Этический аспект использования технологий искусственного интеллекта в области сохранения языков коренных народов

Обложка

Цитировать

Полный текст

Аннотация

В работе рассматриваются этические аспекты использования технологий искусственного интеллекта для языков коренных народов. Основное внимание уделяется анализу ряда заметных проектов. Часть из них не ставит своей непосредственной задачей ревитализацию языка или сохранение культурного наследия и потому может вызывать критику со стороны языковых сообществ. Анализируются и примеры успешных проектов, созданных и/или активно поддерживаемых представителями коренных народов. Предлагаемые к рассмотрению инициативы охватывают самые разные регионы мира: Африку, Северную и Южную Америку, Юго-Восточную Азию и Океанию. В статье также представлены рекомендации по дальнейшему развитию и поддержке таких инициатив, а также подчёркивается необходимость соблюдения этических принципов и особенно прав и интересов коренных народов. Настоящая работа призвана привлечь внимание к важности сохранения языков коренных народов с помощью современных технологий, что особенно актуально для Российской Федерации с её уникальным языковым разнообразием.

Об авторах

Д. И. Коломацкий

Институт языкознания РАН

Автор, ответственный за переписку.
Email: dk@iling-ran.ru

кандидат филологических наук, научный сотрудник

Россия, Москва

Е. В. Коровина

Институт языкознания РАН

Email: evkorovina@iling-ran.ru

младший научный сотрудник

Россия, Москва

Список литературы

  1. Good J. Ethics in Language Documentation and Revitalization // The Oxford Hand-book of Endangered Languages / Ed. K.L. Rehg, L. Campbell. Oxford University Press, 2018. P. 418–440. doi: 10.1093/oxfordhb/9780190610029.013.21.
  2. Holton G., Leonard W.Y., Pulsifer P.L. Indigenous Peoples, Ethics, and Linguistic Data // The Open Handbook of Linguistic Data Management / Ed. A.L. Berez-Kroeker et al. The MIT Press, 2022. P. 49–60. doi: 10.7551/mitpress/12200.003.0008.
  3. Marley T.L. Indigenous Data Sovereignty and the role of universities // Indigenous Data Sovereignty and Policy. 1st ed. London: Routledge, 2020. P. 157–168. doi: 10.4324/9780429273957-11.
  4. Ruckstuhl K. Trust in Scholarly Communications and Infrastructure: Indigenous Data Sovereignty // Front. Res. Metr. Anal. 2022. Vol. 6. doi: 10.3389/frma.2021.752336.
  5. Ortenzi K.M. et al. Good data relations key to Indigenous research sovereignty: A case study from Nunatsiavut // Ambio. 2025. Vol. 54, № 2. P. 256–269. doi: 10.1007/s13280-024-02077-6.
  6. Visser E.A grammar of Kalamang. Berlin: Language Science Press, 2022. https://zenodo.org/record/6499927 (Access date 10.05.2025).
  7. Tanzer G. et al. A Benchmark for Learning to Translate a New Language from One Grammar Book: arXiv:2309.16575. arXiv, 2024. doi: 10.48550/arXiv.2309.16575.
  8. Kornilov A., Shavrina T. From MTEB to MTOB: Retrieval-Augmented Classification for Descriptive Grammars: arXiv:2411.15577. arXiv, 2024. doi: 10.48550/arXiv.2411.15577.
  9. Aycock S. et al. Can LLMs Really Learn to Translate a Low-Resource Language from One Grammar Book? arXiv:2409.19151. arXiv, 2025. doi: 10.48550/arXiv.2409.19151.
  10. Brixey J. Using Artificial Intelligence to Preserve Indigenous Languages. USC Insti-tute for Creative Technologies, 2025. https://ict.usc.edu/news/essays/using-artificial-intelligence-to-preserve-indigenous-languages/ (Access date 10.05.2025).
  11. Brixey J., Pincus E., Artstein R. Chahta Anumpa: A Multimodal Corpus of the Choc-taw Language // Proceedings of the Eleventh International Conference on Language Re-sources and Evaluation (LREC 2018). 2018. P. 3371–3376. https://aclanthology.org/L18-1532.pdf. (Access date 10.05.2025).
  12. Brixey J., Artstein R. ChoCo: a multimodal corpus of the Choctaw language // Lang Resources & Evaluation. 2021. Vol. 55, № 1. P. 241–257. doi: 10.1007/s10579-020-09494-5.
  13. Brixey J., Traum D. Masheli: A Choctaw-English Bilingual Chatbot // Conversational Dialogue Systems for the Next Decade / Ed. L.F. D’Haro, Z. Callejas, S. Nakamura Singa-pore: Springer Singapore, 2021. Vol. 704. P. 41–50. doi: 10.1007/978-981-15-8395-7_4.
  14. Brixey J., Traum D. Does a code-switching dialogue system help users learn conver-sational fluency in Choctaw? // Proceedings of the Fifth Workshop on NLP for Indigenous Languages of the Americas (AmericasNLP). Albuquerque, New Mexico: Association for Computational Linguistics, 2025. P. 8–17. https://aclanthology.org/2025.americasnlp-1.2/ (Access date 10.05.2025).
  15. Leuski A., Traum D. NPCEditor: Creating Virtual Human Dialogue Using Infor-mation Retrieval Techniques // AI Magazine. 2011. Vol. 32, № 2. P. 42–56. doi: 10.1609/aimag.v32i2.2347.
  16. Orife I. et al. Masakhane – Machine Translation For Africa: arXiv:2003.11529. arXiv, 2020. doi: 10.48550/arXiv.2003.11529.
  17. Martinus L., Abbott J.Z. A Focus on Neural Machine Translation for African Lan-guages: arXiv:1906.05685. arXiv, 2019. doi: 10.48550/arXiv.1906.05685.
  18. Nekoto W. et al. Participatory Research for Low-resourced Machine Translation: A Case Study in African Languages: arXiv:2010.02353. arXiv, 2020. doi: 10.48550/arXiv.2010.02353.
  19. Rajab J. et al. The Esethu Framework: Reimagining Sustainable Dataset Governance and Curation for Low-Resource Languages: arXiv:2502.15916. arXiv, 2025. doi: 10.48550/arXiv.2502.15916.
  20. Jones P.-L. et al. Kia tangata whenua: Artificial intelligence that grows from the land and people // Ethical Space: International Journal of Communication Ethics. 2023. Vol. 2023, № 2/3. doi: 10.21428/0af3f4c0.9092b177.
  21. Leoni G. et al. Solving Failure Modes in the Creation of Trustworthy Language Technologies // Proceedings of the 3rd Annual Meeting of the Special Interest Group on Un-der-resourced Languages @ LREC-COLING 2024. Torino, Italia, 2024. https://aclanthology.org/2024.sigul-1.39/ (Access date 11.05.2025).
  22. Xu X. et al. A Survey on Knowledge Distillation of Large Language Models: arXiv:2402.13116. arXiv, 2024. doi: 10.48550/arXiv.2402.13116.
  23. Jiang A.Q. et al. Mistral 7B: arXiv:2310.06825. arXiv, 2023. doi: 10.48550/arXiv.2310.06825.
  24. Pinhanez C. et al. Harnessing the Power of Artificial Intelligence to Vitalize Endan-gered Indigenous Languages: Technologies and Experiences: arXiv:2407.12620. arXiv, 2024. doi: 10.48550/arXiv.2407.12620.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Коломацкий Д.И., Коровина Е.В., 2026

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).