Нейросети научились распознавать марийский язык
Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.

Салам лийже, технологии! / Нейросети научились распознавать марийский язык

Культура 05.11.2025 17:09 132

Функционал Яндекса расширился: нейросети теперь распознают устный марийский язык, позволяют сделать фотоперевод и перевести его на доступные сервисам языки мира. В минувшие выходные разработчики провели в МарНИИЯЛИ презентацию проекта, посвященного 105-летию республики.

Технологичное детище

Это событие в стенах института называют поистине историческим: нейросети Яндекса «изучили» марийский язык! За месяц переводчиком на национальный язык воспользовались уже 11 тысяч человек, подтвердив удобство пользования. Языковой корпус для него научные работники собирали годами: разговоры о цифровизации марийского шли еще с 2011 года, но то не хватало финансовой поддержки, то времени, то людей.

Несмотря на это, специалисты не теряли надежд на новый проект, собирая информацию. Технологии не стоят на месте, и они стремились освоить функционал распознавания устной марийской речи. В конце прошлого года компания «Яндекс» подписала соглашение с Правительством Марий Эл. Проект «Речевые технологии распознавания и синтеза марийской речи от компании «Яндекс» авторы посвятили 105-летию Марий Эл.

‒ Яндекс помогает языкам народов России развернуться в технологическом поле. Но главная заслуга принадлежит энтузиастам-разработчикам и дикторам, ставших голосом сервиса Яндекса. И здесь, конечно, хотелось бы поблагодарить руководство МарНИИЯЛИ и лично Андрея Чемышева за кропотливый повседневный труд и поддержку родного языка, - отметил директор по региональному сотрудничеству компании «Яндекс» Антон Москаленков.

По его словам, сейчас переводчик преображает марийский язык в русский почти без ошибок: речь идет как о текстах, генерации предложений, так и о голосовых запросах. А значит, не имеет ограничений для взаимодействия с другими языками: благодаря «посреднику» и сервису можно общаться с носителями десятков языков, доступных в переводчике.


Перешли языковой барьер

На презентации директор Марийского национального театра драмы имени М. Шкетана Эрик Юзыкайн точно подметил, что инициативы с марийским языком – тот случай, когда не спрос рождает предложение, а происходит обратная ситуация. Работа, которую вела команда научного сотрудника института Андрея Чемышева, стала настоящим национальным проектом. Он ‒ про единство народа, стремление принести пользу и сохранить чистоту родного языка для потомков.

‒ Оценивая путь, который мы прошли, остается порадоваться, – улыбается директор по работе с органами государственной власти компании «Яндекс» Александр Болховитянов. – Одна из вех, нами пройденных, – распознавание речи носителя языка. Фантастические, мне кажется, результаты: 95 процентов правильного распознавания фраз, более 85 процентов фраз генерируют без ошибок.

А вот фотоперевод пока можно выполнить только на андроидах и в веб-версии. Версию для операционной системы нужно будет подождать где-то три недели из-за объема работ.

‒ Показатели говорят, что это довольно качественный перевод, сродни тому, что делает специалист по марийскому языку, – отметил Александр Болховитянов. – Доступен синтез речи и в самом переводчике, и в приложении с режимом диалогов, которые используются в реальном времени при общении. Например, один пользователь может говорить на русском, а другой отвечать ему на марийском. В беседе приложение переведет фразы на нужный язык и озвучит их. Для тех, кто не успевает печатать, действует голосовой ввод в клавиатуре: сервис в считанные секунды преобразует сказанное в текст.

‒ Я убежден, что живые языки народов России не могут оставаться только объектом академического интереса, поэтому его развитие ‒ важная задача. Но если языки не будут «выходить» в повседневную жизнь, на них не будет говорить молодежь, то область распространения языка будет очень маленькой. Благодаря современным технологиям мы исправляем эту ситуацию. И хотя по сравнению с татарским языком количество пользователей онлайн меньше, это вопрос времени, – подчеркнул Антон Москаленков.


Время возможностей

Глава Марий Эл назвал разработку особенной, учитывая ее функцию сохранения и популяризации национальной культуры.

‒ Теперь у нас есть сервисы, которые понимают живой марийский язык и могут на него отвечать. Это открывает огромные возможности для образования, общения и сохранения языка. Такие проекты – мощный вклад в развитие марийского языка в цифровую эпоху. Очень символичный и важный подарок к 105-летию нашей республики в рамках проекта по сохранению языков народов России, – сказал Юрий Зайцев.

Министр цифрового развития Марий Эл Венедикт Суворов назвал проект настоящим прорывом.

‒ Со средневекового уровня мы вышли на цифровой. Даже если носители марийского языка исчезнут (не дай Бог!), язык останется в истории и в материалах. Теперь можно обсудить и использование этого ресурса в культуре, в образовании, в практической деятельности, чтобы каждая марийская бабушка в деревне могла включить телевизор с помощью марийскоговорящей колонки, – подчеркнул он. – Благодаря проекту, прорубившему окно в возможности, открываются интересные перспективы.

Сейчас перед авторами проекта стоит другая масштабная задача – наполнить цифровое пространство культурно-этническими материалами. Например, национальными изображениями. В этом смысле большой архивный проект с оцифровкой и распознаванием архивного рукописного текста должен быть продолжен на другом уровне. И тогда нейросети перейдут от больших языковых моделей к культурному полю, учитывая колорит и самобытность российских регионов.



В Марий Эл отметили 105-летие республики и День народного единства

Коротко


Архив материалов

Апрель 2026
Пн Вт Ср Чт Пт Сб Вс
    5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      
Мы используем куки, в том числе в целях сбора статистических данных и обработки персональных данных с использованием интернет-сервиса «Яндекс.Метрика» (Политика обработки персональных данных). Если Вы не согласны, немедленно прекратите использование данного сайта.
СОГЛАСЕН
bool(true)