Нейросети научились распознавать марийский язык
Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.

Салам лийже, технологии! / Нейросети научились распознавать марийский язык

Культура 05.11.2025 17:09 118

Функционал Яндекса расширился: нейросети теперь распознают устный марийский язык, позволяют сделать фотоперевод и перевести его на доступные сервисам языки мира. В минувшие выходные разработчики провели в МарНИИЯЛИ презентацию проекта, посвященного 105-летию республики.

Технологичное детище

Это событие в стенах института называют поистине историческим: нейросети Яндекса «изучили» марийский язык! За месяц переводчиком на национальный язык воспользовались уже 11 тысяч человек, подтвердив удобство пользования. Языковой корпус для него научные работники собирали годами: разговоры о цифровизации марийского шли еще с 2011 года, но то не хватало финансовой поддержки, то времени, то людей.

Несмотря на это, специалисты не теряли надежд на новый проект, собирая информацию. Технологии не стоят на месте, и они стремились освоить функционал распознавания устной марийской речи. В конце прошлого года компания «Яндекс» подписала соглашение с Правительством Марий Эл. Проект «Речевые технологии распознавания и синтеза марийской речи от компании «Яндекс» авторы посвятили 105-летию Марий Эл.

‒ Яндекс помогает языкам народов России развернуться в технологическом поле. Но главная заслуга принадлежит энтузиастам-разработчикам и дикторам, ставших голосом сервиса Яндекса. И здесь, конечно, хотелось бы поблагодарить руководство МарНИИЯЛИ и лично Андрея Чемышева за кропотливый повседневный труд и поддержку родного языка, - отметил директор по региональному сотрудничеству компании «Яндекс» Антон Москаленков.

По его словам, сейчас переводчик преображает марийский язык в русский почти без ошибок: речь идет как о текстах, генерации предложений, так и о голосовых запросах. А значит, не имеет ограничений для взаимодействия с другими языками: благодаря «посреднику» и сервису можно общаться с носителями десятков языков, доступных в переводчике.


Перешли языковой барьер

На презентации директор Марийского национального театра драмы имени М. Шкетана Эрик Юзыкайн точно подметил, что инициативы с марийским языком – тот случай, когда не спрос рождает предложение, а происходит обратная ситуация. Работа, которую вела команда научного сотрудника института Андрея Чемышева, стала настоящим национальным проектом. Он ‒ про единство народа, стремление принести пользу и сохранить чистоту родного языка для потомков.

‒ Оценивая путь, который мы прошли, остается порадоваться, – улыбается директор по работе с органами государственной власти компании «Яндекс» Александр Болховитянов. – Одна из вех, нами пройденных, – распознавание речи носителя языка. Фантастические, мне кажется, результаты: 95 процентов правильного распознавания фраз, более 85 процентов фраз генерируют без ошибок.

А вот фотоперевод пока можно выполнить только на андроидах и в веб-версии. Версию для операционной системы нужно будет подождать где-то три недели из-за объема работ.

‒ Показатели говорят, что это довольно качественный перевод, сродни тому, что делает специалист по марийскому языку, – отметил Александр Болховитянов. – Доступен синтез речи и в самом переводчике, и в приложении с режимом диалогов, которые используются в реальном времени при общении. Например, один пользователь может говорить на русском, а другой отвечать ему на марийском. В беседе приложение переведет фразы на нужный язык и озвучит их. Для тех, кто не успевает печатать, действует голосовой ввод в клавиатуре: сервис в считанные секунды преобразует сказанное в текст.

‒ Я убежден, что живые языки народов России не могут оставаться только объектом академического интереса, поэтому его развитие ‒ важная задача. Но если языки не будут «выходить» в повседневную жизнь, на них не будет говорить молодежь, то область распространения языка будет очень маленькой. Благодаря современным технологиям мы исправляем эту ситуацию. И хотя по сравнению с татарским языком количество пользователей онлайн меньше, это вопрос времени, – подчеркнул Антон Москаленков.


Время возможностей

Глава Марий Эл назвал разработку особенной, учитывая ее функцию сохранения и популяризации национальной культуры.

‒ Теперь у нас есть сервисы, которые понимают живой марийский язык и могут на него отвечать. Это открывает огромные возможности для образования, общения и сохранения языка. Такие проекты – мощный вклад в развитие марийского языка в цифровую эпоху. Очень символичный и важный подарок к 105-летию нашей республики в рамках проекта по сохранению языков народов России, – сказал Юрий Зайцев.

Министр цифрового развития Марий Эл Венедикт Суворов назвал проект настоящим прорывом.

‒ Со средневекового уровня мы вышли на цифровой. Даже если носители марийского языка исчезнут (не дай Бог!), язык останется в истории и в материалах. Теперь можно обсудить и использование этого ресурса в культуре, в образовании, в практической деятельности, чтобы каждая марийская бабушка в деревне могла включить телевизор с помощью марийскоговорящей колонки, – подчеркнул он. – Благодаря проекту, прорубившему окно в возможности, открываются интересные перспективы.

Сейчас перед авторами проекта стоит другая масштабная задача – наполнить цифровое пространство культурно-этническими материалами. Например, национальными изображениями. В этом смысле большой архивный проект с оцифровкой и распознаванием архивного рукописного текста должен быть продолжен на другом уровне. И тогда нейросети перейдут от больших языковых моделей к культурному полю, учитывая колорит и самобытность российских регионов.



В Марий Эл отметили 105-летие республики и День народного единства

Коротко


Архив материалов

Март 2026
Пн Вт Ср Чт Пт Сб Вс
           
17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          
Мы используем куки, в том числе в целях сбора статистических данных и обработки персональных данных с использованием интернет-сервиса «Яндекс.Метрика» (Политика обработки персональных данных). Если Вы не согласны, немедленно прекратите использование данного сайта.
СОГЛАСЕН
bool(true)