Функционал Яндекса расширился: нейросети теперь распознают устный марийский язык, позволяют сделать фотоперевод и перевести его на доступные сервисам языки мира. В минувшие выходные разработчики провели в МарНИИЯЛИ презентацию проекта, посвященного 105-летию республики.
Технологичное детище
Это событие в стенах института называют поистине историческим: нейросети Яндекса «изучили» марийский язык! За месяц переводчиком на национальный язык воспользовались уже 11 тысяч человек, подтвердив удобство пользования. Языковой корпус для него научные работники собирали годами: разговоры о цифровизации марийского шли еще с 2011 года, но то не хватало финансовой поддержки, то времени, то людей.
Несмотря на это, специалисты не теряли надежд на новый проект, собирая информацию. Технологии не стоят на месте, и они стремились освоить функционал распознавания устной марийской речи. В конце прошлого года компания «Яндекс» подписала соглашение с Правительством Марий Эл. Проект «Речевые технологии распознавания и синтеза марийской речи от компании «Яндекс» авторы посвятили 105-летию Марий Эл.
‒ Яндекс помогает языкам народов России развернуться в технологическом поле. Но главная заслуга принадлежит энтузиастам-разработчикам и дикторам, ставших голосом сервиса Яндекса. И здесь, конечно, хотелось бы поблагодарить руководство МарНИИЯЛИ и лично Андрея Чемышева за кропотливый повседневный труд и поддержку родного языка, - отметил директор по региональному сотрудничеству компании «Яндекс» Антон Москаленков.
По его словам, сейчас переводчик преображает марийский язык в русский почти без ошибок: речь идет как о текстах, генерации предложений, так и о голосовых запросах. А значит, не имеет ограничений для взаимодействия с другими языками: благодаря «посреднику» и сервису можно общаться с носителями десятков языков, доступных в переводчике.

Перешли языковой барьер
На презентации директор Марийского национального театра драмы имени М. Шкетана Эрик Юзыкайн точно подметил, что инициативы с марийским языком – тот случай, когда не спрос рождает предложение, а происходит обратная ситуация. Работа, которую вела команда научного сотрудника института Андрея Чемышева, стала настоящим национальным проектом. Он ‒ про единство народа, стремление принести пользу и сохранить чистоту родного языка для потомков.
‒ Оценивая путь, который мы прошли, остается порадоваться, – улыбается директор по работе с органами государственной власти компании «Яндекс» Александр Болховитянов. – Одна из вех, нами пройденных, – распознавание речи носителя языка. Фантастические, мне кажется, результаты: 95 процентов правильного распознавания фраз, более 85 процентов фраз генерируют без ошибок.
А вот фотоперевод пока можно выполнить только на андроидах и в веб-версии. Версию для операционной системы нужно будет подождать где-то три недели из-за объема работ.
‒ Показатели говорят, что это довольно качественный перевод, сродни тому, что делает специалист по марийскому языку, – отметил Александр Болховитянов. – Доступен синтез речи и в самом переводчике, и в приложении с режимом диалогов, которые используются в реальном времени при общении. Например, один пользователь может говорить на русском, а другой отвечать ему на марийском. В беседе приложение переведет фразы на нужный язык и озвучит их. Для тех, кто не успевает печатать, действует голосовой ввод в клавиатуре: сервис в считанные секунды преобразует сказанное в текст.
‒ Я убежден, что живые языки народов России не могут оставаться только объектом академического интереса, поэтому его развитие ‒ важная задача. Но если языки не будут «выходить» в повседневную жизнь, на них не будет говорить молодежь, то область распространения языка будет очень маленькой. Благодаря современным технологиям мы исправляем эту ситуацию. И хотя по сравнению с татарским языком количество пользователей онлайн меньше, это вопрос времени, – подчеркнул Антон Москаленков.

Время возможностей
Глава Марий Эл назвал разработку особенной, учитывая ее функцию сохранения и популяризации национальной культуры.
‒ Теперь у нас есть сервисы, которые понимают живой марийский язык и могут на него отвечать. Это открывает огромные возможности для образования, общения и сохранения языка. Такие проекты – мощный вклад в развитие марийского языка в цифровую эпоху. Очень символичный и важный подарок к 105-летию нашей республики в рамках проекта по сохранению языков народов России, – сказал Юрий Зайцев.
Министр цифрового развития Марий Эл Венедикт Суворов назвал проект настоящим прорывом.
‒ Со средневекового уровня мы вышли на цифровой. Даже если носители марийского языка исчезнут (не дай Бог!), язык останется в истории и в материалах. Теперь можно обсудить и использование этого ресурса в культуре, в образовании, в практической деятельности, чтобы каждая марийская бабушка в деревне могла включить телевизор с помощью марийскоговорящей колонки, – подчеркнул он. – Благодаря проекту, прорубившему окно в возможности, открываются интересные перспективы.
Сейчас перед авторами проекта стоит другая масштабная задача – наполнить цифровое пространство культурно-этническими материалами. Например, национальными изображениями. В этом смысле большой архивный проект с оцифровкой и распознаванием архивного рукописного текста должен быть продолжен на другом уровне. И тогда нейросети перейдут от больших языковых моделей к культурному полю, учитывая колорит и самобытность российских регионов.







