Гугл-переводчик начал понимать марийский язык
Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.

Гугл-переводчик начал понимать марийский язык

Технологии 28.06.2024 17:09 939
Юлия Панина
Автор:
Юлия Панина

Онлайн-переводчик сейчас осваивает луговой марийский язык, горномарийского языка пока здесь нет.

Корпорация Google провела масштабное обновление онлайн-переводчика – здесь появилось 110 новых языков, в том числе, и марийский. По словам лингвиста Андрея Чемышева, пока искусственный интеллект не очень хорошо переводит с родного языка мари – допускает ошибки.

– Гугл-переводчик еще очень сырой, Яндекс переводит лучше. Гугл путает некоторые слова, например, утро и день. Но мы работаем над тем, чтобы онлайн-переводчики совершенствовали свои навыки, - отметил Андрей Валерьевич.

Для обучения интернет-платформ новым языкам, лингвисты пользуются параллельными корпусами. Эта технология позволяет сопоставить тексты на разных языках – текст оригинала и его перевод. Такой подход позволяет проводить исследования и обучать переводу не только людей, но и компьютеры.

Специалисты МарНИИЯЛИ пополняют параллельный корпус уже несколько лет. Он находится в открытом доступе, им-то и пользуются компании для обучения онлайн-переводчиков марийскому языку.

– Моя команда ежедневно пополняет параллельный корпус, и этим корпусом мы делимся со всем миром: "Салам, тӱня!..", – написал Андрей Чемышев на своей странице в социальной сети ВКонтакте.

Кстати, в Яндекс-переводчике марийский язык появился еще в 2016 году. С тех пор он регулярно обновляется для более качественного перевода. Андрей Чемышев рассказал, что очередное обновление произойдет буквально через неделю. В онлайн-переводчике отечественной компании есть как луговой марийский, так и горномарийский. Пока здесь доступен только перевод в текстовом формате, но Андрей Валерьевич отметил, что специалисты сейчас работают и над голосовым вводом – планируется, что такая функция в Яндекс-переводчике появится в обозримом будущем.

В распознавании марийской речи был заинтересован и крупный видеохостинг YouTube, который тоже входит в корпорацию Google.

– На меня однажды выходили представители YouTube, говорили, что они планируют сделать автоматическое титрование видеозаписией на марийском языке. Но каких-то сроков реализации этой задумки они не сообщали, - отметил лингвист.


Ранее мы писали, что в деревне Мизинер Моркинского района Марий Эл проходит традиционный праздник поэзии «Колумб лудмаш» («Колумбовские чтения»).

Коротко


Архив материалов

Март 2026
Пн Вт Ср Чт Пт Сб Вс
           
22
23 24 25 26 27 28 29
30 31          
Мы используем куки, в том числе в целях сбора статистических данных и обработки персональных данных с использованием интернет-сервиса «Яндекс.Метрика» (Политика обработки персональных данных). Если Вы не согласны, немедленно прекратите использование данного сайта.
СОГЛАСЕН
bool(true)