Гугл-переводчик начал понимать марийский язык
Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.

Гугл-переводчик начал понимать марийский язык

Технологии 28.06.2024 17:09 969
Юлия Панина
Автор:
Юлия Панина

Онлайн-переводчик сейчас осваивает луговой марийский язык, горномарийского языка пока здесь нет.

Корпорация Google провела масштабное обновление онлайн-переводчика – здесь появилось 110 новых языков, в том числе, и марийский. По словам лингвиста Андрея Чемышева, пока искусственный интеллект не очень хорошо переводит с родного языка мари – допускает ошибки.

– Гугл-переводчик еще очень сырой, Яндекс переводит лучше. Гугл путает некоторые слова, например, утро и день. Но мы работаем над тем, чтобы онлайн-переводчики совершенствовали свои навыки, - отметил Андрей Валерьевич.

Для обучения интернет-платформ новым языкам, лингвисты пользуются параллельными корпусами. Эта технология позволяет сопоставить тексты на разных языках – текст оригинала и его перевод. Такой подход позволяет проводить исследования и обучать переводу не только людей, но и компьютеры.

Специалисты МарНИИЯЛИ пополняют параллельный корпус уже несколько лет. Он находится в открытом доступе, им-то и пользуются компании для обучения онлайн-переводчиков марийскому языку.

– Моя команда ежедневно пополняет параллельный корпус, и этим корпусом мы делимся со всем миром: "Салам, тӱня!..", – написал Андрей Чемышев на своей странице в социальной сети ВКонтакте.

Кстати, в Яндекс-переводчике марийский язык появился еще в 2016 году. С тех пор он регулярно обновляется для более качественного перевода. Андрей Чемышев рассказал, что очередное обновление произойдет буквально через неделю. В онлайн-переводчике отечественной компании есть как луговой марийский, так и горномарийский. Пока здесь доступен только перевод в текстовом формате, но Андрей Валерьевич отметил, что специалисты сейчас работают и над голосовым вводом – планируется, что такая функция в Яндекс-переводчике появится в обозримом будущем.

В распознавании марийской речи был заинтересован и крупный видеохостинг YouTube, который тоже входит в корпорацию Google.

– На меня однажды выходили представители YouTube, говорили, что они планируют сделать автоматическое титрование видеозаписией на марийском языке. Но каких-то сроков реализации этой задумки они не сообщали, - отметил лингвист.


Ранее мы писали, что в деревне Мизинер Моркинского района Марий Эл проходит традиционный праздник поэзии «Колумб лудмаш» («Колумбовские чтения»).

Коротко


Архив материалов

Май 2026
Пн Вт Ср Чт Пт Сб Вс
       
7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Мы используем куки, в том числе в целях сбора статистических данных и обработки персональных данных с использованием интернет-сервиса «Яндекс.Метрика» (Политика обработки персональных данных). Если Вы не согласны, немедленно прекратите использование данного сайта.
СОГЛАСЕН
bool(true)