В Марий Эл создана программа распознавания марийской речи
Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации.

В Марий Эл создана программа распознавания марийской речи

Культура 29.06.2023 13:55 262

Об этом и многом другом говорилось на очередном заседании Правительственной комиссии по государственным языкам Марий Эл. Вел его первый заместитель Председателя Правительства республики Михаил Васютин.

Речь шла, в частности, о контрольных цифрах приема в МарГУ. Так, в этом году по направлению подготовки «Педагогическое образование» по профилю «Образование в области родного языка и литературы, иностранного языка (английский)» и «Филологическое образование в этнокультурной среде» планируется набрать 30 человек. Шесть бюджетных мест выделено по профилю «Филологические основы этножурналистики».

Но в центре внимания участников встречи была работа МарНИИЯЛИ имени В.М.Васильева по формированию корпуса марийского языка и аудиокорпуса с образцами марийской речи.

- В Марий Эл ведётся большая работа по цифровизации марийского языка, - сообщила подробности директор института Людмила Григорьева. - В этом масштабном проекте принимают участие наши научные сотрудники, сотрудники Республиканского центра марийской культуры, студенты-практиканты МарГУ и ПГТУ, а также добровольцы-волонтёры.

Национальный корпус марийского языка размещён на сайте corp.marnii.ru. На сегодня он включает в себя более 20 миллионов словоупотреблений, которые оснащены лемматизацией (приведением слов к начальной форме), морфологической разметкой и инструментами поиска. На базе языкового корпуса создаются монографические исследования, изданы «Словарь сравнений марийского языка» и «Словарь эпитетов марийского языка», начато составление «Словаря антонимов марийского языка».

Набирает ход работа по созданию горномарийского подкорпуса Национального корпуса марийского языка, совместно с МарГУ мы запустили проект «Фольклорный подкорпус Национального корпуса марийского языка». В сервисе «Яндекс переводчик» уже реализован марийский машинный переводчик. Сейчас необходимо его совершенствовать.

Большое значение придается формированию аудиокорпуса с образцами речи. Он включает озвученные произведения (как написанные на марийском языке, так и переведенные на него) и используется для системы распознавания марийской речи. Она уже создана и проходит апробацию. Цель - перевод речи в текст, а также создание голосовых помощников. Это очень важная работа, позволяющая сэкономить много времени и сил.

Фото со страницы Минкультуры Марий Эл «ВКонтакте».

Ранее «Марийская правда» рассказала о цифровизации в области образования.

Коротко


Архив материалов

Апрель 2026
Пн Вт Ср Чт Пт Сб Вс
    4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      
Мы используем куки, в том числе в целях сбора статистических данных и обработки персональных данных с использованием интернет-сервиса «Яндекс.Метрика» (Политика обработки персональных данных). Если Вы не согласны, немедленно прекратите использование данного сайта.
СОГЛАСЕН
bool(true)