Компанией Mozilla запущена марийская версия проекта Common Voice, который представляет собой распознавателя человеческой речи на базе обучаемого искусственного интеллекта.
В настоящее время в марийскоязычной программе принимают участие более сотни пользователей. На сегодняшний день сформирован банк из более 40 часов аудиозаписей.
- Марийский язык в платформе Common Voice запущен 20 февраля 2022 года. К проектам по речевым технологиям уже подключаются йошкар-олинские вузы и общественные организации, - рассказал сотрудник Марийского научно-исследовательского института языка, литературы и истории имени Васильева Андрей Чемышев.

Организаторы проекта выразили уверенность, что за год к программе для распознавания марийской речи могут подключиться около 1 тысячи человек. Согласно планам, участники запишут не менее 300 часов записи. Этого будет достаточно, чтобы достигнуть точность распознавания свыше 95%. На данный момент сбор образцов языковых конструкций на марийском языке продолжается.
Напомним, что сейчас ФНКА Марийцев России, МарНИИЯЛИ имени Васильева и Республиканский центр марийской культуры работают над созданием синтезатора марийской речи.
Также «Марийская правда» рассказывала, что первый шаг на пути создания «Алисы» на марийском языке пройден.






