Несколько специалистов письменного корпуса татарского языка присоединились к работе в открытом проекте Common Voice, который собирает базы данных голосовых записей для распознавания речи, сообщает 16 августа пресс-служба Казанского федерального университета (КФУ).

Работу над проектом ведут старший научный сотрудник Института языка, литературы и искусства Академии наук Татарии Мансур Сайхунов, инженер кафедры образовательных технологий и информационных систем Института филологии и межкультурной коммуникации, доцент КФУ Тавзих Ибрагимов, а также инженер GDC Рустем Хусаинов, который давно занимается вопросами синтеза и анализа речи.

«На сегодняшний день свой вклад в проект внесли более 60 человек. Выражаем огромную благодарность за их бескорыстный труд», — сказал Сайхунов.

По его словам, за два месяца работы группа собрала около трех часов непрерывной татарской речи. Однако в планах специалистов на полученном результате не останавливаться: по оценке Сайхунова, хорошим результатом работы станет 100 часов речевого текста.

Отметим, программная часть Common Voice разрабатывается ведущими учеными из разных стран мира. Платформа проекта — открытая, присоединиться к нему может любой желающий, а код и речевые базы системы распространяются под открытыми лицензиями наподобие GNU General Public License и Creative Commons.

Читайте также: В Казани отреставрировали самое большое в мире печатное издание Корана