Назарбаев Университет собрал крупную базу данных казахской речи, которая общедоступна для публичного и коммерческого использования, передает VRK.News.
База данных находится в свободном доступе для всех, так что условные Siri (умный помощник для владельцев устройств Apple), Alexa (это виртуальный ассистент Amazon) или Алиса (виртуальный голосовой помощник «Яндекс») в скором времени могут заговорит на казахском.
Проект был создан Институтом умных систем и искусственного интеллекта (ИУСИИ или ISSAI) Назарбаев Университета для поддержки использования казахского языка в цифровом мире, и популяризации казахского языка при взаимодействии с цифровыми программами, как виртуальные помощники, и умные дома.
Великолепная возможность покажет действительную заинтересованность мировых вендоров в рынке Казахстана.
Корпус казахской речи содержит около 335 часов аудиозаписей, включающей более 175 000 предложений, произнесенных участниками из разных регионов РК, возрастных групп и пола. Корпус был тщательно проверен носителями казахского языка в целях обеспечения высокого качества. Корпус казахской речи — это крупнейшая общедоступная база данных, разработанная для продвижения различных приложений обработки казахской речи и языка, таких как распознавание речи и синтез речи.
14 сентября 2020 года ISSAI отметил свой первый юбилей.
«Ранее, отсутствие достаточно большой базы данных было препятствием для использования казахского языка в цифровом мире. На данный момент мы готовы поделиться собранной базой данных казахской речи, с открытым исходным кодом, со всеми исследователям и цифровым предпринимателям, чтобы максимизировать его положительное влияние на экономику и общество страны», — рассказывает о разработке института директор-основатель ISSAI, профессор Хусейн Атакан Варол.
На сайте ISSAI по ссылке issai.nu.edu.kz/kz-speech-corpus можно получить доступ к собранной базе данных казахской речи, а также протестировать технологию распознавания казахской речи. База данных Корпуса казахской речи также доступна на Github для публичного и коммерческого использования разработчиками всего мира по запросу в соответствии с международной лицензией Creative Commons Attribution 4.0.
Научный коллектив ISSAI состоит из более чем 30 молодых казахстанских исследователей, которые благодарны населению за поддержку и участие в проекте. Институт будет продолжать служить движущей силой исследований и инноваций в области искусственного интеллекта в цифровой сфере Казахстана и делиться своими знаниями и опытом.
Команда проекта голосовых технологий на основе искусственного интеллекта:
- Профессор Атакан Варол, директор-основатель ISSAI
- Ерболат Хасанов, постдокторант
- Саида Мусаходжаева, специалист по обработке данных
- Мухамет Нурпеисов, специалист по обработке данных
- Алмас Мирзахметов, компьютерный инженер
- Ален Адиев, младший научный сотрудник
- Айгерим Боранбаева, специалист по казахскому языку
- Дастан Абилев, графический дизайнер
- Ербол Абсалямов, технический координатор проекта
- Гибрат Курманов, административный менеджер
- Куралай Байменова, старший PR-менеджер
Читайте также:
Активист? Получи премию! — новая инициатива для молодых
Ертаева приговорили к 11 годам. Он напишет книгу о счастье
Если вас пытали полицейские — появилась подробная инструкция, что делать
Тасмагамбетов возвращается в политику
Доллар умирает — финансовый гуру Роберт Кийосаки
Токаев поздравил атамана казахстанского кино
Трамп победил на выборах. Twitter не согласен
«Борат» на миллиарды продавал наркотики в Казахстане — КНБ РК. Видео
Рабы в Казахстане. Откровения МВД республики. Видео
Конина по сниженной цене? Нереальная ярмарка Нур-Султана
Сабина Алтынбекова рассказала об отношениях с Куатом Хамитовым