Институт умных систем и искусственного интеллекта Назарбаев Университета запустил проект для автоматизированного распознавания казахской речи. При помощи этой технологии можно начинать успешное внедрение казахского языка в мировое цифровое пространство.
Чтобы реализовать задуманную идею, разработчики осуществили сбор самой большой базы голосовых данных нашей страны. Это более трёхсот часов аудиозаписей 2000 человек.
Событие является огромным шагом для казахской национальной культуры, так как использование данной технологии откроет огромные возможности для казахского языка тем, что теперь казахская речь будет распознаваться виртуальными помощниками и использоваться в различных программах, включая технологию “умного дома”. Также данный проект даст начало развитию инклюзии в Казахстане. А новая программа будет использоваться голосовыми и текстовыми программами, широко применяющимися среди людей с ограниченными возможностями.
Интервью с главным разработчиком данной технологии профессором Атаканом Варол
Главная цель проекта?
Главной целью нашего проекта является расширение границ для казахского языка в цифровом мире. Чтобы все казахоязычные люди нашей планеты могли без особых проблем использовать голосовые приложения на своём родном языке.
Как долго вы работали над данным проектом?
На самом деле, идея зародилась очень давно. Однако отсутствие огромной базы казахского языка являлось главным припятствием для её применения в мире цифровых данных. Из-за этого проект был реализован только сейчас.
Какие планы у вашего проекта на ближайшее будущее?
Сейчас мы собираемся делиться своим открытым исходным кодом и своей собранной базой данных казахской речи с со всеми исследователями и цифровыми предпринимателями.
А кому именно и где можно получить доступ к базе данных?
Любой желающий может получить доступ к собранной базе данных в интернете на нашем сайте, либо на сайте нашего университета, а также протестировать технологию распознавания казахской речи.