Ученые ТУСУРа изучают шепот, чтобы научить машины распознавать речь

ТОМСК, 8 фев – РИА Томск. Исследователи Томского госуниверситета систем управления и радиоэлектроники (ТУСУР) изучают устную речь человека с помощью уникального математического аппарата, чтобы разработать принципиально новые алгоритмы распознавания речи для создания интерфейсов человек-компьютер, сообщает в четверг инновационный портал Томской области.

Уточняется, что существующие системы распознавания устной речи не учитывают вариативность окончаний и других особенностей спонтанной устной речи, неспособны определять "на слух" аббревиатуры "съедающиеся" при беглой речи звуки. Математический аппарат, разработанный в ТУСУРе, позволяет распознавать ударные звуки, даже произнесенные шепотом, с надежностью не менее 70%.

"На кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) ТУСУР с помощью созданного здесь уникального математического аппарата проводятся исследования по распознаванию речи человека на уровне параметров речевого сигнала (шепота). Их результатом может стать создание новых алгоритмов… для корректного и более точного распознавания речи", – говорится в сообщении.

Своей задачей ученые кафедры называют определение более точных параметров звуков по сравнению с уже существующими системами распознавания речи, в том числе с помощью изучения шепота.

"Есть классический термин – форманта – максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шепотную речь, которая отделена от голосового источника и лишена этих искажений", – цитирует портал сотрудника КИБЭВС Антона Конева.

Точное распознавание речи, которое станет доступно в результате исследований, будет полезно для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов, подчеркивается в сообщении.