18:12, 26 октября 2020

Ученый ТГУ озадачил искусственный интеллект словами-омографами

Тема:

ТОМСК, 26 окт – РИА Томск. Доцент кафедры теоретических основ информатики института прикладной математики и компьютерных наук Томского госуниверситета (ИПМКНТГУ) Михаил Пожидаев занимается созданием библиотеки для обработки слов-омографов в русском языке; библиотека необходима для автоматического создания аудиокниг, сообщает в понедельник пресс-служба вуза.

Пресс-служба напоминает, что слова-омографы – это слова, которые совпадают в написании, но различаются в произношении. Например, существительное "пОтом" ("обливаясь пОтом") и наречие "потОм" ("как выяснилось потОм"). При переводе текстов в аудиоформат искусственный интеллект не способен автоматически найти правильное звучание слова, что затрудняет доступ к текстам, в том числе техническим, для слабовидящих людей.

"Создание библиотеки для обработки омографов (Михаилом Пожидаевым) напрямую связано с компьютерной лингвистикой. Сейчас во время учебного процесса школьники и студенты с нарушениями зрения часто сталкиваются с рядом неточностей в автоматической обработке текстов на русском языке. Те же проблемы встречают и прочие слушатели аудиокниг", – поясняется в сообщении актуальность проблемы.

По словам Пожидаева, которого цитирует пресс-служба, в настоящий момент даже синтезаторы речи именитых производителей продолжают ошибаться с выбором ударения, не говоря уже о синтезаторах, находящихся в свободном доступе. Решением проблемы занимаются специалисты в области компьютерной лингвистики. Ученый опирается на собственный опыт погружения в проблему – вследствие болезни ученый полностью лишился зрения.

В русском языке почти 30 тысяч слов-омографов. Нюанс библиотеки для их обработки в том, что когда контексты собраны, можно провести повторный анализ тех же самых текстов и посмотреть, не прослеживается ли статистическая закономерность использования тех же самых контекстов, но без морфологической неопределенности. Однако для этого нужно обработать колоссальные объемы информации, что требует огромных вычислительных мощностей, поясняется в сообщении.

"К счастью, у нас есть достаточный набор средств понизить вычислительную сложность. Если научиться решать такую задачу, этим можно пользоваться и для снятия других типов неоднозначности. Например, для определения склонения дат, денежных сумм и так далее. Для работы с морфологией слов очень помог проект aot.ru Алексея Сокирко и его коллег", – отмечает Пожидаев.

Актуально

Июль в Томске ожидается жарким, но первая неделя будет дождливой

Рыба и проезд в транспорте – лидеры роста цен в Томской области за год

Собственник самовольно перестроил дом-памятник на Учебной в Томске

Томичи могут выиграть 5 тыс руб, заказав огромный рамен в "Кинцуги"

ТГУ устроит для абитуриентов и родителей пикник в Университетской роще

Плотники из 17 стран примут участие в томском Празднике топора в 2025г

РИА Томск — это мультимедийное информационное агентство. На нашем портале — все свежие новости Томска и Томской области, а также интервью, аналитика, актуальные комментарии, фотоленты, видеорепортажи и инфографика, новости о последних событиях и афиша Томска. Мы располагаем современным мультимедийным пресс-центром в центре Томска, проводим конференции, презентации, брифинги с участием томских чиновников, бизнесменов и общественных деятелей, часто получаем новости «из первых рук». Наши материалы соответствуют высоким стандартам журналистики: эксклюзивность, оперативность и достоверность.

Актуально

Июль в Томске ожидается жарким, но первая неделя будет дождливой

Рыба и проезд в транспорте – лидеры роста цен в Томской области за год

Собственник самовольно перестроил дом-памятник на Учебной в Томске

Томичи могут выиграть 5 тыс руб, заказав огромный рамен в "Кинцуги"

ТГУ устроит для абитуриентов и родителей пикник в Университетской роще

Плотники из 17 стран примут участие в томском Празднике топора в 2025г

От 9 до 42%: как изменятся тарифы на ЖКУ в Томске с 1 июля 2025 года

Раз-два-три: выпускники томских школ станцевали вальс на Новособорной

Море молодых: как проходит День молодежи в Томске. Фото

"Мама думала, дурачусь": как в Томске выбирали лучших в уличном движе

С ревом по Левобережью: соревнования по мотокроссу проходят в Томске

Только 2 маршрута: как изменится движение трамваев в Томске до 20 июля

Гребной сезон: на Сенной Курье в Томске проходят гонки на лодках