ТОМСК, 15 дек – РИА Томск, Елена
Тайлашева. Разработчики томской
компании ENBISYS "оживили" голландского Санта-Клауса – Синтерклааса,
разработав платформу для интерактивного общения с ним. Как нейронные сети
распознают детские желания и чем решение томичей может изменить глобальный
рынок онлайн-образования – в материале РИА Томск.
Бот, да не тот
"Веришь
в меня или нет?" – с экрана ноутбука на родителя строго смотрит
голландский Санта-Клаус – Синтерклаас. "Нет", – чистосердечно
отвечает тот. "Ну все, ты уже вырос, что с тобой разговаривать". И
засыпает… "Ладно-ладно, верю", – одумывается родитель, которому
вообще-то надо испробовать демо-версию платформы и решить: стоит ли платить за
виртуальную встречу своего ребенка со сказочным персонажем?
Синтерклаас,
открыв глаза и улыбнувшись, соглашается прислать скидочный купон на
использование платформы…
"В
Голландии вызов Синтерклааса на дом стоит очень дорого, в районе 500 евро. И
наши партнеры, с которыми мы работали по другим проектам, предложили создать
платформу для виртуального общения со сказочным персонажем", – рассказывает
предысторию технический директор компании ENBISYS Максим Усов.
Простые
приложения для этого и раньше можно было скачать в AppStore и PlayMarket, но
они, в основном, сводились к чату, где на другом конце "провода"
сидел в лучшем случае живой оператор, а чаще всего – бот. У томичей была задача
не просто дополнить общение видео, но и сделать его интерактивным. По сути – "оживить"
волшебника, создать видимость разговора с живым героем.
© предоставил Максим Усов
Синтерклаас приезжает к голландским детям из Испании в конце ноября и ездит по городам до 5 декабря. В каждом он принимает детей на главной площади, сидя на своем троне и листая гроте-бук – книгу, в которой в течение года собирает "досье" на каждого ребенка.
Поиздеваемся над дедушкой?
"Технический
челлендж был в том, чтобы это все работало на современных браузерах, на разных
платформах, чтобы не нужно было ничего устанавливать. В разработке есть понятие
"intrusive" (то есть "назойливый"), когда
человеку надо совершать дополнительные действия – например, скачивать и устанавливать
приложение. Больше половины на этом этапе срежется – будет просто лень", –
говорит Максим Усов.
Поэтому
интерфейс должен был быть максимально простым – зашел на сайт, нажал на
кнопочку "демо-версия", попробовал сам, понравилось – оплатил ребенку...
"А чем проще выглядит интерфейс, тем сложнее это сделать технически,
потому что требуется больше автоматических решений, а значит, и больше труда
программистов", – добавляет программист ENBISYS Степан Крымский.
© Принт скрин с видео, предоставленного ENBISYS
Сайт для общения с Синтерклаасом рассчитан на такую нагрузку, чтобы одновременно выдержать 300 интерактивных диалогов. Билетик на один сеанс стоит всего 1,75 евро
Голландцы,
со своей стороны, отсняли около сотни вариантов видео с профессиональными
актерами (у Синтерклааса есть помощники – Черные Питы, а также тетушка),
которые потом незаметно "склеивались" в единый сценарий, в
зависимости от поведения ребенка.
"В
сценарии около 10 точек, из которых события могут развиваться по-разному – в
зависимости от выбора ребенка. Например, волшебник просит тетушку сделать ему
кофе, камера фокусируется на ней, она наполняет кружечку, а потом заговорщицким
тоном шепчет ребенку: "Может, вместо сахара положим соль?", – приводит
пример Крымский.
Если
ребенок отвечает "Да!", то специальные алгоритмы, распознающие и
анализирующие ответ на вопрос, "переводят" сценарий на сюжет, когда
Синтерклаас пробует кофе с солью и возмущается. Если ребенок отказался
подшучивать над дедушкой, тот просто принимает кружку с кофе и спокойно пьет
его.
предоставила компания ENBISYSФайл не найденx0:000:00Загрузка .
Виртуальный менеджер и педагог
Взрослые
слегка ошиблись в том, насколько бурной будет реакция на встречу с дедушкой: в
промо-роликах дети чинно сидят перед монитором и задают вопросы, на практике
они восторженно кричали, через слово повторяя: "Синтерклаас! Синтерклаас!".
При
этом для быстрой обратной связи система должна четко разобрать детскую речь.
Вычленить слова из звукового потока помогает искусственный интеллект от Google, встроенный в платформу.
"У
Google Cloud
есть очень точное распознавание голоса в облаке на нейронных сетях. Мы
тестировали эту систему на русском языке, давая воспроизводить фразу "серо-буро-малиновый
глазовыколупыватель с полуподломленными ножками". Распознала все слово в
слово! Сетка натренирована на огромном количестве примеров, с разными шумами,
дефектами речи, диалектами, акцентами", – рассказывает Максим Усов.
© предоставлено ENBISYS
Технический директор компании ENBISYS Максим Усов
За
быструю доставку голоса от браузера до сервера облака и назад отвечает
собственная технология ENBISYS. Также томичами написаны алгоритмы, которые
помогают распознавать смысл речи и выделять стандартные паттерны поведения,
чтобы моментально выбирать подходящий сценарий в зависимости от реакции
ребенка.
"Решая
этот комплекс задач, мы, конечно, подразумевали не просто возможность устроить
диалог между ребенком и Синтерклаасом. Мы смогли сделать универсальную
платформу, в которую можно загружать любой материал и работать с ним в real-time, исходя из
запросов конкретного человека", – подчеркивает директор ENBISYS Дмитрий
Бубнов.
Эта
технология может быть полезна, скажем, банкам. Сейчас банковские онлайн-сервисы
сводятся, в основном, к текстовым чатам или, максимум, голосовым помощникам. "Но
никто не предлагает вместе с этим визуального видеоряда, причем не просто "говорящую
голову", а настоящего виртуального менеджера. Это сложно, и никто в мире
этого пока не делал", – говорит Бубнов.
Еще
более перспективная отрасль – образование.
"На
базе нашей платформы вместе с ТГУ (Томским госуниверситетом. – Ред.) мы уже
делаем систему адаптивного обучения, которая будет принципиально отличаться от
существующих онлайн-курсов. Есть множество единиц образовательного контента,
его можно "склеить" в интерактивный урок, который будет развиваться в
зависимости от вопросов студента", – рассказывает Дмитрий Бубнов.
Это
будет то же самое индивидуальное обучение – то, что сейчас практикуют в вузах
для работы с отстающими студентами, – но с виртуальным преподавателем, то есть значительно
более дешевое и при этом не менее эффективное.