ТОМСК, 15 дек – РИА Томск, Елена Тайлашева. Разработчики томской компании ENBISYS "оживили" голландского Санта-Клауса – Синтерклааса, разработав платформу для интерактивного общения с ним. Как нейронные сети распознают детские желания и чем решение томичей может изменить глобальный рынок онлайн-образования – в материале РИА Томск.
Бот, да не тот
"Веришь в меня или нет?" – с экрана ноутбука на родителя строго смотрит голландский Санта-Клаус – Синтерклаас. "Нет", – чистосердечно отвечает тот. "Ну все, ты уже вырос, что с тобой разговаривать". И засыпает… "Ладно-ладно, верю", – одумывается родитель, которому вообще-то надо испробовать демо-версию платформы и решить: стоит ли платить за виртуальную встречу своего ребенка со сказочным персонажем?
Синтерклаас, открыв глаза и улыбнувшись, соглашается прислать скидочный купон на использование платформы…
"В Голландии вызов Синтерклааса на дом стоит очень дорого, в районе 500 евро. И наши партнеры, с которыми мы работали по другим проектам, предложили создать платформу для виртуального общения со сказочным персонажем", – рассказывает предысторию технический директор компании ENBISYS Максим Усов.
Простые приложения для этого и раньше можно было скачать в AppStore и PlayMarket, но они, в основном, сводились к чату, где на другом конце "провода" сидел в лучшем случае живой оператор, а чаще всего – бот. У томичей была задача не просто дополнить общение видео, но и сделать его интерактивным. По сути – "оживить" волшебника, создать видимость разговора с живым героем.
Поиздеваемся над дедушкой?
"Технический челлендж был в том, чтобы это все работало на современных браузерах, на разных платформах, чтобы не нужно было ничего устанавливать. В разработке есть понятие "intrusive" (то есть "назойливый"), когда человеку надо совершать дополнительные действия – например, скачивать и устанавливать приложение. Больше половины на этом этапе срежется – будет просто лень", – говорит Максим Усов.
Поэтому интерфейс должен был быть максимально простым – зашел на сайт, нажал на кнопочку "демо-версия", попробовал сам, понравилось – оплатил ребенку... "А чем проще выглядит интерфейс, тем сложнее это сделать технически, потому что требуется больше автоматических решений, а значит, и больше труда программистов", – добавляет программист ENBISYS Степан Крымский.
"В сценарии около 10 точек, из которых события могут развиваться по-разному – в зависимости от выбора ребенка. Например, волшебник просит тетушку сделать ему кофе, камера фокусируется на ней, она наполняет кружечку, а потом заговорщицким тоном шепчет ребенку: "Может, вместо сахара положим соль?", – приводит пример Крымский.
Если ребенок отвечает "Да!", то специальные алгоритмы, распознающие и анализирующие ответ на вопрос, "переводят" сценарий на сюжет, когда Синтерклаас пробует кофе с солью и возмущается. Если ребенок отказался подшучивать над дедушкой, тот просто принимает кружку с кофе и спокойно пьет его.
Виртуальный менеджер и педагог
Взрослые слегка ошиблись в том, насколько бурной будет реакция на встречу с дедушкой: в промо-роликах дети чинно сидят перед монитором и задают вопросы, на практике они восторженно кричали, через слово повторяя: "Синтерклаас! Синтерклаас!".
При этом для быстрой обратной связи система должна четко разобрать детскую речь. Вычленить слова из звукового потока помогает искусственный интеллект от Google, встроенный в платформу.
"У Google Cloud есть очень точное распознавание голоса в облаке на нейронных сетях. Мы тестировали эту систему на русском языке, давая воспроизводить фразу "серо-буро-малиновый глазовыколупыватель с полуподломленными ножками". Распознала все слово в слово! Сетка натренирована на огромном количестве примеров, с разными шумами, дефектами речи, диалектами, акцентами", – рассказывает Максим Усов.
"Решая этот комплекс задач, мы, конечно, подразумевали не просто возможность устроить диалог между ребенком и Синтерклаасом. Мы смогли сделать универсальную платформу, в которую можно загружать любой материал и работать с ним в real-time, исходя из запросов конкретного человека", – подчеркивает директор ENBISYS Дмитрий Бубнов.
Эта технология может быть полезна, скажем, банкам. Сейчас банковские онлайн-сервисы сводятся, в основном, к текстовым чатам или, максимум, голосовым помощникам. "Но никто не предлагает вместе с этим визуального видеоряда, причем не просто "говорящую голову", а настоящего виртуального менеджера. Это сложно, и никто в мире этого пока не делал", – говорит Бубнов.
Еще более перспективная отрасль – образование.
"На базе нашей платформы вместе с ТГУ (Томским госуниверситетом. – Ред.) мы уже делаем систему адаптивного обучения, которая будет принципиально отличаться от существующих онлайн-курсов. Есть множество единиц образовательного контента, его можно "склеить" в интерактивный урок, который будет развиваться в зависимости от вопросов студента", – рассказывает Дмитрий Бубнов.
Это будет то же самое индивидуальное обучение – то, что сейчас практикуют в вузах для работы с отстающими студентами, – но с виртуальным преподавателем, то есть значительно более дешевое и при этом не менее эффективное.