ChatGPT продолжает ошибаться: эксперт ТГУ рассказал о рисках ИИ

ТОМСК, 29 июн – РИА Томск. "Доверяй, но проверяй" – русская пословица становится главным принципом для пользователей генеративного искусственного интеллекта (ГИИ). Почему за нейросетью нужно проверять важные факты и о чем лучше не спрашивать чат-ботов – об этом РИА Томск рассказала эксперт Института анализа больших данных и искусственного интеллекта (ИИ) Томского госуниверситета (ТГУ) Полина Басина.

Ошибочка вышла

Опросы, проведенные Аналитическим центром ВЦИОМ, утверждают, что каждый пятый российский интернет-пользователь взаимодействует с искусственным интеллектом постоянно, при этом больше половины из этой группы используют нейросети для консультаций и поиска информации.

Это показывает, насколько массовой стала практика спрашивать нейросети вместо привычного "погугли". И, пожалуй, именно поэтому новости о недостоверных ответах ИИ привлекают большое внимание: получить ложную информацию может каждый из нас, и ни одна тема не застрахована от ошибки – будь то получение визы, обращение в суд или проблемы со здоровьем.

Один из последних случаев ГИИ-ошибки произошел с путешественниками из России. Как писали федеральные СМИ, родители с тремя детьми купили билеты в Северную Македонию в полной уверенности, что виза для въезда в страну не нужна – так сказал ChatGPT. И только в аэропорту туристы выяснили, что с 2022 года россияне должны иметь визу или электронное разрешение. Поездка сорвалась, что стоило немалых денег и нервов многодетной семье.

Иллюзия компетентности

Когда речь идет о ChatGPT и других аналогичных помощниках, нужно помнить, что они – не просто искусственный интеллект, а генеративный ИИ. Это прямая связь со словом "генерация", то есть создание чего-то нового.

Как объясняет специалист ТГУ, ГИИ – это класс моделей ИИ, которые обучены на огромном количестве данных и умеют отвечать на вопросы, то есть буквально СОЗДАВАТЬ ответ, а также изображения, программный код и многое другое.

"Остановимся подробнее именно на текстах. Никто не даст гарантию пользователю чат-бота, что в созданном ответе будет правда и только правда. Нейросеть может добавить что-то "от себя" или вообще нафантазировать от начала до конца. Широкой аудитории более известен термин "галлюцинации". Чат-боты развиваются, но тема их галлюцинаций по-прежнему актуальна", – говорит Басина.

О галлюцинациях было известно с первых дней выхода чат-ботов в большой мир, но, несмотря на это, пользователи склонны доверять ГИИ. А как не довериться, если он выдает несуществующие факты с максимальной уверенностью? Так и возникает иллюзия компетентности чат-ботов.

"Важно понимать, что нейросети не являются поисковыми системами и не "знают" факты в человеческом понимании. Чат-боты действительно создают текст, который с высокой долей вероятности кажется правдоподобным, но они основываются на данных, которые модель видела при обучении", – объясняет Басина.

Почему чат-боты ошибаются

По словам эксперта, основные ошибки чат-ботов обусловлены рядом факторов. Во-первых, каждая модель имеет "дату отсечения" (knowledge cutoff) – это момент, после которого она не учитывает события, произошедшие позже.

Например, если модель была обучена до 2022 года, она не знает о новых законах или изменениях, которые произошли после этой даты. То есть модель обучили, и после данные никак не обновлялись с точки зрения актуальных фактов (так как задача модели – генерировать, а не давать точные факты).

Во-вторых, нейросеть обучается на данных, которые могут быть устаревшими. Например, до 2022 года действовал безвизовый режим для поездок россиян в Северную Македонию. Эта информация широко представлена в интернете и, скорей всего, попала в обучающую выборку модели, с которой консультировались упомянутые выше путешественники.

Как проверить, говорит ли нейросеть правду?

Аналитик ТГУ рекомендует следовать следующим правилам при общении с чат-ботами по важным темам.

Правило №1: проверять информацию через официальные источники. Например, для получения актуальной визовой информации можно обратиться в посольство или консульство страны назначения, а также на сайт МИД РФ. Информация на сайтах авиакомпаний также может быть надежным источником, так как они несут ответственность за перевозку пассажиров.

Правило №2: проверка через поисковые системы. Рекомендуется сделать запрос в поисковике и сравнить результаты с ответом нейросети. Если есть противоречия, это может быть сигналом о том, что чат-бот дает устаревшую информацию.

Правило №3: задавать уточняющие вопросы. Эксперты советуют попросить чат-бот указать источник информации и дату, на которую эти правила актуальны. Это поможет понять, насколько информация достоверна.

"Нейросети – это мощный и удобный инструмент, который может помочь в решении различных задач. Однако они не заменяют критическое мышление. Ответственность за принятие решений на основе информации, полученной от нейросетей, всегда лежит на пользователях. В ситуациях, где ошибка может привести к финансовым потерям, потере времени или угрозе безопасности, доверяйте только официальным источникам", – резюмировала Басина.