ТОМСК, 9 окт – РИА Томск. Выдать список подходящих профессий,
определить самого популярного выпускника в Википедии, отличить экстраверта от
интроверта – все это можно сделать с помощью big data. Что такое большие данные и где они встречаются в обычной жизни – об этом
рассказал заведующий учебно-научной лабораторией компьютерных средств обучения
Томского госуниверситета (ТГУ) Артем Фещенко.
Он выступил с лекцией на Youtube-канале ТГУ в рамках фестиваля "NAUKA
0+". Тезисы лекции – в обзоре РИА Томск.
Ранее сообщалось, что фестиваль проходит Томске с 4 по 8
октября. В его программе около 70 мероприятий – лектории от томских ученых,
подкасты о науке, экскурсии по научным лабораториям, научные шоу, квесты,
конкурсы и творческие мастерские.
Что такое big data?
"Большие данные – это когда данных больше одного терабайта, это
данные, которые не помещаются в Excel, данные, которые
невозможно обрабатывать на одном компьютере. Есть мнение, что big data – это вообще любые данные, а еще, что big data вообще не существует – мол, этот термин придумали маркетологи", – говорит
Фещенко.
© с сайта Томского госуниверситета
Завлабораторией Артем Фещенко
Определений этого феномена очень много, и все они зависят от контекста и
сферы деятельности, рассказывает эксперт ТГУ. Он подчеркивает, что источники
данных разнообразны. Благодаря цифровизации и появлению технологий, позволяющих
человеку легко и быстро публиковать в интернете самую разную информацию,
мировые данные удваиваются в своем объеме даже не ежесуточно, а за более
короткий промежуток времени.
"Получается бездна информации, в которую человечество погружается день
за днем. И в этой бездне есть данные пользователя – это все наши действия,
цифровые реакции, которые мы производим, находясь в цифровом пространстве. Даже
простая регистрация в социальной сети и создание полупустого аккаунта – это уже
артефакт, который мы оставляем после себя в виртуальном мире", – объясняет
ученый.
Большие данные под лупой
© предоставила пресс-служба Томского госуниверситета
Для изучения big data, в том числе данных
пользователей, в ТГУ в 2016 году был создан Центр прикладного анализа больших
данных. С каждым годом он растет по навыкам и компетенциям, доступным при
работе с big data, по количеству задач и проектов.
"Центр ТГУ – это не единственный пример, когда ученые пробуют
извлекать пользу из огромного количества данных. Так, появился консорциум
университетов, цель которого – объединять усилия, обмениваться данными,
навыками и технологиями по извлечению этих данных", – говорит Фещенко.
Одно из направлений исследований ученых консорциума – проект, связанный с
измерением третьей роли университета, то есть его влияния на экономику, уровень
человеческого капитала и инновационный потенциал региона. В его рамках среди
прочего специалисты выяснили, какие известные выпускники вуза являются наиболее
"просматриваемыми" в Википедии.
"ТГУ сделал для себя интересное открытие. Оказалось, что на первом
месте среди наших самых популярных выпускников находится Ким Ём Нам. Кто это?
Видный политический деятель Корейской народно-демократической республики. На
втором месте – Михаил Башкатов, на третьем – Андрей Бурковский", – говорит
ученый ТГУ.
Еще одно исследование касалось психологического портрета благотворителя,
который поддерживает эндаумент-фонды вузов.
"Ученые задались вопросом, что же подталкивает людей к тому, чтобы
благодарить свои университеты и делать взносы. Здесь большие данные помогли
собрать цифровой след благотворителей в социальных сетях, обобщить его и
увидеть некие закономерности. <...> Все это помогает университетам
улучшить методики работы с выпускниками и увеличить количество благотворителей",
– рассказывает эксперт.
Личность и след – все в "цифре"
К большим данным имеет прямое отношение так называемая цифровая модель
человека или личности. Как правило, для составления такой модели применяется
искусственный интеллект.
Фещенко отмечает: чтобы понять, что подразумевается под цифровой моделью
человека, нужно разобраться, что же такое цифровой след.
"В жизни человека есть деятельность, связанная с обучением и работой.
И в этой части цифрового пространства человек генерирует цифровой след, но не
очень насыщенный. Его можно использовать для прогнозирования того, что будет
происходить в поведении человека, а именно для этого нужна цифровая модель
личности. Но более богатым с точки зрения создания прогнозов является его
цифровой след в соцсетях, видеохостингах, мессенджерах", – говорит он.
Извлекать эти данные отовсюду невозможно – ученые работают с открытыми
пользовательскими данными в соцсетях, и это огромный пласт информации. Наука
доказывает, что по цифровому следу можно понять, что представляет из себя
человек и какие у него психологическое особенности.
© сайт Томского государственного университета
Так, одно из исследований показало, что по тексту на "стене"
конкретного человека в соцсетях можно определить, к какому психологическому
типу он относится. Этот эксперимент проходил по следующей схеме: реальные люди
выполняли тест, например, на уровень экстраверсии, затем исследовался их
цифровой след в Facebook, и искусственный
интеллект находил закономерности.
Оказывается, экстраверты чаще пишут тексты, связанные со спортом, отдыхом,
пляжем, а интроверты чаще упоминают современную японскую культуру.
Какое прикладное применение может быть у цифрового следа? "Пример "Робот-профориентатор"
ТГУ – приложение во "ВКонтакте", которое за несколько секунд
подскажет одну из 10 профессиональных сфер, которая вам подходит по интересам и
жизненным ценностям, отпечатанным в цифровом следе. Робот выдает прогноз,
который приведет вас к списку профессий, и там вы сможете выбрать и факультет,
и вуз", – объясняет Фещенко.
Цифровые модели людей используются в маркетинге, политических предвыборных
кампаниях и многом-многом другом, отмечает ученый. Сфера применения растет с
каждым днем – с развитием технологий и уж тем более с переходом мира в более "глубокий"
дистант.
Big data в жизни современного человека