ТОМСК, 21 фев – РИА Томск. Ученые Томского государственного университета (ТГУ) рассчитали индексы благополучия для каждого
региона России, проанализировав данные социальных сетей; самые отрицательные
оценки качества жизни зафиксированы в Западной Сибири, а наиболее положительные
– в Чукотском автономном округе. Подробности – в обзоре РИА Томск.
Уточняется, что исследования проводят ученые
лаборатории наук о больших данных и проблемах общества ТГУ при поддержке гранта
Российского фонда фундаментальных исследований (РФФИ).
Лаборатория была создана в 2016 году, ее научным
руководителем сейчас является профессор Орегонского университета (США) Михаил
Мягков. Коллектив лаборатории – 20 человек – анализирует открытые данные на
основе цифрового следа пользователей (посты, комментарии, дружественные связи и
другое), в том числе из социальных сетей.
© предоставила пресс-служба Томского госуниверситета
Сотрудники лаборатории наук о больших данных и проблемах общества ТГУ
Классификация благополучия
Автор проекта "Изучение качества жизни россиян по
данным соцсетей" – научный сотрудник лаборатории Евгений Щекотин. Он и его
коллеги планируют посмотреть в динамике, как у людей меняется оценка той или
иной сферы жизни.
© РИА Томск. Павел Стефанский
Для этого еще в прошлом году ученые начали разрабатывать
методологию анализа благополучия россиян: идея была в том, чтобы изучать
региональные сообщества, но не все подряд, а с исключением "мусорных"
– "отдам даром", "доставка пиццы/суши" так далее.
"Был разработан классификатор сообщений по 19
категориям социальной, экономической и политической сферы. Сейчас в лаборатории
есть данные за 2018 год, идет выгрузка данных за 2019-й. О динамике пока
говорить рано, однако рассчитаны индексы благополучия по каждому региону
страны, плюс есть такие индексы по каждой категории", – говорится в
сообщении.
Кому на Руси жить хорошо
"Итоговое положительное значение у нас получилось
по всем категориям только по Чукотскому автономному округу. Самые высокие
отрицательные оценки качества жизни прослеживались, в основном, в регионах
Западной Сибири. Наименьшие отрицательные значения зафиксированы в Камчатском
крае, Магаданской области, Приморском крае, в Москве", – цитируется в
сообщении сотрудница лаборатории Галина Коварж.
По ее словам, наибольшую обеспокоенность у
пользователей вызывает такой показатель, как безопасность, он намного выше в
сравнении с другими.
© предоставила пресс-служба Томского госуниверситета
Галина Коварж, сотрудница лаборатории наук о больших данных и проблемах общества ТГУ
"По всем категориям и по трем тональностям –
позитивной, негативной и нейтральной – обработано более 3,3 миллиона постов за
2018 год. Алгоритм также отбрасывает "мусорные" сообщения, по
заданной формуле рассчитывает индекс благополучия, и на основе полученных
данных команда проекта выводит среднемесячные значения по каждой категории и
тональности в каждом регионе страны", – дополняет пресс-служба.
© РИА Томск. Таисия Воронцова
Так выясняется, насколько люди удовлетворены или нет,
например, инфраструктурой, внутренней политикой в регионе, экологической
ситуацией и так далее. В классификаторе также уделяется внимание отношениям
между людьми, общему эмоциональному состоянию человека. Ученые не упускают эти
важные личностные аспекты, чтобы не было формального подхода к исследованию.
Исследование для миллионов
Ученые подчеркивают, что в настоящее время существуют
две теории измерения благополучия людей – объективная и субъективная. Первая
подразумевает стандартное использование статистических данных, вторая –
использование данных соцопросов, анкетирования и личностных оценок, полученных,
например, в процессе социальных экспериментов.
"В масштабах страны, где численность населения
составляет почти 147 миллионов человек, стандартный соцопрос охватывает в
среднем 1,6 тысячи человек. А с помощью соцсетей мы можем получить гораздо
больший охват", – говорит Коварж.
По ее словам, по автоматическому алгоритму поиска
ученые будут анализировать в каждом регионе по 400–500 сообществ в соцсетях.
Таким образом, они смогут охватить около 80 миллионов зарегистрированных
пользователей соцсетей, из которых более 60 миллионов – жители России.
Как уточняется в сообщении, в этом году начнется
автоматический отсев ботов, которые встречаются в самых разных сообществах – в
том числе и в тех, которые интересны для анализа индекса благополучия реальных
людей.