ТОМСК, 16 ноя – РИА
Томск, Елена Тайлашева. Приемная кампания 2021 года в Томском политехе (ТПУ) будет выстроена с использованием технологий Big Data: проект по анализу данных
абитуриентов, выполненный с участием студентов-айтишников, позволит более
точечно искать химиков, физиков или, скажем, будущих предпринимателей из
конкретных регионов. Как машина прогнозирует выбор школьников – в материале РИА
Томск.
"Подсветка" деталей
Базовую статистику по итогам приемной кампании собирают все
вузы – публикуют средний балл, количество высокобалльников, географию
поступающих, конкурс… Словом, все, что несложно выделить и посчитать в
экселевской таблице.
Этим летом в Томском политехе решили копнуть глубже,
проанализировав большие массивы данных. Студенты Инженерной школы
информационных технологий и робототехники (ИШИТР) во время летней практики
погрузились в статистику по абитуриентам за последние два года, а конкретно – в
те первичные данные, которые они сообщают о себе в анкетах при подаче
документов. Закономерности в них искала машина.
И кое в чем они оказались очень неожиданными...
© пресс-служба Томского политехнического университетаДанные из анкет выпускников не такие уж подробные – учебное заведение, которое окончили, баллы ЕГЭ, место прописки. Но даже эти данные – большие, если учитывать, что абитуриентов десятки тысяч.
Скажем, всегда было известно, что большинство среди
поступающих – томичи, следующая по величине группа – кемеровские абитуриенты, и
далее по убывающей жители других регионов Сибири и Дальнего Востока.
Но Big Data "подсветила" некоторые важные особенности набора
этого года, например, что почти треть из 71 абитуриента-300-балльника в этом году дала
именно Кемеровская область, а самое большое количество круглых отличников – 23
– поступило в Инженерную школу природных ресурсов (ИШПР), причем пятеро из них
– новосибирцы.
Или, например, что нынче был пик по поступлению "хорошистов" – школьников с хорошей успеваемостью по всем предметам (средний балл около 255)
– их стало на треть больше, чем в 2019 году, при этом высокобалльники нередко
приезжают из Татарстана и Краснодарского края, а в ИШПР поступил даже один
москвич.
"Интересно также, что в этом году у нас резкий скачок по
300-балльникам – их стало больше почти в два раза (71 против 39-ти в прошлом году).
Зато "просела" химия среди неолимпиадников. Почему так получилось? Это предмет
для последующего анализа", – говорит руководитель проекта, советник ректора ТПУ
Ростислав Яворский.
Точечный удар
Big Data – это прежде всего персонализация, подчеркивает
Яворский: алгоритм, в отличие от человека, может проанализировать информацию по
каждому абитуриенту и на ее основании сделать выводы относительно конкретного
региона, школы, класса, тех двух-трех человек, поступающих на конкретную
специальность.
"Благодаря такому подробному анализу данных возникают
интересные инсайты, и эти знания могут привести к более точному пониманию
результатов приема и более оптимальному планированию кампании на следующий год.
Не просто – мы набрали лучших, и мы молодцы. А конкретно – набрали
лучших в каком сегменте, на какое направление, из какой школы? Можно
проанализировать историю региона: у нас там были мероприятия, конкурсы, встречи
с учителями, которые "привели" к нам талантливых студентов? Постепенно
технологии Big Data становятся незаменимым инструментом для людей, которые
планируют и организуют приемную кампанию следующего года", – говорит эксперт.
© пресс-служба Томского политехнического университета"Если мы видим, что в каком-то регионе абитуриенты из одной школы показывают средний балл ниже, зато по физике у них балл выше, мы можем работать с этой школой по набору на конкретную специальность, где нужна именно сильная физика", – говорит Ростислав Яворский.
Исполняющий обязанности начальника отдела организации набора
ТПУ Александр Денисевич подтверждает, что результаты исследования позволят
более точечно определить ключевые регионы для ТПУ:
"Например, благодаря новому инструменту мы видим, что из
Иркутской области к нам в основном едут абитуриенты со средним баллом, и они, как и абитуриенты из Читы, часто поступают в Инженерную школу ядерных
технологий. Видимо, потому что на территории регионов есть предприятия,
входящие в структуру Росатома, и ребята планируют потом вернуться.
Интерес к ядерной физике проявляют и школьники Омской
области, между тем мы никогда не проводили там выездных мероприятий,
концентрируясь на ближайших соседях. Будем расширять географию, активно
подключать к кампании новые регионы, в которых мы увидели спрос на конкретные
специальности".
Следующий этап проекта по Big Data – анализ абитуриентских
данных за 5-7 лет, который может показать еще более глубокие взаимосвязи и
предопределить тенденции их спроса.
© пресс-служба Томского политехнического университетаВ работе с данными много времени занимает исправление опечаток и неточностей, заполнение пропусков. Эта часть тоже делается не вручную, а с помощью специально разрабатываемых скриптов. Очистка, нормализация и подготовка к анализу занимают большую часть времени и сил инженера Big Data.
Все включено
В будущем, считает Яворский, приемные кампании по
степени цифровизации будут похожи на самые продвинутые в этом смысле сферы,
например, туризм. По его словам, компьютеризация проходит в несколько этапов:
"Если проводить аналогии с туризмом, то многие еще помнят
время, когда поездку в отпуск можно было организовать только через турагентство.
Первым шагом к цифровизации было появление компьютерных систем для покупки
авиабилетов. Затем в интернете появились базы данных гостиниц с возможностью
бронирования онлайн, далее – сервисы с подробными описаниями мест отдыха,
многочисленными фотографиями и рекомендациями пользователей.
Конечно, компьютер не принимает за вас решение, где
отдыхать, но сейчас достаточно забить в поисковик ваши пожелания (первая линия
у моря, развлечения для детей, бюджет путешествия) – и интернет предложит вам
десятки вариантов "под ключ" с возможностью забронировать тур и купить билеты в один клик. В итоге искусственный интеллект
полностью автоматизировал все, что делали турагентства".
Похожая ситуация происходит с приемной кампанией: не за
горами появление рекомендательных систем, которым можно будет задать параметры
специальности, на которую требуется набор, и получить от искусственного
интеллекта точные инструкции, в каких регионах какие мероприятия провести, в
какие соцсети и с какой рекламой выходить, чтобы точно попасть в "своих"
абитуриентов.
© РИА Томск. Павел СтефанскийНа следующий год в Томском политехе открыто 3 519 бюджетных мест на все формы и уровни обучения. Это на 713 мест больше, чем в 2020 году.