Ученые НИТУ «МИСиС» разработали математическую модель, которая сможет прогнозировать следующее местоположение человека, основываясь на его текущих публикациях в Twitter. Алгоритм использует для «предсказаний» большие данные и машинное обучение
Российские ученые представили алгоритм, способный предугадывать место отдыха человека, основываясь на его публикациях в соцсетях. Решение использует для прогнозов большие данные (Big Data) и машинное обучение (ML). Статья о разработке опубликована в статье An ensemble classification approach for prediction of user’s next location based on Twitter data в журнале Journal of Ambient Intelligence and Humanized Computing.
Как сообщили в пресс-службе вуза, прогнозы следующего местоположения пользователей базируются на публикациях людей в Twitter с геолокацией. При отборе данных категории сопоставлялись с характеристиками личности пользователя. Для построения модели прогнозирования был использован метод ансамблевой классификации, объединяющей результаты всех базовых классификаторов.
«Мы использовали не только открытые данные о путешествиях, но и о личностях самих путешественников. Сначала мы извлекли из данных все геотегируемые твиты и категоризировали. Из случайного набора 5000 профилей пользователей разных европейских стран (Франция, Германия, Швеция, Испания, Италия, Швейцария, Польша, Греция и многие другие) было выложено более 800 тысяч твитов. При отборе данных наиболее посещаемыми в поездках категориями оказались «Еда», «Ночные клубы», «Вокзалы», «Церкви», «Морские пляжи». Для каждой категории мы подготовили отдельный набор данных», — рассказала руководитель исследования, директор Института информационных бизнес-систем НИТУ «МИСиС» Марина Нежурина.
По мнению разработчиков, алгоритм будет полезен представителям туристического бизнеса, так как позволит предсказывать востребованность курортов в отпускной период. Сейчас ученые работают над возможностью конкретизации прогнозов с учетом гражданства, возраста и пола пользователей.