Идея о том, что активность людей в социальных сетях и твиттере может многое рассказать о явлениях, суть которых не лежит на поверхности, завоевывает все большую популярность у ученых. За последние несколько лет различные группы исследователей заявляли, что научились предсказывать что угодно — от исхода президентских выборов до выручки от проката новых кинокартин.
«Газета.Ru» рассказывала, как активность в твиттере зависит от того, насколько далеко человек уехал от дома, а недавно ирландские ученые поведали, как при помощи этой платформы узнать, какие группировки воюют на невидимом интернет-фронте сирийского конфликта.
Предсказать поведение толпы, а также время и место массовых протестов, что выглядит довольно актуальным на фоне киевских столкновений, попробовал студент Массачусетского технологического института Натан Каллас.
Учитывая опыт «арабской весны» и то, что твиттер собирает ежедневно около 500 млн сообщений и продолжает расти, Каллас считает, что подобные предсказания будут очень важны в будущем.
В своей работе, выложенной в архиве электронных препринтов, студент использовал данные, предоставленные американской компанией Recorded Future. Она занимается сбором открытых данных в интернете, связей между источниками и предсказанием на их основе различных событий. Компания сканирует порядка 300 тыс. источников в интернете, сообщения в которых появляются на семи языках: арабском, английском, фарси, французском, русском, испанском и китайском.
Каллас использовал эти данные, чтобы понять на примере протестов в отдельно взятых странах, какие индикаторы указывали на готовящиеся столкновения. «Мы ограничили наш выбор 18 странами, среди них — Афганистан, Бахрейн, Египет, Греция, Индия, Индонезия, Иран, Италия…» — пишет Каллас в своей работе. Затем он проанализировал сообщения, предшествовавшие массовым протестам в этих странах, с 1 января 2011-го по 10 июля 2013 года.
Используя стандартные языковые процедуры обработки, автор исследовал ключевые слова, тональность высказываний местных жителей накануне массовых протестов.
Найдя общие закономерности твиттер-активности в выбранных странах, Каллас проанализировал сообщения египтян накануне государственного переворота в июле 2013 года и попытался задним числом предсказать беспорядки.
В таблице красные квадратики соответствуют дням с высокой вероятностью протестов, синие — с низкой.
«Как мы можем видеть, протесты вокруг даты 30 июня предсказывались с высокой точностью задолго, за три недели до этого», — уверен автор. В действительности Каллас, если бы занимался пророчеством в июне прошлого года, не ошибался бы:
массовые протесты и правда пришлись на годовщину правления президента Мухаммеда Мурси.
«Как известно, протесты в годовщину правления Мурси действительно выросли, и в столкновениях с полицией было много погибших и раненых. Протесты продолжились, и 1 июля египетская армия выставила ультиматум Мурси… 3 июля армия отстранила президента Мурси от власти», — напоминает Каллас.
И хотя у освоенного метода есть ряд недостатков, связанных с невозможностью отличить, скажем, пустую, но воинствующую болтовню молодых людей от реальных намерений участвовать в протестах, предсказание выступлений в будущем может играть важную роль.
Этим инструментом могут воспользоваться как власти, так и те, кто хочет уберечь витрины своих магазинов в крупных городах.
«К сожалению, у меня нет прогноза по поводу Киева, которым я мог бы поделиться на данный момент», — ответил автор «Газете.Ru» на вопрос касательно ситуации на Украине.