Нейросеть научили предсказывать наводнения по Flickr


Опубликованно 12.03.2017 22:10

Нейросеть научили предсказывать наводнения по Flickr

Британские ученые показали, что семантический анализ контента пользователя в социальных сетях позволяет прогнозировать стихийные бедствия.

Современных систем предупреждения об опасности стихийных бедствий во многом основаны на эксплуатацию специализированного оборудования и профессиональных аналитиков. В то же время, существуют сервисы, с помощью которых все желающие могут в режиме реального времени сообщать властям об изменении некоторых климатических показателей, например, количества осадков и уровня воды. Кроме того, ранее Геологическая служба США (USGS), признал, что анализ пользовательского контента и местоположения постов в Twitter может быть хорошим дополнением к методам высоких технологий, выступая в роли "барометр общества".

Предыдущие исследования показали, что таким же образом может использовать сервис обмена фотографиями Flickr. Таким образом, динамика публикаций, а также характер их описание и теги коррелирует с колебаниями атмосферного давления, в штате Нью-Джерси накануне и во время урагана Сэнди в 2012 году, что в теории позволило прогнозировать изменения погоды в пострадавших районах. Тем не менее, методы, контент-анализ в социальных сетях часто зависят от ключевых слов и фраз, соответствующих определенному типу или названию стихийного бедствия (наводнения, "Катрина"). По мнению авторов новой работы, такой подход может быть эффективным при решении оперативных проблем, но ее возможности сильно ограничены.

Чтобы восполнить этот пробел, исследователи из университета Уорвик разработали алгоритм для анализа семантических тегов, которые были сформированы с помощью метода матрицы корреляции деконструированных водопады (Deconstructed Cascade Correlation Matrix). Этот метод позволяет сформировать ложное нейросеть анализ целевой проблемы, "замораживая" весовых блоков скрытый вход, — в результате оценки, остается относительно стабильным, несмотря на изменчивость параметров. Кроме того, DCCM предусматривает возможность вертикальной и горизонтальной деконструкции переменные и работа в интернете. Метод междисциплинарных и прикладных, в том числе для прогнозирования погоды.

Команда создала новый алгоритм на фото и видео из пакета Yahoo Flickr Creative Commons 100M (YFCC100M), которые были выпущены в период с апреля 2004 по август 2014 года. На вход компьютера проанализировали материалы на четыре основные ("природа", "пейзаж", "река", "вода") и два синтеза ("RW" — "река" и "вода" и "NL", "природа" и "пейзаж") теги, выход из которого был связан с особыми потребностями ("потоп", "наводнение", "пойма") with без указания атрибутов веса. Сопоставление тега с риском стихийных бедствий был проведен на основе трех параметров: масштаб события, количество публикаций за пять дней до пика наводнения и спустя пять дней, так что модель поведения в период пика наводнения.

Результаты показали, что появление Flickr теги, связанных с наводнениями, статистически значимо коррелирует с показателем заболеваемости конкретные ("вода", "река") и синтеза ("RW") теги. В то же время, угроза стихийного бедствия оказались почти не связаны с увеличением числа таких тегов, как "пейзаж" и "природа". Примечательно, что теги "вода" и "река" заняли промежуточное положение между маркерами катастрофы и на тему природы и почти такую же корреляцию с остальными тегами. Резюме теги наиболее часто встречались однажды прежде, в пик наводнения, подход, на пике тег "RW" был использован все больше и больше, и тег "NL", напротив, резко утратили свою популярность.

Кроме того, ученые ретроспективно проверить способность модели предсказывать наводнения по количеству публикаций в день в течение пяти дней до события. Наиболее сильная корреляция найдено для теги "VIDEO" и "вода". Таким образом, угроза бедствия, отметил увеличение числа загрузок с тегом "RW" на 100 и более пяти дней до затопления, с последующим жидкости, падение индикатора. Увеличение количества публикаций с тегом "RW" - до 125 и более в день корреляция возросла; это же динамика была характерна для роста загрузки с тегом "вода" до 125 и более в день, с пиком в течение трех дней до наводнения и отслеживать снижение ставки.

По словам авторов, их исследование показывает, что социальные сети-это ресурс, который может быть использован в сочетании с профессиональными источников метеорологичесикх данных. В будущем, эти системы профилактики, основанные на анализе содержимого, могут обладать беспрецедентной точностью и эффективностью, утверждают ученые.

Поведение пользователей социальных сетей является объектом изучения не в первый раз. Ранее психологи связали активность на этих сайтах, с чувством социальной изоляции и физики сравнили распространения мемов в социальных сетях с статистические модели, которые описывают эпидемия и финансовые рынки.



Категория: Наука и техника