Новости науки и техники
3147 | 0

Кто намывает золото на интернет-помойке

Концепцию «больших данных» (Big Data), позволяющую справляться с любым объемом информации, в научном мире окрестили новой нефтью, символом новой золотой лихорадки. С помощью Big Data экспертное сообщество планирует одолеть любые задачи - от проблем мирового голода до решений по госуправлению, здравоохранению и отдельным бизнес-проектам.

Кто намывает золото на интернет-помойке
Читайте МН в TELEGRAM ДЗЕН

Пользователи интернета породили огромную, до недавнего времени неуправляемую информационную помойку. Но любая объемная бессмыслица обладает неочевидным капиталом, и за его извлечение будет биться весь мир!

Этот метод, перелопачивающий громадье данных с помощью математических алгоритмов, достаточно точно показывает, на чем можно сэкономить деньги, какое лекарство эффективнее и т.п. Так, вы вдруг узнаете, что в ДТП чаще всего  попадают автомобили оранжевого цвета...

Вспомним, как в 2009 году был обнаружен новый штамм вируса гриппа H1N1, против которого не было вакцины. Пока органы здравоохранения  США медленно и печально собирали информацию о распространении вируса, ситуацию спас Google, применивший метод Big Data. Инженеры проанализировали более трех миллиардов поисковых запросов в день. Была разработана универсальная система, позволяющая выявить соотношение между частотой запросов по тем или иным лекарствам и распространением гриппа. Исследование Google опередило бюрократическую волокиту и помогло спасти немало жизней.

ГДЕ ПИТТ И ДЖОЛИ - ТАМ ПОБЕДА

Молодой предприниматель Брэдфорд Кросс на основе Big Data проанализировал пользовательские настройки, критерии популярности, связанные с социальными сетями, сайты, блоги и официальные СМИ. Характерно, что алгоритм Big Data не делал различий между аккаунтом подростка, корпоративным сайтом или публикацией в Washington Post. Программа просто распознала, что в высшей степени востребовано и интересно. Сайт находчивого студента заработал миллионы, набрав колоссальный трафик просмотров и утерев нос электронной версии газеты The New York Times.

Сайт The-Numbers.com на основе Big Data сообщает голливудским продюсерам предполагаемый доход от того или иного фильма задолго до первого дубля. Компания обрабатывает около 30 млн записей о каждом коммерческом кинофильме США за последние годы. Это данные о бюджете, жанре, актерском составе, съемочной группе, наградах, кассовых сборах и т.д. и т.п. «Мы разработали карту из миллиона взаимосвязей. Например, этот сценарист работал с этим режиссером; этот режиссер работал с этим актером», - говорит президент компании Брюс Нэш. Отдельной услугой The-Numbers.com является подсказка о том, как увеличить доход и свести к минимуму финансовые риски. Например, «большие данные» говорят: проект будет успешен, если в главной мужской роли снимется актер, номинированный на премию «Оскар», с гонораром 5 млн долларов... Или, скажем, фильм быстро окупится, если потратиться на парочку Брэд Питт-Анджелина Джоли.

С помощью Big Data продавцы торговой сети Target «пеленгуют» девушек в интересном положении. Оказывается, американки на третьем месяце беременности приобретают лосьон без запаха. На более позднем сроке - пищевые добавки (магний, кальций, цинк и пр.). Таким образом, хитрые маркетологи угадывают приблизительную дату родов и агрессивно «отоваривают» всю счастливую семью.

Благодаря Big Data проект ancestry.com задался целью построить семейную историю человечества. В распоряжении его специалистов есть все - от летописей до анализов ДНК. Уже удалось собрать около 5 млрд профилей людей, живших в разные исторические эпохи, 45 млн генеалогических древ, описывающих связи внутри семей.

Для обработки глобальной информации в США строят гигантские центры. В их числе здание АНБ в Форт-Уильямсе, Юта, стоимостью 1,2 млрд долларов. Это хранилище будет способно вместить все о каждом из нас.

ХОРОШИЙ ЗАЕМЩИК НОЧУЕТ ДОМА

В России потребители Big Data разделяются на две большие группы - технологические компании и корпоративный рынок. Первым российским покупателем аналитической системы в стиле «больших данных» стала компания Yota Networks. На Big Data построены многие продукты «Яндекса». Это поиск, машинный перевод, антиспам,  распознавание образов и речи, предсказание пробок, рекламные стратегии...

Российские «сотовики» уже года три как занимаются геоаналитикой, то есть вопросами дислокации нас с вами, абонентов. В этом году это направление трансформировалось в самостоятельный сервис по изучению пассажироперевозок.

Геолокация плюс исследования интернет-трафика абонентов - находка для банков, выдающих кредиты населению. Технические решения по оценке рисков заемщика принимаются согласно балловой системе, в которой закодирована наша личная информация. «Анализ интернет-трафика и передвижений абонента помогает отсечь большую часть мошенников. Так, одним из критериев порядочности заемщика считается... привычка заемщика ночевать по одному адресу. Также изучаются связь абонента со злостными должниками, его активность в соцсетях, посещаемые им сайты, аспект взаимоотношений с соседями. Важно, сколько абонент разговаривает по телефону, где и с какой периодичностью совершает платежи. В работу поступают все эти штрихи, как и сотни других. Но я не могу раскрывать все внутренние нюансы, поскольку мы работаем в рамках соглашения о конфиденциальности», - рассказывал корреспонденту «МН» инженер-специалист по Big Data одного из крупных банков.

ЭЛЕКТРОННЫЕ СТУКАЧИ

Дополнительный пугающий тренд - судить и наказывать людей на основе прогнозов «больших данных» до того, как они совершат преступление. Это сводит на нет идею презумпции невиновности. В Америке в 30 штатах известны случаи, когда на основе анализа «больших данных» отказывали в условно-досрочном освобождении. Безжалостный алгоритм указал на этих лиц как на наиболее склонных к совершению преступлений.

В 2006 году компания AOL сделала общедоступными старые поисковые запросы. Личные данные - имя пользователя и IP-адрес - были удалены и заменены уникальным числовым идентификатором. Все это было сделано под предлогом возможности интересных исследований. Пытливые корреспонденты New York Times наняли инженера по «большим данным», связали такие поисковые запросы, как «целебный чай», «одинокие мужчины за...», «ландшафтный дизайнер в Лилбурне, Джорджия», и легко установили, что пользователь №4417749 - это Тельма Арнольд, 62-летняя вдова из Лилбурна. У женщины случилась истерика, разразился скандал, того, кто слил результат в Сеть, крупно оштрафовали.

Мария Рунова

Фото FOTOLIA.COM

ПОСЛЕСЛОВИЕ

Как видим, «большие данные» из бесценного инструмента в одночасье могут превратиться в орудие манипуляций, преследований и репрессий. Самая большая печаль - никто и ничто не гарантирует нам больше конфиденциальности. От личной жизни до публичной - один шаг.

 

Подпишитесь и следите за новостями удобным для Вас способом.