Рохит Бхаргава – Мегатренды. Как предсказывать грядущие тенденции и видеть то, что упускают другие (страница 26)
В 1954 году гуру менеджмента Питер Друкер сделал знаменитый вывод: «
На протяжении десятилетий эта мантра описывала, как мир воспринимает данные. Цифры приветствуются повсюду, и те, кто принимает решения на их основе, пользуются уважением. Самые богатые компании в мире – те, что имеют доступ к самым большим массивам данных.
Неудивительно, что под влиянием нашей культуры благоговения перед данными все сосредоточены на поиске новых и лучших способов накопить как можно больше информации. Компании не только постоянно собирают «большие данные» через принадлежащие им платформы, но и наши гаджеты генерируют бесконечные потоки «малых данных». Голосовые устройства прослушивают и записывают разговоры. Данные из приложений по совместному пользованию автотранспортом, умных термостатов, потоковых развлечений, онлайн-игр, фитнес-трекеров и трафика в режиме реального времени собираются и хранятся как правило теми, кто надеется извлечь выгоду из этой информации.
Бо́льшая часть малых данных поступает из информации, которой мы делимся добровольно, поскольку последствия этого редко кажутся нам опасными. Кого волнует, что Netflix точно знает, какие фильмы вы выберете, или что Google знает о ваших поисках нового принтера? В некотором смысле тот факт, что у них есть эта информация, означает, что они смогут оказать вам лучшую и более персонализированную услугу.
И все же иногда мы невольно делимся информацией, которой не собирались делиться. Например, загрузка фотографии в интернет часто включает скрытые метаданные, такие как точное местоположение GPS и время, которые могут быть сопоставлены с фотографиями других людей, чтобы точно определить, с кем вы были и даже что вы делали. Вероятность злоупотреблений технологией отслеживания лиц настолько велика, что Сан-Франциско и несколько других городов уже запретили ее применение230.
В дополнение ко всем этим данным, собранным организациями, и информации, распространяемой в интернете отдельными лицами, существует еще один источник важных данных, который все чаще становится общедоступным: «открытые данные». Этот термин относится к обширным хранилищам данных, выгружаемых в интернет компаниями и правительствами во имя прозрачности или соблюдения нормативных требований. Это сочетание создало путаницу, которую я описал в 2018 году, назвав тенденцию
По некоторым экспертным оценкам, колоссальные 90 процентов данных, которые в настоящее время существуют в мире, были созданы за последние два года, и они будут продолжать экспоненциально умножаться231.
В современном мире
Хорошие данные и бесполезные данные
Сельское хозяйство, в настоящее время переполненное данными, может дать некоторые ответы.
Сегодня всего лишь одна ферма способна предоставить горы сведений от датчиков в почве, портативных трекеров на сельскохозяйственных животных и воздушных дронов, контролирующих урожай. Эта информация дает возможность грамотно вести земледелие – посадить нужные растения в нужном месте и собрать урожай в нужное время.
Некоторые группы объединяют данные из многих источников, чтобы создать нечто, имеющее ценность для всей отрасли. Калифорнийская фермерская бизнес-сеть является одним из таких примеров232. Сеть просит фермеров поделиться данными о ценах на химикаты, размерах полей и урожайности сельскохозяйственных культур. Эта информация от тысяч участвующих фермеров, коллективно обрабатывающих более чем 9 тысяч гектаров сельскохозяйственных угодий по всей территории Соединенных Штатов и Канады, вводится в систему, чтобы любой участник мог видеть справедливые рыночные цены на сырье, реальную урожайность семян и оптимальные точки доставки зерна.
Точно так же открытые сети появляются и в других отраслях. В области медицины, например, приложение под названием Figure 1 привлекло почти 2,5 миллиона медицинских работников для обмена изображениями пациентов (с удаленными личными данными), чтобы помочь своим коллегам диагностировать сложные или редкие заболевания. Это приложение, получившее название «Instagram для врачей»233, помогло сотням профессионалов лучше лечить пациентов с помощью идей коллег-медиков со всего мира.
Распространение открытых сетей оказывается чрезвычайно полезным для тех, кто делится данными. Однако это верно только в случае, если данные хороши – актуальны, понятны и управляемы. Больше не всегда означает лучше.
Обширные массивы данных от правительственных и неправительственных групп становятся доступными для других пользователей интернета. Теоретически это может показаться положительным моментом, но, к сожалению, не все данные пригодны для использования. Индекс GovLab234, который отслеживает тенденции открытых данных и публикует ежегодные отчеты об уровне их использования правительствами во всем мире, выявил некоторые отрезвляющие моменты:
● Более 1 миллиона наборов данных были открыты правительствами по всему миру.
● Менее 7 % этих наборов данных публикуются как в машиночитаемых формах, так и по открытым лицензиям.
● 96 % стран обмениваются наборами данных, которые не обновляются регулярно.
Когда дело касается данных, качество гораздо важнее, чем количество, как поняли те, кто вкладывает свои рекламные доллары в социальные медиаплатформы.
Когда поддельные аккаунты портят данные
Facebook получил огромную прибыль от ошеломляющего количества данных, которые он собирает от пользователей. Рекламодатели стекались в Facebook, чтобы получить доступ к данным. Количество пользователей и детали, которые Facebook знает о каждом из них, дают рекламодателям огромную возможность таргетированной рекламы в зависимости от того, во что люди верят, кого слушают, что им нравится и что они ищут.
Другие онлайн-платформы также предлагают аналогичный вариант брендам, но все они сталкиваются с реальной и растущей проблемой: многие пользователи на их платформах на самом деле являются троллями, ботами или скрываются за поддельными учетными записями.
В первые шесть месяцев 2019 года Facebook вычистил поддельные аккаунты из своей системы235, что становится сейчас необходимым ритуалом для всех. По имеющимся данным, чистка была самой масштабной за всю историю: удалили 3,39 миллиарда поддельных аккаунтов. За полгода фальшивых аккаунтов на платформе было создано больше, чем реальных, которые, по оценке Facebook, составляли лишь около 2,4 миллиарда.
Трудно сказать, сколько аккаунтов в социальных сетях могут быть фальшивыми, потому что большинство платформ неохотно делятся этими цифрами публично. Однако некоторые независимые исследователи подсчитали, что по крайней мере 15 % всех профилей в социальных сетях могут быть автоматически сгенерированы без реального человека, стоящего за ними. Столь высокий процент подделок разочаровывает рекламодателей.
Один из специалистов, возглавляющий работу по решению этой проблемы, – главный бренд-директор компании Procter & Gamble Марк Притчард. В 2017 году он, как известно, сократил расходы на цифровую рекламу более чем на 200 миллионов долларов в связи с сомнениями по поводу ее просмотров, случаями мошенничества и отсутствием измерений качества236. Этот шаг вызвал приливную волну в медиаиндустрии и запустил спешное удаление мертвых учетных записей и очистку данных.
К сожалению, поддельные аккаунты в социальных сетях – не единственный способ загрязнения данных. Пользователи сами часто вносят свой вклад в скомпрометированные или отсутствующие данные.
Я слежу за своим 15-летним сыном в Instagram и в прошлом месяце заметил в его аккаунте что-то странное. После того как летом он провел несколько недель, путешествуя по Западному побережью и делясь множеством фотографий, на его странице вдруг осталось всего четыре фотографии из этой поездки. Обеспокоенный тем, что он потерял часть контента, я спросил его об этом.
«Я удалил их», – сказал он.
«Почему?» – я был озадачен его ответом.
«Мне они не нужны».
Большинство постов моего сына получают примерно в десять раз больше лайков, чем мои, но это социальное одобрение, похоже, не имеет для него значения. В то время как я использую социальные сети как галерею своей жизни, для него это скорее схоже с предметом одежды: сегодня вещь можно надеть, а завтра сменить. Оказывается, он не одинок.
В статье в Washington Post сообщалось, что подростки следят за своими аккаунтами в Instagram и удаляют старые фотографии, которые либо не получили много лайков, либо больше не нужны в их профилях237. Но когда пользователи удаляют старые посты, это отражается на числе просмотров их страниц и меняет статистику времени вовлеченности, искажая данные, которые Instagram пытается монетизировать. Чем менее точны их данные, тем меньше возможностей для продажи рекламы. Отчаявшись удержать пользователей от удаления данных, от которых зависит его бизнес-модель, Instagram ввел функцию, которая позволяет архивировать старые фото вместо их удаления.