Адам Кучарски – Законы эпидемий. Как развиваются и почему прекращаются эпидемии болезней, финансовые кризисы, вспышки насилия и модные тренды (страница 54)
Подобные базы данных создают не только коммерческие компании. За период с 2006 по 2010 год полмиллиона добровольцев приняли участие в проекте британского Биобанка, цель которого – изучение закономерностей в генетике и здоровье людей. База данных Биобанка постоянно расширяется и становится доступной ученым со всего мира, что превращает ее в ценный научный ресурс. В 2017 году доступ к данным запросили тысячи исследователей, которые изучают болезни, травмы, питание, физические возможности и психическое здоровье людей[562].
Предоставление данных исследователям принесет огромную пользу обществу. Но если эти наборы данных будут доступны множеству людей, стоит задуматься о соблюдении конфиденциальности. Один из способов снизить риск – удалять информацию, позволяющую идентифицировать участников. Например, когда исследователи получают доступ к медицинским базам данных, из них удаляется личная информация пациентов, в частности имена и адреса. Но идентифицировать людей можно и без этих данных. Когда Латания Суини училась в докторантуре
Так она и поступила. «Чтобы проверить свою гипотезу, мне нужно было кого-то вычислить», – впоследствии вспоминала она[564]. Штат Массачусетс тогда как раз анонимизировал больничные записи и сделал их доступными для исследований. Губернатор Уильям Уэлд утверждал, что личные данные пациентов надежно защищены, но эксперимент Суини показал, что он ошибается. Она заплатила 20 долларов за доступ к спискам избирателей Кембриджа, где жил Уэлд, а затем сопоставила возраст, пол и почтовый индекс губернатора, указанные в списке, с информацией из больничной базы данных. Вычислив медицинскую карту Уэлда, Суини отправила ему копию по электронной почте. Эксперимент и последовавший за ним публичный скандал в итоге привели к серьезным изменениям в правилах хранения и передачи медицинских данных в США[565].
Данные перетекают с одного компьютера на другой – а вместе с ними и уникальные сведения о жизни людей. И это не только медицинская или генетическая информация, с которой следует обращаться особенно осторожно; даже безобидные на первый взгляд наборы данных могут содержать очень личные подробности. В марте 2014 года Крис Вонг, называющий себя «фанатиком данных», воспользовался американским Законом о свободе информации, чтобы получить сведения обо всех поездках в такси в Нью-Йорке за предыдущий год. Набор данных, обнародованный агентством
Для начала он показал, как выследить известных персон. Потратив пару часов на поиск фотографий по запросу «Знаменитости в такси на Манхэттене в 2013 году», Токар нашел несколько снимков, на которые попал номерной знак автомобиля. Сверившись с блогами знаменитостей и глянцевыми журналами, он вычислил, где такси забирало или высаживало пассажира, и сопоставил эти сведения с якобы анонимизированной базой данных. Кроме того, он выяснил, какие чаевые оставляли знаменитости – и оставляли ли их вообще. «Конечно, это относительно безобидные данные, особенно по прошествии года, – однако мне все же удалось раскрыть информацию, которая
Токар понимал, что у большинства людей такие изыскания не вызовут особого беспокойства, поэтому решил копнуть глубже. Он обратил внимание на один стриптиз-клуб на Манхэттене, в районе под названием Адская Кухня, и решил изучить ночные поездки на такси из этого клуба. Вскоре он вычислил постоянных клиентов и их домашние адреса. Ему не понадобилось много времени, чтобы найти этих людей в соцсетях; теперь он знал, как они выглядят, сколько стоят их дома и каково их семейное положение. Токар решил не публиковать эту информацию, но то же самое вполне мог проделать любой другой человек. «Возможные последствия таких изысканий трудно переоценить», – заключил Токар.
Высокоточные данные
Несмотря на эти риски, доступность данных о передвижении людей очень важна: ученые получают возможность выяснить, где будут распространяться вирусы; спасательные команды эффективнее помогают населению после природных катастроф; специалисты по городскому планированию видят, как следует усовершенствовать систему городского транспорта[571]. Высокоточные данные
Если последнее предложение вызвало у вас некоторый дискомфорт, вы не одиноки. С повышением доступности цифровых данных растут и опасения по поводу конфиденциальности. Проблема неравенства имеет огромное значение для общества и, бесспорно, достойна изучения – но остается вопрос: насколько глубоко исследователи подобных проблем могут погружаться в подробности, связанные с нашими доходами, политическими взглядами и социальной жизнью? Когда речь заходит об изучении поведения людей, нам часто приходится решать, какова допустимая цена этих знаний.
Работая над проектами с использованием данных о передвижении, мы с коллегами всегда уделяли первостепенное внимание конфиденциальности. С одной стороны, мы стремились по возможности собрать максимум полезных данных, особенно если они помогали спасти общество от эпидемии. С другой стороны, мы должны были защитить частную жизнь людей в этих сообществах, даже если ради этого приходилось отказаться от сбора и публикации некоторых сведений. Ситуация осложняется, когда дело касается таких болезней, как грипп или корь, поскольку дети, подвергающиеся высокому риску заражения, – это особенно уязвимая возрастная группа[573]. Существуют способы провести массу исследований и узнать много полезного и интересного о социальном поведении, но эти способы предполагают вторжение в частную жизнь, а такое вторжение трудно будет оправдать.
В тех редких случаях, когда нам приходилось использовать высокоточные данные
Упрощение доступа к данным о местоположении влечет появление новых видов преступности. Мошенники давно использовали фишинговые сообщения, чтобы выудить у пользователей важную информацию. Теперь они применяют адресный фишинг на основе данных конкретного человека. В 2016 году несколько жителей Пенсильвании получили электронные письма с требованием уплатить штраф за превышение скорости. В письмах верно указывалась скорость автомобиля и место нарушения, однако квитанции были фальшивыми. Полиция предположила, что мошенники получили данные