реклама
Бургер менюБургер меню

Кристиан Монтаг – Новые боги. Как онлайн-платформы манипулируют нашим выбором и что вернет нам свободу (страница 23)

18

Другой способ привлечь к исследованию побольше народа – заплатить каждому участнику. На мой взгляд, это худший вариант: не только потому, что он гораздо дороже, но и потому, что может пострадать качество данных. Вдруг кто-то примет участие в исследовании только «для галочки», чтобы заработать?

Для научного исследования Михала Косински удалось привлечь 58 466 человек: они не только заполнили онлайн-анкеты, но и позволили ученым соотнести эти данные с информацией из их профилей в фейсбуке. Такое количество респондентов заслуживает отдельного упоминания: многие исследования в области психологии сталкиваются с проблемой небольших выборок, которые часто состоят сплошь из жителей так называемых WEIRD-обществ (см. главу 2)[298]. Похоже, здесь нам наконец поможет психоинформатика: она позволяет работать с надежными выборками и привлекать разные группы людей[299].

После успешного сбора данных Михал Косински и его коллеги сосредоточились на изучении лайков, которые испытуемые ставят в фейсбуке, чтобы сделать прогнозы относительно их анкет. Ученые хотели определить, насколько хорошо отметки «Нравится» позволяют судить о социально-демографических переменных, таких как возраст и пол, и о психологических, вроде характера или уровня интеллекта. Почему именно лайки? Они содержат релевантную информацию о пользователях, поскольку люди обычно лайкают только то, что им действительно нравится. Таким образом пользователи фейсбука добровольно показывают операторам платформы, что им по душе, а что нет. Meta извлекла из этой информации немало прибыли. По схожему алгоритму работал Косински: на основании оставленных пользователями лайков его команда отбирала общие паттерны поведения, которые позволяли ученым строить гипотезы о характеристиках участников и относить их к той или иной категории. Приведу пример (не из исследования), который наглядно показывает, как может выглядеть отбор. Представим, что из комментария под постом в фейсбуке я узнал, что Нил Янг скоро выступит с концертами в Европе, а в другом комментарии прочел, что у Тейлор Свифт выходит новый альбом. Я бы лайкнул оба сообщения. На основании этого меня можно отнести в категорию «Любитель музыки». Такая категоризация, конечно, приводит к упрощению данных, но одновременно помогает лучше их отсортировать и проанализировать. Статистический анализ в работе Косински ожидаемо показал, что большее количество доступных для анализа лайков привело к повышению точности прогнозов по целевым переменным. Чем больше цифровых следов было доступно, тем легче авторам исследования было предсказать многочисленные психологические переменные. Но насколько точна эта информация?

Для начала отметим, что при проведении статистического анализа на одного пользователя в среднем приходилось около 170 лайков. Этого было достаточно для выявления дихотомических переменных – переменных из двух категорий, например пол (мужчина/женщина)[300]. В США политическая ориентация также была бы дихотомической переменной, так как, в отличие от Германии, там двухпартийная система (демократы против республиканцев). Еще один пример – употребление алкоголя (да/нет). Но вернемся к лайкам в фейсбуке и их предсказательной силе. Мужчину можно отличить от женщины на основе лайков с точностью 93 %. Также алгоритм смог правильно (85 %) классифицировать либералов и консерваторов. Точность определения сексуальной ориентации человека (гетеросексуал или гомосексуал) составила 88 % среди мужчин и 75 % среди женщин.

Как и в исследовании Гокула Читтаранджана, команда Косински попыталась описать структуру личности на основе данных смартфона. В лучшем случае предсказательная сила информации о лайках участников исследования составила 0,40 для показателя «экстраверсия» и 0,43 для личностной черты «открытость опыту». Здесь точность прогнозирования значительно снижается, так как речь идет не о дихотомических переменных, а о метрических конструктах. К метрическим конструктам относятся не только рост и вес человека, но и характер, который оценивается совокупностью целого ряда критериев.

Несмотря на более низкую предсказательную силу, все же удалось обнаружить умеренные корреляции между лайками и чертами личности. Чтобы вы могли лучше представить себе эти результаты, приведу конкретные примеры из работы Ву Ю Ю и ее коллег. Они пошли еще дальше и доказали, что информация о лайках позволяет описать характер участников исследования точнее, чем опросы друзей и партнеров[301]. Необходимо лишь достаточное количество лайков для анализа – и алгоритм справится на «отлично»!

В исследовании Ву Ю Ю и ее коллег экстраверты выделялись тем, что ставили больше лайков постам о вечеринках, танцах или, например, Снуки, звезде реалити-шоу в США. Люди с высокими показателями открытости ко всему новому с большей вероятностью ставили лайк публикациям о Сальвадоре Дали, о техниках медитации и о TED Talks, научных лекциях на ютубе, где эксперты излагают информацию по самым разнообразным темам примерно в течение 18 минут.

Думаю, интуитивно понятно, почему лайки обладают некоторой предсказательной силой при определении личностных качеств. Однако здесь снова необходимо отметить, что наблюдается лишь умеренная корреляция между тем, что человек лайкает, и чертами его личности, поэтому прогнозирование возможно только на групповом уровне. Как и в случае с исследованием Читтаранджана, о котором мы только что говорили, можно только предполагать, что лайки под постами на определенные темы указывают на чуть больший или чуть меньший уровень экстраверсии пользователя. Однако вероятность ошибочной психодиагностики на уровне отдельного человека все еще остается относительно высокой. Правда, рекламщиков это не тревожит, и я сейчас расскажу почему.

В последнее время появилось бесчисленное количество исследований, посвященных взаимосвязи между цифровыми следами пользователей фейсбука и их чертами личности. Теперь было бы полезно применить метааналитический подход. Метаанализ позволяет изучить корреляцию между рассматриваемыми переменными сразу во многих исследованиях по определенной теме.

В данном случае становится любопытно: насколько велика статистическая предсказательная сила различных цифровых следов в фейсбуке при определении характера человека?[302] Этот вопрос немного шире, чем работа Косински и его коллег, поскольку в ходе других исследований для прогнозирования личностных черт анализировались не только лайки. Научная литература по психоинформатике знает примеры, когда психологические переменные пытались определить по частоте публикаций и смены статусов и количествеу людей, с которыми общается пользователь. Это лишь несколько вариантов бесчисленных переменных.

Я был очень рад, когда мой итальянский коллега Давиде Маренго из Туринского университета получил стипендию и смог поработать в моей лаборатории в городе Ульм в течение нескольких месяцев. Поскольку зимние месяцы в Ульме всегда немного мрачные и очень туманные, у нас было достаточно времени, чтобы полностью сосредоточиться на наших исследовательских проектах.

В ноябре 2019 года мы приступили к завершению метаанализа литературы, посвященной фейсбуку, который готовили несколько месяцев. Можно было бы, конечно, проанализировать и другие медиаплатформы, чтобы ответить на вопрос об успешности предсказательной силы данных из всех соцсетей. Однако я все же думаю, что сфокусироваться именно на фейсбуке было верным решением, ведь там больше всего пользователей.

В ходе обширного штудирования литературы (более чем 900 работ) мы отобрали ядро из 21 статьи, в которых черты личности прогнозировались исходя из данных в фейсбуке. Затем они были включены в итоговую оценку. В ходе метаанализа мы обнаружили несколько интересных моментов[303]. Во-первых, коэффициент корреляции между цифровыми следами на фейсбуке и личностными характеристиками составил 0,34 по всем характеристикам, входящим в «большую пятерку» (0,34 × 0,34 = 0,115, т. е. примерно 12 % дисперсии). Во-вторых, наиболее сильной оказалась корреляция с уровнем экстраверсии. Все результаты представлены в таблице 4.1.

К слову, наш метаанализ показал, что прогноз становится точнее, если учитывать как можно больше различных форм цифровых следов.

Табл. 4.1. Взаимосвязь между параметрами «большой пятерки» и данными фейсбука в метаанализе Маренго и Монтага (2020; см. примечание 303)

Поскольку мы рассматривали только следы на фейсбуке, стоит упомянуть и другой метаанализ данных, проведенный Дэнни Азукаром (совместно с Давиде Маренго). Они определяли предсказательную силу цифровых следов за пределами фейсбука[304]. Этот анализ дал схожие с нашими результаты.

Работа Михала Косински вызвала настоящую волну обсуждений в научном сообществе прежде всего из-за ее связи со скандалом вокруг Cambridge Analytica. Бытует мнение, что то исследование стало методологической основой для теневой деятельности компании. Однако я убежден, что эта работа в любом случае, даже без истории с Cambridge Analytica, вызвала бы большой резонанс, поскольку она имеет огромное значение для дальнейшего развития психоинформатической диагностики. Результаты убедительно показывают, какую информацию можно извлечь из «простого» источника цифровых данных (например, лайков).