Дэниел Левитин – Организованный ум (страница 32)

Шрифт

Чаще всего в краудсорсинговых проектах участвуют далеко не эксперты в сфере реализации проекта, но искренне интересующиеся этой темой. Думаю, что наиболее заметные результаты краудсорсинг обеспечил проектам Yelp и Zagat: на этих сайтах потребители могут оставлять отзывы об услугах и формировать рейтинги. Этот подход отлично работает и на сайтах вроде Amazon.com, где покупатели имеют возможность написать отзыв о купленном товаре. В прежние времена, до интернета, в газетах и журналах, например в Consumer Reports, публиковались отзывы профессиональных критиков о товарах и услугах. А теперь обычные люди получили возможность поделиться впечатлениями на сайтах типа TripAdvisor, Yelp и Angie’s List: скажем, похвалить гостиницу за чистую и тихую комнату или раскритиковать ресторан, в котором недостаточно чисто или маленькие порции. Нельзя не признать, что и у старой системы были преимущества: тогда отзывы писали профессионалы, имевшие серьезный опыт. Читая отзыв специалиста о ресторане, вы точно знали, что автор побывал во многих подобных заведениях и может сравнивать. Отзывы об автомобилях или технических новинках также писали эксперты, сопоставлявшие технические характеристики и обращавшие внимание на детали, которых мы с вами и не заметили бы, но которые тем не менее очень важны (к примеру, эффективность антиблокировочной тормозной системы на мокрой дороге).

Краудсорсинг обеспечил разнообразие отзывов и предоставил возможность всем желающим делиться впечатлениями, но к доступной теперь информации нужно относиться осторожно. Можно ли вообще доверять мнению толпы? И да, и нет. То, что большинству кажется позитивным и правильным, совершенно не обязательно всегда и во всем подойдет лично вам. Наверняка вы без труда вспомните книгу или музыкальное произведение, которые пришлись вам по вкусу, хотя большинство людей их не оценили. Но с точки зрения количественной оценки мнение многих довольно объективно отражает реальность. Приведу простой пример: перед нами большая банка с конфетами, и мы просим людей оценить, сколько их там. Конечно, в основном ответы будут ошибочными, но среднее арифметическое по всей группе окажется очень близким к реальной цифре[221].

Компании, создающие собственный контент, – Amazon, Netflix, Pandora – научились использовать мнение больших групп пользователей в рамках математических алгоритмов, лежащих в основе так называемой стратегии коллаборативной фильтрации: они отслеживают корреляцию или совпадения в поведении отдельных групп и используют эти данные для формирования рекомендаций. Возможно, вы замечали на каких-нибудь сайтах фразы типа «пользователям, купившим это, также понравилось вот это»: так и выглядит коллаборативная фильтрация. Однако здесь возникают и проблемы: компании могут не принимать в расчет отдельные нюансы и обстоятельства принимаемых потребителями решений. Купив книгу по садоводству в подарок своей тете, вы рискуете получить массу ссылок на книги схожего содержания, подобранных якобы специально для вас, – ведь рекомендательный алгоритм не знает, что вы ненавидите садоводство, а книжку приобрели в подарок. А если случалось хотя бы однажды скачать фильм для детей, то очень может быть, что вас стали донимать рекомендациями фильмов для семейного просмотра, хотя вам гораздо интереснее остросюжетные боевики.

Автомобильные системы навигации тоже работают на принципах краудсорсинга. Когда приложения Waze или Google Maps подсказывают оптимальный маршрут, они исходят из состояния трафика на текущий момент – но откуда у них данные о загруженности дорог? Да ведь они получили возможность отслеживать перемещение мобильных телефонов тысяч пользователей и могут оценивать, как быстро все телефоны, которые находятся в этот момент в машинах, движутся по дороге. Если вы застряли в пробке, то GPS-координаты вашего телефона могут по несколько минут не обновляться; если дорога свободна и машины движутся быстро, то мобильник в вашем кармане тоже постоянно движется, и это ясно по изменению его координат. Используя эти данные, система делает предположения о дорожных пробках и строит оптимальный маршрут. Как и в любых проектах на основе краудсорсинга, качество системы серьезно зависит от количества пользователей или участников. В известном смысле эти проекты схожи с работой телефона, факса или электронной почты: если техническая новинка есть лишь у пары людей, в ней нет особого толку – но по мере роста числа пользователей полезность системы резко возрастает.

Художник и изобретатель Сальваторе Яконези использовал краудсорсинг, чтобы провести сравнительный анализ подходов к лечению рака мозга, который у него обнаружили несколько лет назад. Он разместил всю медицинскую информацию о собственном состоянии в интернете и получил более 500 000 откликов; сформировались целые группы врачей, которые стали обсуждать возможные подходы к лечению. «Люди из самых разных стран стали предлагать решения, основанные на накопленных человечеством знаниях и традициях», – писал Яконези. Прочитав комментарии и обдумав предложенные варианты, он согласился на традиционную операцию, но в сочетании с альтернативными подходами. Сейчас Сальваторе здоров[222].

Сфера, в которой краудсорсинг применяется, возможно, чаще всего, остается практически незаметной для большинства: это reCAPTCHA, то есть нечетко написанные слова, которые используются, чтобы не позволить так называемым ботам, то есть компьютерам, получить доступ к защищенным страницам. Человеку прочесть и напечатать предложенное слово довольно легко, а компьютер этого чаще всего не может. (Слово CAPTCHA – сокращение от Completely Automated Public Turing test to tell Computers and Humans Apart, или «Полностью автоматизированный публичный тест Тьюринга, позволяющий отличить людей от компьютеров». Сокращение reCAPTCHA указывает на возможность многократного использования возможностей человеческого мозга.[223]) Откуда берутся эти нечеткие изображения слов[224]? Часто это страницы старых книг или рукописей, которые были оцифрованы, но Google их все же сложно расшифровать. На каждое слово человеку требуется секунд десять; за день удастся разобрать более 200 миллионов слов, а это 150 000 рабочих часов в день. Грех не использовать это время на что-то полезное.

Технологии автоматического сканирования письменных материалов и превращения их в тексты, доступные для поисковых систем, пока неидеальны. Во многих случаях человек может разобрать рукописное слово, а компьютер нет. Вот для примера отрывок из книги, которую Google пытается оцифровать[225]:

После того как текст был отсканирован, две разные системы распознавания (так называемые OCR, системы оптического чтения символов) пытались превратить неразборчивые знаки во что-то читаемое. Те слова, в отношении которых программы дают разный результат, считаются не подлежащими расшифровке, и их используют в программе reCAPTCHA, фактически передавая на проверку посетителям сайтов. А откуда система понимает, что вы узнали слово верно? Система сопоставляет непонятные слова с расшифрованными, исходя из предположения, что если вы можете прочесть известное системе слово, то вы человек, а не бот, и тогда вы, скорее всего, верно прочтете и нерасшифрованное пока слово. Когда несколько независимых пользователей предлагают одно и то же прочтение нерасшифрованного слова, эта версия признается верной и добавляется в сканированный текст.

Созданная компанией Amazon платформа для поиска и предложения краудсорсинговых услуг Mechanical Turk используется для решения задач особого рода: компьютеры справляются с ними не особенно хорошо, а людям без дополнительной мотивации они кажутся скучными. Эта платформа использовалась в ходе проведенного недавно когнитивными психологами эксперимента, результаты которого опубликованы в журнале Science. Добровольцы (каждому заплатили по три доллара) должны были прочесть историю, а потом пройти тест, по результатам которого оценивался их уровень эмпатии. Эмпатия предполагает способность смотреть на ситуацию с разных точек зрения, а для этого нужно использовать задумчиво-мечтательное состояние мозга (сеть пассивного режима работы мозга); при этом задействуется префронтальная кора, передняя поясная, а также зона их соединения с височно-теменным узлом[226]. Подозреваю, что, скажем, республиканцы и демократы, вспоминая друг о друге, эти зоны не используют. Исследования показали, что люди, которым пришлось читать отрывок из художественной прозы (а не текст более легкого жанра или научно-популярный), гораздо успешнее смогли на следующем этапе считывать чужие эмоции. Была сформулирована теория, что художественная проза вовлекает читателя в декодирование мыслей и чувств героев – в отличие от популярных и научных текстов, которые такой задачи не ставят. Для эксперимента потребовались сотни добровольцев, и если бы пришлось работать с ними очно в лабораториях, было бы потрачено гораздо больше времени.

Разумеется, человеку свойственно хитрить и искать более легкие решения, и любой, кто собирается использовать краудсорсинг, должен это учитывать. Читая в интернете отзывы о ресторане, никогда не знаешь, написаны они тем, кто там на самом деле побывал, или родственниками владельца. В случае с Википедией проверка достоверности реализуется автоматически, просто в силу того, что над каждой статьей работают довольно много человек. В основе этого подхода лежит предположение, что обманщиков, мошенников и вообще людей, склонных к антисоциальному поведению, в любой образованной случайным образом группе меньшинство, поэтому добро всегда побеждает зло. К сожалению, в реальности это не всегда так, но в основном принцип справедлив, поэтому результатам, полученным с помощью краудсорсинга, в целом можно доверять. А еще этот метод во многих случаях оказывается удивительно эффективной альтернативой привлечению проверенных проплаченных экспертов.

31 32 33 34 Вперед