Дэниел Левитин – Организованный ум (страница 62)

Шрифт

В типичном эксперименте из научной литературы вам дают прочитать сценарий. Говорят, что в конкретном университете 10 % студентов – инженеры, а 90 % – нет. Вы идете на вечеринку и видите, что у кого-то в кармане есть пластиковый карманный протектор[586] (в описании не указано, но многие считают, что это типично для инженеров). Затем вас попросят оценить, насколько вероятно, что этот человек – инженер. Зачастую люди полагают, что это неоспоримый факт. Карманный протектор кажется настолько точным атрибутом, таким убедительным доказательством, что трудно представить, будто человек может быть кем-то еще. Но инженеров в этом университете довольно мало, и это нужно учитывать. Вероятность того, что описываемый человек – инженер, может быть не такой низкой, как очевидный показатель, 10 %. Но и не такой высокой, не 100 %, потому что другие люди тоже могут носить карманные протекторы. Вот тут становится интересно. Затем исследователи воссоздают тот же сценарий – вечеринку в университете, где 10 % студентов – инженеры, а 90 % – нет, но при этом поясняют: «Вы сталкиваетесь с кем-то, у кого может быть пластиковый карманный протектор или нет; вы не можете сказать этого, потому что человек в пиджаке». Когда просят оценить вероятность того, что это инженер, люди обычно говорят: «50 на 50». Если предложат объяснить почему, они произносят: «Потому что у него может быть карманный протектор, а может и не быть, мы не знаем». В подсчетах опять-таки не учитываются базовые показатели. Если вы ничего не знаете о человеке, то у вас всего 10 % шансов предположить, что он инженер, а не 50 %. Просто если есть только два варианта, это не значит, что они одинаково вероятны.

Рассмотрим интуитивно более понятный пример. Представьте, что вы входите в местный продуктовый магазин и сталкиваетесь с кем-то, не видя его. Это может быть королева Елизавета или нет. Насколько вероятно, что это королева? Большинство людей не думает, что тут шансы 50 на 50. Насколько велика вероятность, что королева зайдет в какой-то продуктовый магазин, тем более тот, где обычно бываете вы? Ничтожно мала. Это показывает, что мы можем использовать информацию об очевидных показателях, когда события крайне маловероятны. Однако если вероятность чуть больше, мозг застывает. Организация наших решений требует объединить данные очевидных показателей с соответствующими точными сведениями. Этот тип рассуждений был открыт в XVIII веке математиком и пресвитерианским священником Томасом Байесом и носит его имя – правило Байеса.

Правило Байеса позволяет уточнять оценки. Например, пишут, что примерно половина браков заканчивается разводом. Но показатель 50 % имеет место для совокупности всех, поэтому мы можем уточнить оценку, если есть дополнительная информация: возраст, религия или место жительства людей, с которыми это происходит. Одни группы населения имеют более высокий процент разводов, чем другие.

Помните вечеринку в университете, где учатся 10 % инженеров и 90 % не инженеров? Некоторая дополнительная информация поможет оценить вероятность того, что человек с карманным протектором – инженер. Может быть, вы знаете, что хозяйка вечеринки некогда сильно поссорилась с инженером, поэтому больше не приглашает их на свои праздники. Возможно, вы в курсе, что 50 % студентов-медиков и тех, кто готовится поступать на медицинский факультет в этот университет, носят карманные протекторы. Такая информация позволяет сопоставлять первоначальные оценки базового показателя с новыми вводными. Количественная оценка этой обновленной вероятности становится применением вывода Байеса.

Мы больше не задаем простой, одночастный вопрос: «Какова вероятность того, что человек с карманным протектором – инженер?» Вместо этого ставим сложный вопрос: «Какова вероятность того, что человек с карманным протектором – инженер, учитывая информацию, что 50 % студентов-медиков носят такие же защитные приспособления?» Небольшое количество инженеров противопоставляется дополнительной косвенной информации о повсеместном распространении карманных протекторов.

Мы можем аналогичным образом обновить медицинские вопросы, например: «Какова вероятность того, что эта боль в горле служит признаком гриппа, учитывая, что я навещал больного три дня назад?» Или: «Какова вероятность того, что боль в горле – симптом сенной лихорадки, учитывая, что я был на открытом воздухе в разгар сезона пыльцы?» Мы мысленно делаем подобные обновления по своему усмотрению, но есть инструменты, которые помогают определить влияние новой информации. Проблема вот в чем: «наше усмотрение» заключается в том, что мозг не настроен на интуитивное получение точных ответов на эти вопросы. Он эволюционировал для решения целого ряда проблем, но задачи Байеса пока не входят в их число.

Только не это! Результат анализа оказался положительным!

Насколько серьезны подобные новости? Сложные вопросы, как этот, легко решаемы с помощью трюка, который я узнал в аспирантуре, – четырехпольных таблиц (или таблиц сопряженности признаков)[587]. Их нелегко решить с помощью интуиции или догадок. Допустим, вы просыпаетесь утром, и все плывет перед глазами. Также предположим, что существует редкое заболевание – блурит, при котором пропадает четкость зрения. На всей территории США насчитывается только 38 000 человек с этим заболеванием, следовательно, частотность заболевания, или базовый показатель, равна 1 случаю из 10 000 (38 000 из 380 миллионов). Вы только что прочитали об этом и теперь боитесь, что у вас именно оно. «По какой же еще причине, – думаете вы, – у меня может быть размытое зрение?»

Чтобы проверить, есть ли у вас блурит, вы сдаете анализы крови, и они оказываются положительными. Вы с врачом пытаетесь решить, что делать дальше. Проблема в том, что лекарство от размытого зрения – хлорогидроксилен[588] – в 5 % случаев дает серьезные побочные эффекты, в том числе невыносимый и постоянный зуд в той части спины, до которой невозможно дотянуться. (Есть лекарство, которое можно принимать против этого зуда, но тогда с вероятностью 80 % начнет зашкаливать артериальное давление.) 5 % не производят большого впечатления, и, возможно, вы готовы принять лекарство, чтобы избавиться от этого размытого зрения. (Эти 5 % – объективная вероятность первого вида, а не субъективная оценка, то есть цифра получена в результате отслеживания десятков тысяч пациентов, принимающих препарат.) Естественно, вы хотите точно знать, каковы прогнозы на то, что вы действительно больны, прежде чем начать пить лекарство с риском постоянно чесаться.

Четырехпольная таблица поможет разложить информацию так, чтобы она вся была перед глазами, и ее понимание не потребует от вас большего образования, чем восемь классов школы. Если цифры и дроби приводят вас в бешенство, не волнуйтесь: в приложении есть все детали, а в этой главе дается общее представление (весьма туманное, раз уж, в конце концов, вы прямо сейчас страдаете от блурита).

Давайте рассмотрим имеющуюся информацию:

• Базовый показатель для болезни с размытым зрением составляет один шанс из 10 000, или 0,0001.

• Использование хлорогидроксилена дает побочные эффекты в 5 % случаев, или 0,05.

Вероятно, вы решите: раз результаты анализов положительные, значит, вы больны. Но анализы несовершенны, поэтому утверждение так не работает. И теперь, уже кое-что зная о мышлении Байеса, вы решите уточнить вопрос: «Какова вероятность того, что у меня на самом деле заболевание, учитывая, что анализы положительные?» Не забудьте, что основные показатели свидетельствуют: шансы заболеть у произвольно выбранного человека – 0,0001. Но вы же не произвольно выбранный. Врач направил вас сдавать анализы.

Далее необходимо больше информации. Нам нужно знать процентное соотношение правильных и неправильных результатов анализов, а также то, что они могут быть неверными в двух случаях: показывать, что вы больны, хотя на самом деле нет, то есть быть ложноположительными; или показывать, что вы здоровы, хотя на самом деле больны, то есть быть ложноотрицательными. Давайте считать, что оба варианта вероятны на 2 %. В реальной жизни они могут отличаться, но здесь допустим 2 % в каждом случае.

Нарисуем поле из четырех клеток и обозначим их следующим образом:

Из названий колонок понятно, что результаты анализов (пока не принимаем во внимание их точность) могут быть как положительными, так и отрицательными, их мы и будем включать в таблицу. Заголовки строк демонстрируют возможное наличие или отсутствие заболевания. Каждая клетка находится на пересечении строк и столбцов. Читая строки, мы видим, что из всех людей, у которых есть заболевание (ряд «Болезнь есть»), некоторые будут иметь положительные результаты анализов (в левой верхней клетке), а некоторые – отрицательные (в верхней правой). То же самое можно сказать и для ряда, где «Болезнь – нет»: у одних будут положительные результаты анализов, а у других – отрицательные. Вы надеетесь, что, даже несмотря на положительные результаты анализов (левую колонку), вы не больны (нижняя левая клетка).

После того как вы заполнили данные (в приложении я разбираю это более подробно), можно ответить на вопрос: какова вероятность того, что у вас есть заболевание, учитывая, что результаты анализов положительные?

61 62 63 64 Вперед