Дэниел Левитин – Организованный ум (страница 101)
Время от времени за нас это делает мироздание: мы неожиданно теряем друга, любимого питомца, выгодную сделку, а то и рушится вся мировая экономика. Лучший способ усовершенствовать мозг, данный нам от природы, – научиться приспосабливаться к обстоятельствам. Мой опыт говорит следующее: когда теряешь что-то, считавшееся незаменимым, обычно вместо него возникает нечто намного лучшее. Ключ к переменам – вера в то, что избавление от чего-то или кого-то старого приводит к тому, что на его месте появляется что-то еще более великое.
Приложение. Как строить четырехпольные таблицы
Рассуждая о медицине в логическом ключе, мы часто сталкиваемся с такими редкими заболеваниями, что даже положительные анализы не говорят об их наличии. Большое количество фармацевтической продукции настолько редко действует как нужно, что вероятность проявления побочных эффектов гораздо выше возможной пользы. Четырехпольные таблицы позволяют легко рассчитать вероятность, задав байесовский вопрос: «Какова вероятность того, что я болен некой болезнью,
Здесь я приведу пример из главы 6 с несуществующей болезнью, блуритом. Давайте вспомним, о чем шла речь.
• Вы сдаете анализы на гипотетическую болезнь – и получаете положительный результат.
• Основной показатель для блурита – 1 случай из 10 000, или 0,0001.
• Если лечиться хлорогидроксиленом, то существует вероятность 5 %, или 0,05, что у вас проявятся побочные эффекты.
• Анализы на блурит в 2 % случаев, или 0,02, оказываются неверными.
Вопрос: принимать лекарство или нет?
Для начала построим четырехпольную таблицу и подпишем ячейки.
Ячейки внутри позволяют распределить данные на взаимоисключающие категории:
• люди с положительными результатами анализов, у которых есть заболевание (верхняя левая ячейка внутри). Назовем ее ПРАВИЛЬНОЕ ПОДТВЕРЖДЕНИЕ.
• люди с отрицательными результатами анализов, у которых есть заболевание (верхняя правая ячейка внутри). Назовем ее ЛОЖНООТРИЦАТЕЛЬНЫЕ.
• люди с положительными результатами анализов, у которых нет заболевания (нижняя левая ячейка внутри). Назовем ее ЛОЖНОПОЛОЖИТЕЛЬНЫЕ.
• люди с отрицательными результатами анализов, у которых нет заболевания (нижняя правая ячейка внутри). Назовем ее ПРАВИЛЬНОЕ ОТКЛОНЕНИЕ.
Начнем заполнять известные данные. Основной показатель болезни – 1 из 10 000. В нижнем правом углу, за пределами большой ячейки, напишем «общее население» – 10 000. Я говорю «население», потому что это общее количество человек, которое мы рассматриваем (могли бы взять 380 миллионов человек, живущих в США, а затем изучить все случаи за год – 38 000, но мне удобнее заполнять таблицу меньшими числами, потому что с ними легче обращаться и представить себе «масштабы катастрофы»).
Теперь с помощью этой таблицы нужно посчитать данные во всех остальных ячейках, как в основных четырех внутри, так и снаружи. Мы знаем: один человек из этих 10 000 болеет блуритом. Пока не видим результатов анализов, поэтому пишем цифру 1 справа в поле «Болезнь: есть», показывая наличие болезни.
То, каким образом организована таблица, когда значения идут сверху вниз и слева направо, предполагает, что сумма этих значений заполняется на полях за ее пределами. Это логично: если количество заболевших равно единице, а общее число – 10 000, мы знаем, сколько людей не болеют: 10 000 – 1 = 9999. Впишем.
От врача мы знаем (об этом я писал выше), что в 2 % случаев анализы дают неправильные результаты. Из 9999 незаболевших 2 % получили неверные анализы, предполагающие диагноз, в том смысле, что они не болеют, но результаты анализов положительные (ложноположительные, нижнее левое поле). Считаем 2 % × 9999 = 199,98, округляем до 200.
Теперь, ввиду того, что нам нужно заполнить данные и по горизонтали, и по вертикали, можно посчитать здоровых людей, результаты анализов у которых были отрицательные, то есть правильное отклонение. Это 9999 – 200 = 9799.
Теперь заполним данные о другой ошибке в постановке диагноза: 2 % ложноотрицательных. Эти результаты означают, что человек на самом деле болен, а по результатам анализов – нет. Это количество представлено в верхнем правом поле. Болен (как мы видим в таблице, посмотрев на правое поле за пределами основных ячеек) один человек. Тогда считаем 2 % × 1 = 0,2, округляем до 0.
И конечно, давайте теперь заполним оставшееся пустое поле – вписываем туда 1 (это значение получилось так: от 1 в боковом поле, которую мы вписали вначале, вычитаем 0, записанный в верхнее правое поле, поскольку у нас должны быть заполнены все ячейки).
Теперь, чтобы действительно заполнить всю таблицу, выпишем значения в нижние поля за пределами основных ячеек. Чтобы узнать общее количество человек с положительными результатами анализов, просто сложим значения в колонке: 1 + 200 = 201. Общее количество человек с отрицательными результатами анализов: 0 + 9799 = 9799.
Уже отсюда мы можем решить задачу так, как показано в главе 6.
1. Какова вероятность того, что вы больны,
1.1. p (Есть заболевание | анализы положительные)
Это удобный формат записи, потому что так мы видим: первая часть предложения, то есть все, что до знака |, – это числитель (верхняя часть уравнения), а все, что после – знаменатель.
Чтобы ответить на вопрос 1, мы смотрим
2. Какова вероятность того, что анализы окажутся положительными,
2.1. p (Анализы положительные | есть заболевание).
Здесь мы смотрим только на верхний ряд, и дробь получается 1/1. Это говорит о том, что вероятность получить положительные анализы при наличии заболевания равна 100 %.
Не забывайте, что хлорогидроксилен, гипотетическое лекарство, о котором я говорил, в 20 % случаев дает побочные эффекты. Если бы лечили всех, то есть 201 человека с положительными анализами на блурит, то 20 % из них – 40 человек – получили бы побочные эффекты. Помните, что на самом деле болеет только один человек, а лечение в 40 раз чаще приводит к побочным эффектам, нежели выздоровление.
В обоих описанных в шестой главе случаях, как с блуритом, так и с «синей» болезнью, даже при положительных анализах вряд ли вы оказываетесь больным. Конечно, если вы на самом деле болеете, очень важно подобрать правильное лекарство. Что можно сделать?
Стоит сдать анализы второй раз. Мы применяем закон умножения вероятностей, считая, что результаты анализов независимы. То есть любые ошибки могут случайно привести к тому, что только у вас из всех, кто сдавал анализы, получится неверный результат. Это совсем не значит, что у кого-то в лаборатории на вас зуб, поэтому если вы получили некорректный результат однажды, то шансы получить ошибку второй раз у вас не больше, чем у кого-то другого. Вспомните, я говорил, что существует двухпроцентная вероятность того, что анализы окажутся неверными. Рассчитать вероятность того, что лаборант два раза подряд ошибется, можно 2 % × 2 %, или 0,0004. Если вы предпочитаете дроби, то вероятность 1/50, и 1/50 × 1/50 = 1/2500. Но даже эта статистика не включает основной показатель, то есть то, насколько редко встречается эта болезнь. И основной посыл раздела: это нужно делать.
Безусловно, очень поможет, если вы и в этом случае построите четырехпольную таблицу и ответите на вопрос «Какова вероятность того, что я болею,
Когда мы начинали рассматривать блурит, у нас была только гора цифр, и мы расставляли их в таблицу. Так было проще посчитать скорректированную вероятность. Одна из особенностей байесовского вывода в том, что вы можете поместить скорректированные данные в новую четырехпольную таблицу. И каждый раз, обновляя информацию, строить новую таблицу и фокусировать внимание на все более точных оценках.
Вот так выглядит заполненная таблица:
И по ней мы видим:
• Количество человек с положительными результатами анализов: 201
• Количество человек с положительными результатами анализов, имеющие заболевание: 1
• Количество человек с положительными результатами анализов, не имеющие заболевания: 200.
Обратите внимание, мы сейчас рассматриваем только ту половину таблицы, где собраны данные людей с положительными результатами анализов. Это потому, что вопрос, на который мы хотим ответить, предполагает у вас положительные результаты: «Какова вероятность того, что я на самом деле болею, если два раза подряд анализы получились положительными?»
Теперь построим новую таблицу с имеющейся информацией. Как видно из заголовков ячеек, второй анализ может быть положительным или отрицательным, у вас может быть заболевание, а может не быть, но теперь мы рассматриваем не все население в 10 000 человек, а только тех из этого количества, у кого положительные анализы, то есть 201 человека. И теперь в ячейку «Все население» в нижнем правом поле мы записываем 201.