18+
реклама
18+
Бургер менюБургер меню

Том Чиверс – Предсказать всё. Как теорема Байеса объясняет наш мир (страница 3)

18

В Британии возник еще один скандал, связанный с этими принципами: несколько комментаторов из числа настроенных скептически в отношении самоизоляции людей какое-то смутное представление о теореме Байеса получили. Бывший министр Джон Редвуд прославился, наверное, больше остальных: «Советники правительства должны нам сегодня сказать, как они собираются бороться с ложными результатами тестов, искажающими цифры», – потребовал он.

Дело в том, что один из скептиков неверно истолковал интервью с профессором сэром Дэвидом Шпигелхалтером – жизнерадостным статистиком, который во время пандемии не вылезал из телевизора и радио, терпеливо объясняя точность тестирования или эффективность прививок. Из его слов эти комментаторы извлекли, что когда тестирование дает 1 % ложноположительных результатов, то это не означает, что лишь 1 % всех положительных результатов ложны!.. Все это происходило между первой и второй волнами, когда при малейшем насморке мы делали тестирование при помощи полимеразной цепной реакции – ПЦР-тесты. В то время заболеваемость ковидом среди британцев была довольно низкой – локдаун же снижает число заражений! – но, похоже, она снова начала расти.

Однако ковид-диссиденты посчитали, что явный рост заболеваемости – иллюзия, которую можно объяснить с помощью теоремы Байеса. Примерно 0,1 % людей на тот момент болели ковидом. Если бы вы тестировали людей случайным образом, и ваш тест в 99 % случаев правильно определял бы людей, у которых нет ковида, а людей, у которых ковид есть, – в 90 % случаев, то более 90 % ваших положительных результатов были бы ложными[4].

Все это абсолютно верно. Однако они не зашли в своих байесовских рассуждениях достаточно далеко. Во-первых, действительно ли априорная вероятность составляла 0,1 %? Конечно, если тестировать население полностью случайным образом. Но мы-то не тестировали их так – мы тестировали людей, у которых были симптомы, или же контактировавших с человеком, заболевание которого было подтверждено. Вероятность, что эти люди больны, была гораздо выше. Насколько выше? Мы не знаем, но даже если только у одного процента из них в действительности был ковид, общая доля ложноположительных результатов упала бы до 50 %. Если 10 % из них действительно болели бы, примерно 90 % положительных результатов были бы правильными.

И, конечно, мы исходим из того, что доля ложноположительных результатов составляет 1 %. Такой показатель кажется совершенно невероятным.

В один момент летом 2020 года, когда ковид, казалось, пошел на убыль, общая доля положительных тестов – и ложных, и правильных – составила 0,05 %, то есть доля ложноположительных результатов не могла объективно превышать этот показатель. Если взять это за основу, то при заболеваемости ковидом на уровне 0,1 % доля неверных положительных результатов упадет примерно до 35 %. Если учесть, что заболеваемость подвергнутой тестированию части населения была выше, как мы аргументировали ранее, получим, что доля неверных положительных результатов среди положительных была еще меньше.

Речь, впрочем, может идти не только о ковиде. Невозможно разобраться ни в одной из форм медицинских анализов, не призвав на помощь Байеса.

Система медицинского обслуживания (NHS) в Англии делает плановый онкоскрининг трех видов – груди, мозга и толстой кишки. Обследование предстательной железы могут пройти мужчины старше пятидесяти лет, если они обратятся самостоятельно, но в плановом порядке оно не проводится.

Почему? Обследование на рак – это же здорово. Все мы знаем, что чем раньше болезнь выявят, тем выше шансы ее победить. Почему тогда не пройти обследование, которое выявит, больны вы раком или нет? Ответ на этот и другие вопросы, заданные в этой книге, – в теореме Байеса.

Скрининг рака предстательной железы проводят с помощью так называемого теста на простатический специфический антиген (ПСА). Он довольно простой. Ты делаешь анализ крови, и если уровень ПСА в крови превышает определенный показатель, – обычно 3 или 4 нанограмма на миллилитр, – тебя направляют на дальнейшее обследование, например, на сканирование или биопсию. Высокий уровень ПСА может быть признаком рака предстательной железы, хотя он же может указывать и на наличие инфекции, воспаления или просто на возраст.

ПСА-скрининг не настолько точен, как тесты, о которых шла речь выше. По данным Национального института здоровья и медицинской помощи (NICE) – консультативного медицинского органа Великобритании, – если проводить скрининг на ПСА с отсечкой 3 нанограмма на миллилитр, это позволит правильно выявить около 32 % пациентов, больных раком (чувствительность) и около 85 % пациентов, у которых нет рака (специфичность).

Примерно 2 % мужчин за пятьдесят страдают раком предстательной железы. Если еще раз протестировать миллион пациентов, примерно 20 тысяч из них действительно окажутся больны. Правильный диагноз будет поставлен примерно 6 400 из них. А из оставшихся 980 тысяч примерно 147 тысячам вы скажете, что им нужно будет пройти дополнительное обследование. Если вы получите положительный результат по этому тесту, и вы мужчина за пятьдесят, вероятность, что у вас действительно рак, составит примерно 4 %.

Стоит ли знать о такой вероятности? Наверное. Но нужно иметь в виду, что надо будет пройти дополнительные обследования, в том числе инвазивные, неприятные, иногда в чем-то рискованные. Плюс, конечно, NHS пришлось бы оплачивать десятки тысяч МРТ-сканирований и биопсий, а это миллионы фунтов. Такие деньги лучше было бы потратить на статины, пересадку почек или зарплату медсестер. Особенность рака предстательной железы заключается в том, что во многих случаях он растет настолько медленно, что мужчины даже не подозревают о том, что он у них может быть; очень часто рак простаты обнаруживают при вскрытии, когда мужчина умер от чего-то другого.

Так что возникает еще одна важная тема. Показатели «чувствительность 32 %, специфичность 85 %» вы получите, если примените отсечку в 3 нанограмма на миллилитр. Но можно увеличить этот показатель до 4 нанограмм. Что тогда?

Тогда показатель специфичности будет выше. Процент пациентов, которым правильно диагностировано отсутствие рака, увеличится с 85 до 91 %. Но тогда пострадает чувствительность. Доля мужчин, у которых есть рак, и при этом правильно диагностированный, снизится с 32 до 21 %. Если еще раз протестировать миллион мужчин, то теперь вы получите меньше ложноположительных результатов – 88 200, но меньше и истинно положительных: всего 4 200 из 20 тысяч. В такой ситуации, если вы получили положительный результат, вероятность, что у вас действительно рак, все равно составит всего лишь около 4,5 %.

Обойти это невозможно. Можно поднять порог, скажем, до 5 нанограмм на миллилитр, и уменьшить число ложноположительных результатов, но только за счет увеличения числа ложноотрицательных. Или можно снизить порог и уменьшить количество ложноотрицательных результатов, но только ценой увеличения количества ложноположительных. Это неизбежная дилемма, высеченная в камне. Единственный возможный обходной маневр здесь – пройти другое, более эффективное обследование. Ситуация аналогична проблеме «статистической значимости» в науке. Об этой проблеме мы еще поговорим.

При раке груди и толстой кишки скрининг довольно точен. Но даже в этом случае он сильно зависит от показателя заболеваемости в популяции. В одном крупном исследовании было показано, что 60 % женщин, которые в течение десяти лет ежегодно делают маммографию, хотя бы один раз получают ложноположительный результат. Их направляют на дополнительные исследования, например на биопсию. Всё это вызывает «тревогу, душевное смятение и беспокойство, связанные с раком молочной железы». Стоит ли оно того? Будет целиком зависеть от фонового уровня заболеваемости в популяции, то есть от априорной вероятности. Рак груди редко встречается у молодых женщин. Если протестировать женщин моложе сорока, то даже довольно чувствительные и специфические тесты дадут очень много ложноположительных результатов. Среди женщин старшего возраста этот метод ценят больше, и в NICE утверждают, что он экономически эффективен, если его делать у женщин старше пятидесяти. Но вы не можете принимать решения, не прибегнув к помощи Байеса.

Будущим родителям тоже не помешает почитать о Байесе. Существует вид дородового скрининга, известный как «неинвазивное пренатальное тестирование» (NIPT), при котором у беременной женщины берут на анализ кровь, которую проверяют на наличие различных хромосомных заболеваний у плода. В Великобритании NHS предлагает его пройти женщинам из категорий высокого риска. Еще его делают в частных клиниках, примерно за 500 фунтов. Продают тест, рекламируя его 99-процентную точность. Но, опять же, точность теста сама по себе ничего вам не скажет о том, насколько вероятна правильность вашего результата. Заболевания, ради выявления которых его проходят, редки; это синдром Дауна, синдром Патау и синдром Эдвардса. Но они при этом крайне серьезны. Ребенок с синдромом Дауна может прожить долгую и счастливую жизнь, но ему скорее всего будет необходим пожизненный уход, в то время как дети с синдромами Патау и Эдвардса обычно умирают в первые месяцы или годы жизни. Очевидно, что для родителей очень важно, точны результаты тестов или нет.