Константин Абзац – Как нейросети предсказывают эпидемии и спасают миллионы (страница 2)
Это не повод бежать в пещеры и рвать все контакты. Это повод понять простую истину: в современном мире мы все сидим в одной лодке. Болезнь из далекой страны может оказаться в вашем городе быстрее, чем вы сходите в магазин за хлебом. История эпидемий – это история нашей собственной уязвимости, которую мы сами же и создаем своим стремлением к развитию.
Именно поэтому нам нужны новые инструменты защиты. Мечи и крепостные стены против вируса бесполезны. Нужно что-то другое. Что-то, что сможет увидеть опасность там, где ее не видит человеческий глаз. И это что-то – анализ данных и нейросети, о которых мы будем говорить дальше. Мы заплатили страшную цену за наши уроки, и теперь пришло время использовать эти знания не для того, чтобы вспоминать прошлое, а чтобы защищать будущее.
Почему традиционные методы прогнетирования дают сбой
Мы уже убедились, что история эпидемий – это темная сторона прогресса. Человечество веками сражалось с невидимым врагом, и оружием в этой битве часто были не только лекарства, но и попытки заглянуть в будущее, понять, куда ударит болезнь завтра. Но давайте честно: наши попытки предсказывать эпидемии до недавнего времени напоминали игру в кости с подтасованными костями. Почему же традиционные методы прогнозирования, на которые полагались лучшие умы, так часто давали сбой?
Метод “пальцем в небо” или искусство гадания на карте
Представьте себе эпидемиолога середины двадцатого века. В его арсенале – карта города, карандаш, стопка отчетов из больниц и колоссальный опыт. Он смотрит на цифры заболеваемости и пытается экстраполировать: если в прошлом месяце было сто заболевших, а в этом – двести, значит, в следующем будет четыреста. Логика в этом есть, но работает она только в идеальном, стерильном мире, где ничего не меняется.
А в реальном мире меняется всё. Люди переезжают, рождаются, умирают. Начинается сезон дождей, и комары – переносчики лихорадки – мигрируют в новые районы. Правительство решает закрыть завод, и тысячи людей уезжают из города. Как это учесть? Опытный врач мог сказать: “Чувствую я, что в этом районе будет вспышка”. И часто его чутье, основанное на годах практики, оказывалось верным. Но это было именно чутье, интуиция, а не точный расчет. Это как предсказывать погоду, глядя на небо из окна: вы видите, что тучи сгущаются, но не знаете, будет это легкий дождик или ураган, смоет ли он мост через реку и успеют ли жители эвакуироваться.
Кстати, о мостах и реках. Один мой знакомый, назовем его просто “врач из маленького городка”, рассказывал, как в девяностые годы его район оказался отрезанным от поставок вакцин из-за размытой дороги. В его традиционных расчетах не было переменной “качество дорожного покрытия и прогноз осадков на неделю”. А в реальности это оказалось важнее, чем стандартные коэффициенты заболеваемости. Таких неучтенных переменных – миллион.
Модели, которые смотрят в зеркало заднего вида
Главная проблема традиционных методов в том, что они почти всегда ориентированы на прошлое. Они берут исторические данные и пытаются найти в них закономерности, чтобы предсказать будущее. Это похоже на вождение автомобиля, когда вы смотрите только в зеркало заднего вида. Вы отлично видите, где вы были, какие ямы вы уже проехали, но абсолютно не видите, что впереди – крутой обрыв или новый мост.
Классические эпидемиологические модели, например, знаменитая модель SIR (Susceptible-Infectious-Recovered – Восприимчивые-Инфицированные-Выздоровевшие), делит население на три группы и описывает, как люди переходят из одной в другую. Это гениальная по своей простоте и полезная штука. Но она работает идеально только в теории, для идеально перемешанного населения, где все контактируют со всеми с одинаковой вероятностью. В реальности мы живем в сложной сети социальных связей. Кто-то работает в огромном офисе, кто-то – из дома, кто-то каждый день ездит в метро, а кто-то – на машине. Школьник приносит вирус домой, заражает бабушку, бабушка идет в поликлинику и заражает соседа по очереди. Учесть все эти “социальные графы” вручную или с помощью простых формул – невозможно.
Помните, как в школе мы учили формулы из физики, где нужно было представить “абсолютно упругое тело” и “идеальный вакуум”? Вот и традиционные модели эпидемиологов часто оперировали такими же “идеальными” понятиями. А жизнь, как вы знаете, далека от идеала.
Слепые, глухие и медлительные
Представьте, что вы пытаетесь услышать разговор в шумном зале, но у вас в ушах беруши. Примерно так чувствовали себя традиционные методы прогнозирования в мире, где данные существовали, но до них было не добраться. Информация о первых заболевших могла идти неделями: от врача в районной поликлинике до главврача, потом в городской департамент, потом в министерство, и только потом – к исследователям. К тому времени, как они получали цифры, вспышка либо уже затухала сама собой, либо, наоборот, разгоралась в пожаре.
Данные были не только медленными, но и крайне скудными. Мы знали, сколько человек заболело и сколько умерло. Но мы не знали, где именно они живут, с кем контактируют, какие у них привычки, путешествовали ли они недавно. Это все равно что пытаться собрать пазл из тысячи кусочков, имея всего пятьдесят, да еще и с закрытыми глазами.
Кроме того, традиционные методы плохо справлялись с “тихими” сигналами. Эпидемия не всегда начинается с того, что в больницу поступает сотня пациентов с высокой температурой. Она может начаться с десятка странных сообщений в соцсетях: “У всех в нашем офисе болит горло, что за ерунда?”. Или с резкого увеличения продаж определенных лекарств в аптеках одного района. Традиционная эпидемиология эти сигналы просто не видела. У нее не было инструментов, чтобы заглянуть в эти “зашумленные” источники.
Оглянитесь вокруг. В вашем телефоне, в ваших поисковых запросах, в историях ваших поездок по городу скрывается колоссальный объем информации о вашем здоровье и поведении. Но еще двадцать лет назад эти данные были просто недоступны. Эпидемиологам приходилось работать с тем, что есть, и удивляться, почему их прогнозы так далеки от реальности. Они были похожи на шахматистов, которые пытаются просчитать партию на десять ходов вперед, но видят только три фигуры на доске.
Все эти недостатки – слепота, медлительность, ориентация на прошлое и неспособность учесть сложность реального мира – делали традиционное прогнозирование скорее искусством, чем наукой. Искусством, которое иногда спасало жизни, но слишком часто терпело крах. Именно здесь, в этой точке разочарования и неопределенности, на сцену и выходит новый игрок – данные и искусственный интеллект, которым только предстояло научиться видеть невидимое.
Роль данных в современной эпидемиологии
Представьте себе детектива, который пытается раскрыть преступление вслепую. У него нет отпечатков пальцев, записей камер наблюдения или показаний свидетелей. Он просто стоит посреди пустой комнаты и гадает: кто это был, когда это случилось и куда преступник направился? Примерно так же выглядела работа эпидемиологов всего сто лет назад. В их распоряжении были лишь собственные наблюдения, расспросы больных и, если повезет, пара-тройка статистических таблиц, составленных вручную. Именно тогда эпидемиология начала превращаться из гадания на кофейной гуще в настоящую науку, и главным действующим лицом в этой трансформации стали данные.
Данные как новый язык медицины
Что же такое данные? Если совсем просто, это любая зафиксированная информация. Это не только цифры в таблицах. Для эпидемиолога данными может стать всё, что угодно: количество проданных в аптеке градусников, сообщения в социальных сетях о том, что у ребенка поднялась температура, частота запросов в интернете со словом “кашель”, спутниковые снимки городов и даже информация о том, как часто люди ездят на работу в метро. Раньше, во времена наших бабушек и дедушек, данные собирали по крупицам. Врач приходил к больному, ставил диагноз и заполнял карточку. Эти карточки потом годами пылились в архивах. Чтобы понять, что в городе начинается эпидемия гриппа, нужно было дождаться, пока врачи соберут все эти карточки, передадут их в единый центр, где специально обученные люди их обработают. К тому времени, как они понимали масштаб бедствия, эпидемия уже была в самом разгаре.
Сегодня данные сыплются на нас со всех сторон, как конфетти на карнавале. И главная задача эпидемиолога – не просто собрать эти конфетти, а научиться видеть в этом разноцветном бумажном вихре закономерности. Например, внезапный всплеск продаж детского жаропонижающего в конкретном районе города может быть не просто совпадением, а самым настоящим сигналом тревоги, который нейросеть поймает за несколько дней до того, как местные поликлиники заполнятся больными детьми.
От наблюдений к предсказаниям
Эпидемиология – это наука о том, как болезни распространяются среди людей и почему. Раньше это было похоже на работу пожарного, который тушит уже полыхающий дом. Врачи констатировали факт: люди болеют, вот статистика, давайте лечить. Данные нужны были лишь для того, чтобы описать картину прошлого. Но современная эпидемиология, вооруженная данными, меняет подход. Она пытается стать тем самым детективом, который не просто смотрит на место преступления, а предсказывает, где произойдет следующее.