Антон Владзимирский – Технологии искусственного интеллекта для массовых профилактических лучевых исследований (страница 4)
2.2. Развитие программного обеспечения, основанного на технологиях искусственного интеллекта
CAD-системы нового поколения, основанные на технологиях искусственного интеллекта (ПО на основе ТИИ), отличаются от предшественников главным образом использованием при их разработке сложных алгоритмов, тренируемых на больших данных без активного участия оператора. Успех разработки таких систем в значительной степени зависит от качества данных [94]. Размещение этих данных в открытом доступе [95—98] и возможность использования мощных вычислительных ресурсов способствовали быстрому росту исследований в области ИИ [99]. Применение ПО на основе ТИИ в клинической практике возможно только после официальной регистрации продукта как медицинского изделия. Принципиальное отличие ПО на основе ТИИ от ранее рассмотренных экспертных систем заключается в том, что оно способно обучаться и накапливать опыт [100].
Основные сферы применения ИИ охватывают: 1) технологии обработки естественного языка (NLP) для анализа текста и речи; 2) компьютерное зрение (CV) для распознавания, классификации и анализа образов на медицинских изображениях; 3) анализ больших данных (Data Science) для выявления закономерностей, структурирования данных, извлечения знаний и предсказания исходов [101]. В этом разделе основное внимание будет уделено программному обеспечению на основе искусственного интеллекта для компьютерного зрения, направленному на классификацию и локализацию патологий. ПО на основе ТИИ использует два основных метода: машинное обучение, где значимость параметров определяется алгоритмически [102, 103], и глубокое обучение, которое воспроизводит структуру человеческого мозга и включает значительно больше параметров [103]. Для клинического использования такого ПО требуется подтверждение его эффективности [103].
По теме диагностики туберкулеза существуют два крупных систематических обзора с метаанализом, которые позволяют оценить возможности и перспективы использования ПО на основе ТИИ: первый был опубликован в 2016 году [104], второй – в 2019-м [105]. В этих обзорах результаты исследований, посвященных разработке, значительно превышают результаты клинических исследований, показывая AUC от 0,88 (0,82—0,90) против 0,75 (0,66—0,87). Исследователи подчеркивают значительный потенциал ПО на основе ТИИ для диагностики туберкулеза, но отмечают, что клиническим оценкам уделяется недостаточно внимания [105]. Технологии ИИ развиваются стремительно, и научные данные, представленные в этих работах, уже устарели. Свежий обзор, выполненный K.Santosh с коллегами и опубликованный в октябре 2022 года, показывает, что за последние три года AUC в новых исследованиях превысил 0,90, а по данным некоторых исследователей, даже достиг 0,99 [106, 107].
Пандемия COVID-19 явилась катализатором для разработки ПО на основе ТИИ для рентгенологических исследований органов грудной клетки. В большом количестве начинали появляться модели, обученные для выявления признаков вирусной пневмонии на рентгенограммах. Недавний систематический обзор показал, что большинство новейших решений на основе ТИИ достигли AUC выше 0,95, а самые точные – более 0,99 [108—111].
При изучении литературы об алгоритмах, выявляющих подозрительные на ЗНО легочные узлы, выяснилось, что существует ограниченное количество исследований. В последние три года был найден всего один систематический обзор с метаанализом, который также упоминал использование ПО на основе ТИИ для диагностики ЗНО легких на рентгенограммах. Согласно данным этого обзора, показатель AUC для выявления легочных узлов достигал 0,884 (0,842—0,925) с чувствительностью 0,75 (0,634—0,866) и специфичностью 0,944 (0,912—0,976). Детекция ЗНО легких демонстрировала AUC 0,864 (95% ДИ 0,827—0,901) на рентгенограммах, чувствительность при этом составляла 0,801 (0,683—0,919), а специфичность не была указана [107]. Из этих данных следует, что ПО на основе ТИИ не способно достигать чувствительности, близкой к 100%, для всех патологий, кроме туберкулеза и COVID-19.
Одной из особенностей рентгенографии органов грудной клетки является необходимость выявления алгоритмами на основе ТИИ нескольких целевых патологий. Существуют ИИ-алгоритмы, которые выполняют бинарную классификацию: норма или патология, что идеально подходит для триажа – приоритизации исследований в рабочем списке врача-рентгенолога. В среднем диагностическая точность (AUC) такого ПО составляет 0,917 (0,869—0,966), чувствительность – 0,873 (0,762—0,985), а специфичность – 0,894 (0,860—0,929) [107].
При публикации результатов разработки ПО на основе ТИИ часто демонстрируются высокие показатели точности [105, 106, 112]. Однако в ходе разработки такого программного обеспечения исследователи зачастую не уделяют должного внимания сравнению полученной диагностической точности с показателями врачей-рентгенологов. Из 39 исследовательских работ, в которых оценивалась точность ПО на основе ТИИ при анализе рентгенографических исследований, только в 13 сравнивали результаты с выводами врачей, что позволило бы более объективно оценить достоверность данных. Сравнение диагностической точности, полученной с помощью ПО на основе ТИИ, с результатами врача-рентгенолога на одном и том же наборе данных демонстрирует особую ценность, но, к сожалению, таких исследований мало [113]. В 2019 году авторы одного из обзоров с осторожностью указывали на то, что точность ПО на основе ТИИ может быть сопоставима с точностью медицинских работников.
Важно также учитывать этические вопросы: изучение научной литературы показывает, что точность ПО на основе ТИИ уже сопоставима и в некоторых случаях превосходит точность врачей-рентгенологов. Однако, как было показано, точность алгоритмов достигает 99% только для отдельных патологий – это означает, что на практике ошибки неизбежны [114]. Создается парадокс: использование ПО на основе ТИИ в автономном режиме оказывается невозможным, однако результаты проведенных исследований говорят о том, что врачи ошибаются чаще. В этом контексте в профессиональном сообществе ведется активное обсуждение целесообразности применения ПО на основе ТИИ в лучевой диагностике [115—120].
В результате исследователи предложили использовать ПО на основе ТИИ в тандеме с врачом-рентгенологом, что повышает диагностическую точность по сравнению с работой врача в одиночку [112].
Многочисленные исследования подтверждают эффективность использования ПО на основе ТИИ в лучевой диагностике. Точность алгоритмов при определении отдельных рентгенологических признаков сопоставима с работой среднестатистического врача-рентгенолога. Автоматический анализ демонстрирует чувствительность и специфичность, а также значения AUC, приближающиеся к показателям врачей: 75,4, 90,6 и 0,89% против 73,0, 88,6 и 0,85% соответственно [121]. Аналогично автоматизированный анализ результатов маммографий показывает чувствительность и специфичность на уровне 91,4 и 91,6% с AUC 0,945 [122]. При сегментации патологических областей коэффициенты сходства IoU (Intersection over Union) для ИИ-алгоритмов и врачей составляют 0,86 и 0,96 соответственно [123].
Становится очевидной необходимость использования ПО на основе ТИИ в клинической практике, при этом программный продукт обязательно должен быть зарегистрирован как медицинское изделие. К концу 2022 года 29 таких программ получили европейскую сертификацию CE MDR/MDD, и 11 из них также сертифицированы в США [124]. Программный продукт ChestLink®, который используется для полностью автономного анализа рентгенограмм грудной клетки, заслуживает особого внимания. Он самостоятельно сортирует исследования, распознает рентгенограммы, не содержащие патологических признаков, и формирует полные описания [125], что существенно снижает нагрузку на врача, позволяя сосредоточиться на более сложных случаях [126].
Значительное количество научных работ посвящено разработке ПО на основе ТИИ для цифровой рентгенографии органов грудной клетки. С 2020 по 2022 год было опубликовано 2248 научных статей по этой теме [127]. В то же время исследования возможностей ПО на основе ТИИ для цифровой флюорографии ограничены; к примеру, был представлен только один алгоритм от компании Google в 2018 году [128], без подробностей о диагностической точности. Такие исследования в основном проводятся в России и СНГ, где флюорография активно используется [129—132].
ПО на основе ТИИ уже демонстрирует хорошие результаты в лучевой диагностике, но его широкое внедрение в медицинскую практику требует не только подтверждения его эффективности, но и детального анализа возможных рисков, а также стандартизации методов оценки его работы. Социологическое исследование 2020 года показало: большинство пациентов положительно относятся к применению ПО на основе ТИИ в медицине, ожидая, что оно повысит качество медицинской помощи [133].
Таким образом, несмотря на потенциальные риски, использование ПО на основе ТИИ является перспективным направлением в радиологии, способным улучшить качество диагностики и оптимизировать рабочие процессы в ОЛД.
Современная научная литература отмечает недостаток работ, направленных на оценку усредненной диагностической точности ПО на основе ТИИ для профилактических исследований в лучевой диагностике. В то же время количество исследований, посвященных анализу диагностической точности конкретных ИИ-решений, стремительно увеличивается [26, 134—136]. Необходимо учитывать, что для глобального внедрения ПО на основе ТИИ в лучевую диагностику важно знать не только показатели диагностической точности самого программного обеспечения, но и сопоставлять их с показателями врача-рентгенолога, что на текущий момент недостаточно освещено.