Анна Хоружая – Цифровые технологии в лучевой и инструментальной диагностике (страница 5)

Шрифт

Опубликовано краткое сообщение (тезисы) о применении в Красноярском крае программного обеспечения на основе ИИ для ретроспективного пересмотра результатов КТ ОГК, выполненных в период пандемии COVID-19. Из 10 500 исследований 484 (4,6%) случая автоматически классифицированы как «подозрительные». После проверки врачами-рентгенологами 45 КТ-снимков отнесены к «группе пациентов с рентгенологическими признаками или подозрением на рак легкого». Полученные результаты авторы использовали как обоснование «эффективности гибридного подхода» к анализу результатов КТ ОГК [43].

Особое внимание российские исследователи уделяют проблематике применения технологий ИИ для анализа результатов профилактической маммографии.

Н. И. Рожкова с соавторами (2020), опубликовали результаты разработки и изучения диагностической значимости сегментационной нейросетевой модели детекции патологических изменений молочных желез. С применением набора данных из размеченных результатов 15 486 цифровых маммографий реализована модель на нейронной архитектуре ResNet50 с выводом результата при помощи градиентного бустинга. Точность сегментации определяли по коэффициенту сходства, вероятность злокачественности находок вычисляли с помощью показателей бинарной классификации. Результаты: разработана система, представленная сегментационной моделью на основе нейросетевой архитектуры. Модель выявляла критичные рентгенологические признаки (новообразования, кальцинаты, локальную перестройку структуры или асимметрию) с высокой точностью: коэффициент сходства – 0,8176 и выше при пороговых значениях на выходных нейронах сети 0,1 и 0,15. Авторы заявили, что результаты машинной сегментации и разметки изображений врачом-рентгенологом эквивалентны по своей точности как минимум в отношении выявления новообразований, внеочаговых кальцинатов и внутрижелезистых лимфатических узлов. Полученные результаты послужили обоснованием возможности применения разработанного решения как системы поддержки принятия врачебных решений при анализе и интерпретации профилактических маммографических исследований [84]. Это чрезвычайно важное исследование, логичным продолжением которого должно послужить исследование точности и надежности авторской разработки в реальных клинических условиях.

Выполнены обзор и сравнение отдельных шести отечественных и зарубежных решений на основе ИИ для автоматизированного анализа результатов маммографии и улучшения выявляемости злокачественных новообразований молочной железы. Приведены данные о функциональных возможностях, а также о диагностической точности. Вместе с тем сопоставимость показателей вызывает определенные сомнения, так как они получены в разных условиях: как на собственных наборах данных разработчиков, так и в ходе независимой валидации. В целом работа подтверждает сложившееся мнение о значительном потенциале ИИ как системы поддержки принятия врачебных решений, направленной на снижение рисков пропуска значимой патологии и повышение производительности труда врачей-рентгенологов [93].

Представляет интерес публикация, появившаяся в процессе развития одного из отечественных программных продуктов на основе ИИ, впоследствии получившего статус медицинского изделия. Для создания системы анализа результатов рентгенографии органов грудной клетки использовали находящийся в свободном доступе набор данных ChestX-ray8 и три разные архитектуры (нейросеть с обучением методом обратного распространения ошибки, нейронную сеть, работающую по конкурентному принципу, глубокую сверточную нейросеть). Для первого варианта архитектуры достигнута точность в 81,03% при минимальном среднеквадратическом отклонении. Второй вариант достигал большее среднее значение точности (90,12%), но величина погрешности была более высокой. Третий вариант показал максимальную точность и минимальную величину погрешности, но был сопряжен со значительными ресурсными затратами на обучение [9]. Особую ценность работе придают сделанные авторами выделение, структурирование и анализ причин ошибок нейронных сетей. Это важный методический момент, часто упускаемый из виду в научных публикациях. Тщательный разбор ошибок позволяет пошагово и системно повышать точность работы ИИ в лучевой диагностике.

Встречаются отдельные работы, представляющие собой смешение обзора и тестирования некоего конкретного программного продукта (например, для автоматизированного анализа результатов конусно-лучевой компьютерной томографии в стоматологической практике) [11, 52]. Однако результаты апробации излагаются без достаточного объема статистического материала.

На этом фоне положительно выделяется исследование, опубликованное в 2022 году и посвященное сравнительному изучению различных систем ИИ для выявления очагов и округлых образований в легких. Авторы выбрали четыре программных продукта и анонимизировали их. Для тестирования использованы два оригинальных зарегистрированных набора данных из 150 цифровых рентгенограмм легких с различными верифицированными патологиями и из 5000 цифровых рентгенограмм без патологических признаков. На основе наборов данных сформированы три выборки с распространенностью патологических признаков 3,0, 6,0 и 50,0%. Тем самым авторы смоделировали ситуации рентгенологического скрининга (первые две выборки) и диагностического пульмонологического центра (третья выборка). Включенные программные продукты последовательно протестированы. Для выборки 1 общая точность колебалась в диапазоне 90,0—94,0%, площадь под характеристической кривой – 0,723—0,825; для выборки 2 соответствующие диапазоны составили 89,0—97,0% и 0,750—0,911; для выборки 3 – 77,0—89,0% и 0,770—0,890. Выявлены существенные различия в диагностической точности при работе ИИ на разных выборках. В разных ситуациях некоторые системы не могли преодолеть минимальный пороговый уровень показателя «площадь под характеристической кривой», либо показатели точности достаточно серьезно варьировались.

Доказана необходимость отбора программного продукта четко под задачи и специфику конкретной медицинской организации. Авторы сообщили, что показатели точности всех программных продуктов сопоставимы с результатами тестирования врачей-рентгенологов. Такое тестирование было проведено и опубликовано тем же авторским коллективом ранее (показатели чувствительности и специфичности врачей были 76,0 и 72,3% соответственно) [92]. В процитированной публикации проведена независимая валидация четырех программных решений на основе технологий ИИ для лучевой диагностики. К сожалению, подобных работ исчезающе мало. Позиция авторов состояла в объективном установлении точности ИИ и в нежелании сравнивать конкретные продукты. Тем не менее отсутствие информации о протестированных разработках несколько снижает ценность публикации. Минимальной альтернативой могло стать хотя бы перечисление протестированных продуктов с последующей анонимизацией результатов тестирования. Подчеркнем особо, что выявленные авторами зависимости точности от характера выборки (фактически претестовой вероятности патологии) служат серьезным обоснованием необходимости проведения исследования технологий ИИ в реальных клинических условиях.

Остаются малоизученными аспекты влияния автоматизации на основе ИИ на производительность, качество работы врачей-рентгенологов, организацию и результативность лучевой диагностики. На экстремально малой выборке (n = 5) показано, что автоматизация рабочего процесса врача-рентгенолога за счет внедрения ИИ для анализа результатов рентгенографии ОГК оптимизирует трудозатраты, сокращает время на проведение рутинных процедур примерно на 30,0%, повышает производительность труда (то есть увеличивает количество описываемых исследований) [85].

Пандемия новой коронавирусной инфекции создала колоссальные вызовы для систем здравоохранения всех стран мира; особую роль в борьбе с этим заболеванием сыграла лучевая диагностика. Глобально к выявлению, дифференциальной диагностике и контролю динамики течения COVID-19 применялись – с точки зрения рентгенологии – различные подходы. Часть стран сфокусировалась на применении компьютерной томографии, другая часть отдала предпочтение рентгенографии. В России, в силу наличия особенностей субъектов, применялись обе модальности, также велись исследования в аспекте использования магнитно-резонансной томографии [170]. В любом случае ситуация привлекла значительное внимание разработчиков технологий ИИ. В мире был зафиксирован скачок числа публикаций о разработках и применении искусственного интеллекта для диагностики и оценки тяжести COVID-19 по результатам лучевых исследований [60, 63].

Необходимо подчеркнуть негативный факт. В период пандемии в России появился целый ряд оригинальных разработок – программных продуктов на основе ИИ для автоматизированного выявления признаков COVID-19 и оценки тяжести по результатам компьютерной томографии (прогресс в этой области наглядно демонстрирует сетевой каталог ИИ-сервисов – https://mosmed.ai/service_catalog); часть таких разработок даже получили статус медицинского изделия. Вместе с тем научных публикаций о соответствующих решениях, их испытаниях и применении фактически не появилось. Отечественные авторы ограничивались литературными обзорами [60, 63, 103]. Единичные сообщения о применении технологий ИИ носили сугубо ретроспективный характер и основывались на малых объемах наблюдений (от 16 до 187 пациентов) [61, 95].

4 5 6 7 Вперед