Трансляция Регистрация

15—16 октября 2020 года
Онлайн

Об оценке надежности медицинского диагноза, формируемого на основе математического анализа эмпирических данных - на Московской конференции по Искусственному Интеллекту в здравоохранении #MosCai'20. 17.09.2020

Об оценке надежности медицинского диагноза, формируемого на основе математического анализа эмпирических данных - на Московской конференции по Искусственному Интеллекту в здравоохранении #MosCai'20.

К ПРОБЛЕМЕ НАДЕЖНОСТИ МЕДИЦИНСКОГО ДИАГНОЗА, ФОРМИРУЕМОГО НА ОСНОВЕ ЭМПИРИЧЕСКИХ ДАННЫХ
Забежайло М.И., Трунин Ю.Ю
В современной (и в первую очередь – высокотехнологичной) медицине все более значимую роль играют математические методы и компьютерные инструменты обработки эмпирических данных о текущем состоянии пациента. Углубленный анализ постоянно накапливаемых данных оказывается критически значимой составной частью принятия врачебных решений – постановки диагноза, формирования плана лечебных мероприятий и т.п..
Принципиально важной особенностью медицинских заключений диагностического характера является «опора» на уже накопленный опыт ранее принимавшихся решений в аналогичных ситуациях. С формальной точки зрения это – математическая техника принятия решений по результатам «обучения» на прецедентах (ранее сформированных как успешных, так и ошибочных диагностических заключениях), описываемая теми или иными интерполяционно-экстраполяционными (ИЭ) методами и алгоритмами компьютерного анализа данных.
Наряду с очевидными достоинствами ИЭ-схемам анализа данных и поддержки принятия решений (АД и ППР) присущ ряд существенных ограничений: это, в частности, - приближенный характер интерполяции при использовании статистических средств анализа данных (так, например, для заключений с вероятностью характерны определенные затруднения при необходимости принять персонализированное решение в конкретном единичном случае); нестабильность набора интерполяционных зависимостей при расширении исходной «обучающей» выборки описаний прецедентов; порождение в процессе АД и ППР в т.ч. и артефактов (формально корректных, однако, содержательно не интерпретируемых заключений\зависимостей, примером которых могут служить, в частности, артефакты машинного обучения, отражающие эффект так называемого переобучения).
В складывающейся ситуации представляется естественным искать компьютерный «инструментарий» АД и ППР, позволяющий строить такие ИЭ-зависимости, которые были бы и неоспариваемы на уже накопленной выборке эмпирических данных (имеющейся Базе Фактов), и наследуемы (устойчивы) при ее расширении описаниями новых прецедентов, при этом (там, где это возможно) минимизировалось бы порождение артефактов компьютерного анализа данных.
В работах [1-3 и др.] был представлен математический аппарат так называемых Характеристических Функций (ХФ), обладающий названными выше необходимыми свойствами. Принципиально важной его особенностью оказались ИЭ-возможности, в основе которых – анализ причинности возникновения анализируемых эффектов, опирающийся на современные математические методы искусственного интеллекта. При построении ХФ, интерполирующих текущую Базу Фактов, для отсечения артефактов АД задействован механизм сопоставления эмпирических причинных зависимостей, порождаемых на примерах (прецедентах, где наблюдается анализируемый целевой эффект), с контр-примерами (прецедентами, где анализируемого целевого эффекта нет): ни одна из найденных на примерах причинных зависимостей не должна выполняться ни на одном из контр-примеров (каждая соответствующая ХФ выполняется на каждом из примеров, и не выполняется ни на одном из контр-примеров). Это – базовый механизм проверки порождаемых зависимостей на фальсифицируемость (опровергаемость, оспариваемость).
Однако, достаточно часто в приложениях приходится иметь дело с эффектом асимметрии примеров и контр-примеров: если наличие анализируемого целевого эффекта обусловлено соответствующими причинными «влияниями», то его отсутствие может отражать как наличие контр-«влияний» (например, реакцию иммунной системы в сопротивлении организма болезни и т.п.), так и ситуацию, где нет ни «влияний», ни «контр-влияний». К сожалению, надежно разделить контрпримеры этих двух типов в исходной обучающей выборке, как правило, не представляется возможным.
Одним из вариантов действий, позволяющих бороться с ограничениями подобного типа, оказалась возможность использовать пары содержательных «контр-эффектов» для проверки на фальсифицируемость представляемых порождаемыми ХФ причинных зависимостей. Разбираемым в докладе примером подобной пары содержательных контр-явлений являются эффект роста злокачественных новообразований, характерный для так называемой псевдопрогрессии (ПсП), и, наоборот, эффект сокращения объема опухоли (СОО), наблюдаемого в ряде случаев прямо в рамках штатной серии сеансов лучевой терапии. Предлагаемая процедура содержательной фальсификации (проверки на опровергаемость ХФ, порождаемых в процессе интеллектуального анализа данных) предполагает, что оба контр-эффекта одновременно (на каком-либо прецеденте) иметь место не могут (т.е. одновременная выполнимость двух контр-ХФ есть «сигнал» о выявлении артефакта, который должен быть исключен из дальнейшего процесса АД и ППР).
Для демонстрации результативности предлагаемой процедурной техники отсечения артефактов АД и ППР в докладе дается анализ эмпирических зависимостей (ХФ), характеризующих эффект псевдопрогрессии (ПсП) некоторого вида опухолей головного мозга человека, с использованием в качестве контр-эффекта к ПсП эффекта сокращения объема опухоли (СОО) в рамках штатной серии сеансов лучевой терапии, в котором подробно представлены:
- описания эффектов ПсП и СОО,
- используемая для выполняемого интеллектуального компьютерного анализа База Фактов - исходная выборка данных (д-р Ю.Ю.Трунин, НМИЦ НХ им. ак. Н.Н.Бурденко),
- примеры описывающих эффект ПсП характеристических функций,
- результаты (успешной) проверки таких ХФ на фальсифицируемость на СОО-подвыборке исходной БФ,
Дополнительно обсуждаются результаты изучения «симметричной» ситуации – попытки решить аналогичную задачу и для эффекта СОО. Продемонстрирована каузальная нерепрезентативность [2,3] текущей БФ по отношению к эффекту СОО (не выполняется одно из критически значимых условий, необходимых для формирования СОО-ХФ). Причина - мало данных, характеризующих собственно природу эффекта СОО (в текущей БФ недостаточно данных о детальных особенностях задействованных режимов лучевой терапии, разделении первичных опухолей и рецидивов, морфологических характеристиках опухолей и др.). Следствием предпринятого анализа стали рекомендации по детализации и пополнению описаний прецедентов в БФ в том числе и именно такими (СОО-ориентированными) расширенными данными. Это позволит более результативно использовать характеризующие эффект СОО эмпирические зависимости (формализованные в виде ХФ знания о причинах возникновения этого эффекта) как дополнительный инструмент отсечения артефактов компьютерного анализа данных при экстраполяции ПсП-ХФ на новые прецеденты в процессе формирования ПсП-заключения у новых пациентов.
Демонстрируется, что предлагаемая процедурная техника АД и ППР – результативный «инструмент» интеллектуального анализа данных, который позволяет повысить надежность медицинских диагнозов, формируемых на базе постоянно накапливаемых и пополняемых эмпирических данных о текущем состоянии пациентов.

Возврат к списку

В разделе "трансляция" выложена общая запись всех мероприятий конгресса с разбивкой по залам.

На сайте Международного конгресса #ИТМ в разделе "трансляция" https://itmcongress.ru/itm2020/stream/  выложена общая запись всех мероприятий конгресса с разбивкой по залам.  По мере обработки, мы будем прикреплять презентации, видео и материалы конкретных выступлений к их карточкам в разделе  ИТМ2020: доклады и презентации: https://itmcongress.ru/itm2020/agenda/

«N3.Аналитика» (ООО «Нетрика» https://netrika.ru/ ) - Победитель ежегодного конкурса Конкурса "Лучшее ИТ решение для здравоохранения 2020"

«N3.Аналитика» (ООО «Нетрика» https://netrika.ru/ ) - Победитель ежегодного конкурса Конкурса "Лучшее ИТ решение для здравоохранения 2020" https://itmcongress.ru/itm2020/competition/
Информационная система «N3.Аналитика» - система класса BI, разработана компанией «Нетрика» в 2017 году, включено в реестр Единый реестр российских программ для электронных вычислительных машин и баз данных. Решение внедрено и используется в 11 регионах России, среди которых Санкт-Петербург, Ленинградская область, Хабаровский край, Мурманская область, Краснодарский край, Кировская область, ЯНАО, Кемеровская область, Забайкальский край, Алтайский край, Республика Калмыкия.
Описание, параметры и авторы системы здесь: https://itmcongress.ru/itm2020/competition/netrika.php

Наверх