Содержание к диссертации
Введение
ГЛАВА 1. Анализ существующих подходов к решению диагностической задачи 12
1.1. Методы постановки диагноза, используемые в медицинских информационных системах 12
1.1.1. Математические методы решения задач медицинской диагностики 14
1.1.2. Классификация при наличии обучающих выборок 15
1.1.3. Классификация на основе байесовской теории принятия решений 17
1.2. Многокритериальные задачи принятия решений 18
1.3. Методы формирования номенклатуры признаков и оценка их информативности 23
1.4. Этапы работы над задачами диагностики и возникающие при этом трудности 27
1.5. Постановка задачи исследования 33
Основные результаты первой главы 35
ГЛАВА 2. Методы классификации и идентификации опасных инфекционных заболеваний 36
2.1. Общая постановка задачи классификации опасных инфекционных заболеваний 36
2.2. Формирование обобщенного диагностического показателя 39
2.3. Алгоритм объективизации экспертных оценок 40
2.4. Области значений диагностических признаков 43
2.5. Идентификация объекта с опасными инфекционными заболеваниями 45
Основные результаты второй главы 48
ГЛАВА 3. Построение и обоснование методики исследования 49
3.1. Структурная организация информации 49
3.2. Экспериментальная проверка метода 59
3.2.1. Определение перечня информативных признаков 59
3.2.2. Типизация признаков по характеру проявления 60
3.2.3. Группировка признаков по направлениям осмотра 65
3.3. Исследование структуры диагностических признаков 67
Основные результаты третьей главы 71
ГЛАВА 4. Разработка решающего алгоритма и результаты исследований 72
4.1. Составление карты обследования 72
4.2. Обобщенный диагностический алгоритм 73
4.3. Оценка качества решающих правил 78
4.4. Реализация алгоритма оперативной диагностики 79
4.5. Анализ полученных результатов 84
Основные результаты четвертой главы 87
Заключение 88
Список использованных источников 89
Приложение №1. 98
Приложение №2. 106
- Математические методы решения задач медицинской диагностики
- Алгоритм объективизации экспертных оценок
- Группировка признаков по направлениям осмотра
- Реализация алгоритма оперативной диагностики
Введение к работе
Актуальность темы. Несмотря на значительные успехи, достигнутые в области эколого-вирусологических исследований, эпидемическая ситуация по инфекционным и паразитарным заболеваниям в мире продолжает оставаться напряженной [1]. Именно ранняя диагностика опасных инфекционных заболеваний (ОИЗ) играет решающую роль в предотвращении серьезных последствий возможного распространения, позволяет определить тактику лечения больных на догоспитальном этапе, оказать неотложную внебольничную помощь. Таким образом, диагностика опасных инфекционных заболеваний на ранних стадиях является чрезвычайно важной задачей государственного масштаба [2-5].
В настоящее время идёт непрерывное совершенствование "старых" диагностических методов, разрабатываются новые, всё более эффективные и надёжные методики [6]. Необходимость дальнейшей разработки методов оперативной диагностики инфекционных заболеваний во многом обусловлена тем, что происходит заметное изменение патоморфоза и клинической картины инфекций. Увеличивается количество стёртых, атипичных, затяжных форм инфекций, наблюдается нарастание частоты смешанных инфекций бактериальной и вирусной природы. Надо признать, что ни один из современных оперативных методов не обеспечивает 100% выявления возбудителя инфекции [7-9]. Поэтому целесообразным является использование нескольких методов диагностики; нередко требуется проведение повторных исследований [10].
Существующие методы диагностики ОИЗ, во-первых, длительны во времени, во-вторых, требуют либо дорогостоящего оборудования (иммуноферментный и радиоиммунный анализ, вирусологический, бактериологический, серологический, паразитологический методы исследования), либо недостаточно чувствительны (клинико-
иммунологическая оценка лабораторных данных, основанная на качественной визуальной оценке биохимической реакции) [11]. Проблема диагностики заболевания на ранних стадиях, наблюдение за течением заболевания, прослеживание эффективности применяемого лечения - все это в настоящее время является проблемой, для решения которой необходимо объединение усилий медиков и специалистов смежных областей знаний [12-14].
Обстоятельства выявления очагов инфекций и опасность массового заражения обязывают к оперативности действий при возникновении подозрения на инфекционное заболевание. Доступность персональных компьютеров делает возможным их повсеместное использование в лечебных заведениях для диагностики заболеваний с помощью методов теории распознавания [15,16], однако недостатки соответствующих диагностических систем и методов их разработки не позволяют решить эту задачу в полной мере. Одной из причин такого положения вещей являются значительные теоретические трудности в построении медицинских информационных систем (МИС), основанных на знаниях опытных специалистов-экспертов. Медицинская диагностика относится к так называемым слабоструктурируемым предметным областям, в которых доминирующими факторами при принятии решений являются профессиональный опыт и интуиция [17]. Трудности выявления экспертных знаний во многом обусловлены их подсознательным характером, когда эксперт не может вербализовать полную и непротиворечивую систему правил, которую он использует при принятии решений. В совокупности с повышенными требованиями к точности и полноте, которые предъявляются к экспертным знаниям для построения на их основе МИС, эта проблема делает актуальной разработку методик выявления не только полных и непротиворечивых систем экспертных решающих правил, но и методик повышения достоверности извлеченных знаний, минимизирующих ошибки эксперта [18].
В связи со сказанным, актуальной задачей является разработка методов структурной организации исходной информации и преобразование ее в формализованный вид, применимый для эффективной и оперативной реализации с помощью современных вычислительных средств.
Цель работы и задачи исследования. Целью данной работы является разработка автоматизированной методики процесса оперативной диагностики опасных инфекционных заболеваний на основе первичной информации о состоянии здоровья пациента.
Для достижения поставленной цели в ходе исследований по теме диссертационной работы ставились и решались следующие основные задачи:
разработка метода формализации исходной информации, ее
преобразования, унификации и представления для
последующего анализа;
разработка методов классификации и идентификации опасных
инфекционных заболеваний;
разработка методов определения диагностической значимости
признаков;
разработка алгоритмов формального представления
диагностических решающих правил;
экспериментальная проверка правильности функционирования и
оценка качества разработанных методов на контрольных
примерах;
реализация построенных методов и алгоритмов с помощью
программно-вычислительных средств.
Методы исследования. При решении поставленных задач
использовались: теория распознавания образов, методы математической
статистики, методы анализа структуры данных, математический аппарат
нечеткой логики, методы теории принятия решений, принципы построения
алгоритмов и систем, а также методы вычислительной математики и программирования.
Научная новизна работы. В диссертации получены следующие новые научные результаты:
разработан метод анализа структуры ведущих признаков инфекционных заболеваний посредством процедур статистической обработки данных с привлечением экспертной информации, учитывающий специфику слабо структурированных медико-биологических данных;
на основе методов теории распознавания образов разработаны методы ранней классификации опасных инфекционных заболеваний;
построен и реализован алгоритм оперативной диагностики опасных инфекционных заболеваний, проведена экспериментальная проверка его работы;
создана автоматизированная система оперативной диагностики, позволяющая оперативно идентифицировать опасные инфекционные заболевания.
Практическая значимость полученных в диссертационной работе результатов состоит в следующем:
построен и реализован алгоритм, позволяющий проводить оперативную диагностику опасных инфекционных заболеваний с максимальной эффективностью;
на основе разработанного метода классификации опасных инфекционных заболеваний созданы средства экспресс-диагностики;
полученные результаты дают возможность достоверно на ранних этапах диагностировать опасные инфекционные заболевания, что, в случаях их выявления, позволяет избежать возможного массового распространения и принять меры по
локализации очага, что особенно актуально для постановки
диагноза в «полевых» условиях, когда лабораторные и
инструментальные методы недоступны. Результаты, выносимые на защиту:
методы классификации и идентификации опасных
инфекционных заболеваний;
метод структурной организации слабоформализуемой
медицинской информации с нечеткими данными;
методы анализа информативности показателей опасных
инфекционных заболеваний;
методы формального представления комбинированных
диагностических правил;
алгоритм оперативной диагностики опасных инфекционных
заболеваний. Реализация результатов. Результаты диссертации легли в основу научно-исследовательской работы по теме: «Обоснование системотехнических решений по созданию экспертной системы верификации биотерактов и разработка ее информационного обеспечения», проводимой в Пущинском научном центре РАН.
Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на Международной конференции «Параллельные вычисления и задачи управления» РАСО (Москва 2006 г.), Международной конференции «Информационно-вычисли-тельные технологии в науке» (Москва 2006 г.), Международной научно-практической конференции «Пилотируемые полеты в космос», научном семинаре в Институте военной медицины МО РФ (Москва 2005 г.), научно-технической конференции МИРЭА (Москва 2005 г.), научных семинарах в Пущинском научном центре РАН (Пущино, 2004-2006 гг.).
Публикации. По материалам диссертации опубликовано 7 работ (в том числе 3 публикации в ведущих рецензируемых научных изданиях, рекомендованных ВАК, 4 публикации в трудах научных конференций).
Структура и объем работы. Диссертация состоит из введения, четырех глав и заключения. Работа содержит 107 страниц, включая 18 рисунков, 9 таблиц, 2 приложения и список литературы из 103 наименований.
Математические методы решения задач медицинской диагностики
Среди математических методов, применяемых для решения задач диагностики заболеваний, можно выделить три группы: вероятностно -статистические, геометрические и логические методы [22]. Наибольшее распространение в медицинской практике получили методы первой группы. Это объясняется наличием развитых теории и программно-алгоритмического обеспечения, а также разработанными принципами интерпретации используемой модели данных и результатов статистических вычислений.
В зависимости от способа построения диагностического правила их можно разделить на статистические; эвристические; минимизирующие функцию эмпирического риска.
Статистические методы построены на основе теории статистических решений. К ним относятся байесовские методы, метод последовательной процедуры Вальда и др. Статистические методы базируются на методическом учете неопределенных факторов с неизвестным законом распределения, что является наиболее характерным для диагностических систем [22]. В этом случае, следует ориентироваться на правильный выбор критериев, на основе которых принимаются решения.
Эвристические методы основаны на предположении о том, что каждый класс характеризуется определенным набором параметров -эталоном. Диагностическое правило строится в соответствии с введенной некоторым образом мерой близости к эталону. Примерами эвристических методов диагностики заболеваний являются следующие: метод, основанный на максимизации сходства внутри множества, метод "ближайшего соседа" и др. [23]. Классическим примером реализации метода является система MYCIN, спроектированная для помощи врачам в диагностике и назначении курса лечения при инфекционных церебральных заболеваниях. Медицинские знания о заболеваниях представлялись в виде диагностических правил «ЕСЛИ - ТО» в сочетании с коэффициентами неопределенности. Всего в систему было включено около 500 правил [22].
Методы, минимизирующие функцию эмпирического риска, строятся на предположении о том, что вид дискриминантной функции известен, а сам алгоритм диагностики характеризуется заданной некоторым образом функцией риска. В этом случае задача построения диагностического правила заключается в определении неизвестных коэффициентов дискриминантной функции. Существует большое число различных алгоритмов построения ДП, основанных на различных методах оценивания неизвестных коэффициентов дискриминантной функции, и выбора функции эмпирического риска. Совокупность алгоритмов, порождающих на основании предположений и выборки конкретное правило классификации, называют дискриминантным анализом (ДА) [23]. Рассмотрим далее базовые понятия ДА.
В общем виде задача различения (дискриминации) формулируется следующим образом. Пусть результатом наблюдения над объектом является реализация /-мерного случайного вектора Р = (P],P2,...,Pi,...,Pf). Требуется установить правило, согласно которому, по наблюденному значению вектора Pik, k-й объект относится к одной из возможных совокупностей А., у = 1, /. Для построения ДП все выборочное пространство R значений вектора Pt разбивается на области А,, так, что при попадании Pik в R, объект относят к совокупности А[24].
Предполагается, что случайная выборка представляет собой последовательность независимых пар наблюдений вида (Pik,Aj), где / = 1,/ - номер признака, a j = 1, J - номер класса, к которому принадлежит Pik (/-ый признак к -го объекта). Число классов J заранее известно исследователю, известно также, что все Pt принадлежат одному и тому же пространству наблюдений (К). Такую выборку принято называть обучающей. При построении правила классификации используется предположение о свойствах распределения Pi внутри классов: v{PtlЛ )
- неизвестная вероятность того, что Р: будет извлечено из у-го класса.
Обычно в задаче различения переходят от вектора признаков, характеризующих объект, к линейной функции от них, дискриминантной функции - гиперплоскости, наилучшим образом разделяющей совокупности выборочных точек. Наиболее изучен случай, когда известно, что распределение вектора признаков в каждой совокупности нормальное, но нет информации о параметрах этих распределений. Здесь естественно заменить неизвестные параметры распределения в дискриминантной функции их наилучшими оценками. Непараметрические методы дискриминации не требуют знания точного функционального вида распределения и позволяют решать задачи на основе незначительной априорной информации [24].
Процесс классификации сопровождается оценкой ошибки классификации. В качестве решающего правила широко используется линейная дискриминантная функция Фишера (ЛДФ) [24]: наблюдение принадлежит тому классу, для которого значение ЛДФ максимально. Выбор этого метода объясняется рядом преимуществ ЛДФ: ЛДФ устойчива к нарушению ряда допущений ДА [24]; величина стандартизованных коэффициентов ЛДФ позволяет понять и интерпретировать различия между классами; проекции обучающей выборки на ЛДФ могут быть изучены графически; алгоритмы вычисления ЛДФ реализованы во многих известных статистических пакетах программ [25]. Кроме того, для принятия решения о классификации наблюдения оцениваются апостериорные вероятности отнесения его к тому или иному классу. В этом случае ДП формулируется следующим образом: наблюдение принадлежит тому классу, для которого значение апостериорной вероятности максимально.
Алгоритм объективизации экспертных оценок
Результат оперативной диагностики опирается на исходную информацию, большую часть которой получают от экспертов. Экспертные оценки служат эффективным, а иногда и единственным средством решения большого числа неформальных задач в самых различных областях человеческой деятельности [84,85]. Обычно они используются там, где некоторый объект характеризуется только качественными свойствами, которые не пригодны для обработки. Для получения количественной информации об объекте обращаются к методу экспертных оценок. Экспертные методы используют эвристические возможности человека, позволяя на основе знаний, опыта и интуиции специалистов, работающих в данной области, получить оценку исследуемых явлений. Обоснованию и математическим основам экспертных методов посвящено значительное число работ [15-17,52,66,68].
При использовании мнений членами экспертной группы (ЭГ) предполагается, что организованное взаимодействие между специалистами позволит компенсировать смещения оценок отдельных членов группы и что сумма информации, имеющейся в распоряжении группы экспертов, будет больше, чем информация любого члена группы. В общем случае предполагается, что мнение группы экспертов надежнее, чем мнение отдельного индивидуума, т.е. что две группы одинаково компетентных экспертов с большей вероятностью дадут аналогичные ответы на ряд вопросов, чем два индивидуума [17,68,86].
Обработка результатов экспертизы представляет собой трудоемкий процесс. Выполнение операций вычисления оценок и показателей их надежности вручную связано с большими трудовыми затратами даже в случае решения простых задач. Поэтому для построения системы оперативной диагностики ОИЗ следует предусмотреть возможность обработки экспертных оценок после ввода результатов экспертизы [20-22,26,51,68].
Алгоритм формирования списка диагностических признаков членами экспертной группы (ЭГ) можно представить следующим образом.
Пусть в обсуждении участвует N экспертов-медиков и им предложен список из L диагностических признаков. Каждый участник ЭГ имеет четко ранжированные предпочтения по выбору информативных признаков из списка L, которые представлены матрицей N х L, каждый элемент которой Рп1 определяет /-ый уровень предпочтения варианта выбора для п -ого
участника обсуждения. Будем считать, что чем больше значение /, тем ниже ранг предпочтения. Алгоритм проведения обсуждения следующий:
1) Рассматривается наиболее предпочтительная альтернатива выбора диагностических признаков каждого участника ЭГ. Если предпочтения участников группы совпадают, то - выбор сделан, если нет, то 5 = 2, переход к шагу 5.
s) Рассматриваются следующие по порядку альтернативы. Теперь каждый участник выставляет z возможных наиболее предпочтительных признаков. Если есть их пересечение - выбор сделан, если нет, то 5 = 5 + 1. Если s N - шаг 5 повторяется, если s N - выбор не сделан, в обсуждение включаются новые члены ЭГ.
Пример. Пусть имеется 4 эксперта-медика, имеется список признаков
Р = \Р1,...РГ} определенного заболевания.
Шаг 0. Каждый эксперт записывает выбранные признаки из списка по уровню предпочтений, если эксперт считает, что данный признак не важен для диагностики данного заболевания, то вместо этого признака ставит 0.
Из полученных от ЭГ данным формируется матрица Y, элементы каждой строки расположены по убыванию уровня предпочтений, строка показывает предпочтения эксперта, если предпочтений нет - ставится прочерк «_».
Группировка признаков по направлениям осмотра
Последующий анализ структуры медицинской информации показал, что ведущие признаки подклассов исследуемых заболеваний могут быть сгруппированы по направлениям первичного осмотра пациента (объективного осмотра), принятым в клинической практике [8,11]:
1) общее состояние пациента;
2) состояние кожных покровов и слизистых;
3) состояние органов дыхания;
4) состояние сердечно-сосудистой системы;
5) симптомы поражения нервной системы;
6) состояние органов гепатолиенальной системы;
7) состояние гемодинамики;
8) состояние органов пищеварения.
Согласно аксиоме 2, установим связи рассматриваемых информационных элементов (ведущих признаков) с информационными секциями (направлениями осмотра).
Результат группировки ведущих признаков по направлениям осмотра для ряда исследуемых заболеваний приведен в таблице 3.5.
На рисунке 3.5 приведен пример распределения ВП по направлениям осмотра, демонстрирующий диапазон значимости направлений осмотра для подкласса холера (рис.3.5,а), сибирская язва (рис.3.5,6), чума бубонная (рис.3.5,в), M-vivax (рис.3.5,г), ОКИ (рис.3.5,д) и грипп (рис.3.5,е).
Аналогичные распределения строятся для каждого подкласса ОИЗ. Эти гистограммы позволяют оценить диагностическую значимость каждого из восьми направлений осмотра для каждого из подклассов заболеваний. 3.3. Исследование структуры диагностических признаков
Возвращаясь к описанию клинической картины заболевания, для каждого из выбранных признаков, указанных в таблице 3.1, существуют следующие параметры, определяющие характер проявления признака: стадия (время обнаружения), частота проявления, числовое значение, период сохранения и дополнительные описательные (лингвистические) характеристики. Пример описания ведущих признаков M-vivax приведен в таблице 3.6.
Как можно видеть из таблицы 3.6, в медицине принято довольно широкое множество характеристик показателей - от числовых значений до описательных, лингвистических переменных (в Приложении №1 приведены характеристики признаков подклассов исследуемых заболеваний). Каждая характеристика проявления признака, может быть представлена как соответствующее значение признака. Так, например, при проявлении признака "Боль в мышцах", его значение может определяться как боль может быть сильной или умеренной.
Воспользуемся аппаратом алгебры логики, т.е. опишем каждый элемент из множества значений {JE"} признака, зависимостями вида
Ej-=(Ej-,Ef,...,EF). Каждая такая зависимость Е является «булевой» функцией, у которой число возможных состояний каждой ее независимой переменной равно двум, т.е. ее аргументы определены на множестве {0,1}. Таким образом, имеем следующую связь лингвистических переменных с цифровыми значениями (рис. 3.6).
Реализация алгоритма оперативной диагностики
На основании построенного диагностического алгоритма была разработана система оперативной диагностики, позволяющая выявлять подклассы ОИЗ.
Система разработана с помощью современных технологий, обеспечивающих взаимодействие подсистем моделирования, визуализации и управления. Критерием выбора среды разработки, являлась необходимость обеспечения возможности создания баз знаний для разных областей медицинской диагностики, их просмотра и редактирования, и построения на их основе специализированных диагностических систем [95,96]. Выбранные технологии способствуют совершенствованию качеств системы, предлагая прекрасные графические средства, поддержку анимации и обеспечение сложных интерактивных свойств [97].
Разработанная система имеет дружественный пользовательский интерфейс, который удобен и понятен обычному пользователю, не обладающему специальными навыками. На рисунке 4.4 приведены фрагменты интерфейсов системы.
При разработке экспертной диагностической системы необходимым элементом являются структурные спецификации опасных инфекционных заболеваний, с которыми сравниваются данные карты обследования пациента. Поскольку число переменных, характеризующих состояние пациента достаточно велико (например, при описании клинической картины геморрагической лихорадки Ласса (ГЛЛ) используются около 80 признаков), при разработке структурных спецификаций заболеваний возникала необходимость рассмотрения различных композиций признаков и проведение имитационных испытаний с целью уточнения состава и параметров структурных спецификаций до тех пор, пока не было достигнуто качественное соответствие реальным клиническим описаниям ОИЗ.
Важным свойством для разработанной экспертной системы является возможность установления порога уверенности. Машина вывода может работать таким образом, что будет рассматривать только те гипотезы, которые имеют фактор достоверности выше уровня установленного пользователем. Пользователь может ускорить процесс вывода, установив соответствующий порог достоверности и тем самым дать указание системе рассматривать только те диагностические гипотезы достоверность которых выше пороговой.
Так же, следует обратить внимание на ситуацию, когда пользователь в качестве ответа на вопрос выбирает «возможно» [98]. Основной принцип, который реализуется в оболочке, состоит в том, что все проблемные знания описываются экспертом в объектно-ориентированном стиле, а продукционное представление знаний, используемое на более низком уровне, генерируются автоматически и скрыто от эксперта [99].
Эти идеи и легли в основу технологических решений при
конструировании экспертной системы оперативной диагностики. Входными данными системы являются:
ответы пользователя на вопросы;
таблица ведущих признаков с описаниями;
таблица заболеваний;
таблица соответствий между заболеваниями и признаками;
таблица значений признаков заболеваний;
данные о пациентах.
Иначе говоря, входные данные можно разбить на два больших блока:
1. Данные, поступающие из пользовательского интерфейса. Сюда также входит и база данных о пациентах (их «больничные карточки»);
2. Содержимое базы знаний, заполненной экспертами.