Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Залавский Дмитрий Станиславович

Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда
<
Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Залавский Дмитрий Станиславович. Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда : Дис. ... канд. техн. наук : 05.13.01 : Воронеж, 2003 159 c. РГБ ОД, 61:04-5/308-4

Содержание к диссертации

Введение

1 Системный анализ современного состояния проблемы дифференциальной диагностики осложненных форм инфаркта миокарда 14

1.1 Подходы к дифференциальной диагностике и прогнозированию осложненных форм инфаркта миокарда 15

1.2 Анализ методов и концепций распознавания образов в медицинской диагностике 26

1.3 Цель и задачи исследования 42

2 Алгоритмизация формирования интервальных и бинарных структур 43

2.1 Формирование обучающей выборки для моделирования осложненных форм инфаркта миокарда 43

2.2 Разработка алгоритма формирования интервальных и бинарных структур 51

2.3 Анализ взаимосвязи медико-биологических признаков при помощи построения корреляционного графа 66

Выводы второй главы 80

3 Моделирование решающих правил для прогнозирования диагноза осложненной формы инфаркта миокарда 81

3.1 Разработка модифицированного многошагового байесовского алгоритма как основной стратегии распознавания 81

3.2 Формирование подмножества информационно-ценных признаков для модифицированного многошагового байесовского алгоритма... 96

3.3 Разработка методов построения показателей эффективности применения стратегии распознавания 99

Выводы третей главы 107

4 Анализ эффективности комплекса методов и алгоритмов интеллектуальной поддержки принятия решений при дифференциальной диагностике осложненных форм инфаркта миокарда 108

4.1 Анализ показателей эффективности дифференциальной диагностики осложненных форм инфаркта миокарда 108

4.2 База знаний и экспертный модуль системы дифференциальной диагностики 121

4.3 Структура программно-алгоритмического обеспечения информационной системы диагностики 126

Выводы четвертой главы 134

Заключение 135

Список литературы 137

Приложения 153

Введение к работе

Актуальность темы. В настоящее время одной из наиболее острых про блем ургентной терапии является инфаркт миокарда (ИМ). В России ИМ в структуре госпитализированных больных составляет около 7 % [143]. В структуре смертности от ишемической болезни сердца ИМ занимает первое І место и составляет 0,9 % у лиц 30-39-летнего возраста, 10,5 % в возрасте 40 49 лет, 29,5 % - 50-59 лет и 41,1 % - у лиц старше 60 лет [31].

Тяжесть ИМ, частота смертельных исходов, длительность госпитального лечения и реабилитации, последующая инвалидизации пациентов, а следовательно, и экономические затраты всецело определяются осложненными

Н формами этого заболевания [103]. Среди них наиболее опасны и в то же время наиболее распространены: кардиогенный шок, аритмический синдром, фибрилляция желудочков, острая левожелудочковая недостаточность - отек легких, разрыв миокарда [31, 165]. Актуальной сохраняется проблема развития поздних осложнений - эпистенокардитического перикардита и синдрома

Дреслера, а также рецидивирующего течения ИМ [34,131].

Современная медицина имеет ограниченные возможности ранней диаг ностики патологических заболеваний, не обладает достаточными сведениями о патогенезе атеросклероза, гипертонии и нарушения сердечного ритма [9, 116], о механизмах гомеостаза жизненно-важных патологических процессов [116].

1 Современная наука только приближается к пониманию про странственно-временной организации физиологических процессов, и цен „ нейшая информация, заключенная в реограмме, кардиограмме, мониторинге артериального давления и пульса, пока не может быть использована для осознания фундаментальных механизмов регуляции процессов жизнедея тельности [34]. В связи с этим возникла потребность отталкиваться не от существующих медико-физиологических знаний, которые трудно формализовать даже тогда, когда они есть, и принципиально невозможно, когда их нет, а от эмпирических данных - данных историй болезни и протоколов экспериментов [10, 40, 104].

Существующие информационные методы диагностики осложненных форм ИМ оказываются в большинстве своем малоэффективными [108]. Многие исследователи в данной области пренебрегают тем, что распространенные методы многомерной статистики имеют ограниченное применение в медицине [13, 151], методологически неграмотно представлять результаты исследований в форме "среднее арифметическое ± ошибка средней" [96], из множества клинических, лабораторных и инструментальных признаков необходимо извлекать минимальные подмножества, важные для понимания патогенеза клинической ситуации и достаточные для решения конкретной диагностической задачи [124, 125].

Проблема диссертационного исследования заключается в высокой летальности ИМ [103, 131, 165] и низкой достоверности существующих моделей и алгоритмов ранней дифференциальной диагностики осложнений данного заболевания [31, 34].

Таким образом, актуальность темы диссертационной работы определяется необходимостью создания таких методов анализа эмпирических медицинских данных, которые бы с одной стороны не противоречили методологическому аспекту области применения, а с другой стороны обеспечивали более высокую точность дифференциальной диагностики осложненных форм ИМ по сравнению с другими известными методами.

Диссертационная работа выполнена в соответствии с межвузовской комплексной научно-технической программой 12.11 "Перспективные информационные технологии в высшей школе" в рамках одного из основных направлений Воронежского государственного технического университета "Биомедкибернетика, компьютеризация в медицине".

Цель и задачи исследования. Целью исследования является разработка моделей, алгоритмов и информационного комплекса, обеспечивающих повышение эффективности ранней дифференциальной диагностики осложненных форм ИМ с помощью построения нечетких вероятностных процедур анализа эмпирических данных, а также создание методологии принятия многоальтернативного диагностического решения для обеспечения высокой точности дифференциальной диагностики осложнений.

Для достижения поставленной цели необходимо решить следующие задачи:

проанализировать пути повышения эффективности прогностических оценок диагностики осложненных форм ИМ с помощью методов биометрической статистики, имитационного моделирования и непараметрических методов распознавания образов;

разработать алгоритм формирования обучающей выборки для получения достоверных объектов на основе диагонализации матрицы связи и выделения сильно связанных подмножеств;

разработать методику построения интервальных и бинарных (матричных) структур для дальнейшей дифференциальной диагностики, обеспечивающую максимальное извлечение медико-физиологических знаний;

смоделировать решающие правила для информационной поддержки клинических решений на основе системного подхода и методологии распознавания образов,

сформировать оценки эффективности применения решающих правил на основе метрических и информационных показателей;

внедрить информационный комплекс по дифференциальной диагностики осложненных форм ИМ в клиническую практику на региональном уровне.

Методы исследования. В работе использованы методы системного анализа, распознавания образов, экспертного оценивания, имитационного моделирования, основные положения теории вероятности, математической статистики и теории управления биосистемами.

Научная новизна. В диссертации получены следующие основные результаты, характеризующиеся научной новизной:

алгоритм формирования обучающей выборки на основе процесса диагонализации матрицы связи, позволяющий отказаться от субъективного мнения эксперта о пороговой степени достоверности объектов;

способ введения вероятностной меры, формирующий интервальные и бинарные структуры, отличающийся возможностью эффективного анализа патофизиологически значимых интервалов или прямоугольников проявления жизнедеятельности;

интервальные и бинарные структуры в совокупности со стратегией распознавания образов, представляющие собой объект базы знаний интеллектуальных систем, не требующие при своем формировании экспертных медицинских знаний высокого уровня;

модифицированный многошаговый байесовский алгоритм, позволяющий освободиться от влияния априорных вероятностей, обеспечивающий эффективную интеграцию многоальтернативного байесовского подхода и упорядочение признаков в соответствии с их информационной ценностью;

методология принятия много альтернативного диагностического решения, обеспечивающая высокую точность дифференциальной диагностики осложнений.

Практическая ценность и реализация результатов работы.

В результате проведенного системного анализа инновационных технологий дифференциальной диагностики осложненных форм ИМ обоснована концепция разработки интегрированной системы прогнозирования вероятностной меры диагноза пациента.

Экспериментально доказано, что десяти клинико-лабораторных признаков достаточно для дифференциальной диагностики осложненных форм ИМ: лактатдегидрогеназа-2, протромбиновый индекс, креатинкиназа, каолин - кефалиновое время свертывания АЧТВ, аспартатаминотрансфераза, Т-супрессоры, давление наполнения левого желудочка, частота сердечных сокращений, систолическое артериальное давление при поступлении, Т-лимфоциты.

Создана база знаний в экспертном модуле системы в рамках конкретной предметной области - "Осложненные формы ИМ". В программном комплексе предусмотрен переход в другую предметную область.

Проведенные исследования убедительно показали, что алгоритмическое формирование базы знаний в процессе обучения и специальная организация экспертной системы позволяют принимать дифференциально-диагностические решения, превышающие возможности современного клинического опыта.

Результаты диссертации внедрены в практику кардиологического отделения Воронежской областной клинической больницы в виде программно-алгоритмического обеспечения дифференциальной диагностики осложненных форм ИМ.

Теоретические и практические результаты работы, реализованные автором в информационном комплексе дифференциальной диагностики осложненных форм ИМ, внедрены в учебный процесс на кафедре "Системный анализ и управление в медицинских системах" для студентов специальности 190500 "Биотехнические и медицинские аппараты и системы".

Апробация работы. Результаты диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах: Всероссийской конференции "Интеллектуализация управления в социальных и экономических системах" (Воронеж, 2002), Региональной научно-технической конференции "Компьютерные технологии в промышленности и связи" (Воронеж, 2002), Всероссийской конференции "Интеллектуальные информационные системы" (Воронеж, 2002).

Публикации. Основное содержание диссертационной работы изложено в 17 печатных работах, в том числе учебном пособии. В работах, опубликованных в соавторстве и приведенных в конце автореферата, лично соискателю принадлежат: в [1] применение биомедицинских материалов (4 глава учебного пособия), в [12] анализ применения технологии концептуального моделирования COMOD в медико-биологических системах, в [13] введение понятия индекса структурной организации, системный анализ асимметрии связей признаков.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, изложенных на 152 страницах машинописного текста, списка литературы (182 наименований), приложений, содержит 21 рисунок, 20 таблиц.

Во введении обосновывается актуальность работы, формируются цель и задачи исследования, основные научные результаты, выносимые на защиту, дается краткая характеристика работы.

Первая глава посвящена системному анализу современного состояния проблемы дифференциальной диагностики осложненных форм ИМ.

Проанализирован ряд работ по современным подходам к дифференциальной диагностике и прогнозированию осложненных форм ИМ с целью выделения адекватных и актуальных осложнений, присущим инфаркту миокарда.

На основании теоретических рассуждений, информационных методов и концепций распознавания образов в медицинской диагностике рассмотрены различные системы классификаций: детерминированные, вероятностные, ло-гические и структурные.

4 Большее внимание уделяется рассмотрению вероятностных структур 

распознавания образов - модели Неймана-Пирсона, Вальда, Байеса, Фишера, прецедентов. Проведен системный анализ в виде сравнительной характеристики преимуществ и недостатков рассмотренных моделей. Исходя из требований предъявляемым к этим моделям, сформулированы цель и задачи исследования.

Во второй главе рассматривается одна из центральных проблем медицинской информатики - представление количественных наблюдений в форме частот. Ее решение позволяет не только адекватно сравнивать вариабельность выборок, извлеченных из разных распределений, но и эффективно извлекать и представлять знания в экспертных системах.

Предложен алгоритм формирования достоверной обучающей выборки для последующего моделирования осложненных форм ИМ в условиях неопределенности на основе построения матрицы связи, ее последующей диаго нализации и выделения сильно связанных подмножеств.

Предложен алгоритм формирования интервальных и бинарных (матричных) структур для оптимального разбиения интервала изменения значения каждого признака на градации.

Поставлена оптимизационная нелинейная задача в функционалах для нахождения оптимального разбиения медико-физиологических данных, для решения которой предложен эвристический метод поиска максимума суммарного функционала Кульбака.

4 Предложенный алгоритм предусматривает: 1) поиск глобального мак симума, обеспечиваемый просмотром всех ключевых точек заданного интервала, 2) конечность алгоритма за счет мониторинга увеличения функционала

Кульбака. Приводится доказательство, что интервальные и бинарные структуры эффективные инструменты формализации и представления знаний в экспертных системах, алгоритмически формирующих базу знаний, которые позволяют унифицировать разнообразную клинико-лабораторную информацию и легко модифицируются при увеличении эмпирического материала.

Приведены новые возможности извлечения содержательной информации из корреляционной матрицы, с помощью анализа корреляционного графа, который позволяет выявлять более длинные цепочки отношений между признаками, а не просто их парные связи.

В третьей главе рассматривается вопрос поиска оптимальной методологии для дифференциальной диагностики осложненных форм ИМ.

На основе системного анализа приводится доказательство не состоя -4 тельности моделей Неймана-Пирсона, Вальда, Байеса, Фишера и метода пре цедентов для высокоточного прогноза диагноза пациента.

Предложен алгоритм моделирования решающих правил, использующий стратегию Байеса, но освобожденный от влияния априорных вероятностей. В этом алгоритме эффективно интегрированы полезный элемент байе совского подхода - его многоальтернативность - и продуктивная идея неод-нородного последовательного анализа - упорядочение признаков в соответствии с их информационной ценностью.

С помощью анализа матрицы соответствия, предложена методика формирования подмножества информационно-ценных признаков для модифицированного многошагового байесовского алгоритма, которая дает право на исключение большего количества слабоинформативных признаков. В конечном счете, эта методика дает возможность снизить время определения дифферен циального диагноза, что весьма актуально при осложненных формах ИМ, и снижает расходы на весьма дорогие клинико-лабораторные анализы. Обоснован методологический подход к получению оценки эффективности алгоритмов автоматической классификации данных. На основе матрицы соответствия рассчитываются метрические и информационные по казатели качества алгоритмов.

Информационные показатели эффективности алгоритма распознавания предложено формировать на основе энтропийных функционалов.

Приводится доказательство того, что информационный показатель эффективности алгоритмов распознавания, построенный на основе энтропии Шеннона, обладает лучшей чувствительностью к свойству различения классов объектов по сравнению с метрическими показателями.

В четвертой главе приводится анализ эффективности комплекса мето дов и алгоритмов интеллектуальной поддержки принятия решений при диф - ференциальной диагностике осложненных форм ИМ.

Рассмотрена в качестве эмпирического материала база данных кардиологического отделения Санкт-Петербургского государственного медицинского университета им. И.П. Павлова, сформированная на основании архивных историй болезни 1985 - 1992 г.г.

На основе алгоритма формирования обучающей выборки произведена диагонализация матрицы связи и проведена фильтрация данных первоначальной выборки - 39 из 774 больных были исключены из дальнейшего рассмотрения в виду неадекватности показателей их признаков.

Сформированы интервальные и бинарные структуры для дифференциальной диагностики осложненных форм ИМ.

Найдено подмножество информационно-ценных признаков для обеспечения высокоточного прогноза дифференциального диагноза: лактатдегидро геназа-2, протромбиновый индекс, креатинкиназа, каолин - кефалиновое время свертывания АЧТВ, аспартатаминотрансфераза, Т-супрессоры, давленияє наполнения левого желудочка, частота сердечных сокращений, систолическое артериальное давление при поступлении, Т-лимфоциты.

Подробно рассмотрены примеры определения вероятностной меры каждого из семи дифференциальных диагнозов, по предложенным алгоритмам.

Обоснована трехуровневая система представления знаний в разработанном комплексе. Самый высокий уровень - база целей, следующий уровень

- база задач; на самом низком уровне хранятся решающие правила, разработанные в процессе взаимодействия "человек - ЭВМ" для решения интересую щих пользователя задач - интервальные и бинарные (матричные) структуры вместе со стратегией распознавания. Они и являются основными объектами базы знаний информационной системы.

Создана база знаний в экспертном модуле системы в рамках конкрет I ной предметной области — "Осложненные формы ИМ". В программном комплексе предусмотрен переход из одной предметной области в другую.

Проведенные исследования убедительно показали, что алгоритмическое формирование базы знаний в процессе обучения и специальная организация экспертной системы позволяют принимать дифференциальною диагностические, прогностические и другие решения, превышающие возможности современного клинического опыта.

Разработан программный комплекс, состоящий из шести модулей: модуль формирования достоверной выборки; модуль формирования интервальных и бинарных структур; модуль анализа взаимосвязи медико-биологических признаков; модуль формирования информационно-ценных признаков; модуль прогнозирования осложненной формы ИМ; модуль анализа эффективности решающих правил.

В заключении приводятся основные результаты работы. 

Подходы к дифференциальной диагностике и прогнозированию осложненных форм инфаркта миокарда

В настоящее время одной из наиболее острых проблем ургентной тера пии является инфаркт миокарда. "Эпидемия" острой коронарной патологии в последнее время проявляется в растущих показателях заболеваемости насе ления. По данным многих отечественных авторов (Н. Н. Богданов [31], В. А. Нестеров [33], В. К. Овчаров [134], А. М. Ловриненко [97], Ю. П. Лисицын [143] и др.), заболеваемость острыми формами ИБС занимает не 6 - 8-е место в структуре заболеваемости, как это было 15-20 лет назад, а 4 - 5-е. Подобные сведения приводят ВОЗ и зарубежные исследователи [154]. В России инфаркт миокарда в структуре госпитализированных больных составляет около 7 % [34,143]. В структуре смертности от ИБС инфаркт мио карда занимает первое место и составляет 0,9 % у лиц 30 - 39-летнего возрас та, 10,5% в возрасте 40 - 49 лет, 29,5 % - 50 - 59 лет и 41,1 % - у лиц старше 60 лет [37, 51,119,135]. Приведенные расчеты соответствуют цифрам, полученным на основе аналогичных статистических методов в других странах. По данным М. Kornitzer [165], 29 % лиц в возрасте старше 51 года имели очаговые пораже ния миокарда. По сведениям W. К. Kannol и Т. Gordon, распространенность острых коронарных некрозов в возрасте 60 лет и выше составляет 40 - 50 % [154]. На большую степень распространенности Рубцовых изменений и оча говых дистрофий миокарда указывают результаты массового обследования, , проведенного в США. Хотя методика обследования отличалась от той, кото рая применялась в нашей стране (не включала комплексные осмотры), однако было зарегистрировано 3,8 млн. больных [52]. Рассматривая тенденции забо 16 леваемости острой коронарной патологией и смертности от нее, следует от-метить значительное омолаживание этих показателей [88,131]. , Случаи инфаркта миокарда все чаще наблюдаются в более молодом возрасте; увеличились и показатели смертности лиц молодого, особенно среднего, возраста [137]. Так, возрастные показатели смертности от острого инфаркта миокарда среди мужчин 35 - 44 лет в расчете на 100 тыс. населения в 1981 г. в Канаде составили 83,2, в Японии - 71,4, в Финляндии - 171,6, в ФРГ - 69,6, в Австралии - 99,3, в США - 131,6, в Великобритании - 95,4, в Чехословакии - 105,8, в Венгрии - 11,5, в Польше - 99,3, в Болгарии - 69,6 [37, 146]. В настоящее время эти показатели увеличились примерно в 1,5 раза [52, 103,129]. Увеличение заболеваемости острой коронарной патологией и смертно ста от инфаркта миокарда в молодом и среднем возрасте установлено рядом отечественных исследователей [12, 107, 135]. По данным Е. И. Чазова [31], значительно увеличилась смертность в возрастной группе 30 - 45 лет. В. В. Гафаровым установлено, что показатели смертности контингентов больных увеличились особенно интенсивно среди мужчин моложе 55 лет, женщин -моложе 40 лет [33]. Смертность повьппается уже с 20-летнего возраста, ее резкий подъем отмечается после 35 лет (ранее назывался возраст 45-55 лет), каждое последующее пятилетие характеризуется увеличением уровня смертности в 1,5 - 2 раза [51, 137]. Сводку современных данных об уменьшении возраста больных инфарктом миокарда содержит монография Л. Т. Малой и В. И. Волкова [88]. Авторы сообщают, что частота инфаркта миокарда у лиц в возрасте до 40 лет отмечалась в 35 % случаев этого заболевания, причем 82 % „ составляли крупноочаговые поражения миокарда, из них у 79 % наблюдались осложненные формы. Следует отметить существенные экономические потери, вызванные острыми сердечно-сосудистыми заболеваниями. По далеко не полным дан 17 ным [131] общий ущерб в США за год в результате потери трудоспособности составляет 52 млн. человеко-дней и более 40 млрд. долларов, что соответст , вует 6 % национального бюджета. Вследствие преждевременной смерти от осложненного инфаркта миокарда в США трудовые потери в год составляют 2 млн. лет [146]. По расчетам Ассоциации кардиологов США потери, связан ные с острой коронарной патологией, за один лишь 1980 г. составили 30 млрд. долларов [34]. Очаговые некрозы миокарда занимают одно из первых мест среди причин инвалидности населения. По данным С. В. Курашова [103], постинфарктный кардиосклероз являлся первичной причиной инвалидности в 21 % первичного обследования рабочих и служащих. Столь же высокий удельный вес острой коронарной патологии среди причин инвалидности отмечают и иссле - дователи других стран. Например, 43 % инвалидности у мужчин Германии были вызваны этой патологией [159]. Смертность от острого инфаркта миокарда существенным образом сказывается на комплексном показателе - средней продолжительности жизни. По расчетам М. С. Бедного, Е. Г. Процек и др. острая коронарная патология сокращает этот показатель на несколько лет (по расчетам В. А. Нестерова - на 7,7 лет, для мужчин - на 6,8, для женщин 4 на 9 лет, по данным Е.Г. Процек, для городского населения - на 5,1 года, для сельского - на 4,7 лет) [119]. Тяжесть инфаркта миокарда, частота смертельных исходов, дли тельность госпитального лечения и реабилитации, последующая инвалидиза ция пациентов, а следовательно, и экономические затраты всецело определя ются осложненными формами этого заболевания [43, 103]. Среди них наибо м лее опасны и в то же время наиболее распространены: кардиогенный шок, аритмический синдром, фибрилляция желудочков, острая левожелудочковая недостаточность - отек легких, разрыв миокарда [31, 165]. Актуальной сохраняется проблема развития поздних осложнений - эпистенокардитического пе 18 рикардита и синдрома Дреслера, а также рецидивирующего течения инфарк 4 та миокарда [34,131].

Формирование обучающей выборки для моделирования осложненных форм инфаркта миокарда

Для эффективного моделирования биомедицинских систем и принятия оптимального решения необходимым фактором является наличие достоверных эмпирических данных [141]. Основной причиной неадекватности медицинских данных являются ошибки, возникающие при регистрации информации, искажения, случайные помехи. Для обеспечения достоверного моделирования решающих правил необходимо эмпирические данные, представленные в виде начальной выборки отфильтровать [71,141].

Рассмотрим некоторое множество элементов X=(xi, ..., xN), характеризующее клиническое состояние N пациентов. Для каждой пары пациентов зададим число ау, которое будем трактовать как величину "связи" или степень "близости" между этими объектами. Таким образом, можно считать, что рассматриваемое множество объектов X характеризуется матрицей которую будем называть матрицей связи. Именно матрица связи и есть тот эмпирический материал, задача обработки которого будет рассмотрена в данной главе [90]. Целью обработки матрицы связи является разбиение всего множества элементов на такие непересекающиеся подмножества Gi,..., GL (ИХ называют также "блоками" или "агрегатами"), что величины связи ау между элементами, попавшими в одно подмножество, по возможности, большие, а между элементами, попавшими в разные подмножества, - маленькие. Таким образом, те подмножества, которые будут иметь малую размерность (до трех объектов [53]), будут неадекватными подмножествами, исключение которых даст почву для эффективного моделирования решающих правил.

Такую задачу назовем задачей агрегирования исходного множества элементов, или задачей разбиения этого множества на сильно связанные блоки. Если различным образом нумеровать объекты Xi,..., xN, это будет соответствовать перестановкам строк и столбцов матрицы связи А. Рассмотрим задачу нахождения такой нумерации элементов (то есть такого расположения строк и соответствующих столбцов матрицы А) и выделения таких непересекающихся квадратных подматриц вдоль главной диагонали преобразованной подобным образом матрицы связи, чтобы компоненты - числа ц — каждой выделенной подматрицы были по возможности большими, а числа ау, расположенные вне этих матриц, - маленькими. Будем также требовать, чтобы выделенные квадратные подматрицы полностью покрывали главную диагональ матрицы связи. Условно выделенные подматрицы с большими компонентами можно изобразить в виде квадратов разного размера (рис.2.1), расположенных вдоль главной диагонали матрицы А. Тогда подмножество элементов, которым соответствуют строки и столбцы преобразованной матрицы связи А, образующие одну из выделенных подматриц, - это и есть один из сильно связанных блоков. Имея в виду такую интерпретацию задачи агрегирования, эту задачу целесообразно назвать задачей диагонализации матрицы связи [23].

Строки этой матрицы можно представить векторами, характеризующие множество изучаемых объектов. Геометрически два таких вектора в пространстве параметров тем ближе, чем меньше различаются между собой значения каждого из параметров для обоих объектов. Это обстоятельство дает основание предположить, что чем ближе в пространстве параметров расположены два вектора, тем более "похожи", тем менее различимы между собой соответствующие объекты вообще по многим своим свойствам, а не только по тем, которые нашли отражение в матрице данных. Поэтому, если среди множества всех векторов-объектов удается выделить геометрически достаточно изолированные "облака" близких между собой векторов, то можно думать, что тем самым выделены классы объектов, обладающих близкими внутренними свойствами, а одиночные объекты или облака малой размерности представляют собой неадекватные недостоверные объекты.

Введем некоторую меру близости двух объектов. В качестве такой меры могут быть использованы убывающие функции евклидова расстояния между соответствующими векторами-объектами. Целесообразно ввести потенциальную функцию. Экстремизируемый функционал, о котором идет речь, должен зависеть от того, как измеряется "близость" между объектами. Меру близости между двумя объектами (двумя точками пространства параметров) можно задать некоторой функцией F(x, у) двух векторных переменных. Естественно считать, что такая функция симметрична (2.2) F(x, y)=F(y, x), (2.2) так, что объект х в той же мере "близок" к объекту у, в какой объект у — к объекту х. Целесообразно в качестве функции F(x, у) взять функцию, убывающую с евклидовым расстоянием между точками х и у в пространстве параметров [8] (2.3): Так как потенциальная функция определена, то матрица связи между объектами построена. Такую задачу целесообразно назвать задачей автоматической классификации объектов [53]. Как видно это задача относится к классу задач диагонализации матрицы связи. Вместе с тем, у этой задачи есть две существенные особенности, которые привели к разработке специальных методов ее решения. Во-первых, в отличие от общей задачи диагонализации матрицы связи, задача автоматической классификации может быть понята как геометриче-» екая задача о выделении в некотором пространстве "плотных" скоплений то чек. Такой геометрический подход позволяет разработать специальный метод решения задачи автоматической классификации. Во-вторых, очень часто число N объектов в матрице данных велико. В таких условиях нет возможности хранить в оперативной памяти машины матрицу связи целиком или хотя бы ее значительную часть. Тем самым для решения задачи автоматической классификации часто оказываются непригодными алгоритмы, основанные на одновременном сопоставлении взаимного расположения значительной части объектов. Это обстоятельство побудило разработать рекуррентный алгоритм, в котором на каждом шаге вычисления проводятся только с одним очередным объектом (или с одной строкой соот ветствующей матрицы связи).

Разработка модифицированного многошагового байесовского алгоритма как основной стратегии распознавания

Дальше пользователь может попасть в любой отдел экспертного модуля, выбранный в соответствии с целями экспертизы.

Клавиша "Алгоритмы" главного меню предоставляет обзор всех дифференциально-диагностических задач, хранящихся в базе знаний, предназначенных для достижения выбранной цели.

Трехуровневая структура базы знаний - цели, задачи, решающие правила - облегчает системе быстрый просмотр решающих правил, а пользователю - быстрое получение ответов на интересующие его вопросы. В системе нет механизма, логически обосновывающего принятие решения. Пользователь получает лишь сведения о том, на основании каких признаков был поставлен диагноз каждым из алгоритмов и какова надеж 126 ность этого решения, причем эти сведения становятся доступными вместе с принятым решением. 4 При разработке решающих правил в базе знаний сохраняются только достаточно надежные алгоритмы. Вероятности их ошибок известны пользо , вателю, поэтому ему известны возможности существующей базы знаний для решения конкретных задач. База знаний в экспертном модуле системы создана в рамках конкретной предметной области - "Осложненные формы инфаркта миокарда". В реальной клинической практике часто возникает необходимость перехода из одной области медицины в другую. В программном комплексе предусмотрены такие переходы. Они достигаются с помощью функции "Смена предметной области" - одной из служебных функций, доступ к которым осуществля . ется при актуализации строчки "Служебные функции" главного меню (рис.4.8). Проведенные исследования убедительно показали, что алгоритмическое формирование базы знаний в процессе обучения (приобретение знаний из данных истории болезни и протоколов эксперимента) и специаль-ная организация экспертной системы (компьютерный консилиум) позволяют » принимать дифференциально-диагностические, прогностические и другие решения, превышающие возможности современного клинического опыта. 4.3 Структура программно-алгоритмического обеспечения информационной системы диагностики f Разработанное в рамках диссертационного исследования программное обеспечение представляет собой комплекс взаимосвязанных программных модулей, состоящий из шести программ: 1) модуль формирования достоверной выборки; 2) модуль формирования интервальных и бинарных структур; 127 3) модуль анализа взаимосвязи медико-биологических признаков; 4) модуль формирования информационно-ценных признаков; 5) модуль прогнозирования осложненной формы инфаркта миокарда; 6) модуль анализа эффективности решающих правил. В основе разработанного программного комплекса - идеология системного подхода, концепция различия и вероятностные методы распознавания образов. Замысел информационной системы - в едином программном комплексе практически осуществить автоматизированное извлечение нового медико-биологического знания из эмпирических данных и предоставить клиницисту возможность использовать полученное знание для решения интересующих его задач. При осуществлении этого замысла кроме преодоления принципиальных трудностей была поставлена задача: спроектировать исследовательскую (интеллектуальную) систему, чтобы управление ею было доступно врачу и не требовало привлечения специалистов по медицинской информатике. Программный комплекс включает в себя: конструктор предметных областей (генератор оболочки компьютерной истории болезни); информационную систему, предоставляющую возможности удобного и быстрого ввода клинической, лабораторной и инструментальной информации; исследовательский модуль - математический инструментарий адекватного системного анализа данных историй болезни в диалоге с исследователем; механизм формирования базы знаний на основании результатов работы исследовательского модуля; экспертный модуль, обеспечивающий общение с базой знаний и принятие экспертных решений.

Анализ показателей эффективности дифференциальной диагностики осложненных форм инфаркта миокарда

При разработке решающих правил в базе знаний сохраняются только достаточно надежные алгоритмы. Вероятности их ошибок известны пользо , вателю, поэтому ему известны возможности существующей базы знаний для решения конкретных задач. База знаний в экспертном модуле системы создана в рамках конкретной предметной области - "Осложненные формы инфаркта миокарда". В реальной клинической практике часто возникает необходимость перехода из одной области медицины в другую. В программном комплексе предусмотрены такие переходы. Они достигаются с помощью функции "Смена предметной области" - одной из служебных функций, доступ к которым осуществля . ется при актуализации строчки "Служебные функции" главного меню (рис.4.8). Проведенные исследования убедительно показали, что алгоритмическое формирование базы знаний в процессе обучения (приобретение знаний из данных истории болезни и протоколов эксперимента) и специаль-ная организация экспертной системы (компьютерный консилиум) позволяют » принимать дифференциально-диагностические, прогностические и другие решения, превышающие возможности современного клинического опыта. 4.3 Структура программно-алгоритмического обеспечения информационной системы диагностики f Разработанное в рамках диссертационного исследования программное обеспечение представляет собой комплекс взаимосвязанных программных модулей, состоящий из шести программ: 1) модуль формирования достоверной выборки; 2) модуль формирования интервальных и бинарных структур; 3) модуль анализа взаимосвязи медико-биологических признаков; 4) модуль формирования информационно-ценных признаков; 5) модуль прогнозирования осложненной формы инфаркта миокарда; 6) модуль анализа эффективности решающих правил. В основе разработанного программного комплекса - идеология системного подхода, концепция различия и вероятностные методы распознавания образов. Замысел информационной системы - в едином программном комплексе практически осуществить автоматизированное извлечение нового медико-биологического знания из эмпирических данных и предоставить клиницисту возможность использовать полученное знание для решения интересующих его задач. При осуществлении этого замысла кроме преодоления принципиальных трудностей была поставлена задача: спроектировать исследовательскую (интеллектуальную) систему, чтобы управление ею было доступно врачу и не требовало привлечения специалистов по медицинской информатике. Программный комплекс включает в себя: конструктор предметных областей (генератор оболочки компьютерной истории болезни); информационную систему, предоставляющую возможности удобного и быстрого ввода клинической, лабораторной и инструментальной информации; исследовательский модуль - математический инструментарий адекватного системного анализа данных историй болезни в диалоге с исследователем; механизм формирования базы знаний на основании результатов работы исследовательского модуля; экспертный модуль, обеспечивающий общение с базой знаний и принятие экспертных решений. Соотношения между клиническим образом болезни, эмпирическими данными, математическим аппаратом анализа данных, пользователем и информационным образом болезни схематически представлены на рис.4.9. Разработка решающих правил идеологически принципиально отличается от экспертных систем, в которых роль базы данных сводится лишь к поддержке базы знаний, сформированной на основании правил "если - то". Архитектура программного комплекса изображена на рис.4.10. Рассмотрим назначение каждого из модулей, входящих в программный комплекс.

Модуль формирования достоверных данных необходим для того, чтобы отфильтровать недостоверные данные в первоначальной выборке, возникающие в связи с искажением результатов вследствие дефектов в методике определения показателей, с аппаратными погрешностями, с Модуль формирования интервальных и бинарных структур необходим для оптимального разбиения шкалы на градации признака таким образом, чтобы обеспечить функционалу Кульбака максимальное значение.

Модуль анализа взаимосвязи медико-биологических признаков необходим для извлечения содержательной информации из корреляционной матрицы при помощи анализа корреляционного графа, который позволяет выявлять более длинные цепочки отношений между признаками, а не просто их парные связи.

Похожие диссертации на Разработка решающих правил для дифференциальной диагностики осложненных форм инфаркта миокарда