Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Эмпирическое восстановление математических моделей медицинской диагностики Газарян, Варвара Арамовна

Эмпирическое восстановление математических моделей медицинской диагностики
<
Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики Эмпирическое восстановление математических моделей медицинской диагностики
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Газарян, Варвара Арамовна. Эмпирическое восстановление математических моделей медицинской диагностики : диссертация ... кандидата физико-математических наук : 05.13.18 / Газарян Варвара Арамовна; [Место защиты: Моск. гос. техн. ун-т им. Н.Э. Баумана].- Москва, 2013.- 150 с.: ил. РГБ ОД, 61 13-1/602

Содержание к диссертации

Введение

Глава 1. Математические методы медицинской диагностики . 15

1.1. Необходимость создания нового комплексного метода компьютерной оценки функциональных нарушений в системе пищеварения 15

1.2. Классификация заболеваний методом дискриминантного анализа ... 17

1.3. Логические решающие функции 21

1.4. Выбор системы информативных признаков 24

1.5. Нечёткие модели медицинских экспертных систем 27

Глава 2. Теоретико-вероятностная модель медицинской диагностики 31

2.1. Правило постановки медицинского диагноза, минимизирующее риск потерь 31

2.2. Алгоритм типа «Кора». Обучение. Распознавание 34

2.3. Отличия вероятностного алгоритма «Кора» от используемых ранее алгоритмов 42

2.4. Использование вероятностного алгоритма «Кора» для компьютерной оценки функциональных нарушений желудочно- кишечного тракта 44

Глава 3- Теоретико-возможностная модель медицинского объекта 48

3.1. Возможность как альтернативная вероятности модель феномена случайности 48

3.1.1. Мера возможности. Возможность нечёткого события 48

3.1.2. Теоретико-возможностная модель, согласованная с теоретико-вероятностной моделью 54

3.1.3. Проблемы эмпирического построения и интерпретации вероятностной модели 57

3.2. Теоретико-возможностная модель симптомов заболеваний 58

3.2.1. Стохастическая модель возможности при анализе симптомов заболеваний 58

3.2.2. Алгоритм построения теоретико-возможностной модели. Выявление признаков заболевания, удовлетворяющих условию максимальной разделённости 63

3.2.3. Алгоритм гранулирования пространства значений признаков заболевания 66

3.2.4. Вычислительный эксперимент. Диагностические критерии функциональных нарушений при неформализованном характере данных. Результаты применения алгоритмов гранулирования 71

Глава 4. Теоретико-возможностная модель медицинской диагностики 82

4.1. Теоретико-возможностная модель постановки медицинского диагноза. Правило постановки диагноза, минимизирующее риск потерь 82

4.2. Возможностный алгоритм классификации «Кора». Обучение и распознавание 89

4.3. Диагностика заболеваний. Вычислительный эксперимент 92

4.3.1. Диагностика острого аппендицита методом дискриминантного анализа 92

4.3.2. Применение вероятностного алгоритма «Кора» для диагностики острого аппендицита 100

4.3.3. Применение возможностного алгоритма «Кора» для диагностики острого аппендицита. Сравнительный анализ вероятностного и возможностного алгоритмов «Кора» 107

4.3.4. Результаты работы программного комплекса диагностики заболеваний 117

4.4. Возможность в статистической теории проверки гипотез в задачах медицинской диагностики 122

4.4.1. Возможность в статистической теории проверки гипотез. Парамеф распределения вероятностей как нечёткий элемент 122

4.4.2. Применение теории проверки гипотез в задачах медицинской диагностики 124

4.4.3. Результаты вычислительного эксперимента 128

Выводы 139

Список литературы

Введение к работе

Актуальность темы. Теоретико-вероятностные методы широко применяются при моделировании многих аспектов случайности, неточности и нечёткости, которые свойственны сложным физическим, техническим, экономическим, социальным и медицинским объектам. Такие объекты часто характеризуются изменчивостью во времени, неформализованным и, в ряде случаев, субъективным характером их описания. В то же время, вероятностные методы на практике оказываются недостаточно эффективными при математическом моделировании такого рода объектов.

Причины неэффективности вероятностных методов обусловлены многими факторами. Вероятностные методы в своей основе используют предположения о стохастической природе объектов и существовании вероятностной модели изучаемых явлений. Если моделируемый объект не является стохастическим, то вероятностной модели не существует. Тогда неточность и нечёткость, свойственные объектам, нельзя охарактеризовать в вероятностных терминах. Однако судить о стохастичности объекта не всегда просто вследствие отсутствия критерия вероятностной природы объектов в теории вероятностей.

При эмпирическом построении вероятностной модели сложного, но заведомо стохастического объекта, также возникают трудности принципиального характера: если в процессе получения данных объект эволюционирует, его вероятностные характеристики непредсказуемо изменяются, а их оценки оказываются неадекватными. В этом случае эмпирическое построение вероятностной модели стохастического объекта невозможно, поскольку данные наблюдений не позволяют оценить эволюцию его вероятностных свойств. Если же вероятностные характеристики стохастического объекта неизменны, эмпирическое построение его вероятностной модели с необходимой точностью может оказаться нереализуемым вследствие достаточно большого объема необходимых данных наблюдений.

Ввиду неэффективности вероятностных методов при математическом моделировании сложных медицинских объектов, для создания автоматизированных систем их диагностирования естественно обратиться к невероятностным моделям случайности, нечёткости и неопределённости. В теории возможностей (Ю.П. Пытьев; 2007) показано, что в то время как вероятностную модель стохастического объекта, непредсказуемо эволюционирующего во времени, эмпирически построить невозможно, его возможностная модель при достаточно слабых ограничениях на характер эволюции вероятностной модели может быть восстановлена, причём точно и на основании конечного числа наблюдений. Если к этому добавить, что возможностная модель и не стохастического объекта может быть построена эмпирически на основе заключений экспертов, то предпочтительность возможностного моделирования постановки диагноза, при котором используются как «чёткие», так и неформализованные данные, становится очевидной.

Для решения проблем медицинской диагностики заболеваний с 60-х годов прошлого века применяются методы вычислительной математики. Задача медицинской диагностики рассматривается как задача идентификации, в которой требуется принять решение о принадлежности медицинского объекта, в данном случае - субъекта (пациента), к одному из М заданных классов заболеваний, либо о том, что данный субъект не относится ни к одному из выделенных классов. В диссертации употребляются также термины «классификация» и «распознавание», понимаемые как «идентификация», то есть отнесение субъекта к одному из заранее определённых классов, причём «отсутствие выделенных заболеваний» рассматривается как отдельный класс. Признаками, характеризующими субъект, являются симптомы заболевания, обнаруженные в результате обследования и опроса пациента; каждый симптом может принимать как количественные, так и качественные значения. В диссертации рассмотрены два этапа решения задачи идентификации: обучения и постановки предварительного диагноза. Процесс обучения состоит в определении характерных значений признаков (симптомов) заболевания в каждом из М классов по обучающей выборке объектов. Класс «норма», как правило, характеризуется значениями признаков заболеваний, находящимися «в пределах нормы». На основании результатов обучения проводится идентификация - отнесение диагностируемого пациента к одному из М классов, либо к классу «отсутствие выделенных заболеваний», если у данного пациента не наблюдается характерных симптомов изучаемых классов. При этом он может страдать заболеваниями, диагностика которых выходит за рамки основной цели проведённого исследования.

Цель проведённых исследований - разработка, исследование и применение вероятностных и возможностных методов математического моделирования процессов постановки медицинского диагноза, разработка алгоритмов и программ обучения и распознавания в условиях нечёткого описания медицинских объектов, изменчивости во времени их вероятностных характеристик и ограниченного размера обучающих выборок, создание возможностной медицинской диагностической системы - её математических основ и компьютерной реализации.

Методы исследования. При решении задач, возникших в ходе выполнения диссертационной работы, использовались вероятностные и возможностные методы идентификации, методы эмпирического построения возможностных моделей стохастических объектов, а также статистическая теория оценивания и проверки гипотез.

Достоверность и обоснованность научных результатов и выводов гарантируется строгостью используемого математического аппарата и подтверждается сравнением результатов, полученных с использованием различных методов, вычислительных экспериментов и врачебных заключений. Сформулированные в работе допущения обоснованы как путём их содержательного анализа, так и методами математического моделирования, а разработанные методы идентификации заболеваний обладают математически обоснованными критериями оптимальности решающих процедур.

Научная новизна. В диссертации получены следующие новые научные результаты, выносимые на защиту:

  1. Разработаны и исследованы: вероятностная модель диагностики заболеваний; новый вариант алгоритма диагностики заболеваний типа «Кора», включающий процесс обучения системы компьютерной диагностики и процесс распознавания - постановку предварительного диагноза пациенту на основании решающего правила, минимизирующего математическое ожидание вероятности потерь, сопутствующих ошибочной классификации; программное обеспечение для реализации данного алгоритма.

  2. Разработаны и исследованы: возможностная модель медицинского объекта; метод эмпирического построения возможностной модели медицинского объекта, основанный на гранулировании пространства значений признаков заболеваний, позволяющий определять характерные симптомы заболеваний; алгоритм, осуществляющий эмпирическое построение гранулированного пространства с возможностью; программное обеспечение для эмпирического восстановления возможностной модели медицинского объекта.

  3. Разработаны и исследованы: возможностная модель диагностики, в которой решающее правило минимизирует возможность потерь при постановке диагноза; возможностный алгоритм «Кора», определяющий на этапе обучения нечёткие представительные наборы каждого заболевания и осуществляющий классификацию заболеваний при нечётком описании симптомов и изменчивости их вероятностных характеристик; программный комплекс диагностики заболеваний, включающий компьютерную реализацию вероятностного и возможностного алгоритмов «Кора».

4. Разработаны: возможностный метод оценивания эффективности лечения пациентов определённым препаратом; алгоритм сравнения возможностей различных изменений уровней биохимических показателей крови пациентов, больных хроническим панкреатитом, позволяющий сделать вывод об эффективности их лечения данным препаратом. Проведён сравнительный анализ вероятностного и возможностного алгоритмов классификации заболеваний, показывающий преимущества возможностного моделирования медицинских объектов и процесса компьютерной постановки медицинского диагноза.

Практическая значимость диссертационной работы связана с её прикладной ориентацией, а полученные результаты могут быть использованы при математическом моделировании процессов постановки медицинского диагноза. Предложенные в диссертации алгоритмы поиска характерных признаков классов заболеваний, предварительной постановки диагноза, и разработанный на их основе программный комплекс позволяют решать следующие задачи медицинской диагностики: нахождения отличительных особенностей функциональных нарушений желудочно-кишечного тракта (ЖКТ) и трёх форм острого аппендицита (ОА), формализации и анализа симптомов заболевания «синдром раздражённого кишечника» (СРК), исследования влияния пищевых добавок на состояние больных хроническим панкреатитом (ХП).

Апробация работы. Основные результаты диссертационной работы неоднократно докладывались на научных семинарах кафедр компьютерных методов физики и математики физического факультета МГУ им. М.В. Ломоносова, научном семинаре «Молекулярное моделирование и разработка биологически активных соединений» НИВЦ МГУ им. М.В. Ломоносова, а также на международной конференции «Ломоносов - 2003» (Москва, 2003), XIII-й Всероссийской конференции «Математические методы распознавания образов» (Москва, 2007), Международной научно-практической конференции «Румянцевские чтения. Экономика, государство, общество в XXI веке» (Москва, 2009).

Публикации. Основные научные результаты диссертации отражены в 8 научных работах, в том числе в 5 статьях из Перечня ведущих рецензируемых научных журналов и изданий ВАК РФ.

Личный вклад соискателя. Все исследования, результаты, которые изложены в диссертационной работе, проведены лично соискателем в процессе научной деятельности. Из совместных публикаций в диссертацию включен лишь тот материал, который непосредственно принадлежит соискателю; заимствованный материал обозначен в работе ссылками.

Структура и объём работы. Диссертация состоит из введения, 4 глав, заключения и списка литературы. Диссертационная работа изложена на 150 страницах, содержит 34 иллюстрации. Библиография включает 106 наименований.

Классификация заболеваний методом дискриминантного анализа

В задаче дискриминантного анализа [6-9, 35, 36] в качестве решающих функций выступают построенные на этапе обучения т.н. канонические дискриминантные функции: где к = /,..., М, т = /,..., N0, п - число признаков, М- число классов, N0 -число объектов обучающей выборки, хкт - значение /-го признака т—го объекта к-то класса, і =/,..., п. Коэффициенты Д, і =1,..., п, определяются таким образом, чтобы с помощью дискриминантных функций наилучшим образом, то есть с наименьшим числом ошибочных решений, разделить объекты на классы. Для изучения различий между классами используются т.н. центроиды. Центроид к-го класса - это «-мерный вектор, координаты которого - средние значения признаков к-то класса. Центроид класса выполняет роль типичного объекта класса. В результате дискриминантного анализа происходит преобразование «-мерного пространства признаков в -мерное пространство канонических дискриминантных переменных, где q - число дискриминантных функций, q = п-1. Для данного объекта значение dkm (1.1) интерпретируется как его координата в пространстве канонических дискриминантных функций. Для определения коэффициентов /?,, i=lf..., п, дискриминантной функции dkm9 к = /,..., М, m = /,..., Nb следует решить систему из п уравнений, максимальное число нетривиальных решений которой равно q = п \ . Каждому решению (Я, v) соответствует один вектор коэффициентов V = (H,,I J,..., II) канонической дискриминантной функции dkm, к = /,..., М, m = /,..., Л . В качестве её коэффициентов можно непосредственно использовать v,j = 1,...,и. Однако для того, чтобы начало координат в пространстве канонических дискриминантных функций совпало с главным центроидом - вектором средних значений признаков всех объектов обучающей выборки, принято нормировать компоненты собственного вектора v [8]: A=vfV -A/f/?0=-ZA 0-2)

В теории дискриминантного анализа принято считать, что исходные данные приведены к стандартной форме, если векторы объектов имеют нулевое математическое ожидание и единичную дисперсию. В противном случае соответствующие коэффициенты Д, і =/,..., п, в (1.2) называются нестандартизованными. Показано, что разделяющая мощность у-ой дискриминантной функции тем выше, чем больше соответствующее ей собственное значение Х [9]. Разделяющая (дихотомизационная) мощность дискриминантной функции определяется числом классов, разделённых посредством данной дискриминантной функции [4]. Одной из характеристик разделяющей мощности у -ой дискриминантной функции является относительное процентное содержание Aj: Sj =— —100. Степень зависимости между классами и дискримииантной функцией отражает так называемый коэффициент канонической корреляции г = \— —, где j у 1 + Л, номер соответствующей дискриминантной функции [7]. Максимальному s} не всегда соответствует большое значение г], то есть у самой значимой (по сравнению с другими) функции может быть слабая связь с классами. Если классы не очень хорошо различаются по данным переменным, все коэффициенты корреляции имеют малые значения. Для выбора дискриминантных функций на практике s и г] используются совместно.

При распознавании вычисляется расстояние от «диагностируемого» объекта до центроидов каждого класса в пространстве дискриминантных функций. Субъект относится к тому классу, расстояние до центроида которого минимально. При этом результат целиком зависит от положения центроидов в пространстве дискриминантных функций. Однако нельзя считать, что признаки «среднего» объекта класса, объявляемого «типичным больным», на самом деле являются характерными симптомами заболевания. Как скажется изменение обучающей выборки на качестве диагностики, непредсказуемо.

Дискриминантный анализ разновидность классификации, осуществяемой с помощью функции расстояния. На качество работы таких классификаторов существенно влияют кластеризационные свойства классов. Можно рассчитывать на получение удовлетворительных практических результатов только в тех случаях, когда классы обнаруживают тенденцию к проявлению кластеризационных свойств в постранстве дискриминантных функций. Существуют разновидности классификаторов, основанные на критерии минимума расстояния, например, случай множественности эталонов, когда решение принимается на основании сравнения объектов не только с центроидами, но и с другими «эталонными» объектами классов, «правило ближайшего соседа» (БС-правило) и т.д. При использовании метода дискриминантного анализа существует ряд ограничений. Во-первых, требуется линейная независимость признаков. Во-вторых, ковариационные матрицы классов должны быть одинаковы. В-третьих, необходимо, чтобы объекты всех классов подчинялись нормальному закону распределения. Кроме того, такая система распознавания представляется врачам «чёрным ящиком». Невозможно выявить группы симптомов, характеризующие классы в пространстве дискриминантиых функций. Поэтому врачам непонятно, на каком основании компьютер ставит диагнозы их пациентам, и подобный способ диагностики вызывает естественное недоверие. Метод дискриминантного анализа используется, например, для диагностики рака желудка, успешно отделяя его от других, сходных по симптомам, заболеваний: язвы, полипоза, гастрита, доброкачественной опухоли. В качестве признаков (дискриминантиых переменных) используются количественные характеристики различных типов клеток (лейкоцитов, лимфоцитов, В-лимфоцитов и др.) в иммунологическом анализе крови. Диагноз зависит от знака функции d(x)=0.02xi+0.207x2+0.31x3+0.75х4+0.618х5+0.154х6+0.212х7+0.403х8-0.492x9+0.5 [3]. В четвёртой главе показаны результаты применения дискриминантного анализа к задаче диагностики аппендицита.

Для описания картины симптомов заболевания совместно используются количественные, порядковые и качественные признаки. Для анализа таких признаков и классификации объектов, имеющих разнотипные признаки, используются логические решающие функции. Широкое применение находят созданные на их основе алгоритмы выявления эмпирических закономерностей [10-14].

Алгоритм типа «Кора». Обучение. Распознавание

Как было отмечено, современные диагностические методики не всегда справляются с выявлением СРК. На этапе обучения, используя выборку симптомов больных - пациентов клиники НИИ питания РАМН с верифицированным диагнозом, следует определить наиболее часто встречающиеся сочетания признаков - симптомов заболевания. Такие сочетания признаков характеризуют класс СРК и используются в дальнейшем для распознавания. Диагностика СРК на начальном этапе сводится к разделению объектов на два класса - СРК и Норма, причем объекты класса Норма - люди, не имеющие заболеваний ЖКТ. В главе 1 отмечалось, что способность алгоритма классификации к обобщению проверяется при предъявлении ему реальных данных, не используемых при обучении. Качество работы алгоритма зависит от того, насколько хорошо обучающие объекты представляют реальные данные. Возникает также вопрос о том, какое минимальное количество объектов необходимо включить в обучающую выборку для того, чтобы выработать у алгоритма классификации хорошие способности к обобщению. В [4] показано, что при полном отсутствии вероятностной характеристики, общее количество объектов двух классов должно быть по крайней мере равно удвоенной размерности векторов образов, а точнее, TV 2{п+\). Оценка справедлива для хорошо размещённого множества объектов. Множество, состоящее из N точек /7-мерного пространства, называется хорошо размещённым, если ни одно из его подмножеств, состоящих из п+\ точки, не лежит в (/7-/)-мерной гиперплоскости. Однако в условиях задачи медицинской диагностики из-за специфики представления векторов образов при их высокой размерности судить о хорошей размещённости обучающей выборки крайне затруднительно. В такой ситуации накладывается существенно более жёсткое ограничение: N 20( 7+1) [4] позволяющее надеяться, что априорной информации будет достаточно для успешной классификации.

Задача классификации заболеваний решается в данной главе с помощью алгоритма «Кора» [21-27]. Существует несколько разновидностей данного алгоритма. Наиболее популярна его алгебраическая модель, основанная на построении информативных фрагментов обучающих объектов - сочетаний признаков, называемых представительными наборами [24, 42]. Множество представительных наборов определяется заданием двух целочисленных параметров qj (q} 1) и q2 (q2 0). Набор признаков считается характерным для класса, если он не менее q} раз встречается в описании обучающих объектов данного класса и не более q2 раз - в описании остальных обучающих объектов. Для классификации существенны не все представительные наборы, а только так называемые тупиковые, ни одно подмножество которых не является представительным. Множества признаков, входящих в тупиковые представительные наборы класса, названы опорными множествами класса. Эмпирически задаются входные параметры - веса признаков и объектов, и по признакам опорных множеств в [42] оцениваются близость объектов и мера важности признаков и объектов. Решающее правило основано на критерии минимума расстояния от объекта до представительных наборов класса. Варьируя параметры, можно добиваться разных результатов диагностики. В диссертации алгоритм «Кора» модифицирован на основании определённой выше вероятностной модели диагностики. Обучающее множество содержит N объектов из М классов -непересекающихся подмножеств заболеваний QM..MQW. Разбиение на классы определено не полностью. Информация о классах задана в виде обучающей выборки.

Для определения представительных наборов классов каждый объект сок{ сравнивается со всеми остальными объектами класса по всем признакам и результат сравнения объектов представляется в бинарном виде, в котором единица свидетельствует о неразличимости объектов по данному признаку (т.е. о совпадении по данному признаку), а ноль - о различии значений данного признака у объектов.

Признаки, не входящие в представительные наборы, объявляются несущественными для данного класса. Обозначим некоторый представительный набор {& ,..., // )J} „. jn г п, через D (ю /), где s - номер набора, д—1,...2 к -1, к- номер класса, сок1 - объект, для которого строилась матрица В(1) (2.9), то есть объект, давший представительный набор Dks(coki), l=\f...,Nk. На этапе обучения по обучающей выборке находятся все представительные наборы Dk5(coki),s \f...2tk -1 всех классовк= 1,2,..., М. Пользуясь предположением о стохастической природе объектов, мы можем говорить о существовании вероятностей рг(к), ргЩО ), рг{р1\к), где рг(к) - априорные вероятности классов, рг\р \к) - вероятность набора D в классе С1к, ргЩО ) - вероятность того, что объект, обладающий набором Dks принадлежит классу Qk. При распознавании предъявляется объект х = (х\х2,...,х"), который следует отнести к одному из М классов. Выявляются все представительные наборы всех классов, присущие объекту х. Пусть найдено S таких наборов в классе к: s l,...,iS . Для классификации объекта х требуется не всё его описание, а только представительные наборы, которыми он обладает. Поэтому вместо вектора значений признаков х (2.1), в pr7lK(x \ к) (2.3 ) берётся его наиболее существенный в классе к набор Ц, . Согласно закону больших чисел [37-40], если число объектов Л стремится к бесконечности, вероятность любого отклонения частоты от вероятности стремится к нулю. Используя для обучения достаточно большую выборку, можно аппроксимировать вероятности в (2.3 ) частотами, пользуясь предположением о стохастической природе объектов. В частности, аппроксимируя на практике вероятности pr{D \k) частотами встречаемости объектов с Д в к-ом классе, следует помнить об условиях практического применения ЗБЧ и сделать оценки Хёфдинга [29] ошибки приближения вероятности частотой для выборки объёма Nk в к-ом классе (как для неизменных, так и для меняющихся вероятностных характеристик объектов, что в данной задаче является актуальным из-за индивидуальных особенностей пациентов и изменчивости их состояния).

Следует отметить принципиальную важность оценки тяжести последствий разных вариантов ошибочного диагноза в медицинской практике. При вероятностном моделировании процесса постановки диагноза такие оценки можно получить, руководствуясь байесовским решающим правилом, минимизирующем риск потерь (2.4) и приводящим к решению задачи (2.11) алгоритма «Кора». При вероятностном моделировании процесса постановки диагноза такие оценки можно получить, руководствуясь теорией статистических решений. В математическое ожидание потерь (2.3 ), сопутствующих постановке определённого диагноза, входит матрица потерь с заданными врачом элементами 1и » характеризующими величину потерь при постановке диагноза d пациенту, страдающему на самом деле заболеванием к. Если при точном решении потери нулевые, а при любом ошибочном решении единичные, то риск равен ожидаемой доле ошибочных решений, то есть вероятности ошибки идентификации.

Мера возможности. Возможность нечёткого события

Как уже было замечено, для описания заболевания необходимо конкретизировать его симптоматику в условиях небольшого числа объектов (пациентов, заполнивших опросники) относительно количества признаков (вопросов). Алгоритм был применен к 53 объектам, каждый из которых содержал 13 признаков. В результате были выделены те признаки, которые удовлетворяют условию максимальной разделённости и возможности их значений строго упорядочены. Во всех получившихся соотношениях вида 1 = p(w[) p(w!2 ) ..., где w/ є Q , T - (» ), наиболее значимыми для данного заболевания являются сочетания значений признаков w(, имеющие возможность p(w[) = \.

Основные результаты работы простого алгоритма представлены в таблицах. Таблица 3 демонстрирует некоторые характерные комбинации психосоматических признаков группы №1 (Замедленная моторика), ранжированные по возможностям их значений, причем наборы симптомов расположены в порядке убывания возможностей. Результаты, представленные в таблице 4, соответствуют группе №2 (Ускоренная моторика). Далее две группы СРК будем называть классами согласно терминологии теории распознавания образов. Рассмотрены не только некоторые наиболее значимые комбинации, имеющие возможность, равную 1, но и такие, которые могут встретиться при «нетипичном» протекании заболевания, характеризующемся несколько иной симптоматикой. Такие симптомы имеют возможность р:0 р \ и не должны игнорироваться при диагностике и лечении. Например, для больных класса 1, типичны сочетания вегетативных нарушений различной степени с повышенным ощущением тревоги (р}=\). Вегетативным нарушениям при отсутствии тревоги соответствует возможность р2 Р\- На практике приходится встречаться и с такими проявлениями заболевания. А вот встретить больного СРК, страдающего тревогой, но не имеющего при этом вегетативных нарушений (р4), практически невозможно, так как р4 /?3 р2 где р3 соответствует только сильной степени тревоги (в комплексе с вегетативными нарушениями), что также редко имеет место при СРК. Все основные психосоматические нарушения и их связи в обеих группах отражены в таблицах. В классе 2 выявлено больше психосоматических нарушений, чем в классе 1, а их взаимозависимость выражена полнее. Типичные отклонения в классе 2, приводящие к СРК, - сочетание напряженности, вегетативных нарушений и депрессии; значительные вегетативные нарушения также сочетаются с нарушениями сна, а плохой сон, в свою очередь, ведет к повышенной утомляемости пациентов, страдающих ускоренной моторикой.

При анализе влияния на состояние больного различных факторов, предшествующих заболеванию: бытовых проблем, конфликтов на работе, эмоционального напряжения, малоподвижного образа жизни и т.д., оказалось, что у больных класса 1 с возможностью, равной 1, заболеванию предшествовало от 2 до 5 неблагоприятных факторов. Обнаружено также, что наличие даже одного такого фактора может привести к заболеванию с возможностью, отличной от нуля. Следовательно, Таблица 3. Характерные значения психосоматических признаков группы №1 Сочетания признаков пронумерованы по порядку убывания возможности их появления при СРК; 1 = р, р2 ..., где р, возможность гранулы wt. Степени тяжести симптомов: 0 - отсутствие симптома, 1 - слабое проявление, 2 - средняя степень тяжести, 3 -сильное проявление симптома. Таблица 4. Характерные значения психосоматических признаков группы №2 перечисленные факторы представляют реальную угрозу заболевания. Если же СРК предшествовало большее число факторов (4 - 7), то максимальной становится возможность попадания больного в класс 2. Значит большее число проблем скорее приведет к ускоренной моторике, чем к замедленной. Ранжированы переходные возможности возникновения болей в двух группах при различных предпосылках, связанных со стулом, характером и частотой питания, физической нагрузкой, эмоциональным возбуждением и т.д. У больных класса 1 возможность возникновения болей даже при небольшом числе предпосылок (1-3) равна 1, а возможность отсутствия болей равна 0, т.е. боли «неизбежны». У больных класса 2 боли возникают значительно чаще: возможность их появления при наличии 4-7 предпосылок равна 1. Возможность обойтись без болей также нулевая. Степень тяжести болей также выше в классе 2, в то время как в классе 1 возможность наличия сильных болей минимальна.

Опросник ТОС содержит довольно большой объём информации о пациенте, количество наборов симптомов, удовлетворяющих условию максимальной разделённости, очень велико, и работа простого алгоритма требует больших затрат времени. Для удобства анализа полученных результатов простой алгоритм применялся к отдельным группам ТОС, характеризующим различные стороны заболевания.

Оптимизированный алгоритм применен к той же выборке: к 53 объектам, каждый из которых характеризуется 13 признаками. 34 объекта принадлежит классу 1 «Замедленная моторика», 19 - классу 2 «Ускоренная моторика». Результатом работы алгоритма являются упорядоченные по значениям возможности наборы признаков: 1 = p(w[) p{w[) ..., где wj є QT. Наиболее значимыми для данного класса заболевания являются сочетания значений признаков (гранулы) w,7, имеющие единичную возможность. Разработан интерфейс, демонстрирующий поиск диагностических критериев заболевания на основе обучающей выборки в диалоговом режиме. Процесс и результат гранулирования отражается в диалоговом окне «Гранулирование». Выбрав файл с обучающей выборкой соответствующего класса нажатием кнопки «Загрузить из файла» и нажав на кнопку «Показать объект», получим изображение вектора значений признаков данного объекта обучающей выборки (рис. 3.1). Здесь по горизонтали - номера./ = 1, ..., п признаков, п = 13, по вертикали - их значения у данного объекта.

Реализованный алгоритм выполняет оптимизированное гранулирование, переходя к всё большей степени приближения до тех пор, пока состав гранул не перестанет изменяться, и производит минимизацию суммарного числа различных значений признаков на множестве всех гранул «максимальной» степени приближения. Это сделано для того, чтобы в рамках условий данной задачи (ограниченный объем обучающей выборки и низкие частоты элементарных событий) представить наиболее информативный результат. Запуск оптимизированного алгоритма гранулирования производится нажатием кнопки «Особый алгоритм гранулирования». В процессе его работы происходит отыскание всех вариантов гранул, удовлетворяющих условиям оптимальности, ранжированных по значению возможности. При просмотре результатов гранулирования становится доступным переключатель «вариант», позволяющий просмотреть все варианты гранул, ранжированных по значению возможности.

Возможностный алгоритм классификации «Кора». Обучение и распознавание

Наборы признаков w[,w 2,t.. удовлетворяют по определению 3.3. условию максимальной разделенности (» ). Было показано, что так же упорядочены переходные возможности p(k\w ) заболевания к при наличии симптомов wj. Наиболее существенными признаками заболевания к являются наборы w/ ,w,\... разбиений Г/, 7 ,..., имеющие в классе к максимальную возможностьр[ =р(у [ш \к)=І а в остальных классах -меньшую возможность p(w[ \j) l, j-l,...M , ]фк . На основании этих рассуждений дадим определение нечёткого представительного набора класса, являющееся альтернативой представительного набора класса в вероятностном алгоритме «Кора» (глава 2). Теоретико-возможностный аналог алгоритма «Кора» будем называть нечётким алгоритмом «Кора».

На этапе обучения по обучающей выборке находятся множества {w} , = 1, 2,.., А/ всех представительных наборов. Распознавание в нечётком алгоритме «Кора» осуществляется следующим образом. Предъявляется объект х = (х1, 2,..., ") (4.1), где У-значениеу -го признака (симптома), который следует отнести к одному из М классов. Выявляются все нечёткие представительные наборы (w5) , к=\9 ..., Mt из множества {w} , присущие объекту х. Пусть найдено S таких наборов в классе к: s = 1, ..., . В каждом классе к определяется нечёткий представительный набор wSt, имеющий максимальную апостериорную возможность:р(к\wSi )= max p(k\ws), s = 1,..., Sk. Далее в (4.17) в качестве условного распределения р (хЛ) используется значение переходной возможности р(х\к) объекта х при условии принадлежности его к классу к. При этом для классификации объекта х требуется не всё его описание, а только нечёткие представительные наборы, которыми он обладает. Поэтому вместо вектора значений признаков х = (х\х29...9х") в р(х\к) берётся наиболее существенный в классе к набор \\. Объект х относится к тому классу ? , которому принадлежит набор ws., имеющий минимальную возможность потерь, и правило принятия решения в нечётком алгоритме «Кора» формулируется следующим образом:

Качество врачебной диагностики острого аппендицита (ОА) и хирургические возможности достигли в настоящее время высокого уровня. Однако и в данной области остаются ещё некоторые проблемы. Своевременное обнаружение острого аппендицита чрезвычайно важно для здоровья и жизни больного. Поэтому в том случае, когда возникают сомнения относительно наличия острого аппендицита, врачи предпочитают хирургическое вмешательство. При подозрении на острый аппендицит очень важно опираться не на отдельные симптомы желудочно-кишечных расстройств, а выделить такие группы признаков, которые действительно характеризуют данное заболевание и позволяют отличить больного человека от здорового. Острый аппендицит, как класс заболеваний, в свою очередь делится на три группы: гангренозный, флегмонозный и катаральный. Врачи отмечают, что их признаки сильно пересекаются, и привлечение компьютерных методов классификации к анализу симптоматики и диагностике трёх форм острого аппендицита также является актуальным.

Обучающая выборка - результаты обследования 103 человек из 4 классов: 3 группы острого аппендицита: гангренозный (28 чел.), флегмонозный (25 чел.), катаральный (26 чел.) и группа больных с неподтвержденным диагнозом (24 чел.).

При распознавании вычисляется расстояние от «диагностируемого» объекта до центроидов каждого класса в пространстве дискриминантных функций. Объект относится к тому классу, расстояние до центроида которого минимально, причём в качестве меры расстояния между объектами с коррелированными переменными (признаками) используется обобщённое расстояние Махаланобиса [4].

Относительное процентное содержание собственных значений и коэффициент канонической корреляции таковы, что для решения диагностической задачи достаточно двух первых дискриминантных функций на которые приходится 98,3% дискриминантных возможностей. Стандартизованные и нестандартизованные коэффициенты этих функций при всех восьми координатах (признаках) представлены в табл. 7, значения дискриминантных функций центроидов четырёх классов (групп) обучающей выборки даны в табл. 8.

Три группы острого аппендицита имеют значительные пересечения в пространстве дискриминантных функций. Отсюда невысокая точность диагностики: больных первой группы - 78%, второй - 64%, третьей - 65%. Под точностью здесь понимается процент правильно диагностируемых объектов обучающей выборки.

Такая система распознавания представляется врачам «чёрным ящиком». Невозможно выявить группы симптомов, характеризующие классы в пространстве дискриминантных функций. Поэтому врачам непонятно, на каком основании компьютер ставит диагнозы их пациентам, и подобный способ диагностики вызывает естественное недоверие.

Похожие диссертации на Эмпирическое восстановление математических моделей медицинской диагностики