Содержание к диссертации
Введение
I. Maтематические методы в медицине 10
1.1. Применение математических методов в медицине 10
1.2. Методика количественной оценки операционного риска 17
1.3. Медицинские критерии оценки точности методов 19
1.4. Общая характеристика эмпирического материала 23
1.5. Основные этапы разработки медицинских информационных систем поддержки принятия решений 26
1.6. Выводы 30
II. Вероятностно - статистические методы количесвенной оценки операционного риска 32
2.1. Концепция различия и уровень значимости 32
2.2. Введение вероятностной меры в пространство признаков 33
2.3. Критерии информативности Кульбака 36
2.4. Формирование интервальных и бинарных структур 37
2.5. Стратегия распознавания образов Байеса 41
2.6. Стратег ия распознавания образов Вальда 46
2.7. Многошаговая Байесовская стратегия распознавания образов 50
2.8. Алгоритмы поиска факторов риска 51
2.9. Аналиї результатов количественной оценки операционного риска у больных желчно - каменной болезнью вероятностно - статистическими методами 53
2.10. Выводы 66
III. Нейросетевые методы количественной оценки операционного риска 69
3.1. Обзор нейросетевых методов и их возможностей 69
3.2. Обоснование выбора многослойной нейросети с последовательными связями 72
3.3, Предобрабогка меди ко - биолог и чес кил данных для нейросетевой количественной оценки риска 81
3.4. Анализ результатов количественной оценки операционного риска у больных желчно- каменной болезнью нейросетевыми методами 85
3.5. Сравнительный анализ вероятностных и нейросетевых методов для количественной оценки операционного риска 89
3.6. Выводы 93
IV. Автоматизированная система количественной оценки операционного риска 94
4.1. Идеология и архитектура системы 94
4.2. Компьютерный образ клинической ситуации 95
4.3. Исследовательский модуль 97
4.4. База данных АСКОР 99
4.5. Информационная система бланков 101
4.6. База знаний АСКОР 104
4.7. Экспертный модуль и процесс принятия решений 106
4.8.1 Іроект системы АСКОР «Оценка операционного риска у больных
ЖКБ» 109
4.9. Выводы 112
Заключение 114
Литература
- Основные этапы разработки медицинских информационных систем поддержки принятия решений
- Критерии информативности Кульбака
- Предобрабогка меди ко - биолог и чес кил данных для нейросетевой количественной оценки риска
- Компьютерный образ клинической ситуации
Введение к работе
АкгуальносіЕ». В настоящее время исследования и разработки в различных областях науки и техники предполаїают обработку больших объемов информации связанной с описанием состояния и поведения иесдедлемых объектов. Это предполагает применение различных методов, а также поиск и создание моделей ее обработки. Вместе с необходимостью применения математических моделей для описания состояний и поведения объектов растут и требования к эффективности этих моделей. Эти вопросы являются особенно актуальными в таких областях как обработка аэрокосмической информации, геофизических, медико-биологических данных и пр.
Анализ видов математических моделей [1], используемых в медицине, показал, что модели, отражающие процессы регулирования в биологических системах как процессы с обратными связями в виде замкнутых контуров регулирования или хотя бы как процессы с прямыми связями и уравнениями взаимосвязей между звеньями регулирующих систем, встречаются относительно редко. Этот факт по существу соответствует теоретическим концепциям биокибернетики, общей кибернетики и общей теории систем, согласно которым организм человека и высших животных относятся к очень сложным по своей природе системам с недетерминированным поведением. Поэтому из)чение патологических состояний человека ведется с позиций системною подхода, чаще всею, путем статистической проверки определенных іипотез.
На практике, при проведении плановою лечения пациентов, основываясь на собственном опыте, врач - клиницист ставит диагноз, качественно оценивает степень тяжести состояния больного, оценивает риск проведения лечебных мероприятий [2]. В ситуациях с тяжело )еіанавливаемьім или неясным днаиюзом часто очень важно количественно оценить тяжесть заболевания, в то время как универсальных методов количественной оценки тяжести не существует.
Одной из наиболее важных проблем в современной медицине является сложность количественной оценки операционного риска. Оценка операшюнною риска подразумевает оценку степени тяжести предоперационного состояния пациента при угрозе летального исхода или возможных послеоперационных осложнений [3]. Сложность оценки степени тяжести состояния обусловлена большим количеством симптомов, различных дія каждого заболевания и большой лабильностью клинических проявлений заболевания. На практике степень тяжести состояния пациента определяется качественно. При этом используется небольшой набор (5-10) симптомов или факторов риска, значения которых наиболее явно отражают заболевание пациента, в то время как менее значимые симптомы не учитываются. Поэтому одним из путей повышения эффективности оценки операционною риска является применение математических методов анализа данных и разработка проблемно-ориентированных систем обработки информации.
Данная диссертационная работа посвящена разработке автоматизированной системы для количественной оценки операционного риска при любом заболевании пациента. Разработка системы ведется с позиций системного подхода и основывается на применении известных математических моделей, адекватно описывающих состояние пациента. Исследования по количественной оценке операционною риска проводились на статистическом материале больных желчно - каменной болезнью (ЖКБ), прооперированных за последние 12 лет {1990 - 2002 і г.) в Больнице Кч 5 г. Барнаула. Выбор именно желчно - каменной болезни обусловлен её частотой и достаточно высокой послеоперационной летальностью при осложнениях. Создание такой системы позволит более точно оценивать степень тяжести предоперационного состояния при определенном заболевании пациента и своевременно проводить лечебные мероприятия. Использование проблемно-ориентированной системы поддержки принятия решений поможет повысить оперативность действий врачей - клиницистов и снизить уровень субъективизма при проведении лечения больных ЖКБ.
Состояние вопроса. Исследования по поиску математических моделей, наиболее эффективно отражающих поведение организма пациента в условиях патологии, ведутся не один десяток лет [3, 4, 5, 6, 7, 8]. Однако следует привести некоторые особенности имеющихся на данный момент достижений в области оценки тяжести состояний больных:
• большинство методик разрабатываются для конкретных заболеваний, и часто оказываются непригодными для ряда других;
• анализ данных ведется статистическими методами, а большинство выводов статистических исследований делается при условии нормальности распределений данных, что не справедливо для всех медико - биологических показателей;
• недостаточно хорошо изучена значимость многих факторов, оказывающих влияние на постановку диагноза, и часто в исследованиях изучаются лишь re признаки, которые, по мнению врача, наиболее явно отражают заболевание; • из-за сложности обработки данных не всегда применяются наиболее мощные критерии и медики ограничиваются, например, линейным приближением или степенным уравнением. Цель исследования. Цель работы заключается в разработке эффективной математической модели интегральной количественной оценки тяжести предоперационного состояния больных ЖКБ, а также в разработке проблемно - ориентированной системы анализа медико-биологической информации и количественной оценки операционного риска. Основные задачи исследования:
1. Анализ известных методик количественной оценки степени операционного риска.
2. Исследование эффективности вероятностных и нейросетевых моделей для количественной оценки операционного риска больных желчно -каменной болезнью.
3. Разработка алгоритмов выделения комплекса факторов риска- набора наиболее значимых симптомов при оценке тяжести заболевания.
4. Разработка программного продукта, реализующего систему анализа клинико-лабораторных данных, поиска факторов риска и количественной оценки операционного риска для больных желчно-каменной болезнью.
Научная новизна работы заключается в достижении следующих научных результатов:
1. Обоснована эффективность совместного применения вероятностной и нейросетевой математических моделей для высокоточной и разносторонней количественной оценки степени операционного риска.
2. Предложены алгоритмы поиска и найден комплекс факторов риска -наиболее значимых признаков при оценке тяжести предоперационною состояния больных ЖКБ.
3. Разработаны нейросетевая и вероятностная модели количественной оценки операционного риска больных желчно-каменной болезнью.
Положения, выносимые на защиту. 1. Вероятное гная и нейросетевая модели количественной оценки операционного риска, совместное использование которых позволяет провести высокоточный и разносторонний анализ клинико-лабораторных данных больных ЖКБ. 2. Алгоритмы выделения комплекса факторов операционною риска больных желчно- каменной болезнью, заключающих в себе основную диагностическую информацию.
3. Реализация автоматизированной системы количественной оценки операционною риска у больных желчно-каменной болезнью, позволяющая рассчитать степень тяжести предоперационноюіо состояния больного, провести диагностику основных осложнений и спрогнозировать возможные исходы операции.
Теореичсская значимость результатов работы. Исследования по оценке операционного риска у больных желчно-каменной болезнью показали, что вероятностно-статистические и нейросетевых модели позволяют эффективно количественно оценивать тяжесть предоперационного состояния пациентов, а также выделять комплекс наиболее значимых симптомов при оценке тяжести заболевания. Вероятностно-статистические методы позволяют провести анализ распределений значений симптомов, выделить дифференциально-диагностические границы диапазона значений признаков, превышение которых существенно при рассматриваемой клинической ситуации. Нейросетевые методы анализа данных позволяют создавать высокочувствительные и высокоспецифичные структуры нейронных сетей, использование которых дает высокую точность при количественной оценке операционною риска. Таким образом, совместное использование вероятностных и нейросетеых моделей в автоматизированной системе количественной оценке риска позволяет провести высокоточный и разносторонний анализ данных. При этом вероятностные модели можно порекомендовать для быстрой, предварительной обработки клинико-лабораторных данных, в то время как нейросетевые методы - для более точного анализа информации при оценке операционного риска.
Предложенные в работе методы и модели интегральной оценки состояний объектов .могут эффективно применяться также в биологии, экономике, технике и прочих предметных областях, в которых существует необходимость в обработке больших объемов слабо формализованных данных.
Практическая значимость результатов работы. Использование вероя гностнос га гистических и нейросетевых моделей составляет практическою основу для построения автоматизированной системы количественной оценки степени операционного риска. Рекомендации системы могут использоваться врачами для поддержки принятия решений о тяжести предоперационного состоянии больного желчно-каменной болезнью. Нейросетевая система расчета степени тяжести состояния может эффективно применяться не только для оценки степени операционного риска, но и для прогнозирования послеоперационных исходов у больных ЖКБ, а также можег осуществлять диагностику основных осложнений желчно-каменной болезни. Оценка риска, прогнозирование и диагностика могут осуществляться без привлечения высококвалифицированных экспертов в условиях периферических медицинских учреждений. Использование проблемно-ориентированной системы поддержки принятия решений может повысить оперативность принятия решений и снизить уровень субъективизма при проведении лечения больных ЖКБ.
Основные результаты диссертационной работы реализованы в виде программною комплекса «АСКОР» для оценки тяжести состояний больных ЖКБ, внедренного в двух медицинских учреждениях Алтайского края и использующеюся в медицинской практике.
Публикации. По теме диссертации опубликовано 14 печатных работ, в том числе 3 статьи в сборниках статей, 11 тезисов докладов на конференциях. Получена одна официальная регистрация программного продукта, реализующего экспертный модуль «АСКОР».
Апробация результатов. Основные положения и отдельные результаты исследования докладывались и обсуждались на международной конференции по математическому моделированию и информационным технологиям (Новосибирск, 2002), XII всероссийском научном семинаре «Пейроинформагика и ее приложения» (Красноярск, 2004), 3-й междисциплинарной конференции «ИБИТТ-21» (Петрозаводск, 2004), XIII всероссийском научном семинаре «Нсйроинформатика и ее приложения» (Красноярск, 2005), XIV всероссийском научном семинаре «І Іейроинформатпка и ее приложения» (Красноярск, 2006).
Внедрение. Программа для ЭВМ Автоматизированная система количественной оценки операционного риска «АСКОР» была внедрена в двух клинических больницах Алтайского края. В Алтайском государственном университете на физико-техническом факультете в учебном процессе исполыовалась реализованная в программе для ЭВМ модель диагностики.
Структура работы. Во введении обоснована актуальность исследования, определены цели, задачи, объект, предмет, методы исследования. Раскрыты научная новизна, теоретическая и практическая ценность, сформулированы положения, выносимые на защиту. Указывается новизна разработок, апробация результатов и их внедрение.
В первой главе диссертационной работы «Методы математического моделирования в медицине» определены понятия операционный риск, диагностика и прогнозирование заболеваний, обозначена методика количественной оценки операционного риска. Рассмотрены математические модели, наиболее часто применяемые в медицине для оценки тяжести состояний и диагностики. Изложены основные идеи математического подхода, в рамках которого производится системный анализ и формализация процесса эмпирической диагностики. Также рассмотрены способы построения проблемно - ориентированных систем диагностики и оценки тяжести состояний пациентов с помощью вероятностно статистических и нейросетевых методов.
Во второй главе диссертационной работы «Вероятностно -статистические методы оценки операционного риска» приведены результаты исследований эффективности неиараметрических вероятностно -статистических методов анализа информации для количественной оценки операционною риска больных желчно - каменной болезнью.
В третьей главе диссертационной работы «Нейросетевыс методы оценки операционною риска» обосновывается выбор модели искусственных нейронных сетей (ИІІС) для количественной оценки риска операции, рассматривается выбор оптимальной архитектуры ИЫС. Также приводятся результаты количественной оценки операционного риска у больных ЖКБ, анализируется эффективность данного вида ИНС для оценки риска, и сравниваются методики обработки медико-биологических данных нейросетевыми моделями и вероятностно-статистическими методами.
В четвертой главе диссертационной работы «Автоматизированная система количественной оценки риска (АСКОР)» описывается архитектура и идеология системы, раскрывается назначение каждого объекта системы, определяется область применения системы.
В заключении формулируются основные результаты работы.
Основные этапы разработки медицинских информационных систем поддержки принятия решений
Разработка методики количественной оценки операционного риска, как и исследования эффективности и оценки точности математических моделей для количественной оценки риска вряд ли будут вызывать практический интерес медицинских работников без наглядной демонстрации программной реализации рассматриваемых методов в клинической практике.
В 70-х годах ХХ-го века появились первые Системы Поддержки Принятия Решений (СППР), ориентированные на предоставление информации для принятия управленческих решений. Современные системы поддержки принятия решения, возникшие как естественное развитие и продолжение управленческих информационных систем и систем управления базами данных, представляют собой системы, максимально приспособленные к решению задач повседневной управленческой деятельности, являются инструментом, призванным оказать помощь лицам, принимающим решения (ЛПР) [62,63,73]. С помощью СППР могут решаться неструктурированные и слабоструктурированные многокритериальные задачи. СППР, как правило, являются результатом мультиднсциплинарного исследования, включающего теории баз данных, искусственною интеллекта, интерактивных компьютерных систем, методов имитационного моделирования. Конструкция СППР существенно зависит от вида задач, для решения которых она разрабатывается, от доступных данных, информации и знаний, а также от пользователей системы. В большинстве случаев СППР -это интерактивная автоматизированная система, которая помогает пользователю (ЛПР) использовать данные и модели для идентификации и решения задач и принятия решений.
Таким образом, основные характеристики СППР это: 1. CIII IP использует и данные, и модели; 2. СППР предназначены для помощи в принятии решений для слабоструктурированных и неструктурированных задач; 3. СІ ІПР поддерживают, а не заменяют, выработку решений; 4.1 [cm, СППР - улучшение эффективности решений.
В зависимости от аспекта рассмотрения, системы поддержки принятия решений можно классифицировать по-разному: на уровне пользователя; на концептуальном уровне; в зависимости от данных, с которыми эти системы работают [73].
На уровне пользователя СППР делят на пассивные, активные и кооперативные. Пассивной СППР называется система, которая помогает процессу принятия решения, но не может вынести предложение, какое решение принять. Активная СППР может сделать предложение, какое решение следует выбрать. Кооперативная СППР позволяет ЛПР изменять, пополнять или улучшать решения, предлагаемые системой, посылая затем эти изменения в систему для проверки. Система изменяет, пополняет или улучшает эти решения и посылает их опять пользователю. Процесс продолжается до получения согласованного решения [73].
Па концептуальном уровне отличают следующие типы СППР: управляемые сообщениями; управляемые данными; управляемые документами; управляемые знаниями; управляемые моделями (статистическими, финансовыми, оптимизационными, имитационными) [73].
В зависимости от данных, с которыми эти системы работают, СППР условно можно разделить на оперативные и стратегические. Оперативные СППР предназначены для немедленного реагирования на изменения текущей ситуации. Стратеї ические СППР ориентированы на анализ значительных объемов разнородной информации, собираемых из различных источников [73]. Наиболее обобщенная архитектура CIIIII включает; 1)сис7ему управления данными; 2)сисіему управления моделями; 3)машину знаний; 4)интерфейс пользователя. На основе систем поддержки принятия решений создаются экспертные системы (ЭС). Экспертная система - основанная на знаниях определенной предметной области информационная система искусственного интеллекта, выполняющая роль эксперта-консультанта для конечных пользователей. Экспертные знания в ЭС составляют отдельную базу знаний, которая, и частности, может быть получена на основании опыта реальных людей-экспертов, умеющих эффективно решать задачи в своей предметной области [63]. Главным достоинством экспертных систем является возможность накопления знаний и сохранение их длительное время. По мнению профессионалов, хорошая экспертная система должна в обязательном порядке обладай, следующими качествами [74].
1. Самоотчет. ЭС должна уметь объяснять свои выводы и действия. При решении реальных задач ценятся практические рекомендации, основанные на существующих фактах, которые можно проверить, и объяснение которых подчиняется формальной логике.
2. Компетентность. ЭС должна достигать экспертного уровня решений, а именно: рассуждать, опираясь на фундаментальные принципы принятия правильною логического решения, даже в тех случаях, когда обрабатываемая ею информация недостаточна или содержит некорректные данные.
3. Использование символьных рассуждений. Это свойство ЭС означает, что результат ее "размышлений" должен быть выражен обычными предложениями с использованием профессиональных терминов, оперируя словами в символьном исполнении.
Таким образом, СППР и ЭС применяют для решения трудно формализуемых и неструктурированных задач. Отличительными чертами ЭС от СППР является более узкая специализация предметной области и наличие базы знаний, предоставляемых экспертом. Тем не менее, основными целями СППР и ЭС является информационная поддержка принятия решений [24,62,63,74].
Критерии информативности Кульбака
Для измерения количества информации Н. Винер и К. Шеннон независимо друг от друга в 1948 г. предложили логарифмические меры, получившие признание в качестве количественных мер информации [49,50,52]. К классу подобных логарифмических мер относится введенная Jeffreus в 1946 г. и подробно изученная в качестве информационной меры Кульбаком мера J(x;l,2) расхождения между статистическими распределениями 1 и 2 [49,50,52,75]. Для дискретных распределений эта мера выражается формулой: Д\Мі 2)-І[Р(-ї„/4)-Р( / )] ІпйЦ ; (2.6) где J(x,;Ai,/V ) - информационная мера Кульбака, мера расхождения между двумя сташстическими распределениями значений признака х, при состояниях Л) и А:; P(xjA\) и Р(л1;/Л2) - вероятность наличия признака х„ значения которого л, пренадлсжат интервалу с номером $, при состояниях А] и А2; s - номер интервала значений признака х,.
При справедливости нулевой і ипотезы, т.е. о юм, что два распределения принадлежат одной генеральной совокупности, величина Дх,;АьА2) имеет асимптотически распределение у с s-І степенями свободы [49,50,75]. Эго позволяет вычислять не только степень, но и уровень значимости рашичий
Величина информативности Кульбака J(x;;Aj,A; ), будучи всегда положительной, отражает абсолютное значение (модуль) вклада данного интервала значений в приближение к любому правильному диагностическому порогу [47,49,50,52]. Применение данного критерия основывается на знании значений вероятностей, а не на знании параметров статистических выборок. В этом смысле критерий Кульбака можно отнести к непарамегрическим критериям различия. Кроме того, данный критерий является наиболее мощным из всех нспарачетрических, и выявляет различия распределений всегда, если они есть. Исследования, проведенные рядом авторов подтверждают [47,49,50,52], что не менее чем в 10% случаев различия двух распределений не выявляются параметрическими критериями, когда на самом деле различия устанавливаются критерием Кульбака.
Предеіавление количественных наблюдений в форме частот - одна из центральных проблем медицинской информатики. Ее решение позволяет не только адекватно сравнивать вариабельность выборок, извлеченных из разных распределений, но и эффективно извлекать и представлять знания в экспертных системах [47,49,50].
Частотные распределения котчестеешюго признака при анализе данных широко используются в основном в биометрике для представления больших объемов информации [15,42,45,49,50]. Чтобы получить такие распределения, диапазон изменения значений признака квантуется на равномерные интервалы, число которых зависит от количества наблюдений.
Для эффективного применения при распознавании, квантование диапазона значений признака должно быть таким, чтобы подчеркнуть наиболее значимую дифференциально-диаі ностическую информацию. Рассмотрим процедуру формирования интервальных и бинарных сіруктур для двух клинических ситуаций А/ и А,?, предлагаемую в [45,49,50].
Уточним полный диапазон изменения значений признака. С этой целью найдем наименьшее и наибольшее значения признака для всех клинических ситуаций: (7 = тик (2.7) где а - .минимальное значение из всего множества возможных значений {д-}, для всех рассматриваемых состояний Аь h - максимальное значение из всего множества возможных значений {.v}, для всех рассматриваемых состояний Ал; А(- состояние, клиническая ситуация; к- номер состояния.
Используя статистическое определение вероятности в диапазоне значений признака [а, Ь] предварительно введем такое разбиение на интервалы (рис. 1.1), чтобы ни в одном из них функция распределения вероятностей для каждой клинических сигуаций не принимала бы нулевое значение. Количество и длины таких интервалов могут быть любыми [45,49,50].
Найдем расстояние между функциями распределения вероятности в каждом интервале - AF,, а также сумму этих расстояний AF [45,49]: M -Y} /.1,)-1 /А,)\- (2.8) где Д1: - сумма расстояний между функциями распределения вероятности во всех шпервалах; AF, - расстояние между функциями распределения вероятности в интервале с номером/; ГД.т/А/) и F/i/Aj)-значения функций распределения вероятности признака х в интервале с номером/ для состояний А\ и Аз соотвеїственно; j - номер интервала. Для непрерывной величины, после интегрирования, AF носило бы смысл необщей площади между двумя распределениями плотности вероятности [49,50].
Предобрабогка меди ко - биолог и чес кил данных для нейросетевой количественной оценки риска
Математический аппарат нейронных сетей разработан для обработки числовой информации. Так как статистические данные содержат как качественные, так и количественные данные, для обучения нейронных сетей требуется предварительная обработка исходных данных. Кроме тою, как отмечаюсь в подразделе 1.4, исходные данные содержат пропуски, а для обучения входной вектор каждою примера должен иметь постоянную размерность.
Наличие пропущенных данных пациентов при сборе статистической информации может стать существенной преградой для использования нейронных сетей. Обучающий задачник, как и тестируемое множество должны содержать постоянное количество входных параметров для всех примеров. Поэтому, отбросив неполные примеры, можно использовать только приюдные для обучения данные. Однако в условиях ограниченности статистических данных, отбрасывая неполные примеры, можно лишиться ценной информации о соответствии некоторых значений входных данных распознаваемому состоянию. При обучении нейросети для использования в реальной клинической практике стоит выделить набор показателей, которые исследуются у всех пациентов, иначе ответ нейросети нельзя будет считать верным [39,82,83,85]. При наличии статистического материала с неполными данными оправданным будет восстановление пропущенных значений тех показателей, которые берутся для анализа у большинства больных.
Таким образом, предварительная обработка медико-биологической информации для обучения нейронных сетей должна проводиться в несколько этапов: 1. Отбор наиболее часто исследуемых лабораторных показателей; 2. Восстановление пропущенной информации в примерах задачника; 3. Предобработка качественной информации путем кодирования числовыми значениями наличия (1) либо отсутствия (0) признака; 4. Предобработка количественной информации, заключавшаяся в преобразованию к безразмерному виду, путем масштабирования к единой шкале (от 0 до 1).
При отборе примеров для восстановления пропусков также следует учитывать следующее. Каким бы точным или правдоподобным не был метод восстановления, чем меньший процент данных будет восстановлен, тем ближе к исходному будет данный пример. Поэтому, в условиях ограниченности статистики нужно найти компромиссный вариант, позволяющий отобрать достаточное для обучения и тестирования количество примеров с минимальным количеством пропусков.
На рис. 3.4 изображены зависимости количества входных векторов данных от их заполнения для двух рассматриваемых состояний больных ЖКБ, представленные в процентах.
Зависимость количества входных векторов данных от их заполнения (в процентах)
Данный рисунок хорошо представляет картину отсутствия части данных входных векторов. Видно, что примеров без пропусков практически нет, большая часть статистики содержит только половину признаков. Поэтому компромиссным вариантом можно считать 70-ти процентный порог заполнения вектора, при этом в нашем распоряжении будет около 70% примеров состояния А] и около 60% для состояния А2.
Заполнение значений качественных признаков можно провести следующим образом. Так как качественный признак, в основном, представляет информацию о наличии либо отсутствии той или иной патологии, то отсутствие и пропуск данных кодируется 0, а наличие - 1.
Для восстановления значений количественных показателей мы использовали методы моделирования данных, разработанные лабораторией неравновесных систем № 1.3 Института Вычислительного Моделирования СО РАН, и реализованные в программе «Итерационный факторный анализ: метод главных компонент» (FAMaster) [97,98,99]. Процесс заполнения пропусков в таблицах основан на итерационном построении интерполяционных моделей известных данных, сначала линейной, а затем на её основе и нелинейной модели, при этом возможна полиномиальная интерполяция, либо сплайн-интерполяция. Пусть задана таблица с пропусками A=(a,j), @ - пропущенное значение. Изначально ставится задача поиска наилучшего приближения А матрицей вида .\\Vj-rbj методом наименьших квадратов: Ф= (a;-\,v(-/);):- mm, (3.10) / и при этом в качестве начальных значений задаются DH- (злі) i.e.у- случайный, нормирован на I, п, , где tij - число известных данных в /-ом столбце, т.е. bj определяется как среднее значение в столбце. Далее, на основе интерполяционной модели данных линейного приближения строится вектор-функция /(/), минимизирующая функционал: ф= I К-/Д1«. л))2+«](Л »г злз) где а 0 - параметр сглаживания [97,98,99].
Однако, при восстановлении пропущенных значений числовых признаков программой FAMaster мы получили достаточно высокий процент «выпавших» из интервала изменения значений. Как уже упоминалось в подразделе 1.4, распределения вероятностей значений большей части признаков наиболее близки при аппроксимации к нормальному закону, однако имеются и распределения близкие к лої нормальному закону распределения. При более подробном рассмотрении данных методов восстановления обнаружилось, что при построении линейного приближения используются средние значения признаков [97,98,99]. Учитывая тот факт, что мы имеем как нормально распределенные, так и лої нормально распределенные данные, нами было предложено использовать не средние значения при построении линейного приближения, а наиболее вероятные значения признаков:
Компьютерный образ клинической ситуации
Процесс информационной поддержки принятия решений осуществляется в режиме выполнения системы АСКОР. Пользователь, посредствам созданных в режиме разработки проекта информационной системы бланков и базы знаний, формирует компьютерный образ состояния пациента, который распознается при помощи экспертного модуля. Основное окно АСКОР в режиме выполнения проекта изображено на рис. 5.1 ПРИЛОЖЕНИЯ 5. Процесс взаимодействия объектов системы в режиме выполнения схематично изображен на рис. 4.5.
В режиме выполнения пользователь (врач-клиницист) заполняет поля бланков, содержащих качественные и количественные признаки конкретною больного в соответствии с тем представлением, которое было заданно в режиме разработки. После заполнения каждою бланка информация, соответствующая определенной дате анализов, сохраняется в базе данных пациентов. Посредствам представления исходных данных пациента в соответствии с объектами базы знаний, формируется компьютерный образ состояния пациента. Результатом представления исходных данных для вероятностно-стаїистических стратегий распознавания является вектор состояния в вероятностном пространстве, для неиросетсвых .методов - вектор состояния пациента в нормированном пространстве значений.
Далее, используя решающие правила неиросетсвых и вероятностных моделей, происходит количественное сопоставление компьютерного образа состояния пациента с распознаваемыми образами заболеваний. Верояпюсгная модель распознавания в экспертном модуле представлена 3-мя стратегиями распознавания образов, подробно описанными в подразделах 2.5-2.7, нейросетевая модель представлена 3-чя архитектурами обученных нейросетей, описанными в подразделе 3.4. Использование 3-х нейросетевых архитектур дает более надежный результат, и результаты распознавания здесь мог т быть усреднены. Вероятностные стратегии дают разностороннюю количественную оценку распознаваемому образу пациента. Это достигается использованием априорных вероятностей состояний (стратегии Байеса и Вальда), учетом желаемого уровня ошибок распознавания (стратегия Вальда), а также использованием ранжированных по информативности одномерных и двумерных признаков в иоследоваїельньїх стратегиях распознавания образов (Вальда и многошаговая стратегия Байеса). Па рис. 5.2 ПРИЛОЖЕНИЯ 5 изображено окно экспертного модуля. Пользователю предоставляется возможность выбора используемых при распознавании методов и их параметров.
Как упоминалось в подразделе 2.8, для последовательных вероятностных стратегий (Вальда и многошаговая стратегия Байеса) важен порядок использования признаков, поэтому пользователю в режиме выполнения предоставляется возможность выбора признаков, это могут быть наборы факторов риска, найденных при разработке проекта, а также пользователь может использовать отдельные признаки. При этом указываются не только последовательности одномерных и двумерных признаков (для вероятностных методов), но и значения информативности и уровня значимости различий. Окно выбора используемых признаков изображено на рис. 5.3 ПРИЛОЖЕНИЯ 5. 11о окончании работы экспертного модуля пользователь получает отчет экспертизы, в котором содержаться: Паспортные данные рассматриваемою пациента (фамилия, инициалы, номер истории болезни, отделение больницы); Значения качественных и количественных признаков пациента в соответствии с бланками. Указывается наименование бланка, дата анализов, а также повышены или понижены значения количественных показателей, если в базе знаний содержится информация о границах референтного интервала; Цель экспертизы, в том числе развернутое описание распознаваемых состояний; Результаты распознавания образа состояния пациента, на основе которых и принимается решение об отнесении этою образа к одной из двух клинических ситуаций. Для вероятностных методов указывается название стратегии распознавания, количество используемых признаков и вероятности состояний при данном входном векторе состояния пациента. Для нейросегевых методов также указывается количество использованных признаков и количественная оценка соответствия вектора данных пациента распознаваемым состояниям.
Таблица признаков, в которой фиксированы вероятности каждого одномерного или двумерного признака при одном из состояний и отношения правдоподобия признака, которые, возможно, указывают на объект направления лечения.
Пользователю предоставлена возможность выбора, выводить в таблицу или нет, выводить все одномерные и двумерные признаки или только одномерные. Отношения правдоподобия, содержащиеся в таблице признаков, указывают, насколько характерны значения данного признака для одною из состояний: если величина отношения правдоподобия мною больше I - значения признака характерны для более тяжелою состояния; если величина отношения правдоподобия много меньше 1 - значения признака характерны для более легкого состояния. В качестве примера в ПРИЛОЖЕНИИ 6 приведен отчет экспертизы проекта «Оценка операционною риска у больных ЖКБ».