Содержание к диссертации
Введение
1 Особенности разработки систем поддержки принятия медицинских решений 16
1.1 Вводные замечания 16
1.2 Неопределенность при обработке медико-технологических данных в задачах поддержки принятия медицинских решений 19
1.3 Методы получения статистической медицинской информации для управленческих медицинских решений 24
1.4 Применение теории нечетких множеств для представления медицинских знаний 31
1.5 Анализ медицинских информационных систем и систем поддержки принятия медицинских решений 36
1.6 Выводы по главе 1 45
2 Применение алгоритма нечеткой кластеризации для исследования данных медико-технологического процесса 47
2.1 Вводные замечания 47
2.2 Задача анализа статистических данных в информационной системе медицинского назначения в условиях неопределенности 50
2.3 Применение кластеризации для анализа статистической информации медико-технологического процесса 53
2.4 Алгоритм нечеткой кластеризации в задаче поддержки принятия медицинских решений 58
2.5 Оценка качества нечеткой кластеризации 66
2.6 Использование алгоритма нечеткой кластеризации в системе поддержки принятия медицинских решений 70
2.7 Выводы по главе 2 75
3 Построение медицинских экспертных систем сопровождения медико-технологического процесса 77
3.1 Вводные замечания 77
3.2 Структура системы поддержки принятия медицинских решений в условиях неопределенности 79
3.3 Схема построения смешанной медицинской экспертной системы 83
3.4 Формирование модели состояния здоровья пациента в медицинских экспертных системах 86
3.5 Медицинская система поддержки принятия решения на основе алгоритма нечеткой кластеризации 96
3.6 Результаты применения разработанной методики для сопровождений медико-технологического процесса 101
3.7 Выводы по главе 3 106
4 Программная реализация алгоритмов обработки статистических данных медико-технолигических процессов в интеллектуальных медицинских системах . 108
4.1 Вводные замечания 108
4.2 Выбор вариантов течения заболевания на базе программного комплекса поддержки принятия решений на основе нечеткой логики «Эксперт 4. Обработка статистических данных медико-технологических процессов методом нечеткой кластеризации» 109
4.3 Оценка состояния здоровья пациента посредством медицинской системы поддержки принятия решений на базе применения нечеткой логики «Эксперт 4» 112
4.4 Автоматизированная информационная система медицинского назначения «Эксперт» 114
4.5 Выводы по главе 4 117
Заключение 119
Список сокращений 122
Список использованной литературы 123
Приложение 137
- Неопределенность при обработке медико-технологических данных в задачах поддержки принятия медицинских решений
- Применение кластеризации для анализа статистической информации медико-технологического процесса
- Формирование модели состояния здоровья пациента в медицинских экспертных системах
- Автоматизированная информационная система медицинского назначения «Эксперт»
Неопределенность при обработке медико-технологических данных в задачах поддержки принятия медицинских решений
Современные медицинские учреждения в процессе своей деятельности накапливают огромные объемы данных, которые связаны как с лечебно-диагностическими, так и организационно-управленческими характерами медико-технологического процесса. Результативность и эффективность ПМР зависит от анализа и обработки этих данных. Работа с большим количеством медицинской информации в условиях различных ограничений, таких как временные и финансовые ресурсы, а также под влиянием изменения внешней среды является довольно сложной задачей. Решение этой проблемы на современном этапе видится в применении МИС, ключевым звеном в которых являются СППМР [30, 102].
СППМР - это совокупность процедур и методов, разработанных для сбора, хранения, обработки и анализа медицинской информации с целью помощи ЛПМР в ПМР в медико-технологическом процессе [16]. Например, информационная поддержка медицинских работников при заполнении, просмотре, исправлении, анализе и поиске интересующей их информации, а также консультативная помощь врачу при постановке диагноза, ВТЗ и др.
В медицинской области ПМР заключается в процессе выбора оптимального из возможных решений для достижения поставленных целей медицинского персонала как в лечении пациентов, оказании медицинской помощи и справочной поддержке медицинских обслуживаний, так и в управлении деятельностью медицинского учреждения в целом [23, 29, 31, 36, 102]. Все медицинские решения медико-технологического процесса, принимаемые в медицинских учреждениях, можно разделить на:
- лечебно-диагностические;
- организационно-управленческие (таблица 1.1).
Для решения вышеприведенных задач требуется учет многих факторов от ЛПМР, что влечет за собой больше затрат (временных, интеллектуальных и финансовых ресурсов) для медицинского учреждения [29, 31, 52]. Очень часто в процессе ПМР труднейшей проблемой, с которой сталкиваются ЛПМР, является неопределенность, которая представляет собой причины врачебных ошибок, приводящих к дальнейшему усугублению проблемной ситуации. В основном неопределенность в задачах ППМР возникает по многим причинам [26, 30, 77, 102], основные факторы из которых представлены в таблице 1.2.
Процесс ПМР для ЛПМР характеризуется индивидуальностью и зависит от многих факторов как субъективных, так и объективных. В случае, когда медицинские решения принимаются только на основе имеющегося опыта или понимании ЛПМР (правильные или похожие на медицинскую проблемную ситуацию, которая происходила в прошлом времени), новые альтернативы неумышленно будут упущены, хотя указанный подход позволяет эффективно экономить временные и финансовые ресурсы.
Эти решения характеризуются субъективностью суждения и являются интуитивными. В случае, когда ЛПМР может точно определить любое альтернативное решение в рассматриваемой проблемной ситуации, медицинские решения принимаются в условиях определенности. Однако это редко встречается или не существует в реальных условиях. На практике проблемные ситуации часто происходят незакономерно, например, анафилактическая реакция у пациентов может произойти после инъекции, для пациентов после операции могут появиться осложнения и т.д. Кроме того, полученные медико-технологические данные носят сложный характер, их формализация затруднена, например, медицинская информация, полученная от пациента, имеет нечеткий вид: «очень/не очень больно», «много/немного», «примерно несколько дней» (пациент не может точно определить промежуток времени проявления болезни) и др. Поэтому невозможно оценить и определить альтернативы. При этом медицинские решения принимаются в условиях неопределенности.
При обработке медико-технологических данных о медицинской предметной области медико-технологического процесса в задачах ППМР неопределенность зачастую характеризуется следующим образом:
- неполнота существующих медицинских знаний о проблемной ситуации, а также о СЗП (неполнота данных анамнеза, отсутствие или неполнота результатов медицинских анализов и др.);
- неточность или противоречивостью медицинской информации (ошибка в результатах медицинских анализов или результаты противоречивы, полученная информация от пациента неточна и др.);
- реакция организма пациента, а также внешней среды, на действия ЛПМР непредсказуема;
- неточность понимания цели ЛПМР (при осуществлении выбора ВТЗ).
Неопределенность при обработке медико-технологических данных является особенностью задач ППМР [36], самым главным правилом которой является не избежание, а снижение уровня неопределенности. Для уменьшения неопределенности требуется:
- дополнительная медицинская информация о проблемной ситуации (возможно использование накопленного опыта ЛПМР или статистики, суждений или интуиции ЛПМР);
-уточнение имеющей медицинской информации (повторно провести медицинский анализ или дополнительный анализ);
- информация о действиях ЛПМР, совершаемых в полном соответствии с прошлым опытом (при отсутствии ресурсов для сбора дополнительной информации).
В медицинской предметной области для принятия рационального решения необходимо учитывать факторы неопределенности и не зависеть от имеющегося опыта, а также факторы изменения окружающей среды. В связи с этим ЛПМР необходимо выполнить объективный аналитический процесс, включающий последовательное выполнение следующих действий (рисунок 1.1).
Таким образом, в условиях неопределенности к ППМР относятся [30]:
- поддержка ЛПМР при анализе и диагностике проблемной ситуации;
- поддержка ЛПМР при учете неопределенности медицинской информации;
- генерация в конкретной проблемной ситуации альтернатив, из которых осуществляется отбор множества рациональных вариантов решений;
- оценка по определенным критериям рациональных вариантов решений, соответствующих предпочтениям ЛПМР;
- помощь ЛПМР в выборе оптимального медицинского решения. Процесс ПМР (как лечебно-диагностических, так и организационно-управленческих) носит характер, связанный с ответственностью ЛПМР, т.е. ЛПМР несут полную ответственность за МУР, а также за результаты их выполнения. МУР отображают эффективность работы ЛПМР и непосредственно влияют на ресурсы медицинских учреждений. ЛПМР для принятия МУР необходим объективный анализ медицинской проблемной ситуации на основе полученной медицинской информации, связанной с решаемой медицинской проблемой. При этом получение статистической медицинской информации о медицинской проблемной ситуации адекватными методами является одним из важных шагов в процессе принятия МУР.
Применение кластеризации для анализа статистической информации медико-технологического процесса
В настоящее время в медицинской области при осуществлении анализа накопленных статистических данных широко и успешно применяются методы кластерного анализа [32]. Одной из медицинских задач, которая эффективно решается с использованием указанного подход, и является задача формирования набора вариантов течения заболевания для выработки рекомендательной базы дальнейших медицинских действий, производимых с пациентом [44].
Задача кластерного анализа (или кластеризации) - разбиение множества объектов исходных данных на группы «похожих» объектов по их характеристикам, называемые кластерами. Каждый объект данных предметной области это q,eQ, i = 1,n, здесь Q - множество исходных данных, описываемый вектором т характеристик вида
Каждый кластер cljeCL, j = 1,k, где CL - множество кластеров; к количество кластеров, представляет собой подмножество «похожих» объектов по характеристикам из множества Q. Таким образом, решение задачи кластеризации можно рассматривать как построение оптимального разбиения п объектов данных предметной области на к кластеры «похожих» объектов данных.
В медицинской области, как правило, медицинские данные имеют и количественные (измерение МП, интервалы…) и качественные (статус пациента, СЗП и др.) характеристики. Поэтому необходимо выделить наиболее точные характеристики для объектов данных и выполнить нормализацию характеристик путем уменьшения размерности пространства. В итоге представляются объекты данных характеристическими векторами.
Для определения степени «похожести» объектов данных используется для каждой пары q., qj расстояние diq,q.) между ними, которое является результатом использования определенной метрики в пространстве их характеристик.
Выбор метрики в пространстве объектов исходных данных является серьёзной проблемой в задачах кластеризации [2, 83]. Метрика - математическая модель сходства объектов, и её выбор во многих случаях не однозначен. Следовательно, выбор метрики необходимо осуществлять в зависимости от пространства, где находятся объекты данных предметной области, а также от скрытых характеристик кластеров.
Метрика Евклида, используемая для определения расстояния между точками пространства характеристик, и удовлетворяет всем аксиомам расстояния; удобна для определения расстояния между двумя точками (именно объектами по их характеристикам); не учитывает распределение точек в кластере; позволяет не учитывать знаковые различия, пропорционально увеличивает расстояние между объектами в случае разных абсолютных значений показателей. Довольно часто если кластеры представляются областями в виде гиперсфер, и все координаты объекта данных непрерывны и вещественны, используется метрика Евклида
Результаты разбиения необходимо представлять в наглядном виде, чтобы было удобно производить их оценку. В зависимости от алгоритмов результаты разбиения объектов данных можно представить в виде: графов, диаграмм или таблиц.
Важной проблемой в задачах кластеризации является оценка качества разбиения объектов на кластеры. Для решения этой проблемы имеются различные методы, основные из которых это: сравнение результатов (кластеров), полученных различными алгоритмами; использование различных критериев для оценки результатов кластеризации.
В общем кластерный анализ производится по следующим этапам:
- 1-ый этап: отбор выборки объектов данных предметной области;
- 2-ой этап: определение характеристик объектов данных;
- 3-ий этап: выбор метрики для вычисления степени «похожести» между объектами;
- 4-ый этап: применение метода кластеризации для разбиения объектов на кластеры;
- 5-ый этап: представление полученных результатов анализа.
Существует множество алгоритмов кластеризации в настоящее время [2, 10, 13, 48, 49, 58, 83, 106, 108]. На рисунке 2.1 приведен обзор таксономии алгоритмов кластеризации.
В условиях неопределенности медицинские данные имеют нечеткие характеристики [30]. При осуществлении мониторинга статистических медицинских данных эффективно применяются методы нечеткой кластеризации, которая позволяет каждому объекту данных принадлежать различным кластерам с некоторым значением нечеткой функции принадлежности [102].
Бесспорное преимущество нечеткой кластеризации заключается в определении объектов, которые находятся на границе кластеров, то есть, нечеткая кластеризация позволяет обнаружить пересекающие кластеры. Однако для слабоструктурированной исходной медицинской информации традиционные подходы к нечеткой кластеризации не позволяют получить адекватные решения [24, 27, 32]. Известные алгоритмы основаны на допущениях, таких как: существует часть центра кластеров (особенная точка внутри кластеров); кластеры имеют определенную форму, определенную выбранным алгоритмом; разбиение объектов на кластеры осуществляется при учете взаимосвязей между центрами кластеров и объектами данных. Однако на практике форма кластеров может быть произвольной, центры кластеров отсутствуют и/или невозможно определить центральную часть кластеров.
Таким образом, для преодоления вышеприведенных недостатков необходима разработка методики нечеткой кластеризации, которая позволит получить наилучшее решение соответствующее определенным критериям с использованием нечеткой функции принадлежности [69, 101, 102].
Формирование модели состояния здоровья пациента в медицинских экспертных системах
В СППМР автоматизированная оценка СЗП является довольно затруднительной в связи с неопределенностью исходной информации, а также достигаемых целей. При этом необходимо применение теории нечетких множеств. При построении СППМР на основе нечеткой логики, включая и МЭС, важной проблемой является представление и использование знаний, которыми обладают врачи-эксперты и инженеры по знаниям.
В медицинской области обычно строятся модели представления медицинских знаний с помощью семантической сети [52].
Автоматизированная оценка СЗП в СППМР должна осуществляться с учетом [9, 66]: результатов опроса пациентов лечащим врачом; данных предварительного обследования пациентов; результатов измерений медицинской аппаратурой; формализованных медицинских выводов и закономерностей. В связи с этим, для оценки СЗП необходимо построение модели СЗП.
В разрабатываемой СППМР семантическая сеть, представляющая общую модель СЗП, описана следующим образом [46, 66, 73, 75]:
М = {С,Щ, (3.1)
где С - множество медицинских характеристик (множество значений МП); R -множество дуг, которые связывают медицинские характеристики в модели СЗП. К медицинским характеристикам относятся: физические, микробиологические и химические параметры внутренних и внешних факторов СЗП, состояния эпидемиологической ситуации, окружающей пациента, условия, в которых происходит его лечение и т.д.) [71]. При этом каждая из дуг представляет собой отношения между медицинскими характеристиками. Примером является отношение между ситуациями или взаимная связь между ситуациями, указывающая степень зависимости одной ситуации от другой, а также взаимосвязь ситуаций и действий из медицинской предметной области. Как выше указано, медицинская информация характеризуются нечеткостью, следовательно, в системах представления знаний модель СЗП необходимо представлять на базе нечеткой логики с нечеткими объектами и отношениями между ними, для чего требуется определить нечеткий объект, задав при этом его неопределенные и фиксированные атрибуты, а также модель с соответствующими нечетким и четким множествами [66].
Множество медицинских характеристик С включает объекты о.
семантической сети, каждый из которых можно представить следующим образом:
Os={N,A,Ro], (3.2)
здесь N - название медицинских характеристик в модели СЗП; А - множество атрибутов, входящих в медицинскую характеристику; 1 - множество, которое содержит значения отношений между атрибутами А и характеристиками N.
В ходе лечения пациента врач выполняет множество действий. В главе 4, пункт 4.3 представляются примеры действий врача. Для каждого пациента формируется индивидуальная программа лечения, которая представляет собой определенную последовательность действий, направленных как на выздоровление пациента, так и на улучшение общих характеристик СЗП. Каждому действию врача соответствует одна или несколько моделей получения данных, которые могут носить регистрационный, расчетный или опросный характер. В процессе сопровождения пациента для получения значений характеристик, которые описывают текущее состояние как СЗП, так и среды, в которой пребывает пациент до и после диспансеризации, применяются различные источники и каналы информации. В основном, их можно разделить на следующие формальные способы получения данных: расчет с применением математических моделей; данные медицинской статистики; получение результатов медицинских анализа; анамнеза пациента. Однако независимо от своего источника значений, важности и характера принадлежности, элементы этих множеств можно представить как частный случай общей модели СЗП М [73]. При этом для /-ого пациента формула (3.2) переписывается: где 0\ - у-я медицинская характеристика /-го пациента; N - название медицинской характеристики в модели состояния здоровья /-го пациента; А -множество атрибутов, входящих или связанных в медицинские характеристики; R0j - множество отношений между атрибутами А1 и характеристиками N .
В медицинской практике для каждого конкретного пациента даже для достаточно опытного врача бывает затруднительно определить степень значимости атрибутов для оцениваемой медицинской характеристики, поэтому в СППМР отношения между атрибутами характеристики строятся с помощью различных степеней зависимости. Типы градуируемых связей рассматриваются как нечеткие объектные связи [71, 76].
Множество R определяется двойкой следующего вида: где RA - нечеткое множество, которое показывает степень зависимости между медицинской характеристикой СЗП и степенью значимости медицинских характеристик для оценки общего СЗП в конкретной ситуации (значимостью атрибутов); К = {к1,к2) - тип критерия оценки медицинской характеристики, который определяет два вида: критерий оценки ситуации - к1 и критерий оценки действий (рекомендации) - к2.
Нечеткое множество RA определяется следующим образом: С={ (4 )4 Л }, (3.5) где j = 1,nA; пА - количество понятий в медицинской характеристике; А) атрибуты, принадлежащие медицинской характеристике. Согласно вышесказанному, медицинская характеристика О) может быть поставлена в соответствие критерию о) с фиксированными и неопределенными атрибутами: где N) - информационная часть у-ой медицинской характеристики СЗП; А) множество понятий, принадлежащих -ой медицинской характеристике /-го пациента; кді - тип критерия оценки; ju (Л ., ,) - отношение близости между понятием А\ и названием медицинской характеристики N\. На основе связей между всеми понятиями критериев оценки будет строиться зависимость между узлами. Представим нечеткое отношение, описывающее близость понятий относительно друг друга, следующим образом:
Для /-го пациента на основе нечеткого отношения (3.7) строится нечеткое множество R A: здесь к- количество понятий медицинских характеристик в СППМР.
Модель СЗП - знания СППМР о пациенте, предназначенные для организации процесса выборки и выдачи необходимой информации для врача пользователя. Эта модель считается моделью актуального на настоящий момент состояния знаний (о пациенте и ситуации для анализа), представляет собой «идеальную» модель знаний о пациенте, включающую знания о предметной области, когнитивных механизмах и типичных ошибках [46, 50, 51, 53, 68, 75]. Модель СЗП должна включать следующие знания: общая характеристика пациента (как физического, так и социального индивидуума), не зависящая от предметной области (возраст, пол, социальное положение, специальность, уровень образования и т.п.); значимость полученных рекомендаций из найденных наборов для пациента (т.е. насколько полно пациенту подходят рекомендации для дальнейших действий); история хранения информации о пациенте в системе [66]. К начальному состоянию СЗП требуется полный набор формализованных знаний по СЗП до начала его обследования и лечения, включая данные анамнеза и данные истории болезни в случае, когда у пациента рецидив. На рисунке 3.5 представлена схема процесса формирования модели СЗП
Автоматизированная информационная система медицинского назначения «Эксперт»
Автоматизированная информационная система медицинского назначения «Эксперт» разработана на базе нечеткой логики. В составе системы содержатся подсистемы, в том числе подсистема выбор ВТЗ (часть 4.2) и подсистема оценка СЗП (часть 4.2).
С помощью автоматизированной информационной системы медицинского назначения «Эксперт» возможно решить следующие медицинские задачи:
- вести электронную историю болезни;
-осуществлять эффективный анализ статистической медицинской информации;
- оказывать консультационную помощь врачу в ППМР при выборе ВТЗ, а также курса лечения пациента и дальнейшую его корректировку;
- осуществлять построение МБЗ для оценки СЗП;
- производить формирование отчетов и уведомлений.
Автоматизированная информационная система медицинского назначения «Эксперт» успешно внедрена в Государственном бюджетном учреждении Рязанской области «Областной клинический противотуберкулезный диспансер» (ГБУ РО ОКПТД), г. Рязань (акт внедрения от 26.12.2017) (см. Приложение 3).
Разработанная система, защищена авторским правом [92], была реализована с использованием СУБД Microsoft Access и Microsoft Visual Studio, которые хорошо зарекомендовали себя для решения прикладных медицинских задач.
В структуру автоматизированной информационной системы медицинского назначения «Эксперт» для медицинского учреждения включено несколько блоков (подсистем), каждый из которых решает определенную медицинскую задачу:
- блок ведения электронной истории болезни;
- блок ведения анамнеза и особенностей социальной среды проживания пациентов;
- блок консультационной помощи (ППМР) при выборе ВТЗ, курса лечения пациента и его корректировке;
- МЭС сопровождения медико-технического процесса, на основе которой осуществляется оценка СЗП;
- блок подготовки статистической отчетности и уведомлений.
На рисунке 4.3 представлена структурная автоматизированной информационной системы медицинского назначения «Эксперт».
В работе системы позволяется ведение электронной истории болезни пациента при его поступлении в медицинском учреждении. В случае, когда пациента не зарегистрирован, то в систему добавляется новая электронная учетная карточка, или его карточка находится в системе. При этом в зависимости от номера участка куда направлен пациента выбирается отдел медицинского учреждения (в котором врач его осмотрит).
В системе вносятся и сохраняются все данные о пациенте: персональные данные (включая социальный статус, место работы и должность, категория населения, декретированные больные); анамнеза и особенностей социальной среды проживания пациента; результаты медицинского анализа; информация о лечащем враче, поставленном диагнозе, назначенных курсах лечения и др. Эта информация используется для работы других блоков (ППМР при выборе ВТЗ, оценка СЗП) и подготовки статистической отчетности.
Нормирование накопленных данных в виде МП для выбора ВТЗ осуществляется с участием эксперта-врача и инженера по знаниям. На основе модифицированного метода нечеткой кластеризации (глава 2) система позволяет реализовать разбиение исходное множество данных на кластеры. Результаты нечеткой кластеризации выдают наборы ВТЗ. Наиболее близкое разбиение к шаблону из набора берется в качестве ВТЗ. Если результаты разбиений значительно отличаются от шаблона для конкретного диагноза, то системой выдается ранжированный список наиболее подходящих вариантов в отношении других диагнозов. При этом врач может либо добавить в МБЗ системы новый ВТЗ, либо рассмотреть вариант с другим диагнозом.
С помощью разработанной МЭС, которая входит в состав системы, возможно осуществлять выбор курса лечения и его корректировку в зависимости от текущего СЗП. Для этого, в системе на основе собранной информации о пациенте формируется модель СЗП на базе семантической сети (часть 3.4), а также МБЗ для оценки СЗП (части 3.2 и 3.4).
Блок подготовки статистической отчетности и уведомлений, включающий в систему, позволяет формировать многие различные виды отчетности (более 20 видов статистической, более 30 видов оперативной и более 40 регламентированной отчетности). Тем не менее, возможно добавлять в систему новые отчеты, а также автоматически формируются уведомления.
Таким образом, автоматизированная информационная система медицинского назначения «Эксперт» успешно внедрена в Государственном бюджетном учреждении Рязанской области «Областной клинический противотуберкулезный диспансер» (ГБУ РО ОКПТД), г. Рязань. С помощью системы, разработанной в диссертационной работе повышена точность выбор ВТЗ, а также эффективность лечения пациентов в целом.