Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Сташевский Павел Сергеевич

Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости
<
Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Сташевский Павел Сергеевич. Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости: диссертация ... кандидата технических наук: 05.13.10 / Сташевский Павел Сергеевич;[Место защиты: Сибирский государственный университет телекоммуникаций и информатики].- Новосибирск, 2014.- 147 с.

Содержание к диссертации

Введение

1. Исследование особенностей подготовки управленческих решений в здравоохранении 10

1.1 Анализ процесса подготовки управленческих решений в здравоохранении 10

1.2. Обзор информационных систем в здравоохранении 20

1.3. Модель подготовки управленческих решений в здравоохранении 27

1.4. Результаты и выводы по главе 29

2. Постановка задачи поддержки принятия решений с использованием показателя риска популяционной заболеваемости 32

2.1. Анализ особенностей управленческих решений в здравоохранение2

2.2. Исходные данные, используемые при подготовке решений 37

2.3. Риск популяционной заболеваемости 40

2.4. Формальная постановка задачи поддержки принятия решений с использованием популяционного риска заболеваемости 44

2.5 Результаты и выводы по главе 45

3. Разработка математического обеспечения системы поддержки принятия управленческих решений 47

3.1. Вводные замечания 47

3.2. Вариативное моделирование многомерного показателя популяционного риска 48

3.3. Использование методов ИАД для расчета компонент риска 54

3.4. Организация структурированного хранения модельного обеспечения

3.5 Результаты и выводы по главе 64

4. Разработка компонент информационной системы для получения вектор-модели риска 65

4.1. Семиэтапный технологический процесс подготовки управленческого решения 65

4.2. Требования к разрабатываемым компонентам системы поддержки принятия решений 70

4.3. Общая архитектура системы 72

4.4. Особенности реализации компонентов СППР 76

4.5. Результаты и выводы по главе 80

5. Исследование применимости разработанного обеспечения 81

5.1. Применение методов ИАД для расчета компонент показателя популяционного риска 81

5.2. Применение показателя популяционного риска для задачи прогнозирования инфекционной заболеваемости

5.3 Генерация вариантов управленческих решений 100

5.4 Результаты и выводы по главе 113

Заключение 114

Список использованной литературы 115

Модель подготовки управленческих решений в здравоохранении

Анализ индикаторов, представленных в таблице 1.2 показывает, что с точки зрения процедур управления в системе здравоохранения наиболее часто используемым является заболеваемость различными патологиями [12, 38, 49], что связано со следующими причинами: 1. В информационных системах в здравоохранении собираются и консолидируются именно данные по заболеваемости, тогда как другие индикаторы (например, смертность, продолжительность жизни и др.) собираются в других прикладных системах и малодоступны. 2. Заболеваемость является информативным, объективным и точечным индикатором с точки зрения процедуры управления, тогда как продолжительность жизни или инвалидизация зависят от большего количества факторов и являются некоторыми итоговыми агрегирующими показателями, что затрудняет их применение для оперативного принятия управленческих решений. 3. Большинство отчетов и документации в системе здравоохранения направлены на сбор и передачу данных по заболеваемости между различными учреждениями здравоохранения. 4. Для исследователей в области здравоохранения наиболее доступными являются данные по заболеваемости.

В связи с этим в работе рассматривается подготовка управленческих решений в здравоохранении именно на базе данных о заболеваемости различными патологиями. Наиболее часто употребляемым в литературе и используемым в работе определением заболеваемости населения является следующее: заболеваемость - состояние населения, отражаемое данными о распространенности, структуре и динамике различных болезней, зарегистрированных среди населения в целом или в его отдельных группах (возрастных, половых, территориальных, профессиональных и др.) [84]. При изучении заболеваемости населения выделяют ряд показателей. Наиболее важные из них с точки зрения подготовки решений, используемые в работе, это следующие: 1. Общая заболеваемость - это совокупность случаев заболеваний среди определенных групп населения за календарный год. Единицей наблюдения является первичное обращение пациента к врачу по поводу конкретного заболевания в данном календарном году. Основным учетным документом является «Статистический талон для регистрации заключительных (уточненных) диагнозов» (ф.025-2/у). 2. Первичная общая заболеваемость - это совокупность случаев заболеваний, впервые выявленных за календарный год (как правило, рассчитывается на 1000, 10 000 или 100 000 человек). 3. Распространенность - это совокупность случаев заболеваемости, впервые выявленных за календарный год и перерегистрированных за прошлые года (на 1000, 10 000 или 100 000 человек).

При использовании характеристик заболеваемости как индикаторов были рассмотрены различные виды заболеваемости (см. табл. 1.3) и их особенности, влияющие на процесс подготовки управленческих решений. показателей заболеваемости взаимосвязи с учитываемыми факторами Ху, что говорит о необходимости разработки такого инструмента, который позволил бы на основании таких данных рассчитывать показатели, позволяющие автоматизировать и облегчить процедуру подготовки управленческих решений. Моделирование структуры и информационных потоков в субъектах управления

Подготовка решений в здравоохранении характеризуется сложными информационными потоками, происходящими в субъекте управления S (в системе здравоохранения). При этом субъект управления представляет собой сложную иерархическую систему, где на разных уровнях различными учреждениями здравоохранения и медицинским их управленческим персоналом принимаются решения, влияющие на состояние здоровья населения Н.

По результатам анализа различных источников [11, 48, 74, 75, 89, 95] и исследования деятельности лечебно-профилактических и управленческих учреждений при организации работы регистров хронических патологий на территории Новосибирской области и республики Бурятия (регистр хронической почечной недостаточности, регистр сахарного диабета, регистр нарушений сердечно-сосудистой деятельности, регистр онкопатологий) была получена трехуровневая структурная модель, представленная на рис. 1.2, описывающая взаимодействие учреждений, персонала и внешней среды при решении задач здравоохранения.

Формальная постановка задачи поддержки принятия решений с использованием популяционного риска заболеваемости

Результаты исследований, приведенные в п. 2.1, 2.2, 2.3, позволяют выполнить формальную постановку задачи Z в виде четырехэтапного процесса подготовки управленческих решений в здравоохранении с использованием популяционного риска заболеваемости населения (рис. 2.4), предполагая, что решение задачи происходит лицом, принимающим решения на одном из уровней системы здравоохранения.

На первом этапе подготовки решения происходит конкретизация параметров задачи Z=(Pzi,...,PZ6) с участием ЛПР, влияющих на дальнейшую процедуру подготовки управленческих решений.

Второй этап решения заключается в проведении процедур выбора исходных данных D, включающих в себя информативные индикаторы состояния здоровья Y и другие учитываемые факторы Ху, состоящие из различных групп данных. При этом в работе используются данные регистров хронических патологий и инфекционной заболеваемости, а также климатические данные для получения некоторых моделей, учитывающих климатический фон.

Третий этап включает в себя обработку и анализ исходных данных с расчетом показателей популяционного риска заболеваемости /, состоящих в общем случае из трех компонент: Iw - факторов возникновения риска, Ir -степень устойчивости возникновения риска, 1р - прогноза риска. Тогда можно ввести в рассмотрение функцию Fi, которая на основании задачи Z и набора исходных данных D позволяет получить показатели риска заболеваемости:

Рассмотрены различные задачи подготовки управленческих решений, выполняемые на различных уровнях субъекта управления. Выполнена параметризация задачи Z. Предложена параметризация управленческих решений на основе полученных параметров задачи Z.

Рассмотрены основные группы данных учитываемых факторов Ху, а также информативных индикаторов о состоянии здоровья населения 7 и их особенности, используемые при подготовки управленческих решений в здравоохранении.

Предложен многомерный показатель популяционного риска заболеваемости / в виде набора характеристик, позволяющий выполнять комплексную оценку и содержащий набор факторов риска с величинами их значимости, степень устойчивости возникновения риска и набор прогнозных значений числа случаев заболеваемости.

Дана формальная постановка задачи подготовки управленческих решений как четырехэтапная процедура, включающая в себя конкретизацию параметров задачи Z, сбор исходных данных D, расчет компонент популяционного риска / и формирование множества вариантов решений Ri,...,Rk.

Автоматизация процесса поддержки принятия управленческих решений в здравоохранении позволит упростить процесс подготовки решений для ЛПР и снизить влияние внутренних субъективных факторов на получаемый результат.

В связи с большой разнородностью исходных данных, используемых в процессе подготовки решений, необходима разработка универсальной процедуры предобработки, позволяющей данные из различных групп сравнивать и использовать для расчета популяционного риска.

Предложенное новое представление популяционного риска, позволяющее более полно характеризовать его для ЛПР, предполагает разработку нового алгоритмического и модельного обеспечения, для проводения расчета различных компонент оценки риска.

В третьей главе рассматриваются вопросы разработки математического (модельного и алгоритмического) обеспечения, ориентированного на решение задач подготовки вариантов управленческих решений с использованием популяционного риска заболеваемости в рамках системы поддержки принятия решений в здравоохранении.

Согласно введенным во второй главе обозначениям и формальной постановке задачи, при разработке математического обеспечения должны быть решены следующие задачи: 1) Расчет компонент многомерного показателя популяционного риска в зависимости от условий исходной задачи Z. При этом следует учитывать, что в силу разнородности и большого количества данных, сложности предметной области, необходимости расчета различных компонент риска и получения адекватного и качественного решения, предлагается одновременно использовать несколько разных моделей. 2) Организация структурированного хранения и автоматического выбора необходимых методов и моделей при расчете компонент показателя популяционного риска в связи с использованием большого количества моделей. 3) Генерация вариантов управленческих решений на основе рассчитанных значений компонент популяционного риска и параметров исходной задачи Z, на основе которых ЛПР сможет сформировать комплекс необходимых мероприятий в системе здравоохранения.

В связи с рассмотренной спецификой, в работе было предложено использовать подход вариативного моделирования (VM) для расчета компонент показателя популяционного риска и методы интеллектуального анализа данных (ИАД), которые рассматриваются в п. 3.2-3.3. Для этого предложено использовать метод моделетеки для организации хранения модельного обеспечения (п. 3.4) и процедуры получения итоговых значений и нечеткого вывода для генерации возможных вариантов управленческих решений (рассматривается в 5 главе).

Вариативное моделирование многомерного показателя популяционного риска Вариативное (от англ. variety - разнообразие, разновидность), или вариантное моделирование (VM) (объекта) есть метод, основанный на замене исследуемого объекта-оригинала набором разнообразных моделей и одновременном их применении [31, 32, 33 ]. Отличительная особенность вариативного моделирования от обычного (классического) заключается в том, что обязательным является построение и совместное применение в процессе моделирования не менее двух разных моделей исследуемого (моделируемого) объекта. Это могут быть модели разных классов, одного класса, но разных типов, сложности; использующие разные уровни описания объекта, разные средства и технологии их построения, интерпретации и применения и т.п.

Использование методов ИАД для расчета компонент риска

Для исследования применимости методов ИАД в работе были проведены серии экспериментов по построению прогнозных моделей для инфекционной заболеваемости (общей, а также отдельных инфекционных патологий) и хронической почечной недостаточности. В частности, были проведены следующие серии экспериментов: 1. Построение моделей краткосрочного прогноза общей инфекционной заболеваемости для городов Челябинск, Екатеринбург, Барнаул, учитывающих как ретроспективные данные заболеваемости, так и погодные факторы, на массивах данных, содержащих тысячи записей за несколько лет. 2. Построение моделей краткосрочного прогноза заболеваемости ОКИ и сальмонеллезом для городов Екатеринбург и Челябинск, учитывающих погодные факторы, на массивах данных, содержащих тысячи записей за несколько лет. 3. Построение моделей средне- и долгосрочного прогноза заболеваемости ХПН для Новосибирской области и Республики Бурятия, учитывающих ретроспективные данные заболеваемости за более чем 10 лет. 4. Исследование влияния учитываемых факторов (погодные факторы для инфекционной заболеваемости, пол и возраст для ХПН) на динамику заболеваемости в рамках экспериментов 1-3.

Выбор исследуемых методов ИАД, используемых при построении модельного обеспечения для моделирования показателей популяционного риска, был обусловлен следующими факторами:

Дерево принятия решений используется для создания классификационных и прогнозных моделей. Структура дерева представляет собой следующее: на ребрах («ветках») дерева решения записаны атрибуты, от которых зависит целевая функция, в «листьях» записаны значения целевой функции, а в остальных узлах — атрибуты, по которым различаются случаи. Чтобы классифицировать новый случай, надо спуститься по дереву до листа и выдать соответствующее значение. Деревья решений - это способ представления правил в иерархической последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение. Под правилом понимается логическая конструкция, представленная в виде «если ... то ...». Область применения деревьев решений в настоящее время широка, но все задачи, решаемые этим аппаратом могут быть объединены в следующие три класса: 1. Описание данных: хранение описания объектов в компактной форме. 2. Классификация: отнесение объектов к одному из заранее известных классов. Целевая переменная должна иметь дискретные значения. 3. Регрессия: если целевая переменная имеет непрерывные значения, деревья решений позволяют установить зависимость целевой переменной от независимых(входных) переменных.

В работе для построения деревьев решений был использован алгоритм CART (Classification and Regression Trees), где каждый узел дерева решений имеет двух потомков. На каждом шаге построения дерева правило, формируемое в узле, делит заданное множество примеров (обучающую выборку) на две части - часть, в которой выполняется правило (потомок - right) и часть, в которой правило не выполняется (потомок - left). Для выбора оптимального правила используется функция оценки качества разбиения.

В качестве критериев качества построенных деревьев помимо ошибки прогноза, применяемой для всех методов, использовались высота и ширина построенных деревьев, позволяющих оценить «ветвистость» построенных деревьев.

С помощью метода деревьев решений были построены модели для общей инфекционной заболеваемости, которые, учитывая погодные факторы (среднесуточные атмосферное давление, относительная влажность и температура), позволяют спрогнозировать класс заболеваемости (и его усредненное численное значение в количестве случаев заболеваемости) на краткосрочный период: неделя или месяц. Использование классов (по сути прогноз динамики заболеваемости) связано с тем, что на основании погодных данных получить точные прогнозные модели не представляется возможным из-за большого влияния еще других факторов на заболеваемость. Подробное описание параметров серий экспериментов представлено в таблице 5.2. В рамках экспериментов исследовались различные комбинации используемого алгоритма CART для построения деревьев решений: соотношений тестовой и обучающей выборки, способа сокращения «ветвистости дерева» (ограничение на глубину при построении дерева и минимальная стоимость отсечения) и меру неоднородности, используемую при выборе узла для расщепления (индекс Джини и энтропия).

В итоге проведенных экспериментов были получены результаты, представленные в табл. 5.3. Использование энтропии в качестве меры неоднородности давет более низкий процент средней ошибки и существенно снижает сложность дерева, что является немаловажным качеством. Особенно заметна разница в средней точности деревьев выборок 95\5 - там она составляет почти 30%. Наилучшими же вариантами для каждого из городов оказались деревья, обученные на выборке 95% и использующие энтропию в качестве меры неоднородности (Барнаул - 74%, Челябинск - 78%, Екатеринбург

Кроме того, стоит отметить, что для данной проблемы деревья не справились с одной из своих задач - обеспечить наглядность и лёгкую интерпретацию (рис. 5.1). Из-за большой ширины деревья невозможно увидеть целиком, то есть невозможно охватить всё решение сразу визуально, что можно отнести не к недостаткам метода, а к неуниверсальности для различных задач в этом плане. Рис. 5.1 - Пример структуры построенного дерева решений (Барнаул)

Байесовский классификатор— широкий класс алгоритмов классификации, основанный на принципе максимума апостериорной вероятности. Для классифицируемого объекта вычисляются функции правдоподобия каждого из классов, по ним вычисляются апостериорные вероятности классов. Объект относится к тому классу, для которого апостериорная вероятность максимальна. Байесовский подход к классификации основан на теореме, утверждающей, что если плотности распределения каждого из классов известны, то искомый алгоритм можно выписать в явном аналитическом виде.

В работе из совокупности байесовских методов классификации используется наивный байесовский классификатор, основанный на строгом применение теоремы Байеса со строгими (наивными) предположениями о независимости переменных. На самом деле, в контексте решаемой задачи, это не является абсолютно истинным утверждением, поскольку погодные факторы могут зависеть друг друга, тем не менее делается допущение о независимости исследуемых факторов.

Требования к разрабатываемым компонентам системы поддержки принятия решений

Расчет важности в работе происходит с помощью процедуры нечеткого вывода. Выбор данного инструмента связан со следующими причинами: 1) в данном случае мы имеем дело с семантической нечеткостью понятий «степень устойчивости значений риска» и «прогноз риска», для которых разные специалисты могут выставлять различные численные значения, 2) невозможно, используя значения степени устойчивости и прогноза риска, сформировать одну обобщенную аналитическую функцию для расчета важности каждого из решений - использование семантики этих понятий предпочтительнее, 3) для получения важности решений необходимо использование экспертных знаний по применению того или иного решения. Рассмотрим основные этапы нечеткого вывода для получения важности решений. Обобщенную постановку задачи для процедуры вывода можно представить следующим образом: необходимо формализовать процедуру каждого из вариантов управленческих решений на основе информации о значениях степени устойчивости риска 1Г и прогноза количества случаев 1Р.

Описания лингвистических переменных «вероятность риска», «прогноз риска» и «важность управленческого решения» были формализованы следующим образом, представленным в табл. 5.14. С помощью синтаксических правил G базовое терм-множество Т лингвистических переменных «прогноз риска» и «важность управленческого решения» было расширено до 5 нечетких переменных: низкая, ниже среднего, средняя, выше среднего и высокая. В данном случае структура переменной «прогноз риска» приведена для общей инфекционной заболеваемости (абсолютная заболеваемость на 100 000 чел. для Челябинска). Для других патологий отличаются функции принадлежности для базового терм-множества Т (для ХПН описание переменной рассматривается в примере в 5 главе). Также важность управленческого решения рассмотрена безотносительно конкретных вариантов решений, поскольку для каждого множество высокая средней, высокая На рисунке 5.6 приведен вид функций принадлежности для рассматриваемых переменных. Сильное наложение трапецевидных функций для нечетких переменных из базового терм-множества Т обусловлено тем, что таким образом мы уменьшаем степени неопределенности при попадании значения в область пересечения нечетких переменных, что не позволяет искусственно уменьшить значимость управленческого решения в результате операции импликации. Трапецивидные функции задаются и хранятся в базе знаний системы с помощью четверки чисел (a,b,c,d) по формуле, представленной в таблице 5.14, для каждой переменной хранится полное терм-множество, которое используется в процедуре нечеткого вывода.

Функция принадлежности переменной «Важность» Рис. 5.6 - Функции принадлежности лингвистических переменных Основой для проведения операции нечеткого логического вывода является база правил, содержащая нечеткие высказывания в форме "Если-то" и функции принадлежности для соответствующих лингвистических термов. При этом должны соблюдаться следующие условия: 1. Существует хотя бы одно правило для каждого лингвистического терма выходной переменной. 2. Для любого терма входной переменной имеется хотя бы одно правило, в котором этот терм используется в качестве предпосылки (левая часть правила).

При соблюдении этих условий мы получим полную базу нечетких правил, в противном случае возможна ситуация, когда для заданных входных значений вероятности и прогноза будет невозможно найти правил вывода.

Особенностью решаемой задачи является то, что в процессе нечеткого вывода базу правил необходимо сегментировать в связи с наличием в ней правил для различных видов управленческих задач и рассматриваемых патологий. В связи с этим в работе перед операцией нечеткого вывода вводится этап выбора сегмента базы нечетких правил, выполняемый аналогично выбору вариантов управленческих решений на предыдущем этапе, - на основе типа задачи Pzi (прогноз, оценка и т.д.) и по вида патологии Таї происходит поиск подмножества нечетких правил для процедуры нечеткого вывода.

Наполнение базы нечетких правил происходило с участием экспертов, как специалистов предметной области (специалисты Министерства здравоохранения, главные врачи региональных и специализированных ЛПУ, сотрудники государственного научного центар «Вектор»), так и специалистов в области обработки данных (специалисты кафедры вычислительной техники НГТУ). В таблице 5.15 приведено описание состава экспертов для формирования нечеткой базы знаний. При этом была использована следующая процедура:

1) Для всех сочетаний термов переменных (3x5=15 комбинаций) «устойчивость» и «прогноз» каждым из экспертов была проставлена важность для всех управленческих решений в нечетких терминах (низкая, средняя, выше среднего, высокая), тем самым мы получили мнения экспертов Зі,...,3п по полному набору правил для базы знаний.

2) Формирование итогового постусловия (важности) всех правил происходило выбором наиболее частотного значения со взвешиванием мнений экспертов, где мнению специалиста предметной области (здравоохранения) присваивался вес равный двум, а специалисту области обработки данных - единице.

3) После расчета итогового значения терма выходной лингвистической переменной, происходил расчет согласованности мнений экспертов как доли итогового решения среди всех предложенных экспертами вариантов. Значение согласованности сохраняется как вес правила, который в дальнейшем используется в процедуре нечеткого вывода.

Так, для рассматриваемой задачи прогнозирования общей инфекционной заболеваемости в г. Челябинск для управленческого решения «проведение профилактических мероприятий» была получена база нечетких правил, представленная в табл. 5.16. Каждая строка таблицы соответствует нечеткому правилу. Например, 12 строку можно интерпретировать следующим образом: если значение устойчивости высокое и значение прогноза ниже среднего, то значение важности решения «проведение профилактического мероприятия» = ниже среднего и вес этого правила (уровень доверия) составляет 0,7. База нечетких правил хранится в базе знаний системы для каждого варианта управленческих решений, при этом связывание и соответственно выбор необходимых правил происходит с помощью идентифкатора шаблона решений

Рассмотрим предложенный в работе механизм нечеткого вывода на основе формализованных лингвистических переменных и базы нечетких правил. В общем случае механизм логического вывода включает четыре этапа: 1) введение нечеткости (фазификация), 2) нечеткий вывод, 3) композиция (импликация) и 4) приведение к четкости, или дефазификация (см. рис. 5.7). Алгоритмы нечеткого вывода различаются главным образом видом используемых правил, логических операций и разновидностью метода дефазификации. В работе используется модель нечеткого вывода Мамдани с фиксированными способами импликации и дефаззификации, которые показали хорошие результаты в экспериментах.

Похожие диссертации на Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости