Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Системный анализ и обработка информации медицинских регистров в регионах Хромушин Виктор Александрович

Системный анализ и обработка информации медицинских регистров в регионах
<
Системный анализ и обработка информации медицинских регистров в регионах Системный анализ и обработка информации медицинских регистров в регионах Системный анализ и обработка информации медицинских регистров в регионах Системный анализ и обработка информации медицинских регистров в регионах Системный анализ и обработка информации медицинских регистров в регионах Системный анализ и обработка информации медицинских регистров в регионах Системный анализ и обработка информации медицинских регистров в регионах Системный анализ и обработка информации медицинских регистров в регионах Системный анализ и обработка информации медицинских регистров в регионах
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Хромушин Виктор Александрович. Системный анализ и обработка информации медицинских регистров в регионах : Дис. ... д-ра биол. наук : 05.13.01 Тула, 2006 348 с. РГБ ОД, 71:06-3/181

Содержание к диссертации

Введение

ГЛАВА 1. Информационное обеспечение анализа последствий техногенных катастроф 13

1.1. Медицинские последствия техногенных катастроф на примере аварии на Чернобыльской атомной электростанции 13

1.2. Информационная поддержка (методология, алгоритмы и программное обеспечение по сбору, верификация) и анализ медицинских данных 27

ГЛАВА 2. Объект и методы исследования 35

ГЛАВА 3. Пути оптимизации медицинских регистров и обеспечение высокой достоверности данных 41

3.1. Пути информационной оптимизации медицинских регистров 41

3.2. Принципы обеспечения достоверности данных 44

ГЛАВА 4. Поэтапный анализ данных медицинских регистров: методология и алгоритмы 59

4.1. Методология поэтапного анализа данных регистра 59

4.2. Анализ данных на основе оценки значимости переменных 62

4.3. Сравнительный частотный анализ не сочетанных причин на предварительном этапе исследований данных медицинских регистров 67

4.4. Анализ сочетанного влияния факторов 70

4.5. Прогноз влияния последствий техногенных катастроф на перинатальную смертность населения на примере территорий Тульской области с правом на отселение за 2000 -2004 годы 73

4.6. Построение математических моделей на основе кросс-табуляции многомерного отклика с взвешенной оценкой 80

4.7. О возможности применения анализа с разбивкой факторов на группы 84

4.8. Особенности применения алгебраических моделей 87

ГЛАВА 5. Структура управления аналитическими работами областного уровня 114

5.1. Сбор и верификация данных в регистр 114

5.2. Организация аналитических работ 115

5.3. Основные направления совершенствования организационной структуры аналитических работ 116

ГЛАВА 6. Оценка результатов разработки и внедрения региональной информационной системы мониторинга рождаемости и смертности населения 121

6.1. Регистр смертности населения 121

6.2. Регистр рождаемости населения 134

6.3. Пути совершенствования мониторинга рождаемости населения 142

6.4. Регистр перинатальной смертности населения 147

6.5. Программа дополнительной верификации данных регистра смертности населения 152

6.6. Программа ANSSD для частотного анализа множественных причин смерти населения 156

6.7. Аналитическая программа AMCL 160

6.8. Прочие программы для мониторинга рождаемости и смертности 162

ГЛАВА 7. Рождаемость и смертность населения тульской области при изучении последствий чернобыльской аварии: математические модели и анализ 166

7.1. Предварительное исследование поэтапного анализа причин смерти 166

7.2. Аналитический расчет множественных причин смерти 180

7.3. Уточненный аналитический расчет 201

7.4. Углубленный математический анализ с использованием алгебраических моделей 206

7.5. Оценка результатов аналитических расчетов 207

Заключение 212

Выводы 222

Практические рекомендации 224

Список литературы 225

Приложения 262

Введение к работе

Актуальность проблемы. В последнее десятилетие состояние здоровья населения Российской Федерации ухудшилось: упал уровень рождаемости, возросли заболеваемость и смертность населения, сохраняется низкая ожидаемая продолжительность жизни. В докладе [92] о состоянии здравоохранения в Европе сказано о Российской Федерации и других странах европейской части территории бывшего СССР, что «В условиях мирного времени прецедентов в изменениях такого масштаба просто не существует, причем в этих странах данные процессы совпали с радикальными социально-экономическими преобразованиями».

В условиях демографического кризиса одной из важных задач является изучение медико-демографических процессов и, прежде всего, смертности и рождаемости, в том числе во взаимосвязи с последствиями техногенных катастроф. Так, например, в Тульской области (ТО) показатели смертности (случаев на 1000 населения) в 1999 - 2004 гг. соответственно равны 20,3; 21,0; 21,5; 21,8; 22,6; 21,7, что значительно превышает показатели по РФ 14,7; 15,4; 15,6; 16,3; 16,4; 16,0 за эти же годы, а также по Центральному Федеральному округу (ЦФО) 18,5; 17,9; 17,4 за 2002 - 2004 гг. Показатели рождаемости (случаев на 1000 населения) по ТО в 1999 - 2004 гг. соответственно равны 6,5; 6,8; 7,2; 7,4; 7,9; 7,9, что заметно ниже показателей по РФ 8,3; 8,7; 9,1; 9,8; 10,2; 10,4 за эти же годы, в том числе по ЦФО 8,5; 8,7; 9,0 за 2002 -2004 гг.

В настоящее время важным направлением работ по медицинской информатике является создание различных регистров, отражающих актуальные проблемы здравоохранения, и развертывание аналитических работ с использованием их данных. В Тульской области (ТО) функционируют следующие медицинские регистры, материалы которых являются базовой основой развернутых аналитических работ:

1. Государственный медико-дозиметрический регистр (РГМДР) по ТО (федеральный регистр).

  1. Регистр сахарного диабета (РСД) ТО (федеральный регистр).

  2. Регистр смертности населения ТО (областной регистр).

  3. Регистр перинатальной смертности населения ТО (областной регистр).

  4. Регистр рождаемости населения ТО (областной регистр). Результаты анализа являются основой для принятия обоснованных

управленческих решений.

Проблематика указанных направлений определена:

загрязненностью значительной территории ТО в результате аварии на Чернобыльской атомной электростанции (ЧАЭС);

высокой заболеваемостью сахарным диабетом, существенно снижающим качество жизни человека;

усугубляющимся демографическим кризисом.

Анализ данных медицинских регистров сопряжен с проблемой их достоверности. В частности, обеспечение высокой достоверности данных по рождаемости и смертности населения, их международной сопоставимости достигаются как за счет научных разработок [30, 72, 186], методических материалов [31, 208, 210], обучения специалистов [188], так и применения новых компьютерных технологий, позволяющих наряду с вводом данных осуществлять контроль их достоверности, включая автоматический выбор первоначальной причины смерти.

Статистика смертности во всем мире основывается чаще всего на одной -первоначальной причине, что не отражает механизма происходящих патологических процессов. Как правило, смерть вызывается не одним заболеванием, а комплексом болезней, связанных друг с другом. Известно, что многие осложнения основного заболевания и сопутствующие болезни оказывают определенное значение на наступление смерти. Анализ этих множественных причин позволяет выявить степень их влияния на наступление смерти, планировать медицинскую помощь и принимать управленческие решения, направленные на снижение смертности. Однако множественные причины

7 смерти недостаточно изучены из-за отсутствия специальных программ и баз данных.

Уровень перинатальной смертности (ПС) является одним из основных показателей, отражающих качество медицинской помощи беременным и новорожденным [11, 27, 70, 98, 127, 150] и совокупное действие множества факторов, влияющих на состояние здоровья женщин [201, 204, 227, 283, 287]. Несмотря на достижения в современном акушерстве, проблема ПС остается актуальной в мире [296, 300J и в нашей стране [149, 269]. ПС сохраняет свою медико-социальную значимость и требует специального, системного анализа с целью уточнения стратегии службы по ее снижению. Сложившиеся социально-экономические условия не могли не сказаться на уровне перинатальных потерь [149, 269]. В Тульской области, как и в целом по России в последние годы удалось закрепить стойкую тенденцию к снижению ПС, но, несмотря на это, показатель ее остается высоким [178].

Для выявления путей снижения ПС важно изучить все случаи смерти детей в перинатальном периоде для их систематизации и выработке рациональных мер профилактики. Это диктует необходимость проведения системного анализа причин и факторов риска ПС на региональном уровне.

Сложная демографическая ситуация в Российской Федерации, в том числе в ТО, характеризует важность мониторинга рождаемости, позволяющего осуществлять углубленный анализ данных и на основе его принимать управленческие решения. Следовательно, проблема анализа множества факторов, влияющих на состояние здоровья женщин [204, 227, 283] продолжает сохранять свою медико-социальную значимость и не может быть решена без массивов достоверной информации о рождаемости.

Одним из важных проблемных направлений является мониторинг больных сахарным диабетом. В докладе [92] Всемирной Организации Здравоохранения (ВОЗ) за 2002 г. отмечено, что сахарным диабетом страдают около 22,5 млн. взрослых в Европейском регионе, и в большинстве стран по-

8 казатели его распространенности быстро увеличиваются. Более того, изменился сам характер диабета, так если раньше его мишенью были преимущественно лица старших возрастов, то сейчас он стал поражать и людей в первой половине жизни. Созданный в Тульской области (2002 г.) регистр сахарного диабета позволил накопить важную для последующего анализа информацию.

Важным направлением работ, имеющим большую научную значимость, имеет изучение последствий аварии на ЧАЭС на здоровье населения [120, 121]. С этой целью в РФ создан РГМДР, который настоящее время является самой крупной в России медицинской информационно-аналитической системой, где хранится, обрабатывается и ежегодно пополняется персональная информация более чем на 600 тыс. граждан РФ [175], подвергшихся воздействию радиации. РГМДР имеет многоуровневую иерархическую структуру, которая охватывает всю территорию России через региональные центры, областные и районные отделения, ведомственные регистры. Это позволяет получать медико-дозиметрическую информацию по единой технологии из более чем 4000 медицинских учреждений страны. По мнению Федеральной службы по надзору и защите прав потребителей и благополучия человека основной целью работы регистра является «проведение исследований по оценке влияния радиационного фактора на заболеваемость и смертность пострадавшего населения, объективная оценка ущерба здоровью граждан России вследствие чернобыльской и других радиационных аварий, выработка оптимальной стратегии минимизации медицинских последствий» [175]. Важность проводимых работ отмечена в докладе правительства Российской Федерации (2003 г.) на Генеральной Ассамблее Организации Объединенных Наций N56/109 по вопросу укрепления международного сотрудничества и координация усилий в деле изучения, смягчения и минимизации последствий чернобыльской катастрофы. Накопленные в базе регистра данные за все годы после аварии на ЧАЭС, проводимые на их основе аналитические работы [120, 121, 151, 227, 274, 293], включая когортные исследования, указывают

9 на заметное влияние загрязненности территорий радионуклидами на здоровье человека.

ТО в результате аварии на ЧАЭС имеет значительную площадь загрязнения радионуклидами (11,6 тыс. кв. км.), при этом плотность загрязнения рай-онов ТО существенно различается, достигая до 3-4 раз в отношении Cs и до 7-8 раз в отношении 1311 [151]. Данные РГМДР по ТО (по состоянию на август 2005 г. имеется 40372 карты диспансерного наблюдения, из них 1977 карт на участников ликвидации аварии) дополняет детализированная информация региональных регистров общей и перинатальной смертности, позволяющая проводить углубленный анализ влияния радиоактивного загрязнения территорий ТО на здоровье населения.

Важной особенностью эксплуатации регистров является решение организационно-методических проблем обеспечения сбора и верификации данных. Их решение обеспечивает полноту и качество информации. Большая роль в этом отводится программному обеспечению.

Цель работы. Разработка теоретических основ обеспечения сбора и обработки информации медицинских регистров. Создание программно-методического обеспечения информационно-аналитических систем и проведение анализа смертности населения, проживающего на территориях с правом на отселение.

Задачи исследования.

  1. Установить механизм оптимально эффективного функционирования медицинских регистров по проблемным направлениям здравоохранения в Тульской области.

  2. Разработать алгоритмы углубленного анализа и оценки медицинской информации.

  3. Разработать программное обеспечение регистров для сбора, верификации и хранения данных рождаемости и смертности населения.

  4. Разработать аналитическое программное обеспечение обработки информации, накопленной в регистрах.

  1. Создать информационно-аналитическую систему поэтапного многофакторного анализа данных медицинских регистров, обеспечивающую высокий уровень достоверности информации.

  2. Произвести анализ влияния проживания населения на территориях Тульской области с правом на отселение на структуру смертности.

Научная новизна.

  1. Впервые создан алгоритм построения алгебраической модели в многоточечном пространстве с переходом в пространство предикатов по различным оптимизирующим критериям.

  2. Предложена методология поэтапного многофакторного анализа и обработки данных медицинских регистров, обеспечивающая построение математических моделей и достоверное выявление отличий целевого и не целевого пространства изучаемой проблемы.

  3. Создано программное обеспечение для проведения мониторинга рождаемости и смертности населения с множественными причинами смерти и возможностью автоматического определения первоначальной причины смерти с накоплением верифицированных данных за 2000-2004 гг.

  4. Разработана и внедрена в практику здравоохранения методология управленческой системы сбора, верификации и анализа медицинских данных регистров по проблемным направлениям здравоохранения.

  5. На основе баз данных по проблемным направлениям здравоохранения ТО и созданного пакета аналитических программ построены математические модели, характеризующие территории ТО с правом на отселение.

Научно-практическая значимость реализации результатов работы.

Создана научно-обоснованная методология анализа данных медицинских регистров, алгоритмы и программное обеспечение для нее.

Создана и функционирует информационно-аналитическая система, обеспечивающая углубленный анализ данных регистров по проблемным вопросам здравоохранения, обеспеченная организационно-методической

11 структурой сбора, верификации, передачи и хранения формализованной информации.

Проведенный анализ данных по смертности населения ТО, проживающего на территориях с правом на отселение, указывает на отличия в структуре множественных причин смерти. Построенные математические модели позволяют количественно оценить степень влияния сочетанных факторов.

Полученные данные РГМДР, РСД, регистров рождаемости, общей и перинатальной смертности и результаты анализа легли в основу планирования работ по минимизации медицинских последствий аварии на ЧАЭС по ТО. Основные положения, выносимые на защиту

1. Информационно-аналитическая система мониторинга рождаемости и
смертности высокой достоверности.

2. Система управления сбором, верификации и анализа данных региональ
ных регистров по проблемным направлениям здравоохранения.

3. Модели, методы и алгоритмы поэтапного анализа данных медицинских
регистров.

  1. Алгебраическая модель углубленного анализа медицинских данных.

  2. Отличия в структуре смертности населения Тульской области, проживающего на территориях с правом на отселение, выявленные в результате анализа верифицированных медицинских данных.

Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих конференциях и совещаниях:

конференция "Экологические проблемы Тульского региона". Тула, 2002 г.;

4-ая региональная научно-практическая конференция: "Современные проблемы экологии и рационального природопользования в Тульской области. Тула, 2004;

научно-практическая конференция "Современные инфрокоммуника-ционные технологии в системе охраны здоровья". Московская область, 2003;

III национальный конгресс по профилактической медицине и валеоло-гии. С.-Петербург, 1996;

IV национальный конгресс по профилактической медицине и валеоло-гии. С.-Петербург, 1997;

межрегиональная научно-практическая конференция "Актуальные проблемы территориального здравоохранения". Тула, 2004;

шестой Российский форум "Мать и дитя". Москва, 2004;

всероссийская конференция «Проблемы защиты населения и территорий от чрезвычайных ситуаций». Красноярск, 1997;

международная научно-практическая конференция «Приборостроение-97». Винница-Симеиз, 1997;

V конгресс по пульмонологии. Москва, 1997;

международный экологический конгресс. Москва, 1996;

всероссийская научно-практическая конференция «Биотехнические, медицинские и экологические системы и комплексы». Рязань, 1996;

научно-практическая конференция «Здоровье студентов как комплексная проблема: медицинские, экологические и социальные аспекты». Тула: ТГУ, 1996;

научно-практическая конференция «Тула историческая: прошлое и настоящее» (секция «Тульская наука: вчера, сегодня, завтра»), посвященная 850-летию г. Тулы (25.04.94).- Тула, 1996.

конференция «XXII научная сессия, посвященная Дню Радио». Тула, 2004;

форум «Новые медицинские технологии в практику первичного звена здравоохранения». Тула, 2005.

Публикации. Результаты диссертационной работы опубликованы в 56 работах, из них 23 в научных изданиях, рекомендуемых ВАК.

Информационная поддержка (методология, алгоритмы и программное обеспечение по сбору, верификация) и анализ медицинских данных

В настоящее время существует большое многообразие различных математических средств для анализа данных [3, 4, 6-7, 9-10, 12-15, 20-21, 24-26, 36, 39, 41, 43, 50-51, 53-60, 64, 66-69, 76, 77, 81, 89, 93-97, 99-102, 104, 106-108, 110-111, 125-126, 128-132, 135, 137, 143-145, 147-148, 154, 156, 158, 161, 164, 165, 171-174, 179-181, 184-185, 195, 199, 205-206, 209, 213-216, 218, 220-222, 224, 226, 229, 231, 257, 270-273, 276-279, 295, 297, 299, 312, 321-324]. Такой широкий выбор с одной стороны открывает большие возможности перед исследователем, а с другой затрудняет правильный их выбор в целевых исследованиях при методологической не проработанности. В силу этого многие исследователи выбирают свой путь применительно к специфике поставленной задачи.

В частности, в работе [143] авторы оценки медико-экологической ситуации используют корреляционный, кластерный, дискриминантный анализ, анализ временных рядов, регрессионный анализ информации по различным нозологическим формам заболеваемости с отображением при помощи геоинформационной системы. Формирование индексов комфортности осуществлялась по каждой из рассматриваемых нозологических форм и экологических показателей, а затем осуществлялась свертка. Аналогичный подход использовался нами [81, 83, 86, 202] для анализа данных в медицине катастроф. Данный подход требует знания коэффициентов, учитывающих значимость каждой нозологической формы. Их выбор с требуемой достоверностью для мониторинга рождаемости и смертности крайне затруднен.

В настоящее время с большим успехом в исследовательской работе используются нейросетевые алгоритмы [66-67]. Прогресс в построении удачных нейросетевых моделей исследуемых явлений, полностью базирующихся на экспериментальных данных, позволяет их применять для поставленных исследовательских задач. Здесь наиболее полно проявляются замечательные свойства искусственных нейронных систем: массивная параллельность обработки информации, ассоциативность памяти и возможность к обучению на опыте. Это открывает новые перспективы для систематизации многочисленной экспериментальной информации.

Использование нейросетей требует их обучения. В частности для обучения с «учителем» без обратных связей используют многослойные персептро-ны для аппроксимации функций и классификации; соревновательные сети, карты Кохонена для сжатия данных и выделения признаков. Для обучения с обратными связями без «учителя» используют рекуррентные аппроксимато-ры для предсказания временных рядов и обучения в режиме on-line; сети Хопфилда для ассоциативной памяти, кластеризации данных и оптимизации.

Среди нейросетевого программного обеспечения можно выделить следующие:

1. Пакет программ NeuralWorks Professional II Plus. Это одна из последних версий программного продукта NeuralWorks, разработанного фирмой NeuralWare. Пакет содержит программные модели десятков архитектур нейронных сетей.

2. Пакет программ ExploreNet 3000. Разработка фирмы HNC, основанной профессором Робертом Хехт-Нильсеном. Пакет предоставляет широкие возможности по моделированию и управлению данными. 3. Оболочка NeuroShell 2.0. Достоинством этой программы является совместимость с популярным пакетом управления данными Microsoft Excel, что делает продукт удобным для массового использования.

Несмотря на большие потенциальные возможности, сетевые алгоритмы сложны в использовании по сравнению с алгоритмами, базирующихся на прямых расчетах, таких как АМКЛ.

Применение современных информационных технологий накладывает ряд ограничений на методы анализа, преобразований и тематической интерпретации данных. В первую очередь, это связано с необходимостью комплексной обработки больших объемов качественной и количественной информации различной физической природы. Анализ методов обработки такой информации показывает, что в концептуальном и прикладных аспектах одним из эффективных подходов является применение процедур корреляционно-экстремального типа [63, 147] в силу их высокой потенциальной помехоустойчивости и простоты программно-аппаратной реализации. Суть их заключается в сопоставлении измеряемой (регистрируемой) информации с множеством эталонных (полученных ранее) данных с целью поиска представителя множества, «ближайшего» к анализируемой информации в смысле некоторой взвешенной близости. Использование многомерных признаковых пространств и установление веса (значимости) каждого признака, как правило, могут обеспечивать, с одной стороны, инвариантность к различного рода деформациям при изменении условий регистрации, с другой, - адекватность используемой модели конкретной прикладной интерпретации данных.

Вместе с тем, процедуры классификации, основанные на сравнении с эталонами, имеют ряд недостатков, и главный из них - высокая комбинаторная сложность, т.е. большое число переборов возможных ситуаций.

В работе [40] предлагается подход к сокращению числа операций сравнения с эталонами за счет предварительной обработки множества эталонов, а именно: «похожие» с заданной степенью близости эталоны объединяются в группы; на этапе распознавания (классификации) выбирается ближайшая группа, и перебор осуществляется только внутри выбранной группы. Дальнейшее понижение числа переборов возможных сравнений осуществляется путем иерархического разбиения заданного набора эталонов, т. е. на каждом уровне иерархии каждая группа эталонов может содержать несколько подмножеств, которые в свою очередь, представляют совокупности близких в смысле некоторой меры элементов. Необходимо отметить, что обработка эталонной информации осуществляется до этапа классификации, т. е. нет ограничений реального масштаба времени, а из этого следует возможность рационального выбора вида и величины меры близости, используемой при разбиении множества эталонов.

Данный подход использовался нами для анализа медицинских данных и построения экспертных систем [133, 134] в области пульмонологии с использованием созданных упрощенных технических средств [22, 47, 48] сбора информации с использованием сети [251]. Однако для анализа множественных причин смерти такие методы сложно использовать из-за специфики данных и характера поставленной цели.

Эффективным методом, широко используемым в анализе медицинских данных, является метод «случай-контроль». Имея базу, например, по рождаемости и смертности, исследователь может выбрать случаи в диапазоне кодов МКБ-10. Для контроля из базы можно выбрать записи по генератору случайных чисел, совпадающими по полу, территории проживания и дате рождения с точностью полгода.

Данный подход применим к поставленным задачам исследования. Тем не менее, данные регистров фактически являются сплошным статистическим наблюдением, что позволяет надеяться на высокую точность оценки при выборе подходящей методологии исследований. Метод «случай-контроль» оптимален при дефиците данных и не оптимален для регистров с данными сплошного наблюдения.

Сравнительный частотный анализ не сочетанных причин на предварительном этапе исследований данных медицинских регистров

Практическая работа с массивами данных по Тульской области подсказала путь использования на первоначальном этапе простых (грубых) средств анализа [233] с целью выявления проблемных вопросов с последующим поэтапным анализом более сложными (тонкими) математическими методами, включая построение математической модели на конечном этапе [232, 240, 241].

Предлагаемый метод анализа основан на вычислении частоты случаев и является по существу модификацией АОЗП. Он прост в реализации и позволяет выбрать направления последующего анализа.

Алгоритм предварительного анализа на примере анализа не сочетанных причин смерти [33] заключается в следующем: J. Формируется исходный массив данных, в котором имеются данные о принадлежности населенного пункта постоянного проживания к территории с правом на отселение и указан пол, возраст и признак принадлежности причины смерти (первоначальной или множественной, в зависимости от выбранного характера исследований) к классу МКБ-10. В информационной базе должны кодироваться все причины смерти. Принадлежность кода множественной причины смерти одному из 19 классов фиксируется одной единицей, включая случаи с несколькими причинами внутри одного класса. На этапе предварительного анализа 20-й класс не используется, так как при правильном кодировании причин смерти число случаев в 19 и 20 классе должны быть равны. В случае отсутствия точной даты смерти возраст вычисляется по дате выдачи медицинского свидетельства о смерти.

2. Подсчитывается число одинаковых строк в массиве данных для каждого сочетания значений признака принадлежности к загрязненной территории и признака принадлежности к выбранному классу причин смерти, полу и возрасту.

3. Подсчитывается число случаев смерти отдельно для загрязненных территорий и для всех остальных территорий (не загрязненных) для тех же условий (пола и возраста).

4. Рассчитывается частота путем деления числа одинаковых строк по п. 2 на число случаев по п. 3 для одноименных территорий по загрязненности.

5. По данным пункта 4 вычисляем нижнюю и верхнюю границы доверительного интервала (по Стыоденту) при доверительной вероятности 0,95.

6. Выделяем пары причин смерти (загрязненных и не загрязненных) с не перекрывающимися доверительными интервалами (от нижней до верхней границы). Тем самым выделяем только достоверно определенные причины. 7. Определяем мощность достоверно определенных причин для выделенных пар по п. 6 как разность их частот.

8. Повторяют пункты 2-7 для другого класса причин смерти, пола и иного (при необходимости) диапазона возрастов.

Основные направления совершенствования организационной структуры аналитических работ

Важной особенностью организации работ является необходимость постоянной работы по следующим направлениям работ:

- совершенствованию программного обеспечения регистров;

- обучению специалистов;

- освоению новых математических средств анализа;

- освоению новых аналитических программ;

- созданию собственных алгоритмов и аналитических программ;

- совершенствованию методологии анализа. Важным также является решение проблемных вопросов:

- исключение дублирования сбора информации;

- эффективная координация работ;

- укрепление материально-технической базы сбора, накопления и анали за информации медицинских регистров.

Работы по совершенствованию программного обеспечения регистров, прежде всего, стимулируются необходимостью повышения качества первичной информации. Ввод информации должен сопровождаться контролем, выявляющим не только простые ошибки, но и интеллектуальные, непосредственно связанные с медицинскими знаниями. Программное обеспечение должно максимально помогать медицинскому работнику в формировании исходной информации. В определенной степени программное обеспечение должно приближаться к экспертным системам, т. е. иметь вложенные знания.

В частности, созданное и используемое нами программное обеспечение для мониторинга рождаемости и смертности в ТО позволяет на этапе ввода данных практически исключить ошибки за счет встроенных тестов, а для регистра смертности - дополнительно за счет автоматического выбора первоначальной причины смерти. Такой режим в регистре смертности, используя основной принцип, три правила кодирования и 6 модификаций, существенно облегчает работу врача по кодированию причин смерти, однако не в полной мере решает проблемы подготовки данных для анализа множественных причин смерти. Так, например, выполняя требования правила модификации А («Старость и другие не точно обозначенные состояния») автоматический режим правильно определит первоначальную причину не принимая во внима 118 ниє код R54. Однако, как одна из причин смерти, она не должна присутствовать в анализе множественных причин смерти. Для исключения такого рода ситуаций нами используются встроенные тесты, которые с одной стороны контролируют весьма небольшую долю ошибок в кодировании, когда автоматический режим не в состоянии определить первоначальную причину смерти, а с другой стороны - стремятся свести кодирование к идеальному варианту: использованию общего принципа кодирования.

Другой стороной вопроса качества первичной информации является уровень подготовки специалистов, как операторов, так и медицинских работников. Грубой ошибкой, встречающейся в практике ведения регистров, является попытка исправить выявленные при вводе информации ошибки (например, ошибки кодирования множественных причин смерти) силами оператора. Его не подготовленность в медицинских вопросах приводит к ошибкам. Знания медицинского работника также нуждаются в совершенствовании, особенно по кодированию множественных причин смерти.

Вопросы повышения достоверности статистики смертности населения на уровне субъекта Российской Федерации, включая обучение, подробно рассмотрены в диссертации [186]. Разработанная и постоянно действующая система включает в себя регулярную экспертизу заполнения медицинских свидетельств о смерти, совершенствование программного обеспечения регистра, экспертизу базы данных, обучение «учителей» и экспертов. Если рассматривать систему с позиций углубленного анализа информации с целью принятия управленческих решений, то ее можно дополнить аналитическими работами. Результаты анализа не только нужны для достижения поставленной цели, но и для верификации данных. В процессе проведения аналитических работ можно выявлять на общем фоне резко отличающиеся территории, что может быть связанно с нерешенностью организационных проблем, недостаточной обученностью или необходимостью детального анализа ситуации на выявленной территории.

Регистры являются важными источниками информации, прежде всего для углубленного анализа, а не только для статистики. Особенно ценным является возможность стыковки различных регистров, что позволяет дополнять исходный массив ценной информацией. В частности, регистр смертности в ТО используется нами для корректировки данных в РГМДР и РСД. Как специализированный регистр с высоким уровнем достоверности данных он, несомненно, имеет преимущества перед фрагментарными встроенными в федеральные регистры программными модулями.

Углубленный анализ должен быть предметом постоянного внимания специалистов и органов управления здравоохранением. Для этого предлагается заранее разрабатывать перечень аналитических исследований, готовить методики и программное обеспечение. Это позволит сразу после получения данных за отчетный период выполнить аналитические расчеты и на их основе своевременно выработать управленческие решения. Выполнение широкомасштабного анализа не может сводиться к уникальным расчетам, поскольку они требуют значительных затрат времени и высокой квалификации разносторонних специалистов. Учитывая эти обстоятельства, нами создан пакет программ по анализу данных региональных регистров (рождаемости и смертности), а также методология поэтапного анализа.

Работы по освоению новых математических средств анализа, новых аналитических программ, созданию собственных алгоритмов и аналитических программ, а также работы совершенствованию методологии анализа предлагается проводить параллельно с текущими аналитическими расчетами, подготавливая следующий уровень анализа.

Программа ANSSD для частотного анализа множественных причин смерти населения

В последние годы неблагоприятные тенденции в смертности и продолжительности жизни требуют применения различных методов анализа, в т.ч. математических при проведении мониторинга и для принятия управленческих решений.

Смертность, как один из наиболее достоверных показателей, используется в здравоохранении для различных целей, в том числе для анализа состояния здоровья населения, а также для демографического мониторинга на федеральном и региональном уровнях.

Статистика смертности во всем мире основывается только на одной -первоначальной причине, что не отражает механизма происходящих патологических процессов. Как правило, смерть вызывается не одним заболеванием, а комплексом болезней, связанных друг с другом. Многие осложнения основного заболевания и сопутствующие болезни оказывают значимое влияние на наступление смерти. Анализ этих множественных причин позволит выявить степень этого влияния, планировать медицинскую помощь и принимать управленческие решения, направленные на снижение смертности.

Множественные причины смерти недостаточно изучены из-за отсутствия специальных программ и баз данных. Имеются только отдельные исследования множественных причин смерти [30, 162].

В настоящее время существует большое число различных математических методов, которые можно использовать для анализа множественных причин смерти. Однако его результативность во многом определяется методологией анализа и выбором адекватных математических средств.

Практическая работа с массивами данных по Тульской области подсказала путь использования на первоначальном этапе простых (грубых) средств анализа [33, 233] с целью выявления проблемных вопросов с последующим поэтапным анализом более сложными (тонкими) математическими методами, включая построение математической модели на конечном этапе [232,241, 278, 280].

Первоначальный этап, основанный на вычислениях частот в доверительных интервалах прост в реализации и позволяет выбрать направления последующего анализа.

Его выполнение связано с предварительным изучением статистических данных (с помощью программ ACMERU и MedSSV). В частности, с помощью регистра смертности можно выделить те классы МКБ-10, смертность по которым наибольшая (Приложение 6). В данном случае исследователю необходимо обратить внимание на II, IV, VI, IX, X, XI, IXX классы. Статистика смертности по возрастным когортам указывает на возраст 45-54, нарушающий гладкость кривой смертности [241]. На эту критическую возрастную когорту (с наибольшим числом случаев) обращает на себя внимание статистика алкогольных отравлений и суицидов (Приложения 7 и 8). Примем выявленные классы и возрастную когорту в качестве исходных для начального этапа исследований.

С использованием приведенного выше алгоритма произведем расчет частот не сочетанного влияния причин смерти по Тульской области.

Результаты расчета указывают, что территории с правом на отселение отличаются от остальных территорий Тульской области частотой не сочетан-ных множественных причин смерти следующих классов болезней:

1. Болезни органов дыхания - в 1,68 раза выше (мощность 0,05012).

2. Болезни органов пищеварения - в 1,52 раза выше (мощность 0,02011).

3. Болезни эндокринной системы, расстройства питания и нарушения обмена веществ - в 1,49 раза выше (мощность 0,01001).

4. Болезни нервной системы - в 1,74 раза ниже (мощность 0,03744).

Полагая, что грубая оценка может поглощать составляющие с повышенной и пониженной частотой, нельзя ограничивать первоначальный этап исследований выполненным расчетом. В связи с этим целесообразно, как это часто делается в здравоохранении, посмотреть в разрезе пола и возраста, включая расчеты по первоначальной причине смерти, а также отдельных ко горт (ликвидаторов Чернобыльской аварии и перинатальную смертность на » территориях с правом на отселение).

Похожие диссертации на Системный анализ и обработка информации медицинских регистров в регионах