Содержание к диссертации
Введение
Глава 1. Модели, базирующиеся на статистике Госкомстата России 20
Предисловие 20
2.1. Линейные модели 21
2.2. Нелинейные модели 31
2.3. Корреляция интегральных показателей 41
Основные выводы по главе 1 45
Глава 2. Модели, использующие дополнительные показатели 47
Предисловие 47
3.1. Выбор множества дополнительных показателей 47
3.2. Линейные модели 51
3.3. Нелинейные модели 57
3.4. Корреляция интегральных показателей 63
Основные выводы по главе 2 68
Глава 3. Прогнозирование в моделях интегральных показателей оценки здоровья населения 70
Предисловие 70
3.1. Распределения статистических и интегральных показателей . 70
3.2. Прогнозирование математических ожиданий статистических и интегральных показателей 81
3.3. Программный комплекс 97
Основные выводы по главе 3 99
Заключение 101
Литература 105
Приложения 110
- Корреляция интегральных показателей
- Выбор множества дополнительных показателей
- Нелинейные модели
- Прогнозирование математических ожиданий статистических и интегральных показателей
Введение к работе
В.1. АКТУАЛЬНОСТЬ ПРОБЛЕМЫ ИНТЕГРАЛЬНОГО ОЦЕНИВАНИЯ
ЗДОРОВЬЯ? НАСЕЛЕНИЯ
Математическое моделирование является весьма популярным, а во многих случаях и единственно возможным методом решения или исследования широкого класса задач [52, 61]. Основным средством математического моделирования являются: ЭВМ; Поэтому развитие теории математического моделирования и значительное расширение областей его; применения были связаны с быстрым развитием возможностей ЭВМ [52]. В настоящее время оно применяется даже в таких областях как сельское хозяйство [8], спорт [50], гидроэнергетика [9] и др. По-видимому, трудно назвать такую отрасль или область знаний, в которой математическое моделирование не могло бы быть использовано.
В. медицине и здравоохранении математические модели используются уже не одно десятилетие. Основой для построения соответствующих моделей служили результаты статистических исследований; которые в России начали проводиться еще в 18-м веке [46]. Степень адекватности результатов, получаемых с помощью моделей и из статистических данных, являлась критерием приемлемости предлагаемых моделей.
В процессе математического моделирования часто приходится иметь дело с различными: случайностями и исследовать так называемые стохастические модели (синонимы: вероятностные,. статистические), связанные с имитацией соответствующих случайностей. Нередко такие модели используются и для исследования задач детерминированной природы, например, в вычислительной математике — при решении краевых задач, для вычисления значений многомерных интегралов [19, 20], при
поиске оптимальных решений [11] и т.д. Из большого числа известных математических моделей в области медицины, кроме детерминированных моделей [56- и др.], также имеются и стохастические [27 и др.].
Среди математических моделей в области медицины и здравоохранения значительное место занимают модели, связанные с интегральной оценкой; здоровья населения. Попытки; создания таких моделей ведутся уже в течение нескольких лет..
При оценке здоровья принято выделять 3 уровня [32, 46]::
* здоровье отдельного' человека (индивидуальное здоровье);
групповое здоровье (здоровье социальных, этнических групп, населения; административных территорий);
общественное здоровье (здоровье общества, субпопуляции в целом).
В литературе характеристики, группового и общественного здоровья^ в статике и в динамике рассматриваются как интегральное: понятие индивидуального здоровья. Причем эти характеристики, являются не просто суммой» соответствующих характеристик рассматриваемого множества; индивидуумов, а совокупностью взаимосвязанных данных, выраженных количественными и качественными показателями. Математические описания взаимосвязи указанных показателей,, позволяющее определять интегральные показатели группового или общественного здоровья, являются математическими моделями* оценки интегральных показателей- здоровья: населения.
По мнению академика Ю; П. Лисицина [32, 34], " в различные периоды развития общества и, в частности, современной системы здравоохранения- были и остаются актуальными: вопросы: оценки состояния; здоровья, анализа обоснованности и силы, влияния тех или иных факторов на; формирование и сохранение определенного уровня общественного здоровья". Актуальность разработки моделей; интегральных показателей оценки здоровья населения подчеркивается и рядом; других авторов
[например, 46, 49, 56]. Указанные показатели необходимы не только для- удобного сравнения состояния здоровья населения различных регионов, но также и для принятия надлежащих мер по охране и укреплению здоровья.
Приведённые далее результаты анализа литературы по известным математическим моделям [18, 37, 38, 46, 53, 54, 56, 64, 66, 68, 69, 70, 71] показывают однако, что еще нет модели или моделей, принятых большинством специалистов в качестве основных, наиболее подходящих для интегральных характеристик здоровья; населения. В отдельных моделях имеются математические неувязки. Следовательно, проблема разработки и совершенствования указанных моделей остается актуальной.
В.2. ЗДОРОВЬЕ И МЕТОДОЛОГИЯ ЕГО ОЦЕНКИ
Из литературы известно более ста определений и подходов к определению понятия "здоровье" [46], которые в крупном плане можно классифицировать следующим образом:
здоровье — это отсутствие болезней;
здоровье — это нормальная жизнь, хорошее самочувствие;
здоровье — это единство морфологических, психоэмоциональных и социально-экономических констант.
Общим для приведенных определений и подходов является то, что здоровье понимается как нечто противоположное понятию "нездоровье" и зависит от распространенности тех или иных болезней, дефектов развития, уровня смертности и т. д.
Отправной точкой для медико-социальной интерпретации здоровья является определение, принятое Всемирной организацией здравоохранения (ВОЗ): "Здоровье является состоянием полного физического, духовного и социального благополучия, а не только отсутствием болезней и
физических дефектов". Таким образом, здоровье рассматривается как состояние, позволяющее вести активную в социальном и экономическом плане жизнь.
В> 1971-м году ВОЗ сформулировала приводимые ниже требования к интегральным показателям оценки здоровья населения (в материалах ВОЗ такой показатель называется обобщенным индексом здоровья населения). По утверждению ВОЗ^ приводимые требования необходимы? для обоснованного применения интегральной: оценки в качестве критерия для сравнения; здоровья больших совокупностей населения и оценки эффективности соответствующих мероприятийj проводимых органами здравоохранения.
Итак, согласно мнению ВОЗ, интегральный показатель (ИП) оценки группового и общественного здоровья должен удовлетворять следующим десяти требованиям [46]:
Доступность данных. Должна существовать возможность для определения ИП без "сложных специальных исследований".
Полнота охвата. ИП должен быть получена из данных, охватывающих все население, для которого она предназначена;
Качество: Национальные или территориальные данные не должны изменяться во времени и пространстве таким, образом, чтобы на ИП оказывалось значительное влияние.
Универсальность. ИП по возможности должен быть отражением группы факторов, которые определены и влияют на уровень, здоровья.
< Вычислимость. ИП должен рассчитываться как можно более про-
стым способом, расчет не должен быть дорогостоящим.
Приемлемость и интерпретируемость. ИП должен быть приемлем
и, несомненно, должны существовать приемлемые методы для расче
та ИП и его интерпретации..
Воспроизводимость. При использовании ИИ здоровья разными специалистами в различных условиях и в различное время результаты должны быть идентичными.
Специфичность. ИП должен отражать изменения только в тех явлениях, выражением которых она служит.
Чувствительность. /Ш здоровья должен: быть чувствительным к изменениям соответствующих явлений.
Валидность. ИП должен быть истинным выражением фактов, мерой которых он является.
По-видимому, некоторые из перечисленных требований уже не являются актуальными. Так, в настоящее время в медицинских: учреждениях достаточно широко используется современная компьютерная1 техника, которая обладает очень высоким быстродействием и весьма* большой памятью. Поэтому понятие сложности' вычислений интегральных показателей уже существенно отличается от этого понятия в 1971-м году. Однако в целом перечисленные требования по-прежнему являются важной составляющей методологии разработки интегральных показателей здоровья населения.
В 1980-м году С. П. Ермаковым [46] было предложено дополнить приведенный перечень требований ВОЗ еще тремя требованиями, которые повышают обоснованность использования полученных индексов:
Репрезентативность.. ИП должен быть представительным при отражении изменений в здоровье отдельных возрастно-половых и других контингентов населения, выделенных для* целей изучения.
Иерархичность. ИП должен конструироваться по единому принципу для разных иерархических уровней, выделяемых в изучаемой совокупности населения для учитываемых заболеваний, их стадий и последствий. Должна существовать возможность его унифицированной свертки и развертки по составляющим компонентам.
Целевая состоятельность. ИП должен адекватно отражать цели сохранения и развития (улучшения) здоровья и стимулировать общество к поиску наиболее эффективных путей достижения этих целей. По-видимому, в большинстве случаев, при разработке моделей интегральных показателей авторы старались учесть требования ВОЗ, а в отдельных случаях и придать ИП и дополнительные свойства. Однако: в качестве ИП использовались различные величины, что связано,, в частности, с использованием разных понятий группового и общественного! здоровья населения.
Отметим, что понятие "общественное здоровье" до настоящего времени остается весьма "расплывчатым". Поэтому не существует и общепринятой методологии оценки общественного здоровья. Известна лишь общая концепция, общественного здоровья,, которая воплощена в Европейской стратегии "Здоровье для всех к 2000 году" [56]; При этом здоровье стало рассматриваться как состояние, позволяющее вести активную в социальном и в экономическом плане жизнь. Однако вопрос о том, что следует считать мерой указанной активности, пока остается открытым.
В.З. АНАЛИТИЧЕСКИЙ ОБЗОР ИЗВЕСТНЫХ МОДЕЛЕЙ
Большое число моделей оценки здоровья; населения; (согласно проведённому анализу их около ста) обуславливает целесообразностью их комплексного рассмотрения, выделяя модели интегральных показателей оценки группового здоровья и элементов общественного здоровья. Ввиду отсутствия; четких критериев оценки общественного здоровья в дальнейшем будем вести» речь именно о таких моделях. Цель их анализа — выявление достоинств и недостатков для конкретизации задач выполняемой работы.
В указанной постановке выделяются две группы» моделей^ рассматриваемые ниже. Устаревшие модели, не соответствующие современным представлениям о здоровье, анализироваться не будут.
К первой группе указанных моделей отнесем модели оценки здоровья на основе интегрального показателя — индекса DALY [29], предложенного в 1993-м году экспертами Мирового банка реконструкции и развития для оценки эффективности инвестиций в здравоохранение. В России он известен как показатель "Глобальное Бремя Болезней" (ГББ). Индекс DALY учитывает потери здоровой жизни в результате преждевременной смерти и в результате: утраты здоровых лет жизни вследствие наступления? временной нетрудоспособности и. инвалидности. При этом продолжительность фактической жизни сравнивается с так называемой; потенциальной продолжительностью* жизни вї рассматриваемой; административной территории.
В: простейшем случае расчет потерь здоровой жизни производится; согласно выражению
/=1
где IDALY - значение индекса DALY, L - потенциальный предел жизни, п
- число интервалов, на которые делят L, Ti - средняя продолжительность
жизни для /-го интервала, a N;- число случаев смерти за изучаемый
период в возрасте, относящемся к /-му интервалу. За единицу измерения индекса обычно принимается один год.
При- наличии нетрудоспособного контингента к указанному значению индекса DALY добавляются еще потери; за счет нетрудоспособности. При их расчете нетрудоспособный контингент населения разделяется на шесть классов по степени нетрудоспособности согласно табл. В.1, и потери здоровой жизни за счет нетрудоспособности вычисляются как сумма произведений числа людей, попавших в каждый класс, на уста-
новленный экспертами весовой коэффициент соответствующего класса (вес) и на: времяі нетрудоспособности. В этих произведениях могут учитываться и возрастные коэффициенты. Считается, что значение индекса DALY находится точнее, если указанные сложения заменить интегрированием. При этом подынтегральная функция- интегрируется точно.
Таблица; ЕШ
Класс
Описание
Ограниченная- способность (на 50% ш более) исполнять* по крайней мере одну деятельность в одной из следующих: областей: отдых, образование, воспроизведение или профессиональная деятельность.
Ограниченная способность исполнять большинство действий в одной из следующих областей: отдых, образование, воспроизведение или профессиональная деятельность. Ограниченная способность исполнять действия в двух или более следующих областей: отдых, образование, воспроизведение или профессиональная деятельность.. Ограниченная способность, исполнять, большинство действий во всех следующих областях: отдых, образование, воспроизведение или профессиональная деятельность. Требуется 'помощь, для ежедневной инструментальной деятельности типа подготовки пищи; посещения: магазина или работы по дому.
Требуется помощь для, ежедневной- деятельности типа
приема пищи, персональной гигиены или использования
туалета.
0,096
0,220 0,400 0,600 0,810 0,920
Таким, образом, главная идея концепции DALY состоит в попытке^ количественно оценить уровень здоровья,, принимая во внимание различные социальные факторы в разных возрастах и» их изменения с течением; времени. Индекс DALY аккумулировал в себя" ряд соответствующих показателей. В моделях на основе этого* индекса широко используются устанавливаемые экспертами весовые коэффициенты. Отметим, что таблица, похожая; на В11, приводится в [28].
К недостаткам моделей на основе индекса DALY можно ? отнести :
- Ненормируемость интегрального показателя затрудняет сравнение
оценок здоровья населения различных территориальных; единиц.
Не учитывается важный для оценки общественного здоровья фактор: воспроизводство населения (рождаемость).
Отсутствие (или сложность) получения необходимых для расчетов статистических данных.
Второй группой моделей являются модели, использующие для оценки здоровья населения два интегральных показателя: 1) индекс здоровья населения (ИЗН) — число потенциальных лет здоровой жизни, которое пришлось бы в среднем на одного человека в данном году, если бы і все женщины, желающие забеременеть, забеременели и родили бы живого ребенка, а смертность происходила бы только на і этапе старения; 2) уровень здоровья населения; (УЗН), поясняемый ниже [56].
За единицу измерения ИЗН принимается один; год. Для его вычисления предварительно находится жизненный потенциал населения (ЖПН) - число потенциальных человеко-лет предстоящей жизни, которым обладает изучаемое население. ЖПН вычисляется как сумма, произведений числа живущих, относящихся к каждой половозрастной группе, на количества лет предстоящей жизни для этих половозрастных групп. При этом за соответствующие количества лет предстоящей жизни принимаются значения разности потенциального предела жизни, который- может быть разным для различных территориальных единиц (обычно 100 ч- 115 лет), и средних возрастов, относящихся к различным половозрастным группам.
Значение ИЗН находится согласно выражению
РЖ"
изн = сжп:-^-,
у+и
в котором СЖП - средний жизненный потенциал, равный ЖПН, деленному на численность населения изучаемой территориальной единицы,
РЖ-число родившихся живыми, У—число всех умерших, И— число впервые ставших инвалидами, включая инвалидов с детства.
Второй интегральный показатель - уровень здоровья населения; измеряется в процентах. Он определяется согласно выражениям:
УЗН=ИЖ.Лщ пзн = сжп-Б+Бп.
ПЗН Уп
В этих выражениях ПЗН— потенциал здоровья населения; Б— число случаев беременности без искусственных абортов, по желанию женщин, >г — число случаев зарегистрированного бесплодия, Уп—число умерших пожилых людей (65 лет и старше).
Аналогичные интегральные оценки* предлагается ввести и; для различных категорий населения: беременных, детей; до 14-ти- лет и т. д.
Достоинством предлагаемых моделей является возможность получения исходных данных из отчетов; Госкомстата России и из стандартных отчетных форм лечебно-профилактических учреждений. Кроме: того, с помощью показателя УЗН удобно сравнивать по качеству здоровья территориальные единицы с разной численностью населения. К недостаткам второй группы моделей можно; отнести:
'> Интегральные показатели оценки здоровья не учитывают качествен-
ных изменений характеристик отдельных параметров. Например, дліг инвалидов не учитываются весовые коэффициенты, характеризующие степень, (класс) нетрудоспособности.
* Модели не лишены отдельных математических некорректностей; Так,
поскольку умершие пожилыми образуют подмножество множества; всех умерших, то в случае, когда все умершие были по возрасту моложе 65 лет, то есть указанное подмножество пусто, выражение для ПЗН лишено смысла.
По результатам анализа работ, связанных с оценкой здоровья,, следует еще отметить предложенную Y. W.Torrance и его соавторами [46]
систему классификации состояния здоровья, использованную, например, в [40]. Эта система распределяет состояния здоровья по четырем признакам: физическое состояние: (подвижность и физическая активность), повседневная жизнедеятельность (возможности самообслуживания), со-цио-эмоциональные функции (эмоциональное благополучие и социальная активность) и проблемы здоровья. Каждое состояние подразделяется на 4-7-8 уровней. Например, по возможности^ реализации социо-эмоцио-нальных функций каждый индивидуум относится к одному из следующих четырех уровней:
Счастлив, и раскован всегда или в большей части, имеет среднее число друзей и контактов с ними.
Счастлив и раскован всегда или в большей части, имеет мало друзей и контактов с ними.
Беспокоен или находится в состоянии депрессии все или значительную часть времени, имеет среднее число друзей и контактов с ними.
Беспокоен или находится в состоянии; депрессии все или значительную часть времени, имеет мало друзей и контактов с ними.
В итоге в данной модели оказывается возможным 6-5-4-8 = 960 комбинаций уровней. Каждому уровню приписывается соответствующий весовой коэффициент, названный фактором полезности, а состояние здоровья" каждого индивидуума характеризуется значением полезности (по-видимому, точнее - коэффициентом качества жизни), линейно зависящим от произведения четырех факторов полезности.
Основная проблема практической реализации модели Torrance заключается в сложности распределения населения по. указанным признакам и уровням. Ошибки же при формировании баз данных неизбежно приведут и к неточностям в оценках здоровья.
Интересное направление построения моделей интегральной оценки здоровья населения, занимающее, по-видимому, промежуточное положе-
ниє между двумя рассмотренными выше группами моделей, предложено в [43]. Авторы вводят коэффициент возраста ^=1-//115, где / — число
прожитых индивидуумом лет (при />115 //=0) и по аналогии с [46]
используют группы (классы) отягощённости комплексом болезней h:.
Тогда величины ку = (1 - / /115) hj и stj = (1 - / /115) (1 - hj ) называются
соответственно потенциальным значением "нездоровья" и потенциальным значением "здоровья" рассматриваемого индивидуума в возрасте / лет. Сумма этих величин; равна значению tt.
Обозначая через х„ количество случаев J заболеваемости в возрасте / для 1000: индивидуумов, авторы [43] получают 4 показателя:
Sp = 2 И xiji - реализованное "здоровье",
1 1J і j
$п = 2 Z xijsij - потенциальное "здоровье", ' j
Кп =HHxijkij ~ потенциальное "нездоровье", ' j
Кр = X Z xij (1 - / /115) - реализованное "нездоровье". і J
Сумма S +Sn характеризует общее здоровье населения рассматриваемого региона, а сумма К +КП — общее его нездоровье.
Предлагаемые показатели могут изменяться от 0 до 1. Однако их нормируемость достигается потому, что в модели не учитывается, например, воспроизводство населения. В отличие от таких показателей здоровья как заболеваемость и смертность, повышение рождаемости должно свидетельствовать об улучшении группового здоровья населения.
Отметим также, что в [35] в качестве интегрального показателя предлагается использовать только смертность населения, что, по-видимому, недостаточно характеризует здоровье населения.
В.4. ЦЕЛЬ И ЗАДАЧИ* ДИССЕРТАЦИОННОЙ РАБОТЫ
Анализ известных моделей оценки здоровья населения [6] позволяет сформулировать приводимые ниже выводы, из которых вытекают конкретные задачи дальнейшей работы.
Все известные модели оценки здоровья населения имеют те или иные недостатки. Вместе с тем задача; оценивания состояния здоровья населения с помощью интегральных показателей имеет важное практическое значение. Поэтому разработка более совершенных математических моделей интегральных показателей оценки здоровья населения является актуальной.
Интегральные показатели должны отражать основные параметры соответствующих явлений, аккумулируя их свойства.
Интегральные показатели должны быть удобными для сравнения здоровья населения различных территориальных единиц, имеющих разную численность населения. Поэтому их значения должны изменяться в одних и тех же интервалах, удобнее всего - от нуля до единицы (нормированный вариант интегральных показателей).
Целесообразно, чтобы интегральные показатели основывались на стандартной государственной; статистике - на статистических данных, приводимых в отчетах Госкомстата России. Имеет смысл и разработка показателей, использующих еще дополнительно и данные стандартных отчетных форм лечебно-профилактических учреждений.
Практическое использование интегральных показателей имеет смысл при ответственном формировании соответствующих баз данных.
Для учета основных характеристик (статистических показателей) здоровья математическая модель интегрального показателя должна использовать непрерывные или дискретные функциональные зависимости значения показателя от значений указанных характеристик. Во втором случае характеристики здоровья подразделяются на классы (уровни и др.), каждому из которых на основе экспертных оценок приписывается определенный весовой коэффициент (вес)..
Интегральный показатель должен: быть достаточно чувствительным к изменениям значений каждого весового коэффициента. В противном случае нецелесообразно иметь большое количество указанных классов.
При заполнении отчетных форм лечебно-профилактических учреждений медицинский персонал не должен заниматься выбором значений указанных в п. 6 весовых коэффициентов. Поэтому таблицы весовых коэффициентов для моделей интегральных показателей должны быть разработаны заранее и являться приложением к этим моделям.
Ввиду того, что понятие общественного здоровья еще не установилось, при выполнении диссертационной работы ограничиться разработкой моделей интегральных показателей здоровья, аккумулирующих основные характеристики группового здоровья и некоторые характеристики, которые в будущем, по-видимому, должны быть учтены в окончательном определении общественного здоровья.
Цель диссертационной работы состоит в разработке и исследовании новых математических моделей интегральных показателей оценки здоровья населения, корректных с математической точки зрения, которые могли бы найти достаточно широкое практическое применение. При этом ставятся задачи:
1. Разработать и. исследовать модели, использующие только показатели (данные) Госкомстата России по здоровью населения, а также
устанавливаемые экспертами значения вводимых в модели коэффициентов.
Разработать и исследовать модели, использующие как показатели Госкомстата России, так и другие статистические показатели здоровья населения, а также устанавливаемые экспертами значения вводимых в модели коэффициентов.
Исследовать вопросы прогнозирования на основе разработанных моделей.
Указанные задачи рассматриваются соответственно в трёх главах диссертации. Предлагаемые модели обоснуются и исследуются. Конкретные примеры в основном приводятся для Новгородской области и Великого Новгорода, по которым была получена необходимая база статистических данных. Отдельные примеры даны для РФ в целом и для Северо-Западного региона РФ. Итоги работы подведены в заключении. Здесь даются рекомендации по применению результатов работы.
Список публикаций, на которые делаются ссылки, включает 72 наименования. Среди них - 7 публикаций автора.
Корреляция интегральных показателей
Графики полученных зависимостей для Новгородской области приведены на рис. 1.10 и 1.11. Для Великого Новгорода эти графики имеют аналогичный вид. Жирные участки графиков соответствуют интервалам изменения аргументов в 1900-2000 годах согласно табл. 1.2. На рис. 1.10 эти участки приведены с учетом корректирующих коэффициентов Обд и Обвп.
Значения коэффициентов Kt и Ot в зависимостях, графики которых приведены на рис. 1.10-1.12, выбраны следующими: Крж=\, Кбд=0,\5, Кбвп=0,1, Кум=1,75, Обд=0,85 и Обвп=0,75. Графики чувствительности ИЗН для России в целом имеют аналогичный характер. Анализируя функции чувствительности ИЗН и их графики можно сделать следующие выводы: 1. Все функции имеют выпуклость вниз. Однако только для 4{NpoK) эта выпуклость хорошо видна на графике. На графиках остальных функций она почти незаметна. На выделенных участках изменения аргументов в 1990 - 2000 годах указанные функции можно считать линейными, а функцию 4{N ж) - близкой к линейной. Поэтому можно ожидать, что при пропорциональном изменении значений всех СП значение ИЗН практически не будет изменяться, если значения СП не близки к нулю. 2. В точке С77 = +0 4{N рж) = 9,921, 4(N6d)=0,024, 4{N6en)=0,0l6 и 4[NyM )=0,2S0. Эти значения Ч(СП;) в несколько раз больше соответствующих значений Ч(СПі) на выделенных участках. Поэтому при малых значениях СП зависимость ИЗН от СП должна иметь другой характер, чем при значениях СП, не близких к нулю. Однако "почти равные нулю" значения СП практически нереальны. 3. Согласно выражению (1.3) для нелинейных моделей неустранимая погрешность ДЯЗЯ,- равна ЧІСП АСП; = 0,005Ч(СП;). Поскольку минимальное значение 4{Cnt) не менее 0,0001, то есть АИЗНітіп « «0,0000005, то значения ИЗН в рассмотренных нелинейных моделях целесообразно представлять с 6-ю знаками после запятой. 4. Из графиков на рис. 1.10 и из табл. 1.2 видно, что положение с рождаемостью в Новгородской области довольно тяжелое, так как множества, которым принадлежали имевшие место значения N ж и N , даже не пересекаются! Выводы 1-й и 2-й подтверждаются графиками на рис. 1.11, иллюстрирующими зависимость ИЗН от {N , N6d, N6en, NyM) при прямо пропорциональном изменении значений всех СП{ этого множества. Такое изменение СП І осуществлялось путем умножения их значений в 1990-м году (графики 2-й и 3-й) или в 2000-м году (графики 1-й и 4-й) для Новгородской области на коэффициент К .
Для сравнения на рис. 1.12 приведены графики для линейной и нелинейной моделей: для третьей (графики 1-й и 2-й) и седьмой (графики 3-й и 4-й) моделей для Новгородской области. Из графиков видно, что интервал допустимых значений Кпр для линейной модели ограничен сверху, а для нелинейной — сверху не ограничен.
Разный вид графиков на рис. 1.12 для линейной и нелинейной моделей обусловлен разным принципом функционирования этих моделей (определение алгебраической суммы обобщенных параметров модели или отношения одного из этих параметров к их сумме). Как уже отмечалось, ввиду некоторой разницы в значениях ИЗН, вычисляемых согласно разным моделям, сравнение уровней здоровья различных регионов следует на основе значений ИП, полученных с помощью одной и той же модели.
Диаграммы значений ИЗН, полученные при использовании линейных и нелинейных моделей, показывают, что они имеют одинаковые тенденции изменения, хотя принцип их функционирования и различен. Однако целесообразно убедиться, что указанное не является случайным, характерным только для приведенного в табл. 1.2 множества СП. Покажем, что значения ИЗН, получаемых с помощью 3-й и 7-й моделей, имеют достаточно большой, положительный коэффициент корреляции.
Из сравнения алгоритмов этих моделей можно ожидать, что коэффициент корреляции выдаваемых ими ИЗН, являющихся значениями разных функций случайных величин С/7,-, является положительным. Действительно, при увеличении значения Nрж величины указанных ИЗН возрастают, а при увеличении любого из значений N6d, N6m, и N или всех этих значений они уменьшаются.
Учитывая нелинейность 7-й модели, поставленную задачу будем решать не аналитически, а путем математического моделирования указанных ИЗН на достаточно большом объеме независимых С/7,-, хотя фактически случайные величины N6d, N6en и NyM являются коррелированными. Так, из данных табл. 1.2 можно получить следующие значения оценок их коэффициентов корреляции: R(N6d,N6en) = 0,524,
Выбор множества дополнительных показателей
Обзор известных моделей с различными вариантами используемых СП был сделан в первой главе работы. Учитывая необходимость обеспечения достаточно высокой чувствительности ИП здоровья населения и, следовательно, применения множества СП сравнительно небольшой мощности, при построении рассматриваемых моделей автор предлагает использовать рекомендованное Y. W. Torrance и его соавторами [46, 70], дифференцирование состояния здоровья по возможностям повседневной жизнедеятельности. Однако для построения моделей к рекомендуемым указанными авторами 5-ти группам (уровням, классам) состояния здоровья можно добавить еще группу умерших. В итоге получаем 6 групп, представленных в табл. 2.1.
Первая группа является группой здоровых индивидуумов. С ростом номера группы возможности повседневной деятельности индивидуумов уменьшаются.
Разумеется,, возможны и другие варианты классификации индивидуумов по группам здоровья. Рекомендуемая классификация учитывает опыт зарубежных специалистов..
Кроме того, учтем, что с общественной точки зрения более молодые индивидуумы в целом до конца своей жизни способны сделать больший вклад в развитие общества, нежели более старые индивидуумы. Поэтому ограничения в их жизнедеятельности и их смертность должны учитываться с большими весовыми коэффициентами, чем для пожилых индивидуумов (конечно, в этом утверждении могут быть отдельные исключения). Следовательно, необходимо дифференцирование индивидуумов по возрасту.
В принципе дифференцирование по возрасту можно реализовать, например, с точностью до года, что значительно увеличит мощность множества статистических параметров и весовых коэффициентов и снизит чувствительность ИП.
Ниже в качестве возможного варианта используется дифференцирование индивидуумов на 6 возрастных, групп (см. табл. 2.2). Первая из них является группой детей. Таблица 2.2 иллюстрирует распределение жителей Новгородской области по группам здоровья и возрастным группам в 1995-м году. Все данные приведены из расчета на 1000 человек населения. Распределение показателей по группам состояния здоровья проводилось с привлечением экспертов на основе статистических данных.
Данные таблиц типа 2.2 для любого года являются нестандартными СП. Они могут быть получены независимо от стандартных СП. По-видимому,, определение их значений для заполнения соответствующих таблиц с привлечением экспертов несколько усложнит работу соответствующего медицинского персонала, так как при распределении? индивидуумов по группам- здоровья нельзя избежать принятия- так называемых волевых решений, которые не могут быть, стандартными. Это может привести к принятию необъективных решений при- сравнении; интегральных оценок здоровья населения разных регионов. Поэтому целесообразно исследовать, возможность, получения указанных нестандартных СП как значений некоторой функции от стандартных СП, то есть, согласно некоторому стандартному алгоритму. В этом случае показатели указанных таблиц, по сути дела, можно будет считать стандартными. Однако такая задача должна рассматриваться специалистами в области здравоохранения. В данной работе она не рассматривается.
Кроме того, в моделях с нестандартными параметрами можно учесть наличие врожденных пороков у родившихся младенцев, полагая, что младенцы с такими пороками дают меньшее увеличение ИЗЩ чем; младенцы, без пороков. Статистические данные по врожденным порокам приводятся в отчетах родильных домов. Но все эти данные не входят с статистику Госкомстата РФ.
По степени тяжести врожденных пороков родившихся живыми младенцев для учета в моделях ИП здоровья, населения следует также разбить на группы. Можно, например, использовать три таких группы. Младенцев,, родившихся без врожденных пороков, будем относить к 1-й группе, а все пороки разобьем на не очень тяжелые (2-я группа)? ш тяжелые (3-я группа). К не очень тяжелым; можно отнести врожденные пороки типа ушной раковины, косорукость,, сращение пальцев стопы и т.д., а к тяжелым - полное отсутствие верхних или нижних конечностей, врожденные пороки сердца, коронарную гипоспадию, стенозы легочной артерии, синдром Дауна и другие пороки. В этом случае из 331 рожденных в 1995-м году с соответствующими пороками младенцев Новгородской области согласно мнению экспертов 127 из них следует отнести ко второй группе, а 204 —к третьей. Воспользовавшись данным приложения Ш, не трудно подсчитать, что в расчете на 1000 человек населения области общее количество младенцев, отнесенных к первой, второй и третьей указанным группам соответственно составляет 7,46, 0,17 и 0,27 (единицы измерения — безразмерные).
В дальнейшем принятое множество дополнительных СП, в которое входят количества индивидуумов, относящихся к различны группам состояния здоровья и возрастным группам, а также количества живых младенцев, отнесённых к каждой из трех групп по степени тяжести врожденных пороков, будет использовано для построения как линейных, так и нелинейных моделей (для удобства сравнения с моделями на основе стандартных СП в статистике Госкомстата России рассматриваемые в данной главе модели также классифицируются на линейные и нелинейные).
Нелинейные модели
Отметим, что графики на рис. 2.7 могут быть продолжены в правую сторону только до значения NujJ =1000, так как аналогично статистическим данным Госкомстата России значения всех показателей используются в расчете на 1000 человек населения. При построении этих графиков на каждом шаге изменения NuiJ значения всех остальных СП табл. 2.2 пропорционально корректировались так, чтобы сумма значений СП была бы равной 1000. Для графиков на рис. 2.6 такая корректировка проводилась только по первой строке указанной таблицы.
Анализируя графики на рис. 2.6 и рис. 2.7, можно заключить, при СП{ 0 имеет место почти постоянная чувствительность ИЗН к изменению СП, что можно отнести к достоинству предложенных моделей. Полагая, что минимальное значение Ч(СП{) не менее 0,00001, получа ем: АИЗН 10 . Следовательно, значения ИЗН необходимо представлять с семью разрядами после запятой.
К достоинствам рассмотренных нелинейных моделей следует отнести нормируемость значений ИЗН -они могут изменяться от 0 до 1. В рассмотренных примерах согласно предложенным линейным и нелинейным моделям были получены диаграммы ИЗН, имеющие одинаковые тенденции изменения. Целесообразно убедиться, что указанное не является случайным, характерным только для приведенных в табл. 2.2, 2.4, 2.5 и 2.7 значений СП и весовых коэффициентов. Покажем, что значения ИЗН, получаемых с помощью 10-й и 12-й моделей (ограничимся наиболее полными моделями), имеют достаточно большой, положительный коэффициент корреляции. Аналогично п. 1.3 можно ожидать, что коэффициент корреляции выдаваемых сравниваемыми моделями ИЗН, являющихся значениями разных функций случайных величин N и весовых коэффициентов,. является положительным, так как при увеличении значения N рж величины указанных ИЗН возрастают, а при увеличении любого из значений N6d, N6en и N или одновременно всех этих значений они уменьшаются. Учитывая нелинейность 12-й модели, поставленную задачу будем решать не аналитически, а путем математического моделирования указанных ИЗН на достаточно большом объеме независимых С/7,-, хотя фактически N могут быть коррелированными. Однако, если будет доказано наличие положительной корреляции значений ИЗН для рассматриваемых моделей на множестве независимых СП, то при положительной корреляции; СП значения коэффициентов корреляции этих ИЗН могут только возрасти. Поэтому выбранный способ решения поставленной задачи, аналогичный п. 1.3, обоснован и вместе с тем достаточно прост. Поскольку законы распределения подлежащих моделированию 39 С/7,-, приводимых в табл. 2.2 и табл. 2.5, не известны, то для моделирования случайных величин, задающих соответствующие случайные изменения указанных С/7,-, был принят равномерный закон распределения. В этом случае имеет место максимальная дисперсия моделируемых случайных величин по сравнению с "горбатыми" распределениями на том же множестве этих величин. В связи с указанным моделирование было проведено с помощью поясняемых ниже двух алгоритмов. Алгоритм 1. Данный алгоритм предусматривал следующие этапы: — Генерирование случайной величины X, равновероятной в [0,5, 1,5] (X: = 0,5 + random). - Изменение табличного значения СПХ путём умножения его на X. - Повторение двух первых этапов ещё 38 раз для изменения значений сп2 + СПЪ9. — Приведение суммы значений всех 36 СП Nuij, входящих в табл. 2.2, к единице путем вычисления их суммы и деления каждого из указанных СП на вычисленную сумму. - Получение 11 значений ИЗН. для 10-й модели (линейной) и 11 зна чений ИЗН для 12-й модели (нелинейной) -для 1990-ь2000 г. — Вывод диаграмм значений ИЗН- получение рис. 2.8. — Повторение пяти первых этапов ещё 499 раз (определение 5500 значений ИЗН для 10-й модели и 5500 значений ИЗН для 12-й модели). - Вычисление значений оценок коэффициента корреляции R и средних квадратических отклонений ИЗН на основе 10-й и 12-й моделей. Алгоритм 2 отличается от первого алгоритма только первым и шестым этапами, которые теперь предусматривают следующее: - Генерирование случайной величины X, равновероятной в [0, 2,] (X: = 2 random). - Вывод диаграмм значений ИЗН - получение рис. 2.9. Таким образом, если в первом алгоритме дисперсия случайной величины X была равна 1/12, то во втором алгоритме она равнялась 1/3 [25, 26]. Поэтому можно было ожидать, что моделирование по второму алгоритму даст несколько меньшую статистическую оценку коэффициента корреляции ИЗН, получаемых на основе 10-й и 12-й моделей. Отметим, что шестой этап приведенных алгоритмов (вывод диаграмм) следует выполнять только один раз. В противном случае на рисунке произойдет наложение диаграмм. Полученные диаграммы для Новгородской области приведены на рис. 2.8 и 2.9. Для сравнения на этих рисунках приводятся также диаграммы значений ИЗН для 10-й (первые слева) и 12-й (третьи слева) моделей, полученные без применения алгоритмов случайного изменения
Прогнозирование математических ожиданий статистических и интегральных показателей
Вопросы прогнозирования временных рядов, которыми являются и последовательности показателей здоровья населения, неоднократно рассматривались в литературе [2, 10, 36, 58, 62, 63 и др.]. В частности, автором в работе [3] были предложены и проанализированы при решении задач прогнозирования алгоритмы, использующие линейные рекуррентные выражения. В целом эти алгоритмы реализуют метод скользящего окна, согласно которому прогнозируемое значение временного ряда в момент t зависит от значений этого ряда в моменты, где п - ширина окна. Указанная зависимость в общем случае может быть нелинейной, и представлять, например, значение продолженной на один шаг функции P(t), сглаживающей значения рассматриваемых показателей здоровья на интервале выбранного окна. Однако наиболее простыми являются линейные алгоритмы. Частным случаем таких алгоритмов является наиболее часто используемый в известных из литературы задачах алгоритм определения среднего арифметического находящихся в окне значений ряда (оценки текущего значения математического ожидания ряда) и выдачи его в качестве прогнозируемого значения этого ряда [58, 62], называемый иногда методом скользящего среднего.
Ниже приводятся результаты сравнительного анализа применения линейных и параболических алгоритмов для прогнозирования рассматриваемых показателей здоровья на один и большее число шагов, а также применения для этого алгоритмов скользящего среднего. При этом учитывается особенность временных рядов указанных показателей, заключающаяся в их значительной положительной корреляции, способствующей решению задачи прогнозирования; Это было установлено в 1-й и во 2-й главах работы, а также отмечалось в [3]. При сильной положительной корреляции нет смысла выбирать окно достаточно широким. Согласно [3] значение п можно выбрать равным 3 илш 4, то есть использовать для расчёта прогноза не более 4 значений ряда.
Имея статистику показателей здоровья за значительное число лет и изменяя временное положение окна, погрешность получаемых прогнозов будем определять как модуль разности5 между значением прогноза и известным фактическим значением ряда в момент, на который; определялся; прогноз. Такой анализ проведём для алгоритмов 1 - 4 порядков (будем считать, что порядок алгоритма- определяется шириной» окна). Поскольку приводимые ниже общие выражения для анализируемых алгоритмов не зависят от типа показателя; здоровья, то в общем случае значения ряда в них обозначаются буквой х с соответствующим индексом времени.
Примем для удобства, что первому значению показателя в окне соответствует / = 0. Тогда значения прогноза xt на момент t, где t n, будем находить согласно выражениям Подставляя эти выражения в уравнения (3.4), получим алгоритмы, представленные в табл. 3.3. Отметим, что- для линейного (лин) алгоритма 2-го порядка прямая P(t) проходит через точки (0, 0) и (1, л:,), а для параболического (пар) алгоритма 3-го порядка парабола P(t) проходит через точки (0, л:0), (1, л:,) и (2, л:2), то есть осуществляется интерполирование значений временного ряда в окне. При этом продолжение интерполяционной кривой или прямой за правую границу окна реализует соответствующее прогнозирование.
Проведём сравнительный анализ точности і прогнозов на основе полученных алгоритмов для значений использованных в предложенных моделях "стандартных" СП и для ИЗН, рассчитываемых согласно моделям 3-й, 7-й, 10-й и 12-й. Такой анализ, по-видимому, может быть выполнен только с помощью моделирования. При проведении этого анализа для сравнения получим значения прогнозов и на основе известного алгоритма скользящего среднего [58, 62].
Указанный анализ проведём для двух случаев прогнозирования: одношаговое прогнозирование, то есть в рассматриваемых задачах — прогнозирование на ближайший год, и 3-шаговое прогнозирование, то есть прогнозирование на третий г год вперёд. В таб. 3.4 приведены результаты одношаговых, а в табл. 3:5 - 3-шаговых прогнозов показателей здоровья для районов Новгородской; области. Они даются как отношения прогноз/факт. При этом абсолютные погрешности прогнозов равны модулям дополнений этих значений до 1 (относительным погрешностям), умноженным на фактические значения- соответствующих показателей.