Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Статистические модели взаимосвязей здоровья населения с факторами внешней среды Маслакова Татьяна Анатольевна

Статистические модели взаимосвязей здоровья населения с факторами внешней среды
<
Статистические модели взаимосвязей здоровья населения с факторами внешней среды Статистические модели взаимосвязей здоровья населения с факторами внешней среды Статистические модели взаимосвязей здоровья населения с факторами внешней среды Статистические модели взаимосвязей здоровья населения с факторами внешней среды Статистические модели взаимосвязей здоровья населения с факторами внешней среды Статистические модели взаимосвязей здоровья населения с факторами внешней среды Статистические модели взаимосвязей здоровья населения с факторами внешней среды Статистические модели взаимосвязей здоровья населения с факторами внешней среды Статистические модели взаимосвязей здоровья населения с факторами внешней среды
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Маслакова Татьяна Анатольевна. Статистические модели взаимосвязей здоровья населения с факторами внешней среды : диссертация... кандидата физико-математических наук : 03.00.16 Екатеринбург, 2007 155 с. РГБ ОД, 61:07-1/921

Содержание к диссертации

Введение

Глава 1.

ВЛИЯНИЕ ФАКТОРОВ РИСКА НА ЗДОРОВЬЕ НАСЕЛЕНИЯ И СТАТИСТИЧЕСКИЕ МЕТОДЫ ОЦЕНКИ ЭТОГО ВЛИЯНИЯ (литературный обзор) 11

1.1. Влияние факторов риска на здоровье населения 11

1.2. Статистические методы исследований 24

Глава 2.

ОСОБЕННОСТИ ПОСТРОЕНИЯ И АНАЛИЗА МОДЕЛЕЙ РЕГРЕССИОННОГО ТИПА В ЗАДАЧАХ МЕДИКО- ЭКОЛОГИЧЕСКОГО МОНИТОРИНГА 33

2.1. Предметная и предсказательная модели регрессии 33

2.2. Условия применимости регрессионных моделей в области медико-экологического мониторинга 38

2.3. Возможности регрессионных моделей 40

2.4. Статистическая устойчивость моделей 49

2.5. Качество регрессионных моделей 52

2.6. Формализованная схема построения модели регрессионного типа и представления результатов моделирования 58

Глава 3.

РЕГРЕССИОННЫЕ МОДЕЛИ ВЗАИМОСВЯЗЕЙ ЗДОРОВЬЯ НАСЕЛЕНИЯ С ФАКТОРАМИ СРЕДЫ ОБИТАНИЯ ЧЕЛОВЕКА 64

3.1. Регрессионная модель взаимосвязи общей заболеваемости населения крупного города с загрязнением окружающей среды 65

3.1.1. Описательная статистика 66

3.1.2. Распределение значений токсикантов и заболеваемости 68

3.1.3. Парные коэффициенты корреляции между заболеваемостью и концентрациями токсикантов 71

3.1.4. Коэффициенты корреляции между концентрациями токсикантов 75

3.1.5. Модели простой линейной регрессии 80

3.1.6. Модели множественной регрессии 81

3.1.7. Устойчивость модели множественной регрессии 85

3.2. Смертность населения городов Свердловской области и ее связь с социально-экономическими факторами риска (анализ на основе регрессионной модели) 89

3.2.1. Описательная статистика 93

3.2.2. Парные корреляционные связи между смертностью и факторами риска 94

3.2.3. Модели простой линейной регрессии 100

3.2.4. Модели множественной регрессии 101

3.2.5. Устойчивость модели множественной регрессии 106

3.3. Сравнение моделей, построенных для разных уровней усреднения данных (городской, областной, федеральный уровни) 109

Глава 4.

ИНТЕГРАЛЬНЫЕ ПОКАЗАТЕЛИ СРЕДЫ ОБИТАНИЯ ЧЕЛОВЕКА И ИХ СВЯЗЬ С ПОКАЗАТЕЛЯМИ ЗДОРОВЬЯ НАСЕЛЕНИЯ 115

4.1. Обзор подходов к построению интегральных показателей (ИП) 115

4.2. Интегральные показатели загрязнения атмосферного воздуха и их связь с показателями заболеваемости населения крупного промышленного центра (Санкт-Петербург) 121

4.2.1. Характеристики связи между заболеваемостью и концентрациями токсикантов 121

4.2.2. Интегральные показатели загрязнения и их связь с показателями заболеваемости 126

4.3. Интегральный показатель социально-экономического положения городов Свердловской области и его связь со смертностью населения 134

4.3.1. Коэффициенты корреляции между YuX. 135

4.3.2. Различие смертности в городах с благоприятной и неблагоприятной социально-экономической обстановкой X. 135

4.3.3. Различие средних значений факторов риска X в городах с низкой и высокой смертностью Y. 137

4.3.4. Интегральный показатель социально-экономического состояния городов 138

ЗАКЛЮЧЕНИЕ 143

БИБЛИОГРАФИЧЕСКИЙ СПИСОК 146

Введение к работе

Актуальность проблемы. Выявление ведущих факторов риска потери здоровья населением является актуальной не только для России, но и для всех стран мира. Знание этих факторов позволяет ранжировать их по степени влияния на здоровье, разрабатывать программы по устранению факторов риска (если это возможно) или находить меры, снижающие негативное действие факторов риска (если их устранение невозможно). Информация о силе влияния различных факторов риска может быть использована для управления риском, для формирования групп риска путем отбора из популяции индивидуумов, имеющих повышенную вероятность заболеваний. Именно в группе повышенного риска проведение профилактических мероприятий наиболее целесообразно.

Исследования взаимосвязей факторов риска с показателями здоровья, которые объединяют в раздел «Медико-экологический мониторинг» (Медико-экологический мониторинг, 1993), описываются в большом числе публикаций (Авалиани, 2001; Альбицкий, 1986; Балаболкин, 1998; Вельтищев, 1998; Гичев, 2003; Привалова, 2003; Штоль, 2000; Экология, 1998). В последнее десятилетие ведущими специалистами выдвигается необходимость количественного описания взаимосвязи «Здоровье - фактор риска» (Вельтищев, 1998; Голубев, 2001а). Однако декларация необходимости установления количественных связей не приводит автоматически к желаемому результату. Более того, в последние годы в ведущих Российских научных журналах появляются публикации, которые либо вообще не используют математические методы анализа и, следовательно, не устанавливают никаких связей (Губернский и др., 2002; Иванов и др., 2005), либо выдают за количественные такие оценки, которые на самом деле количественными не являются (Близнюк, 2001; Галлеев и др., 2002; Голубев, 20016; Иванов, 2003).

Среди математических методов, используемых в исследованиях медико-экологического мониторинга, значительное место занимают методы математической статистики (Бейли, 1962; Афифи, 1982; Гланц, 1994; Гублер, 1978; Гублер, 1990; Гублер, Генкин, 1968; Джонсон, 1981; Дюк, Самойленко, 2001; Медик, 2000; Медик, 2001; Флейс, 1989). В наибольшей степени задачам количественной оценки отвечают, среди статистических методов, методы корреляционного и регрессионного анализа (Дрейпер, 1973; Кендалл, 1973; Налимов, 1971; Реброва, 2003; Юнкеров, Григорьев, 2005; Вараксин, 2006; Shoukri, 1998). Анализ имеющейся в открытой печати медико-экологической информации (Окружающая среда..., 2002; Результаты..., 2001; Российский статистический ежегодник, 2004; Социально-экономическое положение, 2004; Социально-экономическое положение, 2006) показывает, что многие характеристики здоровья населения и факторов риска выражаются, с точки зрения математики, количественными непрерывными переменными. Именно для такого типа переменных применяются методы корреляционного и регрессионного анализа. Таким образом, актуальной является тема количественного исследования взаимосвязей между состоянием здоровья населения и факторами риска потери здоровья методами прикладной математической статистики, а именно методами регрессионного анализа.

Еще одной проблемой медико-экологического мониторинга является проблема комплексного учета факторов риска при их совместном действии на организм человека (Флетчер, 1998; Привалова, 2003; Гичев, 2000; Гичев, 2002; Горбатовский, 1995; Гаврилов, 1991; Ендриховский, 1980). Большинство заболеваний имеют многофакторную природу и поэтому актуальной проблемой является задача математической оценки действия нескольких факторов риска одновременно. Эта проблема также решается методами многофакторного регрессионного анализа. При этом, существующие методики статистических исследований требуют существенных дополнений, когда речь идет о задачах медико-экологического

мониторинга (в основном, в плане идеологии постановки задачи исследования и трактовки получаемых результатов). Поэтому совершенствование и применение многофакторных методик для комплексной оценки состояния здоровья населения в связи с воздействием различных факторов окружающей среды представляется актуальной.

Цель работы', разработка методологии анализа взаимосвязей здоровья населения с факторами среды обитания на основе статистических регрессионных моделей и ее применение для выявления такой взаимосвязи с целью определения ведущих факторов риска потери здоровья для городского, областного и федерального уровней рассмотрения.

Задачи исследования:

  1. Изучение особенностей построения и анализа статистических регрессионных моделей, используемых для решения задач в области медико-экологического мониторинга. Формулировка показаний к применению регрессионных моделей и ограничений подходов, основанных на этих моделях.

  2. Построение и анализ регрессионной модели взаимосвязи здоровья населения крупного города с загрязнением атмосферного воздуха (городской уровень).

  3. Анализ факторов риска потери здоровья и построение регрессионной модели взаимосвязи здоровья населения городов Свердловской области с социально-экономическими факторами риска (областной уровень).

  4. Совместный анализ факторов риска потери здоровья на городском, областном и федеральном уровнях.

  5. Анализ методик построения интегральных показателей, характеризующих среду обитания человека в связи с проблемой здоровья населения; построение интегральных показателей среды обитания (на

городском и областном уровнях), ориентированных на данный показатель

здоровья. Научная новизна.

Сформулированы условия построения предсказательных регрессионных моделей для различных территориальных уровней в задачах медико-экологического мониторинга.

Построены новые регрессионные модели для описания взаимосвязи здоровья населения с факторами риска потери здоровья на городском, областном и федеральном уровнях. Показано, что на основе имеющейся информации (данные официальной медико-экологической статистики) с помощью регрессионных моделей можно изучать влияние загрязнения атмосферного воздуха на здоровье населения крупного города с развитой системой мониторинга атмосферы; на областном и федеральном уровнях возможно изучение влияния социально-экономических факторов.

Построены новые интегральные показатели (ИП) загрязнения атмосферного воздуха крупного города и социально-экономического состояния городов области, ориентированные на выбранный показатель здоровья. Показано, что для создания такого ИП необходим ориентированный на показатель здоровья отбор первичных факторов риска и подходящий многофакторный метод построения ИП (лучший метод -кластер-анализ).

Практическая значимость работы. Найденные факторы риска потери здоровья, оказывающие максимальный негативный эффект на человека, могут служить основой для разработки научно-обоснованных программ по сохранению и восстановлению здоровья населения путем целенаправленного воздействия на эти факторы. Результаты исследований могут быть использованы руководящими органами городов и областей (Отделы здравоохранения, экологические контролирующие организации городов и областей, органы Роспотребнадзора).

8 Основные положения, выносимые на защиту:

  1. Только на городском уровне возможно построение предсказательной регрессионной модели для описания взаимосвязи здоровья населения с показателями загрязнения атмосферного воздуха. В условиях России на областном и федеральном уровнях возможны модели, основанные на социально-экономических факторах.

  2. Более 80% изменчивости (дисперсии) заболеваемости населения г. Санкт-Петербург, может быть объяснено различием загрязнения атмосферного воздуха в различных районах города на основе регрессионной модели с тремя предикторами-токсикантами (окись углерода, двуокись азота, фенол).

  3. Различия смертности населения городов одной области в значительной мере обусловлены социальными факторами. Для населения городов Свердловской области около 80% дисперсии показателя «Смертность» может быть объяснено (модель множественной регрессии) влиянием всего трех факторов риска: высокой безработицей, большой долей нетрудоспособного населения, малой численностью врачей.

  4. Интегральным показателем, наиболее тесно связанным с выбранной характеристикой здоровья населения, является показатель, основанный на многомерной кластерной модели.

Личный вклад автора. Вошедшие в диссертацию результаты получены автором совместно с научным руководителем чл.-корр. РАН В.Н. Чукановым. Диссертант самостоятельно провел поиск и отбор для дальнейшего анализа первичных данных, построил статистические регрессионные модели взаимосвязи здоровья населения с факторами риска, получил интегральные показатели состояния среды обитания человека, ориентированные на выбранный показатель здоровья.

9 Апробация работы. Основные положения диссертационной работы были представлены на Всероссийской конференции «Экологические проблемы промышленных регионов», Екатеринбург, 2004; Международной конференции «Медико-биологические и экологические проблемы здоровья человека на Севере», Сургут, 2004; Всероссийской научно-практической конференции «Современные технологии исследований в гигиене и экологии», Санкт-Петербург, 2004; XI Международном экологическом симпозиуме «Урал атомный, Урал промышленный», Екатеринбург, 2005; XI Всероссийском конгрессе «Экология и здоровье человека», Самара, 2006.

Публикации. Основное содержание диссертации представлено в 8 публикациях, из них три - в журналах из списка ВАК и пять - тезисы докладов международных и всероссийских конференций.

Структура и объем работы. Диссертация состоит из введения, четырех глав, выводов, списка литературы. Работа изложена на 155 страницах текста, содержит 31 таблицу и 21 рисунок. Библиографический список включает 109 источников.

Благодарности. Выражаю благодарность научному руководителю -доктору физико-математических наук, профессору, члену-корреспонденту РАН Виктору Николаевичу Чуканову за руководство и поддержку на всех этапах выполнения работы.

Признательна заведующему лабораторией математического моделирования Института промышленной экологии УрО РАН доктору физико-математических наук, профессору Вараксину Анатолию Николаевичу, сотрудникам лаборатории кандидату физико-математических наук Живодерову Андрею Алексеевичу, кандидату физико-математических наук Антонову Константину Леонидовичу, научному сотруднику Константиновой Екатерине Даниловне за поддержку работы, дружеские советы и помощь.

Список сокращений

ОС - окружающая среда

ПЛР - простая линейная регрессия

МЛР - множественная линейная регрессия

ПДК - предельно-допустимая концентрация

ИП - интегральный показатель РФ - Российская Федерация ФР - фактор риска

Список условных обозначений

Y - объясняемый показатель в регрессионных моделях (заболеваемость,

смертность)

X - объясняющие показатели в регрессионных моделях (факторы риска)

п - число наблюдений

к- число предикторов в модели МЛР

г - парный коэффициент корреляции Пирсона

rs - парный коэффициент корреляции Спирмена

R - коэффициент детерминации модели МЛР

Влияние факторов риска на здоровье населения

Цель настоящего раздела - рассмотреть имеющиеся в литературе подходы к анализу влияния различных факторов риска на здоровье населения. В результате такого анализа систематизированы типичные ошибки, возникающие при использовании статистических методов анализа влияния факторов риска на здоровье населения и сформулированы принципы корректного анализа медико-экологической информации с помощью регрессионных моделей. Обзор составлен на основе анализа известных монографий (Окружающая среда ... , 2002; Экология..., 1998; Маймулов и др., 2000; Вельтищев, 1998; Альбицкий, Баранов, 1986) и статей, опубликованных в ведущих периодических изданиях России.

Ниже перечислены основные ошибки в построении и анализе статистических моделей в задачах медико-экологического мониторинга.

В работах по применению статистических моделей в задачах медико-экологического мониторинга достаточно распространены формальные ошибки построения модели, когда не выполнены основные условия построения моделей (для моделей регрессионного типа эти условия перечислены в разделе 1.2). Ниже приведен анализ публикаций, содержащих ошибки такого рода. В работе (Зайцева и др., 1999) речь идет о применении метода газовой хроматографии для определения ароматических углеводородов в биологических жидкостях. Авторами получены экспериментальные данные о содержании бензола в крови ребенка (Y) и содержании бензола в крови матери (X) и проведена статистическая обработка данных. Анализ диаграммы рассеяния Y-X, полученной авторами, показывает, что наблюдения образуют компактную группу точек и одну точку, отстоящую от группы очень далеко. Данная точка является явным выбросом. Регрессионная кривая проведена авторами через все указанные точки, включая выброс. Таким образом, здесь мы видим типичную ошибку при построении модели регрессионного типа на данных с выбросом. При наличии такой грубой ошибки, как явный выброс, не приходится вообще говорить о какой-то модели: по представленным экспериментальным данным в принципе невозможно определить зависимость Y от X.

С биологической точки зрения интересен механизм поступления бензола в организм матери и его обмен в системе мать - плацента - плод. Авторы не пытаются построить предметную модель взаимосвязи Y и X; в результате в работе отсутствует биологическое или медицинское обоснование взаимосвязи исследуемых показателей.

Ошибка при обработке массива информации с выбросом допущена в работе (Зайцева и др., 2004), в которой имеется набор наблюдений, состоящий из 51 точки на графике Y - X, координата X у которых не превосходит 0.45. Этот набор на диаграмме рассеяния представляет собой бесформенное облако точек без каких-либо тенденций изменения Y (IgE к дихлорэтану) при изменении X (содержание дихлорэтана в крови). Фактически уравнение регрессии получается за счет существования одной точки с Х=1, которая является явным выбросом. При этом авторы утверждают, что «... доказаны линейные (?) статистические зависимости содержания IgE и концентрации токсиканта в крови, которые свидетельствуют о достоверной прямой зависимости (г=0.467) в системе IgE, специфический к дихлорэтану - дихлорэтан». Очевидно, что на таком экспериментальном материале путем моделирования доказать ничего невозможно. Аналогичные ошибки встречаются также в работах (Мудрый и др., 2000; Косарев, Сиротко, 2002; Сабирова, 2001; Даутов и др., 2003; Золотников, Ракитский, 2000 и др.).

Другой распространенной ошибкой среди публикаций по использованию регрессионных моделей в задачах медико-экологического мониторинга является отсутствие четкого описания первичных данных. Результатом такого рода ошибки является невозможность понять, анализ чего (каких объектов, каких связей) был проведен в данной работе и, как следствие, полная бесполезность данной модели для анализа изучаемого явления. Ниже приведены примеры таких публикаций.

В работе (Косарев, Сиротко, 2002) исследовано состояние окружающей среды крупного областного центра (Самара) и проведена оценка влияния выбросов промышленного производства в 5 районах города на бронхолегочную заболеваемость в период 1993-1998 г. Для описания воздействия химических соединений на заболеваемость пневмонией авторами построена модель МЛР, содержащая три предиктора: углеводороды, сернистый ангидрид и сажа. Из текста статьи непонятно, что является точкой наблюдения при построении модели МЛР. Авторы пишут, что «корреляционный анализ проводили... в 5 районах города суммарно и по каждому району отдельно». Тогда в первом случае (по городу в целом) точка наблюдения - это заболеваемость и загрязнение в какой-либо год наблюдения; получается очень короткий временной ряд, содержащий всего 6 точек наблюдения (1993-1998 гг.). Во втором случае (анализ по каждому району отдельно) в качестве наблюдения можно было использовать усредненную за 6 лет заболеваемость и загрязнение каждого района; получается 5 точек наблюдения, что нереально мало для построения модели множественной регрессии с тремя предикторами. Наконец, если в качестве наблюдений в регрессионном анализе использовались данные каждого района за каждый год (5 районов х 6 лет =30 точек наблюдения, представляющих смешанную пространственно-временную совокупность), тогда авторы построили очень интересную модель, которая с высокой точностью (R2 90%) описывает как пространственные, так и временные изменения заболеваемости, однако это лишь догадки.

В работе (Штоль и др., 2000) изучалось влияние загрязнения атмосферного воздуха асбестсодержащей пылью на здоровье детей. Авторы сообщают, что всего обследовано 600 детей в г. Асбесте Свердловской области, где воздух содержит асбестсодержащую пыль, и 400 детей в Екатеринбурге (контрольная группа). При построении модели регрессионного типа, связывающей респираторную заболеваемость детей с концентрацией асбестсодержащей пыли не указано, что является точкой наблюдения (отдельный ребенок, группа детей, способ формирования группы) и по какому числу точек построено уравнение регрессии. В результате выводы работы оказываются неопределенными. Аналогичные ошибки присутствуют в работах (Кутепов и др., 1999), (Большаков и др., 1999), (Сабирова и др., 2003).

Предметная и предсказательная модели регрессии

Существуют два основных типа задач, для решения которых используются модели регрессионного типа (модели множественной линейной регрессии - МЛР) (Айвазян и др., 1985): Задача 1. Предсказание с помощью МЛР неизвестных значений Y для значений X, не вошедших в набор первичных данных (предсказательная модель). Для этого строится уравнение МЛР типа (1.5), с помощью которого можно рассчитать значения Y при значениях Xj, отличных от набора первичных данных. При этом вопрос о составе предикторов X (какие конкретно Xj необходимо включить в модель) не является главным; основная задача - минимизация ошибок получаемого прогноза с помощью тех предикторов, которые имеются в распоряжении исследователя. Поэтому соответствующую модель называют иногда моделью черного ящика.

Таким образом, термин «модель черного ящика» означает, что мы не знаем:

- существует ли вообще зависимость Y от X, должна ли она проявляться для данных объектов исследования (например, зависит ли заболеваемость Y населения данной территории от уровней загрязнения окружающей среды X)?

- каков биологический механизм действия токсиканта на организм человека, приводящий к возникновению данного заболевания - каков вид зависимости Y от X - линейный, квадратичный, логарифмический или иной Следует отметить, что отсутствие знаний о биологическом (физиологическом) механизме действия факторов риска на человека и отсутствие знаний о виде зависимости Y от X при построении моделей в области медико-экологического мониторинга является обычным явлением.

Задача 2. Выявление причинно-следственных связей между Y и X с использованием модели МЛР. В задачах данного типа на основе знания коэффициентов регрессии Z»i необходимо объяснить (трактовать) на предметном уровне зависимость Y от отдельных Xj. Как отмечается в (Айвазян и др., 1985), постановка задачи 2 претендует на проникновение в физический смысл изучаемых связей (предметная модель) и в области медико-экологического мониторинга реально трудно выполнима. Предметная статистическая модель подразумевает чаще всего, что причинно-следственные связи между Y и X уже установлены в той предметной области знаний, к которой принадлежит данная модель (в нашем случае - биология и медицина). В этом смысле часть задачи 2 должна быть решена заранее вне статистического анализа. Другая ее часть может быть решена методами статистического анализа; это касается вычисления параметров модели, установления силы и определения статистического качества взаимосвязи Y с отдельными предикторами X, ранжирования предикторов по степени их влияния на Y в комплексе предикторов и др.

Анализ опубликованных в литературе результатов (глава 1) приводит к следующему заключению. Если предметная область, в которой строится модель регрессионного типа, ничего не говорит о виде зависимости Y от предикторов Х\, модель МЛР может быть использована для предсказания зависимости Y от X без трактовки предметного смысла коэффициентов (модель черного ящика). Использование модели МЛР в ситуации черного ящика для объяснения зависимости Y от предикторов X,- в принципе неправомочно и может привести к явно абсурдным, с предметной точки зрения, результатам. Даже в том случае, когда явно абсурдных результатов нет, предметная трактовка параметров предсказательной модели не имеет смысла.

Литературные данные о построении предметных моделей в экологии (биологии, медицине) крайне скудны. Нам известны две предметные модели регрессионного типа, которые можно отнести к разделам знаний «Экология -биология - медицина». Авторы первой модели (Айвазян и др., 1985) исследовали возможность прогнозирования веса коров на основе знания двух первичных характеристик животного: Xj - окружность туловища и Х2 - длина коровы от холки до хвоста. Для этого были построены две модели МЛР: одна - традиционная, вторая - предметная. В традиционной модели вес коровы Y представляли в виде линейной комбинации первичных характеристик Xi и Х2 без привлечения каких-либо знаний предметной области:

Регрессионная модель взаимосвязи общей заболеваемости населения крупного города с загрязнением окружающей среды

В данном разделе, основанном на работе (Вараксин, Маслакова, Чуканов, 2004), показаны способы построения и анализа моделей регрессионного типа, связывающих заболеваемость населения с уровнями загрязнения атмосферного воздуха в крупном промышленном центре (г.Санкт-Петербург). Первичная информация, необходимая для выполнения данной работы опубликована в монографии (Окружающая среда ..., 2002). Объектами исследования является население административных районов г. Санкт-Петербург. База данных содержит показатели загрязнения атмосферного воздуха и показатели заболеваемости. Показателями загрязнения выступают усредненные за пять лет (1993-1997 гг.) концентрации 12 токсикантов в 19 административных районах Санкт-Петербурга. Концентрации именно этих токсикантов систематически (по мнению авторов) превышают нормативные значения. Показатель заболеваемости - усредненная за пять лет общая заболеваемость взрослого населения в этих же районах города.

Авторы работы (Окружающая среда ..., 2002) следующим образом обосновывают выбор исследуемой величины (общая заболеваемость): «... на уровне малых воздействий (в пределах 1...10 ПДК) большая часть примесей проявляет токсический эффект однотипно, в виде симптомов неспецифической хронической интоксикации, приводящей к снижению адаптационных возможностей организма и создающей благоприятный фон для развития различных видов патологии, суммирующихся в показателях общей заболеваемости».

В работе (Окружающая среда..., 2002) вычислены парные коэффициенты корреляции Пирсона между заболеваемостью Y и концентрациями токсикантов X, построена модель множественной регрессии, связывающая Y с концентрациями всех 12 токсикантов и модель простой линейной регрессии для связи Y с суммарным показателем загрязнения атмосферы Рсум.

Авторы (Окружающая среда ..., 2002) отмечают, что ни один из коэффициентов уравнения множественной регрессии статистически значимо не отличается от нуля на уровне значимости а=0.05; следовательно, взаимосвязи между Y и концентрациями всех 12 загрязнителей не существует. Авторы (Окружающая среда ..., 2002) получили статистически достоверную взаимосвязь между Y и Рсум., с помощью которой, по мнению авторов, можно оценить вклад загрязнения атмосферного воздуха в среднегодовой уровень общей заболеваемости среди взрослых. Коэффициент детерминации модели, полученный авторами (R =0.23), достаточно низок для того, чтобы модель была предсказательной (чтобы расчетные значения Y действительно совпадали с реально наблюдаемыми значениями заболеваемости для каждого района города); модель, скорее, отражает тенденцию роста заболеваемости при увеличении загрязнения.

Следует признать, что авторы (Окружающая среда ..., 2002) сделали лишь малую часть выводов и заключений, которые можно было бы получить из имеющейся информации. Посмотрим, какие заключения о взаимосвязях заболеваемости с загрязнением окружающей среды можно сделать на основе имеющейся информации, если следовать схеме построения и анализа регрессионной модели, представленной в разделе 2.6.

Похожие диссертации на Статистические модели взаимосвязей здоровья населения с факторами внешней среды