Содержание к диссертации
Введение
Глава 1. Современные подходы к анализу данных медицинских обследований. Аналитический обзор литературы 13
1.1. Статистические данные о сердечнососудистой патологии у работников нефтеперерабатывающих производств 13
1.2. Медицинская статусметрия в оценке риска развития клинических проявлений атеросклероза 15
1.3. Применение искусственных нейронных сетей в медицине 21
1.4. Методологические аспекты применения ИНС в оценке риска 24
1.5. Генетические методы 27
1.6. Критерий качества обучения ИНС 29
1.7. Заключение 30
Глава 2. Объекты, объем и методы исследования 31
2.1. Общая характеристика материала исследования 31
2.2. Характеристика использованных показателей 32
2.3. Описание процесса составления обучающих и контрольных выборок 36
2.4. Программное обеспечение 36
2.5. Заключение 38
Глава 3. Теоретическое обоснование возможности применения и разработка математического аппарата неиросетевои оценки риска развития клинических проявлений атеросклероза 39
3.1. Формальное представление исходных данных 39
3.2. Математическое определение оценки риска 41
3.3. Связь условной функции частоты и модели Фишера 42
3.4. Востановление условной функции частоты методом «kn ближайших соседей» (kn — Nearest Neighbor) 45
3.5. Особенности применения искусственных нейронных сетей при аппроксимации условной функции частоты 51
3.6. Эмпирический подход к регуляризации обучения искусственных нейронных сетей 59
3.7. Коррекция алгоритма Лавенберга-Маркварта 66
3.8. Генетический алгоритм и аспекты его применения в синтезе и обучении ИНС 71
3.9. Нормировка значений исходных показателей 72
3.10. Заключение 77
Глава 4. Разработка алгоритм автоматизированного синтеза нейросетевой системы оценки риска 79
4.1. Общая структура процедуры синтеза 79
4.2. Формирование обучающего множества 81
4.3. Выбор структуры ИНС и метода ее обучения 87
4.4. Обучение ИНС по всему обучающему множеству 91
Глава 5. Исследование эффективности нейросетевого метода оценки риска развития клинических проявлений атеросклероза 98
5.1. Статистическое моделирование 98
5.1.1. Пример восстановления условной функции частоты по экспериментальным данным 98
5.1.2. Экспериментальное подтверждение эффективности применения внешнего критерия 103
5.2. Проверка эффективности нейросетевого алгоритма по сравнению с существующим методом на экспериментальных данных 106
5.2.1. Сравнение результатов работы ИНС и ЛДА на реальных экспериментальных данных 106
5.2.2. Исследование вариации оценки риска при значительном изменении одного параметра 111
5.3. Заключение 117
Глава 6. Оценка риска развития клинических проявлений атеросклероза с учетом характера и условий труда на примере работников нефтепереработки 118
6.1. Распространенность атеросклероза крупных сосудов среди работников нефтепереработки 118
6.2. Сравнительный анализ эффективности нейросетевой оценки риска развития клинических проявлений атеросклероза со шкалами SCORE, PROCAMHFHS 121
6.3. Анализ состояния здоровья работников НИН, находящихся под длительным наблюдением 124
Обсуждение результатов 127
Выводы 134
Практические рекомендации 136
Список литературы 138
- Медицинская статусметрия в оценке риска развития клинических проявлений атеросклероза
- Особенности применения искусственных нейронных сетей при аппроксимации условной функции частоты
- Исследование вариации оценки риска при значительном изменении одного параметра
- Анализ состояния здоровья работников НИН, находящихся под длительным наблюдением
Введение к работе
Актуальность исследования. Атеросклеротически обусловленная кардиоваскулярная патология является основной причиной смертности населения в мире. Так, в США на ее долю приходится более 30% от всех причин смерти, в Европе – свыше 50%. В России ежегодно от сердечнососудистых заболеваний умирает более 700 человек на каждые 100 тысяч населения (Константинов В.О., 2006; Информационный бюллетень ВОЗ, 2007; Christopher P., 2002; Conroy R.M et al., 2003; Lloyd-Jones D.M. et al., 2004; Fourth J.T. 2007). Факторы риска развития атеросклероза весьма многообразны и большинство из них достаточно хорошо изучено. Они включают нарушение липидного обмена, артериальную гипертензию, сахарный диабет II типа, хроническую почечную недостаточность, гипотиреоз, неблагоприятную наследственность, метаболический синдром, курение и некоторые другие. Вместе с тем, в отечественной научной литературе имеются данные о более высокой вероятности развития атеросклероза при воздействии тех или иных факторов труда и трудового процесса, что в ряде случаев позволяет рассматривать эту группу заболеваний в качестве профессионально обусловленных. В частности, в процессе многолетних исследований, выполненных под руководством профессора Бовтюшко В.Г., установлены факты более раннего развития сердечнососудистой патологии атерогенной природы у работников нефтеперерабатывающего производства. Авторы связывают это с воздействием на работников сложного комплекса вредных факторов рабочей среды и трудового процесса, включающего интенсивный производственный шум, повышенную напряженность труда вследствие взрывоопасности производства и высокой личной ответственности, а также широкий спектр вредных химических веществ, представленный, в основном углеводородами различных классов (Бовтюшко В.Г., 1996, Иванов А.А., 2007, Иванов А.А. и др., 2008).
Исследованиям, связанным с изучением закономерностей формирования болезней системы кровообращения как профессионально обусловленных заболеваний уделяется на современном этапе развития медицины труда особое внимание, поскольку, являясь «болезнями цивилизации», именно они определяют уровень заболеваемости, трудопотерь по болезни и смертности работающего населения в большинстве развитых и многих развивающихся странах (Измеров Н.Ф., 2005; Шаяхметов С.Ф., Дьякович М.П., 2007; Денисов Э.И., Чесалин П.В., 2007).
В условиях анализа и мониторинга здоровья в крупных трудовых коллективах одной из важнейших проблем становится оценка и прогноз индивидуального риска клинических проявлений атеросклероза, особенно таких серьезных как инфаркт миокарда и мозговой инсульт. Наиболее широко с этой целью в настоящее время используется таблица SCORE (Systemic Coronary Risk Evaluation), с помощью которой прогнозируется индивидуальный фатальный риск атеросклеротической патологии на ближайшие 10 лет (Christopher P., 2002 Thompson G. Et al., 2006). Величина индивидуального риска в диапазоне от 1% до 15% определяется с учетом пола, возраста, статуса курения, уровня систолического артериального давления и общего холестерина в плазме крови. Значения параметров рисков по шкале SCORE основаны на результатах 12 эпидемиологических исследований с участием более 205 тысяч человек. В настоящее время разработана аналогичная таблица для Российской Федерации с учетом данных национальной статистики и особенностей распространения факторов риска сердечнососудистой патологии в России. Тем не менее, установлено, что он может быть выше, чем рассчитанный с помощью SCORE, поскольку в ней не учитываются данные инструментальных и лабораторных исследований, объективно характеризующие состояние сердечнососудистой системы, липидного обмена, гематологические и биохимические показатели.
Существует еще несколько методик оценки риска развития атеросклероза, в частности FHS (Framingham heart study) и PROCAM, также основанных на статистическом прогнозировании, которые уделяют чрезмерную роль календарному возрасту. По этой причине, подавляющее большинство лиц в возрасте 25 - 50 лет попадает в категорию низкого, реже, умеренного риска. Из этого следует, что работники молодого и среднего возраста традиционно исключаются из сферы действия известных методов стратификации риска. В то же время, по данным Росстата, за период с 1990 по 2005 год смертность среди лиц в возрасте от 25 до 35 лет от сердечнососудистых заболеваний выросла более чем в три раза.
В 1996 году В.Г. Бовтюшко в своей докторской диссертации продемонстрировал эффективность практического применения медицинской статусметрии (Разоренов Г.И., Поддубский Г.А., 1985) при решении задачи диагностики доклинических стадий заболеваний сердечнососудистой системы атерогенной природы у работников нефтеперерабатывающих производств. Установленные в последующем зависимости взаимосвязей биохимических и гемодинамических показателей при развитии атеросклероза позволили расширить состав диагностических показателей, традиционно используемых при оценке риска развития атеросклероза, что повысило информативность и устойчивость полученных результатов, по сравнению с наиболее распространенными экспертными методами. Опыт использования системы диагностики доклинического атеросклероза подтвердил эффективность применения медицинской статусметрии в целях своевременной профилактики сердечнососудистых заболеваний атерогенной природы. Однако одновременно был выявлен и ряд серьезных недостатков используемой системы, проявляющихся в значимом искажении оценки риска для лиц, показатели которых имели значения, далеко отстоящие от основной массы наблюдений.
Повысить эффективность практического применения метода индивидуальной оценки риска может позволить математический аппарат искусственных нейронных сетей (ИНС), которые способны обобщать эмпирические данные, выявлять и воспроизводить скрытые в этих данных закономерности, что дает возможность рассматривать нейросетевой подход как наиболее приемлемую альтернативу применяемым ранее классическим статистическим методам.
Таким образом, актуальность настоящего исследования определяется высокой распространенностью среди работающего населения атерогенных поражений системы кровообращения, являющихся одной из основных причин ранней утраты трудоспособности и смертности в трудоспособном возрасте, необходимостью оценки индивидуального риска развития атеросклероза в условиях мониторинга здоровья трудовых коллективов и потребностью повышения эффективности методов оценки риска за счет использования математического аппарата ИНС.
Целью настоящей работы является совершенствование системы оценки индивидуального риска развития клинических проявлений атеросклероза, у работников занятых во вредных условиях труда, путем использования математического аппарата искусственных нейронных сетей.
Для достижения поставленной цели необходимо было решить следующие основные задачи:
-
Исследовать современные подходы к анализу данных медицинских обследований и выявить основные причины недостаточной информативности и устойчивости оценки риска развития клинических проявлений атеросклероза при применении линейного дискриминантного анализа по данным отечественной и зарубежной литературы.
-
Теоретически обосновать возможность применения и разработать математический аппарат нейросетевой оценки риска развития клинических проявлений атеросклероза.
-
Разработать алгоритм автоматизированного синтеза нейросетевой системы оценки риска.
-
Оценить эффективность нейросетевого метода оценки риска развития клинических проявлений атеросклероза на основе сравнительного анализа результатов многолетнего мониторинга состояния здоровья работников нефтеперерабатывающих производств.
-
Оценить распространенность заболеваний системы кровообращения в современных производствах нефтепереработки с учетом характера и условий труда работников.
Научная новизна исследования состоит в том, что представленный в работе подход к оценке риска развития клинических проявлений атеросклероза у работников нефтехимических производств не имеет опубликованных аналогов. Впервые ИНС рассматривается в качестве математического аппарата, воспроизводящего условную функцию частоты на основании альтернативных обучающих выборок. Установлено, что высокая чувствительность нейросетевого метода к изменению взаимосвязей показателей функциональных систем организма позволяет отследить систематический рост величины риска, спрогнозировать развитие патологии, принять своевременные профилактические и лечебные мероприятия; последующий анализ динамики риска позволяет также оценить эффективность принятых мер, и, при необходимости, скорректировать профилактику и лечение доклинического атеросклероза.
Теоретическая значимость исследования состоит в аналитическом обосновании алгоритма самоорганизации ИНС, обеспечивающего нейросетевую реализацию условной функции частоты заболеваемости на множестве значений показателей, которые могут иметь произвольную природу.
В работе показана универсальность предлагаемого подхода к обработке многомерных статистических данных. Эти свойства разработанного алгоритма позволяют использовать его для решения широкого круга медицинских и биологических задач, в том числе для выявления производственных факторов, вызывающих раннее развитие атеросклероза, до начала фактического роста производственно-обусловленной сердечнососудистой заболеваемости.
Практическая значимость исследования заключается в разработке унифицированного комплекса программных и вычислительных средств, реализующих нейросетевой алгоритм оценки риска развития клинических проявлений атеросклероза, и внедрении нейросетевой оценки риска в систему мониторинга здоровья персонала нефтеперерабатывающего производства «Киришинефтеоргсинтез». Благодаря высокой информативной емкости искусственной нейронной сети и ее обобщающим способностям, разработанный метод оценки риска развития атеросклероза в значительной степени повышает эффективность мониторинга состояния здоровья работников нефтеперерабатывающих предприятий и позволяет решить главную задачу профилактики атеросклероза, а, именно, не «пропустить» лиц молодого возраста с высокой активностью атеросклеротических процессов.
Положения, выносимые на защиту.
1. Использовавшийся ранее в расчете риска линейный дискриминантный анализ Фишера дает недостаточно информативные и недостаточно устойчивые результаты, что происходит вследствие неполного соответствия данных лабораторных и врачебных исследований его требованиям.
2. Математический аппарат искусственных нейронных сетей – наиболее приемлемая альтернатива модели Фишера для оценки риска развития атеросклероза по данным врачебных, инструментальных и лабораторных исследований.
3. Предложенный метод обучения искусственных нейронных сетей повышает эффективность мониторинга состояния здоровья работников, занятых во вредных условиях труда, и позволяет решить главную задачу профилактики атеросклероза, а, именно, не «пропустить» лиц молодого возраста с высокой активностью атеросклеротических процессов.
Апробация и внедрение результатов исследования. Цели и материалы исследования докладывались на ежегодной Школе кардиологов Ленинградской области, г. Кириши, 26-27 октября 2006 г.; на второй Всероссийской научно-практической конференции «Терапевтические проблемы пожилого человека» (к 50-летию возрождения Российского научного медицинского общества терапевтов), Санкт-Петербург, 23-25 октября 2008 г.; на научно-практической конференции «Современные подходы к диагностике сердечнососудистых заболеваний» (к 70-летию кафедры ВМГТ ВМедА), Санкт-Петербург, 29-30 апреля 2010 г.; а также на совещаниях научно-исследовательской лаборатории лекарственной и экологической токсикологии НИЦ ВМедА.
Полученные научные данные используются при организации медицинского обеспечения работников предприятия «Киришинефтеоргсинтез», а также в учебном процессе Балтийского государственного технического университета «ВОЕНМЕХ» имени им. Д.Ф. Устинова.
Публикации. По теме диссертации опубликовано 8 работ, в том числе 2 - в журналах, рекомендуемых ВАК; получен 1 патент на изобретение.
Объем и структура диссертации. Диссертация изложена на 141 странице машинописного текста. Она содержит: введение; обзор литературы; описание материалов и методов исследования; главы, описывающие собственные результаты исследований; обсуждение полученных результатов; заключительные разделы, содержащие выводы, и список использованной литературы, включающий 123 источника, в том числе 76 отечественных и 47 иностранных авторов. Работа содержит 39 рисунков и 14 таблиц.
Личный вклад автора. Автором осуществлено планирование, организация и проведение статистических исследований, сформулированы цель и задачи, определены объем и методы исследований, проведены теоретическое обоснование и разработка алгоритма нейросетевой оценки риска. В составе авторского коллектива диссертант принимал участие в подготовке публикаций.
Медицинская статусметрия в оценке риска развития клинических проявлений атеросклероза
Преимущественная роль атеросклероза в структуре смертности от ССЗ отмечается практически во всех исследованиях по данной проблеме [26, 48]. В связи с этим, главным стратегическим средством в замедлении и обращении вспять негативных тенденций показателей смертности является профилактика и превентивное лечение этой патологии [56]. Так, в результате исследований Государственного научно-исследовательского центра профилактической медицины, на фоне проведения профилактики (первые 5 лет наблюдений) отмечено достоверное снижение смертности от ССЗ практически в полтора раза по сравнению с показателями при общепринятом лечении [47]. Естественно, реализация этих мер невозможна без своевременной диагностики патологии атерогенной природы на ранней стадии ее развития [87].
Как известно, основная сложность этой диагностики заключается в том, что в доклиническом (бессимптомном) периоде атеросклероза сколько-нибудь явные клинические проявления этого заболевания практически отсутствуют (А.Л. Мясников, 1960). Кроме того, доклиническую диагностику существенно усложняет влияние различных посторонних факторов, приводящих к неспецифической симптоматике патологии [28].
В этих условиях эффективным инструментом ранней диагностики ССЗ атерогенной природы, как уже отмечалось ранее, стал метод индивидуальной оценки риска развития клинических проявлений атеросклероза [4, 6], который длительное время использовался в рамках программы мониторинга здоровья работников нефтеперерабатывающего предприятия «Киришинефтеоргсинтез» (г. Кириши Ленинградской области).
Обсуждение этого метода следует начать с уточнения термина «риск», который в литературе трактуется по-разному. В статистической математике под термином «риск» обычно понимают наиболее вероятную цену ошибочной классификации (так называемый «Байесовский риск») [30], а также вероятность ошибочной классификации (средний и эмпирический риски) [1]. В противоположность этим определениям, в медицинской литературе термин «риск» связывают совсем с другой величиной: чаще всего он обозначает либо сравнительную оценку, такую как частота заболеваемости, либо вероятностный прогноз исходов патологии на некоторый период времени [27, 37]. В нашем же исследовании под термином «риск» подразумевается условная функция частоты клинических проявлений атеросклероза, определенная на множестве значений показателей клинических и лабораторных данных [2].
Условная функция частоты в предельном варианте (при каком угодно большом количестве экспериментов) стремится к апостериорной вероятности заболеваемости (распространенность в эпидемиологии) и довольно часто используется как в научно-исследовательской литературе [22, 30], так и в нормативно-правовых актах, в частности в нормах пожарной безопасности НПБ 105-03 [61], где опасность поражения человека избыточным давлением при сгорании газо-, паро- или пылевоздушных смесей определяется условной апостериорной вероятностью.
Упомянутый ранее вероятностный прогноз на некоторый срок (обычно 10 лет) также имеет широкое применение в медицине, в частности, на него опираются такие известные системы стратификации риска, как SCORE [99], FHS [116], NCEP [103] и ВНОК [26]. Однако не трудно доказать, что эта величина имеет прямую алгебраическую взаимосвязь с условной функцией частоты и при этом гораздо менее информативна. Главный недостаток вероятностного прогноза состоит в том, что технология его разработки обязательно приводит к завышению роли календарного возраста, что неприемлемо в оценке риска лиц, подверженных действию атерогенных факторов производства.
Возвращаясь к используемому методу оценки риска, отметим, что он имеет довольно длительную предысторию, которая началась еще в начале 70-х годов прошлого столетия с появлением вычислительной техники, позволяющей обрабатывать большие массивы многомерных данных, что предоставило возможность расширить математический аппарат биологических и медицинских исследований.
В 1985 году Г.И. Разоренов и Г.А. Поддубский предложили метод медицинской статусметрии, позволяющий проанализировать и оценить состояние здоровья человека по комплексу генетических, иммунологических, физиологических, биохимических, анамнестических, социально-гигиенических и других показателей [65]. В основе этого метода лежит линейный дискриминантный анализ (ЛДА) Фишера [29, 105], а результатом работы является вероятностная оценка принадлежности объекта к одному из двух альтернативных состояний («здоровье» или «клиническая стадия заболевания»).
Линейный дискриминантный анализ был предложен Р. Фишером (R. Fisher) в 1936 г. [29, 105] и уже более 70 лет находит применение в самых разных областях биологической и медицинской статистики (Урбах, 1964; Дуда, Харт, 1978 [30]; Малиновский [59]; Айвазян с соавт. [64], 1989; Ким и соавт., 1989).
Статусметрия была успешно применена для решения различных диагностических [31, 54, 67] и исследовательских задач [34, 36, 68, 79], в том числе для оценки предрасположенности к инфаркту миокарда [66], а также для анализа взаимосвязей между гематологическими, биохимическими, физиологическими и иммунными показателями и заболеваниями атерогенной этиологии [78, 5, 6, 7].
В 1996 году в работе В.Г. Бовтюшко медицинская статусметрия была применена для решения практических задач доклинической диагностики ССЗ атерогенной природы у работников нефтеперерабатывающего предприятия [4]. Позднее этот метод был усовершенствован за счет применения факторного анализа [33].
Многолетний опыт практического использования статусметрии показал целесообразность применения индивидуальной оценки риска развития клинических проявлений атеросклероза в целях своевременной профилактики ССЗ атерогенной природы [8]. В то же время был выявлен ряд серьезных недостатков данного метода, связанных с тем, что модель Фишера накладывает жесткие ограничения на природу решаемой задачи. В частности, в работе советских исследователей И.С. Енюкова и В.П. Булыгина (1976) большое внимание уделялось вопросу о последствиях нарушения предположений и допущений ЛДА [32]. А.Н. Колмогоровым и А.Д. Деевым (1972) были исследованы ошибки классификации при разных соотношениях численности набора признаков и обучающих выборок [24]. Устойчивость параметров модели Фишера к различным засорениям распределений рассмотрена в работе Ю. С. Харина (1990) [84]. Эти и другие публикации свидетельствуют о том, что использование ЛДА всегда требует тщательной проверки соответствия исходных показателей его требованиям.
В литературе отмечаются три наиболее часто нарушаемых требования ЛДА. Во-первых, это требование к надежности оценки средних величин и дисперсий показателей. Однако, как показывает практика, даже несколько величин, значимо выделяющихся из основной массы наблюдений, изменяют средние значения и дисперсии показателей в очень больших пределах и существенно искажают дискриминантную функцию и, соответственно, искомую оценку риска [10]. При этом значительное отклонение некоторых показателей от физиологической нормы у лиц, не имеющих заболеваний атерогенной этиологии, встречается довольно часто [28]. Это может быть вызвано различными заболеваниями (гипотиреоз, нефротический синдром и др.), приемом лекарственных препаратов, наследственными и индивидуальными особенностями организма. В то же время результаты обследований этих лиц трудно исключить из рассмотрения. Это связано с тем, что процедуры исключения экстремальных прецедентов для многомерных статистических исследований в литературе не представлены.
Второе требование состоит в том, что линейный дискриминантный анализ предполагает нормальное распределение исходных показателей в альтернативных выборках «больных» и «здоровых». Однако анализ биомедицинских данных, приведенный в работе В.П. Леонова, показывает, что «исследования нормальности распределения биомедицинских признаков, проведенные в течение 20 лет более чем на 10 тысячах переменных, показали, что примерно 75% используемых переменных не подчиняются нормальному распределению» [55].
Особенности применения искусственных нейронных сетей при аппроксимации условной функции частоты
Искусственные нейронные сети (ИНС) - это математический аппарат многомерной обработки данных произвольной природы, моделирующий структуру и функционирование биологической нейронной сети. Большинство существующих ИНС моделируют лишь самые простые свойства своих биологических прототипов.
Несмотря на это, ИНС позволяют реализовать некоторые важные в обработке данных функциональные возможности своих биологических прототипов. Например, ИНС обучаются на основе опыта и обобщают опыт предыдущих прецедентов на новые случаи.
Как и биологическая нейронная сеть, ИНС состоит из отдельных взаимосвязанных элементов - гипотетических искусственных нейронов. Структура искусственного нейрона, в первом приближении моделирующая функционирование биологического нейрона, представлена на рисунке 2, а его биологического прототипа — на рисунке 3.
Следует отметить важную особенность в передаче сигналов биологического нейрона, который может передавать информацию сложного характера, кодируя ее в виде отдельных групп нервных импульсов. Частота нервных импульсов, проходящих по одному и тому же нервному волокну, зависит от интенсивности раздражения нейрона. Этот способ передачи информации является очень гибким с точки зрения состава передаваемой информации, а также наиболее помехоустойчивым. При компьютерном моделировании такого способа передачи данных импульсный способ передачи сигнала был заменен на его непрерывный эквивалент. Это обозначает, что серия импульсов, испускаемая биологическим нейроном, моделируется эквивалентным (с точки зрения принимающих нейронов) ей сигналом. Например, таким сигналом может быть частота импульсов, которые передает нейрон. В соответствии с вышесказанным, искусственный нейрон генерирует не импульсы, а непрерывный сигнал, величина которого зависит от степени возбуждения нейрона.
В качестве примера на рисунке 2 приведен искусственный нейрон с тремя входами (синапсами) х{,х2,х3 и одним выходом (аксон) — у. В текущий момент времени через входные синапсы (на рисунке их 3) на нейрон направляются сигналы от других нейронов и/или из внешнего мира. Каждый синапс имеет параметр, называемый весом синапса и представляющий какое-либо число. На рисунке 2 веса синапсов обозначены ах,а2,аъ.
Сигнал, проходящий через синапс, умножается на вес этого синапса. В зависимости от веса, сигнал может быть усилен (модуль веса 1) или ослаблен (модуль веса 1) по амплитуде. Действие возбуждающего синапса моделируется положительным значением веса, а действие тормозящего синапса — отрицательным значением.
Сигналы от всех синапсов, ведущих к данному нейрону, принимает сумматор. На рисунке 2 сумматор обозначен Е. Кроме внешних сигналов, на этот же сумматор подается постоянный сигнал смещения а0. Это требуется для того, чтобы смоделировать состояние покоя нейрона, когда он игнорирует раздражающие импульсы слабой интенсивности. Таким образом, величина, определяющая суммарное тормозящее и возбуждающее воздействие входных сигналов, представлена в виде взвешенной суммы
Эта сумма далее передается на преобразователь, реализующий функцию активации данного нейрона. Преобразователь формирует величину, которая является реакцией нейрона на входные сигналы, и отправляет ее по «аксону» всем остальным нейронам через соответствующие синапсы. Последующие нейроны производят с полученными сигналами такие же операции, лишь с тем различием, что, во-первых, веса их синапсов могут быть уже другими, во-вторых, другие нейроны могут иметь другой вид функции активации.
Существуют различные виды функций активации. В большинстве современных работ используются искусственные нейроны с сигма-функцией активации, при которой отклик нейрона описывается следующей зависимостью, аналогичной модели Фишера (аналогичная (3.3))
Применение такой модели активации нейрона обосновано тем что, во-первых, она воспроизводит способность биологического нейрона в зависимости от возбуждения испускать импульсы разной, но ограниченной частоты, а во-вторых, дифференцируемость сигма-функции позволяет применять высоко эффективные методы настройки ИНС [60, 62].
Следует отметить, что для решения многих задач, кроме сигма-функции, могут применяться и другие модели активации нейронов [62]. В частности, МакКалох и Пите предложили модель нейрона, использующую пороговую функцию активации, когда нейрон может находиться только в двух состояниях - «активном» и «покоя». Отклик нейрона с этой функцией активации на входные сигналы определяется следующей разрывной (недифференцируемой) функцией:
Такие нейроны были использованы при создании «персептрона» — ИНС, предложенной Розенблаттом (Rosenblatt F.) [69]. Персептрон может эффективно решать достаточно широкий класс задач, в том числе классификацию, аналогичную кусочно-линейному дискриминантному анализу [52].
К сожалению, метод обучения персептрона малоэффективен, а отклик ИНС неприемлемо чувствителен к малым вариациям входных величин.
ИНС нашли широкое применение в системах, основанных на обработке большого количества сигналов. Особое место ИНС заняли в задачах воспроизведения (аппроксимации) сложных многомерных, в том числе вероятностных, зависимостей. Как уже упоминалось, в 1957 году А.Н. Колмогоровым была опубликована работа , в которой показано, что любая непрерывная функция нескольких переменных может быть представлена суперпозицией и суммированием функций одной переменной [50].
Работы Хехт-Нильсена (Hecht-Nielsen) [111] показали, что функции «достаточно общего вида» могут быть реализованы двухслойной ИНС «прямого распространения», когда нейроны с сигма-функцией активации объединяются в два упорядоченных слоя. Нейроны первого слоя связаны только с входами нейросети, а нейроны второго слоя могут иметь связи только с нейронами первого слоя.
Исследование вариации оценки риска при значительном изменении одного параметра
Если в результате предыдущего эксперимента было сделано заключение о том, что ИНС, по крайней мере, не уступает ЛДА по качеству воспроизведения условной функции частоты, то серия представленных ниже экспериментов позволила показать очевидные преимущества нейросетевого подхода.
Основной проблемой, которую отмечали в своих исследованиях авторы существующей системы, использующей ЛДА, является существенная вариация оценки риска в случае, когда один из показателей принимает сравнительно большую величину, далеко отстоящую от основной массы наблюдений. Эта проблема довольно часто возникает, когда исследуются лица с патологией неатерогенной природы, существенно влияющей на величину того или иного показателя, участвовавшего в оценке риска. Анализ распространенности диагноза «атеросклероз» по величинам используемых показателей, а также приведенные выше результаты статистического моделирования показали, что основной причиной неприемлемых искажений оценки риска является значительное отличие условной функции частоты от той зависимости, которую может воспроизвести ЛДА.
Для того чтобы продемонстрировать, что ИНС в гораздо меньшей степени реагирует на значительные изменения одного показателя, чем ЛДА, был поставлен следующий вычислительный эксперимент.
Доказав, что ИНС не хуже, чем модель Фишера, воспроизводит условную функцию частоты, в исходные данные намеренно вносились искажения в какой-либо один из показателей. Далее проводился анализ изменений реакции ИНС и модели Фишера на эти изменения.
Чтобы избежать необоснованных манипуляций с данными, изменялись только те показатели, величины которых на самом деле могут по той или иной причине выйти за границу нормы. В частности, таким показателем является ХС ЛГШЛ, существенная вариация которого при развитии ряда патологий неатерогенной природы довольно часто упоминается в литературе. Отметим, что роль ХС ЛПНП в развитии атеросклероза изучена довольно хорошо и этот показатель используется практически во всех известных системах доклинической диагностики атеросклероза.
Достаточным основанием для перехода к нейросетевому методу оценки риска является доказательство того, что ИНС гораздо более адекватно, чем модель Фишера, реагирует на изменение этого показателя.
Для начала рассмотрим распределение диагноза «атеросклероз» по величине ХС ЛПНП, представленного на рисунке 35.
Во-первых, следует отметить, что кривая распространенности, полученная методом ЛДА, статистически необоснованно занижает и завышает оценку частоты на граничных значениях ХС ЛПНП.
Во-вторых, эта кривая в значительной степени отличается от эмпирической кривой, полученной методом «к„ ближайших соседей». По крайней мере, для лиц, имеющих величину ХС ЛПНП близкую к 3 ммоль/л, ЛДА необоснованно завышает оценку риска практически в два раза. Например, изменение величины ХС ЛПНП с 2 до 3 ммоль/л исказит оценку частоты заболеваемости с 0.2 до 0.4 для лиц, у которых остальные показатели близки к среднестатистическому уровню.
Рассмотрим теперь искажение оценки риска, если ХС ЛПНП претерпевает значимое изменение до 8 ммоль/л. Результаты этого эксперимента представлены в таблице 11, а гистограмма изменений оценки риска для ЛДА и ИНС — на рисунках 36 и 37
Результаты данного эксперимента показали, что ИНС имеет неоспоримое преимущество в случае, когда один из показателей по какой-либо причине принимает свое экстремальное значение. В частности, изменение у всех примеров величины ХС ЛПНП до 8 ммоль/л вызвало в случае применения ЛДА неприемлемо большое отклонение оценки риска — в среднем, эта оценка увеличилась на величину 0.36; в случае же применения ИНС этот прирост риска составлял в среднем всего 0.0612. Доказать статистическую достоверность этого различия нетрудно, например методом «хи-квадрат», который подтверждает достоверность данного различия с надежностью большей чем 0.99.
Для того, чтобы подтвердить преимущество ИНС и без столь значимого изменения уровня ХС ЛПНП, был проведен эксперимент, аналогичный предыдущему, но с повышением уровня этого показателя только до 4 ммоль/л для тех примеров, у которых этот уровень был ниже. Таким образом было изменено 298 примеров.
Этот эксперимент необходим для того, чтобы показать, что устойчивость оценки риска к значимым изменениям одного показателя вызвана не только удачным выбором метода нормализации исходных данных, но и способностью ИНС более точно воспроизводить условную функцию частоты, чем это делает модель Фишера.
Результаты этого эксперимента представлены в таблице 12, а распределения изменений оценки риска при повышении ХС ЛПНП до указанного уровня — на рисунках 38 и 39. Результаты данного эксперимента свидетельствуют, что реакция ИНС на изменение величины только одного показателя искажается в гораздо меньшей степени, что подтверждает количество примеров, при которых изменение оценки риска изменилось более чем на 0.1. Аналогично предыдущему эксперименту, метод «хи-квадрат» подтверждает статистическую достоверность данного различия с надежностью большей 0.99.
Анализ состояния здоровья работников НИН, находящихся под длительным наблюдением
Эффективность разработанной системы может быть доказана путем анализа динамика распространенности атеросклероза крупных артерий и клинических проявлений атеросклероза у работников НПП в группах с низкой категорией риска. Так, в группу мужчин среднего возраста (на начало исследований) от 40 до 50 лет (средний возраст - 45,5 лет), находившихся под длительным наблюдением (более 10 лет), попало 85 работников. Из этого числа, 49 работников входили в класс низкого риска по SCORE (меньше 5% вероятности фатальных осложнений атеросклероза) и FHS (меньше 10% вероятности развития ИБС), но, при этом, нейросетевой метод оценки риска относил их к классу высокого риска (более 50%). Обозначим эту группу пациентов «группа «В».
В группе «В» на начало исследований была отмечена высокая распространенность доклинического атеросклероза - 31 случай (63%), а у 5 пациентов (10%) уже были диагностированы клинические проявления атеросклероза.
В группу работников «Н», вошли лица, отнесенные к категории низкого риска по всем шкалам (36 мужчин). Атеросклероз крупных сосудов имели 13 пациентов(31%), а клинические проявления были выявлены у 2 пациентов(5,6%). Эти данные свидетельствуют, что нейросетевой метод оценки риска практически вдвое чувствительней к развитию атеросклеротического процесса. Статистическая значимость различий в распространенности атеросклероза крупных сосудов между группами «Н» и «В» подтверждена методом хи-квадрат с уровнем значимости 0,025.
В течение 12 лет в группе «Н» было дополнительно выявлено 9 случаев атеросклероза крупных сосудов (всего 40 - 82%). Так же было диагностировано еще 17 клинические проявления атеросклероза, частота которых выросла с 10% до 45%.
В группе «Н» распространенность атеросклероза крупных сосудов за 12 лет возросла с 36% до 61%,, а клинических проявлений атеросклероза (главным образом ИБС) с 5,6% до 22%, что значительно меньше, чем в группе «В». Достоверность различий в распространенностях атеросклероза крупных сосудов и клинических проявлений атеросклероза также подтверждается методом хи-квадрат с уровнем значимости 0,06 и 0,05, соответственно.
Результаты алогичного исследования лиц молодого возраста (30-40 лет), попадающих в категорию низкого риска по шкалам SCORE и FHS не позволило выявить статистически достоверных различий в развитии атеросклероза и его клинических проявлений между группами низкого и высокого риска, оцененного нейросетевым методом. Однако, распространенность атеросклероза и его клинических проявлений качественно схожа с данными лиц среднего возраста, как это показано в таблице 16.
Так в группе «Н» у лиц молодого возраста распространенность доклинический атеросклероз в этих группах также значимо выросла - с 18% до 58% в группе «Н» и с 60% до 70% в группе «В». Одновременно с этим, доля пациентов с клиническими проявлениями атеросклероза за 12 лет выросла с 0% до 18% , а в группе «В» с 5% до 26%.
Таким образом, среди мужчин молодого и среднего возраста, которые на начало исследований были отнесены шкалами SCORE и FHS к категории низкого риска, разработанный нейросетевой метод оценки риска выявил группу пациентов предрасположенных к раннему развитию атеросклероза и его клинических проявлений. Данные дальнейших наблюдений показали, что через 12 лет в этой группе лиц клинические проявления атеросклероза встречаются в 1,5- 2 раза чаще, чем у лиц, не входивших в категорию высокого риска по всем методам оценки.
Особенно важным результатом является выявление работников молодого и среднего возраста с высокой активностью атеросклеротического процесса, диагностированного при помощи разработанного метода нейросетевой оценки риска. Благодаря этому подходу, при мониторинге здоровья работников НЛП, к настоящему времени было выявлено 92 пациента с высоким риском развития клинических проявлений атеросклероза из 254 лиц, отнесенных общепринятыми методами к разряду низкого и умеренного риска.