Содержание к диссертации
Введение
1. Анализ путей повышения эффективности диагностики хронических диффузных поражений печени 12
1.1. Обзор современного состояния проблемы хронических заболеваний печени 12
1.2. Характеристика информативности методов диагностики хронических диффузных поражений печени 23
1.3. Применение экспертных систем в обеспечении процесса диагностики 35
1.4. Цель и задачи исследования 40
2. Анализ клинических признаков и моделирование процесса управления постановкой диагноза ХДПП 41
2.1. Анализ клинических признаков хронических диффузных поражений печени 41
2.2. Моделирования процесса управления постановкой диагноза заболеваний печени на основе сетей Петри 50
Выводы второй главы 61
3. Оценка эффективности и реализация методов многовариантного моделирования для поддержки приня тия решений дифференциальной диагностики хрони ческих заболеваний печени 62
3.1. Статистическое моделирование диагностики заболеваний печени 62
3.2. Оценка состояния больных хроническими заболеваниями печени на основе «дерева» решений 78
3.3. Разработка модели постановки диагноза хронических поражений печени на базе многослойного персептрона
Выводы третьей главы 106
4. Реализация экспернои системы интеллектуализации процесса диагностики хдпп 107
Заключение 113
Список литературы 115
Приложения 126
- Обзор современного состояния проблемы хронических заболеваний печени
- Характеристика информативности методов диагностики хронических диффузных поражений печени
- Анализ клинических признаков хронических диффузных поражений печени
- Статистическое моделирование диагностики заболеваний печени
Введение к работе
Актуальность темы. Хронические диффузные поражения печени (ХДПП) являются одним из наиболее актуальных разделов внутренней патологии В связи с широким распространением наркомании, алкоголизма и различных форм инфекционного гепатита отмечается повышение удельного веса диффузных заболеваний данной системы среди общей заболеваемости населения во многих странах мира По данным ВОЗ, за последние 20 лет смертность от заболеваний печени возросла в 2 раза ХДПП занимают первое место среди различных причин утраты трудоспособности у больных с заболеваниями желудочно-кишечного тракта
Таким образом, медицинская проблема хронических заболеваний печени обретает медико-социальную значимость, определяемую широкой распространенностью заболеваний данной группы, тяжестью течения, ранней инвалидизацией и высокой летальностью
К числу наиболее распространенных хронических диффузных заболеваний печени относят хронические вирусные гепатиты различной степени активности, стеатоз, стеатогепатит и циррозы печени в стадиях компенсации, субкомпенсации и декомпенсации
Хронические гепатиты включают широкий спектр нозологически самостоятельных диффузных воспалительных заболеваний печени различной этиологии В ряде случаев некоторые заболевания печени на определенном этапе их развития имеют ряд общих клинических и морфологических признаков, свойственных гепатитам, что требует проведения дифференциальной диагностики между ними
Ранняя диагностика позволяет своевременно начать лечение и замедлить прогрессирование поражения печени Большое число параметров, по которым производится оценка состояния больного, требует учета всех факторов и обоснованного подхода к диагностике, что представляет сложную задачу для врача - клинициста При этом действия врача основываются на априорной, вероятностной оценке симптомов патологий, с одной стороны, и детерминированном подходе к постановке диагноза, с другой Скудность клинических проявлений, их схожесть с различными другими патологическими состояниями значительно затрудняют диагно-
стический процесс Данное обстоятельство делает крайне сложным прогнозирование исхода заболевания печени без привлечения математических методов
В связи с этим неоспоримо большое значение приобретает всестороннее усовершенствование методов поддержки принятия решений постановки диагноза заболеваний печени
Использование автоматизированной системы для диагностики ХДПП на основе алгоритмов, использующих формальные методы математического анализа медицинских данных, позволит в значительной степени освободить врача от рутинной деятельности, обеспечивая возможность более глубокого анализа клинической информации
Таким образом, актуальность темы заключается в необходимости разработки методов интеллектуальной поддержки процесса диагностики хронических диффузных заболеваний печени с применением методов искусственного интеллекта и математического моделирования, что способствует повышению эффективности принимаемых решений
Работа выполнена в рамках НИР ГБ 2004 27 «Управление процессами диагностики и лечения на основе информационно-интеллектуальных технологий» в соответствии с основными научными направлениями Воронежского государственного технического университета «Биокибернетика, компьютеризация в медицине» и «Проблемно-ориентированные системы управления»
Цель и задачи исследования. Целью диссертационной работы является разработка моделей и алгоритмов, повышающих эффективность процесса принятия решений при диагностике хроничесьих диффузных поражений печени на основе многовариантного моделирования с последующим внедрением результатов исследования в клиническую практику
Для достижения поставленной цели необходимо решить следующие задачи
провести статистический анализ и сформировать исходную матрицу классификационных признаков хронических заболеваний печени, представленную клиническими симптомами, результатами лабораторных и УЗИ - исследований,
разработать математическую модель процесса принятия решений
при планировании диагностического процесса заболеваний печени на основе сетей Петри,
сформировать классификационные модели на основе экспертного оценивания и статистических методов распознавания образов для оценки состояния больных с хроническими заболеваниями печени,
разработать алгоритм отнесения состояния пациента к одному из классов заболеваний печени на основе метода «деревьев решений»,
реализовать систему поддержки принятий решений постановки диагноза хронических заболеваний печени на основе нейросетевого моделирования,
создать и внедрить автоматизированную экспертную систему интеллектуализации процесса диагностики диффузных поражений печени в клиническую практику
Методы исследования Для достижения поставленных задач в работе были использованы методы системного анализа, распознавания образов, экспертного оценивания, прикладной статистики, имитационного моделирования, «деревьев решений», методы искусственного интеллекта и нейросетевого моделирования
Научная новизна В работе получены следующие основные результаты, характеризующиеся научной новизной
методика интеллектуальной поддержки принятия решения при диагностике хронических гепатитов, жировой дегенерации и циррозов печени, основанная на формализованном описании данных клинических, лабораторных и УЗИ - исследований,
функциональная модель системы диагностики заболеваний печени на основе сети Петри отличающаяся способностью формировать план ди-аіностичесміх мероприятий путем имитации для повышения эффективности принимаемых решений,
методика оценки состояния больных с хроническими диффузными поражениями печени на основе статистических критериев, позволяющая учитывать индивидуальные особенности больных,
алгоритм оценки состояния пациентов с заболеваниями печени на основе метода «деревьев решений», позволяющий определить значимость входных переменных и снизить размерность признакового пространства,
">
нейросетевые модели постановки диагноза заболеваний печени, обеспечивающие информационную поддержку принимаемых лечащим врачом решений с проведением количественной оценки влияния различных диагностических показателей на выходной сигнал сети,
автоматизированная система интеллектуальной поддержки диагностики хронических диффузных поражений печени, реализующая интеграцию методов, моделей и алгоритмов рационального принятия решений
Практическая значимость и результаты внедрения. В результате проведенного исследования разработана и научно обоснована методика дифференциальной диагностики хронических диффузных поражений печени, проведена оценка основных клинических и инструментальных показателей, позволяющая повысить эффективность диагностики хронических гепатитов минимальной, умеренной и высокой степени активности, стеа-тоза, стеатогепатита и цирроза печени в стадиях компенсации, субкомпенсации и декомпенсации
Результаты исследований в виде информационного и программного обеспечения автоматизированной системы сбора, обработки и анализа медицинской информации апробированы в гастроэнтерологическом отделении городской клинической больницы скорой медицинской помощи № 10
Материалы диссертации внедрены в учебный процесс кафедры «Системный анализ и управление в медицинских системах» Воронежского государственного технического университета
Апробация работы. Основные положения и научные результаты диссертационного исследования докладывались и обсуждались на следующих конференциях, совещаниях и семинарах Всероссийской конференции "Интеллектуализация управления в социальных и экономических системах" (Воронеж 2006, 2007), Всероссийской конференции «Интеллектуальные информационные системы» (Воронеж, 2006, 2007), научно-методических семинарах кафедры системного анализа и управления в медицинских системах Воронежского государственного технического университета (Воронеж, 2004-2007)
Публикации. По теме диссертации опубликовано 9 научных работ, в том числе 1 - в издании, рекомендованном ВАК РФ
В работах, опубликованных в соавторстве и приведенных в конце
автореферата, соискателем проведен анализ методов-диагностики хронических заболеваний печени [2], проанализированы и сформированы клинические, лабораторные и УЗИ - признаки хронических гепатитов минимальной, умеренной и высокой степени активности, стеатоза, стеатогепа-тита, а также циррозов печени в стадиях компенсации, субкомпенсации и декомпенсации [5], приведен алгоритм имитационного моделирования процесса диагностики заболеваний печени на основе сетей Петри [4], разработаны прогностические модели оценки состояния больных ХДПП с применением методов многомерного статистического анализа данных и «деревьев решений» [1, 6, 9], представлена модель нейронной сети для диагностики заболеваний печени [8], описана реализация алгоритма формирования информационной системы поддержки принятия решений [3,7]
Структура и объем работы Диссертация состоит из введения, четырех глав, заключения, списка литературы из 139 наименований, приложения Основная часть работы изложена на 125 страницах, содержит 29 рисунков, 8 таблиц
Обзор современного состояния проблемы хронических заболеваний печени
Хронические заболевания печени остаются актуальной проблемой современной гастроэнтерологии. По данным ВОЗ, за последние 20 лет смертность от заболеваний печени возросла в 2 раза. Сегодня на земном шаре 350 млн больных вирусным гепатитом и до 500 млн его вирусоносителей. По прогнозам, в следующем десятилетии в результате распространения хронического гепатита С на 60 % увеличится количество больных циррозом печени, на 68 % — гепатоцеллюлярной карциномой [119].
Хронические гепатиты - полиэтиологические хронические (длительностью более 6 мес) поражения печени воспалительно-дистрофического характера с умеренно выраженным фиброзом и преимущественно сохраненной дольковой структурой печени. Среди хронических заболеваний печени хронический гепатит является наиболее частым. Это хроническое заболевание печени связано с тремя типами гепатотропных вирусов: хронический гепатит В, хронический гепатит D, хронический гепатит С [7].
Этиология. Наибольшее значение имеет вирусное, токсическое и ток-сикоаллергическое поражение печени при вирусных гепатитах, промышленных, бытовых, лекарственных хронических интоксикациях (алкоголь, хлороформ, и др.), реже - вирусы инфекционного мононуклеоза, герпеса, цитоме-галий. Хронический гепатит часто наблюдается при затяжном септическом эндокардите, малярии. Хронический холестатический гепатит может быть обусловлен длительным подпеченочным холестазом в сочетании с обычно присоединяющимся воспалительным процессом в желчных протоках и ходах. Он также может быть вызван некоторыми медикаментами (производные фенотиазина, метилтестостерон и его аналоги и т. д.) или возникать после перенесенного вирусного гепатита. Наконец, во многих случаях этиология хронического гепатита остается невыясненной.
Патогенез: непосредственное действие этиологического фактора (вируса, гепатотоксического вещества) на печеночную паренхиму, вызывающее дистрофию и некробиоз гепатоцитов и реактивную пролиферацию мезенхимы. Одним из патогенетических механизмов перехода острого вирусного и токсического гепатита в хронический и дальнейшего прогрессирования последнего являются специфические иммунологические нарушения.
Клиническая картина. Характерны увеличение печени, боль или чувство тяжести, полноты в правом подреберье, диспепсические явления; реже выявляются желтуха, кожный зуд, субфебрилитет. Увеличение печени встречается приблизительно у 95 % больных, однако, в большинстве случаев оно умеренное. Увеличение селезенки отсутствует или она увеличена незначительно. Боль в области печени тупого характера, постоянная. Часты такие симптомы, как снижение аппетита, отрыжка, тошнота, плохая переносимость жиров и алкоголя, метеоризм, неустойчивый стул, общая слабость, снижение трудоспособности, гипергидроз. У трети больных выявляется нерезко выраженная субиктеричность склер и неба или умеренная желтуха.
Гистологическая оценка. Биопсия печени остается важным методом диагностики хронического гепатита и контроля за лечением больных. Данные биопсии позволяют не только установить точный диагноз, но и определить степень активности и стадию развития заболевания.
Степень активности хронического гепатита определяется тяжестью и выраженностью некрозов и воспалительного процесса в печени. Известные гистологические формы, включающие хронический персистирующий гепатит (ХПГ), хронический активный гепатит (ХАГ) и хронический лобулярный гепатит (ХЛГ), по существу представляют собой систему оценки степени активности, а не стадии процесса. Эти формы описывают «идеализированные» степени активности по выраженности гистологических изменений. Важно отметить, что ХПГ или ХЛГ могут не прогрессировать в ХАГ или что ХАГ может не переходить в цирроз печени. Цирроз печени также может развиваться без предшествующих ХЛГ или ХАГ, а ХПГ и ХАГ могут переходить друг в друга, очевидно, в зависимости от взаимодействия вируса и иммунной системы организма больного.
Использование полуколичественного (рангового) определения индекса активности является важным условием контроля за клиническими исследованиями и дополняет полноценные гистологические описания биоптатов. Наиболее широко используют гистологический индекс активности (ГИА), известный как система Knodell. С помощью гистологического индекса активности можно приближенно сопоставлять степень активности с диагнозом. Однако этот индекс не заменяет полноценное описание результатов биопсии. Преимущества представленной системы оценки степени активности в широком диапазоне возможных цифровых значений активности, а значит, и тонкой ее дифференцировке. Нуждаются в усовершенствовании описательные характеристики, эквивалентные цифровым наборам [13, 15].
Стадии хронического гепатита отражают динамику его развития. Определение их важно для выбора тактики лечения и уточнения прогноза заболевания. УЗИ-картина. Частота правильного эхографического диагноза при ХГ составляет 52-63 %.
При острых и хронических гепатитах эхографическая картина весьма неспецифична. Обычно определяется увеличение печени за счет одной или обеих долей, закругление ее краев. Эхоструктура часто нормальна, слабоэхо-генна. Лишь при длительном течении заболевания эхоструктура печени становится «пестрой» и наблюдается чередование участков слабой и высокой эхогенности. В некоторых случаях, в частности, при развитии портальной гипертензии, можно обнаружить увеличение селезенки и расширение селезеночной и портальной вены.
Характеристика информативности методов диагностики хронических диффузных поражений печени
Быстрое увеличение числа методов исследования печени наряду с развитием сети специализированных гастроэнтерологических отделений выдвигает настоятельное требование системного подхода к диагностике болезней печени [61].
Большое значение для распознавания патологии печени имеет анамнез. Наиболее характерны жалобы на чувство давления и боль в области правого подреберья, горечь во рту, тошноту, снижение аппетита, вздутие живота, а также на желтуху, зуд кожи, изменение окраски мочи и кала. Возможны понижение работоспособности, похудание, слабость, нарушения менструального цикла и др. При расспросе следует учитывать возможность злоупотребления алкоголем, интоксикации другими веществами (например, дихлорэтаном) или приема гепатотоксических лекарственных препаратов (например, аминазина, противотуберкулезных средств). Необходимо установить наличие в анамнезе инфекционых болезней, и прежде всего вирусного гепатита.
Пальпация печени является важным методом клинического обследования. Печень обычно пальпируется сразу под реберной дугой по правой сред-неключичной линии. Поверхность печени гладкая, нижний (передний) край слегка заострен, ровный, безболезненный. Низкое расположение нижнего края печени указывает на ее увеличение или опущение, что можно дифференцировать с помощью перкуторного определения верхней границы Бугристая поверхность печени определяется при крупноузловым циррозе. Консистенция печени в норме мягкая; при остром гепатите и венозном застое — более плотная, эластичная; при циррозе печени — плотная, неэластичная. Умеренная болезненность печени при пальпации наблюдается при гепатите, сильная болезненность — при гнойных процессах. Важное значение имеет определение размеров селезенки, т.к. при некоторых заболеваниях печени она может быть увеличена [61].
Биохимические методы исследования часто являются основными в диагностике заболеваний печени. Для изучения пигментного обмена определяют содержание в сыворотке крови билирубина и его фракций. Из энзимоло-гических тестов используют определение в сыворотке крови так называемых индикаторных ферментов (аланинаминотрансферазы и др.), повышение активности которых свидетельствует о повреждении гепатоцитов, экскреторных ферментов (щелочной фосфатазы и др.), активность которых повышается при холестазе, а также синтезируемых в печени секреторных ферментов (холинэстеразы и др.), снижение активности которых указывает на нарушение функции печени. Широкое применение находят коагуляционные пробы (прежде всего тимоловая и сулемовая).
Для оценки метаболической функции печени используют определение содержания в сыворотке крови белковых фракций, факторов свертывания крови, аммиака, мочевины, липидов, железа и др.
Иммунологические методы исследования применяют для специфической диагностики вирусных гепатитов (определение антигенов вируса и антител к ним), выявления аутоиммунных поражений печени, а также для прогнозирования течения и исходов ряда заболеваний [61].
Постановка диагноза ХДПП невозможна без привлечения инструментальных методик.
Радионуклидные методы исследования. Успехи в создании высокочувствительной современной аппаратуры, а также промышленное получение радионуклидов и их соединений приблизили к практике здравоохранения замечательные возможности радионуклидных методов исследования. Они позволяют оценить поглотительно-выделительную функцию и кровообращение печени, проходимость желчных путей, состояние ретикулогистиоцитарной системы печени, селезенки, костного мозга [80].
Техника радионуклидного исследования печени относительно проста, его можно выполнить в обычной радиоизотопной лаборатории. Огромное преимущество метода - безопасность для больного вследствие малых коли
честв используемых препаратов в индикаторных дозах нуклидов, которые не дают побочных эффектов. Кроме того, исследование структуры и функции печени не нарушает целостности органа.
Для определения поглотительно-выделительной функции печени чаще всего используют бенгальскую розовую, меченую I131 (131IBR). ш1-бенгальская розовая имеет выраженную гепатотропность, лишь 5% препарата выделяется через почки. I32IBR вводят исследуемому из расчета 0,74 104 Бк/кг (0,2 мкКи/кг) внутривенно в изотоническом растворе хлорида натрия.
Применение ,31IBR имеет наибольшее значение для оценки поглотительно-выделительной функции печени при хронических диффузных заболеваниях. При патологических состояниях печени поглощение, накопление и выделение краски печенью замедляются.
Для оценки кровообращения печени используют коллоидное золото ( Аи), оно поглощается преимущественно ретикулоэндотелиальными клет-ками печени. При внутривенном введении коллоидного золота ( Аи) скорость и характер поглощения и выделения радионуклида зависят от состояния кровообращения в печени и преимущественно в системе воротной вены. Скорость поглощения и выделения радиоактивного препарата печенью прямо пропорциональна количеству функционирующих кровеносных сосудов и величине кровотока в печени.
У здоровых мужчин кровоток в печени в зависимости от массы тела и общего объема крови составляет от 1,5 до 1,8 л/мин; у больных циррозом печени он снижается в 2—5 раз.
Анализ клинических признаков хронических диффузных поражений печени
В результате анализа заболеваний, проведенного в пункте 1.1, была предложена обобщенная классификационная схема хронических диффузных поражений печени, позволяющая выделить основные заболевания в отдельную группу (рис. 2.1).
Хронические гепатиты рассматриваются с учетом степени активности заболевания, жировая дегенерация печени рассмотрена с учетом степени выраженности изменений: стеатоз и стеатогепатит, цирроз печени - по стадиям заболевания согласно классификации Чайльд - Пью (1997): стадия компенсации (А), субкомпенсации (В), и стадия декомпенсации (С).
В результате обследования 256 пациентов в возрасте от 19 до 79 лет ГУЗ «Воронежская областная клиническая больница №1» за 2001 - 2004 гг., у 98 из них был выявлен хронический гепатит различной степени активности (минимальной степени активности - у 40 человек, умеренной - у 30, высокой степени активности - у 28 человек). Диагноз «стеатоз» и «стеатогепатит» был поставлен группам больных количеством по 30 человек. Цирроз печени в стадии компенсации был отмечен у 32 человек, в стадии субкомпенсации у 35, а в стадии декомпенсации у 31 человека [86].
Обследование производилось с помощью общепринятых клинико-инструментальных методик для диагностики хронических диффузных поражений печени (ХДПП).
На рисунках 2.2 а и б представлены гистограммы распределения частоты встречаемости ХДПП в различных возрастных группах среди мужчин и женщин соответственно.
Анализируя графики, можно сделать следующие выводы - частота встречаемости заболеваний исследуемых групп среди мужчин выше, чем у женщин в среднем на 5 - 10 %. Наибольший процент среди общего числа мужчин с поражениями печени приходится на циррозы, в то время, как у женщин лидирующее положение занимают гепатиты и жировая дегенерация печени.
Также можно сделать вывод о том, что пик выявления заболеваний приходится на трудоспособный возраст. К примеру, циррозы печени в стадии компенсации диагностируются у пациентов-мужчин первой возрастной группы (до 31 года) в 8 % случаев, в стадиях субкомпенсации и декомпенсации - в 5 % случаев. Это может свидетельствовать об отсутствии качественной диагностики ХДПП на начальных стадиях заболеваний, в результате чего происходит переход в более тяжелые формы, хронизация процесса и выявление уже необратимого заболевания.
В связи с вышесказанным, огромное значение приобретает ранняя диагностика заболеваний печени и своевременное лечение, что значительно ос ложняется слабовыраженной клинической картиной заболеваний данной группы.
Как видно из представленной гистограммы, ярко выраженным клиническим признаком хронических гепатитов и жировой дегенерации печени является боль в правом подреберье. Злоупотребление алкоголем может явиться причиной (отягчающим фактором) любого из рассматриваемых заболеваний. Хронический гепатит минимальной степени активности не имеет ярко выраженной клинической картины. Для хронического гепатита умеренной степени активности может быть выражена болезненность печени, возможно наличие иктеричности кожи и склер. Для хронического гепатита высокой степени активности характерна более выраженная клиническая картина - возможны потери в весе, боли в суставах, болезненность печени, спленомегалия. Икте-ричность кожи и склер наблюдается в 80 % случаев.
Клиническая симптоматика циррозов печени (рис. 2.4) более определенна. Для циррозов печени любой степени тяжести наиболее характерно наличие болей в правом подреберье, носовые кровотечения, выявляемые при опросе; иктеричность кожи и склер, «сосудистые звездочки» на теле, отеки нижних конечностей, спленомегалия, бугристая поверхность печени, асцит, выявляемые при осмотре. При циррозе печени «А» возможны жалобы пациентов на потери в весе, повышение температуры тела, носовые кровотечения. При осмотре выявляются также расширение подкожных вен передней брюшной стенки («голова медузы»), варикоз вен пищевода 1 степени. В 11,7 % случаев возможны проявления латентной стадии печеночной энцефалопатии. При циррозе печени «В» потери в весе, носовые кровотечения, «сосудистые звездочки», расширение подкожных вен передней брюшной стенки выявляются чаще. В 50 % случаев присутствуют отеки, печеночная энцефалопатия 1 степени встречается в 20 % случаев, спленомегалия - в 52 %.
Статистическое моделирование диагностики заболеваний печени
Исходя из характера медико-биологических данных, наиболее целесообразно проводить автоматическую классификацию в пространстве первичных признаков. Это объясняется тем, что регистрируемая в ходе диагностики информация является избыточной, так как разные показатели отражают одни и те же механизмы функционирования оцениваемых систем организма [108].
Медико-биологические данные пациентов чаще всего связаны между собой, причем эта связь более или менее тесная. В большинстве случаев она проявляется в виде тенденции, т.е. равномерному увеличению одного из параметров в среднем будет сопутствовать пропорциональное увеличение или уменьшение другого. Необходимо количественно оценить меру стохастической связи между признаками, т.е. уровень их взаимной корреляции.
Корреляционным анализом называется совокупность методов обнаружения корреляционной зависимости между случайными величинами или признаками [24,25].
Необходимо найти такое линейное преобразование исходной матрицы X, которое позволило бы получить сжатое (редуцированное) представление входных данных в виде матрицы F с меньшим числом переменных р (т р) без существенной потери содержательной информации о медицинских объектах.
Под факторным анализом понимается совокупность статистических моделей, описывающих и объясняющих наблюдаемые данные с помощью небольшого числа скрытых (латентных) факторов, которые могут быть сконструированы с помощью определенных математических методов.
Исходя из характера медико-биологических данных, наиболее целесообразно проводить автоматическую классификацию в пространстве первичных признаков. Это объясняется тем, что регистрируемая в ходе диагностики информация является избыточной, так как разные показатели отражают одни и те же механизмы функционирования оцениваемых систем организма [108].
Медико-биологические данные пациентов чаще всего связаны между собой, причем эта связь более или менее тесная. В большинстве случаев она проявляется в виде тенденции, т.е. равномерному увеличению одного из параметров в среднем будет сопутствовать пропорциональное увеличение или уменьшение другого. Необходимо количественно оценить меру стохастической связи между признаками, т.е. уровень их взаимной корреляции.
Корреляционным анализом называется совокупность методов обнаружения корреляционной зависимости между случайными величинами или признаками [24,25].
Необходимо найти такое линейное преобразование исходной матрицы X, которое позволило бы получить сжатое (редуцированное) представление входных данных в виде матрицы F с меньшим числом переменных р (т р) без существенной потери содержательной информации о медицинских объектах.
Под факторным анализом понимается совокупность статистических моделей, описывающих и объясняющих наблюдаемые данные с помощью небольшого числа скрытых (латентных) факторов, которые могут быть сконструированы с помощью определенных математических методов. Под моделью факторного анализа понимают представление исходных переменных в виде линейной комбинации факторов F
В этой модели латентные переменныеF , к- \,2,...,р, называются общими факторами, а переменные Ц ,j = 1,2,..., т, - специфическими факторами (англ. - unique factor). Значения ад называются факторными нагрузками.
Основное требование к исходным данным для факторного анализа -это то, что они должны подчиняться допущению о многомерном нормальном распределении в совокупности.
Если все признаки X, стандартизованы, а факторы Fh F2, ..., Fp независимы и не связаны со специфическими факторами Ц, то факторные нагрузки cijk совпадают с коэффициентами корреляции между общими факторами и переменными Xj. Общая дисперсия признака Xj раскладывается при этом на сумму квадратов факторных нагрузок Н), которая называется общностью, и дисперсию специфического фактора Si, или специфичность:
Другими словами, общность Н] представляет собой часть дисперсии переменных, объясненную факторами, а специфичность S2 - часть дисперсии, обусловленную случайными ошибками или переменными, неучтенными в модели. В соответствии с постановкой задачи, необходимо искать такие факторы, при которых суммарная общность максимальна, а специфичность -минимальна.
Основным объектом преобразований в факторном анализе является корреляционная матрица из коэффициентов корреляции (или дисперсионно-ковариационная матрица), полученная обычным путем обработки массива данных X. Выделение общих факторов и сжатие информации в ходе факторного анализа сводится к воспроизведению с той или иной степенью точности исходной корреляционной матрицы, т.е. предполагается, что редуцированная корреляционная матрица получена с использованием тех же объектов, но описанных меньшим числом переменных. Таким образом, под сжатием информации в факторном анализе понимается уменьшение размерности корреляционной матрицы, а не самих данных.
Поскольку коэффициенты, составляющие корреляционную матрицу, могут вычисляться разным способом, различают следующие техники факторного анализа: R - техника, когда коэффициенты корреляции вычисляются между переменными и исходная матрица X сжимается по столбцам, т.е. число признаков уменьшается с т дор; Q - техника, когда изучается корреляция между объектами (точнее, их состояниями, описываемыми векторами параметров) и их количество уменьшается с и дор; Р - техника, предполагающая факторный анализ результатов экспериментальных исследований, выполненных на одном и том же объекте в различные промежутки времени.
Одним из наиболее распространенных приемов поиска факторов является метод главных компонент. Его основное различие от факторного анализа заключается в том, что главные компоненты F связаны с наблюдаемыми переменными Xj линейными функциями преобразования:
Основная идея метода главных компонент основана на следующем предположении: чем выше дисперсия вдоль какой-нибудь оси, тем больше информации содержат значения проекций на эту ось. Такая ось называется первой главной компонентой (фактором).
Поиск всей системы взаимно перпендикулярных осей по методу главных компонент сводится к последовательной процедуре: т.е. вначале ищется первый фактор, который объясняет наибольшую часть дисперсии, затем независимый от него второй фактор, объясняющий наибольшую часть оставшейся дисперсии, и т.д.