Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита) Лебедев Дмитрий Сергеевич

Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита)
<
Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита) Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита) Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита) Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита) Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита)
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Лебедев Дмитрий Сергеевич. Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита) : диссертация ... кандидата медицинских наук : 14.00.33 / Лебедев Дмитрий Сергеевич; [Место защиты: Государственный институт усовершенствования врачей].- Москва, 2005.- 80 с.: ил.

Содержание к диссертации

Введение

Глава I. Эпидемиология, этиопатогенез, классификация, диагностика и прогнозирование острого панкреатита (обзор литературы)

Эпидемиология острого панкреатита 8

Этиология острого панкреатита 10

Классификация острого панкреатита 12

Диагностика острого панкреатита 17

Прогнозирование в медицине 23

Модели прогнозирования тяжести острого панкреатита и его исходов 24

Выводы к главе I. 34

Глава II. Клиническая характеристика больных и методы исследования

1. Характеристика больных 36

2. Нейронные сети 41

3. Методы уменьшения размерности пространства исходных данных 45

Выводы к главе II 50

Глава III. Прогнозирование характера течения острого панкреатита методом нейронных сетей (результаты собственных исследований) 51

Выводы к главе III 79

Общие выводы 81

Практические рекомендации 82

Список литературы 84

Классификация острого панкреатита

В 1992 г: на Международном: Симпозиуме в Атланте с: участием 40 экспертов в; области панкреатологии из разных стран мира была разработана классификация ОП, в основу которой легли, современные методы визуализации и прогнозирования и; даны точные определения понятий [110]. В основу настоящей работы, была положена классификация, принятая на Международном симпозиуме в Атланте в 1992 г. Согласно определению;, сформулированному на .Международном Симпозиуме в Атланте, под; ОП понимают: острый воспалительный процесс в ПЖ с вовлечением окружающих тканей; и удаленных органных систем различной1 степени выраженности. Клинические признаки панкреатита должны классифицироваться, как острый панкреатит до того, как будут выявлены очевидные признаки хронического панкреатита.

Тяжелым ОП называют панкреатит, которому сопутствуют органная недостаточность и/или местные осложнения, такие как некроз, абсцесс или псевдокисты. Клинически: тяжелый ОП характеризуется болезненностью при пальпации живота, положительным симптомом Щеткина-Блюмберга, вздутием живота и ослаблением или отсутствием перистальтических кишечных шумов. В эпигастральной области может пальпироваться опухолевидное образование. Реже удается выявить кровоподтеки по боковой поверхности живота (симптом Грея-Тюрнера) или кровоподтеки в параумбиликальной области (симптом Куллена). Тяжелый панкреатит характеризуется также наличием 3 и более баллов по системе Ranson [186] или восьми и более баллов по системе APACHE II [155]. Органная недостаточность определяется как шок (систолическое артериальное давление менее 90 мм.рт.ст.), острая дыхательная недостаточность (напряжение кислорода в артериальной крови 60 и менее мм.рт.ст.), острая почечная недостаточность (уровень креатинина крови более 177 мкмоль/л после проведения регидратации) или гастроинтестинальное кровотечение (более 500 мл/24 часа). При тяжелом ОП также могут наблюдаться такие системные осложнения, как диссеминированное внутрисосудистое свертывание (тромбоциты. 100000/мм3 или менее, фибриногенемия менее 1 г/л, продукты- деградации фибрина более 80 мкг/мл) или тяжелые метаболические расстройства (кальциемия 1,87 ммоль/л и менее).

Наиболее часто тяжелый панкреатит клинически протекает в форме панкреонекроза. Менее часто наблюдается трансформация отечного панкреатита в деструктивный. Тяжелый ОП обычно развивается вскоре после появления первых симптомов заболевания [203,204]. Оценку тяжести ОП необходимо осуществлять до начала любого терапевтического вмешательства, что в дальнейшем позволит отслеживать динамику изменений характера течения заболевания на фоне лечения.

Нетяжелым ОП называют панкреатит, которому сопутствуют минимальные органные дисфункции, выздоровление без осложнений и отсутствие признаков, характерных для тяжелого течения ОП. У больных с нетяжелым характером течения ОП на фоне инфузионной терапии наблюдается быстрая нормализация физиологических и лабораторных показателей. Отсутствие клинического улучшения в течение 48-72 часов после начала лечения является показанием для назначения дополнительных методов обследования с целью выявления осложнений. Компьютерная томография с контрастным усилением ткани ПЖ обычно позволяет исключить некротические изменения. При макроскопическом и гистологическом исследовании ткани ПЖ обычно выявляется интерстициальный отек, могут также быть обнаружены некрозы парапанкреатической жировой клетчатки. Нетяжелая форма ОП встречается в 75% случаев ОП [173].

Острые коллекторы жидкости развиваются на ранних стадиях ОП, локализуются в ПЖ или в окружающих тканях и не имеют стенки, представленной грануляционной или соединительной тканью. Острые коллекторы жидкости наиболее характерны для тяжелого панкреатита и наблюдаются в 30-50% случаев тяжелого ОП [108,196]. Более чем в половине случаев острые коллекторы жидкости подвергаются спонтанной регрессии [108,157,177,196], диагностируются обычно с помощью УЗИ или КТ. Основное отличие от псевдокист и абсцесса ПЖ — отсутствие соединительно-тканной стенки. Со временем острые коллекторы жидкости могут трансформироваться в абсцессы или псевдокисты.

Панкреонекроз - это диффузные или локальные нежизнеспособные участки паренхимы ПЖ, обычно сочетающиеся с наличием некроза парапанкреатической жировой клетчатки. Обычно участки панкреонекроза локализуются по периферии ПЖ [154,159,163]. Чаще развитие панкреонекроза сочетается с ухудшением клинического течения заболевания, но с целью диагностики необходимо использовать объективные методы его верификации. Динамическое исследование ПЖ методом КТ с контрастным усилением в настоящее время является «золотым стандартом» клинической диагностики панкреонекроза [120,203]. Локальные или диффузные, с четко отграниченными краями, неконтрастируемые зоны паренхимы ПЖ более 3 см или более 30% объема ПЖ — необходимые критерии для КТ диагностики панкреонекроза [211]. Точность динамической КТ-диагностики панкреонекроза - более 90% [120,211,170].

Осуществлялись многократные попытки найти лабораторные маркеры панкреонекроза. Среди них С-реактивный протеин [116], эластаза полиморфонуклеарных нейтрофилов [205], белковый активатор трипсиногена [211,213] и другие. Эти лабораторные показатели не получили достаточного клинического подтверждения как высокочувствительные маркеры панкреонекроза.

Важную проблему представляет дифференциальная диагностика между инфицированным и стерильным панкреонекрозом, так как инфицирование некротизированных участков ПЖ сопровождается значительным увеличением риска летального исхода [83,85,98,118,182,187]. Стерильный панкреонекроз может лечиться консервативно [182], тогда как инфицированный панкреонекроз при консервативной тактике ведения без дренирующих хирургических вмешательств имеет тенденцию к фатальному исходу [136,149].

Псевдокисты — это скопление панкреатического секрета, окруженное стенкой, представленной соединительной или грануляционной тканью, которые развиваются как последствие ОП, травмы ПЖ или хронического панкреатита. Псевдокисты имеют четко отграниченную стенку и хорошо визуализируются при КТ или УЗИ диагностике. Псевдокисты формируются в сроки более 4 недель от начала заболевания [24,108,159].

Абсцесс ПЖ — это отграниченное внутрибрюшное скопление гноя, обычно располагающееся вблизи ПЖ, развивается вследствие ОП или травмы ПЖ, может содержать небольшое количество некротизированных тканей ПЖ. Клиническая картина абсцесса ПЖ неспецифична и обычно соответствует клинической картине инфекционного процесса. Абсцессы ПЖ обычно развиваются на фоне тяжелого ОП в сроки более 4 недель от начала заболевания [211]. Наличие гноя и культуры бактерий или грибов и, возможно, небольшого количества некротизированной ткани ПЖ позволяет дифференцировать абсцесс ПЖ и парапанкреатических тканей от инфицированного некроза ПЖ. Абсцесс ПЖ и инфицированный панкреонекроз имеют различные клинические проявления. Дифференциальная диагностика важна вследствие двух соображений: 1) риск летального исхода при инфицированном некрозе ПЖ в два раза выше, чем при абсцессах ПЖ [62,210,211], 2) лечебная тактика различается [210].

Модели прогнозирования тяжести острого панкреатита и его исходов

В настоящее время известно большое количество прогностических моделей и отдельных маркеров тяжести ОП. Среди них:

1) модель Ranson,(1974),

2) модель Glazgow (Imrie),

3) модель APACHE II,

4) модель Balthazar (985, 1990),

5) модель Bernard Organ Failure Scoring System (BOFSS) — 1995,

6) модель Филлина-Костюченко,

7) прогностические критерии Bank,

8) прогностические критерии Agarwal и Pitchumoni,

9) прогностические критерии Hong Kong,

10) клиническая оценка экспертами,

11) перитонеальный диализ как фактор прогноза,

12) некоторые отдельные лабораторные маркеры и др.

На практике чаще используются модели Ranson, Glazgow и APACHE II. По данным литературы нет единого мнения по поводу оценки тяжести ОП с помощью различных моделей. Такие оценки колеблются в значительных пределах и иногда не совсем ясно, о какой форме панкреатита идет речь: тяжелая форма ОП - Ranson ( 3 или 5 баллов), APACHE II ( 6 или 8 баллов), КТ (с некрозом-15% или 30% объема ІГЖ). Проведено большое количество исследований с целью сравнения эффективности различных мультипараметрических моделей для определения тяжести заболевания и прогнозирования исхода ОП.

Оказалось, что идеальных моделей со 100% специфичностью и чувствительностью на сегодняшний день нет. В сравнительном исследовании, проведенном на 82 больных в Барселоне [211] были получены следующие результаты, которые отражены в таблице 3. Данные, приведенные в таблице 3 и на рис. 1 свидетельствуют о том, что,чувствительность и специфичность известных мультипараметрических моделей не высокие, в основном- не превосходят таковые для отдельных биохимических маркеров тяжести ОП и возрастают при учете значения С-реактивного белка. По данным, представленным в таблице 3 построена гистограмма (рис.1).

Как уже отмечалось наиболее распространенными моделями, применяемыми для прогнозирования исхода ОП, являются модели Ranson, Imrie и APACHE II. В нашей стране наряду с перечисленными применяется модель Филина-Костюченко. На Международном Симпозиуме в Атланте с целью определения тяжести заболевания рекомендованы модели Ranson и APACHE II.

Одной из первых моделей для идентификации тяжести острого алкогольного панкреатита является модель, разработанная John Ranson в 1974 году, которая широко применяется в настоящее время во всем мире. В модели используется 11 критериев [109,184,185,186]. Если у больного есть от 0 до 2 критериев — панкреатит не тяжелый и почти все больные выживают. При 3-5 положительных критериях летальность составляет 10-20%. При наличии более 6 критериев - прогноз тяжелый (летальность свыше 50%). Больные, у которых обнаруживается 3 и более признаков, имеют высокую частоту системных осложнений и вероятность развития панкреонекроза. Когда имеется более 6 положительных критериев, заболевание обычно осложняется присоединением инфекции. Критерии модели Ranson представлены в таблице 4.

Является модификацией модели Ranson [213]. Она была разработана для больных с желче-каменным панкреатитом, но такого широкого распространения, как модель Ranson, не получила. В модели анализируются 9 критериев тяжести в первые 48 часов от поступления. На тяжелую форму заболевания указывает наличие трех и более критериев из девяти.

Эта модель оценивает тяжесть заболевания в баллах на основании возраста, наличии хронических заболеваний и 12 физиологических показателей [155]. Модель используется для оценки тяжести больных при различных клинических ситуациях в отделениях интенсивной терапии, включая, в последние годы ОП. Оценка с помощью модели APACHE II при госпитализации, в первые 48 часов и при оперативном лечении помогает идентифицировать пациентов с высоким риском. Больные, имеющие 9 баллов или менее в первые 48 часов от госпитализации, выживают. При 13 и более баллах вероятен фатальный исход заболевания. Рекомендуется ежедневное использование модели. Toh SKS, Walters J et al., 1996 [211] ввели в модель APACHE II индекс массы тела. По данным авторов учет фактора ожирения повышает чувствительность и специфичность модели. Данная модификация названа авторами АРАСНЕ-О.

Оригинальная модель Balthazar разработана на данных КТ без контрастирования со степенями градации до 5 [87,88,89,90,91,92,93,111, 113,117]. Более поздние модели, разработанные на основе данных КТ с контрастированием со степенями градации до 10, значительно более точно оценивают тяжесть ОП. Модели, базирующиеся на данных КТ с контрастированием, разделяют интрапанкреатические и экстрапанкреатические изменения и учитывают распространенность некроза железы. Имеется прямая корреляция между потерей контрастности и наличием некроза ПЖ. Однако чувствительность и специфичность метода зависит от степени распространенности некроза. При небольших участках некроза чувствительность и специфичность ниже. Ложноположительные результаты наблюдаются, когда ОП сопутствует наличие областей фиброза ткани железы и исследование выполняется в ранние сроки заболевания. Сепсис чаще развивается у больных с некрозом 30% ПЖ, чем у пациентов с площадью некроза 30%. Частота инфицирования некротического панкреатита прямо коррелирует с распространенностью некроза. Критерии, включенные в модель Balthazar, отражены в таблице 5.

Сравнительные исследования Lucarotti ME et al. 1993 [213] не выявили преимуществ у КТ-критериев перед шкалой Glasgow. В исследованиях по раннему выборочному применению КТ с контрастированием [209] подтверждено, что применение метода позволяет достаточно точно охарактеризовать тяжесть заболевания, и обеспечивает морфологической информацией о том, что происходит в ткани ПЖ и в окружающих тканях.

По данным Balthazar Е et all, 1994 [92] использование метода КТ наиболее эффективно в следующих случаях:

1. у больных с неясным клиническим диагнозом,

2. у больных с гиперамилаземией и клиническими признаками тяжелого панкреатита, вздутием живота, болезненностью при пальпации живота, лихорадкой свыше 39 градусов по Цельсию и лейкоцитозом,

3. у больных с оценкой по шкале Ranson более 3 баллов или по шкале APACHE II более 8 баллов,

4. у больных с отсутствием положительной динамики в течение первых 72 часов госпитализации на фоне консервативной терапии,

5. у больных с внезапным ухудшением состояния вслед за первоначальным клиническим улучшением.

Методы уменьшения размерности пространства исходных данных

При обработке информации нередко встречаются ситуации, когда объект описывается очень большим числом признаков. Как правило, эти признаки взаимосвязаны (коррелированны) и в информационном смысле избыточны. Классификация, хранение, передача, обработка, наглядное представление и интерпретация таких данных представляет значительные трудности. Возникает задача сокращения размерности пространства признаков. Такое сокращение возможно, так как в большинстве случаев признаки сильно взаимосвязаны (коррелированы) и, следовательно, в информационном смысле данные избыточны [2,3,4,11,18,27,31,40, 65,66,67,68,69,70,71,82,105,151,158,178,214].

Для уменьшения избыточности данные подвергают сжатию. Размерность пространства данных можно уменьшить двумя способами:

1) удалить переменные, которые несут наименьшее количество информации для разделения объектов прогнозирования на классы,

2) трансформировать пространство переменных с высокой размерностью в пространство переменных с меньшей размерностью с минимальными потерями полезной информации.

С целью оценки значимости количественных переменных для разделения объектов на классы можно использовать t-критерий. В этом случае сравниваются средние значения переменных в разных классах, с последующим отбором тех из них, которые достоверно различаются [2,3,4,12,13,38,40,59]. Независимость переменных можно оценить по ковариантностям пар переменных, которая является мерой изменения одной переменной при изменении другой. Пары переменных с высокими значениями ковариации являются зависимыми и одну из переменных пары можно исключить. При изменении объема выборки степень информативности переменных для разделения объектов на классы может измениться и простое исключение переменных нецелесообразно. В связи с этим более предпочтительным способом уменьшения размерности пространства данных являются методы сжатия данных. Из способов сжатия данных с потерями некоторой части информации одним из наиболее известных является метод главных компонент (МГК) [11,18,151]. Методы сжатия данных с потерей части информации осуществляют преобразование исходного пространства X переменных п в пространство Y меньшей размерности переменных т (т п). При этом важно, чтобы сохранялась наиболее существенная для решения задачи информация об X в сжатом образе Y Выбор вида преобразования Y=f{X) и числа латентных переменных зависит от специфики задачи. Для осуществления такого перехода к новым переменным можно использовать статистические свойства матрицы X. Если данные имеют многомерное нормальное распределение, то эти свойства определяются ковариационной или корреляционной матрицей "признак-признак".

Метод главных компонент — это статистический метод, осуществляющий линейное преобразование, при котором сохраняется наиболее важная информация об изучаемом объекте. При этом делается замена исходных коррелированных данных на статистически независимые компоненты. Компоненты затем можно проранжировать с учетом их информативности. С целью решения вопроса, сколько следует выделять главных компонент используют критерий Кайзера и графический критерий «каменистой осыпи» Кэттелла. В случае использования критерия Кайзера выбирают компоненты со значениями, большими единицы. При использовании критерия Кэттелла строят график значений главных компонент в порядке их убывания и выделяют те компоненты, после которых линия графика приближается к горизонтальной. На практике обычно применяется тот критерий, с помощью которого удается выделить компоненты, которые могут быть содержательно интерпретированы. МГК позволяет по п — числу признаков объекта выделить т главных компонент, то есть осуществляет преобразование п-мерного пространства исходных данных Х = Л, 2,...,Хл] в пространство главных компонент Z = \\Z\,Z2,...,Zm\\ = F(X). Преобразование Z = F(X) должно удовлетворять следующим условиям:

1) преобразование F(X) линейно;

2) главные компоненты ZvZ2,...,Zm ортогональны;

3) дисперсии главных компонент удовлетворяют условию

Сжатие данных позволяет более эффективно использовать пространство для их хранения, уменьшать размерность исходного пространства и выявлять наиболее характерные признаки многомерного пространства.

Автоассоциативные нейронные сети (ААНС) относятся к категории НС типа многослойного персептрона, применяются для сжатия пространства данных с потерей части несущественной информации и отличаются рядом характерных особенностей:

1) число входов и выходов одинаково и равно размерности исходного пространства данных п;

2) сеть содержит не менее одного скрытого слоя с числом нейронов т п, которое является «узким местом» сети, осуществляющим сжатие пространства данных;

3) в качестве требуемых значений на выходе сети используются значения, подаваемые на вход сети, т.е. сеть, старается, как можно точнее воспроизводить входные значения на выходе.

На рисунке 3 показана принципиальная схема четырехслойной ААНС, которая построена нами для сжатия размерности пространства количественных переменных (лабораторные показатели). Во всех слоях этой сети использована нелинейная функция активации (логистическая функция). Для обучения сети использован алгоритм обратного распространения ошибки.

Сеть осуществляет два преобразования F± и F2. Первое преобразование F\ осуществляет переход из исходного пространства данных в сжатое пространство. Преобразование F2 осуществляет возврат сжатого пространства данных к исходному. Значения, полученные после обучения во втором скрытом слое, представляют сжатый образ исходных данных и называются латентными переменными.

Учитывая, что во всех слоях построенной сети использованы нелинейные функции активации, такая сеть может осуществлять нелинейное преобразование при сжатии, если исходные данные обладают нелинейной структурой. В случае если данные имеют линейную структуру, то сеть производит линейное преобразование, подобное МГК. Таким образом, такая НС может быть универсальным средством для решения задачи уменьшения размерности как для линейно структурированных, так и для не линейно структурированных данных [18,27,66,68,69,70,71,82,158,178,214].

Прогнозирование характера течения острого панкреатита методом нейронных сетей (результаты собственных исследований)

1.Формулировка требований к разработке прогнозной модели.

Объект прогнозирования — характер течения ОП (тяжесть патологического процесса).

Метод прогнозирования — нейронные сети.

Прогнозный фон — не учитывался.

Вид прогноза — поисковый, оперативный.

Период основания прогноза — 72 часа от момента госпитализации.

Источник фактографической информации об объекте прогнозирования — истории болезни больных ОП.

Заданная точность прогноза — 90-95%.

2. Понятие «переменные объекта прогнозирования»

Переменными объекта прогнозирования называют различные характеристики заболевания и больного, которые связаны с риском развития заболевания, осложнений или неблагоприятного исхода. Под переменными объекта прогнозирования в данной работе подразумеваются признаки ОП, которые связаны с риском неблагоприятного течения заболевания. С математической точки зрения это независимые переменные. Большинство переменных взаимосвязаны и могут усиливать влияние друг друга. Даже если значимость каждой отдельной переменной выражена умеренно, риск развития неблагоприятного течения ОП может быть высоким вследствие усиливающегося влияния переменных друг на друга. Поэтому с целью оценки риска неблагоприятного течения заболевания необходимо учитывать все доступные переменные. Другими словами необходимо определять суммарный риск. Выбор переменных в данной работе был ограничен теми, которые были доступны из историй болезни больных в ранние сроки госпитализации (первые 72 часа) и являются рутинными при обследовании больных ОП в больницах Российской Федерации.

3. Постановка задач с учетом метода построения прогнозной модели Выбирая в качестве метода построения модели нейронные сети необходимо было решить следующие задачи:

1) Провести анализ априорной информации. Исходная информация представлена выборкой ограниченного объема. Для каждого больного заданы признаки заболевания, заранее известен характер течения заболевания и его исход.

2) В связи с тем, что выборка имеет ограниченный объем, целесообразно оценить достаточность объема выборки с учетом желаемой точности прогнозирования порядка 90-95%.

3) Разбить имеющуюся выборку примеров на обучающую и тестовую последовательности.

4) При необходимости уменьшить размерность заданного пространства исходных данных с помощью одного из методов сжатия данных потерей некоторой части несущественной информации. Для этого было проведено сравнительное исследование метода главных компонент и автоассоциативных нейронных сетей (ААНС).

5) При применении метода ААНС необходимо провести эксперименты с обучающей и тестовой выборками с целью выбора оптимальной архитектуры ААНС.

6) Определить начальную конфигурацию классифицирующей нейронной сети и выбрать алгоритм ее обучения. Определить критерии качества работы созданной системы.

7) Провести экспериментальные исследования на обучающей и тестовой последовательностях для определения количества слоев и нейронов в слоях (конфигурацию сети).

8) Провести эксперименты с созданной нейронной сетью с целью определения наиболее информативных групп переменных.

В данной работе в имеющейся выборке больных с ОП характер протекания заболевания известен заранее. В связи с этим задача прогноза была сформулирована как задача классификации. Последовательность объектов с указанием, к какому классу они относятся, называют обучающей последовательностью. Необходимо построить такую классификационную модель, которая, используя обучающую последовательность, вырабатывала бы систему правил, на основании которых будут классифицироваться новые объекты, не вошедшие в обучающую последовательность. Несмотря на многолетний опыт применения нейронных сетей в различных областях народного хозяйства для решения разного рода задач, в том числе и медицинских, разработка нейросетевых моделей плохо формализована.

4. Методика разработки нейросетевой модели прогнозирования

Анализ литературы показал, что общепринятые методики разработки нейросетевых моделей прогнозирования практически отсутствуют, имеется большое разнообразие подходов к алгоритмам обучения и архитектурам нейронных сетей [45]. В общем случае выбор структуры НС делается в соответствии со спецификой и сложностью задачи. Для решения некоторых типов задач разработаны оптимальные конфигурации. Если предлагаемые конфигурации не подходят для решения конкретной задачи, то авторам приходится разрабатывать оригинальную конфигурацию сети, а иногда и новый алгоритм или модификацию существующего алгоритма обучения. В связи с этим была поставлена и решена задача разработки методики построения нейросетевого классификатора на базе многослойного персептрона с целью прогнозирования характера течения ОП. Задача прогнозирования сформулирована как задача классификации. При решении этой задачи мы выделили следующие основные этапы:

1) Сбор обучающих данных:

а) составление базы данных примеров с заранее определенными классами,

б) разделение всей совокупности данных на обучающее и тестовое множества.

2) Предварительная обработка данных:

а) определение набора признаков (переменных), наиболее полно, описывающих объекты, подлежащих классификации,

б) нормировка значений переменных для подачи на вход НС,

в) оценка возможности разделения имеющейся совокупности данных на классы.

3) Построение НС:

а) выбор числа слоев и нейронов в слоях,

б) выбор вида функции активации,

в) выбор алгоритма обучения,

4) Обучение и оценка качества работы НС:

а) построение нескольких вариантов НС с разным числом нейронов в скрытом слое, оценка качества работы НС по информационному критерию (например, среднеквадратическая ошибка) и по тестовому множеству примеров,

б) выбор варианта НС, с помощью которого получены наилучшие показатели, характеризующие ее качество (способность к обобщениям),

в) в случае необходимости возврат к этапу 2.

5. Оценка параметров переменных

При разработке прогнозных моделей важной значение придается оценке значимости переменных, описывающих объект прогнозирования. В конечном итоге корректный выбор таких переменных играет решающую роль для создания эффективной модели [6,13,126,183]. Строгих математических методов оценки значимости переменных не существует, но для приблизительной оценки можно использовать некоторые статистические методы. Мы провели оценку значимости количественных и номинальных переменных, в результате которой были выделены наиболее значимые из них. Однако, для разработки модели были использованы все переменные, в том числе и малозначимые, так как при изменении объема выборки степень значимости отдельных переменных может измениться.

В таблице 20 представлены количество номинальных переменных и относительная частота их появления внутри каждого класса и во всей выборке. При определении частот появления переменных наличию переменной соответствовало значение 1, отсутствию — 0.

Похожие диссертации на Использование нейронных сетей для принятия внутригоспитальных управленческих решений (на примере острого панкреатита)