Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Суснина, Алла Васильевна

Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей
<
Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Суснина, Алла Васильевна. Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей : диссертация ... кандидата технических наук : 05.13.11, 05.13.09.- Рязань, 1999.- 213 с.: ил. РГБ ОД, 61 00-5/1037-3

Содержание к диссертации

Введение

Глава 1. Обзор и анализ систем прогнозирования чнфаркта миокарда и его осложнений 21

1.1. Обзор систем прогнозирования возникновения, течения, исхода и осложнений инфаркта миокарда 2\

1.1.1. Основные этапы в развитии прогностических показателей 21

1.1.2. Системы прогнозирования, основанные на использовании математических методов 25

1.1.3. Системы прогнозирования рецидивирующего инфаркта миокарда

1.2. Классификация систем прогнозирования инфаркта миокарда и рецидивирующего инфаркта миокарда 47

1.3. Формулировка требований к разработке системы прогнозирования рецидивирующего инфаркта миокарда 48

Выводы 58

Глава 2. Разработка и исследование математической модели системы прогнозирования 62

2.1. Анализ исходной информации 62

2.1.1. Понятие фактора прогноза 63

2.1.2. Структура карты больного 66

2.2. Постановка задачи прогноза РИМ как задачи классификации

2.2.1. Задача обучения 70

2.2.2. Возможные методы решения задачи

пассификации 74

2.2.3. Оценка объема реальной выборки 77

2.3. Определение частоты появления факторов по лассам 81

2.4. Кодирование входной информации 86

2.5. Исследование параметров факторов в

юответствии с принадлежностью больных к классам 88

2.5.1. Оценка параметров факторов 90

2.5.2. Методика предварительной обработки исходной шформации в задачах прогноза с использованием НС при наличии ограниченного количества примеров для обучения 105

2.5.3. Применение критериев метода кластерного

анализа для оценки разделимости объектов задачи 106

2.5.4. Применение метода кластерного анализа для руппировки факторов

2.6. Обоснование применения математического аппарата ИНС для разработки СП РИМ 113

Выводы 117

Глава 3. STRONG Разработка системы прогнозирования на основе нейрокомпьютерных технологий 120

3.1 .Общие положения теории НС STRONG 120

3.1.1. Стандартные структуры нейронных сетей 121

3.1.2. Методика разработки нейросетевых систем 123

3.2. Разработка структуры СП РИМ 125

3.2.1. Кодирование выходной информации 130

3.3. Выбор алгоритма обучения нейронной сети

3.3.1. Алгоритм обратного распространения ошибки 136

3.3.2. Критерии качества работы нейронной сети 143

3.3.3. Разработка структуры нейронной сети в СП РИМ 145

3.3.4. Разделение исходной информации на Мучающую и тестовую выборки 146

3.4. Определение оптимальной структуры нейронной

Выводы 148

149

Глава 4. Экспериментальные исследования системы прогнозирования рецидивирующего инфаркта миокарда

4.1. Экспериментальное исследование моделей 149

4.1.1. Методика проведения экспериментов 151

4.1.2. Оценка качества Модели 1 152

4.1.3. Оценка качества Модели 2 160

4.1.4. Выбор базовой модели системы 160

4.2. Общие сведения о нейропакете 163

4.2.1. Файл настройки системы 166

Выводы 169

Заключение

Введение к работе

Актуальность темы. Особенностью современной медицины является лубокое проникновение в нее новых информационных технологий.

Огромные возможности дает применение математических методов и вы-шслительной техники в борьбе с наиболее распространенными заболеваниями :ердечно-сосудистой системы.

В области диагностики и лечения больных инфарктом миокарда (ИМ) в юследнее время достигнуты определенные успехи. Тем не менее, около 15-20% 5ольных острым ИМ погибают на догоспитальном этапе, еще 15% в больнице, )бщая летальность составляет 30-35%. Причины устойчивости столь высокой іетальности до конца не изучены.

Отсутствие явного прогресса в исходе болезни заставляет глубже иссле-ювать основные факторы заболевания, более точно прогнозировать течение -ІМ.

Целью прогноза в медицине является обоснование и обеспечение адек-іатньїх лечебных мероприятий, направленных на сохранение жизни больного и тредотвращение угрожающих ему осложнений, а не доказательство их неотвратимости. Большинство этих мероприятий обременительны для больного, сопря-кены с некоторым риском, а в настоящее время и весьма дорогостоящи, что эграничивает их использование с профилактической целью. Известно также, что зсложнения наблюдаются лишь у части больных ИМ и обычно возникают вне-!апно.

Проблема прогнозирования осложнений, которые могут возникнуть в "оспитальный период ИМ, очень актуальна и является сложной задачей кардио-югии.

Рецидивирующий инфаркт миокарда (РИМ) - одно из наиболее серьезных осложнений ИМ.

Прогноз при этой форме течения ИМ обычно неблагоприятен. Летальность при рецидивирующем течении крупноочаговых ИМ даже в условиях спе-диализированных отделений составляет около 50%.

В задачах прогноза в медицине можно выделить только приблизительный набор наиболее важных начальных условий (факторы заболевания, ограниченное количество примеров для обучения), алгоритм нахождения ответа нельзя нетко определить. Неявные задачи медицины стали идеальным полем для применения нейросетевых технологий, именно в этой области наблюдается наибо-іее яркий практический успех нейроинформационных методов.

Основные принципы создания нейросетевых систем изложены в работах ученых России А.Н.Горбаня, Э.М.Куссуля, А.И.Галушкина, Д.А.Россиева, З.В.Золотарева, С.Е.Головенкина и зарубежных авторов Ф.Розенблатта, 1>.Уоссермана, Д.-Э.Бэстэнса, A. Krogh и др.

2 Целью диссертационной работы является разработка единой системі прогнозирования возникновения и исхода рецидивирующего инфаркта миокард (СП РИМ) на основе математического аппарата искусственных нейронных сете (ИНС) для выработки оптимальной стратегии лечения конкретного больной повышение точности прогноза.

Для достижения цели необходимо:

провести анализ существующих систем прогноза ИМ и РИМ;

провести анализ исходной информации, заданной в виде кар больных;

обосновать метод решения задачи;

разработать систему прогнозирования РИМ и реализовать ее пр( граммным путем;

провести экспериментальные исследования разработанной системы.

Методы исследования. Исследования проводились на основе теории в( роятности, математической статистики, методов теории распознавания образої метода кластерного анализа, математического аппарата искусственных нейрої ных сетей, структурного и объектно-ориентированного подхода.

Научная новизна.

  1. Разработан способ прогнозирования возможности возникновения исхода РИМ.

  2. Разработана методика предварительной оценки исходной информаци в задачах прогноза с использованием искусственных нейронных сетей пр наличии ограниченного количества примеров для обучения.

  3. Предложено и обосновано применение метода кластерного анализ для уменьшения размерности вектора входных параметров при ограниченно выборке исходной информации.

  4. Выявлены группы факторов, оказывающих идентичное влияние і возникновение и исход РИМ, что позволяет произвести уменьшение количеств факторов путем введения «синтетических» факторов, обобщающих влиян* группы родственных.

Практическая ценность работы заключается в том, что разработанны способ системы прогнозирования РИМ на основе искусственных нейронны сетей позволяет получить точность прогноза возникновения и исхода РИМ 9( 95%. Разработанная методика предварительной оценки исходной информации задачах прогноза с ограниченным количеством примеров для обучения позвол) ет оценить возможность применения искусственных нейронных сетей для реші ния задачи. Получена матрица коэффициентов нейросети для решения задач прогноза РИМ.

Примечание. Под точностью прогноза в работе понимается оценка вероятности правильного распознавания объектов тестовой последовательности.

Практическая ценность результатов диссертационной работы подтверждается актами внедрения.

Достоверность полученных в диссертационной работе результатов обосновывается применением апробированных методов исследований и подтверждается результатами экспериментов на тестовых выборках исходной информации.

Реализация и внедрение результатов.

Система прогнозирования возникновения и исхода рецидивирующего инфаркта миокарда, разработанная в диссертационной работе, используется для анализа состояния больного при его поступлении в инфарктное отделение Рязанского областного клинического кардиологического диспансера с целью выработки стратегии лечения конкретного больного.

Методика анализа исходной информации для решения задач прогнозирования с применением неиросетевых технологий при наличии ограниченного количества примеров для обучения используется в учебном процессе в Рязанской государственной радиотехнической академии:

S на кафедре электронных вычислительных машин в курсе «Системы искусственного интеллекта» студентами специальности 2201 - «Вычислительные системы комплексы и сети»;

S на кафедре вычислительной и прикладной математики в курсе «Теория принятия решений» студентами специальности 2204 - «Программное обеспечение вычислительной техники и автоматизированных систем».

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах:

  1. Международные научно-технические семинары «Проблемы передачи и обработки информации в информационно-вычислительных сетях», Рязань, 1997г., 1999г.

  2. III Международный славянский конгресс «Электроника в медицине. Мониторинг, диагностика, терапия», Санкт-Петербург, 1998г.

  3. Научно-практическая конференция Всероссийского научного общества кардиологов «Артериальные гипертензии и сердечная недостаточность», Рязань, 1998.

Публикации. По теме диссертации опубликовано 7 работ. В том числе 3 статьи в межвузовских сборниках, 4 тезисов и материалов докладов на международных и всероссийских конференциях и семинарах.

Структура и объем диссертации. Диссертационная работа состоит и введения, четырех глав, заключения и приложений. Основной текст содержи 213 страниц, 18 таблиц и 40 рисунков.

Список литературы состоит из 101 наименования.

Основные результаты, выносимые на защиту:

  1. Способ прогнозирования рецидива инфаркта миокарда на основ искусственных нейронных сетей.

  2. Методика предварительной оценки информации в задачах про гноза с использованием искусственных нейронных сетей при наличии огра ничейного количества примеров для обучения.

  3. Методика уменьшения размерности вектора входных факторов з счет выделения групп факторов и их объединения.

  4. Пакет прикладных программ системы прогнозирования РИМ н основе искусственных нейронных сетей.

Основные этапы в развитии прогностических показателей

Russek применил прогностическую оценку для выбора лечения , а не просто для предсказания возможной выживаемости. В день поступления больных острым ИМ в госпиталь он делил их на две категории - с небольшой опасностью для жизни и большой. Ввод антикоагулянтов использовался только для второй группы [62].

Более совершенным шагом в развитии прогностических оценок стало изучение сочетаний факторов. White и соавт. не только произвели оценку отдельных факторов, но и изучили значение некоторых их сочетаний [63].

Подробнее остановимся на системах Schnur и Peel. Эти системы и на сегодняшний день продолжают оставаться самыми популярными системами прогностических индексов, поскольку привычны в применении. Более совершенные системы прогноза, основанные на использовании того или иного математического метода, сравниваются по результатам прогноза с этими широко известными системами [1,2,25].

Для комплексной оценки состояния больных 1953 г. Schnur [59] предложил метод количественного определения тяжести ИМ по данным, полученным при поступлении больных в стационар. Автор выделил 19 наиболее значимых признаков, которые можно было определить немедленно после поступления больного без каких-либо лабораторных исследований. На основании наблюдений каждому признаку был дан весовой балл. Затрудняет использование шкалы признаков то, что некоторые признаки получили интервалы значений с широким диапазоном, что должно, по-видимому, отражать степень их выраженности. Автор не указывает, каким образом он определял выраженность того или иного признака. Высший балл (40) был дан шоку, критерии которого представлены нечетко. Проанализировав весь свой материал по выбранной шкале признаков, автор выделил 5 групп больных и рассчитал процент летальности в каждой из них. Schnur не ставил перед собой задачу определения индивидуального прогноза, а лишь устанавливал вероятность неблагоприятного исхода в группах с определенным патологическим индексом (от 8% летальности в группе с патологическим индексом 0-19 до 95% в группе с патологическим индексом 80 и более) [9, 59]. Формула Schnur проста для расчета, ею можно пользоваться в любых условиях (на дому, при транспортировке больного). Точность прогноза невелика [28].

В 1962 г. была опубликована работа Peel с соавт. [60] о коронарном прогностическом индексе, который предполагалось использовать как для сравнения тяжести состояния больных, так и для определения индивидуального ближайшего прогноза по клиническим и электрокардиологическим данным. Считая таблицу Schnur слишком детализированной и оставляющей много возможностей для субъективизма при оценке ряда признаков, авторы разработали свою шкалу, состоящую из 6 факторов, внутри каждого из которых оценки распределены в соответствии со степенью его выраженности. В шкалу были включены пол и возраст больного, электрокардиографические данные о глубине поражения миокарда. Состояния, квалифицируемые наиболее «плохими» оценками подробно описаны. Использовались данные, полученные при поступлении больного в стационар.

Рассмотрены истории болезни 628 больных ИМ. Проведя анализ, авторы выделили 4 группы больных со значениями прогностического индекса от 1 до 8, от 9 до 12, от 13 до 16, 17 я более. Летальность в каждой группе составила соответственно 2.5 -5%; 10-15%; 25; 65-85%.

Авторы предполагали использовать свой индекс для определения тяжести состояния групп больных и прогноза исхода заболевания, но в итоге могли лишь отнести больного к одной из групп, в зависимости от тяжести его состояния [9].

В ряде работ проведена апробация обеих систем. Так по данным И.Г. Ступелиса и соавт [57], соответствие значений индексов действительному исходу заболевания по системе Schnur достигало 85.6%, по системе Peel - 88.9%. По данным Т.А. Апреловой [56] - 89.3 и 90.5% - соответственно. В работе [28] отмечается высокая достоверность летального прогноза по формуле Peel - 83.3%. В работе [27] отмечено, что при использовании формулы Schnur: при благоприятном исходе процент совпадений прогноза и исхода болезни составил - 96%; при неблагоприятном исходе - всего 40%.

Данные, приведенные в работах независимых исследователей, неоднозначны. Все авторы указывают на непригодность этих систем для индивидуального прогноза.

В 1966 г. Gironi и соавт. [62] предложили собственную систему оценки тяжести ИМ. В таблицу признаков заболевания авторы включили ряд объективных и субъективных параметров. Она отличается от предыдущих таблиц тем, что в нее включена продолжительность госпитализации, что делает невозможным применение метода для определения текущего индивидуального прогноза у поступающих больных.

На суммировании баллов основан также метод, предназначенный для определения тяжести течения ИМ, предложенный З.К. Трушинским [58]. Автор не дает подробного анализа клинического материала, указывая лишь на неодинаковую тяжесть состояния больных. В таблицу признаков включено 19 параметров, наличие и количественная оценка которых могли быть определены достоверно. Из рассмотрения исключены такие признаки, как продолжительность и интенсивность болей, определение общего состояния и т.д., при оценке которых трудно избежать субъективности. Для качественных признаков отмечается лишь наличие или отсутствие данной патологии, количественные признаки разделены на ряд градаций. Число условных единиц, соответствующее каждому признаку, рассчитывается с учетом больничной летальности. За одну условную единицу принималось 5%-ное различие в летальности между группами выживших и умерших

Структура карты больного

Прогнозирование представляет собой научно обоснованное определение будущих состояний интересующего нас объекта. Прогноз должен показать, когда и в какой последовательности будут протекать смена состояний объекта и как состояние объекта будет влиять на выполнение задач, для которых данный объект предназначен [82]. Существует два вида задач прогноза: задачи анализа временных рядов и задачи классификации. Для решения задачи прогноза могут быть применены методы теории группового учета алгоритмов (МГУА), методы теории (РО) и методы ИНС [83].

Поскольку для всех больных в заданной выборке исходных данных известен результат лечения, то есть больные априорно разделены на три класса, то задача прогнозирования РИМ может быть сформулирована как задача классификации. Решение задачи классификации подробно описано в работах [69, 77, 80]. Пусть задан перечень классов Q;, / = 1, ..., т (т=3), задан априорный словарь факторов %.,j = 1, ..., N. (N = 25). Диапазон изменения фактора %. разделен на градации (интервалы) Д/Сх Д/Ос Д/Ос,)- Количество градаций - 5. С учетом разбиения на градации общее число факторов К = 125. Набор параметров объектов - факторы Хг- Хк К0Т0Рь1е можно рассматривать как составляющие вектора Ха=ІХ\ - Хк} описывающего априорное пространство факторов К. Конкретные точки этого пространства представляют распознаваемые объекты.

Произведено разбиение объектов на классы Q,, ...,Qm. Требуется выделить в пространстве факторов области )., i-1, ..., т, эквивалентные классам, т.е., характеризуемые следующей необходимой зависимостью: если объект, имеющий факторы х - Хк относится к классу Q., то представляющая его в факторном пространстве точка принадлежит области )j.

Помимо геометрической существует и алгебраическая трактовка задачи: требуется построить разделяющие функции f,(Xi - X г=т обладающие следующим свойством: если объект, имеющий факторы х - Хк отно сится к классу Q,., то величина / (хЛ- х/) Должна быть наибольшей. Такой же она должна быть и для всех других значений факторов объектов, относящихся к классу Qr Если х обозначает вектор факторов объекта, принадлежащего к Q?- му классу, то для всех значений вектора Xq Fq(xq) Fg(xq) Я g=l, ...,т, q g. В пространстве факторов граница разбиений, называемая решающей границей между областями )., соответствующих классам Q/; выражается уравнением р (х) - р (х) = 0.

Задача классификации не имеет однозначного решения, и в зависимости от объема исходной информации для ее решения могут быть использованы методы непосредственной обработки данных, обучения или самообучения [77].

Различают обучение с учителем и обучение без учителя. При обучении без учителя индекс класса для каждого объекта неизвестен, тогда как при обучении учителем такая информация есть [80].

В настоящей задаче для каждого больного исход заболевания известен. Разбиение объектов на классы произведено априорно. В связи с этим, задача классификации может быть решена как задача обучения с учителем.

Последовательность объектов с указанием, к какому классу они относятся, называется обучающей последовательностью. Задача обучения с учителем состоит в том, чтобы построить такую программу, которая, используя обучающую последовательность, вырабатывала бы правило, позволяющее классифицировать новые объекты (отличные от входящих в обучающую последовательность) примерно так же, как учитель. Математическая постановка задачи обучения с учителем заключается в следующем [69].

В среде, которая характеризуется распределением вероятностей Р(х), случайно и независимо появляются объекты х. Существует «учитель» , который относит к одному из к классов (считаем, что к=2). При любом другом числе классов последовательным разбиением на два класса можно построить разделение и на А: классов. Пусть он делает это согласно условной вероятности Р (со їх), где со=1 означает, что вектор х отнесен к первому классу, со=0 - ко второму. Характеристика среды Р(х), правило классификации Р (со їх) неизвестны. Но известно, что обе функции существуют и, следовательно, существует совместное распределение вероятностей Р(со,х)=Р(х) -P(colx). (2.1)

Определено множество Q решающих правил F(x,a). Каждое правило определено заданием параметра а . Все правила F(x,a) - характеристические функции, т.е. могут принимать только одно из двух значений: 0 или 1. Для каждой функции F(x,a) определено качество Р(а) как вероятность различных классификаций ситуаций с учителем. Качество Р(а) функции F(x, а) определяется следующим образом: 1) в случае, когда пространствоXдискретно и состоит из точек х,, ..., х N, Р(с0= t (co-F(xl)a))2P(xl)P(colx,), (2.2) от=0 i =l где Р(х,) - вероятность возникновения ситуации X (.. 1) в случае, когда в пространстве X существует плотность распределения Р(х).

Методика разработки нейросетевых систем

В работе [76] предложена достаточно полная классификация данных, с которыми может столкнуться создатель медицинских экспертных систем, и оптимальные способы их представления в численном виде, учитывающие специфику работы нейросетевых систем. Отмечается, что для фактора, имеющего несколько градаций, кодирование путем присвоения каждой градации порядкового номера нежелательно.

Данные конкретной задачи относятся по этой классификации к пункту «совестимые варианты».

Совместимые варианты. Информация может быть представлена одним или одновременно несколькими вариантами из известного и ограниченного набора вариантов. В таких случаях имеется два различных подхода к кодированию данных. A. Если варианты неупорядоченные, наилучший (но, к сожалению, не всегда удобный) способ состоит в том, чтобы разбить фактор на несколько факторов, количество которых равно количеству вариантов и каждый из них кодировать отдельно. Каждый подфактор в таком случае делается самостоя тельным фактором. Этот вариант до настоящего момента использовался выше. B. Если варианты упорядоченные, можно применить принцип битовой маски

Принцип битовой маски заключается в том, что возможно кодирование не только наличия или отсутствия некоторого фактора, но и степени его проявления. Пример 1. Для фактора х4, наличие градаций: «мелкоочаговый», «крупноочаговый», «трансмуральный», «2-3 и более» - будут иметь соответствующие коды 00010, 00100, 01000, 10000 и соответственно веса 2, 4, 6, 8.

Пример 2. Для фактора х2 одновременное наличие градаций «ожирение», «употребление алкоголя», «курение», «артериальная гипертензия» имеет код 01111 и вес Р2=1+2+4+8=15.

Однако, единого подхода и строгого математического обоснования к определению весов факторов не существует и в каждом конкретном случае требуется квалифицированное решение специалиста.

Если использовать подобное кодирование, то получится, что наличие всех градаций множественного фактора превысит практически в два раза наличие самой сильной градации любого одинарного фактора. Объяснение подобного результата с медицинской точки зрения не представляется возможным.

Тем не менее, так как система прогноза будет реализована с помощью ИНС, отметим, что кодирование в этом случае не имеет принципиального значения (фактически это вопрос о нормировании или ненормировании входных сигналов). В связи с этим, кодирование факторов будет проведено по принципу битовой маски. Кодирование информации для всей выборки больных в соответствии с предложенными принципами приведено в Приложении 1. В результате кодирования число факторов уменьшилось до 25. Для каждой карты больного известен исход заболевания, все больные разделены на 3 класса. Если предположить, что в процессе обучения пространство факторов формируется исходя из заданной или задуманной классификации, то тогда можно предположить, что заданное пространство факторов само по себе задает свойство, под действием которого распознаваемые образы в этом пространстве легко разделяются. Такое предположение в теории РО известно как гипотеза компактности: распознаваемым образам соответствуют компактные множества в пространстве факторов. Под компактным множеством пока будем понимать некие "сгустки" точек в пространстве факторов, предполагая, что между этими сгустками существуют разделяющие их разряжения.

Задачи, в рамках которых гипотеза компактности хорошо выполняется, как правило, имеют простое решение. Те задачи, для которых гипотеза не подтверждается либо совсем не решаются, либо решаются с большим трудом с привлечением дополнительных ухищрений. Таким образом, гипотеза компактности превратилась в признак возможности удовлетворительного решения задач распознавания [69, 73].

Если бы удалось подметить некое всеобщее свойство, не зависящее ни от природы образов, ни от их изображений, а определяющее лишь их способность к разделимости, то наряду с обычной задачей обучения распознаванию, с использованием информации о принадлежности каждого объекта из обучающей последовательности тому или иному образу можно было бы поставить иную классификационную задачу — так называемую задачу обучения без учителя.

Таким объективным свойством является свойство компактности образов. Взаимное расположение точек в выбранном пространстве уже содержит информацию о том, как следует разделить множество точек. Эта информация и определяет то свойство разделимости образов, которое оказывается достаточным для самообучения системы распознаванию образов.

При решении настоящей задачи нет необходимости решать задачу классификации как задачу обучения без учителя, поскольку априорная информация содержит примеры трех видов распознаваемых образов. Тем не менее, поскольку количество примеров ограничено, следует заранее выявить возможность удовлетворительного решения задачи. Рассмотрим, могут ли эти факторы стать базовыми для разбиения больных на три класса после проведенного кодирования.

Получим возможные статистические характеристики факторов, используя методы описательной статистики.

В Таблице 2.4 «Параметры описательной статистики» представлены рассчитанные параметры факторов для всех классов больных. Для каждого фактора во всех трех классах рассчитаны следующие параметры: среднее, стандартная ошибка, медиана, мода, стандартное отклонение, дисперсия, эксцесс, асимметричность, интервал, минимум, максимум, сумма. Набор этих параметров предусмотрен в табличном процессоре Excel 97 пакета Microsoft Office 97 при работе со средствами «Анализ данных», раздел «Описательная статистика». Этот раздел позволяет оценить закон распределения данных. Для конкретной задачи выборка данных недостаточно представительна, функцию распределения для закодированных значений факторов получить невозможно. Все приведенные параметры могут быть использованы для характеристики одномерного распределения и сгруппированы следующим образом [70]. Меры положения: меры среднего положения распределения (среднее, медиана, мода). Меры рассеяния: меры, которые характеризуют изменчивость распределения (дисперсия, стандартное отклонение). Меры формы: меры, которые характеризуют отклонение распределения от нормального (асимметричность, эксцесс).

Оценка качества Модели 2

В этом же модуле происходит кодирование входной информации, поступающей в Базу Данных в раздел «Текущие данные для прогноза».

Для Модели 1 текущие данные конкретного больного из базы поступают в модуль Неиросеть 1, который определяет возможность возникновения РИМ. При прогнозе возникновения РИМ текущие данные поступают в модуль Ней-росетиъ 2, который выдает прогноз о возможном исходе заболевания.

Для Модели 2 текущие данные конкретного больного поступают в модуль Неиросеть, который определяет одновременно возможность и возникновения и исхода РИМ. По полученному прогнозу врач может подобрать метод лечения конкретного больного. Текущие данные на конкретного больного сохраняются в Базе Данных , и могут быть переведены раздел Данные априорной информации». Со временем, при пополнении Базы Данных, можно заново провести обучение системы, сопоставив критерии качества обучения, поскольку реальная выборка примеров в настоящее время недостаточна. Т.е. на этапе «стартового» обучения должны быть определены наилучшие параметры сетей, в последующем пользователи могут дообучить систему в условиях реальной работы и реальных данных. Коренное отличие методологии создания нейросетевых систем от традиционных состоит в том, что система никогда не является полностью законченной, продолжая накапливать опыт в процессе эксплуатации.

Следует подчеркнуть, что решение, принимаемое НС, не является категоричным. Сеть выдает решение вместе со степенью уверенности в нем, что оставляет пользователю возможность критически оценивать ее ответ.

Задача двоичной классификации может быть решена на сети с одним выходным элементом, который может находиться в состоянии 0 или L

Для задачи с многими классами нужно разработать способ записи (кодирования ) выхода. Первый способ состоит в том, чтобы кодировать к классов с помощью -мерных наборов, приписывая /-ой компоненте значение 1, если исследуемый пример принадлежит /-ому классу, и 0 - в противоположном случае. Такой способ называется «бабушкиным» кодированием.

Второй способ работы со многими классами - разбить задачу с к классами на к(к-1) подзадач, содержащих только по два класса. Окончательное присваивание элементу /-го номера класса осуществляется булевой функцией, на вход которой подаются выходы подзадач. В этом случае число выходных элементов с ростом к растет как 2. Такое кодирование называется «2-на-2 кодирование».

Этот способ является предпочтительным, так как в бабушкином методе необходимо строить нелинейные разрешающие границы. Рисунок 3.6 иллюстрирует проблему кодирования выхода на примере двумерной задачи с тремя классами. В связи с тем, что выбраны две структуры СП РИМ, соответственно кодирование выходной информации в Модели 1 и Модели 2 различное. Модель 1. Решение задачи двоичной классификации. Кодирование выходной информации произведено следующим образом. На первом этапе выявлено наличие или отсутствие РИМ между больными 3 класса (без РИМ) и объединенных 1 и 2 классов. Таким образом, возможно кодирование выходной функции одноразрядным двоичным числом

В контексте ИНС процесс обучения может рассматриваться как настройка архитектуры сети и весов связей для эффективного выполнения специальной задачи: некоторое множество входов должно приводить к требуемому множеству выходов. НС должна настроить веса связей по имеющейся обучающей зыборке. Функционирование сети улучшается по мере итеративной настройки зесовых коэффициентов.

Для конструирования процесса обучения, прежде всего, необходимо іметь модель внешней среды, в которой функционирует НС - знать доступную уія сети информацию. Эта модель определяет парадигму обучения [88]. Во-гсорых, необходимо понять, как модифицировать весовые параметры сети, то :сть определить, какие правила обучения управляют процессом настройки. Ал-оритм обучения - это процедура, использующая праавила обучения для настройки весов. В конкретной задаче классификации используется обучение с учителем.

Задача классификации может рассматриваться как задача заполнения пропусков в таблицах: для каждого класса в таблице есть поле, в котором указывается, принадлежит объект данному классу или нет. В эти поля могут ставиться численные значения, например, 1, если объект принадлежит классу, и О (или -1) - в противном случае.

При обучении классификации с учителем для части объектов, составляющих обучающую выборку, известно, каким классам они принадлежат. Требуется построить НС, которая по признакам (факторам) объекта (записанным в других полях таблицы) определяла бы, к какому классу он принадлежит, то есть заполняла бы соответствующие поля.

Обучаемые НС могут производят из данных скрытые знания: создают навык предсказания, классификации, распознавания образов и т.п., но их логическая структура остается скрытой от пользователя. Проблема проявления этой скрытой логической структуры решается путем приведения НС к специальному "логически прозрачному" разреженному виду. Сама НС после удаления лишних связей может рассматриваться как логическая структура, представляющая явные знания. Технология обучения НС состоит из двух этапов. Первый этап: обучить НС решать базовую задачу. Второй этап: с помощью исключения наименее значимых связей и доучивания (все это применяется неоднократно) привести НС к логически прозрачному виду - так, чтобы полученный навык можно было "прочитать". На этом этапе исследуются два вопроса: «Сколько нейронов необходимо для решения задачи?» и «Какова должна быть структура НС?» Объединяя эти два вопроса, получаем третий: «Как сделать работу нейронной сети понятной для пользователя » [76].

Похожие диссертации на Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей