Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Катасёв Алексей Сергеевич

Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем
<
Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Катасёв Алексей Сергеевич. Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем : диссертация ... кандидата технических наук : 05.13.18.- Казань, 2006.- 194 с.: ил. РГБ ОД, 61 07-5/1712

Содержание к диссертации

Введение

1. Интеллектуальные системы поддержки принятия решений 15

1.1. Проблемы разработки систем поддержки принятия решений 15

1.1.1. Задачи систем поддержки принятия решений 15

1.1.2. Методы и системы анализа данных 18

1.1.3. Методы и задачи Data Mining 19

1.1.4. Структура, состав экспертных систем и их характеристики 22

1.2. Технологии интеллектуального анализа данных 25

1.2.1. Стратегии получения знаний для экспертных систем ...25

1.2.2. Обнаружение знаний в базах данных і ..27

1.2.3. Подготовка обучающей выборки ...31

1.2.4. Репрезентативность обучающей выборки ..35

1.3. Методы нечёткой логики и нейронных сетей в задачах интеллектуального анализа информации 37

1.3.1. Предпосылки использования методов искусственного интеллекта в решении задач интеллектуальной обработки информации 37

1.3.2. Искусственные нейронные сети 38

1.3.3. Нечёткая логика 44

1.3.4. Нечёткие логические выводы 49

1.3.5. Сравнительный анализ нечётких и нейросетевых моделей 53

1.3.6. Нечёткие нейронные сети 55

1.3.7. Примеры нечётких нейронных сетей ...58

1.3.8. Идентификация нейронечётких моделей 61

1.3.9. Нечётко-продукционная модель представления знаний ...63

1.3.10. Схема нечёткого логического вывода на нечётко-продукционной модели представления знаний 65

1.3.11. Постановка задачи по разработке структуры и алгоритма обучения нечёткой нейронной сети 68

1.4. Выводы 69

2. Структура и алгоритм обучения нейронечёткой модели 70

2.1. Структура нечёткой нейронной сети ...70

2.1.1. Идентификация параметров и слоев нейронной сети 70

2.1.2. Пример структуры нечёткой нейронной сети 73

2.1.3. Схема функционирования нейронной сети .74

2.1.4. Формы кривых для задания функций принадлежности нечётких " множеств 78

2.2. Алгоритм обучения нейронечёткой модели ...81

2.2.1. Принципы обучения нечёткой нейронной сети ... 81

2.2.2. Разработка алгоритма обучения сети ;„.84

2.2.3. Реализация алгоритма обучения 89

2.2.3.1. Определение весовых коэффициентов в нечётко-продукционных правилах '. 89

2.2.3.2. Инициализация параметров функций принадлежности...91

2.2.3.3. Правила настройки параметров нейронной сети ...'. 94

2.2 А. Критерии качества обучения нечёткой нейронной сети 106

2.2.5. О сходимости алгоритма обучения нейронной сети 108

2.4. Выводы 112

3. Исследование алгоритма обучения на базе разработанного программного комплекса «нечёткая нейронная сеть» 113

3.1. Описание разработанного программного обеспечения 113

3.1.1. Назначение программного комплекса 113

3.1.2. Пример функционирования нейронной сети 114

3.2. Режимы работы нечёткой нейронной сети 119

3.2.1. Работа сети в режиме обучения 119

3.2.2. Режим генерации и отбора значимых правил 121

3.2.3. Тестирование нейронной сети на контрольной выборке данных... 122

3.2.4. Использование нечёткой нейронной сети в составе мягких экспертных систем 123

3.3. Численно-параметрические исследования 125

3.3.1. Сравнение функций принадлежности нечётких ограничений по критериям «скорость обучения» и «точность аппроксимации» 125

3.3.2. Временная сложность вычислений при обучении нечёткой нейронной сети 128

3.3.3. Обучение нечёткой нейронной сети на комплектных и некомплектных выборках 129

3.4. Выводы ...132

4. Решение задачи формирования баз знаний экспертных систем на основе нечёткой нейронной сети 134

4.1. Формирование базы знаний системы медицинской диагностики на примере поясничного остеохондроза ..134

4.1.1. Особенности диагностического процесса в медицине 134

4.1.2. Построение базы знаний системы медицинской диагностики 138

4.1.3. Результаты использования нейронной сети 142

4.2. Формирование базы знаний комплексной системы предупреждения сбоев и аварий технологического оборудования процессов поддержания пластового давления 150

4.2.1. Общее описание системы 150

4.2.2. Формирование базы знаний комплексной системы 155

4.2.3. Методика оперативного обнаружения утечек из водоводов 156

4.2.4. Полученные практические результаты .158

4.3. Сравнение нечёткой нейронной сети с программными средствами формирования баз знаний экспертных систем ...159

4.3.1. Обзор программных средств построения систем нечёткого логического вывода 159

4.3.2. Методы извлечения нечётких правил из баз данных 161

4.4. Выводы 163

Заключение ...165

Список литературы

Введение к работе

Актуальность темы. Глобальная информатизация стимулировала разработку в различных проблемных областях человеческой деятельности автоматизированных диагностических систем. Это, как правило, интеллектуальные системы, моделирующие процесс рассуждения эксперта при принятии им решения – экспертные системы (ЭС). Основным элементом ЭС является база знаний, представленная множеством систематизированных правил, описывающих закономерности предметной области. Данные правила формулируются экспертом или формируются на основе анализа больших статистических массивов данных.

В первом случае эксперт явно или неявно формализует свои знания, опыт и интуицию в рамках выбранной модели представления знаний. Это сложный процесс, требующий большой аналитической работы.

Второе направление связано с разработкой и применением новых математических методов, способных эффективно анализировать статистические данные и извлекать из них полезные знания при минимуме работы эксперта. Использование данного подхода перспективно для формирования баз знаний экспертных систем нового поколения – мягких экспертных систем – в таких предметных областях как медицина, промышленность, нефтяная отрасль и др.

Для всех из них характерны следующие особенности:

резкое увеличение объёмов обрабатываемой информации;

необходимость одновременной обработки разнотипной информации;

её нечёткость, качественность и субъективный характер;

отсутствие формальных подходов к решению задач;

необходимость решать задачи, свойственные только человеку;

многокритериальность решаемых задач в условиях нечёткости критериев.

Актуально создание интеллектуальных систем обработки информации, способных эффективно решать поставленные задачи в указанных условиях.

Исследованию данной проблемы посвящены работы следующих учёных: Заде Л.А., Ларичева О.И., Поспелова Д.А., Аверкина А.Н., Финна В.К., Вагина В.Н., Кобринского Б.А., Загоруйко Н.Г., Ярушкиной Н.Г., Паклина Н.Б., Батыршина И.З., Подольской М.А., Гловы В.И., Аникина И.В. и др.

Однако, несмотря на это, многие вопросы обработки данных в указанных предметных областях не рассматривались. Таким образом, актуальной задачей является разработка адекватных моделей, эффективных алгоритмов и реализующих их программных комплексов формирования баз знаний экспертных систем. Решению этой задачи посвящена настоящая диссертация.

Объект исследования: базы знаний интеллектуальных человеко-машинных систем поддержки принятия решений – экспертных систем.

Предмет исследования: методы, модели, алгоритмы и стратегии получения знаний для экспертных систем.

Цель работы: повышение эффективности построения баз знаний нечётких экспертных систем на основе моделей и алгоритмов интеллектуального анализа данных, формирующих правила принятия решений.

Научная задача: разработка формальной модели, алгоритма её обучения и программного комплекса формирования баз знаний экспертных систем.

Достижение поставленной цели и задачи потребовало решения вопросов:

анализа эффективности методов интеллектуальной обработки информации и стратегий получения знаний для экспертных систем;

разработки нейронечёткой модели формирования баз знаний, алгоритма её обучения и правил инициализации параметров;

реализации программного комплекса на базе нейронечёткой модели;

выполнения исследований для оценки эффективности работы модели;

обучения нечёткой нейронной сети на множестве обучающих выборок.

Методы исследования. Для решения обозначенных вопросов использованы методы математического моделирования, нечёткой логики, искусственных нейронных сетей, мягких вычислений.

Достоверность полученных результатов. Предложенные в диссертационной работе модели и алгоритмы обоснованы теоретическими решениями и не противоречат известным положениям других авторов. Практическая апробация и внедрение в промышленную эксплуатацию результатов работы подтвердили эффективность метода формирования баз знаний экспертных систем.

Научная новизна работы заключается в следующем:

  1. предложена нейронечёткая модель формирования баз знаний экспертных систем в рамках нечётко-продукционной модели представления знаний;

  2. разработан алгоритм обучения нечёткой нейронной сети и правила инициализации её параметров;

  3. обоснованы критерии качества обучения нейронечёткой модели.

Теоретическая значимость работы заключается в разработке:

  1. модели, расширяющей возможности получения знаний для использования их в механизмах выводов экспертных систем;

  2. алгоритма настройки её параметров с точки зрения обучающей выборки.

Практическая ценность диссертационной работы заключается в разработке и реализации программного комплекса на базе нечёткой нейронной сети, производящего анализ статистических данных и формирующего систему нечётко-продукционных правил для их использования в экспертных системах.

По проблеме диссертационной работы опубликовано 18 работ, в том числе 1 статья в журнале из списка, рекомендованного ВАК РФ, 5 статей и 12 тезисов докладов.

С целью апробации основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях: международной конференции «Нечёткие множества и мягкие вычисления в экономике и финансах» (Санкт-Петербург, 2004); второй ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2004); седьмой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Санкт-Петербург, 2004); международной научно-методической конференции «Инновационное образование в техническом университете» (Казань, 2004); региональной научно-методической конференции «Профессиональные компетенции в структуре модели современного инженера» (Нижнекамск, 2005); третьей ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2005); международной молодёжной научной конференции «Туполевские чтения», посвящённой 1000-летию города Казани (Казань, 2005); четвёртой ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2006).

Реализация результатов работы. Результаты исследования:

внедрены в промышленную эксплуатацию в виде системы предупреждения аварийных ситуаций в процессах поддержания пластового давления, решающей задачу оперативного выявления утечек из водоводов;

использованы при построении базы знаний экспертной диагностической системы в вертеброневрологии на данных развития и особенностей клинических проявлений остеохондроза поясничного отдела позвоночника;

внедрены в учебный процесс Казанского государственного технического университета им. А.Н. Туполева и используются при изучении материалов дисциплины «Математические основы человеко-машинных систем»;

внедрены в учебный процесс Нижнекамского химико-технологического института и используются при изучении материалов дисциплины «Системы искусственного интеллекта».

Пути дальнейшей реализации. Созданный программный комплекс планируется использовать в составе мягких экспертных систем как инструмент эксперта для формирования и динамического пополнения баз знаний. Оптимизацию системы правил перспективно проводить на базе генетических методов.

На защиту выносятся следующие результаты:

нейронечёткая модель формирования баз знаний экспертных систем;

алгоритм её обучения и правила инициализации параметров;

программный комплекс для автоматизации формирования нечётко-продукционных правил из набора статистических данных.

Структура и объём диссертации. Диссертация изложена на 194 страницах машинописного текста, содержит 62 рисунка, 7 таблиц, состоит из введения, четырёх глав, заключения, списка использованной литературы из 93 наименований на 9 страницах и 2 приложений на 20 страницах.

Сведения о личном вкладе автора. Разработана нейронечёткая модель формирования баз знаний экспертных систем, предложен алгоритм её обучения, реализован программный комплекс на базе нечёткой нейронной сети, проведены прикладные исследования при работе с комплексом для оценки эффективности использования нейронечёткой модели в решении практических задач.

Разработана и реализована система предупреждения аварийных ситуаций на водоводах НГДУ «ДжалильНефть» ООО «ТатНефть». Проведена опытная эксплуатация системы, разработан план мероприятий по внедрению в промышленную эксплуатацию. Предложена методика оперативного обнаружения утечек из водоводов, реализованная в программном комплексе.

Разработаны этапы последовательного интеллектуального анализа разнотипных медицинских данных. В рамках данных этапов проведён анализ статистических данных диагностики поясничного остеохондроза. Выявлены значимые признаки и их группы, оказывающие максимальное влияние на тяжесть течения заболевания. Подготовлены обучающие выборки и проведено обучение нечёткой нейронной сети с получением системы правил.

Методы и системы анализа данных

Существование «скрытых» знаний обусловлено большими объёмами накопленных данных, которые человек просто не в состоянии обработать. Для обнаружения этих знаний используются специальные методы интеллектуального анализа данных Data Mining, что буквально означает «добыча данных». В широком смысле Data Mining - это процесс исследования и обнаружения средствами и алгоритмами искусственного интеллекта в данных ранее неизвестных, нетривиальных, практически полезных и доступных для интерпретации человеком скрытых закономерностей [50].

Классы систем Data Mining возникли и развиваются на базе разработок в области баз данных, прикладной статистики и систем искусственного интеллекта и призваны решать следующие основные задачи анализа [36].

Классификация, то есть определение класса объекта по его характеристикам. В этой задаче множество классов, к которым может быть отнесён объект, заранее известно.

Регрессия, подобно задаче классификации, позволяет определять по известным характеристикам объекта значение некоторого его параметра. Однако, в отличие от первой задачи, значением параметра является не конечное множество классов, а множество действительных чисел. В этом контексте регрессия применяется, главным образом, для обнаружения числовых зависимостей в данных.

Поиск ассоциативных правил - нахождение частых зависимостей между объектами или событиями, которые представляются в виде правил и могут быть использованы как для лучшего понимания природы анализируемых данных, так и для предсказания появления событий.

Кластеризация, заключающаяся в поиске независимых групп (кластеров) и их характеристик во всём множестве анализируемых данных. Решение данной задачи позволяет лучше понять данные, сгруппировать однородные объекты и, следовательно, облегчить анализ.

Для решения этих и других задач наиболее часто используются такие инструментальные средства Data Mining, как статистические пакеты, нейронные сети, эволюционные методы, алгоритмы поиска логических связей и закономерностей, а также гибридные модели, сочетающие в себе достоинства различных технологий [50].

Исторически первыми методами явились статистические пакеты, реализованные на базе проработанных алгоритмов прикладной статистики. Однако, из-за сохранившегося в них усреднения всех характеристик выборки, большинство этих методов не в состоянии давать приемлемые результаты при решении сложных практических задач. К тому же требования к специальной подготовке пользователей этих систем сужают круг их применения.

Искусственные нейронные сети возникли по аналогии с биологическими основами естественного интеллекта и позволяют проектировать системы, способные к обучению и самоорганизации [44]. Для предсказания значения целевого показателя используются наборы входных переменных, математических функций активации и весовых коэффициентов входных параметров. Выполняя активный обучающий цикл, нейронная сеть модифицирует весовые коэффициенты до тех пор, пока предсказываемый выходной параметр не будет соответствовать требуемому значению с определённой степенью точности. После обучения нейронную сеть можно использовать в качестве модели для прогнозирования новых данных. Основным недостатком нейронных сетей является необходимость наличия большого объёма обучающей выборки. Кроме того, любая нейронная сеть представляет собой «чёрный ящик» и знания в виде нескольких сотен весовых коэффициентов, полученных с её помощью, не поддаются анализу и интерпретации.

В эволюционном подходе искомая зависимость целевой переменной от других переменных моделируется несколькими вариантами алгоритмов, из которых выбирается тот, который воспроизводит зависимость более точно. Найденные зависимости представляются пользователю в виде математической формулы или таблицы.

Алгоритмы поиска логических связей и закономерностей выявляют причинно-следственные связи в данных. Правила, представленные в форме "если условия , то заключение ", можно использовать для прогнозирования или оценки неизвестных параметров (значений). На основании частоты встречаемости логических закономерностей делается вывод о полезности какой-либо их комбинации для установления ассоциации в данных, их классификации, прогнозирования и т.д. Недостатком данного метода является накладываемое ограничение на максимальную длину правил. К тому же поиск простых логических событий в начале работы производится эвристически.

Идентификация параметров и слоев нейронной сети

Структура разработанной нечёткой нейронной сети однозначно определяется следующим множеством параметров [58]: 1) количеством нейронов во входном слое; 2) количеством выходных нейронов; 3) числом градаций входных нейронов; 4) алгоритмом нечёткого логического вывода на модели (1). Первые три параметра задают количество нейронов в соответствующих слоях нейронной сети. Последний параметр определяет число слоев сети, а также их функциональность.

В соответствии с алгоритмом логического вывода на нечётко-продукционной модели (1) нейронная сеть имеет пять слоев, отличающихся по функциональности и по количеству нейронов в них.

Множество входных нейронов образует нулевой (распределительный) слой и содержит Р-нейроны. Обозначим это множество Р = {Pj }, где ip =\,пР , rip - количество Р-нейронов. Нейроны данного слоя выполняют функцию распределения входных сигналов, которые поступают на входы соответствующих нейронов первого слоя.

Входные сигналы нейронной сети являются значениями лингвистических переменных и могут образовывать такие нечёткие градации, как «малый», «средний», «большой». Число градаций в общем случае может быть любым, что определяет степень точности и простоту интерпретируемости решаемой задачи. Однако на практике чаще всего используют количество градаций для лингвистических категорий, равное 3, 4, 5 [89]. Обозначим ng - число градаций входных нейронов. Тогда значением лингвистической переменной, соответствующей Pt -му нейрону сети, будет A; j , где ig =\,ng.

Множество Л-нейронов образует первый слой нейронной сети. Обозначим это множество А = {Аід}, где іА =\,пА, пА - количествоЛ-нейронов. Нейроны данного слоя моделируют функции принадлежности нечётких ограничений (градаций), соответствующих входным значениям сети. Выходами А-нейронов являются значения функций принадлежности, определяющие степень срабатывания условных частей правил. Следует заметить, что количество А-нейронов равно произведению числа входов сети на число градаций, то есть nA=nP ng.

С каждым Л-нейроном связан параметр wu є[0..1], определяющий вес (важность) ограничения Аірі на входное значение Pi -го нейрона. Использование данного параметра в нечётко-продукционных правилах повышает гибкость механизма логического вывода при решении прикладных задачі

Второй слой нейронной сети состоит из Я-нейронов, каждый из которых определяет условные части правила с пР нечёткими антецедентами, соответствующими одной из градаций всех входных значений сети. Совокупность И-нейронов образует полную систему правил, каждое из которых в общем случае может быть вырожденным.

Определение. Вырожденным будем называть такое правило, которое, как и все другие правила, определяется соответствующими входами, градациями и выходом нейронной сети, но не имеет ни одного шаблона в обучающей выборке данных.

Будем обозначать И = {Иі } - множество правил, полученных из всевозможных комбинаций входов Р. г и соответствующих им градаций Aipi , состав ляющих нейроны второго слоя сети, где іИ =\,пИ, пИ - количество Я нейронов. По определению, nM=rig .

Входами Я-нейронов являются выходы соответствующих нейронов предыдущего слоя. Выход определяет оценку степени срабатывания всех условий правила. Данная оценка характеризует удовлетворение значений нейронов Р{ ограничениям Aipi .

В третьем слое сети, содержащем то же количество Cowp-нейронов, что и в предыдущем слое, рассчитывается комплексная оценка - коэффициент достоверности решения, равный произведению оценок степени срабатывания условий правила SR , получаемой на выходе нейрона второго слоя, и степени доверия к принятому решению SD , значение которой рассчитывается и поступает извне. Множество Со/яр-нейронов будем обозначать С = {СІ }, где ic =\,пс, пс - количество Cow/7-нейронов.

Четвёртый слой содержит пт выходных Г-нейрона, каждый из которых связан со всеми нейронами предыдущего слоя. Выходами нейронов являются взвешенные нормированные оценки общего коэффициента достоверности решения, получаемого в результате скалярного произведения нормированных значений выходов Com/7-нейронов и весов связей данных нейронов с выходами нейронной сети Т; єТ (іт = \,пт ). Заметим, что множество выходных нейронов соответствует множеству выходных переменных из обучающей выборки, принимающих только бинарные значения.

Пример функционирования нейронной сети

В данной главе проводится исследование алгоритма обучения нечёткой нейронной сети. Описывается разработанное программное обеспечение, его назначение и пример функционирования. Изучаются режимы работы нечёткой нейронной сети, а также возможность её использования в составе мягких экспертных систем. Проводится сравнение используемых функций принадлежности по критериям «скорость обучения» и «точность аппроксимации». Анализируется временная сложность вычисления при обучении нейронной сети. Исследуется влияние пропущенных значений во входных данных на качество её обучения.

Для решения задачи аппроксимации функциональных зависимостей в экспериментальных данных нечёткими правилами продукций разработан программный комплекс «Нечёткая нейронная сеть» {Fuzzy Neural Network), реализованный в среде программирования высокого уровня Borland Delphi 6.0.

Достоинством нейронной сети является возможность описания зависимостей типа «количественный вход - бинарный выход» в виде нечётких правил продукций, что позволяет использовать её во многих предметных областях, в которых изменения значений количественных параметров приводят к определённому результату.

К таким областям знания можно отнести медицину (процессы постановки медицинских диагнозов, прогноз развития заболевания), нефтяную отрасль (выбор геолого-технических мероприятий для наилучшего способа воздействия на нефтяную залежь), промышленность (диагностика оборудования), информационную безопасность (системы распознавания атак, разграничение доступа, фильтрация «спамовых» почтовых сообщений) и др.

Приведённые примеры говорят о достаточно широкой потенциальной применимости нечёткой нейронной сети, как модели формирования баз знаний для экспертных систем. В четвёртой главе рассмотрены интеллектуальные системы, при разработке которых нейронная сеть прошла свою апробацию и показала хорошие результаты при формировании баз знаний этих систем.

Рассмотрим процессы функционирования нечёткой нейронной сети на примере данных медицинской диагностики. Пусть имеется обучающая выборка, включающая условия, при которых наблюдалось появление тех или иных признаков у больных с остеохондрозом поясничного отдела позвоночника. Необходимо при помощи нейронной сети сформировать систему правил, описывающих совокупное влияние входных параметров модели на её выходы.

Пусть входами нейронной сети будут следующие параметры: 1 - возраст пациента на момент обследования (в годах); 2 - стаж заболевания (в годах); 3 - стаж динамических физических нагрузок (в годах); Выходы нейронной сети: 1 - наличие грыжи межпозвонкового диска; 2 - наличие грыж Шморля; 3 - наличие гипертрофии жёлтой связки на изучаемом уровне; 4 - наличие протрузии межпозвонкового диска; 5 - наличие вакуум-феномена межпозвонкового диска.

Фрагмент файла с данной обучающей выборкой представлен на рис. 3.1, где первые три столбца содержат значения входных количественных параметров, последние пять - значения бинарных выходов.

После подготовки обучающей выборки, определения структуры нейронной сети, задания параметров обучения и критериев его остановки создаётся готовая к обучению нечёткая нейронная сеть (подробнее о процессах подготовки нейронной сети к обучению см. в приложении I).

Обучение нейронной сети сопровождается отображением информации о текущих значениях таких параметров, как скорость обучения, время обучения, значение выхода сети и средняя ошибка выхода. Кроме того, на графике (см. рис. 3.2) строится кривая зависимости изменения ошибки выхода нейронной сети (по оси ординат) от количества эпох (циклов) обучения (ось абсцисс). Итогом обучения нейронной сети является сформированная система нечётко-продукционных правил следующего вида: RuleJ.IF «Возраст пациента» = «средний» (вес=0,5098) «Стаж заболевания» = «малый» (вес=0,7254) «Стаж динамических физических нагрузок» = «малый» (вес=0,745) THEN «Возможно наличие грыжи диска» (CF=0,25483871) Rule_2. IF «Возраст пациента» = «средний» (вес=0,4571) «Стаж заболевания» = «малый» (вес=0,5952) «Стаж динамических физических нагрузок» = «малый» (вес=0,6857) THEN «Возможно наличие грыж Шморля» (CF=0,4047619) RuleJ. IF «Возраст пациента» = «средний» (вес=0,4833) «Стаж заболевания» = «средний» (вес=0,6041) «Стаж динамических физических нагрузок» = «большой» (вес=0,5166) THEN «Возможно наличие гипертрофии жёлтой связки» (CF=0,47123288) Rule_4. IF «Возраст пациента» = «средний» (вес=0,4671) «Стаж заболевания» = «большой» (вес=0,5855) «Стаж динамических физических нагрузок» = «большой» (вес=0,6118) THEN «Возможно наличие протрузии межпозвонкового диска» (CF=0,6310231) RuleJ. IF «Возраст пациента» = «пожилой» (вес=0,7142) «Стаж заболевания» = «средний» (вес=0,4761) «Стаж динамических физических нагрузок» = «средний» (вес=0,4285) THEN «Возможно наличие вакуум-феномена» (CF=0,18181818) В данном случае входные параметры могут принимать три нечётких градации, соответствующие лингвистическим категориям типа «малый», «средний», «большой». Причём каждое нечёткое ограничение моделировалось треугольными функциями принадлежности, которые после обучения нейронной сети приняли вид, как показано на рис. 3.3.

Построение базы знаний системы медицинской диагностики

Глобальная информатизация стимулировала разработку в медицине автоматизированных экспертных диагностических систем нового поколения. Такие системы способны не только решать поставленные перед ними задачи на основе жёстко прописанных алгоритмов, но и анализируя огромные массивы данных, самостоятельно пополнять и оптимизировать набор правил, динамически формировать базу знаний, находить новые пути решения задач и объяснять предлагаемые варианты решения. В общем случае медицинская экспертная система должна [59]: 1) оценивать достоверность внутренней непротиворечивости полученных данных о пациенте; 2) анализировать разнообразную информацию, отражающую неформализованные знания специалистов; 3) интерпретировать данные на основе медицинского знания, которым располагает система, и сводить огромное количество возможных ситуаций в пространстве признаков к небольшому числу типовых, по которым формируются решения; 4) выдавать рекомендации по оптимальному плану дообследования пациента при недостаточно высокой уверенности в предлагаемом диагнозе; 5) прогнозировать естественный ход болезни на основе экстраполяции в пространстве типовых ситуаций; 6) рекомендовать план лечения в соответствии с гипотезой о предполагаемом диагнозе; 7) объяснять и обосновывать предлагаемые решения.

Выполнение этих требований возможно только на основе использования современного математического аппарата анализа медицинских данных, максимально приближенного к принципам работы нейронов головного мозга человека, системам использования механизмов памяти, хранения и извлечения информации из памяти человека по системе вероятности зависимостей событий.

Анализ медицинских данных возможен только при наличии большого клинического опыта врача, представляющего собой накопленную в результате клинической деятельности и изучения литературы медицинскую информацию, хранящуюся в механизмах памяти в вероятностной связи различных клинических, параклинических и статистических признаков. Чем больше опыт врача, тем большим количеством информации он оперирует, принимая экспертное решение. Например, знающий всего о нескольких заболеваниях студент производит диагностический выбор лишь между ними. При этом количество анализируемых признаков может быть ограничено, а процесс диагностики быстрым. Но вероятность ошибки при этом максимальна. Опытный врач в подобном случае анализирует признаки порою нескольких десятков или даже сотен заболеваний, их форм, этапов развития. При этом для анализа гигантского количества признаков требуется большое время, но точность такой диагностики возрастает.

Одной из главных сложностей диагностического процесса в медицине является необходимость коррекции диагноза во времени из-за движущегося, непрерывно развивающегося процесса заболевания. При этом измеряемые и оцениваемые параметры могут меняться в течение короткого промежутка времени. Учёт особенностей настоящего изменения признаков и прогноз будущего их изменения требует отдельного опыта врача: способности видеть и предвидеть патологический процесс в развитии, то есть во времени. Эта особенность многократно увеличивает объём подлежащей анализу медицинской информации.

Вторая сложность сбора и анализа медицинской информации состоит в необходимости проведения лабораторных, аппаратных измерений с применением различной техники, разработки методов для эксперимента на животных, изучения динамики параметров на очень больших клинических выборках со статистической обработкой. В связи с этим процесс сбора информации в медицине ограничен по ширине, поскольку проведение повторного измерения или эксперимента в тех же клинических условиях невозможно: в текущем во времени процессе повторные измерения характеризуют уже его новую точку или стадию развития. Поэтому неизбежны неточности в медицинских данных, пропущенные или несогласованные значения параметров.

Третья сложность заключается в индивидуальности медицинского опыта специалиста-эксперта, минимальной стандартизации личных ощущений, впечатлений, мнений врача, несовпадении оценок значимости одних и тех же признаков разными специалистами. В связи с этим сложно сравнивать результаты таких медицинских исследований. Только оптимизация процесса сбора информации в медицине с применением автоматизированных систем измерения, анализа данных позволяет максимально уточнить процесс диагностики.

Похожие диссертации на Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем