Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Дистанционная диагностическая система на основе гибридных моделей знаний Ле Виен Нгуен

Дистанционная диагностическая система на основе гибридных моделей знаний
<
Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний Дистанционная диагностическая система на основе гибридных моделей знаний
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ле Виен Нгуен. Дистанционная диагностическая система на основе гибридных моделей знаний: диссертация ... кандидата технических наук: 05.13.01 / Ле Виен Нгуен;[Место защиты: Волгоградский государственный технический университет].- Волгоград, 2015.- 123 с.

Содержание к диссертации

Введение

ГЛАВА I Анализ состояния исследований и разработок диагностических систем 13

1.1 Основные понятия области диагностики состояния объекта 13

1.2 Обзор основных подходов к проектированию диагностических систем 14

1.2.1 Диагностика с использованием методов математической статистики 14

1.2.2 Диагностика с использованием методов построения экспертных систем 15

1.3 Обзор технологий использования экспертных систем диагностики состояния объекта 17

1.3.1 Способы представления знаний 17

1.3.2 Средства приобретения знаний 20

1.3.3 Методы вывода диагностического решения 22

1.3.4 Средства объяснения решения 27

1.4 Обзор методологии и методов для интеллектуальной поддержки принятия решения 28

1.5 Обзор отечественных и зарубежных диагностических систем 29

1.6 Постановка задачи диагностики состояния объекта 33

Выводы по первой главе 35

ГЛАВА II Разработка моделей и методов построения дистанционной диагностической экспертной системы 36

2.1 Информационная модель дистанционной диагностической экспертной системы 36

2.2 База знаний 36

2.2.1 Фреймовая база знаний 37

2.2.2 Нечетко-продукционная база знаний 39

2.2.3 Построение базы знаний

2.3 Рабочая память 43

2.4 Приобретение знаний

2.4.1 Формирование базы данных 44

2.4.2 Проверка базы знаний 51

2.5 Механизм вывода диагностического решения 53

2.5.1 Генерация дополнительных вопросов по признакам при обратном выводе 54

2.5.2 Формирование диагностического заключения при прямом выводе

2.6 Объяснение решения 60

2.7 Пользовательский интерфейс 61

Выводы ко второй главе 62

ГЛАВА III Программная реализация дистанционной диагностической экспертной системы 63

3.1 Основные требования, предъявляемые к дистанционной диагностической экспертной системе 63

3.2 Выбор инструментальных средств разработки дистанционной диагностической экспертной системе 64

3.3 Информационные структуры дистанционной диагностической системы

3.3.1 Архитектура дистанционной диагностической системы 65

3.3.2 Диаграммы классов дистанционной диагностической системы 70

3.3.3 Базы данных дистанционной диагностической системы 75

3.4 Основные алгоритмы дистанционной диагностической системы 79

3.4.1 Алгоритм приобретения знаний 80

3.4.2 Алгоритм постановки диагноза 83

Выводы к третьей главе 86

ГЛАВА IV Испытание и внедрение дистанционной диагностической экспертной системы 88

4.1 Разработка системы для решения задачи медицинской предварительной диагностики 88

4.1.1 Задача медицинской предварительной диагностики в удаленном режиме 88

4.1.2 Расширение системы для решения задачи медицинской предварительной диагностики 94

4.2 Описание системы для решения задачи медицинской предварительной диагностики 98

4.3 Применение системы для решения задачи медицинской предварительной диагностики 100

Выводы к четвертой главе 102

Заключение 104

Список используемых источников 106

Диагностика с использованием методов математической статистики

Методы математической статистики решают следующие задачи анализа экспериментальных данных: описательная статистика; сравнение двух выборок; снижение размерности пространства признаков; исследование зависимостей между переменными; классификация. К теории классификации относятся классификация с учителем (дискриминантный анализ), классификация без учителя (кластерный анализ и группировка).

Дискриминантный анализ успешно применяется для решения задач диагностики (например, диагностика заболеваний в медицине). Обучающими выборками, для элементов которых известно, каким классам они принадлежат. Задача заключается в том, чтобы вновь появляющийся объект отнести к одному из этих классов. Если в дискриминантном анализе классы заданы, то кластеризация и группировка предназначены для выявления и выделения классов [2, 3]. Для исследования зависимости диагноза от входных факторов (результат анализ) необходимо построить математические модели на основе регрессионного анализа [4].

Другим из методов математической статистики в задачах диагностики является метод на основе байесовской вероятности, которая позволяет вычислить условную вероятность диагностических решений при данном наборе признаков на основании априорной вероятности диагноза и условной вероятности наблюдения признаков [5, 6]. При применении данного подхода можно выделить четыре следующих проблемы: - организационные трудности возникают при сборе, хранении и обработки больших объемов информации; - отсутствует возможность включать в модели информацию качественного характера; - подход не учитывает структурную сложность объектов диагностики и взаимовлияние разных факторов; - получаемые диагностические результаты напрямую не могут быть объяснены пользователям.

Экспертные системы (ЭС) отличаются от традиционных систем обработки информации использованием знаний. Знания - это закономерности предметной области, накопленные в результате практической деятельности человека (или человечества) [12]. В отличие от данных знания обладают пятами следующими свойствами [13, 14]: внутренняя интерпретируемость; структурированность; связанность; семантическая метрика; активность.

ЭС подразделяются на статические и динамические [15]. Статические ЭС не изменяются с течением времени решения задачи, а динамические изменяются, приспосабливаясь к изменениям окружающего мира. Большинство созданных ЭС, в том числе, относятся к первому классу. Как правило, ЭС состоит из следующих базовых компонентов [7, 8, 14, 15, 16]: база знаний; рабочая память; механизм вывода решения; объяснительный компонент; компонент приобретения знаний; пользовательский интерфейс.

ЭС работают в двух следующих режимах: приобретения знаний и решения задач. В режиме приобретения знаний эксперты наполняют базу знаний ЭС экспертными знаниями, которые обеспечивают возможность автоматизировать процесс принятия диагностического решения. В режиме «решения задачи» в процессе общения с ЭС пользователи получают диагностическое решение и его объяснение (если это необходимо) [17].

ЭС является компьютерными программами, способными эмулировать (имитировать, воспроизводить) те области деятельности человека, которые требуют мышления, определенного мастерства и накопленного опыта. При решении задач диагностики эффективность ЭС заключается в том, что они обладают описанными ниже общими достоинствами [18, 23]: - эффективность (решение ЭС на уровне компетентности, равной или более высокой по сравнению с экспертами); - производительность (вывод решения за приемлемое время в режиме реального времени); - надежность (не подвержено сбоям); - универсальность представления знаний (отображение декларативных и процедурных знаний); - возможность приблизительного вывода (определенная степень уверенности в том, что предложенного решение является верным); - возможность приобретения знаний экспертов (накопление практического опыта решения проблем); - доступность для понимания (объяснение предложенного решения, и его обоснованность); - способность вести диалог на естественном языке.

При разработке диагностических ЭС необходимо реализовать следующие этапы [15]: - идентификация (составление неформального описания цели, задач и выходных данных каждой поставленной задачи); - концептуализация (содержательный анализ области диагностики); - формализация (описание способов и моделей представления знаний и функционирования компонентов ЭС); - реализация (разработка компонентов ЭС и наполнение база знаний (БЗ)); - тестирование (проверка компетентности компонентов ЭС, и качества базы знаний для выявления недостатков и разработки средств их устранения); - опытная эксплуатация (проверка пригодности ЭС для пользователей). В ходе разработки диагностических ЭС приходится неоднократно возвращаться на более ранние этапы и пересматривать принятые там решения.

В разработке диагностических ЭС необходимо учитывать следующие аспекты: - эксперты (специалисты области диагностики) определяют знания, характеризующие область диагностики, и обеспечивают полноту и непротиворечивость базы знаний; - инженеры по знаниям (специалисты по разработке ЭС) помогают экспертам: выявить и структурировать знания, необходимые для работы ЭС; осуществить выбор того инструментального средства (ИС), и определить способ представления знаний в этом ИС; определить функционирование компонентов ЭС, которые используют знания, вводимые экспертами; - программисты (специалисты по разработке ИС) разрабатывают ИС, программируя все основные компоненты ЭС, и осуществляют их сопряжение с окружающей средой.

Нечетко-продукционная база знаний

Схема формирования базы знаний Для заполнения таблиц БЗ эксперт определяет основные понятия, описывающие область диагностики состояния исследуемого объекта и взаимосвязи между ними: диагнозы и их группы; отдельные признаки и их группы; комплексы признаков для диагнозов.

На следующем этапе эксперт определяет основные ЛП: переменные признаков - входные; переменные диагнозов - выходные. Для оценки значений ЛП используется единая качественная шкала: Н - низкий; НС - ниже среднего; С - средний; ВС - выше среднего; В - высокий. Соответствующие ЛТ представляют нечеткое множество, заданное с помощью соответствующих функций принадлежности (ФП). Функции принадлежности ЛП представлены в виде симметричных треугольных функций, которые описываются двумя параметрами (Ъ, с), где Ъ - центр ФП. В таблице 3 приведены числовые интервалы центров ФП в соответствии с оценками значений ЛП по вербально-числовой шкале Харрингтона [84]. Второй параметр («с») задается в числовом интервале [0.0; 1.0].

Для извлечения знаний из статистических данных (ИЗСД) строятся модели, которые описывают близость различных одновременно наблюдаемых категориальных характеристик и могут быть представлены в виде простых правил. В данном случае такими характеристиками являются диагнозы наблюдаемых у исследуемых объектов или их признаки. Для реализации данного подхода используются алгоритмы построения ассоциативных правил (АП), в частности алгоритм Apriori [85, 86, 87].

В общем случае АП имеет вид «Из множества характеристик «X» следует множество характеристик «Y»». Основными характеристиками АП являются «поддержка» и «достоверность» правила. Под «достоверностью» АП понимается доля транзакций из исходного множества, содержащих «X», которые также содержат «Y». А под «поддержкой» - доля транзакций из исходного множества, которые содержат пересечение множеств «X» и «Y».

Достоверность ассоциативного правила вычисляется по следующей формуле: c(X Y)=s(X Y)ls(X) (14) где: s(x- 7) - поддержка ассоциативного правила; s(X) - поддержка множества «X». Необходимо выполнить двухуровневую обработку данных следующим образом: - выявление зависимостей между множеством ЛП признаков и ЛП каждого диагноза; - выявление зависимостей между множеством ЛТ переменных признаков и ЛТ переменной каждого диагноза. Пусть имеется нормализованный вид множества транзакций для всех ЛП диагнозов, которые после предварительной обработки (см. таблицу 4).

Для каждой ЛП диагнозов необходимо определить одно АП, ранжировав сгенерированные правила в соответствии с их значимостью. Значимость одного правила вычисляется перемножением его значений поддержки и достоверности. Результаты первичной обработки применяются для дальнейшего этапа выявления зависимостей между ЛТ, переменных признаков и диагнозов, а также для расширения БЗ при появлении новых зависимостей между ЛП.

Сгенерированные правила, имеющие достоверность выше, чем у принятого минимального порога (60% и больше), составляют базу нечетких правил. В зависимости от значимости АП можно определить весовой коэффициент нечеткого правила, который характеризует его достоверность. Обучение нечетко-продукционной базы знаний (ОНПБЗ) осуществляется с применением генетического алгоритма [88, 89, 90, 91]. Для обучения необходимо сформировать базу обучающих выборок и базу обучающихся нечетких правил базы знаний.

Селекция хромосом, основанная на принципе колеса рулетки, заключается в выборе по вычисленным оценкам приспособленности хромосом для генерации очередного поколения. К хромосомам применяются три следующих оператора с определенной вероятностью: скрещивание; мутация и инверсия [93].

Для формирования новой популяции необходимо сокращение популяции до исходного количества хромосом с применением оператора редукции. Процесс обучения считается законченным, если достигнуто пороговое значение оценки приспособленности хромосомы или достигнуто ограничение на максимальное число эпох функционирования, т.е. не превышен заданный порог для числа эпох.

После обучения выбирается лучшая хромосома с максимальной оценкой приспособленности, которая после декодирования используется для формирования БЗ.

В предлагаемом способе построения БЗ ошибки в экспертной информации ведут к возникновению противоречий как в составлении комплексов признаков для диагнозов, так и в экспертной оценке проявления признаков при наличия диагнозов. Проверка базы знаний (ПБЗ) предназначена для поиска и исключения противоречий. Для этого необходимо сопоставлять информацию, получаемую от эксперта, с полученной ранее и проверять их на непротиворечивость. В задачу поиска и исключения противоречий входит выявление следующих правил: - конфликтные правила (два разных диагноза имеют схожие комплексы признаков); - избыточные правила (одинаковые комплексы признаков присутствуют у сходных диагнозов).

Каждый комплекс признаков для диагноза представляет собой дескриптивное множество, каждому элементу которого поставлено в соответствие путем экспертной оценки силы проявления признака при наличии диагноза. Для количественного определения степени сходства двух комплексов признаков применяется бинарный коэффициент сходства Кульчинского [94], значения которого находятся в диапазоне от «О» (сходство отсутствует) до «1» (полное сходство).

Выбор инструментальных средств разработки дистанционной диагностической экспертной системе

Класс InferenceEngine реализует механизм вывода диагностического решения на БЗ, реализуемой классом Knowledgebase, и РП - классом WorkingMemory.

Вывод решения начинается с генерации дополнительных вопросов, реализуемой классом BackwardChain, и заканчивается формированием диагностического заключения, реализуемого классом ForwardChain.

Класс BackwardChain содержит методы по выделению основных диагнозов, реализуемых классом Candidate, и запросу оценки силы проявления ведущего признака. Класс ForwardChain содержит методы по сопоставлению, разрешению конфликта, срабатыванию, действию для получения диагностических гипотез.

Класс ReteNetwork реализует RETE-сеть, и содержит метод по обработке фактов, реализуемых классом Fact, при поступлении этих элементов в рабочую память.

Класс ExplanationFacility реализует объяснение решения, и содержит метод по добавлению в журнал протокола вывода, реализуемое классом State, и метод по формированию объяснений на основании предшествующих признаков.

Класс Building реализует пополнение БЗ, и содержит методы по добавлению, удалению и изменению сведений о диагнозах, реализуемых классом Diagnosis, отдельных признаках - классом Symptom, группах диагнозов - классом DiagnosisGroup, группах признаков - классом SymptomGroup, и комплексах признаков для диагнозов - классом SymptomComplex.

Класс Mining реализует извлечение знаний из статистических данных, содержит метод по первой обработки для получения АП, реализуемых классом AssociationRule, метод по фильтрации статистических записей, реализуемых классами DiagnosisRecord и SymptomRecord, методы по второй обработки для получения АП, реализуемых классами DiagnosisRule и SymptomRule, и метод по их сохранения для дальнейшего обучения Ш1БЗ.

Класс Learning реализует обучение Ш1БЗ, и содержит методы по созданию и загрузке обучающихся Ш1БЗ, реализуемых классом RuleBase, и метод, обучающий базу имеющихся НПБЗ на базе обучающих выборок, реализуемых классом Sample, с генетическим алгоритмом, реализуемым классом GAs.

Класс Initialization реализует инициализацию параметров и коэффициентов НПБЗ, соответствующей хромосоме-особи, реализуемой классом Chromosome. Преобразование кодов Грея реализуется классом GrayCoder.

Класс Testing реализует проверку БЗ, и содержит метод, выполняющий цикл проверки для каждого имеющегося комплекса признаков, методы по модификации вновь рассматриваемого и создаваемого комплекса признаков, и метод по добавлению создаваемого комплекса признаков в БЗ.

Класс Administration реализует администрирование, и содержит методы по добавлению, удалению, изменению сведений о пользователях-экспертах.

База данных ДДЭС состоит из таблиц, которые можно разделить на четыре основных категорий: экспертных данных; статистических данных; ассоциативных правил; обучающихся НПБЗ; данных пользователей.

В первую категорию «экспертных данных» входят пять следующих таблиц: - таблица Diagnosis содержит список диагнозов (название, описание, диапазон допустимых оценок, группа диагнозов); - таблица DiagnosisGroup содержит список групп диагнозов (название, описание); - таблица Symptom содержит список отдельных признаков (название, описание, диапазон допустимых оценок, группа признаков); - таблица SymptomGroup содержит список групп признаков (название, описание); - таблица SymptomComplex содержит список комплексов признаков для диагнозов (диагноз, отдельный признак, оценка силы проявления признака при наличии диагноза, пользователь-эксперт задающий комплекс признаков для конкретного диагноза).

Во вторую категорию «статистических данных» входят два следующих таблицы: - таблица DiagnosisRecord содержит список диагнозов в статистической записи для извлечения знаний (ЛТ переменной «диагноза»); - таблица SymptomRecord содержит список признаков в статистической записи для извлечения знаний (ЛТ переменной «диагноза», ЛТ переменной «признака»).

В третью категорию «АП» входят два следующих таблицы: - таблица DiagnosisRule содержит список диагнозов из заключения АП, описывающих зависимости между ЛТ переменных (ЛТ переменной «диагноза», достоверность, поддержка, весовой коэффициент НИИ сгенерированного АП после обучения); - таблица SymptomRule содержит список признаков из предпосылки АП, описывающих зависимости между ЛТ переменных (диагноз из заключения АП, ЛТ переменной «признака»).

В четвертую категорию «обучающихся НПБЗ» входят шесть следующих таблиц: - таблица DiagnosisTerm содержит список ЛТ переменных «диагнозов» (диагноз, название ЛТ, параметры ФП после обучения); - таблица SymptomTerm содержит список ЛТ переменных «признаков» (признак, название ЛТ, параметры ФП после обучения). - таблица RulesBase содержит список обучающихся НПБЗ (оценка приспособленности); - таблица DiagnosisParams содержит список параметров ФП ЛТ переменных «диагнозов» (обучающаяся НПБЗ, диагноз, ЛТ переменной диагноза, параметры ФП); - таблица SymptomParams содержит список параметров ФП ЛТ переменных «признаков» (обучающаяся НПБЗ, ЛТ переменной признака, параметры ФП); - таблица RuleCertainty содержит список сгенерированных НЛП (обучающаяся НПБЗ, диагноз из заключения АП, весовой коэффициент НЛП). В пятую категорию «данных пользователей» входит таблица Users, которая содержит список пользователей (Ф.И.О., контактные данные); Для предотвращения конфликтов с другими модулями веб-приложения, каждая таблица имеет префикс VirtualHelper. На рисунке 16 представлена схема базы данных ДДЭС.

Задача медицинской предварительной диагностики в удаленном режиме

DeferredAdviceLibrary отвечает за отсроченную консультацию. Класс DeferredAdvice реализует отсроченную консультацию, и содержит методы по загрузке списка отправленных анкет, реализуемых классом Questionnaire, и методы по обновлению и добавлению в базу данных новой статистической записи. Отправленная анкета включает в себя анкеты пациента, реализуемую классом Patient, анкету симптоматики - классом Examination, и результат предварительного диагноза - классом Solution.

AdministrationLibrary отвечает за управление сведениями о врачах, и также лечебно-профилактических учреждениях. Класс Administration реализует администрирование, и содержит методы по добавлению, удалению, изменению сведений о врачах, реализуемых классом Doctor, и информации о клиниках -классом Clinic.

И также в схему базы данных добавлены их две соответствующие категории таблиц данных: отсроченной консультации; данных врачей.

В категорию «отсроченной консультации» входят пять следующих таблиц: - таблица Patient содержит список пациентов (имя, электронная почта, пол, возраст, время последнего обращения); - таблица Examination содержит список анкет симптоматики (пациент, симптом, оценка проявления признака); - таблица Solution содержит список предварительных диагнозов (заболевание, оценка обнаружения диагноза, объяснительная информация); - таблица Questionnaire содержит список отправленных анкет (пациент, специальность, диагностическое решение, время отправления, отметка ответа); - таблица Request содержит список ответов врачей-специалистов на отправленные анкеты (отправленная анкета, диагностическое решение, врач-специалист, время отправления). В категорию «данных врачей» входят три следующих таблицы: - таблица Users содержит список пользователей (Ф.И.О., контактные данные); - таблица Clinic содержит список лечебно-профилактических учреждений (название, адрес); - таблица Doctor содержит список врачей (пользователь, специальность, лечебно-профилактическое учреждение, режим работы).

На рисунке 16 описана связь таблиц два приведенных категорий следующим образом: таблица Doctor совместно с таблицами Users, Specialist, Clinic используется для определения сведения о конкретном враче; таблица Questionnaire совместно с таблицами Specialist, Patient, Examination, Solution используется для определения отправленной анкеты; таблица Request совместно с таблицами Questionnaire и Doctor используется для определения ответа врача-специалиста на отправленную анкету. Процедура ДДЭС МПД в рабочем режиме представлена последовательностью шагов: Шаг 1. Выполнить аутентификацию пациента (ввод имени и адреса электронной почты для обратной связи). Шаг 2. Заполнить анкеты «личных данных» и «истории болезни» пациента (ввод возраста, пола, профессии, места работы и др.) Шаг 3. Заполнить последовательно анкету «симптоматики», на основании которой поставить предварительный диагноз. Шаг 4. Выбрать режим работы: Шаг 4.1. Поддержать врача-терапевта, принимающего решение для дальнейшего обследования. Шаг 4.2. Выбор варианта пациента: а) Результат предварительного диагноза не принят. Отправить анкеты пациента врачу-специалисту для отсроченной консультации. б) Результат предварительного диагноза принят. Порекомендовать пациенту запись на прием к врачу-специалисту. Шаг 4.3. Обучить студентам-медикам предварительной диагностике. Процедура ДДЭС МПД в режиме отсроченной медицинской представлена последовательностью шагов: Шаг 1. Выполнить авторизацию врача-специалиста (ввод логина и пароля). Шаг 2. Загрузить список отправленных анкет по соответствующей специальности. Шаг 3. Для каждой отправленной анкеты проверить анкеты пациента: а) Если анкеты приняты, то сформировать и записать новое диагностическое заключение в базу данных, тогда отправить письмо пациенту по указанной электронной почте. б) Если анкеты не приняты, то направить ее врачам по предлагаемой узкой специальности. 4.2 Описание системы для решения задачи медицинской предварительной диагностики В состав разработанной системы входят семь следующих подсистем: пополнения БЗ; извлечения знаний из статистических данных; обучения НПБЗ; отсроченной консультации; онлайн-консультации; справочников; администрирования. Подсистема пополнения БЗ реализует следующие функции: - заполнение таблиц основных понятий области медицинской диагностики; - задание функций принадлежности ЛТ переменных.

Подсистема извлечения знаний из статистических данных предназначена для выявления взаимосвязей между ЛП «симптомов и заболеваний» и их ЛТ, на основании которых сформированы ИЛИ.

Похожие диссертации на Дистанционная диагностическая система на основе гибридных моделей знаний