Содержание к диссертации
Введение
1. Анализ предметной области и постановка задачи формирования базы знаний экспертной системы диагностики состояния сложного объекта 22
1.1. Понятие и назначение экспертных систем 22
1.2. Способы получения знаний для экспертных систем 26
1.3. Обнаружение знаний в базах данных 28
1.4. Классификация типов и видов данных для решения задачи диагностики состояния сложного объекта 31
1.5. Представление знаний в экспертной диагностической системе 33
1.5.1. Проблема представления знаний 33
1.5.2. Анализ моделей представления знаний в экспертных системах 34
1.5.3. Виды продукционных правил для решения задачи диагностики состояния объекта и их сравнительный анализ 40
1.6. Постановка задачи формирования базы знаний экспертной системы диагностики состояния сложного объекта 43
1.7. Выводы 44
2. Параметрическая нечетко-продукционная модель определения состояния сложного объекта 46
2.1. Разработка методики группировки параметров объекта
диагностики, входящих в состав продукционных правил 46
2.1.1. Постановка задачи группировки параметров 46
2.1.2. Методика группировки параметров сложного объекта 48
2.1.3. Особенности формируемых групп параметров 51
2.2. Предлагаемый вид нечетко-продукционных правил 52
2.3. Разработка методики построения совокупности систем продукционных правил, описывающих состояние объекта 54
2.3.1. Постановка задачи построения совокупности систем нечетко-продукционных правил 54
2.3.2. Методика построения совокупности систем правил 54
2.4. Разработка алгоритмов логического вывода на системах нечетко продукционных правил 57
2.4.1. Используемые термины и обозначения 57
2.4.2. Алгоритм логического вывода для несвязанной системы правил 58
2.4.3. Алгоритм логического вывода для связанных систем правил 60
2.4.4. Алгоритм логического вывода для совокупности систем правил 61
2.4.5. Достоинства алгоритмов логического вывода 62
2.5. Выводы 64
3. Модель и методы идентификации значений параметров нечетко продукционной модели определения состояния объекта 66
3.1. Постановка задачи идентификации значений параметров модели...66
3.2. Методы инициализации параметров модели 68
3.2.1. Определение начальных значений параметров функций принадлежности в правилах 68
3.2.2. Определение начальных значений достоверности правил 71
3.2.3. Определение начальных значений весов условий в правилах 72
3.3. Настройка значений параметров модели 73
3.3.1. Постановка задачи построения нейронечетких моделей определения состояния объекта 73
3.3.2. Построение структуры нечетких нейронных сетей 74
3.3.3. Обучение нечетких нейронных сетей 77
3.3.3.1. Определение выхода сети при известном входном образе 77
3.3.3.2. Определение параметров обучения сети 77
3.3.3.3. Требования по настройке вектора параметров функций принадлежности 79
3.3.3.4. Правила и ограничения при настройке вектора параметров функций принадлежности 84
3.3.3.5. Изменение значений вектора параметров функций принадлежности для заданного входного образа 85
3.3.3.6. Алгоритм обучения нечеткой нейронной сети 95
3.3.3.7. Временная сложность алгоритма обучения 97
3.4. Нейронечеткая модель, как универсальный аппроксиматор
объектов с дискретным выходом 99
3.4.1. Нечеткие системы, как универсальные аппроксиматоры 99
3.4.2. Алгоритм аппроксимации объектов с дискретным выходом на основе нечеткой базы знаний 101
3.4.3. Оценка аппроксимирующей способности разработанной нечеткой нейронной сети 106
3.5. Выводы 112
4. Технология формирования нечетких правил базы знаний и алгоритм их использования для диагностики 114
4.1. Особенности начального состояния базы знаний 114
4.2. Постановка задачи оценки и устранения избыточности начального состояния базы знаний 117
4.3. Методика оценки и устранения избыточности базы знаний 118
4.4. Технология формирования базы знаний экспертной системы 120
4.5. Использование правил базы знаний для диагностики состояния сложного объекта 122
4.6. Выводы 124
5. Программный комплекс формирования и использования нечетких правил для диагностики состояния сложных объектов 126
5.1. Описание разработанного программного комплекса 126
5.1.1. Назначение программного комплекса 126
5.1.2. Средства разработки программного комплекса 128
5.1.3. Структура и состав программного комплекса 129
5.1.4. Пример функционирования программного комплекса 133
5.2. Оценка классифицирующей способности формируемых баз знаний при анализе известных наборов данных 140
5.2.1. Описание и предварительный анализ наборов данных 140
5.2.2. Результаты классификации исходных данных 143
5.2.3. Результаты классификации данных с пропущенными значениями. 147
5.3. Примеры практического использования программного комплекса для формирования баз знаний экспертных систем 149
5.3.1. Формирование базы знаний для диагностики клинических проявлений поясничного остеохондроза 149
5.3.1.1. Особенности диагностического процесса в медицине 149
5.3.1.2. Этапы медицинской диагностики 152
5.3.1.3. Исходные данные для анализа 154
5.3.1.4. Анализ и интерпретация полученных результатов 156
5.3.2. Формирование базы знаний для диагностики порывов на водоводах в процессах поддержания пластового давления 166
5.3.2.1. Общее описание системы 166
5.3.2.2. Особенности формирования базы знаний 170
5.3.2.3. Методика обнаружения утечек из водоводов 173
5.3.2.4. Полученные практические результаты 175
5.3.3. Формирование базы знаний для фильтрации электронных почтовых сообщений 176
5.3.3.1. Фильтрация электронных почтовых сообщений 176
5.3.3.2. Получение исходных данных и формирование базы знаний 777
5.3.3.3. Оценка адекватности сформированной базы знаний 180
5.3.3.4. Использование базы знаний в составе системы спам-филътрации 181
5.4. Сравнение программного комплекса с другими инструментальными средствами формирования нечетких правил 183
5.4.1. Анализ инструментальных средств построения систем нечеткого логического вывода 183
5.4.2. Анализ методов извлечения нечетких правил из баз данных, используемых в Rule Maker 186
5.5. Выводы 188
Заключение 191
Список литературы
- Классификация типов и видов данных для решения задачи диагностики состояния сложного объекта
- Разработка методики построения совокупности систем продукционных правил, описывающих состояние объекта
- Определение начальных значений весов условий в правилах
- Технология формирования базы знаний экспертной системы
Введение к работе
Актуальность проблемы.
Современный уровень развития науки и техники позволяет осуществлять моделирование сложных объектов, которые характеризуются:
наличием большого числа входов, выходов и состояний, полный учет которых либо нереален, либо резко увеличивает сложность модели;
разнотипностью описывающих параметров и нелинейным характером внутренних связей и закономерностей;
неопределенностью, нечеткостью и неполнотой данных на входе, выходе объекта и в переходе между его состояниями;
нечеткой выраженностью структуры, которая может изменяться в зависимости от ситуации.
Традиционные подходы, основанные на аппарате математической статистики или имитационном моделировании, не позволяют строить адекватные модели сложных объектов в условиях ограниченности временных, вычислительных и материальных ресурсов. Поэтому в последнее время при решении многих практических задач, связанных с управлением производственными процессами, распознаванием образов, диагностикой состояния сложных объектов, наблюдается повышение научного и практического интереса к методам и моделям искусственного интеллекта с применением технологий интеллектуального анализа данных.
Теория нечетких множеств, как одно из направлений искусственного интеллекта, позволяет строить нечеткие модели сложных объектов на естественном языке при помощи лингвистических переменных и механизма нечеткого логического вывода. В настоящее время методы нечеткой логики и разработанные на ее основе нечеткие экспертные системы (ЭС) широко применяются для решения задач диагностики, управления, поддержки принятия решений в различных предметных областях человеческой деятельности.
Исследованиям в области нечеткого моделирования и разработки нечетких ЭС посвящены работы известных зарубежных и российских ученых: Заде Л.А., Клира Дж., Мамдани Е.А., Сугено М., Тэрано Т., Кофмана А., Поспелова Д.А., Ларичева О.П., Аверкина А.Н., Борисова А.Н., Батыршина И.З., Еремеева А.П., Алиева Р.А., Берштейна Л.С., Ковалева СМ., Васильева В.И., Сидоркиной И.Г., Соловьева В.Д., Гловы В.П., Аникина И.В. и др. Однако, несмотря на достоинства нечетких ЭС, они имеют существенный недостаток: необходимость привлечения человека-эксперта для построения правил базы знаний (БЗ) и задания используемых в них функций принадлежности (ФП). Наиболее сложным этапом построения нечеткой системы является выбор формы и параметров ФП, так как из-за субъективности мнения эксперта построенные им ФП могут не вполне отражать реальную действительность. Кроме того, несмотря на возможность использования при разработке нечеткой ЭС технологий инженерии знаний и методов практического извлечения и структурирования знаний, процесс формулирования нечетких правил и задания ФП требует значительных временных затрат и большой аналитической работы эксперта, что существенно усложняет разработку ЭС.
В настоящее время существуют адаптивные модели нечеткого логического вывода, в которых параметры ФП настраиваются автоматически в процессе обучения на экспериментальных данных. Исследованиям в этой области посвящены
работы ученых: Херреры Ф., Фукуды Т., Карра Ч., Лозано М., Сакава М., Кордона О., Касиласа Ж., Хоффмана Ф., Янга Р., Круглова В.В., Ротштейна А.П., Штовбы С.Д., Финна В.К., Вагина В.Н., Кобринского Б.А., Загоруйко Н.Г., Ярушкиной Н.Г., Ходашинского И.А., Емалетдиновой Л.Ю., Паклила Н.Б. и др.
В технической литературе класс адаптивных нечетких ЭС получил название «мягкие экспертные системы». «Мягкий» подход к формированию нечетких баз знаний основан на использовании методов и алгоритмов интеллектуального анализа данных, автоматического (без участия эксперта) извлечения скрытых в них закономерностей. Однако, при моделировании сложных объектов, особенно в экспертных диагностических системах, необходимо учитывать большое количество параметров и их значений, что приводит к громоздкости формируемых нечетких правил и невысокой эффективности их практического использования. Кроме того, проблема выбора числа функций принадлежности в правилах, задания их границ и начальных значений параметров остается актуальной.
Для разрешения указанных проблем и повышения точности принятия решений в интеллектуальных системах диагностики состояния сложных объектов актуальна разработка нового подхода к формированию нечетких правил, адекватно описывающих закономерности в анализируемых данных. При построении диагностической системы целесообразно привлечение эксперта для решения задачи декомпозиции исходного множества параметров на подмножества, описывающие отдельные подсистемы объекта, их состояния и связи между ними. Кроме того, учет мнения эксперта необходим на этапе гранулирования значений входных параметров объекта, выбора числа и границ ФП, их инициализации.
Следовательно, при формировании нечетких правил в системах диагностики состояния сложных объектов анализ исходных данных целесообразно проводить в два этапа: автоматизированный (с участием эксперта) - для структурной идентификации модели объекта, и автоматический - для параметрической идентификации модели. Автоматизация начального этапа выявления скрытых закономерностей в данных должна повысить эффективность их анализа за счет сочетания достоинств методов машинного обучения (способности автоматически извлекать знания из данных) с интеллектуальными возможностями эксперта (его знаниями, опытом и пониманием особенностей решаемой задачи). Это позволит в конкретной предметной области сформировать адекватные базы нечетких правил для моделируемых объектов и повысить точность принимаемых решений.
Таким образом, научно-техническая проблема, решаемая в диссертации, заключается в разработке нового подхода и его методологии для автоматизированного формирования нечетких правил в интеллектуальных системах диагностики состояния сложных объектов. Решение данной проблемы имеет научный и практический интерес для построения нечетких моделей сложных объектов, повышения их адекватности и интерпретируемости.
Объект исследования: нечеткие базы знаний интеллектуальных систем диагностики состояния сложных объектов.
Предмет исследования: модели, методы и алгоритмы автоматизированного формирования нечетких правил.
Цель работы: повышение эффективности формирования нечетких правил в интеллектуальных системах диагностики состояния сложных объектов путем разработки методологии нового подхода, включающего теоретические положения,
модели, методы, критерии и алгоритмы, а также программный комплекс автоматизированного (с участием эксперта) анализа разнотипных, нечетких и неполных исходных данных для извлечения скрытых в них закономерностей. Эффективность сформированных систем правил оценивается их адекватностью и точностью принимаемых на их основе решений по диагностике состояния объектов. Достижение поставленной цели потребовало решения следующих задач:
-
построения параметрической нечетко-продукционной модели определения состояния сложного объекта на основе разработки методики группировки параметров объекта, вида нечетко-продукционного правила, методики построения совокупности систем правил, а также алгоритмов логического вывода на системах нечетко-продукционных правил;
-
идентификации значений параметров нечетко-продукционной модели определения состояния сложного объекта на основе разработки эффективных вычислительных методов с применением современных компьютерных технологий;
-
оценки и устранения избыточности начального состояния базы нечетких правил за счет разработки и применения эффективного численного метода редукции вырожденных и незначимых для определения состояния объекта правил;
-
разработки технологии автоматизированного формирования систем нечетко-продукционных правил с идентифицированными значениям параметров;
-
разработки алгоритма использования сформированных систем нечетко-продукционных правил для диагностики состояния сложного объекта;
-
реализации разработанных численных методов и алгоритмов в виде программного комплекса для формирования нечетких правил и проведения вычислительных экспериментов;
-
решения практических задач формирования нечетких правил для интеллектуальных диагностических систем в социальных и технических областях.
Методы исследования. Для решения обозначенных задач использованы методы математического моделирования, нечеткой логики, искусственных нейронных сетей, визуализации данных, корреляционного анализа, прикладной статистики, объектно-ориентированного программирования.
Достоверность полученных результатов. Предложенные в диссертационной работе оригинальные методики, модели, методы и алгоритмы теоретически обоснованы и не противоречат известным положениям других авторов. Достоверность полученных результатов обеспечена математически строгим выполнением расчетов, подтверждена вычислительными экспериментами и результатами практического использования.
Научная новизна работы заключается в разработке:
-
методики группировки параметров объекта для получения совокупности групп параметров «входы - выход» и определения структуры их взаимосвязей;
-
вида нечетко-продукционного правила для формализации четких и нечетких разнотипных зависимостей в анализируемых данных;
-
методики построения совокупности систем нечетко-продукционных правил, определяемых группами параметров «входы - выход», структурой их взаимосвязей и значениями (градациями) входных и целевого параметров;
-
алгоритмов логического вывода на системах нечетко-продукционных правил для определения состояния сложного объекта в условиях разнотипности, нечеткости и отсутствия части исходных данных;
-
параметрической нечетко-продукционной модели определения состояния сложного объекта в виде совокупности систем нечетко-продукционных правил и алгоритмов логического вывода на правилах;
-
эффективных вычислительных методов инициализации и настройки значений параметров нечетко-продукционной модели определения состояния сложного объекта: параметров функций принадлежности, весов условий и достоверности каждого нечетко-продукционного правила;
-
нейронечетких моделей - аналога нечетко-продукционной модели определения состояния объекта, в виде обученных нечетких нейронных сетей;
-
структуры нечетких нейронных сетей и эффективного алгоритма их обучения на комплектных и некомплектных обучающих выборках;
-
эффективного численного метода редукции вырожденных и незначимых для определения состояния сложного объекта правил на основе оценки и устранения избыточности начального состояния базы знаний;
10) алгоритма использования сформированных систем правил для диагно
стики состояния сложного объекта в режимах постановки и уточнения диагноза.
Теоретическая значимость диссертационной работы заключается в разработке методологии нового подхода и математического обеспечения в виде эффективных методик, алгоритмов и вычислительных методов автоматизированного формирования нечетких правил в интеллектуальных системах диагностики состояния сложных объектов.
Практическая ценность работы заключается в разработке технологии и программного комплекса, реализующего предложенные методы и алгоритмы автоматизированного формирования нечетко-продукционных правил для интеллектуальных систем диагностики состояния сложных объектов.
По проблеме диссертации опубликованы 63 работы, в том числе 1 монография, 16 статей в российских рецензируемых научных журналах, 4 статьи в других российских научных журналах, 37 публикаций в материалах научных семинаров и конференций, 1 статья в зарубежном научном журнале и 4 учебно-методических издания. Получено 1 свидетельство о регистрации программы для ЭВМ.
С целью апробации основные результаты диссертации докладывались и обсуждались на следующих конференциях: VII международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Санкт-Петербург, 2004); международной молодежной научной конференции «ХП Туполевские чтения» (Казань, 2004); международной научно-методической конференции «Инновационное образование в техническом университете» (Казань, 2004); П ежегодной международной научно-практической конференции «Инфо-коммуникационные технологии глобального информационного общества» (Казань, 2004); международной молодежной научной конференции «Туполевские чтения» (Казань, 2005); Ш ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2005); IV ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2006); I межвузовской научно-практической конференции «Современная торговля: теория, методология, практика» (Казань, 2007); V ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2007);
VI ежегодной международной научно-практической конференции «Инфокомму-никационные технологии глобального информационного общества» (Казань, 2008); П всероссийской научной конференции с международным участием «Нечеткие системы и мягкие вычисления» (Ульяновск, 2008); XI национальной конференции по искусственному интеллекту с международным участием «КИИ-2008» (Дубна, 2008); республиканской научно-практической конференции «Проблемы анализа и моделирования региональных социально-экономических процессов» (Казань, 2009); ХП международной конференции по мягким вычислениям и измерениям (Санкт-Петербург, 2009); международной научно-практической конференции «Проблемы социально-экономического развития города и села в условиях мирового экономического кризиса» (Казань, 2009); VII международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2009); П всероссийской научной конференции «Информационные технологии в системе социально-экономической безопасности России и ее регионов» (Казань, 2009); ХП международной конференции «Проблемы управления и моделирования в сложных системах» (Самара, 2010); П международной научно-практической конференции «Современные проблемы безопасности жизнедеятельности: теория и практика» (Казань, 2012); всероссийской научно-технической конференции «Проблемы и перспективы развития информационных технологий» (Казань, 2012); Ш всероссийской научно-практической конференции «Проблемы анализа и моделирования региональных социально-экономических процессов» (Казань, 2012); XVI международной конференции по мягким вычислениям и измерениям (Санкт-Петербург, 2013); XIV международной научно-технической конференции «Кибернетика и высокие технологии XXI века» (Воронеж, 2013); IV международной научно-практической конференции «Проблемы анализа и моделирования региональных социально-экономических процессов» (Казань, 2013); международной научно-практической конференции «Закономерности и тенденции развития науки в современном обществе» (Уфа, 2013); XVII международной конференции по мягким вычислениям и измерениям (Санкт-Петербург, 2014).
Реализация результатов работы. Результаты исследования:
внедрены в промышленную эксплуатацию в виде модуля автоматизированного формирования нечетких правил интеллектуальной системы диагностики порывов на водоводах в процессах поддержания пластового давления;
использованы при разработке экспертной системы предварительного выявления писем несанкционированной массовой рассылки для формирования базы знаний фильтрации электронных почтовых сообщений;
использованы для формирования нечетких правил диагностики клинических проявлений поясничного остеохондроза при разработке экспертной системы диагностики, прогнозирования и лечения остеохондроза поясничного отдела позвоночника;
внедрены в учебный процесс ФГБОУ ВПО «Казанский национальный исследовательский технический университет им. А.Н. Туполева-КАИ» и используются при изучении дисциплин «Технологии интеллектуального анализа данных», «Системы искусственного интеллекта», «Базы знаний интеллектуальных систем», «Модели приобретения и представления знаний».
Пути дальнейшей реализации. С целью развития методологии автоматизированного формирования нечетких правил принятия решений целесообразно совершенствование разработанного математического и программного обеспечения, расширение классов решаемых задач, а также разработка, внедрение и практическое использование интеллектуальных систем в других предметных областях.
На защиту выносятся следующие результаты:
-
методика группировки параметров объекта для получения совокупности групп параметров «входы - выход» и определения структуры их взаимосвязей;
-
вид нечетко-продукционного правила для формализации четких и нечетких разнотипных зависимостей в анализируемых данных;
-
методика построения совокупности систем правил, определяемых группами параметров «входы - выход», структурой их взаимосвязей и значениями (градациями) входных и целевого параметров, для построения параметрической нечетко-продукционной модели определения состояния сложного объекта;
-
алгоритмы логического вывода на системах нечетко-продукционных правил для определения состояния сложного объекта в условиях разнотипности, нечеткости и отсутствия части входных данных;
-
параметрическая нечетко-продукционная модель определения состояния сложного объекта в виде совокупности систем нечетко-продукционных правил и алгоритмов логического вывода на правилах;
-
методы инициализации и настройки значений параметров модели: параметров функций принадлежности, весов условий и достоверности правил;
-
нейронечеткая модель определения состояния сложного объекта: структура и алгоритм обучения нечетких нейронных сетей;
-
метод редукции вырожденных и незначимых для определения состояния сложного объекта нечетко-продукционных правил;
-
алгоритм использования сформированных систем правил для диагностики состояния сложного объекта в режимах постановки и уточнения диагноза;
10) технология и программный комплекс автоматизированного формирова
ния нечетких правил для диагностики состояния сложных объектов.
Структура и объем диссертации. Диссертация изложена на 257 страницах машинописного текста, содержит 78 рисунков, 25 таблиц, состоит из введения, пяти глав, заключения, списка использованной литературы из 253 наименований на 26 страницах и 5 приложений на 39 страницах.
Сведения о личном вкладе автора. Постановка научно-технической проблемы, содержание диссертации и все представленные в ней результаты получены лично автором. Подготовка к публикации некоторых результатов проводилась совместно с соавторами, причем вклад диссертанта был определяющим.
Диссертационная работа выполнялась в рамках государственных заданий Министерства образования и науки Российской Федерации для выполнения научно-исследовательских работ по темам «Научные основы построения информационных технологий, высокопроизводительных вычислительных систем, сетей, методов и средств обеспечения информационной безопасности» (2005-2009 г.г., per. № 01200511008) и «Математическое и программное обеспечение автоматизированного формирования баз знаний мягких экспертных систем диагностики состояния сложных объектов» (2013 г., per. № 01201354277).
Благодарности. Искренняя благодарность выражается заведующему кафедрой систем информационной безопасности Казанского национального исследовательского технического университета им. А.Н. Туполева-КАИ, кандидату технических наук, доценту Аникину Игорю Вячеславовичу и доценту кафедры реаби-литологии и спортивной медицины Казанской государственной медицинской академии, кандидату медицинских наук, доценту Подольской Марине Алексеевне за оказанную поддержку и консультации при проведении исследований.
Классификация типов и видов данных для решения задачи диагностики состояния сложного объекта
В семантических сетях понятийная структура и система зависимостей представлены однородно. Поэтому представление в них, например, математических соотношений графическими средствами неэффективно.
Необходимо отметить, что семантические сети представляют собой пассивные структуры, для обработки которых необходима разработка аппарата формального вывода и планирования. В чистом виде на практике семантические сети практически не используются. Для решения задач на семантических сетях используется дедуктивный вывод [33], который заключается в получении противоречий или пустой сети. Семантические сети также относят к декларативно-процедурным моделям представления знаний.
Правила продукций являются в настоящее время наиболее распространенной моделью представления знаний в ЭС. Идея формализации знаний в виде правил продукций принадлежит Э. Посту (1943г.) [42,154,188].
В общем случае, модель представления знаний в виде правил продукций имеет следующий вид:
«ЕСЛИ перечень условий ТО множество действий », где ЕСЛИ и ТО - ключевые слова продукционного правила.
Часть правила после ключевого слова ЕСЛИ называется посылкой (антецедентом) правила, а часть правила после ключевого слова ТО - заключением (консеквентом) правила. Если посылка является истинной, следует выполнить множество действий, представленных в заключении.
Антецеденты и консеквенты в продукционных правилах представляют собой логические выражения, объединенные функциями конъюнкции («И») и дизъюнкции («ИЛИ»), а также использующие функции отрицания («НЕ»). Элементарное логическое выражение, входящее в антецедент, называется условием правила, а элементарное логическое выражение, входящее в консек-вент - действием. Таким образом, множество действий исполняется, если перечень условий образует истинное утверждение. Зачастую, в качестве действий также используются некоторые утверждения, которые могут быть выведены системой (то есть становятся ей известной), если истинны условия правила.
Перечень условий обычно называют фактами, с помощью которых описывается текущее состояние предметной области. Факты могут быть истинными, ложными либо, в общем случае, правдоподобными, когда истинность факта допускается с некоторой степенью уверенности.
С точки зрения структурных особенностей антецедентов и консеквентов выделяют следующие типы продукционных правил [42].
1. Простые - продукционные правила, имеющие в антецеденте единственное условие и в консеквенте единственное заключение - «ЕСЛИУ4І ТО Сі». В этом случае логические связки «И» и «ИЛИ» не входят в состав антецедента и консеквента продукционного правила.
2. Фокусирующие - продукционные правила, которые имеют множество условий и одно действие, то есть логические связки «И» и «ИЛИ» входят в состав антецедента. Например, «ЕСЛИУ4І ИА2 И ... ИАп ТО С».
3. Разветвляющиеся - продукционные правила, которые имеют одно условие и множество действий, то есть логические связки «И» и «ИЛИ» входят в состав консеквента. Например, «ЕСЛИУ4І ТО Сі И ... И С„».
4. Составные - продукционные правила, имеющие множество условий и множество действий, то есть логические связки «И» и «ИЛИ» входят в состав как антецедента, так и консеквента. Например, «ЕСЛИУ4І ИА2 И ... ИАп ТО Сі И... ИСИ».
С точки зрения синтаксических особенностей антецедента А и консеквента С продукционные правила делятся на четыре типа.
1. Элементарные - продукционные правила, в состав А и С которых не входят логические связки «И» и «ИЛИ». 2. А-правила - продукционные правила, в состав А и С которых входят только логические связки «ИЛИ».
3. МГ-правила - продукционные правила, в состав А и С которых входят только логические связки «И».
4. Смешанные правила - продукционные правила, в состав А и С которых входят как логические связки «И», так и логические связки «ИЛИ».
Отличительной особенностью продукционной модели является способность осуществлять выбор правил из множества возможных на данный момент времени (конфликтного набора) в зависимости от определенных критериев, например, важности, трудоемкости, достоверности результата.
К основному недостатку продукций можно отнести то, что при большом их количестве становится трудоемкой проверка полноты и непротиворечивости базы знаний, например, при добавлении в нее новых правил.
Традиционно в экспертных системах выделяют также формальные логические модели представления знаний, основанные на исчислении предикатов первого порядка [42], когда предметная область или задача описывается в виде набора аксиом. Однако в промышленных экспертных системах формальная логическая модель практически не используется. Она применима в основном в исследовательских системах, так как предъявляет высокие требования и ограничения к предметной области.
Разработка методики построения совокупности систем продукционных правил, описывающих состояние объекта
Для завершения построения нечетко-продукционной модели определения состояния сложного объекта требуется настройка значений ее параметров, удовлетворяющих критерию (3.1). Сформулируем и докажем утверждение, касающееся решения данной задачи.
Утверждение 1: задача настройки значений параметров модели определения состояния сложного объекта, как совокупности систем нечетко-продукционных правил и алгоритмов логического вывода на правилах, эквивалентна задаче построения совокупности нейронечетких моделей состояния объекта, для решения которой требуется решение следующих задач: построение структуры нечетких нейронных сетей; обучение каждой нечеткой нейронной сети на данных, соответствующих каждой группе параметров G, = {Р х,рц.}, у = 1,т. Приведем доказательство данного утверждения.
Известно, что для любой системы нечеткого логического вывода, состоящей из базы правил и алгоритма логического вывода, можно построить соответствующую нечеткую нейронную сеть [9,12]. Данное свойство получило название эквивалентности нечетких систем и нейронечетких сетей [21,124,206].
Нечеткая система в соответствие с заданным алгоритмом производит логический вывод на имеющейся базе нечетко-продукционных правил для решения некоторой поставленной задачи. В противоположность нечеткой системе нечеткая нейронная сеть способна обучаться на исходных данных, соответствующих решению той же задачи, формируя при этом базу нечетко-продукционных правил и производя настройку значений их параметров. Обученная нечеткая нейронная сеть работает так же, как и эквивалентная ей система нечеткого логического вывода. Такие сети называются адаптивными нечеткими системами [20,219]. Следовательно, для настройки значений параметров модели определения состояния сложного объекта, как совокупности систем нечетко-продукционных правил и алгоритмов логического вывода на правилах, требуется разработка структуры и обучение нечетких нейронных сетей для построения совокупности нейронечетких моделей определения состояния исследуемого объекта.
Структура каждой нечеткой нейронной сети, соответствующей своей системе нечетко-продукционных правил SR , однозначно определяется следующими параметрами [80]: 1) числом входных параметров объекта в группе G,; 2) числом значений (градаций) входных параметров объекта; 3) числом значений целевого параметра объекта рц є G,; 4) алгоритмом логического вывода на системе правил вида (2.1). Первые три параметра задают количество нейронов в соответствующих слоях нечеткой нейронной сети. Последний параметр определяет число слоев сети и их функциональность.
В соответствии с алгоритмом логического вывода (алгоритмом 1) на несвязанной системе нечетко-продукционных правил вида (2.1) ННС имеет шесть слоев, отличающихся по функциональности и по количеству нейронов в них.
Число входных параметров объекта Р х в группе G, определяет число нейронов входного слоя сети, состоящего из множества Р-нейронов. Нейроны данного слоя выполняют функцию распределения входных сигналов. Входные сигналы ННС являются значениями входных параметров объекта.
Значения (градации) входных параметров объекта определяют слой значений-градаций входных нейронов сети - множество А -нейронов. Нейроны данного слоя моделируют входные условия р = А нечетких правил. Выходами
А -нейронов являются значения функций принадлежности МіІР ) определяющие степень срабатывания условных частей правил. С каждым А -нейроном связан параметр w є [0..1], определяющий вес (важность) условия в правиле.
Третий слой сети состоит из /f-нейронов, каждый из которых определяет антецедент (условную часть) правила. При этом множество /f-нейронов образует полную систему правил, многие из которых могут быть вырожденными.
Определение 1. Вырожденным будем называть нечетко-продукционное правило, не имеющее ни одного случая реализации своего шаблона в данных (т.е. достоверность CF данного правила равна нулю).
Входами /f-нейронов являются выходы соответствующих нейронов предыдущего слоя. Выход /f-нейронов определяет оценку R степени срабатывания условной части правил. В четвертом слое нейронной сети, содержащем то же количество RT-нейронов, что и в предыдущем слое, вычисляется произведение оценки степени срабатывания условной части правила R, получаемой на выходе соответствующего нейрона предыдущего слоя, и оценки степени доверия к принятому решению (совокупному весу условной части правила) Т, значение которой рассчитывается и поступает извне.
Пятый слой (слой значений выходного нейрона сети) содержит множество у4-нейронов, на входы которых поступают выходные значения і Т-нейронов и связанные с ними достоверности правил CF. Каждый 4-нейрон вычисляет комплексную оценку достоверности решения С и формирует на выходе максимальную из этих оценок.
В шестом слое сети содержится единственный выходной -нейрон, формирующий значение выхода сети рц = А, соответствующее А -нейрону с максимальной комплексной оценкой достоверности С.
Определение начальных значений весов условий в правилах
В отличие от алгоритмов логического вывода 1-3 на системах нечетко-продукционных правил вида (2.1), способных для каждого частного случая определять состояние сложного объекта, для диагностики реального объекта требуется разработка обобщенного алгоритма использования всех правил базы знаний. Сформулируем задачу разработки такого алгоритма.
Пусть в результате интеллектуального анализа исходных данных сформирована база знаний экспертной диагностической системы, представленная совокупностью систем значимых нечетко-продукционных правил вида (2.1) с идентифицированными значениями параметров. Кроме того, имеются алгоритмы логического вывода 1-3 на системах правил, в совокупности с базой знаний составляющие нечетко-продукционную модель определения состояния сложного объекта. Требуется разработать алгоритм использования модели для диагностики состояния сложного объекта.
Для решения поставленной задачи разработан алгоритм функционирования модуля логического вывода экспертной системы, позволяющий определять состояние сложного объекта в режимах постановки и уточнения диагноза. На рисунке 4.5 представлена блок-схема данного алгоритма.
Блок-схема алгоритма использования правил базы знаний для диагностики
На первом шаге работы данного алгоритма пользователь вводит режим диагностики. Если введен режим постановки диагноза, то выполняется левая ветвь алгоритма. При этом на основе алгоритма 3 анализируются все имеющиеся значения входных параметров и производится построение диагностического портрета сложного объекта в виде множества диагнозов и их достоверностей. В данном режиме работы алгоритма используются все правила базы знаний.
Второй режим работы алгоритма используется в случае, когда предполагаемый диагноз известен. Для его уточнения выделяется фрагмент базы знаний, соответствующий введенному диагнозу. Выделенный фрагмент в общем случае состоит из базовой системы правил с целевым параметром, соответствующим предполагаемому диагнозу, и других связанных с ней систем правил, если таковые имеются в базе знаний. Далее формируется множество А наименований входных параметров и вводятся данные, соответствующие этому множеству. Для выполнения логического вывода на правилах фрагмента базы знаний используются алгоритмы 1 и 2. Первый алгоритм выполняет логический вывод на базовой системе правил и используется в том случае, когда данные, соответствующие входным параметрам базовой системы правил, введены. В противном случае, если требуется уточнение (вычисление) значений одного или нескольких входных параметров базовой системы правил, используется алгоритм 2 для выполнения логического вывода на связанных системах. Работа алгоритма завершается выводом диагнозов и их достоверностей. При этом, если максимальное значение комплексной оценки достоверности соответствует предполагаемому диагнозу, то он считается уточненным.
Анализ особенностей начального состояния сформированной базы знаний, как совокупности систем нечетко-продукционных правил с идентифицированными значениями параметров, показал, что полученные системы могут содержать вырожденные и незначимые правила. Особенность вырожденных правил заключается в отсутствии вхождений их шаблонов в исходных данных. Невырожденные незначимые правила, несмотря на присутствие их шаблонов в данных, не участвуют в принятии решений в процессе логического вывода. Редукция вырожденных и незначимых правил не изменяет ошибку классифицирующей способности базы знаний, но упрощает системы правил и ускоряет выполнение алгоритмов логического вывода на правилах.
Разработанная технология интеллектуального анализа данных, включающая этапы группировки параметров объекта диагностики, построения совокупности систем нечетко-продукционных правил, идентификации значений параметров нечетко-продукционной модели определения состояния сложного объекта, оценки избыточности и редукции систем правил с идентифицированными значениями параметров позволяет сформировать базу знаний экспертной диагностической системы.
Алгоритм использования сформированных правил базы знаний позволяет производить диагностику состояний сложного объекта в режимах постановки и уточнения диагнозов. В первом случае на основе всех правил базы знаний производится построение диагностического портрета объекта в виде диагнозов и их достоверностей. Во втором случае выбирается фрагмент базы знаний, соответствующий предполагаемому диагнозу, и производится логический вывод на правилах фрагмента для его уточнения. Диагноз считается уточненным, если ему соответствует правило с максимальной комплексной оценкой достоверности принимаемого решения.
Технология формирования базы знаний экспертной системы
Для повышения оперативности управления и обеспечения безопасности функционирования технологических объектов на промышленных предприятиях разрабатываются и внедряются автоматизированные системы управления технологическими процессами (АСУ ТП) [40]. Проблема обеспечения технологической безопасности остро стоит и для автоматизированных систем управления технологическими процессами поддержания пластового давления (АСУ ТП ППД) [60,78], объектом автоматизации которых является оборудование кустовых насосных станций (КНС) [66,186].
В рамках таких АСУ ТП управление безопасностью процессов ППД осуществляется контроллерами на местном уровне, а также путем принудительного удаленного управления технологическим оборудованием с диспетчерских пунктов, находящихся в цехах поддержания пластового давления (ЦППД) [59].
Эффективность решения данной задачи во многом обеспечивается полнотой и оперативностью поступления информации о состоянии оборудования диспетчеру ЦППД, его способностью быстро и адекватно реагировать на возникшую внештатную ситуацию, возможностью выявить в автоматизированном режиме предаварийные ситуации и принять соответствующие меры по их устранению и предупреждению.
Решение отдельных задач, связанных с диагностикой и предупреждением возможных в будущем аварийных ситуаций требует трудоемкого анализа информации о текущем состоянии контролируемого оборудования, оценки косвенных диагностических признаков и интегральных показателей, свидетельствующих о подобных ситуациях. В ряде случаев принятие решения о возможных аварийных ситуациях требует анализа имеющейся информации о состоянии оборудования в прошлом.
Подобные задачи затруднительно решать на уровне контроллеров АСУ ТП в связи с трудоемкостью отдельных алгоритмов анализа. Решение может быть более эффективно осуществлено на программном уровне в ЦППД путем анализа информации, поступающей на сервер БД. Таким образом, актуальным является создание экспертных диагностических систем, принимающих решение о возникновении аварийных ситуаций на уровне диспетчера цеха поддержания пластового давления [166].
Для этого требуется разработка комплексной системы выявления и предупреждения сбоев и аварий технологического оборудования процессов ППД [49], способной взять на себя поддержку принятия решения множества задач по автоматизации обеспечения технологической безопасности процессов ППД. Внедрение данной системы на диспетчерских пунктах в цехах поддержания пластового давления необходимо для повышения оперативности выявления и предупреждения аварийных ситуаций.
Для достижения данной цели требуется решение следующих задач: разработки модуля оперативного автоматического анализа расходов жидкости и обнаружения утечек из водоводов; оперативного выявления с ЦППД разрыва связи с контроллером КНС; введения и поддержки на уровне ЦППД предупредительных уставок для множества контролируемых технологических параметров; прогноза значений контролируемых технологических параметров. Одной из наиболее актуальных задач, требующих оперативного реагиро вания на уровне ЦППД, является задача выявления утечек из водоводов (поры вов) по результатам анализа получасовых расходов жидкости [41,181,182]. На примере решения данной задачи реализована система оперативного выявления порывов на водоводах, принимающая решение на основании сформированной системы нечетко-продукционных правил.
Дистанционно факт утечки косвенно устанавливается путем анализа расходов жидкости на водоводах и на выкиде КНС. Реализованная в системе методика использована для автоматического оперативного выявления порывов на водоводах в ЦППД-2 НГДУ «ДжалильНефть» ОАО «ТатНефть». представлена типовая схема размещения водоводов на КНС. . Типовая структура водоводов кустовых насосных станций В данном случае в системе имеется 10 водоводов, размещающихся как на блоках гребенок (БГ), так и на выносных блоках гребенок (ВБГ). На каждом водоводе имеется прибор учета расхода жидкости (расходомер), показания которого фиксируются каждые 0,5 часа и сохраняются в базе данных.
Разработанная экспертная система решает комплексную задачу - производит мониторинг состояния водоводов с целью выявления нежелательных тенденций закачки жидкости и оповещает диспетчера о наступлении аварийных ситуаций. Система включает в себя три основных операционных модуля: модуль стыковки с базой данных системы «ПРОТОК»; машину логического вывода; модуль стыковки с автоматизированным рабочим местом (АРМ) «Диспетчер ППД».