Содержание к диссертации
Введение 4
1. Методы и системы представления знаний. 10
1.1. Методы представления знаний 10
Продукционная модель 11
Логические модели 13
Семантические сети 14
Фреймы 16
Преимущества гибридной модели представления знаний. 19
1.2. Системы представления знаний 20
Rhet 20
Babylon 21
Parmenides 22
Frobs, Frolic 22
Florid 23
FramerD 24
SNePS 25
Постановка задачи 26
Выводы 28
2. Гибридная модель представления знаний, основанная на сети
фреймов. Логический вывод на сети фреймов. 29
2.1. Гибридная модель представления знаний 29
2.1.1. Фрейм 30
2.1.2. Связи между фреймами. Типы связей 30
Демоны 31
Сообщения - единый метод доступа и манипуляции данными в сети 33
Логический вывод на сети фреймов 36
Понятие Процессора Логического Вывода (ПЛВ) 36
Концепция множества различных методов логического вывода над единой базой знаний 41
Формальное представление знаний. Синтаксис языка запросов 42
Семантика языка запросов. Метод резолюций на сети фреймов 44
Пример логического вывода 47
2.5. Архитектура фреймовой системы представления
знаний FRAMIX 50
2.6. Выводы 53
3. Реализация гибридной фреймово-сетевой модели. Ядро си
стемы FRAMIX. Алгоритмы и методы реализиции. 56
Архитектура системы FramIX 56
Объектная модель ядра 60
Базовые классы манипулирования данными 61
Подсистема управления демонами 71
Слот 78
Фрейм 80
Подсистема управления связями 84
3.3. API системы FramIX 92
Структура API системы FramIX 92
Функции управления структурой сети 92
Функции манипулирования данными 94
3.3.4. Функция SendMessage 97
Механизмы фиксации состояний сети фреймов 102
Пользовательский модуль. Структура типичного
FramIX приложения 102
3.6. Особенности реализации ядра системы FRAMIX.
Оценка производительности 105
3.7. Выводы 106
4. Экспертная система FBCS*, реализованная в системе про
граммирования FramIX. 107
4.1. Постановка задачи 107
Предварительные определения 108
Исходная информация для классификации и обобщения, постановка задачи 110
Архитектура системы FBCS 112
Реализация системы 115
Выводы 119
Заключение 120
Литература 122
Введение к работе
Построение модели предметной области имеет своей целью решение практически важных задач: управления, прогноза, поддержки принятия решений и т.д. Конкретизация целевой задачи неизбежно приводит к необходимости различной глубины формализации предметной области, т.е. приближению в модели к адекватному отображению реальных отношений, их свойств, состояний и проявлений. Проблема эта значительно осложняется, когда речь идет о предметной области, плохо или мало поддающейся формализации. Кроме того, следует учесть несовпадение вербальных сообщений эксперта предметной области с его профессиональной интеллектуальной активностью.
В таких условиях построение модели с использованием прямых методов -статистических, аналитических - невозможно. Мы приходим к необходимости применения подходов, базирующихся на знаниях о предметной области. Адекватность модели теперь будет зависеть от привлечения новых знаний, их аксиоматического, формального описания в виде правил, логических отношений и т.д., образующих теорию. Очевидно, что этому должен предшествовать этап приобретения, извлечения знаний.
Таким образом, естественно формируется триада: приобретение знаний (data mining), представление знаний (модель) и обработка знаний (прикладная система) - и эта триада представляет содержание направления искусственный интеллект.
Настоящая диссертационная работа посвящена разработке методов и средств, реализующих все три этапа: представление знаний (2-я глава), извлечение знаний (4-я глава), прикладная система, основанная на знаниях (3-я,
4-я главы).
Если в системах, основанных на знаниях, на этапе моделирования невозможно непосредственное использование аналитических, статистических методов, то первый этап наоборот широко и активно их использует. Направление data mining - это по существу совокупность различных, хорошо апробированных методов: регрессионного, дискриминантного, факторного, кластерного анализов и др., - приобретающих новое смысловое назначение - извлечение знаний. Объектами этих методов становятся пассивные хранилища данных -суть результат жизнедеятельности некоторой предметной области. Заметим, что здесь проблема представительности выборки теряет свою остроту.
Если математический аппарат, используемый в методах приобретения знаний, достаточно известен благодаря успешныму применению в фундаментальных и прикладных исследованиях, то проблема представления знаний всякий раз требует уточнения границ применимости подходов, их модификации.
Успешность метода и формы представления знаний, помимо из адекватного отображения конкретной предметной области, состоит в адаптируемости к различным предметным областям, т.е. инвариантности к ним. При таком подходе проблема представления знаний значительно усложняется, ее актуальность получает иные, более значимые оценки. Поэтому в настоящей работе внимание акцентируется на этой проблеме.
Принято различать следующие основные подходы к представлению знаний:
Продукционные системы - описывают предметную область при помощи правил продукции. Наилучщим образом позволяют описать динамику предметной области, однако не подходят для описания сложных, разносторонних задач. При росте базы знаний плохо управляемы.
Логические модели - позволяют получить описание предметной области, как множества фактов и правил вывода. Этому подходу присущ высо-
кий уровень модульности знаний и одновременно с этим можно получить единственную систему представления, в которой логически разъясняются свойства знаний как единого целого. Используя логические модели, можно эффективно описывать законы мира предметной области. С другой стороны, логическим моделям, вследствие сохранения свойства целостности, присущи такие недостатки, как чрезмерный уровень формализации представления знаний, трудность их прочтения, не слишком хорошая производительность обработки.
Семантические сети - способ описания предметной области как множества сущностей (узлов) и отношений между ними (дуги). Недостатками данного формализма являются чрезвычайная детализация предметной области, необходимая для описания правил, и, как следствие, сложность механизмов логического вывода, необходимых для проверки непротиворечивости базы знаний (эффективные методы логического вывода только начинают появляться в настоящее время). Кроме этого, сематическая сеть дает статическое описание предметной области.
Фреймы - данный подход использует для описания предметной области понятие фрейма - структуры, которая описывает какию-либо сущность предметной области. Фремы могут находиться в отношениях наследования и часть-целое. Фреймовые модели наилучшим образом позволяют построить объектную модель предметной области. В настоящее время показано, что фреймовые модели эквивалентны семантическим сетям и поэтому им присущи те же недостатки.
Наилучшим образом задачу представления знаний можно было бы решить, используя модель, которая объединила бы в себе перечисленные выше подходы. Такие модели называются гибридными. Однако, в настоящее время эффективных гибридных моделей не предложено и задача представления знаний не имеет универсального решения.
Таким образом, актуальность темы диссертации может быть сформули-
рована следующими положениями:
Необходимость разработки методов и средств формализации предметной области;
Разработка форм отображения знаний, инвариантных к предметной области;
Построение программных систем, основанных на предложенных моделях, для решения задач поддержки принятия решений.
Цель работы - Решение задачи отображения в гибридной системе достоинств логический систем. Известно, что при всех недостатках логических систем, это единственный подход, который в любом случае приводит к положительному результату, что не всегда достижимо в других системах. Поэтому, если теорию фреймов и соответствующее представление объектов в форме связанных друг с другом отношениями подчиненности, причинности и т.д., что представляет собой сеть фреймов, трансформировать в теорию предикатов 1-го порядка, расширив, тем самым, саму теорию предикатов 1-го порядка, то все её достоинства будут обращены и в теорию сетей фреймов.
Методы исследования. При решении поставленной задачи был проведен анализ существующих методов представления знаний, систем, основанных на гибридных моделях. При разработке модели представления знаний использовался аппарат логики предикатов 1-го порядка. При разработке ядра системы применялось объектно ориентированное проектирование, алгоритмы эффективного хранения и поиска данных, формализм виртуальной машины. При решении практической задачи использовались статистические методы анализа рядов данных.
Научная новизна основных результатов диссертационной работы заключается в следующем:
Предложена новая гибридная модель представления знаний, основанная на формализмах фреймов и семантических сетей.
Разработана активная фреймовая структура, сочетающая внутренние процедуры обработки и передачи информации внутри сети фреймов.
Разработан механизм реализации множества различных методов логического вывода на единой базе знаний, представленной в виде сети фреймов.
Продемонстрирована принципиальная возможность реализации логического вывода на примере метода резолюций логики предикатов 1-го порядка.
Результаты исследований обсуждены на 7-й национальной конференции по искусственному интеллекту "КИИ-2000"[5].
Результаты исследований внедрены в ЗАО "SM-Consulting".
Структура работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы общим объемом 127 страниц текста, включая 14 рисунков.
В первой главе приводится сравнительный анализ существующих методов представления знаний. Подробно рассматриваются особенности каждого формализма, рассматриваются их основные достоинства и недостатки. Приводится обзор некоторых существующих систем представления знаний, основанных на гибридных моделях. Рассматриваются основные достоинства и недостатки этих систем. На основе анализа приводится постановка задачи.
Во второй главе дается описание разработанной гибридной модели представления знаний, основанной на сети фреймов, которая лежит в основе системы FRAMIX. Приводятся определения понятий фрейм, связь, демон, сообщение,
процессор логического вывода. Предлагается подход для реализации множества логических выводов на единой базе знаний и рассматривается синтаксис и семантика единого языка для описания правил и запросов к базе знаний, представленной в виде сети фреймов. На примере ПЛВ основанного на методе резолюций логики предикатов 1-го порядка показывается принципиальная возможность применения предлагаемого подхода для реализации логического вывода на сети фреймов. Далее рассматриваются перспективы развития предложенной модели.
В третьей главе описывается архитекура ядра (супервизора) системы программирования FramIX. Далее подробно излагаются особенности реализации каждой подсистемы, приводится объектная модель системы. Детально излагаются механизм представления данных в системе и механизм передачи сообщений. Исследуются особенности эффективного управления памятью при решении данной задачи и алгоритмы поиска информации. Выполняется оценка производительности системы на примерах.
В четвертой главе выполняется постановка практической задачи: создать экспертную систему для анализа и классификации результатов первичного прогнозирования биржевых котировок некоторых финансовых инструментов. Приводятся определения базовых понятий рассматриваемой предметной области и выполняется постановка прикладной задачи. Далее в главе рассматривается архитектура системы, структура базы знаний, затем рассматривается реализация системы.
В заключении излагаются основные результаты работы и рассматриваются перспективы дальнейших исследований.