Содержание к диссертации
Введение
ГЛАВА 1. Специализированные банки знаний и генераторы редакторов информации (обзор литературы) 8
1.1. Специализированные банки знаний 8
1.2. Генераторы редакторов информации различных видов 13
1.3. Многоуровневые архитектуры моделирования 19
Выводы из обзора литературы и постановка задачи исследования 24
ГЛАВА 2. Концепция Многоцелевого банка знаний 26
2.1. Концепция и политика Многоцелевого банка знаний 26
2.2. Анализ основных задач Многоцелевого банка знаний 30
2.3. Структура информационного наполнения 35
2.4. Структура програмхмного наполнения 37
2.5. Характеристики пользователей Многоцелевого банка знаний 38
2.6. Характеристики рассматриваемых видов информации 42
2.7. Особенности классов носителей рассматриваемых видов информации 45
2.8. Требования к Многоцелевому банку знаний 47
2.9. Универсальный редактор информации различных уровней общности 60
2.10. Неформальное описание процесса функционирования Многоцелевого банка знаний 71
Выводы по главе 74
ГЛАВА 3. Модель процесса редактирования информации различных уровней общности 76
3.1. Архитектура ИРУ О 76
3.2. Модель процесса редактирования ИРУ О 78
3.3. Сравнение Архитектуры ИРУ О с существующими многоуровневыми архитектурами моделирования 80
3.4. Сравнение предложенной модели процесса редактирования с существующими моделями 83
Выводы по главе 84
ГЛАВА 4. Особенности реализации Многоцелевого банка знаний и Редактора ИРУО 86
4.1. Архитектура программной системы 86
4.2. Логика программной системы 88
4.3. Интерфейс программной системы 90 Выводы по главе 92
ГЛАВА 5. Экспериментальное исследование Редактора ИРУО 93
5.1. Технология использования Редактора ИРУО для редактирования информации различных уровней общности 93
5.2. Цель и задачи эксперимента 94
5.3. Порядок проведения эксперимента 94
5.4. Материал для эксперимента 95
5.5. Экспериментальное исследование технологии использования Редактора ИРУО для редактирования информации различных уровней общности 95
5.6. Результаты эксперимента 118
Выводы по главе 123
Заключение 124
Литература 126
- Многоуровневые архитектуры моделирования
- Характеристики пользователей Многоцелевого банка знаний
- Сравнение Архитектуры ИРУ О с существующими многоуровневыми архитектурами моделирования
- Экспериментальное исследование технологии использования Редактора ИРУО для редактирования информации различных уровней общности
Введение к работе
Актуальность проблемы. Исследования в области компьютерных систем, основанных на знаниях, проводимые уже более тридцати лет, показали потенциальную ""возможность существенного повышения эффективности работы во многих областях образовательной, научной и практической деятельности. Однако до настоящего времени разработка и внедрение таких систем тормозились из-за крайне высокой трудоемкости формирования и сопровождения качественных и современных баз знаний.
В последнее время было предпринято несколько попыток решения этой проблемы в отдельных предметных областях путем интегрирования знаний соответствующей области в единый компьютерный информационный ресурс и обеспечения возможности его коллективного развития и использования через сеть Интернет. Такие информационные ресурсы получили название специализированных компьютерных банков знаний. Необходимыми видами информационного наполнения специализированных банков знаний являются описания языков спецификации онтологии, онтологии различных уровней общности, знания и данные. Для создания и сопровождения информационного наполнения в каждом таком банке разрабатывались редакторы формализованной информации всех указанных видов. Такие редакторы предоставляли пользователям возможность коллективного формирования и развития этой информации и обеспечивали носителей информации соответствующих видов необходимой им интеллектуальной поддержкой. Ввиду высокой трудоемкости разработки таких редакторов, перспективным подходом к их созданию является использование генераторов редакторов формализованной информации. Значительный вклад в развитие данного подхода внесли А.С. Клещев, Е.И. Антонова, В.В. Грибова, G. van Heijst, Н. Eriksson и другие.
Однако до сих пор не было разработано ни единой технологии, ни общих программных средств для создания специализированных банков знаний. В результате, каждый такой банк знаний разрабатывался независимо от других, в нем использовалось свое собственное представление информации и специфические для него программные средства. Как следствие, эта информация и эти программные средства не могут быть использованы при создании новых банков, а разработка каждого нового банка остается чрезвычайно трудоемкой. Кроме того, эти банки знаний не предоставляют развитых средств доступа к хранимой информации внешним компьютерным системам, основанным на знаниях, что существенно затрудняет разработку таких систем. Между тем, необходимость создания новых систем, использующих информационное наполнение специализированных банков знаний, диктуется растущими потребностями практики и постоянным научно-техническим прогрессом. При создании средств редактирования информации для банков знаний технология генераторов редакторов не использовалась, поэтому для каждого нового банка и для каждого нового вида информации в нем разрабатывались новые редакторы. Существующие генераторы редакторов не могут быть непосредственно использованы для создания редакторов информационного наполнения банков знаний, поскольку обладают рядом существенных недостатков. А именно, область применения большинства из них жестко ограничена. Они не позволяют разрабатывать совместимые редакторы, поэтому информация, созданная с помощью одних редакторов, не может быть обработана другими. Часто используемый при создании генераторов объектно-ориентированный подход является неестественным для представления знаний и накладывает существенный отпечаток на организуемую интеллектуальную поддержку, которая оказывается неприемлемой для экспертов и специалистов предметных областей. Более того, ни один из генерируемых редакторов не предоставляет возможностей для коллективного редактирования.
Таким образом, разработка генератора редакторов формализованной информации различных уровней общности, предназначенного для создания и развития информационного наполнения специализированных банков знаний, является актуальной.
Целью диссертационной работы является разработка и исследование моделей, методов и средств редактирования и администрирования информационного наполнения специализированных банков знаний в сети Интернет, обеспечивающих необходимую интеллектуальную поддержку этих процессов.
Для достижения поставленной цели в диссертационной работе необходимо решить следующие задачи:
- разработать концепцию информационного ресурса — многоцелевого банка знаний, являющегося совокупностью специализированных банков;
- разработать формализм для представления информации в многоцелевом банке знаний и модель процесса редактирования этой информации;
- разработать методы реализации средств доступа к информации, хранимой в многоцелевом банке знаний, средств редактирования этой информации, а также средств администрирования многоцелевого банказнаний;
исследовать разработанные модели, методы и средства редактирования на соответствие предъявляемым к ним требованиям.
Методы исследования. Для решения указанных задач использовались: теория искусственных языков, элементы теории множеств и математической логики, теория графов, теория реляционных баз данных, а также методы объектно-ориентированного анализа и проектирования, Интернет-технологии, технология OMG CORBA, методы системного программирования.
Научная новизна работы состоит в следующем:
- впервые разработана концепция многоцелевого информационного ресурса для поддержки практической, научной и образовательной деятельности в различных предметных областях;
- разработана единая модель представления различных видов информации различных уровней общности;
- предложена оригинальная схема взаимосвязи между различными уровнями общности информации;
- разработана и исследована обобщенная модель процесса приобретения и редактирования информации различных уровней общности, обеспечивающая необходимый для соответствующих классов носителей информации уровень интеллектуальной поддержки.
Практическая ценность работы состоит в следующем:
- многоцелевой банк знаний используется в ИАПУ ДВО РАН в качестве единой платформы для создания, развития и исследования специализированных банков знаний в различных предметных областях, в том числе в области медицины, химии и оптимизирующих преобразований программ;
- многоцелевой банк знаний используется на кафедре Программного обеспечения ЭВМ ДВГУ в качестве единой платформы для моделирования комплексных учебных ситуаций в области компьютерной обработки информации, поддерживающей активные методы обучения, разработанные программные средства используются для поддержки учебных занятий по дисциплинам «Редактирование информации различных уровней общности», «Математические основы информатики» и «Системы искусственного интеллекта», а научные результаты диссертации - при чтении курсов лекций по специальности «Математическое обеспечение и администрирование информационных систем»;
- модель представления информации различных уровней общности используется для представления информации в банках знаний в области медицины, химии и оптимизации программ, может быть использована для представления и других видов информации;
- схема взаимосвязи между различными уровнями общности информации и программные средства доступа к информации многоцелевого банка знаний могут быть использованы при разработке новых программных средств для специализированных банков знаний;
- разработанное универсальное средство редактирования информации различных уровней общности используется для формирования и редактирования информации указанных выше специализированных банков знаний;
- разработанное средство администрирования используется для администрирования ресурсов многоцелевого банка знаний.
Апробация работы. Основные положения диссертации докладывались и обсуждались на Азиатско-Тихоокеанской Конференции по
Интеллектуальным Системам (Сеул, Ю.Корея, 2001 г.), Международном Аспирантском Консорциуме по Промышленным Информационным Системам (Анже, Франция, 2003 г.), 5й Международной Конференции по Промышленным Информационным Системам (Анже, Франция, 2003 г.), Дальневосточных школах-семинарах им. академика Е.В. Золотова (Владивосток, 2000, 2003 гг.), а также на совместных семинарах отдела Экспертных систем ИАПУ ДВО РАН и базовой кафедры ПО ЭВМ ИМКН ДВГУ в ИАПУ ДВО РАН.
Основные результаты диссертации опубликованы в 12 работах.
Многоуровневые архитектуры моделирования
Интеллектуальная поддержка эксперта ПО в ГСИДРБЗ в процессе приобретения, знаний о ПО состоит в организации активного интервью с экспертом по поводу информации, необходимой редактору на каждом шаге процесса редактирования [1, 2]. Структура диалога определяется иерархией вершин в сети понятий метаинформации. В процессе диалога используются термины предметной области, определенные в метаинформации. Возможны два сценария диалога: произвольный (когда порядок обхода вершин сети понятий метаинформации задается пользователем) и жесткий левосторонний обход всех вершин. Поддержка контроля правильности вводимой информации заключается в проверке типов (зафиксированных в метаинформации) вводимых данных, а также контроле согласованности данных, связанных дугами с маркерами базовое множество и базовая альтернатива.
Подход к интеллектуальной поддержке пользователя в системе ОДИ состоит в организации диалога с пользователем с целью разрешения t неоднозначностей, возникающих в ходе применения универсального рецепта к текущей порождающей модели [42]. Существенной особенностью ОДИ является предоставление инициативы в управлении диалогом при вводе исходных данных пользователю. Это свойство диалога представляется в модели регламентом действий пользователя, который состоит в предоставлении последнему на каждом шаге процесса редактирования возможности выбора варианта среди множества вариантов подходящих данных, относящихся к выполняемой задаче (если набор вариантов конечен) либо возможности ввода информации посредством предоставляемой синтаксической формы (в случае, когда набор возможных вариантов бесконечен).
В CUE [44, 63], QUITE оперирует графовыми моделями и рассчитана на инженера знаний. QUOTE снабжает инженеров знаний проблемно-ориентированной терминологией из предварительно сформированных моделей задач, и предоставляет возможность проверки формируемых онтологии на соответствие синтаксису языка Ontolingua. Основной задачей QUAKE является поддержка экспертов ПО в процессе приобретения и редактирования знаний. QUAKE может работать в двух режимах: пассивном либо активном, В пассивном реисиме пользователь сам управляет процессом редактирования знаний. В активном режиме QUAKE работает в режиме активного интервью на основе соответствующих планов и стратегий приобретения знаний. Кроме того, QUAKE поддерживает процесс приобретения и редактирования знаний возможностью проверки непротиворечивости и (в активном режиме) полноты знаний. Проверка непротиворечивости состоит в проверке вводимых знаний на соответствие ограничениям, зафиксированным в онтологии. Проверка полноты состоит в том, что QUAKE может определять, для каких классов из онтологии определено достаточно экземпляров, для каких - только часть требуемого множества экземпляров, а для каких - экземпляров не определено вообще.
Интерфейс Protege-2000 [43, 54] (и генерируемых систем приобретения онтологии и знаний) основан на использовании структурированных интерфейсных форм приобретения информации, отображающих информацию об объектах классов и позволяющих изменять значения их слотов. Интерфейсные формы используют имена классов и их слотов в качестве терминологии, ориентированной на пользователя. Иерархия классов, описанная в метаинформации, может быть использована для управления диалогом приобретения целевой информации. Метаинформация содержит также описания ограничений и аксиом, связанных с классами и их слотами, которые позволяют проверять формальную правильность информации, вводимой пользователем.
Практика показывает, что объектно-ориентированный подход, принятый за основу в CUE и Protege-2000, накладывает существенный отпечаток на организуемую интеллектуальную поддержку, которая оказывается неестественной для экспертов и специалистов ПО. Кроме того, стоит заметить, что разработчики генераторов редакторов [1, 2, 42, 43, 44, 54, 63] обычно концентрируются на решении собственно проблемы организации процесса редактирования, не учитывая достижений, полученных при разработке специализированных средств редактирования онтологии, знаний и данных, таких, как OPAL [52], APECKS, Apollo, CODE4, С04, CUE, DUET, GKB-Editor, IKARUS, JOE, Oil Ed, OntoEdit, OntoSaurus, VOID, WebODE и WebOnto [32], а также Hozo [49].
Современные подходы, к созданию метаинструментальных средств компьютерной обработки информации (в частности - генераторов редакторов) специфицированы в виде так называемых многоуровневых архитектур моделирования. До настоящей работы рассматривались два основных вида архитектур: одна, основанная на фиксированном наборе точек зрения на целевую систему (трехуровневая), и вторая, основанная на мета-моделировании (четырехуровневая) [53]. Показательным примером архитектуры первого вида является так называемая «эталонная модель открытой распределенной обработки информации» (Reference Model of Open Distributed Processing, RM-ODP) от организаций ISO и IEC [46], a архитектуры второго вида — средство мета-объектного моделирования (Meta Object Facility, MOF) от рабочей группы Object Management Group (OMG) [51]. В данном разделе для каждой из архитектур приводится: 1) назначение; 2) предлагаемые области практического применения; 3) строение; 4) средства мета-моделирования (используемые языки); 5) способ использования архитектур. Архитектура RM-ODP предназначена для спецификации систем (возможно открытых и распределенных, не обязательно программных) в соответствии с методами объектно-ориентированного анализа и проектирования [46]. Архитектура MOF предназначена для спецификации объектно-ориентированных моделей на основе объектных метамоделей. Архитектура MOF может быть использована для моделирования объектно-ориентированных программных систем, а также, как утверждают разработчики, для представления информации [51, 53]. Авторы RM-ODP предлагают использовать данную архитектуру в области проектирования программного обеспечения (открытого и распределенного) и указывают, что она может быть также использована для представления информации [46]. Главной областью применения MOF является проектирование и разработка программного обеспечения [51, 53]. Авторы MOF указывают, что она может быть также использована для управления информационными моделями на основе метаинформационных моделей [51]. Таким образом, RM-ODP и MOF имеют несколько различное назначение, однако направлены на одну и ту же область практического применения: поддержку проектирования программного обеспечения.
Характеристики пользователей Многоцелевого банка знаний
Как показывает практика, онтологии и соответствующие им знания одних предметных областей могут быть полезны и в других. Можно привести примеры внешне-различных предметных областей, имеющих общую онтологию. Так, социология, психология, биология и медицина имеют причинно-следственную онтологию. В работе [3] показаны возможность и достоинства повторного использования онтологии классов прикладных задач и методов их решения. Для обеспечения повторной используемости таких онтологии необходима возможность хранить множество онтологии.
Существуют предметные области, в которых различные разделы имеют самостоятельное значение, но в основе несобственного подмножества разделов лежит одна и та же онтология. В этом смысле можно считать, что часть онтологии такой предметной области повторно используется в ее различных разделах. Примером является медицина. Поскольку разделы такой предметной области имеют самостоятельное значение, то базы знаний для них также самостоятельны, не конкурируют между собой. Отсюда возникает необходимость хранения множества не конкурирующих баз знаний. В случае с областями, разделы которых не имеют самостоятельного значения, снова возникают конкурирующие базы знаний.
В целом, вслед за онтологиями повторно используются соответствующие им знания и данные о действительности. Таким образом, в области компьютерной обработки информации можно и нужно пользоваться концепцией повторного использования различных видов информации. Это влечет необходимость ее накопления в рамках единого информационного ресурса. Из представленного в предыдущем разделе анализа можно видеть, что принципиальными видами информации, хранимой в ИН каждого МБкЗ, являются спецификации искусственных языков (в частности ЯСО), онтологии различных уровней общности, знания и данные предметных областей. Информационное наполнение МБкЗ делится на полезную и экспериментальную области (см. Рисунок 4). Полезная область ИН МБкЗ содержит информационные наполнения СБкЗ, из которых состоит МБкЗ. Каждое такое ИН СБкЗ в общем случае содержит спецификации ЯСО, онтологии различных уровней общности на описанных ЯСО, знания и данные. Отдельные теории СБкЗ можно классифицировать по степени повторной используемости. Так, существует ряд теорий, пригодных для повторного использования в любых СБкЗ (примерами являются искусственные языки общего назначения и проблемно независимые онтологии). Существуют расширяемые языки (такие, как Язык прикладной логики [9]), базис которых пригоден для использования в любых СБкЗ, а в конкретных СБкЗ могут появляться специализированные расширения. Некоторые теории повторноиспользуемы лишь в рамках некоторого класса СБкЗ (например, медицинская база наблюдений в классе медицинских СБкЗ). Наименьшей повторной используемостью обладают, по-видимому, данные конкретной предметной области, которые сформированы в соответствии с конкретной базой наблюдений. Формирование и улучшение знаний в полезной области ИН МБкЗ является одной из основных задач функционирования МБкЗ. Поэтому к этому процессу допускаются лишь квалифицированные пользователи.
Задача поддержки научных исследований и образовательной деятельности влечет необходимость создания экспериментальной области ИН МБкЗ. Принципиальное отличие экспериментальной области от полезной состоит в том, что прикладные пользователи не имеют доступа к ней (т.е. она. не используется при решении прикладных задач). В этой области могут создаваться произвольные СБкЗ; исследователи и студенты могут производить над ними произвольные манипуляции с помощью общедоступных программных средств из ПН МБкЗ; по мере разработки новых программных систем для ПН МБкЗ, последние могут проходить тестовую эксплуатацию в экспериментальной области. СБкЗ и отдельные теории в экспериментальной области ИН МБкЗ имеют ограниченный срок жизни, по окончании которого они должны быть удалены (СБкЗ может быть удален только в том случае, если истек срок жизни всех его теорий). Такое ограничение направлено на то, чтобы в экспериментальной области ИН МБкЗ не накапливались бесполезные СБкЗ и теории (например, неограниченная жизнедеятельность неограниченного числа исследователей и студентов может привести к неэкономному использованию ресурсов МБкЗ). Манипуляции пользователей над экспериментальной областью не влияют на информацию в полезной области ИН МБкЗ.
Программное наполнение МБкЗ также делится на полезную и экспериментальную области (см. Рисунок 4). Полезная область ПН МБкЗ содержит средства редактирования для ИН МБкЗ и набор качественных программных средств (испытанных на удовлетворение критериям надежности, пригодности и безвредности для МБкЗ), предоставляющих прикладным пользователям сервисы для решения задач как над полезной, так и над экспериментальной областью ИН МБкЗ.
Поскольку предусмотреть в полезной области ПН МБкЗ полный набор средств, которые могут когда-либо понадобиться пользователям, не представляется возможным, то по мере развития МБкЗ будут разрабатываться новые программные средства. Целью создания таких средств является предоставление их сервисов конечным пользователям для решения задач над полезной областью ИН МБкЗ. Однако, прежде чем эти средства можно будет допустить к обработке информации в полезной области ИН МБкЗ, они должны пройти тестовую эксплуатацию (испытания на удовлетворение критериям надежности, пригодности и безвредности для МБкЗ). Для проведения тестовой эксплуатации эти средства размещаются в экспериментальной области ПН МБкЗ и имеют доступ только к экспериментальной области ИН МБкЗ.
Сравнение Архитектуры ИРУ О с существующими многоуровневыми архитектурами моделирования
Из соображений минимизации затрат на обучение пользователей и обеспечения эффективности их работы требуется унифицировать способы редактирования различных компонент ИН МБкЗ. Количество редакторов, включаемых в БкЗ, должно быть оптимальным — минимальным без потери уровня интеллектуальной поддержки пользователей.
Сложность понимания логической концепции средства редактирования может приводить к отвержению использования такого средства. Использование же средства редактирования без понимания его логической концепции может приводить к порождению неоправданно сложной и даже неправильной информации. Поэтому редакторы должны быть устроены так, чтобы пользователи затрачивали минимум усилий на понимание их логической концепции и способов редактирования информации с их помощью.
Процесс управления средством редактирования не должен отвлекать пользователя от решения собственно задачи редактирования. В противном случае это будет препятствовать решению задач, в которых редактирование требуется производить в режиме времени, приближенного к реальному, а также ломать процесс редактирования интеллектуально насыщенных видов информации (таких, как онтологии, знания). Поэтому редакторы должны требовать от пользователя минимум усилий на управление ими.
Гости МБкЗ имеют право только просматривать открытое содержимое полезной области ИН МБкЗ, а Носители информации имеют право (ограниченное персональными полномочиями) редактировать содержимое. Поэтому редакторы должны различать Носителей информации и Гостей МБкЗ. Стоит заметить, что в качестве Носителей информации в экспериментальной области ИН МБкЗ выступают Экспериментаторы и Студенты.
Редакторы должны разграничивать полномочия отдельных Носителей информации, поскольку политикой МБкЗ является предоставление конкретному пользователю только тех сервисов, на которые он авторизован, а также исключение возможности несанкционированного влияния жизнедеятельности одного пользователя на другого.
Разные классы пользователей-носителей информации могут иметь разные полномочия по доступу к разным видам информации. Например, на сегодняшний день выделены следующие принципиальные виды информации, представляемые в ИН МБкЗ: описания языков спецификации онтологии, онтологии различных уровней общности, знания и данные предметных областей. Соответствующие классы носителей информации - языковеды, инженеры знаний, эксперты ПО и специалисты ПО. Их полномочия разграничиваются следующим образом: языковеды могут редактировать только описания ИЯ; инженеры знаний - онтологии различных уровней общности и знания; эксперты ПО — онтологии ПО (при наличии метаонтологии соответствующей ПО) и знания ПО (при наличии онтологии знаний соответствующей ПО); специалисты ПО — только данные ПО (при наличии онтологии данных соответствующей ПО). Поэтому редакторы должны различать классы Носителей информации.
Редакторы являются стандартным для МБкЗ средством просмотра информации, поэтому они должны предоставлять пользователю из класса Носителей информации и Гостей возможность просматривать перечень ресурсов МБкЗ и открывать теории для просмотра.
Поддержка Носителей информации, Экспериментаторов и Студентов в процессе редактирования теорий (в соответствии с полномочиями) является основной задачей редакторов," поэтому редакторы должны предоставлять пользователю из класса Носителей информации (Экспериментаторов и Студентов) возможность просматривать перечень ресурсов, на редактирование которых он авторизован Администратором СБкЗ (Администратором экспериментальной области ИН МБкЗ соответственно), и возможность выбрать одну из доступных ему теорий для редактирования.
Модель, предложенная в [5], может быть использована для формирования онтологии, баз знаний, баз примеров и контрпримеров: ситуаций. Эта модель дает общий способ приобретения различных видов информации: требуется сформировать метаинформацию (онтологию), а на ее основе можно организовать интеллектуальную поддержку процесса приобретения собственно интересующей информации (знаний и данных). При этом, иерархия метаонтологии поддерживает процесс получения онтологии, онтология предметной области и онтология данных - знаний, а онтология данных - данных о действительности. Из [5, 34, 36] можно сделать вывод, что использование соответствующей онтологии является современным подходом к ориентации интеллектуальной поддержки (средств редактирования в частности) на эксперта или специалиста конкретной предметной области.
Рассмотрим подробнее процесс формирования онтологии. В первую очередь должен быть задан язык, который далее будет использоваться для формирования онтологии - специальный ЯСО. Для этого сначала нужно описать онтологию ЯСО, а потом в соответствии с ней - сам ЯСО. Описание онтологии языка является сложной задачей, не связанной с какой-либо конкретной предметной областью. Эта задача состоит в редактировании множества формул и требует специальной математической подготовки. Поэтому для ее решения привлекаются особые специалисты, которые должны обладать такой подготовкой — инженеры знаний. Необходимый минимум интеллектуальной поддержки, который нужен инженеру знаний, состоит в формальности процесса редактирования, использовании математической нотации и автоматизации, где возможно, математических вычислений. Следовательно, на этапе формирования онтологии ЯСО инженеру знаний требуется средство редактирования множества формул, обеспечивающее формальность процесса редактирования, использующее математическую нотацию, предоставляющее, где возможно, автоматизацию математических вычислений и предотвращающее или проверяющее наличие формальных ошибок во вводимой информации.
Назовем свойство средств редактирования «обеспечивать формальность процесса редактирования» Свойством 1; свойство «использовать математическую нотацию» - Свойством 2; свойство «предоставлять, где возможно, автоматизацию математических вычислений» —Свойством 3; свойство «предотвращать или проверять наличие формальных ошибок во вводимой информации» - Свойством 4. Тогда последнее требование будет выглядеть так: на этапе формирования онтологии ЯСО инженеру знаний требуется средство редактирования множества формул, обладающее Свойствами 1,2, 3 и 4.
Далее в соответствии с онтологией ЯСО инженер знаний формирует сам ЯСО. Этот прогресс состоит в конкретизации терминов онтологии ЯСО, описывающих языковые конструкции. Поэтому при решении данной задачи инженеру знаний требуется средство конкретизации значений соответствующих терминов онтологии ЯСО. В работе [9] указано, что язык для описания онтологии не может быть фиксированным. В качестве решения этой проблемы там же предложен класс языков, состоящих из ядра и набора специализированных расширений. Описать онтологию языка из такого класса, значит описать онтологии ядра и специализированных расширений, а потом использовать их совокупность в качестве онтологии ЯСО. Поэтому требуется, чтобы средство, использующее онтологию ЯСО, позволяло синтезировать ее из набора онтологии.
Экспериментальное исследование технологии использования Редактора ИРУО для редактирования информации различных уровней общности
Основной целью эксперимента было получение ответа на следующий вопрос: достаточно ли Редактора ИРУО для организации процесса редактирования всех видов информации, которые требуется хранить в информационном наполнении МБкЗ, и обеспечивает ли он необходимый носителям соответствующей информации уровень интеллектуальной поддержки этого процесса?
Согласно концепции МБкЗ, в его информационном наполнении требуется хранить следующие виды информации: описания различных ЯСО, онтологии различных уровней общности, знания и данные предметных областей. В связи с этим, задачей эксперимента было исследование способов применения Редактора ИРУО для создания специализированных средств редактирования информации указанных видов и исследование уровня интеллектуальной поддержки, организуемой этими средствами для носителей соответствующей информации в процессе редактирования.
Наиболее высокой общностью из перечисленных выше видов информации обладают языки спецификации онтологии, и они используются для описания онтологии - информации более низкого уровня общности. Поэтому в первую очередь Редактор ИРУО был использован для спецификации ЯСО. В соответствии с технологией использования Редактора ИРУО, метаинформация отсутствовала, а пользователем был языковед. Предоставляемая ему интеллектуальная поддержка состояла в использовании математической терминологии, предоставлении конструкций, предназначенных для описания искусственных языков, и формальности процесса редактирования. Далее, в соответствии с технологией использования Редактора ИРУО, к нему была подключена полученная спецификация ЯСО, в результате чего был получен редактор онтологии, ориентированный на инженера знаний. Этот редактор был использован для описания онтологии некоторой ПО. Предоставляемая инженеру знаний интеллектуальная поддержка состояла в использовании математической терминологии, предоставлении конструкций, предназначенных для описания онтологии, и формальности процесса редактирования. Показано, что описанная онтология может быть выведена в виде текста на ЯСО, использованном для ее описания. На основе полученной онтологии ПО с помощью Редактора ИРУО специфицирована система понятий для описания знаний этой ПО. Пользователем Редактора ИРУО в этом случае был инженер знаний, предоставляемая ему интеллектуальная поддержка состояла в использовании математической терминологии и терминологии ПО, предоставлении конструкций, удобных для описания систем понятий, и формальности процесса редактирования. Далее, в соответствии с технологией использования Редактора ИРУО, к нему была подключена полученная система понятий для описания знаний ПО, в результате чего был получен редактор соответствующих знаний, ориентированный на эксперта этой ПО. Предоставляемая эксперту ПО интеллектуальная поддержка состояла в использовании привычной для него терминологии и организации процесса редактирования в форме предоставления ответов на вопросы о его знаниях. Для проведения эксперимента выбраны ЯСО «Язык прикладной логики» [9] и «Instance OIL» [37, 45]. Такой выбор обусловлен тем, что, в отличие от большинства других ЯСО, «Язык прикладной логики» имеет расширяемый семантический и синтаксический базис, что делает процесс его реализации нетривиальным. В свою очередь, ЯСО «Instance OIL» выбран потому, что на сегодняшний день он получает все более широкое распространение в связи с его тесной связью с языками разметки, используемыми в сети Интернет. В качестве целевой онтологии для описания взята показательная модель онтологии ПО «Медицинская диагностика» из работы [10]. В той же работе указаны понятия онтологии, предназначенные для описания знаний, и приведен пример соответствующей модели знаний. Эти понятия и модель знаний использованы в качестве целевой системы, понятий для описания знаний и соответствующей модели знаний. технологии использования Редактора ИРУО для редактирования информации различных уровней общности В данном разделе представлены результаты исследования технологии использования Редактора ИРУО для создания специализированных средств редактирования, предназначенных для организации процесса, состоящего из следующих этапов: приобретение ЯСО «Язык прикладной логики», приобретение онтологии ПО «Медицинская диагностика» на этом ЯСО, приобретение ЯСО «Instance OIL», приобретение онтологии ПО «Медицинская диагностика» на этом ЯСО, спецификация системы понятий для описания знаний указанной ПО и приобретение знаний этой ПО. Напомним, что в соответствии с концепцией Редактора ИРУО создание специализированного средства редактирования некоторой целевой информации состоит в подключении к Редактору ИРУО метаинформации, предварительной описанной в соответствии с предложенной моделью процесса редактирования (либо в использовании Языка ИРУО, когда метаииформация отсутствует).
В соответствии с моделью процесса редактирования, описанной в Главе 3, для каждого этапа процесса редактирования должно быть указано, какая информация выступает в качестве метаинформации, а какая — в качестве целевой информации, пользователь какого типа привлекается для редактирования целевой информации, а также (если пользователем является языковед либо инженер знаний) - будет ли в дальнейшем целевая информация использоваться в качестве метаинформации. На данном этапе процесса порождения метаииформация не зафиксирована, поэтому Редактор ИРУО управляется лишь знаниями о Языке ИРУО и использует интеллектуальную поддержку, заданную «по умолчанию» и рассчитанную на языковедов и инженеров знаний (см. Главу 3).
Интерфейс Редактора ИРУО оконный, диалоговый.. Редактор ИРУО предоставляет пользователю инициативу по выбору путей процесса редактирования. Интеллектуальная поддержка пользователя отражается в интерфейсе следующим образом. Предоставляя инициативу пользователю, Редактор ИРУО делает доступными только те возможности, которые не противоречат описанию в управляющей информации. С целью помочь в выборе конкретного пути процесса редактирования, Редактор ИРУО снабжает пользователя сведениями о том, какая информация требуется для того, чтобы перейти к следующему шагу процесса. В Приложении 5 приведены примеры основных экранных форм Редактора ИРУО. Примеры процессов редактирования, приводимые в данном разделе, снабжены соответствующими ссылками на эти экранные формы (ссылки приводятся в описании процессов редактирования в виде номера экранной формы из приложения 5, записанного в круглых скобках).