Содержание к диссертации
Введение
Глава 1. Анализ и синтез условий семантического диалога . 9
1.1. Общие положения. Основные понятия и определения . 9
1.2. Исследование и формулировка "первого" условия. Принцип "коммуникации" 17
1.3. Исследование и формулировка "второго" условия. Принцип "единства знаков" 21
1.4. Исследование и формулировка "третьего" условия. Принцип "информирования" 23
1.5. Исследование и формулировка "четвертого" условия. Принцип "интеллектуальности" 24
1.6. Эвристический алгоритм семантического диалога 30
Выводы по главе 1 31
Глава 2. Концепция построения моделей знаний 33
2.1. Общие положения 33
2.2. Анализ методов сжатия семантической информации .35
2.2.1. Ручные методы: адаптивный, фиксированный, частотный 35
2.2.2. Автоматические методы сжатия 47
2.3. Технология построения моделей знаний (семантической информации) 49
2.3.1. Общие положения 49
2.3.2. Особенности моделей знаний, полученных адаптивным методом 53
2.3.2.1. Модель семантического объекта - первичная семантическая информация 53
2.3.2.2. Модель первичной семантической информации -вторичная семантическая информация 55
2.3.3. Особенности моделей знаний, полученных фиксированным методом 57
2.3.3.1. Структурированная вторичная семантическая информация, полученная методом фиксированного сжатия 57
2.3.3.2. Формализованная вторичная семантическая информация, полученная методом фиксированного сжатия 58
2.3.4. Функции семантического объекта 59
2.3.5. Типовые семантические объекты 61
2.3.6. Обобщенный алгоритм синтеза моделей знаний . 62
2.3.7. Варианты синтеза семантических моделей . 65
2.4. Анализ основных моделей данных 67
2.4.1. Продукционная модель 67
2.4.2. Фреймовая модель 72
2.4.3. Модель семантических сетей 75
Выводы по главе 2 80
Глава 3. Исследование и разработка концепции семантических операций 82
3.1. Формы представления семантической информации (знаний) 82
3.2. Варианты переработки мультимедийной семантической информации в бинарных информационных средах . 86
3.3. Семантическое выражение 87
3.4. Семантические операции 93
3.4.1. Методика реализации семантической операции "интерпретация знаний" 94
3.4.2. Модуль интерпретации знаний (для продукционных систем) 101
Выводы по главе 3 105
Глава 4. Экспериментальные исследования. Практические результаты. Внедрение 107
4.1. Общие положения 107
4.2. Прикладная система искусственного интеллекта № 1. Гибридная СИИ классификации объектов 108
4.3. Прикладная система искусственного интеллекта № 2. Гибридная СИИ прогнозирования (СИИ-2) 125
4.4. Прикладная система искусственного интеллекта № 3. Управляющая система искусственного интеллекта (СИИ-3). 130
4.5. Прикладная система искусственного интеллекта № 4. 141 Прогнозирующая система искусственного интеллекта (СИИ-4).
Выводы по главе 4 145
Заключение по диссертационной работе 147
Библиографический список литературы 151
Приложения 158
- Исследование и формулировка "первого" условия. Принцип "коммуникации"
- Ручные методы: адаптивный, фиксированный, частотный
- Формы представления семантической информации (знаний)
- Прикладная система искусственного интеллекта № 1. Гибридная СИИ классификации объектов
Введение к работе
Существует класс задач, которые невозможно решить традиционными формальными методами [1]. Это обусловлено тем, что формулировка таких задач предоставляется в виде знаний, а их решение сводится к смысловой переработке знаний. Примером таких задач являются: семантическая классификация объектов, прогнозирование ситуации на смысловом уровне, интерпретация сущности явлений и др.
Указанный класс задач определен как интеллектуальные задачи [2 ].
Для решения таких задач необходимы новые неформальные методы. [Тема рассматриваемой диссертации посвящена исследованию и разработке именно такого метода].
Интеллектуальные задачи решаются в структуре «Источник -Приемник», где в качестве источника и приемника выступают равноправные партнеры по переработке информации, представленной в форме знаний. [4]. Примером такой структуры является "Пользователь (П) - экспертная система (ЭС)".
Обязательным этапом решения интеллектуальных задач является взаимное информирование партнеров, иначе говоря, ведение семантического диалога между ними. [5,6]. Кроме того, в процессе решения таких задач партнеры должны взаимно обучаться, используя при этом информацию, поступающую по каналам обратных связей. [7].
Применительно к структурам «П-ЭС», «ЭС-П», взаимное информирование и обучение представляют определенные трудности.
Прежде всего, это связано с принципиальным ограничением возможности взаимного адекватного информирования, обусловленного действием в среде семантической информации (знаний) принципа субъективизма [8].
Согласно указанному принципу, «адекватная интерпретация одной и той же семантической информации различными семантическими объектами невозможна».
Таким образом, существует проблема, связанная с необходимостью ослабления ограничения, накладываемого принципом субъективизма, для реализации семантического диалога между партнерами в процессе решения интеллектуальных задач.
Анализ литературы по данной проблеме [9,10] показал, что в настоящее время отсутствуют завершенные исследования по ее решению.
Выбор модели представления знаний также является обязательным этапом [11-13] решения интеллектуальных задач.
Существующие модели представления знаний в форме продукций, фреймов, семантических сетей и др. [14] являются эвристическими, не объясняют принципы их построения, семантическую сущность и обоснование их выбора.
Представляется важным, прежде всего с научной точки зрения, концепция построения указанных моделей и их версификация.
Анализ литературы по данной проблеме показал [15,16], что при решении интеллектуальных задач, а также в процессе проектирования систем обработки знаний, при выборе модели знаний, разработчики руководствуются интуитивными соображениями.
Таким образом, методология построения моделей знаний является важной проблемой в общей концепции обработки информации, представленной в форме знаний. В настоящее время в научной литературе отсутствуют завершенные исследования по данной проблеме.
Определяющим этапом решения интеллектуальных задач является смысловая переработка знаний.
7 Существующая на практике методика обработки знаний на основе механизма логического вывода является описательной и реализована в виде программного продукта.
Указанное положение не объясняет сущности смысловой переработки знаний с точки зрения научного подхода. Необходимы новые научные подходы.
Анализ литературы по данной проблеме показал [17-23], что в настоящее время подобная постановка проблемы является новой, гносеологической и не имеет завершенных исследований.
В связи с изложенным, цель диссертационной работы формулируется в следующем виде: "Разработка научных положений метода семантического информирования".
Основными задачами научных исследований, выносимыми на защиту диссертации, являются:
Исследование и разработка условий семантического диалога;
Исследование и разработка концепции построения моделей знаний;
Исследование и разработка концепции семантических операций;
Разработка методики проектирования систем обработки знаний различного назначения.
Перечисленные исследования и полученные при этом результаты отображают сущность разработанного метода, являются его определяющими аспектами.
Разработанный метод представляет собой совокупность научных положений, обеспечивающих решение интеллектуальных задач, и является научной основой проектирования систем обработки знаний различного назначения.
Исследование и формулировка "первого" условия. Принцип "коммуникации"
Из выражения (1.4) следует, что цель функционирования ISS может быть достигнута и зависит от указанного перечня элементов. При этом понятие перечня элементов может включать как отдельные элементы, так и различные сочетания их между собой по два, по три и т.д. Конкретный набор элементов, обеспечивающий достижение цели, зависит от задачи, решаемой системой.
Поясним элементы выражения (1.2): а - цель является центральным понятием ISS. Для формальных систем цель представляет собой формализованное достижение результатов функционирования системы, т.е. достигается в соответствии с алгоритмом, который реализует данная система. Для неформальных систем ISS, цель представляет собой неформализованное достижение результатов функционирования системы. Таким образом, цель достигается на основе использования "мягкой логики", которой обладает система. Иначе говоря, за счет "гибкой" обработки информации, т.е. на основе семантического взаимодействия с объектами реального мира, в том числе и с людьми [24]. st - структура системы должна быть так организована, чтобы обеспечивать достижение цели. Это особенно важно на начальных этапах организации системы. В том случае, когда структура системы не соответствует достижению цели, возникают противоречия, вызывающие нестабильность системы. met - методы должны обеспечить достижение цели. При этом желательно применять проверенные методы. В случае их отсутствия может возникнуть необходимость в разработке новых методов. средства должны быть направлены на достижение цели. Средства рассматриваются в широком смысле: технические, программные, языковые, др. SemSI - наличие данного элемента в формальном описании ISS характеризует одно из специфических свойств указанных систем и принципиально отличает их от других систем. Знак "Sem" характеризует наличие "семантической операции", иначе говоря "семантическую переработку семантической информации", включая и информацию, полученную по каналам обратной связи. В процессе функционирования ISS обязательно выполняются семантические операции. Знак SI обозначает "семантическую информацию". условия должны соответствовать достижению цели. Они классифицируются на внешние и внутренние (для конкретной системы).
Условия должны учитывать предысторию и последствия, связанные с достижением системой цели; требования, из которых надо исходить; обстоятельства, от которых зависит достижение цели, исходные данные и пр. At - время должно быть предварительно определено так, чтобы обеспечить выполнение задачи. Выделяют "интервал времени", в котором совершается необходимая деятельность для достижения цели. Согласно данным работы [25] в ISS выделяют типовые семантические объекты, которые представлены множеством вида: где m - человек (группа лиц, коллектив); d - документ (документы) - носитель семантической информации любой формы; г - машина (например экспертная система или любая система искусственного интеллекта). В ISS человек (т) и машина (г) выполняют функции "источника SI" , "приемника SI" и "посредника" между семантическими объектами, а документ (d) - только функцию "источника SI". Поясним кратко указанные функции SO в ISS. Являясь источником, SO "генерирует SI". В функции приемника SO "понимает SI", т.е. принимает решение на основании полученной SI. В качестве посредника SO выполняет семантические операции над SI, и , кроме того, он может быть "источником" и/или "приемником". Образуем из множества Mi (выражение 1.5) другое множество - М2, содержащее двойные элементы. Для этого применим операцию "декартово произведение" к элементам множества В результате получим девять двойных элементов, каждый из которых характеризует класс систем обработки знаний. Свойство каждого класса определяется в следующих понятиях: l.(m,m) - "человек, человек"; 2. (m,d) - "человек, документ"; 3. (m,r) - "человек, машина"; 4. (d,d) - "документ, документ"; 5. (d,r) - "документ, машина"; 6. (d,m) - "документ, человек"; 7. (г,г) - "машина, машина"; 8. (r,m) - "машина, человек"; 9. (r,d) - "машина, документ". Следует заметить, что правомерность существования указанных классов определяется возможностью функционирования системы обработки знаний, содержащей типовые семантические объекты в данном классе. Из анализа указанных классов следует, что только четвертый класс (d,d) - не имеет право на существование. Это обусловлено тем, что функционирование такой системы невозможно, поскольку оба SO являются источниками SI. Во всех перечисленных классах, кроме четвертого, в процессе функционирования имеет место обмен информацией, обусловленный семантическим диалогом [26].
Ручные методы: адаптивный, фиксированный, частотный
Дано определение семантического диалога. Показано, что семантический диалог - это смысловое взаимодействие между источником и приемником в информационной семантической системе. Неотъемлемым свойством семантического диалога является информирование
Дано строгое определение понятия "информационная семантическая система". Выделены специфические особенности указанных систем, принципиально отличающие их от других систем. К таким особенностям относятся смысловая переработка семантической информации и самообучение. Дано формальное описание информационной семантической системы в виде кортежа, содержащего семь элементов (цель, структура, методы, средства, обработка семантической информации, условия, интервал времени), являющихся атрибутами системы. Показано, что структура "пользователь -экспертная система" является информационной семантической системой. 4. Проведен анализ и выполнен синтез условий семантического диалога. Сформулированы четыре условия, обеспечивающие семантический диалог в рассматриваемых системах. К ним относятся: пересечение тезаурусов источника и приемника; единство знаковых систем в пересекающихся областях; истинность процедур в процессе взаимного информирования; достижение цели системой и самообучение семантических объектов в процессе взаимного информирования. 5. Выполнены исследования и сформулированы научные положения, являющиеся теоретической основой указанных условий семантического диалога. К ним относится совокупность сформулированных принципов: "принцип коммуникации", "принцип единства знаков", "принцип информирования", "принцип интеллектуальности систем". 5. Предложен эвристический алгоритм семантического диалога, отображающий сущность сформулированных условий семантического диалога. 6. Определены прикладные аспекты разработанных научных положений. Показано, что семантический диалог является атрибутом структуры "пользователь-система обработки знаний", а сформулированные научные положения являются основой проектирования соответствующих модулей указанных структур. Глава 2. Концепция построения моделей знаний. 2.1. Общие положения. В данной главе рассмотрен комплекс вопросов теоретического, методического и практического характера по исследованию и разработке концепции построения моделей знаний. Указанный перечень вопросов составляет сущность 2-го аспекта разработанного метода. Введем ряд основных определений и понятий. Определение 2.1. В общем случае модель - система объектов или знаков, воспроизводящих некоторые существенные свойства оригинала (системы, объекта). Модель можно использовать в качестве заменителя или представителя изучаемой системы (объекта). В зависимости от цели, поставленной перед ISS, один и тот же семантический объект может иметь различные модели. В основе модели семантического объекта находится взаимодействие трех базовых категорий: структуры объекта, свойств объекта, отношения объекта с другими объектами в составе ISS. По видам семантическую информацию об объектах классифицируют на первичную и вторичную. Определение 2.2. Первичной считается семантическая информация, отражающая посредством знаков независимо от формы представления результаты обобщений, исследований, разработок, наблюдений, сочинений и пр., имеющие завершенный характер. Создание первичной SI об объекте является сложным творческим процессом. Ему предшествует познание объекта, его свойств, структуры и отношений с другими объектами. Обычно для человека важны не все стороны интересующего его объекта одновременно, а только те из них, которые отвечают поставленной цели. (В таком случае познание объекта естественно характеризуется огрублением). С точки зрения теории познания, первичная SI представляет собой зафиксированное отображение выделенной человеком стороны (сторон) объекта. Невозможно найти универсальный алгоритм, пригодный для создания первичной SI об объектах во всех областях знаний. Однако человек при создании первичной SI руководствуется выделением относительно устойчивых категорий, обеспечивающих ему построение своего рода каркаса или логической структуры для синтеза первичной SI . Такими категориями являются категории познания: цель, метод, средство, количество, качество и др. (Категории - обобщенное отражение объективной реальности и вместе с тем существенное определение аспекта объекта). Используя указанные категории, переходящие в конкретные понятия данной области знаний, можно создать первичную SI об объекте. Чем больше приводится сведений об объекте, тем полнее и точнее воспроизводятся свойства объекта. Достигается это определенной избыточностью информации, наличием конкретных данных, параметров, характеристик и т.д. Определение 2.3. Вторичной считается семантическая информация, которая отражает посредством знаний для заданной формы представления, результат аналитико-синтетического и логического преобразования первичной SI.
Формы представления семантической информации (знаний)
Выражение (3.5.) представляет собой множество бинарных мультимедийных информационных сред. Поясним варианты переработки информации в указанных средах. Вариант 1. M2i = {Р,Р} - переработка "первичной SI в первичную SI". Примером является переработка первичной текстовой информации в первичную графическую информацию. Вариант 2. М22 = {Р р} - переработка "первичной SI во вторичную SI". Примером является переработка первичной текстовой информации (статья) во вторичную текстовую информацию (реферат). Вариант 3. Мгз = {р,р} - переработка "вторичной SI во вторичную SI". Примером является переработка вторичной текстовой информации во вторичную визуальную информацию. Вариант 4. М24 - {р,Р} - переработка "вторичной SI в первичную SI". Примером является переработка вторичной графической информации в первичную аудиальную информацию. В рассмотренных вариантах и примерах их поясняющих, обязательным условием является "сохранение" (адекватность) семантики и прагматики в процессе переработки знаний. Что касается синтаксиса, то он, естественно, изменяется и определяется соответствующей формой SI. Следует заметить, что адекватность имеет относительные (не абсолютный) характер. Смысловая переработка знаний осуществляется посредством соответствующих семантических операций. Определение 3.1. "Семантическое выражение" определяет формальное описание совокупности процедур смысловой обработки знаний, выполняемых семантическими объектами для получения результата (решения задачи, достижения цели). Специфической особенностью смысловой обработки знаний семантическими объектами является использование информации, поступающей к ним по каналам обратной связи. Иначе говоря, имеет место самообучение семантических объектов. Семантическое выражение является дальнейшим развитием и обобщением понятий "аналитическое выражение", "арифметическое выражение", "логическое выражение". Формальное описание структуры семантического выражения представляется записью вида: NSO (SO,, S02) is Sem [SO,(2) predicate SO?(1)l - Res (3.6) SO], S02 є ISS, S0/2), S02(1) є ISS Выражение (3.6.) содержит три части: левую - NSO (SOi, S02), SOi, S02 є ISS ; центральную - Sem [SO/2) predicate SO2 ]; правую - Res . Сделаем пояснения компонентов (3.6.). NSO - от англ. (Name of Semantic Operation) - имя семантической операции, название семантической операции. SObS02 - от англ. (Semantic Object) - обозначает понятие "семантические объекты", участвующие в операции; в общем случае количество семантических объектов может быть произвольным n=0..i. ISS - от англ. (Informational Sematic System) информационная семантическая система (в исходном состоянии). Sem - от англ. (Semantic) - знак "семантического выражения". SOi(2), S02(1) - обозначение семантических объектов в процессе "самообучения". (Объекты учитывают информацию, поступающую по каналам обратных связей). При этом SO/ ) учитывает информацию, поступающую от SO aSO -OTSOb ISS - информационная семантическая система в динамическом режиме работы ( в процессе функционирования системы, семантические объекты самообучаются). predicate (предикат) - обозначает сказуемое (логическое утверждение); является операторным предикатом; определяет название "семантической операции", ее сущность и алгоритм реализации. Res - от англ. (Result) - обозначает результат, итог; знак результата семантической операции. Следует отметить, что в качестве результата выполнения семантической операции могут быть: - новые знания; - модификации существующих знаний; - действия и пр. is - от формы англ. глагола (to be) - быть, являться. Данный знак является знаком "отношения" (предикатом отношений). _ - знак следования. ( ), [ ] , - круглые, квадратные скобки, операторная скобка -являются вспомогательными знаками. Квадратные скобки предполагают возможность наличия сложного алгоритма, процедуры которого разделяются круглыми скобками. Операторная скобка выделяет операторный предикат. Примечание 1. Как правило, при выполнении семантической операции, семантический объект SO/2) (левый) доминирует над SC 2(1) (правым). Пример 3.1. В структуре ISS - "система поддержки принятия решения", класса "человек-машина (система искусственного интеллекта, ЭС)" доминирует человек (SOi), т.е. лицо принимающее решение над ЭС (SO2). В рассматриваемой структуре ЭС (SO2) обеспечивает функции, "поддержки" принятия решения". Пример 3.2. В структуре ISS - "диагностическая экспертная система", класса "машина (SOi - человек SO2)", доминирует машина, т.е. экспертная система (SOi) над человеком (S02). В указанной структуре SOi (ЭС) принимает решение, делает вывод по результатам диагностики, a S02 - поддерживает диалог, являясь партнером в процессе решения задачи. С точки зрения математической логики , в семантическом выражении, как и в аналитическом выражении, можно выделить следующие основные группы знаков: а) знаки объектов (SOb S02,...); б) знаки операций (predicate); в) знаки отношений (is, _ ); г) вспомогательные знаки, т.е. скобки ([ ], ( ) и др.), устанавливающие порядок сочетания основных знаков. Примечание 2. Специфической особенностью семантического выражения является также то, что семантическая операция выполняется в структуре ISS. При этом различают исходный ISS и динамический ISS режимы функционирования системы. Правомерность утверждения того факта, что семантической выражение является обобщением других выражений (аналитических, арифметических, логических и др.) подтверждается записью на естественном языке арифметического выражения вида (3.7.):
Прикладная система искусственного интеллекта № 1. Гибридная СИИ классификации объектов
В четвертой главе содержатся материалы, обеспечивающие верификацию научных положений разработанного метода.
Дано изложение принципов функционирования и описание трех разработанных гибридных систем искусственного интеллекта (СИИ) различного назначения в предметной области "Учебный процесс" в системе высшего образования. Первая СИИ предназначена для решения задачи "семантической классификации объектов". Вторая СИИ обеспечивает решение задачи "семантического прогнозирования". Третья СИИ решает задачу "семантического управления". Показано, что в основе проектирования указанных СИИ находятся научные положения разработанного метода. Последние включают перечень следующих основных аспектов: 1. Обоснование условий "семантического диалога" в структуре "Пользователь - СИИ", представленных совокупностью принципов. 2. Обоснование концепции построения моделей знаний, представленных в виде "адаптивных" и "фиксированных" моделей. 3. Разработку концепции "семантических операций", обеспечивающих смысловую переработку знаний. Убедительно показано, что многолетняя опытная эксплуатация указанных систем полностью подтвердила правильность методики проектирования и научные положения разработанного метода. Задача классификации объектов относится к числу важных научно-технических проблем в различных областях науки и техники. Указанная задача достаточно эффективно решается человеком на эвристическом уровне. Однако замена естественного интеллекта искусственным представляется весьма актуальной. К числу перспективных методов решения данной задачи относится разработанный метод. Прикладной характер разработанного метода содержит шесть взаимосвязанных сущностей: -представление предметной области (ПО) в виде базы знаний; -манипуляции с базой знаний с использованием семантических операций с целью решения задачи; -получение текущих фактов на основе семантического диалога; -наличие объяснительных функций по сделанным системой заключениям; -актуализация знаний в базе знаний и их модификация (накопительная функция, учитывающая информацию, поступающую по каналам обратных связей); -достижение поставленной цели. Для решения задачи семантической классификации объектов разработан модифицированный метод, использующий технологии баз данных и знаний. Указанный метод содержит следующий перечень аспектов: 1. Выбор объектов в заданной предметной области. 2. Разработка моделей данных. 3. Синтез процедур формирования "текущих фактов". 109 4. Синтез процедур извлечения знаний из источников знаний и их структуризация. 5. Выбор модели представления знаний. 6. Разработка алгоритма классификации объектов. 7. Реализация механизма принятия решения. 8. Учет информации, поступающей по каналам обратных связей. Кратко поясним указанные аспекты модифицированного метода. Применительно к первому аспекту. Выбор объектов в заданной ПО определяется целью, которая формулируется исследователем для решения конкретной задачи. Применительно ко второму аспекту. Определенными достоинствами, по сравнению с другими моделями, обладает реляционная модель - своей простотой, скоростью обработки на компьютере и практической полезностью. Применительно к третьему аспекту. Используя возможности выбранной СУБД, применительно к решаемой задаче, формируются процедуры обработки информации в БД с целью получения "требуемых данных", которые являются "текущими фактами" ("фиксированные факты" составляют левую часть правил базы правил). Текущие факты запоминаются и используются в дальнейшем в среде БЗ выбранной ПО. Применительно к четвертому аспекту. Применяя разработанную методологию (см. главу 3.), извлекают требуемые знания для решения конкретной задачи. Применительно к пятому аспекту. Используя разработанную методологию синтеза моделей знаний (см. главу 3.) , определяют один из типов моделей (Mi или М2) для решения конкретной задачи. Применительно к шестому аспекту. Алгоритм классификации объектов представляет собой совокупность процедур обработки информации, включая обработку знаний для достижения цели. ( Следует заметить, что разработка алгоритма классификации относится к творческому процессу и является субъективной). Применительно к седьмому аспекту. Реализация механизма принятия решения осуществляется системой (совокупность процедур интерпретации (см. главу 3.)). На рис. 4.1. приведена структурная схема разработанной СИИ для классификации объектов.