Введение к работе
" s ;
Актуальность тени. Растущие мощности современных вычислительных систем постоянно расширяют круг практических задач, решение которых возможно с использованием средств искусственного интеллекта и распознавания образов. При этом, применяются все более сложные модели, призванные описывать явления, для которых затруднительно получить количественные характеристики. Неопределенность информации в системе распознавания вызывается как неточностью измерительной аппаратуры, так и тем, что часто в качестве таковой выступает человек, что особенно характерно для экспертных систем. Неполнота является неотъемлемым дополнением любой информации, поступающей в систему. Основіше методы учета неполноты информации могут быть отнесены к следующим трем категориям: вероятностные, эмпирические и нечеткие.
Использование вероятностного подхода к распознаванию образов затрудняет то, что требования налагаемые на признаки часто оказываются невшюлнимыми. Вероятностное пространство (в конечном случае) состоит из элементарных собитіій, считающихся несовместными. Это обусловливает ту особую роль, которую играют в статистической теории . независимые случайте величины и, соответственно, независимые признают. В реальной же ситуации, признаки почти всегда взаимозависимы. В большішстве моделей используется предположение нормальности распределения признаков, в то время как, обычно, признаки не распределены по какому-либо хоропо известному закону. Часто бывает трудным или невозможным получение выборки достаточного объема, для того, чтобы статистические оценки были достоверными. Кроме того, в вероятностном подходе оченьр; сложно описать факт отсутствия информации.
Что касается эмпирических методов, таких как факторы уверенности экспертной системы MYCIN и их развитие в системе Intersensor, или байесовский подход оценки свудетельств (PROSPECTOR), то не известны границы их применимости.
- г -
С другой стороны, теория нечетких множеств,
сформулированная Л.А.Заде четверть века назад, предлагает
естественный аппарат для представления, таких понятий теории
распознавания образов, как объект и класс, «размытость» которых
не обязательно должна выражаться в случайности. Классы и
объекты, в конечном итоге, интуитивно определяются
наблюдателем, в воображении которого они представляются скорее
нечеткими нежели случайными. Альтернативой теории вероятности
является теория возможностей, развиваемая с 50-х годов. В
отличии от вероятностного пространства, возмокностное строится
из В38ИМНО вложенных .д^уг в друга событий, что херено
соответствует стратегии классификации «сверху-вниз», когда
каждый шаг іслассификации все более' сужает рассматриваемую
область пространства образов, предполагая иерархичность его
строения. э .
Настоящая работа посвящена исследованию вопросов использования теории нечетких множеств и теории возможностей в задачах распознавания образов. При этом, основное внимание было уделено деревьям решений. Деревья решений это универсальное средство представления знаний, близкое к продукциям. Наиболее широко используемые до сих пор четкие и ' вероятностные .деревья решений сужают . возможности методов распознавания из-за неадекватности детерминистских и вероятностных моделей. Выше сказанное делает актуальным использование нечетких деревьев. К деревьям решений тесно примыкает понятие граф-схемы, предложенное впервые для описания алгоритмов Л.А.Калужининым в 1959г. Граф-схемы оказались эффективным средством представления решающих правил.
В связи с этим, представляется актуальным применение теории нечетких множеств и теории возможностей для обобщения понятия граф-схемы при исследовании и разработке инструментальных средств решения задач распознавания, ориентированных на использование нечетких данных.
Цель и задачи работы. Целью работы является исследование алгоритмов и методов реализации системы нечеткого обучения на основе использования граф-схем и теории возможностей,
удовлетворяющей следующим требования!,!:
возможности использования нечетких обучающих примеров;
допустимости противоречивых обучающих примеров;
возможности отсутствия значений некоторых признаков как на этапе обучения, так и при распознавании;
возможности использования взаимозависимых признаков;
допустимости одновременного использования как четких, так и нечетких представлений данных.
В соответствии с указанными целями работы, в диссертации решены еледукцие задачи:
-
Получена формальная постановка задачи нечеткого обучения с учителем в терминах теории возможностей.
-
Разработаны алгоритмы и методы построения нечетких классификаторов на основе нечетких граф-схем.
-
Разработаны архитектура и программная реализация системы нечеткого обучения.
?.?этоды исследования. Для решения указанных задач используется аппарат теории нечетких множеств Заде, теории возможностей, теории Демпстера-Шейфера и системы программирования языка Ada.
Научной новизной работы являются:
1. Обобщение понятия граф-схемы принятия решения на основе
использования:
пары граф-схем, одна из которых оценивает возможности, а другая - необходимости принадлежности классифицируемого объекта классам;
нечетких множеств в качестве весов дуг;
- условных возможностей и необходимостей в качестве
факторов уверенности переходов по дугам граф-схемы.
-
Разработка метода построения нечеткой граф-схемы по нечеткому обучающему множеству и его исследование.
-
Метод бинаризации признаков с упорядоченными шкалами и его использование при построении граф-схемы.
4. Метод дообучения и изменения порядка проверки признаков, при поступлении дополнительных обучающих примеров.
Практическая ценность.
-
Разработан конкретный алгоритм ' построения нечеткой граф-схемы.
-
Разработана программная система нечеткого обучения на основе граф-схем, реализующая алгоритм нечеткого обучения, базу знаний обучения, объектно-ориентированное меню, экранный редактор обучащйд. множеств, подсистемы импорта обучающих множеств и просмотра структуры классификаторов.
-
Разработан пакет прикладных программ построения диалоговых систем, включающий методы редактирования строк, сопоставления образцов, бработки файлов, интерпретации инфиксных выражений.
Внедрение результатов работы. Теоретичешсие и практические результаты диссертационной работы использовались в хоз договорной научно - исследовательской работе НИР МО-58 по. разработке экспертной системы поддержки работы оператора специализированного радио - технического комплекса, выполненной на кафедре математического обеспечения и применения ЭВМ ЛЭТИ им. В.И-.Ульянова /Ленина/ в 1990 - 1991гг, а так se в НИР по разработке коымплексной системы классификации сигналов, выполненной по договору с Россйским НИИ' космического приборостроения в 1991 - 1992гг.
Апробация работа. Основные положения и результаты диссертационной работа докладывались на научно - практических конференциях ЛЭТИ им. В.И.Ульянова /Ленина/ в 1989 - 1.991гг., на 5-м Ленинградском симпозиуме по теории адаптивных ' систем, 1991, на межотраслевом научно - техническом семинаре «Разработка архитектуры и программного обеспечения вычислительных систем обработки информации в реальном времени, использующих микромощную элементную базу», г.Ленинград 1991 г.
Публикации. По теме диссертации опубликовано 7 печатных работ.
Структура и объем работы. Диссертация состоит из введения, пяти глав с выводами, заключения. Основная часть работы изложена на 139 страшщах маїгашошісного текста. Работа содержит 37 рисунков, 4 таблицы. Список литературы включает Tw нн-пменовашй.