Содержание к диссертации
Введение
1. Анализ подходов к моделированию информационных процессов в системах коммуникации и компьютерных сетях
1.1. Элементы телекоммуникационных технологий и методы управления информационными потоками в сетях связи 13
1.2. Моделирование информационных потоков в сиситемах коммуникации и компьютерных сетях 28
1.3. Проблема управляемости и системно-интегрированный подход к управлению информационными процессами в ТКС 38
1.4. Выводы 50
2. Разработка гибридных моделей информационных процессов с использованием методологий мягких вычислений 52
2.1. Интеллектуальные технологии анализа слабо структурированных временных процессов и рядов 53
2.2. Архитектура гибридной пронозирующей системы 70
2.3. Разработка гибридной нечетко-темпоральной модели временного процесса 81
2.4. Разработка динамической нечетко-логической модели с "несинглетным" выводом 92
2.5. Экспериментальное исследование нечетко-динамических гибридных моделей 97
2.6. Выводы 105
3. Методы автоматического формированрія, обучения и адаптации нечетко-динамических моделей
3.1. Анализ подъходов к обучению и адаптации нечетко-динамических моделей на основе парадигм эволюционного моделирования и гибридизации 109
3.2. Разработка общего подхода к обучению нечетко-динамических моделей на основе принципов интеллекутализации и гибридизации 122
3.3. Гибридная сетевая модель для извлечения нечетких правил в базах данных нечетко-динамических моделей 134
3.4. Выводы 146
Заключение 148
Список литературы 151
- Моделирование информационных потоков в сиситемах коммуникации и компьютерных сетях
- Проблема управляемости и системно-интегрированный подход к управлению информационными процессами в ТКС
- Разработка гибридной нечетко-темпоральной модели временного процесса
- Разработка общего подхода к обучению нечетко-динамических моделей на основе принципов интеллекутализации и гибридизации
Введение к работе
Актуальность проблемы. Достижение высоких социальных и экономических результатов в развитии современного информационного общества невозможно без развития его инфраструктуры, ключевую роль в которой играют вычислительная техника, компьютерные сети и средства телекоммуникации Развитие информационной инфраструктуры предполагает активизацию работ, как в области модернизации старой техники, так и в области создания новых поколений телекоммуникационных (ТКС) и компьютерных систем Решение обеих задач невозможно без разработки соответствующих математических моделей, на основе которых осуществляется исследование информационных процессов и систем, их проектирование, а также разработка алгоритмов управления информационными системами и процессами
Одним из известных подходов к моделированию информационных
временных процессов (ИВП) и режимов функционирования ТКС является
имитационное моделирование, осуществляемое с использованием средств
генерации случайных процессов, обладающих заданными свойствами.
Однако, методы генерации потоков обеспечивают возможность
воспроизведения ИВП с точностью до реализации в нем заданных средне
статистических характеристик, не гарантируя при этом точного
воспроизведения самого процесса, как временной функции (шейпа) на
заданном конкретном временном интервале Тем не менее, в ряде задач,
связанных с упреждающим контролем и управлением
телекоммуникационными и компьютерными системами, требуется как можно более точное прогнозирование развития самого процесса, что требует разработки специального класса прогнозирующих моделей.
Разработка адекватных прогнозирующих моделей информационных процессов, протекающих в распределенных системах и компьютерных сетях, относится к классу слабо формализованных задач и является сложной проблемой Это объясняется наличием множества случайных и нечетко-определенных факторов, влияющих на характер поведения ИВП, а также сложным характером временного взаимодействия определяющих факторов в структуре ИВП, что приводит к появлению различного рода нестационарностей, сложных корреляционных зависимостей и временных сдвигов в потоках данных Вышесказанное обуславливает необходимость разработки новых подходов к исследованию ИВП, способных преодолевать указанные выше трудности
Перспективным подходом к моделированию слабо структурированных процессов является подход, основанный на использовании принципа гибридизации, заключающегося в комбинировании традиционных методов моделирования ИВП с интеллектуальными технологиями, опирающимися на модели знаний и парадигмы "мягких" вычислений Причем, в рамках гибридизации именно интеллектуальные модели и мягкие вычисления, как
инструмент моделирования ИВП, играют важнейшую роль, поскольку они позволяют восполнить дефицит информации об исследуемом процессе за счет привлечения дополнительных экспертных знаний.
Для решения слабо формализованных задач, связанных с интеллектуальным моделированием поведения сложных динамических процессов и систем, в настоящее время активно разрабатываются интеллектуальные технологии Большой вклад в становление и развитие данных теорий внесли российские ученые: Батыршин, Вагин В Н, Журавлев Ю.И, Кузнецов О.П., Нариньяни А С , Осипов Г С , Поспелов Д А, Попов Э В , Стефанюк В Л, Тарасов В Б, Финн В.К. и др. Большой вклад в развитие теории мягких вычислений и методов гибридизации внесли российские ученые. Аверкин А.Н, Берштейн Л С, Вагин В Н., Емельянов В В., Еремеев А.П., Ковалев С М., Мелихов А Н, Потапова Р К., Цемель Г И, Ярушкина НГ идр
Развитие гибридных технологий в области моделирования ИВП требует решения комплекса задач, начиная с анализа существующих технологий управления с целью выявления характерных особенностей возникающих здесь задач и разработки общей структуры гибридной прогнозирующей системы, завершая разработкой частных прогнозирующих моделей, методов их обучения и адаптации.
Объект исследования Исходя из сказанного, в качестве основного объекта исследования диссертации выбран новый класс гибридных прогнозирующих моделей, основшшых на объединении традиционных вычислительных технологий моделирования ИВП с интеллектуальными технологиями В соответствии с выбранным направлением исследования сформулирована основная цель работы.
Цель исследования Целью исследования является развитие гибридных технологий моделирования слабо структурированных временных процессов на основе комбинированного использования методов численного анализа и методологий мягких вычислений
Задачи исследования В соответствии с поставленной целью в диссертации решаются следующие задачи
1 Анализ существующих технологий управления в системах коммутации и компьютерных сетях с целью выявления наиболее характерных возникающих здесь проблем и задач.
2. Разработка архитектуры гибридной прогнозирующей системы, приспособленной для работы как с четко определенными данными о состоянии моделируемого процесса, так и с нечетко-определенными данными, описывающими экспергаые знания о поведении ИВП
3 Разработка частных моделей для гибридной прогнозирующей системы, способных оперировать динамической информацией о моделируемом ИВП
4. Разработка методов моделирования ИВП, мало чувствительных к шумам и случайным выбросам в данных, с целью получения на их основе устойчивых краткосрочных и долгосрочных прогнозов
-
Разработка методов обучения и адаптации гибридных прогнозирующих моделей, обеспечивающих оптимальный баланс между интерпретационной пригодностью модели и точностью реализуемых на ее основе прогнозов
-
Разработка алгоритмов и программ, имитирующих функционирование гибридной прогнозирующей системы, с целью экспериментальной проверки эффективности предложенных моделей.
Методы исследования В диссертационной работе использованы методы теории искусственного интеллекта, включая методы мягких вычислений, системного анализа и теории массового обслуживания
Методологическую основу работы составляет концепция гибридизации, заключающаяся в объединении традиционных методов моделирования СВП, основанных на идеях нейросетевого анализа и локального сглаживания, с интеллектуальными методами, основанными на моделях знаний.
Научная новизна исследования Научная новизна исследования заключается в решении важной научно-технической задачи моделирования и прогнозирования поведения слабо структурированных информационных процессов в системах коммутации и компьютерных сетях, имеющей существенное значение для развития методов математического моделирования сложных динамических процессов и систем.
К наиболее существенным научным результатам работы относятся следующие:
1 На основе анализа существующих технологий управления в системах
коммутации и компьютерных сетях обоснована необходимость
использования гибридных технологий при построении прогнозирующих
моделей. В соответствии с этим разработана новая архитектура темпоральной
нейро-нечеткой прогнозирующей системы, предназначенной для обработки
как четких числовых данных, поступающих в систему с информационных
датчиков, так и нечетко-определенной информации, поступающей от
экспертов.
-
Для гибридной прогнозирующей системы разработан новый класс нечетко-логических моделей, способных оперировать динамической информацией о качественных временных, и нечетко-временных зависимостях между определяющими признаками ИВП Для данных моделей разработаны методы вывода, мало чувствительные к шумам и случайным выбросам в данных, благодаря чему достигается возможность получения на их основе устойчивых краткосрочных и долгосрочных прогнозов
-
Разработан комплекс методов структурно-параметрической адаптации прогнозирующих моделей на основе прющипов, обеспечивающих оптимальный баланса между интерпретационной пригодностью модели и ее аппроксимирующей точностью. Предложенные методы позволяют выявлять в исследуемом ИВП наиболее существенную информацию о его внутренней структуре, что способствует повышению качества принимаемых решений, связанных с долгосрочными прогнозами и прогнозами в условиях помех.
Практическая значимость работы Практические эксперименты, проведенные с разработанными в диссертации гибридными моделями,
подтвердили практическую эффективность использования этих моделей с целью идентификации ИВП, а также подтвердили возможность получения долгосрочных прогнозов с точностью в 10-15%
Практическая ценность работы состоит в применении полученных результатов на предприятиях связи для решения задач, связанных с прогнозированием телетрафика Практическая ценность работы также определяется возможностью использования предложенных моделей в интегрированных системах управления информационными процессами в действующих системах коммуникации и компьютерных сетях.
Достоверность и обоснованность результатов Достоверность и обоснованность результатов подтверждается логическим выводом, результатами вычислительных экспериментов, публикациями и апробацией работы на региональных, отраслевых и Всероссийских научно-технических конференциях, а также актами внедрения результатов работы
Реализация и внедрение результатов работы Работа выполнялась в рамках госбюджетных и хоздоговорных НИР, проводимых на кафедре «Автоматики и телемеханика на железнодорожном транспорте» Ростовского государственного университета путей сообщения (РГУПС), а также в рамках НИР, поддержанной Российским фондом фундаментальных исследований проект №04-01-00277. Практические результаты диссертационной работы внедрены на кафедре «Автоматики и телемеханики на железнодорожном транспорте» РГУПСа, в Ростовском филиале ВНИИАС МПС России, в Краснодарском филиале ОАО «Южная телекоммуникационная компания» (г Краснодар)
Апробация результатов работы. Основные результаты докладывались и обсуждались на VII Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления" (г Таганрог, 2004 г), Международной конференции «Интеллектуальные системы (ШЕЕ AIS'06)» (с. Дивноморское, 2006 г), X Национальной конференции по искусственному интеллекту с международным участием «КИИ - 2006» (г. Обнинск, 2006 г.).
Публикации Основные положения диссертации опубликованы в 9 печатных работах
Структура и объем диссертационной работы. Диссертационная работа состоит из введения, трех разделов, заключения, списка литературы из 89 наименований, и содержит 160 страниц, включая 4] рисунок, 2 таблицы и 3 страницы приложений
Моделирование информационных потоков в сиситемах коммуникации и компьютерных сетях
Канальный уровень определяет правила совместного использования физического уровня узлами связи. Здесь определяется формат передаваемых кадров данных, границы кадров, осуществляется обнаружение ошибок и обмен подтверждениями об окончании передач.
Сетевой уровень осуществляет маршрутиризацию сообщений, путем прокладывания пути от отправителя к получателю через всю сеть.
Транспортный уровень обеспечивает связь между коммуникационной подсетью и верхними тремя уровнями. Его главной задачей является управление телетрафиком.
Сеансовый уровень предназначен для организации и управления сеансами взаимодействия прикладных процессов.
Представительский уровень включает в себя функции, требуемые прикладными программами, использующими сеть, например, процедуры, кодирования информации и преобразования графических образов для передачи по сети.
Прикладной уровень включает прикладные программы, использующие сеть, например программы электронной почты.
На сегодня на рынке телекоммуникационных систем наиболее распространенными являются системы Х.25, Frame Relay (FR), IP, ISDN, SDH и ATM. Среди телекоммуникационных технологий наиболее распространенными описываются ниже приведенными стандартами [].
Стандарты технологии Ethernet. Ethernet - это сетевой стандарт, основанный на технологиях экспериментальной сети Ethernet Network. На основе стандарта Ethernet DIX был разработан стандарт IEEE 802.3, который во многом совпадает со своим предшественником. В то время, как в стандарте IEEE 802.3 различаются уровни MAC и EEC, в оригинальном Ethernet оба эти уровня объединены в единый канальный уровень.
Все виды стандартов Ethernet используют один и тот же метод разделения среды передачи данных - метод CSMA/CD. Метод используется в сетях с общей шиной. Данные помещают в кадры определенной структуры и снабжают адресом станции назначения. Кадр передается по линии связи. Все станции, подключенные к линии связи, могут распознать передачу кадра, и та станция, которая определит собственный адрес в заголовках кадра, записывает его содержимое в буфер, обрабатывает полученные данные и посылает по линии связи кадр-ответ. Адрес станции-источника также включен в исходный кадр, поэтому станция-получатель знает, кому нужно послать ответ. Однако, возможна ситуация, когда две станции одновременно пытаются передать кадр данных по общей линии связи. Для уменьшения вероятности этого события перед отправкой кадра передающая станция слушает линию связи, чтобы обнаружить, не передается ли уже кадр данных от другой станции. Если опознается несущая, то станция откладывает передачу своего кадра до окончания чужой передачи, и только потом пытается вновь его передать.
Стандарт технологии Token Ring. Сети стандарта Token Ring используют разделяемую среду передачи данных, в которой все станции сети соединены в кольцо. Для доступа к кольцу используется детерминированный алгоритм, основанный на предоставлении станциям права на использование кольца в определенном порядке. Право определено кадром специального формата, называемого маркером (токеном). В сетях с маркерным методом доступа право на доступ к среде передается циклически от станции к станции по логическому кольцу. Кольцо образуется отрезками кабеля, соединяющими соседние станции. Каждая станция связана со своей предшествующей и последующей станцией и может непосредственно обмениваться данными только с ними. Доступ станций к физической среде по кольцу определен маркером. Получив маркер, станция анализирует его, при необходимости модифицирует и при отсутствии у нее данных для передачи обеспечивает его продвижение к следующей станции. Станция, которая имеет данные для передачи, при получении маркера изымает его из кольца, что дает ей право доступа к физической среде и передачи своих данных. Затем эта станция выдает в кольцо кадр данных установленного формата последовательно по битам. Переданные данные проходят по кольцу всегда в одном направлении от одной станции к другой. При поступлении кадра данных к одной или нескольким станциям, эти станции копируют для себя этот кадр и вставляют в этот кадр подтверждение приема. Станция, выдавшая кадр данных в кольцо, при обратном его получении с подтверждением приема изымает этот кадр из кольца и выдает новый маркер для обеспечения возможности другим станциям сети передавать данные.
Стандарт технологии Fast Ethernet. В технологии Fast Ethernet применяют три варианта кабельных систем: оптоволоконные линии, витая пара категории пять и витая пара категории три.
В стандарте Fast Ethernet подуровень LLC обеспечивает интерфейс протокола Ethernet с протоколами вышележащих уровней, например, с IP или IPX. Подуровень MAC ответственен за формирование кадра Ethernet, получение доступа к разделяемой среде передачи данных и за отправку с помощью физического уровня кадра по физической среде узлу назначения. Среда Ethernet в любой момент времени находится в одном из трех -состояний - свободна, занята, коллизия. Состояние занятости соответствует нормальной передаче кадра одним из узлов сети. Состояние коллизии І возникает при одновременной передаче кадров более чем одним узлом сети.
МАС-подуровень каждого узла сети получает от физического уровня информацию о состоянии разделяемой среды. Если она свободна, и у МАС-подуровня имеется кадр для передачи, то он передает его через физический уровень в сеть. Физический уровень одновременно с побитной передачей кадра следит за состоянием среды. Если за время передачи кадра коллизия не возникла, то кадр считается переданным. Если же за это время коллизия была зафиксирована, то передача кадра прекращается, и в сеть выдается специальная последовательность из 32 бит (jam-последовательность), которая должна помочь однозначно распознать коллизию всеми узлами сети.
Проблема управляемости и системно-интегрированный подход к управлению информационными процессами в ТКС
Экспериментальные исследования с динамическими МНЛС, проведенные в [82], показали, что они обладают несомненными преимуществами перед соответствующими статическими нечеткими системами в задачах моделирования процессов неизвестного порядка и структуры. В значительной степени это обусловлено наличием дополнительного входа обратной связи, позволяющего более корректным образом отражать в модели динамику процесса при неизвестной его структуре. Кроме того, были сделаны попытки рассмотреть динамические МНЛС с точки зрения их принадлежности к общему семейству нелинейных авторегрессионных моделей скользящего среднего. Результаты показали, что при прогнозировании временных рядов, оперируя компонентами авторегрессионной модели совместно со скользящим средним, динамические МНЛС имеют более малую среднеквадратическую ошибку предсказания, чем соответствующие статические нечеткие системы.
Перцептивный анализ временных рядов. Перцептивный дата майнинг временных рядов (ПДМВР) это комплекс моделей и методов, поддерживающих процедуры принятия решений на основе перцепций в задачах, связанных с анализом временных рядов [4, 5], включая задачи перцептивного прогнозирования, экстраполяции и интерполяции данных в БДВР
В основе ПДМВР лежит предположения о том, что принятие решений человеком в трудно формализуемых ситуациях, в частности, связанных с исследованием слабо структурированных процессов, во многом основано на его перцептивных возможностях, то есть восприятии зависимостей между параметрами наблюдаемых процессов посредством словесных описаний. Примером временной перцепции, заимствованной из [4], является утверждение «Маловероятен резкий рост цены на нефть в ближайшем будущем». Учитывая, что человек достаточно свободно оперирует перцепциями, перцептивный анализ исходит из возможности описания характера поведения исследуемого процесса в виде перцерптивных зависимостей, представленных в форме словесных правил, с последующим выводом на основе правил решений путем реализации процедур перцептивного вывода. Для реализации процедур перцептивного вывода в [5] развивается предложенная Заде [84] методология вычисления на словах и перцепциях.
Базовой моделью ПДМВР является гранулярная модель, представляющая собой систему нечетких функций-перцепций, и позволяющая преобразовывать нечеткие множества, поданные на вход модели в нечеткие множества на выходе, реализуя тем самым идею вычисления на словах и перцепциях, представимых данными нечеткими множествами. Каноническим представлением перцептивной временной функции является правило продукции типа: Rk: IfXis Тк then Y is Sh (2.1.4) где Tk - терм-значение лингвистической временной переменной X, Sk -лингвитический терм-описание функции Y при значении X, равном Тк.
Словарь термов лингвистической переменной Т содержит широко используемые в практике нечеткого моделирования термы, характеризующие вещественные значения числовой переменной либо числовые интервалы таких значений, например, такие термы, как МАЛЫЙ, ОЧЕНЬ БОЛЬШОЙ, МЕЖДУ ТІ иТ2и т.д. Словарь термов лингвистической переменной Т может строиться, как путем непосредственного перечисления его элементов, так и на основе некоторой порождающей грамматики. Словарь термов St состоит из нескольких под словарей, каждый из которых соответствует некоторому классу паттернов, описывающих перцептивные образы наиболее типичных функций. В рамках ПДМВР используются следующие классы паттернов [4]: 1) паттерны, определяемые знаком производной («возрастает», «выпукло», «максимум», «убывает вогнуто-выпукло»); 2) паттерны, определяемые шкалированием и гранулированием («быстро растет», «очень медленно убывает и слегка выпукло»); 3) сложные паттерны на основе производящих грамматик; 4) онтологии паттернов. В качестве примера рассмотрим класс паттернов ВОЗРАСТАНИЕ-УБЫВАНИЕ, широко используемых в задачах лингвистической аппроксимации временных рядов.
Класс паттернов ВОЗРАСТАНИЕ-УБЫВАНИЕ задан словарем термов типа ОЧЕНЬ БЫСТРО ВОЗРАСТАЕТ, МЕДЛЕННО УБЫВАЕТ, характеризующих линейные паттерны функций [4,5]. Шкалирование линейных функций осуществляется по аналогии с хорошо известным шкалированием направлений посредством стрелки компаса. Градациям шкалы направлений (см. табл.) соответствует определенный угол поворота прямой относительно оси абцисс.
Разработка гибридной нечетко-темпоральной модели временного процесса
Для описания функционирования НДС введем в рассмотрение к-мерное пространство входных переменных V = ХхХх...Х, характеризующих к "прошлых" значений процесса S, и (к+1)-мерное пространство U = XxV, полученное путем добавления к пространству V (к+1)-го измерения X, описывающего выход НДС, характеризующий прогнозируемое значение процесса S в момент времени t.
Каждое из правил R,, входящих в БЗ НДС, можно рассматривать как нечеткую функцию R., действующую из k-мерного пространства V в одномерное пространство выходной переменной X, или иначе, как нечеткое отношение Д. в пространстве U. Функция принадлежности нечеткого отношения Rj имеет вид MSi(x,y,...,g,u) = M4(x)&tipt(y)&...&/ }i(g)&juai(u) (x,y,...,g,u є X) (2.4.2) Если на вход нечеткой системы, содержащей одно правило Rt, поступают четкие данные v =(x ,y ,...g ) то, подставив их в (2.4.2), приходим к выражению M„(x\y ,...,g ,u) = /ial(x )&Mfii(y )&...&fi)l(g,)&ttai(u), в котором произведение первых к членов дает фиксированное числовое значение JRi(x\y\...,g ) = tiai(x)&tipi{y )&....&.iiri{g )i имеющее смысл степени истинности предпосылки нечеткого правила Rt при заданном значении входа v = (x\y ,...g ). В результате выражение (2.4.3) приобретает вид формулы Mm(v ,u) = JKi(v,)&Mwi(u) (2.4.3) являющейся, по сути дела, формулой нечеткого вывода на основании одного правила. Для БЗ, содержащей множество правил {R R . RJ, нечеткий вывод по всей совокупности правил осуществляется с использованием нечеткого отношения R, определенного в пространстве U путем объединения m нечетких отношений R., соответствующих всем m правилам Л,, входящим в БЗ НДС. Функция принадлежности нечеткого отношения R имеет вид: jun(x,y,...,g,u)= v мы(х)&Мр(у)&-&М )&Мы(и) (x,y,...,g,ueX) (2.4.4) ШеБЗ Нечеткий вывод на основании нечеткого отношения R осуществляется путем подстановки входных данных v =(х ,у ,.. ") в (2.4.4). В результате, приходим к выражению /u (v\u)= уЛо(У )&//ч(и), (2.4.5) ЮеБЗ описывающему схему нечеткого вывода для совокупности правил {ЗД.»..,4.Ь Таким образом, нечеткая схема вывода, определяемая выражением (2.4.5), представляет собой логическую сумму ФП нечетких выходных переменных правил Rt, умноженных на значения истинности их предпосылок. Особенностью рассматриваемой нечеткой системы с обратными связями является то, что в процессе моделирования регрессионного уравнения на каждой і-й итерации на выходе НДС получается не единственное прогнозируемое значение s(tt), а нечеткое множество таких значений (/.). Следовательно, на последующих итерациях моделирования входами НДС будут являться нечеткие данные, полученные в качестве выходных на предыдущих итерациях. Это приводит к необходимости реализации НДС в виде нечеткой системы, способной обрабатывать не только четкие числовые значения х а,х п,...,х ік (синглетон), а значения, представленные в виде нечетких подмножеств X n,X a,...,X it. Такие системы получили название несинглетных (non-Singleton) нечетко-логических систем. Техника "не-синглетного" моделирования для нечетких систем общего назначения рассмотрена в [83].
Недостатком "не-синглетного" вывода по сравнению с традиционным выводом является больший объем вычислений, необходимых для реализации композиции многомерных нечетких отношений. Однако применительно к рассматриваемой авторегрессионной модели процедуру "не-синглетного" нечеткого вывода оказывается возможным упростить.
Пусть входные данные представлены в виде вектора X = (A(xn),B(xi2),..,,G(xik)), элементами которого являются нечеткие подмножества, заданные соответствующими функциями принадлежности на шкале X. Тогда, согласно композиционному правилу вывода нечеткое множество выходных значений Хы вычисляется путем композиции к мерного нечеткого отношения V = AxBx...xG, ФП которого определяется выражением jUf(x,y,...,z) = jU2(x)&/is(y)&...&{id(g), и (к+1)-мерного нечеткого отношения R, определяемого выражением (4), то есть Хк+1 =VoR. ФП выходного нечеткого множества имеет вид:
Разработка общего подхода к обучению нечетко-динамических моделей на основе принципов интеллекутализации и гибридизации
Создание современных информационных систем, в том числе и интеллектуальных систем, основанных на знаниях, невозможно без разработки специальных средств автоматизации процессов приобретения и верификации знаний. Такими средствами являются различного рода адаптируемые, самоадаптируемые, обучающиеся и самоорганизующиеся системы и модели, ориентированные на формирования баз знаний, обеспечивающих аккумуляцию в компактном виде наиболее значимой информации по исследуемому процессу.
БЗ нечеткой системы не составляет гомогенную структуру, а является объединением качественно различных компонент, а поэтому методы формирования, обучения и адаптации БЗ должны основываться на идеях гибридизации, то есть комбинированного использования нескольких различных подходов, направленных, как на параметрическую, так и на структурную оптимизацию НЛС. В этом плане весьма перспективным направлением в области построения самообучающихся систем и моделей является разработка гибридных сетевых моделей, основанных на использовании методологии мягких вычислений, базовыми компонентами которой, как ранее отмечалось, являются искусственные нейронные сети, нечеткие системы и эволюционные модели.
В настоящем подразделе, опираясь на идеи гибридизации, автор разрабатывает новый подход [32, 54] к решению одной из наиболее сложных задач, связанных с обучением динамических НЛС, а именно, задачи автоматического формирования нечетких правил для БЗ НЛС.
Как и ранее, в качестве исходного объекта моделирования будем рассматривать ВР х(/) = (х(/),х(/-1),...,. (/-и)), заданный на дискретной шкале временных отсчетов Т = (tltt2,...,tm). Опираясь на теорему Такенса, математическую модель ВР можно представить в форме нелинейной авторегрессии общего вида: X(t + d) = y/(x(t),...,x(t - п)), где d - лаг прогнозирования; п - ширина окна погружения. Таким образом, теорема Такенса, фактически, декларирует принципиальную возможность реализации динамической модели ВР на основе статической НЛС путем трансформации динамики процесса в статику методом погружения ВР в многомерное пространство его "прошлых" значений. Такая НЛС, построенная на основе принципа погружения, реализует отображение F: X(t-l)xX(t-2)x... xX(t-k)- X(t + l), рассматриваемое в качестве динамической модели ВР, и называется динамической НЛС. Преобразование F, реализуемое посредством НЛС, задается в виде совокупности нечетких "Если ..., то ..." - правил, функционирующих под управлением стандартного механизма нечетко-логического вывода.
Структурное обучение НЛС, как было отмечено ранее в п.3.2., заключается в выборе терм множеств для всех системных переменных НЛС, определение границ размещения термов на соответствующих признаковых шкалах, а также в формирование структур решающих правил в классе нечетко-логических формул.
Общий сценарий структурного обучения в соответствии с рассмотренным в п. 3.2 подходом выглядит следующим образом.
Вначале осуществляется разбиение шкалы выходной переменной X, на которой заданы числовые значения ВР, на относительно небольшое число к (к=5-9) интервалов, соответствующих будущим интервалам локализации нечетких термов выходной переменной. Разбиение выходной переменной порождает разбиение входных обучающих данных на соответствующее число к классов. Далее решается задача разбиения признакового пространства входных переменных V =ХхХх...хХ = П X на минимальное число m прямоугольных областей (гиперпрямоугольников) таким образом, чтобы в каждую из областей попали обучающие данные лишь какого-то одного класса. Полученное таким образом разбиение порождает классификационную модель (К-модель), включающую m четких "Если ...то..."- правил, обеспечивающих верную классификацию всех обучающих данных по к априори заданным классам разбиения выходной переменной.
Сформированная таким образом К-модель однозначно порождает структуру НЛС, которая получается путем сопоставления каждому классифицирующему правилу соответствующего нечеткого правила следующим образом. Стороны гиперпрямоугольника, входящего в описание условной части классифицирующего правила, задают нечеткие термы, входящие в описание предусловия нечеткого правила, проекции сторон на числовую шкалу определяют интервалы локализации нечетких термов, а номер класса разбиения, указанный в заключении классифицирующего правила, задает соответствующее нечеткое значение выходной переменной и интервал ее локализации.
Для построения К-моделей весьма перспективным представляется подход, основанный на использовании специального вида гибридных сетевых моделей. Такого рода модели в свое время были предложены для целей извлечения нечетких правил в БД НЛС при разработке фонемных классификаторов для систем речевого распознавания. Эти модели получили название гиперпрямоугольных композитных нейросетей (ГПКНС). Рассмотрим кратко принципы построения и функционирования ГПКНС.
ГПКНС представляет собой вариант гибридной нейро-нечеткой сети, узлы которой соответствуют нечетким правилам БЗ НЛС и формируются в процессе обучения сетевой модели. Процесс обучения ГПКНС представляет собой итерационную процедуру, в ходе которой осуществляется многократное обращение к экспериментальным данным и формируется структура сети. Обучение начинается с одного или нескольких примеров, на основании которых формируются начальные образы правил, которые в последствии проходят несколько последовательных стадий обобщения и нормализации. На каждой из этих стадий образы правил уточняются и видоизменяются. В завершение обучения из сформированной структуры ГПКНС непосредственно извлекаются нечеткие правила для БЗ НЛС. Символическое представление ГПКНС приведено на рис. 3.3.1.