Содержание к диссертации
Введение
1. Обзор состояния исследований в области использования мультиагантных технологий при решении задач настройки технологических процессов 19
1.1. Обзор МАС в контексте решения задач настройки технологических процессов 19
1.1.1. Архитектуры интеллектуальных агентов 21
1.1.1.1. Абстрактная архитектура ИА 21
1.1.1.2. Классификация конкретных архитектур ИА 22
1.1.2. Классификация механизмов взаимодействия ИА 34
1.1.2.1. Договорные сети 36
1.1.2.2. Системы на базе досок объявления 37
1.1.2.3. Рыночные механизмы 38
1.2. Проблемы разработки современных MAC интеллектуальной настройки технологических процессов 39
1.3. Выводы 42
2. Разработка модели мультиагентной системы настройки технологических процессов 44
2.1. Разработка MAC, удовлетворяющих современным требованиям, предъявляемым к системам настройки реального времени с входными данными высокой размерности 45
2.1.1. Разработка иерархической модели MAC 46
2.1.1.1. Общая характеристика МАС СИН 46
2.1.1.2. Дифференциация ИА по функциональным особенностям в иерархической архитектуре МАС... 47
2.1.1.3. Формальная модель мультиагентной иерархии 55
2.1.2. Реализация архитектур ИА 59
2.1.2.1. Управляющие архитектуры 59
2.1.2.2. Архитектуры подрядчиков 62
2.1.3. Организация механизмов взаимодействия AM и АП в рамках иерархической MAC 63
2.1.3.1. Методы расчёта ошибки дообучения 64
2.1.3.2. Степени доверия AM к АП 67
2.1.3.3. Интервальный алгоритм определения победившего АП 69
2.1.3.4. Пересчёт областей эффективного применения АП... 71
2.1.3.5. Реализация обучения в MAC 78
2.1.3.6. Анализ сложности разработанных алгоритмов 81
2.2. Технические особенности реализации модели MAC 84
2.2.1. Реализация протоколов межагентного взаимодействия 84
2.2.2. Реализация реактивных архитектур ИА 86
2.3. Выводы 88
3. Моделирование агентов-подрядчиков mac настройки технологических процессов в нейросетевом логическом базисе 90
3.1. Применение модифицированных самоорганизующихся карт Кохонена в ИНС Хехт-Нильсона 91
3.1.1. Сети Кохонена на основе принципов самоорганизации 92
3.1.1.1. Общая характеристика сетей Кохонена 92
3.1.1.2. Самоорганизующиеся карты Кохонена 96
Стр.
3.1.1.3. Алгоритм «нейронного газа» 100
3.1.2. Модификация самоорганизующихся карт Кохонена 101
3.1.2.1. Структура многомерной карты Кохонена и её обучение 102
3.1.2.2. Сходимость процесса обучения 105
3.1.2.3. Методы группировки нейронов в матрицу 106
3.1.2.4. Виды областей притяжения 117
3.1.2.5. Меры близости между нейронами и их влияние на гауссову функцию притяжения 124
3.1.2.6. Анализ сложности разработанных алгоритмов 131
3.1.3. Модификация ИНС Хехт-Нильсона 138
3.1.3.1. Алгоритм обучения МСХН 140
3.1.3.2. Перекластеризация в МСХН при дообучении 143
3.2. Методы обучения нейросетевых АП 145
3.3. Выводы 147
4. Настройка технологического процесса производства хлебобулочной продукции 148
4.1. Постановка задач управления производственным циклом 149
4.1.1. Основные стадии производства 149
4.1.2. Автоматизация выпечки хлебобулочной продукции 152
4.2. Применение иерархической МАС для настройки процесса выпечки хлебобулочной продукции 154
4.2.1. Конкретизация нейросетевой модели 154
4.2.2. Конкретизация мультиагентной модели 156
4.2.3. Исследование свойств MAC при настройке техпроцесса производства хлебобулочных изделий в условиях работы пекарни 157
4.2.3.1. Методы расчёта ошибки дообучения 158
4.2.3.2. Операции со степенями доверия 160
4.2.3.3. Алгоритмы пересчёта ОЭО 162
4.2.4. Исследование внедрённых в MAC модифицированных ИНС Хехт-Нильсона при настройке техпроцесса производства хлебобулочных изделий в условиях работы пекарни 164
4.2.4.1. Влияние внутренних параметров на эффективность работы модифицированных ИНС Хехт-Нильсона.. 165
4.2.4.2. Сравнительный анализ эффективности обучения классических и модифицированных ИНС Хехт-Нильсона 172
4.2.4.3. Анализ эффективности применения «алгоритмов утомления» в модифицированных ИНС Хехт-Нильсона 176
4.2.4.4. Сравнительный анализ эффективности обучения модифицированных ИНС Хехт-Нильсона с сетями РБФ и многослойными персептронами 177
4.2.5. Исследование роли внедрённых в MAC модифицированных
ИНС Хехт-Нильсона посредством частотного анализа
применения агентов 179
4.3. Выводы 181
5. Настройка распределения трафика в закрытой информационной системе
Постановка задачи распределения ресурсов 185
Применение иерархической МАС для настройки распределения ресурсов 186
5.2.1. Конкретизация модели MAC 188
5.2.2. Исследование свойств MAC при настройке распределения ресурсов 191
5.2.2.1. Методы расчёта ошибки дообучения 191
5.2.2.2. Операции со степенями доверия 194
5.2.2.3. Алгоритмы пересчёта ОЭО 197
5.2.3. Исследование внедрённых в MAC модифицированных ИНС Хехт-Нильсона при организации распределения ресурсов 200
5.2.3.1. Влияние внутренних параметров на эффективность работы модифицированных ИНС Хехт-Нильсона.. 201
5.2.3.2. Сравнительный анализ эффективности обучения классических и модифицированных ИНС Хехт-Нильсона 210
5.2.3.3. Анализ эффективности применения «алгоритмов' утомления» в модифицированных ИНС Хехт-Нильсона 213
5.2.3.4. Сравнительный анализ эффективности обучения модифицированных ИНС Хехт-Нильсона с сетями РБФ и многослойными персептронами 214
5.2.4. Исследование роли внедрённых в MAC модифицированных ИНС Хехт-Нильсона посредством частотного анализа применения нейросетевых агентов при обработке исключительных ситуаций 217
5.3. Выводы 222
Основные результаты и выводы 226
Список литературы
- Классификация механизмов взаимодействия ИА
- Разработка иерархической модели MAC
- Сети Кохонена на основе принципов самоорганизации
- Применение иерархической МАС для настройки процесса выпечки хлебобулочной продукции
Введение к работе
В последнее время системы интеллектуальной настройки (СИН) параметров технологических процессов на основе искусственных нейронных сетей (ИНС) всё чаще применяются во многих технических и промышленных приложениях. Основные преимущества нейросетевых систем по сравнению с классическими подходами особенно хорошо выявляются при работе со сложными технологическими объектами, неподдающимися точному формальному математическому описанию, как из-за нелинейности внутренней структуры, так и из-за необходимости учёта множества внешних факторов [1]. В свою очередь, ИНС представляют собой большое количество моделей и алгоритмов, обладающих специфическими качествами и имеющих ограниченные функциональные рамки. Усложнение модели объекта посредством увеличения размерности задачи, например, вводом в исходную модель дополнительных параметров, а так же необходимость учёта возможной рассинхронизации, при получении информации с различных датчиков и устройств, делают задачу настройки многокритериальной системы трудноразрешимой с учетом индивидуальных особенностей функционирования отдельно взятых ИНС, входящих с состав СИН [2].
В этой связи наиболее перспективным направлением развития в области интеллектуальных систем стало выделение набора подзадач и объединение различных методов их решения, в частности, на нейросетевой основе. Многообещающей реализацией данной концепции стало развитие мультиагентных систем (МАС), в которых основной акцент делается на декомпозиции системы, относительно независимом решении частных задач и оптимальном взаимодействии множества связанных компонентов, решающих частные задачи, моделируемой системы для наилучшего решения общей задачи. Важной особенностью значительного класса подзадач настройки параметров технологических процессов, возникающих на практике в крупномасштабных системах, является достаточно гладкий вид функционала, что, с одной стороны, всё ещё не позволяет применять классические методы, основанные на линеаризации, ввиду накопления ошибок и снижения робастности моделируемых систем, но, с другой стороны, делает излишним использование громоздких, например, с большим количеством слоев и скрытых нейронов, ИНС или ансамблей ИНС [3]. Данное обстоятельство усугубляется требованием формирования быстрого отклика системы и необходимостью осуществления оперативного дообучения сети в масштабе реального времени. В настоящий момент лишь несколько нейросетевых архитектур позволяют в некоторой степени эффективно справляться с такими проблемами, неизбежно жертвуя качеством обучения в угоду производительности.
Исходя из этого, в решении многих актуальных задач настройки технологических процессов в рамках MAC можно выделить 2 этапа:
1) разработка собственно агентов - небольших относительно автономных систем, эффективно решающих локальные задачи;
2) проектирование и разработка механизма взаимодействия агентов для оптимального решения общей задачи.
Таким образом, разработка новых подходов, методов решения частных задач и моделирование на их основе настройки сложных технологических процессов в многокомпонентных объектах по совокупности ряда внешних и внутренних признаков в условиях неполноты информации, когда в силу изначальной сложности, как среды функционирования, так и настраиваемого объекта, оказывается невозможным применить классические методы, а ограничения, накладываемые характером среды решаемых задач, не позволяют использовать сложные адаптивные подходы, несомненно, является актуальной и важной проблемой, решение которой представляется возможным осуществить в поле прикладных интеллектуальных систем на базе нейросетевого мультиагентного подхода.
Целями диссертационной работы являлись:
- проведение анализа существующих мультиагентных методов решения задач настройки сложных технологических процессов и производств1;
- решение задач автоматизированной настройки технологических процессов применительно к хлебопекарному производству и распределению трафика в закрытой информационной системе.
Научная новизна работы состоит в следующем:
- разработан новый подход к решению задач автоматизированной настройки технологических процессов на базе мультиагентных систем с доменными структурами;
- предложен новый диапазонный метод определения лучших агентов на основе статистических показателей их работы;
- на основе обобщения существующей архитектуры Хехт-Нильсона разработана новая нейросетевая архитектура посредством введения многомерных самоорганизующихся карт Кохонена.
Теоретическая и практическая ценность работы состоят в том, что в работе предложен новый подход к решению задачи автоматизированной настройки технологических процессов в условиях неполной и неточной информации на основе, в частности, модификации архитектуры сети Хехт-Нильсона, расширения размерности самоорганизующихся карт Кохонена, разработанных методов диапазонной конкуренции, которые можно применить для решения широкого круга задач в различных прикладных областях.
Полученные в работе результаты: математические модели, методы, алгоритмы и программные коды используются при автоматизированной настройки технологических процессов выпечки хлебобулочных изделий в Калужском хлебозаводе и в ООО «Пекарня «Дом хлеба»», для автоматизированной настройки процессов распределения трафика закрытой информационной системе в ЗАО «Корбина-Телеком», в Филиале №1 000 «Макснет системы», а так же в учебных целях, в Калужском технологическом колледже. Копии актов о внедрении прилагаются.
Достоверность результатов работы обусловлена корректной постановкой задачи, применением математически обоснованных методов ее решения, сравнением результатов с экспериментальными данными.
На защиту выносятся следующие положения:
- модель мультиагентной многоуровневой иерархической системы с доменной структурой на основе договорных сетей с диапазонными алгоритмами организации межагентного взаимодействия;
- обобщение самоорганизующихся карт Кохонена на основе разработанных методов многомерных формаций нейронов, их областей притяжения и алгоритмов обучения;
- модификация архитектуры сети Хехт-Нильсона, связанная с введением дополнительных межнейронных связей с элементами разработанных многомерных самоорганизующихся карт Кохонена;
- результаты теоретических и экспериментальных исследований эффективности использования разработанных моделей, методов и алгоритмов при решении задач автоматизированной настройки технологических процессов хлебопекарного производства и распределения трафика в закрытой информационной системе.
Апробация результатов. Результаты диссертационной работы докладывались на конференциях:
1. Региональных научно-технических конференциях «Прогрессивные технологии, конструкции и системы в приборо- и машиностроении» (Калуга 2004, 2005,2006).
2. Всероссийских научно-технических конференциях «Прогрессивные технологии, конструкции и системы в приборо- и машиностроении» (Москва 2005); «Наукоёмкие технологии, в приборо- и машиностроении и развитие инновационной деятельности в вузе» (Москва 2006); «Информационные технологии в науке, проектировании и производстве» (Нижний Новгород, 2006).
3. Международной научно-практической конференции «Компьютерные технологии в науке и производстве» (Новочеркасск, 2006).
Классификация механизмов взаимодействия ИА
Помимо определения типа ИА в МАС, важнейшей задачей является решение вопроса о структурной организации МАС, в частности, о методах координации межагентного взаимодействия.
Под координацией понимается способность системы ИА осуществлять некоторую деятельность в разделяемой окружающей среде [34]. Сотрудничество - это координация среди не противоборствующих ИА, в то время, когда переговоры - координация среди конкурирующих или просто заинтересованных в своей цели ИА. Как правило, для успешного сотрудничества каждый ИА должен поддерживать модель других агентов и также развивать мо дель будущих взаимодействий, что делает разработку таких агентов более сложной и исключает применение полностью реактивных архитектур [35].
Целью применения конкурирующих методов координации является выявление наиболее способных агентов, пригодных для решения какой-либо задачи. При этом агенты заинтересованы в победе в конкурентной борьбе посредством введения перспектив поощрения [10]. Конкурентные методы применяются как в масштабах отдельных групп агентов [36,37,38], так и в масштабах МАС в целом [37,39]. Поскольку способности агентов изначально направлены на решение узких задач, конкуренция в масштабах разветвлённых МАС не представляется возможной. В этой связи наиболее востребованными с практической точки зрения, являются протоколы сотрудничества.
Основная стратегия, реализованная в большинстве протоколов сотрудничества, состоит в разделении и последующем распределении задачи. Решение задачи декомпозиции может быть выполнено проектировщиком MAC [40], агентами, использующими иерархическое планирование [31], или может быть свойственно представлению проблемы, как графа [12]. Декомпозиция задачи может быть выполнено пространственно, основываясь на расположении информационных источников или точек решения, или функционально, согласно экспертизе доступных ИА. Дальнейшее распределение подзадач осуществляется согласно следующим критериям: - избегание перегрузки критических ресурсов; - выбор подзадач для ИА с соответствующими способностями; - определение ИА с широким обзором для назначения задач другим ИА; - выявление ИА с близкими обязанностями для форсирования их связи; - переназначение критических подзадач между ИА.
Для реализации распределения задач широко используются договорные сети, системы на базе досок объявления и рыночные механизмы.
Из всех механизмов, наиболее известный и наиболее широко применяемый - протокол договорной сети, представляющий протокол взаимодействия для совместного решения проблемы между ИА [12,41,42,43]. Договорная сеть обеспечивает решение так называемой проблемы связи: обнаружение соответствующего ИА для работы над данной подзадачей (рис. 1.7).
Агент, которому требуется решенная подзадача, называется менеджером (AM); агенты, которые способны решить задачу, называются подрядчиками (АП). AM производит следующие действия: - объявляет подзадачу, которая должна быть выполнена; - получает и оценивает предложения от АП; - предоставляет контракт подходящему АП; - получает и синтезирует результаты. АП выполняет следующие действия: - получает объявления задачи; - оценивает свою способность ответить; отвечает (отклоняет, выдвигает контрпредложения); выполняет задачу, если его предложение принято; сообщает результаты.
Разработка иерархической модели MAC
Архитектура характеризовалась заранее определённым разделением задач между агентами, осуществляемым разработчиком МАС в процессе анализа объекта, что, с одной стороны, исключало изменение концептуальных элементов решения в процессе функционирования ИА, но в то же время, позволяло упростить работу ИА и существенно снизить накладные расходы на их социализацию, поскольку роль и место каждого ИА, его социальные отношения с другими ИА и их область видимости были заранее определены. Относительная свобода агентам предоставлялась в рамках доменов решаемых подзадач, на которые проектировщиком МАС разбивалась основная задача настройки, по аналогии с [45]. Здесь под доменом задачи будем пони мать совокупность всех агентов, задействованных в решении задачи (настройки). Домен подзадачи - подмножество домена задачи - совокупность агентов МАС, задействованных для решения конкретной подзадачи, являющейся частью общего решения задачи.
Таким образом, можно характеризовать процесс управления, реализуемый в МАС, как частично-централизованный.
Для осуществления решения подзадач и координации результатов в предложенной архитектуре предусматривается чёткое разделение агентов по исполняемым ими функциональным обязанностям на агента-координатора (АК), агентов-менеджеров (AM) и агентов-подрядчиков (АП) по аналогии с подходом, описанным в [46].
Координация процесса управления осуществляется АК, в обязанности которого входит: а) получение задания на запуск и остановку MAC, задача синхронизации действий AM; б) определение доменов подзадач; в) начальное определение АП, необходимых для каждого домена, и на значение AM; г) инициализация АП и AM; д) получение общего отклика качества работы СИН; е) назначение времени проведения общего дообучения АП; ж) мониторинг общего состояния МАС. По завершении инициализации МАС ((а)-(г)) АК обращается непосредственно только к AM.
Получая задание на запуск MAC, АК выступает в роли центрального аппарата СИН. Обеспечение механизмов синхронизации работы AM подразумевает функции ведения системного времени и обеспечения экстренного выполнения актуальной задачи. Непосредственно АК взаимодействует только с некоторым количеством AM, располагающимся на 1 уровне иерархии, определяемым исходя из специфики задачи, что обеспечивает передачу сообщения к другим AM по цепочке. Это способствует минимизации глобального управления MAC и передаче высокоуровневым AM полномочий по контролю над большей частью процессов в MAC. Единственным существенным недостатком такой организации взаимодействия АК с AM может стать задержка передачи экстренных сообщений. Побочным эффектом может быть возрастание объёма передаваемого сообщения ввиду большой степени вложенности сообщений при прохождении длинной цепи AM.
Определение доменов подзадач осуществляется разработчиком MAC и реализуется в виде набора метаправил для данной задачи, распространяемым на наборы АП и AM. Домены подзадач могут функционально перекрываться, т.к. одни и те же агенты могут быть использованы различными частями MAC при решении своих подзадач (см. рис. 2.1).
Начальное определение АП и AM для доменов подзадач осуществляется тем же набором метаправил. При этом допускается добавление новых АП (и AM), работающих на уровне доменов подзадач, во время функционирования MAC.
Инициализация АП выполняется индивидуально для каждого АП в зависимости от его технической реализации и подразумевает, где это возможно, начальное (установочное) обучение АП особенностям работы в конкретных условиях в рамках отведённых им доменов подзадач. Инициализация AM подразумевает синхронизацию системных таймеров, построение карты маршрутизации MAC, установку дескрипторных таблиц.
Получение общего отклика работы системы выражается в количественной оценке качества работы СИН, осуществляемого либо в автоматическом режиме путём анализа внешних факторов среды, либо посредством взаимодействия с оператором МАС.
Назначение времени общего дообучения АП осуществляется, во-первых, в процессе инициализации AM, во-вторых, в процессе работы MAC: положительный отклик СИН стимулирует увеличение времени между дообучениями, отрицательный отклик уменьшает это время.
Основная коммуникационная функция АК заключается в мониторинге общего состояния МАС - хранении регулярно обновляемой таблицы маршрутизации (аналог таблиц в сетевом коммуникационном оборудовании [65]), позволяющей отслеживать характер связей в МАС и сигнализировать об их обрывах.
Сети Кохонена на основе принципов самоорганизации
Сети Кохонена (СК) позволяют осуществлять топологически непрерывное отображение действительного многомерного входного пространства в набор классов.
Обучение СК происходит без учителя на основе векторов х, 1, поступающих на вход сети. В качестве метода обучения используется межнейронная конкуренция. Структурно СК представляет собой однослойную ИНС с прямой передачей (распространением) сигнала.
По мере поступления входных векторов на сеть посредством самообучения происходит разбиение п;8 -мерного входного пространства на различные области решения, каждой из которых соответствует отдельный нейрон (рис. 3.1). Самоорганизация СК осуществляется в результате топологического упорядочивания входной информации по различным D8 областям, называемым кластерами. В итоге обучения каждому входному вектору x;g ставится в соответствие единственный нейрон Кохонена, определяющий номер кластера, к которому сеть отнесла этот входной вектор.
Нулевой слой СК выполняет чисто распределительные функции - каждый его нейрон соединён со всеми нейронами выходного слоя. Первый слой (слой Кохонена) осуществляет конкуренцию между нейронами, в результате которой выявляется нейрон-победитель, для которого весовые связи усиливаются, а для остальных нейронов либо не изменяются, либо ослабляются. Победителем в конкурентной борьбе считается нейрон, который в результате подачи на вход сети определённого образа имеет максимальный активацион ный потенциал (внутренне возбуждение), рассчитываемый как: „м где 8) = [x{rf,x{ ,...,x{ e)j -входной вектор; wy =(whJ,w2J,...,wnij!) .) - вектор-столбец весовых коэффициентов, связывающих все rvf распределительных нейронов су-ым нейроном Кохонена; и. - активационный потенциалу-го нейрона Кохонена.
Обозначив нейрон-победитель индексом а: и = max и,., (3.2) определим выход нейронов Кохонена (/;;у) следующим образом:
Обобщить выражение (3.2) на случай произвольных векторов можно посредством введения мер расстояния между векторами, позволяющих определить нейрон, веса которого наиболее близки к входному вектору в смысле некоторой метрики.
Пусть нейрон а будет считаться нейроном-победителем, если dist(x{r8\wa)= min dist(jff\\vX (3.4) i y 4g) где distQ обозначает расстояние (в смысле выбранной метрики) между векторами. Для оценки расстояния принято использовать евклидову меру:
При применении (3.5) разбиение пространства на зоны доминирования нейронов равносильно диаграмме Вороного [75], в которой пространство вокруг центральных точек образует окрестность доминирования данного нейрона. Использование при самоорганизации любой другой меры вызывает несколько иное разделение сфер влияния нейронов.
Таким образом, максимальную активность будет проявлять тот нейрон, весовой вектор которого коллинеарен входному вектору. Концы векторов при этом находятся на поверхности п, -мерной гиперсферы единичного радиуса. Возбуждение нейрона эквивалентно коэффициенту взаимной корреляции между входным и весовым векторами. Он (коэффициент) будет равен единице, когда угол между векторами будет равен 0. Отсюда можно сделать вывод, что правило настройки весовых коэффициентов нейрона-победителя должно соответствовать повороту вектора wa (т.е. вектора весов нейрона-победителя) в сторону вектора х, (рис. 3.2)
Правило модификации весов нейрона-победителя имеет вид: we(f + l) = we(/) + i(x«-we(/)) (0 К1), (3.9) где г - скорость обучения СК.
Поскольку весовые вектора всегда должны быть нормированными, выражение (3.9) следует привести к нормированному виду следующим образом: (3.10) "Л )= , , (о кі). we(0 + i(i«-we(0)
Доказано, что если хотя бы один из векторов х, или w. подвергается нормализации, то процесс самоорганизации всегда приводит к связному разделению пространства данных [75].
Экспериментальные исследования [74] подтвердили необходимость применения нормализации векторов особенно при малой размерности пространства. Такая нормализация проводится, как правило, в соответствии с выражением:
Применение иерархической МАС для настройки процесса выпечки хлебобулочной продукции
Принимая во внимание необходимость использования разработанной МСХН в динамических средах, требующих регулярного дообучения ядер АП, необходимо установить критерий перекластеризации сети.
Учитывая существенные временные задержки, могущие возникнуть при осуществлении перекластеризации, следует сформулировать обстоятельства, при которых подобная процедура будет необходима: 1. Двукратное (и более) увеличение числа классифицируемых объектов по сравнению с объёмом обучающей выборки.
2. Относительная ошибка работы, превышающая на заданном множестве эмпирический порог. Сам процесс перекластеризации представляет собой процедуру запуска представленного выше алгоритма обучения (с п.1.2.), при которой происходит перераспределение центров кластеров, сопровождаемое, при необходимости, добавлением новых кластеров. Ввиду того, что добавление нового единичного кластера (нейрона) возможно лишь при группировке нейронов в шар, в то время как для других формаций нейронов необходимо добавлять большее число нейронов, необходимо выработать критерий, который позволит избежать, с одной стороны, длительного дообучения, с другой стороны, добавления чрезмерного количества нейронов в МСКК.
Очевидный критерий, позволяющий определить необходимость добавление нового кластера, связан с анализом расстояний от всех обработанных примеров до всех существующих центров кластеров и расстояний между самими центрами кластеров, что приводит к алгоритму экспоненциальной сложности 0[тах4. !,Ат!). В этой связи представляется возможным использовать субъективный критерий, исходя из следующих соображений: при корректной кластеризации п, -мерного пространства погрешность нелинейной аппроксимации в каждом кластере должна быть незначительной (особенно при большом числе кластеров), поэтому существенную ошибку работы ИНС можно объяснить лишь неудачным выбором центров кластеров или недостаточным количеством самих кластеров. Первую причину можно исключить при установке значительного порога итераций самоорганизации МСКК, поэтому с большой вероятностью некачественная работа МСХН будет обуславливаться недостаточным числом кластеров. В качестве собственно критерия для добавления нейрона (или нейронов, в зависимости от типа МСКК), был выбран показатель скорости сходимости самоорганизации, аналогичный критерию толерантности (3.43): превышение некоторого наперёд заданного порога (на практике хорошие результаты были получены при установке по рога в 0.2) в течение 15-20 итераций работы, позволяют добавлять новые нейроны.
Возможности применения ИНС в обучаемых АП переводят проблему проектирования нейросетевых АП в плоскость нейроуправления. В этой связи следует выделить 2 метода реализации [80] нейросетевого модуля обучения в АП, представляющих наибольший практический интерес: 1. Специализированное обучение. 2. Обучение с компенсацией сигналов решателя.
Архитектура специализированного обучения (рис. 3.29) используется для непосредственного (или «управляемого целью») обучения сети; при этом ошибка выполнения распространяется по сети в обратном направлении на каждой выборке.
Во многих случаях разработки прикладных систем приходится сталкиваться с ситуацией, когда для некоторых задач существуют удовлетворительные методики решения, основанные, например, на классических алгоритмах или ЭС. В таком случае, представляется целесообразным создать ИНС, компенсирующую недостатки существующего метода решения, ориентированную на частичную корректировку его выходного сигнала (рис. 3.30). Данный метод представляет тем больший интерес, что позволяет создавать простые сети для решения достаточно сложных задач с существенно нелинейными функционалами [52].
Для ряда прикладных задач, в то же время, оказывается невозможным осуществлять настройку в соответствии с рассмотренными методиками. В этом случае используется альтернативный подход, заключающийся в анализе пригодности полученного решения по ряду факторов, например, экспертной группой, и, в случае подтверждения его корректности, принятия результата за эталон с последующим добавлением его в обучающую выборку. Решение прикладных последней методики описано в главах 4 и 5.
Основными результатами, полученными в текущей главе настоящего диссертационного исследования, являются:
1. Произведён анализ ИНС Кохонена, составляющей ядро ИНС Хехт-Нильсона, в результате которого выявлен недостаток, состоящий в низкой скорости самоорганизации при значительном числе кластеров и невысокой точности аппроксимации ввиду её линейного характера.
2. Модифицирована традиционная архитектура сети Хехт-Нильсона посредством введения вертикально связанных с нейронами Кохонена традиционных нейронов, благодаря чему стала возможным аппроксимация поверхностями переменного уровня.
3. Разработан оригинальный метод, позволяющий существенно улучшить скорость сходимости процесса самоорганизации карт Кохонена, основанный на введении многомерных формаций нейронов в виде куба, прямоугольного параллелепипеда и шара.
4. В противовес традиционному масштабированию квадратной области притяжения, разработаны не описанные ранее в литературе методы построения альтернативных областей притяжения, лучшим образом соответствующих различным формациям нейронов.
5. Произведён исчерпывающий теоретический анализ сложности всех вариаций разработанных алгоритмов, учитывающий влияние различных мер, используемых для вычисления расстояния в непрерывной гауссовой функции поощрения.
6. Произведена модификация ИНС Хехт-Нильсона посредством замены классических самоорганизующихся карт Кохонена на модифицированные многомерные карты Кохонена.