Содержание к диссертации
Введение
Глава 1 Выбор и анализ методов решения задачи 14
1.1. Нечеткие системы 15
1.2. Искусственные нейронные сети 30
1.3. Гибридные интеллектуальные системы 42
Выводы по главе 1 48
Глава 2. Построение имитационной модели биомеханического многозвенника 50
2.1. Особенности биомеханических систем 50
2.1.1. Описание системы построения движений 50
2.1.2 Иерархия в биомеханических системах 53
2.1.3. Обоснование выбранных методов 55
2.2. Описание нижнего уровня иерархии 56
2.2.1. Теория равновесной точки 56
2.2.2. Имитация функций сенсорной системы различной модальности 58
2.2.3. Описание верхнего уровня управления, имитируемого нейросетьго 60
2.3. Описание имитационной семиотической модели 64
2.4. Общее описание имитационной модели системы управления движением биомеханического многозвенника 68
Выводы по главе 2 71
Глава 3 Программные системы для создания имитационных моделей управления биомеханическим равновесием 73
3.1. Общее описание программного комплекса 73
3.2. Описание основной программы 76
3.3. Описание программы настройки параметров нечеткого регулятора 77
3.4. Описание нечетких регуляторов для имитации нижнего уровня 79
3.4.1. Описание нечеткого регулятора для имитации тяги 79
3.4.2- Описание процесса настройки регулятора 83
3.4.3. Регуляторы, имитирующие взаимосвязь между звеньями 90
3.5- Программное обеспечение имитационной модели гомеостата 94
Выводы по главе 3 95
Глава 4. Программные эксперименты по обучению имитационной модели системы поддержания равновесия 96
4.1. Исследование зависимости скорости обучения системы от используемых Т-норм 96
4.2. Исследование зависимости скорости обучения системы от начальных условий 97
4.3. Результаты исследования модели с точки зрения адекватности реальным процессам в биомеханической системе 99
4.4. Возможности применения модели 105
Выводы по главе 4 105
Глава 5. Результаты исследования имитационных моделей гомеостатов, применяемых в задачах моделирования процессов в биологических объектах 106
5.1. Имитационная модель гомеостата поддержания постоянства параметров 106
5.2. Описание имитационной модели гомеостата ритмов 112
5.3. Описание имитационной модели иерархического гомеостата 119
Выводы по главе 5 122
Заключение 124
Список используемой литературы 126
- Гибридные интеллектуальные системы
- Общее описание имитационной модели системы управления движением биомеханического многозвенника
- Описание программы настройки параметров нечеткого регулятора
- Исследование зависимости скорости обучения системы от начальных условий
Введение к работе
Диссертационная работа посвящена методам разработки математического и программного обеспечения имитационных моделей процессов управления в биологических системах.
Актуальность работы. Искусственный интеллект - область исследований, ориентированная на разработку компьютерных программ, способных выполнять функции, обычно ассоциируемые с интеллектуальными
действиями человека: анализ, обучение, планирование, принятие решений, творческая деятельность- Методы искусственного интеллекта широко применяются в самых разных областях: в медицине, в образовании, в экономике, на транспорте, на производстве, в области обороны и безопасности. Однако интеллектуальная сфера есть только малая надводная часть айсберга мыслительной деятельности, и для управления движениями человека требуется переработка огромных объемов поступающей в мозг первичной информации и синтез сигналов управления для систем с большим числом степеней свободы. Это часто находится на пределе возможностей современных компьютеров. Поэтому в середине 90-х в Японии на смену программы «ЭВМ пятого поколения» пришла программа "Вычисления в реальном мире", где речь идет, прежде всего, о том, чтобы дать вычислительным системам возможность самостоятельно воспринимать воздействия внешнего мира и действовать в нем. Авторы программы огромную роль - до 40% ее содержания - отводят исследованию естественных моделей поведения и созданию искусственных нечетких и нейросетевых систем для их моделирования. Эти обстоятельства и определяют актуальность тематики настоящей работы - разработки и исследования гибридного интеллектуального подхода к построению и программной реализации имитационных моделей поведения биологических систем. В русле этой тематики на основе
5 нейронечеткого подхода была разработана и программно реализована имитационная модель движения человека, учитывающая основные особенности поведения биологических объектов, которыми являются принципиальная неопределенность ряда параметров, необходимость решать одновременно ряд различных задач и возможность самостоятельного целеполагания.
Задачей настоящего исследования явилось повышение интеллектуальных возможностей нейронечеткнх систем за счет разработки предметно-ориентированных нечетких баз знаний продукционного типа-Методы искусственного интеллекта, применимые к моделированию процессов управления в биомеханических системах, были развиты в работах А.Н, Аверкина, И.З- Батыршнна, А.Г. Беленького, Л.С. Бернштейна, В.И. Городецкого, В.Н- Вагина, В-В- Емельянова, A.IL Еремеева, А.А. Зенкина, О-П. Кузнецова, О.И. Ларичева, А.Н. Мелихова, А.С. Нариньяни, Г.СОсипова, Э.В. Попова, Г-С Поспелова, Д.А. Поспелова, В.Г. Редько, ВЛ. Стефанюка, В.Б.Тарасова, ЭА.Трахтенгерца, В.К. Финна, И.Б. Фоминых, Г.С. Цейтлина, В.Ф, Хорошевского, МП- Шестакова, А.И. Эрлиха.
Гомеостатика изучает ряд систем управления в биологических объектах, которые характеризуются наличием двух совместно работающих, но различных между собой по структуре и целям подсистем и управляющей ими структуры верхнего уровня. Для таких систем характерна высокая устойчивость и быстрая адаптируемость. Основы гомеостатики были изложены в работах Ю-М. Горского, СВ. Покровского, А.В. Теслинова, А.А. Степанова.
Цель работы. Целью работы является исследование различных подходов к построению имитационных моделей биологических систем на основе нейробионических методов искусственного интеллекта с помощью компьютерного моделирования и разработка необходимого математического и программного обеспечения.
Основные направления работы сводятся к решению следующих задач:
- Разработка алгоритмов обучения имитационных моделей систем
управления, включающих усложнение работы, целей и изменение структуры
систем в процессе обучения,
Исследование влияния выбора Т-норм на скорость обучения системы и адекватность функционирования имитационной модели.
Разработка программного комплекса для построения и исследования гибридных многоуровневых нейронечетких систем, основанных на иерархических принципах.
Создание программного комплекса для имитационных моделей гомеостатов, исследование с помощью этих моделей работы гомеостатов в нормальном режиме и при возникновении нарушений в системе управления.
Методы исследования
Поставленные задачи решаются с помощью методов нейронных сетей, нечетких систем и гомеостатов.
Достоверность научных результатов Достоверность научных результатов подтверждается:
соответствием основных теоретических результатов экспериментальным;
апробацией основных результатов на конференциях;
- внедрением гибридной иерархической пейронечеткой системы в РГЛФК с
целью моделирования и исследования процессов управления а
биомеханических системах.
Научная новизна
Новыми являются: 1. 3-х-слойная иерархическая архитектура гибридных интеллектуальных нейронечетких систем.
Алгоритмы построения самообучающихся систем с изменяемой структурой и с возможностью самостоятельного целеполагания.
Алгоритмы обучения гибридных интеллектуальных систем на основе изменения используемых в нечетких регуляторах триангулярных норм.
Компьютерные модели для исследования адаптивности, надежности и помехоустойчивости систем, созданных на основе гомеостатического подхода.
Реализация результатов* Иерархическая нейронечеткая система внедрена в Российской государственной академии физической культуры для использования в образовательном процессе с целью исследования процессов управления и обучения в биомеханических системах в курс «Основы теоретической и практической подготовки спортсменов» и в Московском энергетическом институте для использования в учебном процессе по теме «Искусственный интеллект» с целью изучения принципов работы нечетких регуляторов. Получены акты о внедрении программного комплекса для решения задач изучения процессов формирования двигательных программ от РГАФК и о внедрении программного комплекса в образовательный процесс от кафедры прикладной математики МЭИ,
Апробация работы. Основные результаты работы докладывались и обсуждались на 6-ой и 7-ой научных конференциях аспирантов и студентов «Радиотехника, электроника, энергетика» в Московском Энергетическом институте, (Москва, 2000, 2001), на конференциях ''Информационные технологии в науке, образовании, телекоммуникации, бизнесе ITSE'2000, ITSE^OOl", (Гурзуф, 2000, 2001), на 16-м Международном семинаре «Гомеостатика живых, природных, технических и социальных систем", (Москва, 2000), на конференции «Нейрокомпьютеры и их применения» в Институте проблем управления (Москва, 2000), на конференциях
8 "Электроника-2010. Перспективные виды электротехнического оборудования для передачи и распределения электроэнергии ТРАВЭК'2001, ТРАВЭК'2003" (Марфино, 2001, Солнечногорск, 2003), на конференциях «Физиология мышечной деятельности» в Российской Государственной Академии физкультуры и спорта (Москва, 2001, 2002), на 8-й национальной конференции по искусственному интеллеюу с международным участием КИИГ2002 (Коломна, 2002), на общемосковском семинаре по искусственному интеллекту (Москва, 2002), на 7-м конгрессе европейского колледжа спортивных наук, (Греция, Афины, 2002), на сателлитном симпозиуме "Интеллектуальные системы управления движениями человека" в рамках 7-го международного конгресса "Современный олимпийский спорт и спорт для всех", (Москва, 2003), на специальной секции международного симпозиума EUNITE-2003 "Гибридный и адаптивный вычислительный интеллект в медицине и биоинформатике" (Оулу, Финляндия, 2003).
Публикации. Основные результаты, полученные при выполнении диссертации, опубликованы в 14 печатных работах.
Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения и списка использованной литературы, содержит 66 рисунков, 1 диаграмму, список литературы включает 101 наименование. Общий объём
диссертации составляет 134 страницы.
Содержание работы
Во введении обоснована актуальность темы, сформулирована цель работы и приведено краткое содержание диссертации.
В первой главе приведена структура направления «искусственный интеллект» и обзор методов искусственного интеллекта, используемых при
моделировании движений- Системы искусственного интеллекта по классификации ДА. Поспелова разделяются на системы нейробионического направления, моделирующие интеллектуальные процессы на основе реальных биологических процессов (искусственные нейронные сети, генетические алгоритмы, искусственные иммунные системы, гомеостатический подход), и на системы программно-прагматического направления, основанные на моделировании реальных интеллектуальных процессов в виде черного ящика. В последнем случае на основе логического аппарата и современных программных средств моделируется отображение «вход-выход» для заданного интеллектуального процесса.
Настоящая работа относится к нейробионическому направлению. Это направление носит четко выраженный фундаментальный характер и его интенсивное развитие невозможно без одновременного глубокого изучения мозга нейрофизиологическими, морфологическими и психологическими методами, К числу задач, которые могут быть решены в рамках данного подхода, относятся параллельное распознавание зрительных образов, обучение условным рефлексам и простым движениям. При моделировании движений в настоящей работе основное внимание уделяется нечеткому и нейросетевому подходам, объединенным Лотфи Заде в 1993 году в направление мягких вычислений, куда кроме нечетких систем и нейронных сетей вошли генетические алгоритмы.
Нечеткий регулятор (HP) - это нечеткая продукционная модель системы поддержки принятия решений для управления, позволяющая описывать правила функционирования системы на естественном языке. Существует четыре способа составления правил нечеткого управления: 1) на основе опыта и знаний эксперта; 2) путем создания модели действий оператора; 3) путем обучения и 4) на основе нечеткой модели объекта управления.
Нейронная сеть - это динамическая система для обработки когнитивной информации, основанная на модели нейрона. Сделаны первые попытки
10 использования теории нейронных сетей применительно к моделированию процесса обучения двигательным действиям в спорте, и в настоящее время это направление активно развивается.
Нейронные сети и нечеткие контроллеры используются для построения гибридных интеллектуальных систем, объединяющих достоинства обоих
ПОДХОДОВ.
Бо второй главе изложена теоретическая часть диссертации. В начале дана постановка задачи - построение иерархической многоуровневой нейронечеткой системы управления, затем краткое описание объекта моделирования - системы управления поддержанием равновесия биомеханического многозвенника,
В качестве объекта моделирования взята система управления поддержанием равновесия человеком. При изучении процессов управления вертикальной позой необходимо обращать внимание на сложность взаимодействия всех вовлеченных в эти процессы систем и координирование биомеханических звеньев, участвующих в обеспечении поддержания равновесия- Нижним уровнем предлагаемой системы управления являются тяги, работающие по принципу равновесной точки. Согласно этому принципу, основным параметром является равновесная длина, при превышении которой начинает увеличиваться сила. Но при превышении некоторой оптимальной, для данных условий, длины сила начинает уменьшаться.
Основным свойством таких систем управления является способность к самообучению, самостоятельному целеполаганию и изменению своей внутренней модели (модели объекта управления). Поэтому предлагаемая имитационная модель является семиотической моделью. Для перенастройки таких моделей необходимо изменение цели функционирования системы, в её ходе происходит формирование нового уровня системы со своими задачами. Правила получения выходных значений на начальном этапе работы - просто одновременная работа всей системы тяг, а на последующем - сложное
асинхронное взаимодействие. Для формализации модели используется уточненное понятие нечеткой прагматической семиотической системы, предложенной А.Г, Беленьким и И.Н. Федосеевой, и обобщающей определение Д.А.Поспелова. В главе даётся подробное описание этой системы, разработанной для решения задачи имитационного моделирования. Для моделирования второго уровня управления в системе использовалась искусственная нейронная сеть (ИНС). В ходе обучения происходит настройка второго уровня на решение задач управления,
В третьей главе описана программная реализация имитационной модели для задачи моделирования движений в биомеханическом объекте, а также для моделирования гомеостатических структур. Для первого случая разработана программная среда, осуществляющая координацию между HP и ИНС в зависимости от режима работы (обученная система, необученная система, система в режиме обучения).
Для моделирования нечеткого регулятора была разработана программная среда, которая включает в себя блоки выбора Т-норм, методов дефаззификации, вывода и фаззификации, а также блоки создания новых Т-норм. Были проведены исследования, касающиеся эффективности основных из этих методов, а также методов импликации. Установлено, что наилучшими показателями адекватности реальным данным обладают системы, построенные на основе нечеткой продукционной базы знаний, созданной с применением вероятностной Т-нормы и метода дефаззификации по центру тяжести. Среди методов импликации наилучшим, с точки зрения соответствия полученных результатов реальным данным, оказался оператор импликации, аналогичный Т-норме Лукасевича.
Программное обеспечение имитационной модели гомеостата включает в себя блок самонастройки и блок, позволяющий моделировать нарушения в работе гомеостата.
В четвертой главе описаны результаты программных экспериментов, относящиеся к обучению модели и её работе.
Установлено, что для успешного обучения нейросети большое значение имеет правильный выбор Т-нормьг, при которой происходит создание обучающей выборки; наилучшим вариантом является вероятностная Т-норма. Использование вероятностной Т-нормы дает уменьшение ошибки на 40% по сравнению с Т-нормой Лукасевича и на 60 % по сравнению с Т-нормой Заде.
В результате программных экспериментов установлено, что разработанная система способна осваивать новые режимы работы.
Совместная работа тяг, к которой прибегает необученная система, позволяет уменьшить число степеней свободы за счет того, что система превращается из трехзвенника в однозвенник, но при этом утрачивается возможность противостоять сильным внешним воздействиям и экономить энергию, так как тяги постоянно находятся в напряжении. Неэффективность работы такой системы приводит к необходимости изменения целей функционирования.
При разнонаправленном движении звеньев за счет того, что тяги напрягаются и расслабляются в разные моменты времени, уменьшаются суммарные энергозатраты. Объект управления в результате обучения из однозвеппика превращается в трехзвенник, выбирая из траекторий возвращения в равновесное состояние наиболее оптимальные и осваивая новые режимы работы. В результате программных экспериментов было установлено, что при переходе на новый режим работы энергозатраты снижаются примерно на 40 %.
В конце четвертой главы дан краткий обзор возможных способов применения модели. Модель позволяет изучить проблемы управления движениями человека, связанные с взаимоотношением периферии и центра, моторной и сенсорной систем, формирования и изменения моторных программ произвольных движений, Данные, полученные в ходе изучения модели, могут
13 быть использованы при разработке восстанавливающих процедур для людей с заболеваниями опорно-двигательного аппарата,
В пятой главе рассмотрен способ имитационного модел ирования биологических систем, основанный на гомеостатическом подходе, и дано сравнение гомео статического и нейронечеткого подходов, Гомеостатический подход применяется для решения задач управления в замкнутых системах в тех случаях, когда требуется поддержание постоянства параметров, функций или трендов развития. В задачах управления движением гомеостатический подход применим для описания биомеханического равновесия отдельной тяги,
В заключении приведены основные результаты, полученные в ходе работы, и перспективы их использования.
Гибридные интеллектуальные системы
Помимо нейронных сетей существует множество систем, основанных на нейросетях [46]. Среди них нейронечеткие сети (например, нейросети Петри), нейронечеткие экспертные системы (например, системы, в которых дуги сети соответствуют продукционным правилам), а также системы, где нейросеть обучает регулятор определенному набору правил или заменяет его в случае, если регулятор неправильно работает [47]. Нечеткие нейронные сети. В нечетких нейросетях используются понятия: нечеткое число, функция принадлежности, нечеткие операции. В этом случае каждая из функций может оперировать нечеткими числами, используя их как в качестве аргументов, так и выходных значений [48]. Наиболее часто используются две разновидности нечетких нейронов, В первой модификации используются модели, аналогичные обычным (четким) сетям, но в которых представления параметров нечеткие (РисЛ.20). п Рис.1.20, Нейронная сеть с нечетким представлением параметров.
Допустим, на вход нейрона поступает нечеткое значение, равное "приблизительно 2", а весовой коэффициент данной связи "приблизительно половина", откуда ясно, что результирующее значение будет "близко к единице". Обычно функция принадлежности максимальна в некоторой точке, называемой средним значением нечеткого числа, и плавно уменьшается при отдалении от него в сторону уменьшения или увеличения аргумента, чем и обусловлена треугольная или куполообразная форма функции. Во второй роль входного сигнала / играет функция принадлежности а вместо суммирования используются операции MIN или МАХ, берущиеся по совокупности функций принадлежности (Рис.1.21). Соединяясь в сеть, нечеткие нейроны образуют нечеткую нейронную сеть. Как и в случае с четкими нейронами, нечеткие нейронные сети могут быть однослойными и многослойными, с обратными связями и без обратных связей, полносвязными и иерархическими, а также комбинированными. Так как четкие нейронные сети являются подмножеством нечетких, вторые обладают всеми положительными свойствами первых, но являются более эффективными при наличии неопределенностей во входных сигналах. Построение обычных нейронных сетей при подобных обстоятельствах может требовать огромного количества нейронов, что сильно затруднит реализацию такой сети на современной технике, и, кроме того, большое число обучающих пар, необходимых для учета всех возможных отношений нечетких входов и выходов, может потребовать продолжительного обучения (для серьезных задач), что также не может быть приемлемым для гибкой адаптируемой системы. В работах Сулина А.В. изложено решение задачи выбора с помощью нейросети оптимальной Т-нормы [49,50]. Среди самых известных моделей нейронечеткие системы ANFIS, SONFIN, NEFCON, EfiiNN, FINEST, Fuzzy-Net FUN, Их сравнение дано в таблице 1, где показаны характеристики обучения каждой из этих систем распознаванию функции, заданной дифференциальным уравнением: В первом столбце приведены названия исследовавшихся систем, во втором - количество шагов, необходимых для того, чтобы процесс обучения завершился, в третьем - значение среднеквадратичной ошибки. Среди них был исследован многослойный персептрон. Из таблицы следует» что нейронечеткие системы во многом эффективнее персептронов.
Система ANFIS является одной из первых гибридных нейронечетких моделей и одним из лучших инструментов аппроксимации функций [51]. У неё 5 слоев, первый слой вычисляет функции принадлежности входных величин нечетким множествам, которые соответствуют входным нейронам. Функция принадлежности определяется двумя параметрами, в соответствии с формулой где х - входное значение, с - центр нечеткого множества, а а - ширина этого множества. Второй слой перемножает эти значения, формируя общий вес правил в соответствии с Т-нормой, которая является функцией этих нейронов. В 3-м слое вычисляется относительное значение веса правила, в 4-м вычисляются значения заключений в соответствии с заранее установленными параметрами по формуле где wt - выход третьего слоя, р(,Г; { - множество параметров, х,у - значения, подаваемые на вход системы. Выходной 5-й слой вычисляет конечный результат через метод центров тяжести. Процедура обучения состоит из ряда этапов, в каждом из которых 2 шага: первый основан на методе наименьшего среднеквадратичного отклонения и используется, чтобы настроить параметры 4-го слоя, а второй использует метод обратного распространения ошибок и настраивает параметры 2-го слоя. Во время выполнения первого шага не изменяются входные параметры, а второго - выходные. При выполнении каждого из шагов на вход подается обучающее множество образцов. Система ANFIS не изменяет в ходе обучения свою структуру в отличие от системы NEFCON. Система NEFCON состоит из 3-х слоев; узлы внутреннего слоя соответствуют правилам [52], Веса связей вычисляются на основе нечетких множеств, представляющих эти связи. Процесс обучения состоит из 2-х основных этапов; сначала система создает первоначальное множество правил или дополняет правила, созданные вручную, а потом изменяет или модифицирует нечеткие множества. Настройка правил производится с помощью алгоритма обучения с подтверждением. Потом производится настройка функций принадлежности. На обеих стадиях вычисляется нечеткая ошибка Е7 чтобы перенастроить правила.
Система EfuNN обучается распознавать набор правил [53]. Входной слой проводит данные к следующему слою, который вычисляет степени принадлежности этих данных к заранее заданным нечетким множествам. Каждая входная переменная представляется группой распределенных в пространстве нейронов, которые представляют нечеткие множества значений переменных. Если значение переменной не принадлежит ни одному из этих множеств со степенью, большей некоторого порогового значения, то в этом слое создается новый нейрон. Узлы третьего слоя соответствуют правилам; они представляют собой прототипы возможных объединений входных и выходных данных. Правила настраиваются с помощью алгоритма «победитель забирает всё». Функции принадлежности настраиваются с помощью алгоритма обратного распространения ошибки. Четвертый уровень производит срез выходного множества на уровне значения входа, а пятый вычисляет точное значение выходной переменной.
Общее описание имитационной модели системы управления движением биомеханического многозвенника
Каждая тяга управляется нечётким регулятором, а вся система -искусственной нейронной сетью- От регулятора в ИНС поступает значение напряжения, созданное тягой в данный момент (афферентация), а от ИНС к HP - значение напряження, определяемое сетью. Конечное значение напряжения тяги определяется на основе данных о внешней и внутренней ориентации системы, ее механических свойств (функция ИНС) и возможностей тяги в
Система управления, основанная на такой структуре, является семиотической. Она может самостоятельно изменять свои цели, иерархическую структуру и настраивать новые уровни управления. Первый этап.
Сенсорные датчики положения определяют отклонение верхнего конца системы от начального положения (оптический сенсор) и отклонение центра масс от вертикали.
В случае если сенсоры не работают, система управления переходит в режим коактивации. Начальные условия - внешние воздействия, выводящие систему из равновесия, а также начальная конфигурация системы (углы между звеньями и напряжения тяг). ИНС на данном этапе не задействована в работе.
Нечеткие регуляторы (они представляют собой систему из нескольких простых регуляторов, учитывающих различные статические и динамические свойства тяги), получив управляющий сигнал от сенсоров и непосредственно от тяг, преобразуют его в соответствии с возможностями тяг на данный момент. Так как система нечетких регуляторов самостоятельно не решает сложные задачи» то система управления упрощает процесс управления- Объект превращается в однозвенник за счет одновременного напряжения всех тяг. Из-за этого уменьшается число степеней свободы. Работа системы регуляторов осуществляется так, когда на вход поступает возмущение; все регуляторы дают своим тягам «задание» усилить напряжение. Потом, напряжение спадает, и система возвращается в изначальное положение. Управляющие сигналы поступают сразу ко всем тягам. Цель системы - удержать трехзвенник. Второй этап.
По мере накопления опыта система обучается и запоминает информацию с помощью ИНС - главного управляющего органа.
Для этого используется следующий алгоритм: сначала, случайным образом, выбираются возможные варианты возвращения в исходное состояние, и каждый из них оценивается по двум основным критериям; затраты энергии и суммарное отклонение ОЦТ. Оценка производится с помощью простого нечеткого регулятора с изменяющимися Т-нормами. Варианты отличаются временем и амплитудой подаваемого на тяги напряжения, диапазон амплитуды выбирается на основе равновесной длины тяги- Если эта длина большая, то тогда диапазон большой, если малая - диапазон ограниченный. Существует оптимальная длина, при которой диапазон позволяет наилучшим образом выбирать оптимальную траекторию.
При достаточном наборе данных система переходит на обычный режим работы, управляя «маятником» как многозвенной системой.
На этом этапе более полно учитывается информация от сенсорных датчиков, так, чтобы в соответствии с ней оценивать эффективность работы. Нечеткие регуляторы подают напряжение в случайные моменты времени; величина напряжения определяется диапазоном напряжений, возможных в данных условиях. Управляющие сигналы поступают к тягам, которые работают попеременно. Цель системы - выбрать оптимальные стратегии. Третий этап.
ИНС работает в качестве центрального интегратора, выдавая задачи системам нижележащих уровней. Она является системой высшего уровня, настроенной благодаря алгоритму, основанному на построении диапазона, из которого выбирались случайные значения. Также в основу алгоритма были положены случайный поиск, изменение свойств регулятора и возможность самостоятельного целеполагания. Цель системы - работа в соответствии с оптимальными стратегиями,
В соответствии с вышесказанным в ходе обучения происходит переход от одного принципа работы к другому, что выражается, прежде всего, в изменении иерархической структуры. Эти изменения осуществляются за счет настройки нового уровня по алгоритмам случайного выбора данных из некоторого оптимального диапазона.
Описание программы настройки параметров нечеткого регулятора
В качестве основы для построения регулятора для имитации тяги выбрана система WARPSDT1.0, в которой для вычисления веса (истинностного значения) посылки значения входных переменных объединяются по правилу минимума. Для вычисления функций принадлежности заключений используется метод максимальных точек. Нечеткое значение выходной переменной вычисляется путём "логического максимума". Дефаззификация осуществляется по методу центра тяжести. Улучшенная версия регулятора, интегрированная с Delphi, учитывает также значения, полученные на предыдущем шаге. Схема взаимодействия регуляторов представлена на Рис.3.7. На Рис.3.9-3.11 представлены функции принадлежности для регулятора, определяющего зависимость «длина-сила», В системе работа тяги с позиций теории равновесной точки имитируется с помощью определенного набора правил, приведенных ниже, в которых входными величинами являются равновесная длина и длина мышцы, а выходом - изменение силы, вычисляемое по произведению частоты импульсации на амплитуду. Функции принадлежности входной переменной «длина» для данного регулятора показаны на Рис.3.9, По горизонтали отложены значения переменной, а по вертикали - значения функций принадлежности нечетким множествам. В задаче важно выделить функции принадлежности для минимального и максимального значений длин, так как при этих длинах особенно быстро изменяются свойства. Функции принадлежности выходных переменных показаны на Рис.3.10-3.11, На втором этапе настройки регулятора корректируются функции принадлежности для случаев 1, 2 и крайнего случая 4; процесс корректировки отражен на Рис.ЗЛ4-ЗЛб. Необходимость и возможность их коррекции можно рассмотреть на примере зависимости «длина-сила», показанной на Рис.3 Л 3.
При динамическом изменении управляющего параметра задача выбора правильной Т-нормы оказывается существенной. Для данной задачи оптимальной является вероятностная Т-норма, а наименее применимы Т-норма Лукасевича и драстическая Т-норма, так как при их применении у выходной функции появляются дополнительные локальные экстремумы, что следует из РисЗ.18-3.19. Также были проведены исследования, касающиеся влияния других параметров настройки регулятора. Было установлено, что из методов масштабирования функций выходной переменной лучше всего подходит максминный метод, так как при нем график изменения выходного значения лучше отражает нелинейность, чем, например, при использовании метода минимальной точки; методы дефаззификации не очень сильно отличаются по своим результатам. Эти различия видны из зависимостей силы от длины и динамической жесткости, полученных при разных методах и показанных на Рис. 3,20-3.21 (по горизонтали - длина, по вертикали - сила, значения динамической жесткости приведены справа в % от максимальной). Оптимальными параметрами работы регулятора являются вероятностная Т-норма и максминный метод среза выходной функции принадлежности, что подтверждается в работе [29]. Среди параметров регулятора, оказывающих существенное влияние на его работу, часто указывают также нечеткие расширения операторов импликации, среди которых: сильная импликация В нечетком регуляторе можно изменять веса правил, и вычислять выходные значения с использованием оператора импликации. Исследования по применимости разных методов импликации проводились для модели механического перевернутого маятника; в ходе их было установлено, что оптимальным является оператор импликации, аналогичный Т-норме Лукасевича, используемый в WARPSDT1.0 (усредненная ошибка - 0.10039), потом - вероятностной Т-норме (усредненная ошибка - 0Л0348), худшим является оператор вида Его усредненная ошибка составляет 0,83406. Правила регуляторов, объединяющих звенья в единую систему, аналогичны правилам для маятника на движущейся платформе - если верхнее звено отклонилось влево, то надо сдвинуть вправо нижнее звено, и т.д. Подобные правила действуют и в биомеханической системе. Обычно основным является нижнее звено, но могут быть и другие режимы работы, например, основным является верхнее звено, тогда сначала следует уравновесить это звено. Эти режимы зависят от свойств тяг и инерционных свойств каждого отдельного звена. Для учёта инерционности был разработан специальный регулятор. Он учитывает длину звена, его массу, начальные характеристики тяг, С его помощью можно в определённой степени моделировать геометрию системы.
Исследование зависимости скорости обучения системы от начальных условий
Дія настройки ИНС используется следующий алгоритм - сначала случайным образом выбираются возможные варианты возвращения в исходное состояние и каждый из них оценивается по двум основным критериям -затратам энергии и суммарному отклонению ОЦТ. Варианты отличаются по времени подачи напряжения и величине подаваемого на тяги напряжения; диапазон величины напряжения выбирается в зависимости от равновесной длины тяги. Если эта длина большая (больше 70 % от максимальной), то тогда диапазон большой, если малая (менее 30 % от максимальной) - то диапазон малый. Существует оптимальная длина, при которой диапазон позволяет наилучшим образом выбирать оптимальную траекторию возврата многозвенника в исходное положение. При большом диапазоне из-за большого количества вариантов системе трудно выбрать оптимальный. При малом диапазоне количество таких вариантов недостаточно; оптимальный вариант может быть не найден из-за воздействия случайных факторов. Хотя поддержание равновесия может осуществляться и без информации от сенсоров, обучение сети происходит значительно быстрее, если такая информация есть; при этом более важным является оптический сенсор. На Рис.4.2 показаны: слева - данные, полученные при обучении с учетом сенсоров, справа - данные, полученные при обучении без учета сенсоров. Если рассматривается подборка значений, полученных при одной н той же равновесной длине, то значение равновесной длины не является входным параметром в наборе данных обучающей выборки. В этом случае скорость обучения выше, чем в общем случае. Рассматривается также вариант, когда при одном и том же возмущающем воздействии различна равновесная длина. Сравнение характеристик процесса обучения для этих вариантов дано на РисАЗ. При достаточно большом времени обучения данные нейросети могут с большой степенью точности совпадать с реальными данными.
Сравнение выходных значений обученной нейросети с данными, полученными при моделировании мыогозвешшка (вверху - данные из обучающей выборки), дано на Рис.4.4. Данные представлены для параметра напряжение левой тяги третьего звена. Совместная работа тяг, к которой прибегает необученная система, позволяет уменьшить число степеней свободы системы за счет того, что система превращается из трехзвенника в однозвенник или даже в нульзвенник, но при этом утрачивается возможность противостоять сильным внешним воздействиям и снижать затраты энергии, так как тяги постоянно находятся в напряжении. При разнонаправленном движении звеньев уменьшается среднеквадратичное отклонение общего центра тяжести от положення равновесия, а за счет того, что тяги напрягаются и расслабляются в определенные моменты времени, уменьшаются энергозатраты. Второй способ более сложен с точки зрения процесса управления, поэтому, при условии изменения целей, требуется настройка нового уровня, представленного нейросетью, построенной на основе многослойного персептрона с алгоритмом обучения «обратное распространение ошибок». Процесс выделения значимых входных значений для обучения осуществляет другой многослойный персептрон, обучаемый по методу адаптивного резонанса.
В результате обучения объект управления из однозвенника превращается снова в трехзвенник. Система может осваивать новые режимы работы и изменять свои цели. На Рис.4.5 показано, что в ходе обучения система изменяет свои свойства (переходит от однозвенника (эффекта колонны) к многозвеннику (сгибанию в суставах. В верхней части показаны положения многозвенника, в средней - графики изменения напряжения на тягах, сверху вниз - на первом, втором и третьем звеньях. В нижней части показаны сокращенные схемы процессов управления необученной (без учета ИНС) и обученной систем. В левой колонке, где показана работа необученной системы, затраты энергии составили 34 Дж, а суммарное отклонение ОЦТ 11, а в правой колонке - затраты энергии 17 Дж, а суммарное отклонение ОЦТ 17 .