Содержание к диссертации
Введение
Глава 1. Методы и проблемы построении адаптивных систем управления 10
1. Теория автоматического регулирования (управления) 10
2. Конечные автоматы 12
3. Контроллеры на основе нечеткой логики 13
4. Контроллеры на основе искусственных нейронных сетей 21
5. Метод автономного адаптивного управления 25
Глава 2. Обобщение метода и синтез систем ААУ на основе теории нечетких множеств 32
2.1. Анализ и описание системы ААУ на основе теории нечетких множеств 32
2.1.1. Обобщение метода ААУ на основе теории нечетких множеств 32
2.1.2. Основная схема системы ААУ и ее рекомпозиция 35
2.2. Синтез систем ААУ с использованием нечеткой логики 37
2.2.1. Обзор методов кластеризации и генерации правил 37
1. Существующие методы генерации правил 37
2. Методы кластеризации данных 40
2.2.2. Разработанные методы синтеза подсистем системы ААУ на основе нечеткой логики 46
1. Кодирование входной информации 48
2. Формирование входных нечетких множеств (функций принадлежности) 49
3. Генерация нечетких правил управления 51
4. Подсистема распознавания образов 54
5. Подсистема принятия решений 54
6. Управление базой знаний 56
Глава 3. Проектирование прикладной системы ААУ на основе теории нечетких множеств с использованием унифицированного языка моделирования UML 59
1. Разработка диаграммы базовых классов системы ААУ для среды 4GN 59
2. Разработка диаграммы классов системы управления 63
3. Разработка подсистемы визуализации 71
Глава 4. Эксперименты с прикладной системой ААУ на основе нечеткой логики при управлении различными объектами 78
1. Методика расчета по покрытия правилами в БЗ входных и выходных множеств системы 79
2. Система управления перевернутым физическим маятником 80
3. Система стабилизации углового движения космического аппарата 90
4. Система управления мобильным роботом 97
Заключение 102
Список литературы
- Контроллеры на основе нечеткой логики
- Основная схема системы ААУ и ее рекомпозиция
- Разработка диаграммы классов системы управления
- Система управления перевернутым физическим маятником
Введение к работе
Постоянно растущая сложность и разнообразие задач, решение которых возлагается на автоматические системы, в последнее время определяют повышенную потребность в системах управления с возможно более универсальными свойствами. Однако, ни один из существующих на текущий момент подходов к построению систем управления - ни теория автоматического управления, ни нечеткие контроллеры, ни искусственные нейронные сети, ни другие технологии, не обладают необходимой универсальностью. С другой стороны, имеет место уверенность в возможности построения систем с искомыми свойствами, которая основана на наблюдении действия таких систем в природе, это нервные системы живых организмов.
Возможно, что претендовать на более широкий охват типов решаемых задач могут методы, основанные на концептуальных подходах, моделирующих функциональность и структуру нервных систем живых организмов, поскольку в таких методах объект управления описывается совокупностью формализованных знаний, заранее заданных, либо эмпирически приобретенных системой, и менее привязанных к той или иной функциональной зависимости параметров объекта управления, чем это имеет место в моделях, выраженных в аналитической форме уравнений. К таким концептуальным подходам относится и метод автономного адаптивного управления (ААУ), развиваемый в Отделе имитационных систем Института Системного Программирования РАН.
Метод ААУ определяет общие принципы и некоторые частные реализации самообучающихся систем управления объектами, для которых отсутствует математическая модель и его логико-лингвистическое описание, а известны только общие критерии качества управления (целевая функция).
Однако все первые системы ААУ строились на основе дискретных устройств, что ограничивало область их применения, в особенности, при работе таких систем управления в «реальном» непрерывном мире. Для обеспечения достаточно гладких зависимостей между входными и выходными переменными необходимо было разбивать входное и выходное признаковые пространства на достаточно большое количество диапазонов, и на каждом из них проводить пробные управляющие воздействия для нахождения закономерных реакций. Это приводило к экспоненциальному росту объема базы знаний и времени обучения системы при линейном увеличении критериев качества управления или количества входных переменных системы.
Несмотря на то, что были разработаны специальные алгоритмы, позволяющие значительно ускорить обучение системы, основываясь на различных эвристиках, в целом эффективность систем ААУ оставалась реализованной далеко не полностью.
Целью настоящей работы является разработка подходов к применению нечеткой логики в системах ААУ, что должно повысить эффективность систем ААУ, наделив их непрерывными свойствами. При этом корректность такого применения нечеткой логики основывается на теореме FAT (Fuzzy Approximation Theorem), доказанной Б. Коско (В. Kosko) и гласящей, что любая математическая система может быть аппроксимирована системой на основе нечеткой логики.
Актуальность данной темы заключается, с одной стороны, в необходимости наделения систем ААУ непрерывными свойствами, за счет использования теории нечетких множеств, с целью улучшения их характеристик и расширения области применения, а, с другой стороны - в возможности расширения области применения традиционных нечетких контроллеров за счет применения в них методов обучения и адаптации, используемых в системах ААУ. Разработанные в работе методы могут использоваться для построения широкого класса прикладных систем управления.
Цели и задачи диссертационной работы
Цель диссертационной работы состоит в том, чтобы найти подходы и разработать методы построения управляющих систем ААУ на основе теории нечетких множеств. Такие методы позволят преодолеть ограничения систем ААУ, связанные с обязательным требованием четкой дискретизации информационных объектов.
Для достижения указанной цели необходимо решить следующие задачи:
1. Разработать метод автоматического определения входных и выходных нечетких множеств, заданных при помощи функций принадлежности.
2. Разработать метод автоматической генерации правил управления, описывающих функциональную взаимосвязь между входом и выходом.
3. Разработать метод автоматической адаптации набора правил базы знаний (БЗ) к изменяющимся свойствам объекта управления (ОУ) и среды.
4. Разработать метод оценивания образов и принятия решений.
5. Осуществить проверку работоспособности и эффективности разработанных методов на примерах прикладных систем.
Научная новизна
Научная новизна работы заключается в том, что в данной работе впервые предпринята попытка построения способной к самообучению автономной адаптивной системы управления на основе нечеткой логики. А именно:
• введено описание системы ААУ в терминах теории нечетких множеств. Разработана кодировка входных и выходных нечетких множеств и нечетких правил управления специального вида;
• предложен метод генерации нечетких правил управления, а также входных и выходных функций принадлежности на основе модифицированного метода кластеризации методом вычетов;
предложен метод адаптации набора правил в базе знаний к изменяющимся свойствам объекта управления и среды посредством введения для каждого правила степени адекватности и правила изменения ее величины;
предложен метод принятия решений, учитывающий степени адекватности правил управления в базе знаний и оценки результирующих образов правил;
на примере модели прикладной системы управления показаны преимущества разработанного подхода в скорости обучения перед системами управления, построенными на основе парадигмы обучения с подкреплением, в традиционной тестовой задаче балансировки перевернутым маятником.
Практическая ценность
Практическая ценность работы состоит в том, что разработанные методы могут быть применены для построения прикладных самообучающихся управляющих систем для широкого класса объектов управления.
Возможность построения прикладных систем управления различными объектами и их преимущества показаны на примерах системы балансировки перевернутым маятником, системы стабилизации углового движения космического аппарата и системы управления моделью мобильного робота Pioneer P3-DX.
Апробация работы и публикации
Основные положения работы докладывались на следующих конференциях и семинарах:
• всероссийской научно-технической конференции Нейроинформатика-2004, 2005 МИФИ,
• семинаре «Экобионика» МГТУ им. Н.Э. Баумана,
• XXIX Академических чтениях по космонавтике, 2005 год,
• всероссийской научно-техническая конференции "Наука - производство -технологии - экология» ВятГУ (г. Киров).
Основные положения работы публиковались в журналах и трудах конференций:
1. Жданов А. А., Караваев М. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 3. - М.: ИСП РАН, 2002, с. 119-135.
2. Караваев М.В., Жданов А.А. Применение нечеткой логики в системах автономного адаптивного управления. Сборник материалов всероссийской научно-технической конференции "Наука - производство - технологии - экология": Том 1. Киров: Изд-во ВятГУ, 2002, с. 13-14.
3. Alexander Zhdanov, Maxim Karavaev and Helen Maklakova, Claire Medigue, Michel Sorine. Simulation of control mechanisms in the cardio-vascular system. French-Russian A.M. Liapunov Institute for Applied Mathematics and Computer Science. Transactions. Vol. 4. Pp. 233-245. Moscow. 2003.
4. Караваев M. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 7 (под ред. А.А.Жданова). - М.: ИСП РАН, 2004, с. 41-53.
5. Караваев М.В. Правила формирования связей между нейроноподобными элементами в системах автономного адаптивного управления. С. 102-108. Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2004: Часть 2. М.: МИФИ. С. 102-108.
6. Жданов А.А., Устюжанин А.Е., Караваев М.В. Нейросетевой самообучаемый метод адаптивного управления динамическими объектами. Материалы XXIX Академических чтений по космонавтике, 2005 год. М.: 2005. с. 93.
7. А.А. Жданов, А.Е. Устюжанин, М.В. Караваев, Д.Б. Липкевич. 4GN - инструмент для разработки нейроноподобных адаптивных систем управления на основе метода автономного адаптивного управления. Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2005: Часть 1. М.: МИФИ. С. 203-209.
8. Жданов А.А., Караваев М.В. Разработка адаптивной системы управления мобильным роботом с применением нечеткой логики. Всероссийская научно-техническая конференция "Наука - производство - технологии - экология". Сборник материалов: Том 1. Киров: Изд-во ВятГУ, 2005, с. 34-36.
9. М.В. Караваев. Применение нечеткой логики в системах автономного адаптивного управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS 05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.
10. М.В. Караваев, А.Е. Устюжанин, А.А. Жданов. 4GN - программный инструмент для проектирования интеллектуальных систем управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS 05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.
Структура и объем диссертации
Работа состоит из введения, четырех глав, заключения и списка литературы. Общий объем диссертации составляет 106 страниц. Список литературы содержит 49 наименований.
Контроллеры на основе нечеткой логики
Общепринятый сейчас математический аппарат нечеткой логики впервые был изложен в 1965 году в работах Л. А. Задэ (L. A. Zadeh) [23, 36], профессора технических наук Калифорнийского университета в Беркли.
Как было упомянуто выше, нечеткая логика является многозначной логикой. В отличие от традиционной математики, требующей на каждом шаге моделирования точных и однозначных формулировок закономерностей, нечеткая логика предлагает совершенно иной уровень мышления, при котором творческий процесс моделирования происходит на наивысшем уровне абстракции и постулируется лишь минимальный набор закономерностей, выраженных в логико-лингвистической форме близкой к естественным языкам.
Однако кажущаяся упрощенность систем на основе нечеткой логики не накладывает никаких ограничений на класс решаемых ими задач по сравнению с традиционной математикой. Это утверждение было доказано Б. Коско (В. Kosko) в виде теоремы FAT (Fuzzy Approximation Theorem), гласящей, что любая математическая система может быть аппроксимирована системой на нечеткой логике [38,9].
Выделение методов и средств обработки нечеткой информации в отдельное направление современной информационной технологии оправдано тем, что эта технология является базой для построения всевозможных интеллектуальных программных систем, получивших название "нечетких систем" [39]. Обработка нечеткой информации и нечеткий вывод давно применяются в различных интеллектуальных системах, однако наиболее широкое распространение нечеткие системы получили в области управления. В настоящее время известно большое количество разработок коммерческих нечетких систем управления, которые входят в класс управляющих систем, интеллектуальных "в малом". К настоящему времени разработаны общие принципы и основы методологии построения нечетких систем управления.
Общая схема обработки нечеткой информации в системах управления выглядит обычно следующим образом. Точные исходные данные с датчиков, контролирующих управляющий процесс, переводятся в значения лингвистических переменных в специальном блоке, получившем название "фаззификатор". Далее реализуются процедуры нечеткого вывода на множестве продукционных правил, составляющих базу знаний системы управления, в результате чего формируются выходные лингвистические значения, которые переводятся в точные значения результатов вычислений в специальном блоке, получившем название "дефаззификатор". На выходе последнего формируются управляющие воздействия на исполнительные механизмы. Эта концептуальная схема лежит в основе так называемого нечеткого контроллера, используемого в интеллектуальных системах обработки неопределенной информации, в частности, в системах интеллектуального управления.
Нечеткие множества и нечеткие отношения, операции над ними. Нечеткие и лингвистические переменные
Пусть Е - универсальное множество, х - элемент E,aR некоторое свойство. Нечеткое подмножество А универсального множества Е определяется как множество упорядоченных пар А = {/JA(X)/X}, где /ЛА(Х) - характеристическая функция принадлежности (или просто функция принадлежности), принимающая значения в некотором вполне упорядоченном множестве М (например, М = [0,1]). Функция принадлежности указывает степень (или уровень) принадлежности элемента х подмножеству А. Пример графического представления функции принадлежности представлен на рисунке 1. Множество М называют множеством принадлежностей. Если М- {0,1}, то нечеткое подмножество А может рассматриваться как обычное или четкое множество.
Носителем нечеткого множества А является обычное подмножество со свойством ЦА(Х) 0, то есть носитель А = (х, /ЛА(Х) 0), Vx єЕ. Элементы хєЕ, для которых /ЛА(Х) = 0,5 называются точками перехода множества А.
В нечеткой логике над нечеткими множествами, как в булевой алгебре над простыми множествами, определены такие операции как: 1) Включение: пусть А и В - нечеткие множества на универсальном множестве Е. Говорят, что Л содержится в В, если VxeE juA(x) JLIB(X). Обозначается как "АсВ". 2) Равенство: нечеткие множества Л и В равны, если VxeE JUA(X) = цв(х). Обозначается 3) Дополнение: пусть А/=[0,1], А и В - нечеткие множества, заданные на Е. А и В дополняют друг друга, если VxeE /JA(X) = \-/ив(х). Обозначается "А=АВ" или "В=ЛА". 4) Пересечение: АпВ - наибольшее нечеткое подмножество, содержащееся одновременно в А и В. VxeE /лАпв(х) = тіп (/.ц(х), Цв(х)). 5) Объединение: АиВ - наименьшее нечеткое подмножество, включающее как Л, так и В с функцией принадлежности VxeE JUAUB(X) = max (цА(х), МВ(Х)). 6) Разность: А - В = An ЛВ с функцией принадлежности VxeE ЦА-В(Х) = /іАггв(х) = тіп (ріА(х), 1-мв(х)). 7) Дизъюнктивная сумма: АФВ = (А - В)и(В - А) = (А п АВ)и(АА п В) с функцией принадлежности VxeE /.цев(х) = max (min(/jA(x), 1-/.ів(х)); ІПІП(1-ЦА(Х), JUB(X))}. 8) Алгебраическое произведение: А -В с функцией принадлежности VxeE /JAB(X) = ЦА(Х) Мв(х) 9) Алгебраическая сумма: А+В с функцией принадлежности VxeE А+В(Х) = ЦА(Х) + МВ(Х)-МА(Х)ЫХ) 10) Возведение в степень: А а с функцией принадлежности VxeE JXAJX) = /ҐА(Х). Частные случаи возведения в степень: CON(A) = А2 - операция концентрирования, D1L(A) = А0 5 - операция растяжения. 11) Умножение на число: если а - положительное число, такое, что атах(у.А(х)) 1, то нечеткое множество осА имеет функцию принадлежности: ЦОА(Х) = О.-ЦА(Х). 12) Декартово произведение: пусть А\, А2, ..., Ап - нечеткие подмножества универсальных множеств Е\, Ej, ..., Еп соответственно. Декартово произведение А = Ai х А2 х ... х Ап является нечетким подмножеством множества Е = Е/ х Е2 х ... х Е„ с функцией принадлежности: /лА(х) = цА(хі, xh .... xj = тіп {juAi(xi), / feA .... МАП(Х«)}.
Пусть Е = Е]хЕ2Х ...хЕ„ - прямое произведение универсальных множеств и М -некоторое множество принадлежностей (например М = [0,1]). Нечеткое «-арное отношение определяется как нечеткое подмножество R на Е, принимающее свои значения в М. В случае л=2 и М= [0,1], нечетким отношением R между множествами X = Е; и Y = Ег будет называться функция R:(X,Y)- [0,1], которая ставит в соответствие каждой паре элементов (x,y)eXxY величину Ця(х,у) е[0,1]. Обозначение: нечеткое отношение на XxY запишется в виде: хеХ, yeY: xRy. В случае, когда Х= У, то есть X и Y совпадают, нечеткое отношение R: ХхХ- [0,1] называется нечетким отношением на множестве X.
Основная схема системы ААУ и ее рекомпозиция
Прежде чем приступать к описанию разработанных методов решения описанных выше задач, проанализируем основную структурно-функциональную схему движения потоков информации в системах ААУ.
Как видно из описания [29-31], блок ФРО системы поставляет в систему информацию сугубо количественного характера - образы, сформированные по показаниям датчиков. К примеру, в живых нервных системах исходными поставщиком такого рода информации являются рецепторы - терморецепторы, барорецептори, слуховые рецепторы и т.д. Аппарат эмоций в системах ААУ работает с информацией совершенно другого рода - качественной, приписывая каждому образу, сформированному блоком ФРО, его оценку с точки зрения важности этого образа для максимизации целевых функций. В живых организмах существуют явные поставщики и такого рода информации, важнейшими из которых являются болевые рецепторы, предостерегающие организм от распознавания «образов» ситуаций, опасных для его жизни.
Изначально, по «теории интенсивности» английского врача Э. Дарвина [46], считалось, что ощущения боли и количественную информацию в нервную систему поставляют одни и те же рецепторы. Однако исследования показали, что за болевые ощущения отвечает отдельная подсистема специальных болевых рецепторов - ноцицепторов. Ноцицепторы кожи, участвующие в формировании болевого ощущения при любом механическом, химическом или температурном повреждающем воздействии, являются полимодальными - воспринимают нескольких видов раздражителей. В то время как большинство рецепторов, поставляющих количественную информацию в организм, являются мономодальным - например терморецепторы, тактильные, слуховые, вестибулярные и т.д., реагирующие на абсолютное значение или изменение только одного параметра [47]. Отличие боли от других ощущений в том, что она не информирует мозг о качестве раздражителя, а указывает на то, что раздражитель является повреждающим [46]. Из вышеизложенного можно сделать вывод, что разделение фактологической и оценочной информации в живых организмах начинается уже на уровне рецепторов.
В основной же схеме системы ААУ аппарат эмоций получает информацию лишь с выходов блока ФРО, что ставит оценку в зависимость от распознанных и сформированных образов и создает риск преждевременного смешивания информации двух видов: количественной и качественной. К тому же, такая организация потоков информации несколько усложняет техническую реализацию прикладных систем ААУ: зачастую бывает невозможно приписать вновь сформированному образу какую-либо оценку, руководствуясь лишь его идентификатором, что вынуждает закладывать в кодировку идентификатора образа и необходимую количественную информацию, по которой аппарат эмоций сможет вычислить его оценку.
Исходя из всего вышесказанного, для реализации систем управления по методу ААУ в данной работе разработана дополнительная модификация основной схемы, в которой информация с датчиков поступает в аппарат эмоций непосредственно, минуя блок ФРО.
На основе этой модификации разрабатывались все алгоритмы и проводились эксперименты в данной работе.
Исходя из того, что в разрабатываемом методе система управления оперирует объектами, заданными при помощи нечетких множеств и лингвистических переменных, необходимо разработать метод определения входных и выходных нечетких множеств, а также метод генерации нечетких правил, описывающих пространственно-временные закономерности функционирования ОУ в среде. Такие пространственно-временные закономерности описываются в виде нечетких правил, задающих функциональную взаимосвязь входных и выходных переменных.
Существующие методы генерации правил
Задачу генерации нечетких множеств и правил управления часто называют задачей идентификации нечеткой модели. На текущий момент наиболее распространены три подхода к ее решению.
1-й подход основывается на использовании технологии нечетких нейронных сетей [38, 19]. Нечеткая нейронная сеть состоит из нескольких слоев элементов специального вида -нечетких нейронов, связанных друг с другом «сипаптическими» связями. Как и в традиционных нейронных сетях, всем связям поставлены в соответствие их веса, настройкой которых в процессе обучения и добиваются необходимой функциональной зависимости между входами и выходами сети. Основное отличие от традиционных ИНС состоит в том, что в нечетких нейронах операции умножения, суммирования и сигмоидальная функция активации заменены операциями /-нормы и /-конормы. В зависимости от выбора той или иной из них, нечеткие нейроны подразделяются на «И»-нейроны (операция ґ-конорма) и «ИЛИ»-нейроны (операция ґ-норма).
Настроенная нечеткая нейронная сеть функционирует подобно нечеткому контроллеру. Нейроны 1-го слоя сети соответствуют входным нечетким множествам и выполняют процедуру фаззификации (вычисляют входные функции принадлежности), нейроны последнего слоя - дефаззификацию, а скрытые слои - нечеткий логический вывод.
Процесс обучения нечеткой сети аналогичен обучению традиционных ИНС: перед обучением такой сети необходимо задать ее структуру, а веса связей настраиваются одним из алгоритмов обучения [38] с использованием традиционной для искусственных нейронных сетей обучающей выборки.
После обучения из нечеткой нейронной сети можно автоматически или при помощи эксперта извлечь правила вида «если ... то...», описывающие законы функционирования системы управления. Процедура извлечения достаточно проста, ввиду того, что структура и семантика нечеткой нейронной сети соответствует структуре и семантике классических нечетких правил управления.
При детальном рассмотрении первый подход, очевидно, неприменим в нашем случае, так как требует наличия обучающей выборки, которая по условиям задачи отсутствует. К тому же, этот подход несет в себе многие недостатки, присущие традиционным ИНС. В частности, алгоритмы дообучения (адаптации) являются крайне сложными.
2-й подход генерации правил и функций принадлежности связан с использованием генетических алгоритмов [15]. Суть метода заключается в следующем. Все параметры функций принадлежности (например, для функций треугольного вида - координата вершины и ширина основания) и нечетких правил управления (например, ссылки на функции принадлежности, их количество и т.д.) кодируются числами в определенных позициях вектора, полностью определяющего структуру и параметры системы управления (генотип) -хромосомы. На первом шаге генерируется начальная популяция систем управления - со случайными значениями параметров в хромосомах. Далее все системы управления (особи) из начальной популяции подвергаются операции скрещивания (обмен хромосомами двух особей) и мутации (случайное изменение одного или нескольких чисел в хромосоме).
Разработка диаграммы классов системы управления
Формирование образов, как пространственных в блоке ФРО, так и пространственно-временных в БЗ, происходит с использованием процедуры кластеризации методом вычетов.
Входными данными для процедуры кластеризации является история управления, которая накапливается в специальной буферной памяти системы за определенное количество тактов работы УС и записывается в виде: (Xt,l, Х,,2,... X,iN}, {уц, У t,2,- УШІ {Xt+1,1, Xt+1,2,- xt+i,N}, {yt+i,i, yt+u,- У і.м}, (2.14) где xt,i - значение /-й входной переменной (показание /-го датчика) в момент времени t, а уц - значение /-й выходной переменной (номер действия выполненного г -ым актуатором) в момент времени t,NuM- количество входных и выходных переменных соответственно.
Процедура генерации правил запускается при полном заполнении буферной памяти, после выполнения кластеризации память полностью очищается.
Для генерации однотактовых правил управления используются значения входных и выходных параметров /-го такта и значения входных параметров (/+7)-го такта, которые задают координаты одной точки в (ЛГ+М+ІУ)-мерном пространстве.
Рассмотрим пример системы управления, балансирующей перевернутым физическим маятником, установленным на тележке. Маятник нижним концом прикреплен к тележке при помощи шарнира, на плоскости действия которого лежит прямая, вдоль которой может перемещаться тележка. Задача состоит в том, чтобы при помощи подталкивания тележки удерживать маятник, на который действует сила притяжения, в вертикальном положении. Более подробно этот стандартный тестовый пример рассмотрен в главе 4.
Для решения задачи балансировки маятником, система управления должна получать информацию о текущем угле и угловой скорости маятника, и определять значение управляющего воздействия на тележку. В этом случае одна точка на входе процедуры кластеризации будет задаваться значениями угла, угловой скорости и управляющего воздействия на тележку на t-ом такте и значениями угла и угловой скорости на такте t+І. В результате, на вход процедуры кластеризации поступает набор точек, заданных своими координатами в (ІУ+М+Л -мерном пространстве. В примере с балансировкой маятником размерность пространства получается равной 2+1+2=5.
Процедура кластеризации выполняется методом вычетов, описанным выше. На вход процедуры кластеризации поступает набор точек и задаваемая априорно величина R, определяющая максимальный радиус кластера, а на выходе процедуры получается набор центров кластеров. Далее для каждого центра кластера происходит поиск точек, отстоящих от него на евклидово расстояние не более R. Если таких точек обнаружено две или больше, то из этого набора образуется кластер, описываемый при помощи набора функций принадлежности, из которых составляется правило, заносимое в БЗ.
Входные нечеткие множества традиционно для нечетких контроллеров задаются при помощи функций принадлежности. Функции принадлежности имеют трапецеидальный вид и задаются х-координатами четырех вершин трапеции: х#, ХЦ, ХГ1, и хгь (рис. 2.3). Такая форма задания позволяет определять помимо трапецеидальных функций, также функции треугольного вида (при хи = xrt).
Выбор трапецеидального вида функций принадлежности основан на сравнительной простоте вычисления данного вида функций, а также возможности интерполяции с их помощью большинства распространенных функций принадлежности, например, треугольных и колоколообразных, с достаточной для большинства задач точностью. К тому же, часто объекты управления обладают поведением, близким к линейному на небольших интервалах значений входных и выходных переменных, поэтому для управления ими можно применять нечеткие контроллеры с трапецеидальными функциями принадлежности.
Функция принадлежности генерируется по набору точек кластера, отобранных в результате работы процедуры кластеризации. Точка считается принадлежащей кластеру, если она находится на расстоянии не более чем R (R - заданный априорно максимальный радиус кластера) от выбранного центра кластера.
Рассмотрим автоматическую процедуру генерации функций принадлежности по координатам точек кластера, соответствующим угловому отклонению (другими словами - по проекциям точек кластера на одну из осей координатного пространства).
Пусть R - максимальный радиус кластера, с, - координата проекции /-ой точки кластера на соответствующую ось входного или выходного пространства системы (например, /-ое значение углового отклонения для системы управления перевернутым маятником), cmid -координата проекции центра кластера, a N- количество точек в кластере (iV =2), причем точки кластера отсортированы по возрастанию значений координат их проекций. Тогда координаты вершин трапеции, задающей функцию принадлежности трапецеидального вида, будут вычисляться по формулам:
Система управления перевернутым физическим маятником
Для проверки предложенного подхода на практике, были разработаны системы автономного адаптивного управления для трех моделей объектов управления: адаптивная система балансировки перевернутым маятником, адаптивная система стабилизации углового движения космического аппарата, адаптивная система управления мобильным роботом с целевой функцией «выработка стереотипов поведения при взаимодействии с препятствиями».
Первая модель системы управления решает традиционную «тестовую» задачу, на которой испытывается большинство систем управления: и традиционных контроллеров, и систем на основе нечеткой логики и нейронных сетей. Задача балансировки перевернутым маятником позволяет сравнивать различные подходы к построению систем управления, а точнее, их подкласса - следящих систем.
Вторая модель системы управления решает задачу, имеющую большее практическое значение - стабилизацию углового движения космического аппарата. Эта задача относится к тому же классу, что и балансировка перевернутым маятником, но имеет особенности в силу своего прикладного характера, что делает ее решение более ценным. В экспериментах с этой моделью разработанная система управления сравнивается с разработанными ранее системами ААУ, решающими эту задачу без применения нечеткой логики.
Третья система управления, реализующая целевую функцию «выработка стереотипов поведения при взаимодействии с препятствиями» при управлении мобильным роботом, решает принципиально иную задачу, решаемую до недавнего времени только нервными системами живых организмов. Эта система управления призвана показать широту применения разработанного подхода и с другими системами управления не сравнивается.
Перед описанием проведенных экспериментов в первом параграфе описывается методика измерения одной из важных характеристик нечеткой системы управления - степени покрытия набором правил входного и выходного множеств системы, являющейся аналогом заполнения базы знаний в разработанных ранее системах ААУ [33].
Для оценки заполнения БЗ введем некую величину, которую назовем степень покрытия и обозначим ее С. Пусть эта величина принимает значения от 0 до 1 и показывает, насколько правила управления покрывают входное и выходное множества системы. Обозначим степень покрытия входных множеств - С , выходных - С, а общее покрытие - С.
Для вычисления покрытия некоторой произвольной точки множества, образованного входными и выходными множествами системы, необходимо вычислить результирующие посылки в этой точке для всех правил и выбрать среди получившихся величин максимальную.
Обозначим степень принадлежности точки х входного множества системы, заданной своими координатами {xi,X2, ...хм} j-му правилу W/x), а точки у выходного пространства с координатами {уъУъ—Уи} - /у), тогда покрытия входного и выходного множеств можно вычислить по формулам (4.1,4.2):
Однако на практике формула (4.4) достаточно сложно вычислима, и в нашем случае требует больших вычислительных затрат. Для сокращения этих затрат разработан упрощенная формула расчета степени покрытия (4.5), основанный на линейной интерполяции функций принадлежности и вычислении значений этих функций, а также степеней покрытия только в узлах специально заданной сетки, а не по всем точкам пространства. Выбор этого метода основывается на том факте, что вид самих функций принадлежности является линейным, что позволяет предположить невысокое расхождение результатов с формулой (4.4).
Итоговая формула для вычисления полного покрытия входного и выходного множеств имеет следующий вид (4.5):
где G - количество точек JC/ и УІ, отстоящих друг от друга на равные расстояния, в которых и рассчитывается величина покрытия. Очевидно, точность вычисления величины покрытия в этом случае прямо пропорционально зависит от количества точек измерения.
Модель системы управления для балансировки перевернутым физическим маятником призвана решать традиционную для систем стабилизации задачу, на которой проверяются и сравниваются многие новые системы управления (рис. 4.6).
Выбранная для экспериментов математическая модель физического маятника описывается системой дифференциальных уравнений (4.6,4.7): ,., х и mlq "cos(p-(pnsm(p „ Л (М + т)х"+— —ї- i-+F = 0 (4.6) .ml2 Т. и ml, а ч л {— + 1) Р +у( COSp-gSin ) = 0, (4.7) где х - положение центра тележки, М - масса тележки, m - масса маятника, / - длина маятника, р - отклонение маятника от положения равновесия, a F - сумма внешних воздействий на тележку, как возмущающих, так и управляющих.
Во всех экспериментах были зафиксированы следующие значения констант: М= 1 кг, m = 0.1 кг,/ = 0.5 м.
Для того чтобы исключить из модели состояния, выход из которых невозможен, на тележке установлены два ограничителя, которые не дают маятнику отклониться больше, чем на угол cpmax \ от положения равновесия. Удар маятника об ограничители абсолютно неупругий. Соответственно, модель маятника имеет два устойчивых состояния: в крайнем левом и крайнем правом положениях.
В разработанной системе управления для решения задачи балансировки перевернутым маятником зададим следующие значения основных констант: количество входных переменных N = 2, количество выходных переменных: М = 1, максимальное количество
правил в БЗ: Нтах = 500, пороговое значение суммы результирующих посылок famm = 0,1. Параметры процедуры кластеризации: максимальный размер кластера (первоначальный размах функции принадлежности) R = 0,3, минимальная разница в значениях потенциала на двух последующих шагах алгоритма кластеризации ADmin = 0,0001.
Для вычисления оценки состояния ОУ использовалась формула (4.8), графическая интерпретация которой изображена на рисунке 4.3. Из формулы и рисунка видно, что оценка в 2 раза чувствительнее к отклонению, чем к его скорости, что обусловлено большим влиянием величины отклонения маятника на качество управления, выявленное в ходе экспериментов.