Содержание к диссертации
Введение
ГЛАВА 1. Анализ состояния вопроса и постановка задач исследования 11
1.1 Конструктивные особенности манипуляторов с упругими звеньями... 13
1.2 Особенности моделирования манипуляторов с упругими звеньями 17
1.3 Анализ методов управления манипуляторами с упругими звеньями 26
1.4. Измерительные средства в системах управления манипуляторами с упругими звеньями 35
1.5. Постановка задач исследования 37
1.6. Выводы по главе 38
ГЛАВА 2. Методы расчета конструкций манипуляторов с упругими звеньями 40
2.1. Математическое описание манипулятора с упругими звеньями 41
2.2. Уравнения движения упругих звеньев манипулятора 46
2.3. Метод расчета эквивалентных сил в узловых точках манипулятора56
2.4. Метод силового расчета манипулятора с упругими звеньями 57
2.5. Выводы по главе 62
ГЛАВА 3. Управление манипуляторами с упругими звеньями на базе нейронных сетей 64
3.1. Принципы построения системы управления манипулятором на базе нейронных сетей 64
3.2. Метод аппроксимации существенных нелинейностей 74
3.3. Метод обучения нейросети с использованием сигнала обратной связи 79
3.4. Метод компенсации нелинейностей системы двухзвенного манипулятора 81
3.5. Моделирование системы управления манипулятором 84
3.6. Выводы по главе 94
ГЛАВА 4. Разработка системы управления манипуляторами с упругими звеньями и результаты экспериментальных исследований 95
4.1. Построение упругой манипуляционной системы с управлением по отклонению конечной точки в обратную сторону 95
4.2. Система управления манипуляторами с упругими звеньями 96
4.3 Алгоритм работы системы управления манипуляторами с упругими звеньями 98
4.4. Построение траектории для манипулятора с упругими звеньями 103
4.5. Моделирование манипуляторов с упругими звеньями 104
4.7. Результаты экспериментов по управлению манипулятором с упругим звеном 124
4.8. Метрологическая оценка системы управления манипулятором с упругим звеном 127
4.9. Выводы по главе 129
Заключение 130
Литература 132
Приложения 144
- Особенности моделирования манипуляторов с упругими звеньями
- Уравнения движения упругих звеньев манипулятора
- Метод обучения нейросети с использованием сигнала обратной связи
- Система управления манипуляторами с упругими звеньями
Введение к работе
Актуальность работы. В последние годы все большее внимание привлекает к себе применение манипуляторов облегченной конструкции с упругими звеньями. Прежде всего, здесь следует упомянуть выполнение манипуляционных технологических операций с объектами в труднодоступных или опасных для здоровья и жизни человека местах, когда требуются манипуляторы с большим вылетом руки, но с ограниченной массой. Однако уменьшение массы конструкции манипулятора за счет использования облегченных упругих звеньев является источником ряда негативных факторов. Упругие прогибы от действия внешних нагрузок и сил тяжести, а также колебания звеньев, возникающие при движении упругого звена, не позволяют точно переместить рабочий орган в заданную точку пространства и увеличивают время переходного процесса при движении рабочего органа из одной точки в другую. В результате управляемость и быстродействие упругого манипулятора значительно снижаются, что ограничивает возможности его использования. Таким образом, создание систем эффективного управления манипуляторами с упругими звеньями является актуальной научно-технической проблемой.
В настоящее время, как правило, в основе принципов построения систем управления манипуляторами с упругими звеньями лежат методы расчета управляющего сигнала – вращающего момента, позволящего осуществлять перемещение манипулятора с учетом деформаций и колебаний, обусловленных упругостью составляющих его звеньев. Сигналы управления крутящим моментом рассчитываются для перемещения рабочего органа манипулятора по заданной траектории без его существенных колебаний.
Научные исследования в этом направлении получили широкое распространение как в России, так и за рубежом. Они базируются на трудах ученых И.М. Макарова, Е.И. Юревича, В.М. Лохина, Ю.В. Подураева, А.А. Лукьянова, Ф.М. Кулакова, А.Е. Дитковского, Ю.Н. Санкина, С.Л. Зенкевича, А.С. Ющенко, Ф.Л. Черноусько, Н.Н. Болотника, В.Г. Градецкого,J.B. Jonker, E. Bayo, M.A. Serna, R.G.K.M. Aarts, A. Jnifene и W.R. Andrews, J.Cheong, W.K. Chung, Y. Youm Ges, L.C.S. Negro, R.G. Rios, W. Neto и др.
Стремительный рост ресурсов и быстродействия средств вычислительной техники позволяет осуществлять управление перемещением манипулятора с заданной точностью и допустимой амплитудой колебаний в режиме реального времени. Достичь этого можно с помощью искусственных нейронных сетей, способных к самообучению, адаптации к постоянно изменяющимся условиям, и позволяющих формировать необходимые сигналы для создания исполнительных крутящих моментов. Сложные алгоритмы управления являются в данном случае непригодными к применению, так как это ведет к снижению точности.
Таким образом, для решения проблемы управления манипуляционными системами с упругими звеньями с необходимой точностью, целесообразно использовать адаптивные системы с интеллектуальными регуляторами, строящимися на базе нейронных систем, что составляет предмет данной диссертации.
Соответствие диссертации плану работ ЮРГТУ (НПИ) и целевым комплексным программам. Диссертационная работа выполнена в рамках научного направления ЮРГТУ (НПИ) «Теория и принципы создания робототехнических и мехатронных систем и комплексов», утвержденного ученым советом 01.03.2006 г. и соответствует госбюджетной теме П.3.837 «Разработка принципов и средств автоматизации и роботизации производства на основе мехатронных технологий и систем» (2004-2008 гг.).
Цель работы. Целью данной диссертации является разработка методов адаптивного управления манипуляторами облегченной конструкции за счет компенсации нелинейностей, обусловленных упругостью звеньев, для обеспечения перемещения рабочего органа по заданной траектории без перерегулирования и остаточных упругих колебаний.
Для достижения поставленной цели необходимо решить следующие основные задачи:
– исследовать особенности поведения манипуляционной системы облегченной конструкции во время ее движения;
– разработать метод компенсации нелинейностей манипулятора с упругими звеньями за счет использования обучающихся в режиме реального времени нейросетей, обеспечивающий адаптивность и робастность системы управления;
– разработать метод вычисления траектории перемещения манипулятора с упругими звеньями, позволяющий корректировать заданные значения углов поворота шарниров с учетом меняющихся условий среды, и использовать их при вычислении скоростей звеньев;
– разработать метод моделирования многозвенного манипулятора с упругими звеньями;
– разработать метод адаптивного управления манипулятором с упругими звеньями в режиме реального времени на базе нейронных сетей для обеспечения перемещения схвата по заданной траектории без перерегулирования и остаточных упругих колебаний;
– разработать рекомендации по созданию систем адаптивного управления манипуляторами с упругими звеньями за счет компенсации нелинейностей звеньев.
Идея работы. Идея работы состоит в использовании интеллектуальных регуляторов, строящихся на базе нейросетей, при разработке адаптивной системы управления, работающей в режиме реального времени и способной к плавному ведению манипулятора с упругими звеньями по заданной траектории без перерегулирования и остаточных упругих колебаний.
Методы исследования. В работе использованы методы классической механики, математического моделирования, аналитической геометрии, кинематического и динамического анализа, нейронных сетей, классической и современной теории автоматического управления, синергетики, мехатроники и робототехники, дискретного интегрирования, экспериментальных исследований на физической модели с аналитической обработкой результатов на ЭВМ.
Научные положения, выносимые на защиту:
– метод компенсации нелинейностей манипулятора с упругими звеньями за счет использования обучающихся в режиме реального времени нейросетей c радиальной базисной функцией, реализующей стратегию обновления “активного“ нейрона и параметров его функции активации;
– метод вычисления траектории перемещения манипулятора с упругими звеньями, позволяющий корректировать заданные значения углов поворота шарниров и использовать их при вычислении скоростей звеньев;
– метод рекурсивной процедуры, позволяющий моделировать поведение многозвенного манипулятора с упругими звеньями, заключающийся в вычислении реакций от конечного звена к начальному, предусматривающий использование отдельного регулятора для каждого звена с целью корректировки траектории их движения исходя из перемещения концевой точки и поворота поперечного сечения предыдущего звена;
– метод адаптивного управления манипулятором с упругими звеньями в режиме реального времени на базе нейронных сетей для обеспечения перемещения схвата по заданной траектории без перерегулирования и остаточных упругих колебаний, заключающийся в использовании в цепи обратной связи регулятора значения разницы между движением жесткого звена и упругим отклонением концевой точки.
Научная новизна работы заключается в разработке:
– метода построения нейрокомпенсатора нелинейностей системы робота, заключающегося в том, что в качестве входных воздействий нейросети используются заданные и реальные значения положения и скоростей в шарнирах, обучение нейросети происходит в режиме реального времени, осуществляется обновление параметров только активного нейрона и применяется стратегия усечения нейросети для минимизации количества нейронов;
– метода вычисления траектории перемещения манипулятора с упругими звеньями, характеризующегося тем, что корректируются значения углов поворота шарниров упругих звеньев с учетом влияния внешних воздействий, а скорректированные значения углов используются при вычислении скоростей;
– метода моделирования манипулятора с упругими звеньями, заключающегося в использовании рекурсивной процедуры, суть которой состоит в вычислении реакций от конечного звена к начальному, использовании отдельного регулятора для каждого звена, коррекции траектории упругого звена с учетом перемещения концевой точки и поворота поперечного сечения предыдущего звена;
– метода адаптивного управления манипулятором с упругими звеньями в режиме реального времени на базе нейронных сетей для обеспечения перемещения схвата по заданной траектории без перерегулирования и остаточных упругих колебаний, отличающегося использованием в цепи обратной связи регулятора значения полного смещения концевой точки, полученного как разность между движением жесткого звена и упругого отклонения концевой точки.
Обоснованность и достоверность результатов обеспечивается корректным использованием фундаментальных законов физики, механики, робототехники, классической теории управления и электропривода, корректными допущениями при составлении математических моделей и подтверждается данными экспериментов на модели упругого звена, результатами физического и компьютерного моделирования. Расхождение результатов не превысило 10 %.
Научное значение результатов исследований состоит в том, что предложенные в диссертации математические модели, методы синтеза и управления представляют собой методологические основы для разработки обучаемых манипуляционных систем с упругими звеньями, отличающихся возможностью самонастройки, расширяющих возможности применения манипуляторов.
Практическая ценность работы состоит в том, что предложенные методы, модели и алгоритмы позволяют использовать манипуляторы с упругими звеньями без потери точности и быстродействия в различных отраслях промышленности и сферы обслуживания там, где применение промышленных роботов является невозможным. Прикладная значимость результатов заключается в следующем:
разработанные методы и алгоритмы управления манипулятором с упругими звеньями позволяют реализовывать заданную ему траекторию перемещения без перерегулирования и колебаний схвата;
разработаные рекомендации по созданию систем адаптивного управления манипуляторами с упругими звеньями за счет компенсации нелинейностей звеньев позволяют обоснованно, в зависимости от конструктивных параметров манипулятора, выбирать адаптивную систему управления и способы программной реализации предложенных методов и алгоритмов управления;
разработанный программный пакет позволяет решать задачи построения работающих в режиме реального времени систем адаптивного управления манипуляторами с упругими звеньями.
Внедрение результатов диссертационного исследования. Разработанные модели и методы приняты к внедрению в проектную и конструкторскую документацию в ОАО «ВЭлНИИ» (г. Новочеркасск Ростовской обл.). Материалы диссертационной работы используются в учебном процессе кафедрой «Автоматизация производства, робототехника и мехатроника» ЮРГТУ (НПИ) для студентов специальностей 22040165 «Мехатроника» и 22040265 «Роботы и робототехнические системы».
Апробация работы. Основные результаты работы докладывались и обсуждались на международной научно-технической конференции «Проблемы мехатроники 2006» (Новочеркасск, 2006 г.), 53-м международном научном коллоквиуме «Prospects in Mechanical Engineering» (Ильменау, 2008 г.), международном научно-практическом коллоквиуме «Мехатроника-2008» (Новочеркасск, 2008 г.), 2-й Российской мультиконференции по проблемам управления (Санкт-Петербург, ЦНИИ «Электроприбор»,2008), 58-й научной конференции ЮРГТУ (НПИ) (Новочеркасск, 2009 г.), международном научно-практическом коллоквиуме «Мехатроника-2009» (Новочеркасск, 2009 г.).
Публикации. Основные результаты диссертации опубликованы в 12 статьях, в том числе шесть в изданиях, рекомендованных ВАК, получены одно свидетельство на полезную модель и одно положительное решение.
Структура и объем диссертации. Диссертация состоит из введения, 4-х глав, заключения, списка литературы и 6 приложений. Общий объем работы составляет 143 страницы машинописного текста, содержит 57 рисунков, 20 таблиц, список литературы из 123 наименований.
Особенности моделирования манипуляторов с упругими звеньями
Переход от представления реального объекта к его математической модели осуществляется в несколько ступеней (рис. 1.2). Модель робота в общем виде имеет следующее математическое описание:где q — вектор п обобщённых координат; пг — количество приводов; М— матрица инерционных характеристик;/- вектор центробежных и Кориолисовых воздействий и сил тяжести; и - входной вектор.
Отталкиваясь от реальной системы, делается несколько предположений для получения физической модели, то есть осуществляется идеализация реальной системы, которая отражает наиболее важные признаки объекта. Затем осуществляется описание кинематической схемы, причем имеется две возможности:— получить бесконечномерную модель, а затем применить методы понижения порядка и получить модель конечного порядка [9];- напрямую аппроксимировать непрерывную физическую модель дискретной (в пространстве) моделью и, таким образом, получить модель конечного порядка.
Очень важную роль в процессе моделирования играют допущения, от которых зависят границы применимости модели. Они делятся на три категории: общая конструкция, сочленения и упругие звенья [10]. Допущения можно рассматривать как вопросы, на которые нужно ответить прежде, чем начнётся процесс моделирования. Основные из них приведены в табл. 1.1-1.3.
В табл. 1.1 манипулятор рассматривается как целое, и определяются его главные характеристики. Представляя общую конструкцию манипулятора, мы считаем, что он является абсолютно жёстким, то есть мы пренебрегаем эластичностью сочленений и упругостью звеньев. Предполагается, что эластичность всегда относится к сочленению, а упругость — к звену. В табл. 1.2 приведены допущения по сочленениям. Важными свойствами для сочленений являются трение и эластичность. Эти силы часто присутствуют в волновой передаче, которая является достаточно распространенным редуктором для робота, так как в его конструкции отсутствует люфт. В табл. 1.3 представлены различные допущения, которыми можно пользоваться при моделировании упругого звена.
В подавляющем большинстве моделей для упругих манипуляторов предполагаются малые деформации, как для эластичных сочленений, так и упругих звеньев, что математически формулируется следующим образом [11]: где УиК- соответственно, матрица демпфирования и матрица жёсткости.
Ещё одним важным моментом является допущение укорачивания упругого звена, которое привлекает внимание из-за эффекта геометрической жёсткости, связанной с угловой скоростью шарнира [12-15]. Укорачивание элемента может иметь значение во многих случаях, например, при наличии значительных сил на рабочем органе манипулятра, высоком ускорении или даже возможности потери устойчивости [16]. В отличие от укорачивания, демпфированию в упругом звене почти не уделяется внимания [17]. Однако увеличение внутреннего демпфирования колебаний и учет его влияния может заметно снизить колебания. Диссипативные силы, всегда имеющиеся в реальной механической системе, приводят к затуханию свободных колебаний. Изучение свободных колебаний позволяет оценить продолжительность затухающего движения [18].
Физическая модель манипуляционной системы может быть представлена в двух вариантах — бесконечного и конечного порядка. Модель бесконечного порядка наиболее точная, так как она сохраняет распределённый характер системы. Однако для имитационного моделирования или управления в реальном времени нужна модель конечного порядка. Эту модель можно получить из модели бесконечного порядка, используя методы снижения по рядка, или непосредственно из физической модели путём пространственной дискретизации.
Кинематическая схема. Первым шагом в получении математической модели является выбор систем отсчета и описание кинематических соотношений между этими системами, то есть поступательного и вращательного движения, необходимых для перехода от одной системы к другой. Для описания упругого звена нужно иметь три системы: внутренняя - у основания, наружную - в конце звена, и систему, прикреплённую к элементу балки [16]. Для определения соотношения между этими системами можно использовать матрицы однородного преобразования, которые включают как поступательное, так и вращательное движение, или рассматривать поступательное и вращательное движения отдельно, в матрице вращения и векторе поступательного движения.
Модель бесконечного порядка. Модель бесконечного порядка состоит из системы дифференциальных уравнений: обыкновенного дифференциального уравнения (ОДУ) и дифференциального уравнения в частных производных (ДУЧП) с граничными условиями (ГУ) [9]. ОДУ имеют отношение к перемещению конструкции как твердого тела, а ДУЧП вместе с ГУ описывают перемещение конструкции как упругого тела. Для получения уравнений движения бесконечного порядка можно использовать разные методы. Самыми известными являются принцип Гамильтона и метод Ньютона-Эйлера. Уравнения движения Лагранжа используют для непрерывных систем [19], а уравнения Кейна применяют в частных случаях [20].
Для перехода от непрерывной модели бесконечного порядка к модели пониженного порядка используется метод пространственной дискретизации, при условии, что уравнения являются линейными [9]. Если они поддаются решению, то модель получается за счет расширения. В противном случае необходимо проводить ее аппроксимацию. В один класс процессов дискретизации входит расширение решения в конечном ряду заданной функции. В этом классе существует два подкласса: методы типа Релея-Ритца и взвешенной не вязки (методы Галеркина). Методы Релея-Ритца основаны на вариационном принципе и применяются только к самосопряженным системам. Методы взвешенной невязки, напротив, относятся к общим методам. Следующий класс процессов дискретизации заключается в объединении свойств системы [21]. Метод конечных элементов - это тоже один из методов типа Релея-Ритца, но он, как правило, рассматривается как самостоятельный.
Модель конечного порядка Модель конечного порядка состоит из нескольких ОДУ. Количество ОДУ варьируется от нескольких до бесконечности. Однако в большинстве случаев остаются только несколько уравнений. В отличие от случая бесконечного порядка дискретизация проводится до составления уравнений движения. Самым распространённым методом пространственной дискретизации упругого звена является метод расчетных режимов, который подобен методам типа Релея-Ритца, но не требует модели бесконечного порядка и применим к линейным и нелинейным системам. Можно использовать различные "произвольно принятые" функции: собственные функции балки, сплайны или полиномиальные функции. И здесь для составления уравнения движения имеется возможность выбора из различных методов.
При моделировании упругой системы манипулятора целью является получение точной модели, отображающей поведение и характеристики реальной системы. Важно идентифицировать упругий характер и динамическое поведение системы и создать соответствующую математическую основу для моделирования системы. В настоящее время уже существуют разработанные методы моделирования упругих манипуляторов. Их можно разделить на две главные категории: метод расчетных режимов (МРР) и метод численного анализа [22]. Метод расчётных режимов касается получения приближённых режимов путём решения дифференциального уравнения частных производных (ДУЧП), характеризующего динамическое поведение системы. Обыкновенное дифференциальное уравнение можно получить путём представления изгиба манипулятора как суммирование режимов его колебаний. Предпола
Уравнения движения упругих звеньев манипулятора
Рассмотрим общую многозвенную манипуляционную систему с упругими элементами, расчетная схема которой состоит из множества звеньев (рис. 2.1). При моделировании манипулятора с упругим звеном важно вклю чить в жёсткую систему упругие тела, чтобы можно было выполнить комплексное изучение "гибридной" системы путем моделирования.
Для составления динамических уравнений движения целесообразно использовать принцип виртуального перемещения и теории расчёта балки Тимошенко. Данная теория в этом случае особенно важна, так как звенья большинства промышленных роботов лучше моделировать, не делая допущений, что они могут быть тонкими. Вся методика моделирования делится на четыре стадии:1. Вывод кинематических и кинетических отношений для дифференциального сегмента звена обычного манипулятора.2. Использование метода виртуальных перемещений для представления основных уравнений в интегральной форме, подходящей для схемы моделирования согласно методу конечных элементов.3. Разработка простого и эффективного конечного элемента для проведения дискретизации поля перемещения.4. Вывод уравнений системы.
Представленная выше методика используется для нахождения исполнительных моментов, которые прикладываются к шарнирам, чтобы рабочий орган следовал по заданной траектории [70-73]. Динамические уравнения движения получены первым обучением отдельного звена в цепи. Уравнения отдельных звеньев связаны между собой, чтобы получить динамические уравнения движения для системы всего робота.
Отдельное упругое звено, изображённое на рис. 2.3, представляет часть плоского многозвенного манипулятора с общей длиной /. Масса груза величиной Mt сосредоточена в схвате, а момент инерции шарнира //, - на другом конце. Центр шарнира совпадает с центром привода.
Точка Р, расположенная на расстоянии JC от центра шарнира, принадлежит звену, характеризующемуся упругими деформациями, имеющими значения перемещения по осям, соответственно, их и иу, и угла поворота 9. Эти значения определяются относительно номинального положения, характеризуемого подвижным базисом (е\, е-і), связанным с шарниром, который вращается с заданными (номинальными) угловыми скоростью и ускорением 9Л и9А соответственно. Цель обратной динамики — заставить конец звена не отклоняться от заданной траектории перемещения.
В результате упругих деформаций и связанного с этим движения точка Р подвергается полному ускорению поступательного движения ар и угловому ускорению 9А. Используя принципы относительного движения [74], ускорение в точке Р можно задать исходя из ускорения поступательного движения и углового ускорения шарнира — Я/7 и 9Л, угловой скорости 9Л шарнира, а также относительной скорости vre/ и ускорения arei точки Р. Последние обусловлены упругими отклонениями их и иу относительно движущегося основания робота. В векторной системе обозначений выражение для ускорений меют вид:49 где rp=(x+ux)e ) + uyej$) - положение точки Р после деформации относительно шарнира.
Компоненты относительной скорости — йх и йу, а компоненты относительного ускорения - йх и йу, ускорение шарнира а и ahy. После проведениявекторного преобразования уравнения (2.19) получаем следующие компоненты ускорения:
Соотношение сил и моментов, имеющих место в дифференциальном сегменте свободного тела в плоскости X, Y, представлено на рис. 2.4.
По теории расчёта балки Тимошенко [75] поперечный сдвиг можно использовать в модели как (2.21)где kt — это коэффициент сдвига Тимошенко, А - площадь поперечного сечения, а у - модуль сдвига. Кроме того, соотношения момент/изгиб имеют следующий вид: дх где Е - модуль упругости Юнга и /- момент инерции поперечного сечения.
Основные уравнения из дифференциального сегмента можно написатьв виде:где р - плотность; и fy— распределённые внешние силы на единицу длины. Это могут быть просто гравитационные эффекты при отсутствии воздействия каких-либо других внешних сил.
Для динамического анализа связных жёстких и упругих систем, состоящих из нескольких тел, целесообразно использовать принцип виртуальных перемещений. Виртуальное перемещение определяется как бесконечно малое изменение конфигурации системы в статистический временной отрезок, согласующийся с её пограничными и ограничительными условиями. Если конфигурация представлена вектором положения q, то вектор обобщённого виртуального перемещения обычно обозначается dq.
Виртуальные величины работают так же, как вариации. Не вдаваясь в подробности вариационного исчисления [76], виртуальная величина или вариация 8 действует как дифференциальный оператор, но только по отношению к зависимым переменным, так как величина, зависящая от времени, считается постоянной. Другими словами, считается, что система, состоящая из нескольких тел, находится в неподвижном положении.
Законы вариации сумм, произведений, отношений и т.д. - те же самые, что законы дифференцирования. Кроме того, вариационный оператор можно заменить дифференциальным и интегральным оператором.
Виртуальная работа б W определяется как работа, выполненная всеми силами, действующими на систему, включая инерционные силы, которая подвергается возможному перемещению. Её можно выразить в виде
Метод обучения нейросети с использованием сигнала обратной связи
Из рис. 3.6 видно, что эффективность аппроксимации достигла MSE=0,01 за, приблизительно, 37 этапов обучения, используемых при моделировании (0,002 с). Исходя из этого, усечённой сети требуется только 0,074 секунд, чтобы достичь MSE=0,0l. Таким образом, РБФНС в режиме реального времени обеспечивает хорошую аппроксимацию таких негладких нели-нейностей, как трение.
На основании рассмотренного примера можно сделать следующие выводы:- РБФНС с обучающим алгоритмом РСМРР представляют собой хорошие универсальные аппроксиматоры негладкой нелинейной функции.- Не требуется большого числа повторений для аппроксимации нелинейной функции, как в случае комбинации сети ресурсного распределения с РБФНС. Таким образом, аппроксимация выполняется за более короткий промежуток времени.- Благодаря использованию метода усечения сети не требуется большого числа нейронов и она имеет компактную структуру. 3.3. Метод обучения нейросети с использованием сигнала обратной связи
Механизм обучения нейросети с использованием сигнала обратной связи можно использовать для разработки системы адаптивного управления. Однако главной проблемой при этом является то, как вывести соответствующий сигнал ошибки для регулятора. В случае с управлением по положению или контрольным точкам роль регулятора заключается в том, чтобы создать инверсную модель управляемой системы [96].
Эффективным методом реализации инверсной модели является обучение сети с сенсорным выходом х в качестве входа и и в качестве целевого выхода. Хотя этот метод может работать при решении простых задач, когда инверсия определяется однозначно, но он неприемлем для объектов с существенной нелинейностью, что обычно встречается во многих системах управления. Для решения этой проблемы Кавато предложил способ обучения нейросети с использованием сигнала обратной связи [97].
Данный метод широко используется для управления системами с неопределённой или неизвестной динамикой [98, 99]. Суть метода заключается в получении инверсной динамической модели объекта, сочетающей нейросеть с уже имеющимся типовым регулятором, который работает параллельно с нейросетью. Типовой регулятор должен быть в состоянии стабилизировать регулируемую систему в отсутствии НС или во время периода обучения. Его выходной сигнал подаётся на НС как величина ошибки при обучении. Типовой регулятор можно реализовать при помощи разных способов, например, ПИД-регулятора, расстановки опорных точек, линейного квадратичного регулятора и т.д.
В способе обучения нейросети с использованием сигнала обратной связи заданное значение (xd) и выход системы (х) принимаются как входы НС для того, чтобы обучать инверсно-динамическую модель системы управления. Цель управления заключается в минимизации погрешности (е), которую определяют как разницу между заданным (xd) и выходным значением систе В этом методе обучения используется выход типового регулятора (ис)с обратной связью для вычисления погрешности на выходе нейросети. Когда его выход становится равным нулю, погрешность тоже равна нулю. Следовательно, цель управления достигнута.
На первой стадии системой управляет только типовой контроллер, потому что нейросеть ещё не обучена. Однако как только обучение закончено, выходные значения типового регулятора ( ис ) становятся меньше, а выходныезначения нейросети (иш) приближаются к (и). Поэтому на последней стадии иш управляет всей системой [96, 97].
В этой диссертационной работе предлагается структура обучения нейросети с использованием сигнала обратной связи для обучения нейро-компенсатора, компенсирующего существеные нелинейности (трение, сила тяжести, Силы Кориолиса и центробежные силы) в динамической системе.
Она отличается тем преимуществом, что позволяет создавать заданный входной сигнал без предварительного обучения сети в автономном режиме.
Моделирование компенсации трения в сочленениях двухзвенного манипулятора (рис. 3.9) с помощью обучения НС с использованием сигнала обратной связи позволяет перенести получаемые результаты для манипуляци-онной системы с п звеньями.
В предлагаемой схеме в качестве типового используется пропорционально-дифференциальный регулятор (ПД-регулятор), а обучение РБФНС при помощи алгоритма РСМРР — для компенсации нелинейностей и неопределённостей в системе.
Динамические свойства и-звенного манипулятора можно выразить в форме [100-104]:где 9/, - вектор положения звеньев; 0А— вектор скорости звеньев; М(0А) матрица инерции; Vm(Qh,dh)- матрица центробежных и Кориолисовых сил;G(0/;) - вектор силы тяжести; F(Qh)— диагональная матрица моментов силтрения; и - входной управляющий вектор.
Общая модель трения системы двухзвенного манипулятора описывается уравнением (3.12).
Для системы двухзвенного манипулятора, показанного на рис. 3.9, матрицы модели системы, описанной в уравнении (3.15), можно выразить как [104, 105]:где ш\ ,m2 - массы звена 1 и звена 2, соответственно; 1\ , /2- длины звена 1 и звена 2, соответственно.
Для компьютерного моделирования перемещения необходимо найти его ускорение 0,,, а затем интегрировать полученные результаты с использованием метода Рунге-Кутта [106] и найти перемещение 0Й.
При заданных значениях перемещения Qh, скорости 0 , и коэффициентах усиления Кп, Кд ПД-регулятора сигнал управления (и) рассчитывается по формуле [107]и = Кп(0 - Gн) + КяфІ - ЄА) + М(0J в; + Гт(0л,0А)Є + F(eh) + G eh). (3.16) Приведенные в уравнении (3.16) динамические параметры системы М(0Й)и Vm(QhiQh) должны быть известны, чтобы можно было провести синтез регулятора. Кроме того, должны быть определены трение и сила тяжести, чтобы компенсировать их эффект при расчёте управляющего воздействия, в противном случае они способны ухудшить рабочие характеристики системы. Проблема управления двухзвенного манипулятора уже рассматривалась в литературе. В [105] представлена схема адаптивного управления для
Система управления манипуляторами с упругими звеньями
Осуществить управление упругими манипуляторами для достижения и сохранения точного местоположения довольно сложно. Не случайно, что решению этой задачи посвящено множество исследований. Отклонение концевой точки упругого звена является важным параметром управления, помо гающим добиться непрерывного отслеживания траектории [20]. Этот параметр рассматривается в [27, 31], где для вычисления крутящего момента в частотной области нормальное упругое отклонение концевой точки звена принимается равным нулю. Для измерения упругого отклонения вибрирующего звена Джнифене и др. [50] применяли тензодатчики. Отклонение использовали как ошибку ввода (погрешность по входу) в системе управления с нечеткой логикой с целью уменьшения вибрации схвата манипулятора в ответ на ступенчатое входное воздействие.
В данной работе предлагается использовать ошибку положения концевой точки звена (схвата) в обратной связи на входе ПД-регулятора (рис. 4.1). Полное перемещение yref можно представить как функцию движения жёсткого манипулятора / (0 (/) — 9(/)) и нормального упругого отклонения uy(l,t), в виде [115]:где 9(/) - угол поворота поперечного сечения концевой точки предыдущего упругого звена. Он равен нулю для первого звена, потому что его привод зафиксирован на жестком основании.
В работе предлагается структура системы управления, в которой используется пропорционально-дифференциальный регулятор, а адаптивная нейронная сеть (НС) обучается в режиме реального времени управлять упругим отклонением и компенсировать нелинейности системы [116].
Эта структура управления реализуется методом рекурсивной процедуры для моделирования многозвенного упругого робота (см. 2.2), с целью гашения вибраций и компенсации отклонения концевой точки упругого звена. Требуемое полное отклонение концевой точки определяется как
Задача системы управления - повышение скорости и точности позиционирования концевой точки манипулятора с упругими звеньями, компенсация деформаций звеньев и демпфирование колебаний. Поставленная задача решается за счет того, что предлагается структура системы управления, которая использует ПД-регулятор для стабилизации системы и нейросеть, обучаемая в режиме реального времени, для каждого звена, что позволяет компенсировать нелинейности, например: трение, инерционные, Кориолисовы, центробежные силы и силы тяжести [117]. Схема алгоритма управления манипулятором с упругими звеньями представлена на рис. 4.2.
В предлагаемой системе управления использованы адаптивные нейро-сети с обучением по сигналу обратной связи для управления положением рабочего органа каждого упругого звена. Расширенная нейросеть с радиальной базисной функцией с минимальным ресурсным распределением использована для расчета сигнала управления по возмущению. Четыре входных сигнала, используемые в каждой нейросети, это заданные и действительные положения и скорости в шарнире. Полное отклонение рабочего органа учтено в расчетах ПД-регуляторов. Для управления использована величина перемещения каждого упругого звена, полученного как разность между движением жесткого звена и упругого отклонения концевой точки.
Работает система управления манипулятором с упругими звеньями следующим образом. При ее включении вначале производится считывание исходных данных для дальнейшей обработки. Это полное заданное перемещение концевой точки упругого звена манипулятора, заданный угол поворота в шарнире, заданная скорость поворота в шарнире, действительное значение угла по 102 ворота в шарнире, действительное значение скорости поворота в шарнире, действительное отклонение концевой точки упругого звена робота-манипулятора, угол поворота поперечного сечения концевой точки предыдущего упругого звена. Далее производятся вычисления ошибки полного отклонения концевой точки от заданного значения, результаты которых далее поступают в ПД-регулятор. На следующем этапе работы регулятора выполняется одновременное вычисление управляющих сигналов ПД-регулятора и нейросети и последующее их суммирование для передачи на упругое звено манипулятора. Перед следующим циклом вычислений производится оценка ошибки обучения нейросети и при неудовлетворительном результате происходит обновление параметров нейрона нейросети, центр активационной функции которого ближе других к заданному значению (алгоритм «победитель получает все»). В случае удовлетворения критериев добавления нового нейрона количество нейронов сравнивается с максимально допустимым значением, и если число нейронов N нейросети меньше максимального iVmax, к сети добавляется новый нейрон, если числонейронов нейросети максимально, то удаляется наименее эффективный нейрон, не обновляемый в течение нескольких циклов, а вместо него добавляется новый нейрон. Затем процесс повторяется до завершения моделирования.
Работа системы управления производится методом рекурсивной процедуры, использующей отдельный регулятор для построения траектории каждого упругого звена, начиная интеграцию от последнего звена для моделирования многозвенного упругого робота. Как только вращающий момент для последнего звена получен, на следующем шаге вычисляются реакции, которые будут переданы к предыдущему звену в цепи. Эти реакции рассчитаны по условию равновесия. Процедура продолжается далее так же до первого звена в цепи, как и прежде, но теперь силы реакции присутствуют и поэтому учтены в расчетах. Акт внедрения результатов работы приведен в приложении 1.