Содержание к диссертации
Введение
1 Аналитический обзор известных работ 10
1.1 Методы оптимального управления колебательными системами 10
1.2 Принцип динамического программирования Беллмана и его применение для управления динамическими системами 22
1.3 Метод усреднения и его применение для анализа колебательных систем 28
1.4 Общая математическая постановка задачи
1.4 Схема исследований и решаемые задачи 33
1.5 Общая схема решения задачи стабилизации движения колебательных систем 36
Основные результаты первой главы 39
2. Синтез приближенно оптимальных управлений для линейных колебательных систем общего вида 40
2.1 Приближенно оптимальное управление колебательной системой с несколькими степенями свободы 40
2.2 Приближенно оптимальное управление колебательной системой с двумя степенями свободы 46
2.3 Оценка влияния нелинейных возмущений на решение задачи стабилизации движения колебательной системы с двумя степенями свободы 54
Основные результаты 2 главы 64
3. Приближенно оптимальное управление при решении задач стабилизации колебаний твердого тела и космических аппаратов относительно заданных направлений 65
3.1 Методика определения приближенно оптимального управления 65
3.2 Приближенно оптимальное управление при решении задачи стабилизации движения твердого тела вокруг неподвижной точки 72
3.3 Приближенно оптимальное управление в задаче стабилизации 86
движения КА при входе в атмосферу 86
3.4. Приближенно оптимальное управление в задаче стабилизации движения наноспутника на тросе 96
Основные результаты 3 главы 107
Основные результаты и выводы 109
Основные сокращения и обозначения 111
Список литератуы
- Метод усреднения и его применение для анализа колебательных систем
- Приближенно оптимальное управление колебательной системой с двумя степенями свободы
- Приближенно оптимальное управление при решении задачи стабилизации движения твердого тела вокруг неподвижной точки
- Приближенно оптимальное управление в задаче стабилизации движения наноспутника на тросе
Введение к работе
Актуальность работы. Задача стабилизации движения объектов и систем различного назначения неизбежно возникает при разработке методов и алгоритмов управления. Задача стабилизации движения является важной частью общей задачи управления движением. Общая задача управления движением, как правило, включает в себя построение программного (номинального) управления и разработку методов (алгоритмов) стабилизации, с помощью которых осуществляется реализации программных управлений при действии разнообразных возмущений. В частном случае задача построения номинальных управлений может не решаться, если управление заключается в стабилизация движения системы относительно положений равновесия или положений покоя системы.
Задача стабилизации движения колебательных систем, то есть систем, которые имеют решения близкие к периодическим, имеет множество приложений, в частности, при управлении техническими системами. К этим задачам относятся задачи стабилизации движения космических аппаратов (КА) различных типов и назначения. Особенно важна при этом разработка методов решения задач синтеза управления, то есть когда удается получить управляющие воздействия, непосредственно (явно) зависящие от переменных состояния системы. Однако синтез управления непосредственно с использованием нелинейных математических моделей движения КА представляет собой практически неразрешимую задачу. В этом смысле перспективным представляется разработка методов приближенно оптимального управления колебательными системами, использующих, в частности, метод усреднения. Применение метода усреднения в сочетании с известными методами оптимальными управления (принцип Беллмана, метод аналитического конструирования регуляторов (АКОР) и др.) позволяет существенно упростить решения задач синтеза управления в пространстве состояний системы.
Теории управления техническими системами посвящены многочисленные работы отечественных и зарубежных ученых. Основополагающие результаты в этом научном направлении получены Беллманом Р., Понтрягиным Л.,С., Моисеевым Н.Н., Болтянским В.Г., Гамкрелидзе Р.В., Гурманом В.И., Мищенко Е.Ф., Черноусько, Летовым А.М., Кротовым В.Ф., Красовским Н.Н., Kalman R.E., Falb P.L., Arbib M.A. и другими. Применение метода усреднения для получения приближенно оптимальных управлений колебательными системами, и в частности при рассмотрении движения твердых тел и КА, рассматривались в работах Моисеева Н.Н., Лебедева В.Н., Черноусько Ф.Л., Охоцимского Д.Е., Салмина В.В., Акуленко Л.Д., Лещенко Д.Д., Соколова Б.Н., Ишкова С.А. и др.
Анализ известных работ показывает, что методы стабилизации движения колебательных систем и КА, в которых решение задачи определяется в форме
синтеза, требует дальнейшего развития и совершенствования. В частности, это относится к таким сравнительно новым объектам управления как наноспутники (НС) и космические тросовые системы (КТС).
Вышесказанное определяет актуальность задачи разработки новых методов приближенно оптимального управления в рамках решения проблемы стабилизации движения колебательных систем.
Исследование выполнено при финансовой поддержке Министерства образования и науки Российской Федерации, в рамках проектной части госзадания (проект № 9.1421.2014/K).
Объект исследования: колебательные системы с быстрыми и медленными переменными.
Предмет исследования: алгоритмы оптимального управления колебательными системами при решении задач стабилизации их движения.
Цель и задачи исследования. Целью работы является разработка алгоритмов синтеза управления при решении задач стабилизации колебательных систем, включая прикладные задачи динамики управляемого движения КА.
Для достижения цели исследования необходимо решить следующие задачи:
-
Разработать методику синтеза приближенно оптимальных управлений для решения задач стабилизации движений колебательных систем, основанную на совместном применении принципа динамического программирования и метода усреднения.
-
На основании построенной методики осуществить синтез управлений для линейных динамических колебательных систем общего вида со многими степенями свободы при действии малых возмущений.
-
Разработать и исследовать алгоритмы стабилизации колебаний движения твердых тел (ТТ) и КА относительного заданных направлений в пространственном случае.
-
Произвести оценку для рассматриваемых колебательных систем влияния нелинейностей на их движение при использовании полученных приближенных оптимальных управлений.
Методы решения. Для решения рассматриваемых задач используются классические методы оптимального управления и системного анализа, метод усреднения, методы анализа устойчивости решений обыкновенных дифференциальных уравнений, методы высшей и вычислительной математики.
Область исследования соответствует п.1 "Теоретические основы и методы системного анализа, оптимизации, управления, принятия решений и обработки информации" и п.4 "Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации" паспорта специальности 05.13.01 - Системный анализ, управление и обработка информации (технические системы и связь).
Научная новизна полученных результатов.
1. Предложена и обоснована методика синтеза алгоритмов управления при решении задач стабилизации для динамических колебательных систем со
многими степенями свободы при действии малых возмущений, основанная на совместном применении принципа динамического программирования Беллмана и метода усреднения.
-
Разработан новый подход к решению задачи стабилизации движения твердого тела вокруг неподвижной точки при малых углах нутации, заключающийся в применение замен переменных (характерных для метода усреднения), усреднении и синтезе приближенно оптимальных управлений с помощью принципа динамического управления Беллмана.
-
Предложена и исследована методика синтеза алгоритмов стабилизации при входе КА в атмосферу, основанная на разработанном новом подходе, и учитывающая характерные возмущения, действующие на КА при его движении в плотных слоях атмосферы.
-
Рассмотрена и решена новая задача синтеза алгоритмов стабилизации движения НС на тросе при развертывании КТС на орбите, учитывающая особенности номинальной программы выпуска троса с базового КА.
Практическая ценность работы.
Разработанная методика синтеза алгоритмов управления для решения задач стабилизации колебательных систем позволяет производить аналитический расчет приближенно оптимальных регуляторов для динамических систем различных типов и назначения, что обуславливает ее практическую ценность. Результаты диссертации внедрены в лаборатории "Космические тросовые системы" и могут быть использованы при разработке и проектировании новых тросовых экспериментов на орбите. Основные теоретические положения и методика синтеза управлений используется в учебном процессе кафедры программных систем СГАУ в курсе "Оптимальное управление дискретными системами", при подготовке бакалаврских и магистерских работ по специальности 010300.2 - фундаментальная информатика и информационные технологии.
Результаты, выносимые на защиту.
-
Методика решения задачи стабилизации движения колебательных систем со многими степенями свободы, основанная на совместном применении принципа динамического программирования Беллмана, метода усреднения и теории устойчивости Ляпунова, позволяющая получать приближенно оптимальные управления в аналитическом виде с использованием квадратичного критерия оптимальности.
-
Методика аналитического конструирования приближенно оптимальных регуляторов для решения задач стабилизации движения твердого тела вокруг неподвижной точки и ее приложение к задачам движения КА в атмосфере и НС на тросе.
-
Алгоритмы приближенно оптимального управления при решении задачи стабилизации движения КА при входе в атмосферу, обеспечивающие демпфирование его колебаний относительно вектора скорости и учитывающие характерные для этой задачи возмущения.
-
Алгоритмы приближенно оптимального управления при решении задачи стабилизации движения НС на тросе, обеспечивающие демпфирования
колебаний спутника относительно направления троса при развертывании КТС на орбите.
5. Результаты анализа влияния нелинейностей на движение рассматриваемых колебательных систем при использования полученных приближенно оптимальных управлений.
Степень достоверности и апробация результатов.
Достоверность полученных результатов в диссертационной работе обеспечивается применением при разработке алгоритмов управления классических, хорошо апробированных, методов: принципа динамического программирования Беллмана, метода аналитического конструирования оптимальных регуляторов (АКОР) Летова - Калмана, метода усреднения, теории устойчивости решений дифференциальных уравнений Ляпунова.
Основные результаты докладывались и обсуждались на следующих конференциях: Перспективные информационные технологии (ПИТ 2012), XII Королевские чтения (2013), Управление движением и навигация летательных аппаратов (2013), Перспективные информационные технологии (ПИТ 2013), Перспективные информационные технологии (ПИТ 2014), Перспективные информационные технологии (ПИТ 2015), Управление движением и навигация летательных аппаратов (2014), Информационные технологии и нанотехнологии (ИТНТ-2015).
Личный вклад автора.
Все результаты, вынесенные на защиту, получены автором самостоятельно. Автором самостоятельно проведены численные эксперименты, подтверждающие основные положения и выводы работы.
Основные публикации.
По теме диссертационной работы имеется 12 публикаций, из них 11 статей, в том числе 3 статьи опубликованы в рецензируемых научных изданиях, рекомендованных ВАК.
Структура и объем диссертации.
Диссертация состоит из введения, 3 глав, списка сокращений и основных обозначений, заключения, списка литературы (72 наименования). Объем работы составляет 119 страниц, она содержит 46 рисунков.
Метод усреднения и его применение для анализа колебательных систем
По значению собственных чисел л1 и л2 судят об устойчивости или неустойчивости особых точек на плоскости (к1гк2\, о типе особых точек и о наличии предельных циклов в системе.
Известна теорема о существовании предельных циклов в системах, к которым применим метод усреднения [14, 19], в которой доказывается, что если усредненная система имеет невырожденное положение равновесия, отличное от нуля, и все собственные значения усредненной системы, линеаризованной около этого положения равновесия, имеют отрицательные вещественные части, то исходная система имеет асимптотически устойчивый предельный цикл. Если вещественная часть хотя бы одного из собственных значений положительна, то цикл неустойчив. Положение равновесия называется невырожденным, если линеаризованная около него система не имеет нулевых собственных значений [19].
Рассмотрим нелинейные возмущения, которые получаются при учете полиномиальных возмущений до третьей степени включительно. В этом случае отдельное слагаемое, входящее в функции QNl 2, можно представить в виде (с точностью до коэффициента) У\,У2 У\ У2)= Ух У г У\ Уг , (2.52) где т (/ = 1,2,3,4 )- малые целые числа, такие, что z т = 3 (ті = Л,2,3 ). Если Y. т г =1 имеют место линейные возмущения, которые учитываются в функциях QLl2. Если z т = 2 , в соответствии с заменой переменных (2.38) средние значения в уравнениях для амплитуд колебаний (2.39-2.40) (от sin pj\= о при v /, j = і, 2 Поэтому рассматривается случай, когда тг = з Анализ рассматриваемого случая (при учете также линейных возмущений) позволяет определить общую структуру усредненной системы для амплитуд колебаний (2.39-2.40), которая имеет вид dK dK К v + уД + уК , = І: df =л1С1 + 72л1 +"3Л2) ,—=-2 1 1 (V1 + v2i:1 + V3K2 \ , 2 = к2 (/u1 + /и2к1 + JU3K2 ), (2.53) где v. , /І. (/ = 1,2,3 ) - некоторые числовые коэффициенты, которые получаются при усреднении системы (2.39-2.40).
В соответствии со структурой уравнений (2.53) усредненная система на плоскости (к1,к2) при условии к1,к2 0 может иметь от одной до четырех особых точек. Любой особой точке отличной от начала координат будет соответствовать режим автоколебаний, который может быть устойчивым или неустойчивым в зависимости от значения собственных чисел соответствующей линеаризованной системы. Координаты особых точек определяются из условий а) к1 =к2 = 0 ; б) к1 = 0, /и1 + /л3к22 = 0 ; в) к2 = 0, V1 + v3K2 = 0 ; 2 2 2 2 г) V1 + v2K1 + v3K2 = 0 , /и1 + /и2К1 + /и3К2 = 0 Понятно, что некоторые особые точки могут не существовать при условии к1,к2 0 в зависимости от значений параметров v., ju., которые получаются при усреднении системы (2.39-2.40). Введение приближенно оптимального управления в соответствии с описанной выше методикой обеспечивает асимптотическую устойчивость особой точки к1,к2 = 0 Однако влияние нелинейных возмущений может ограничить область притяжения особой точки к1,к2 = 0 , так как приближенно оптимальное управление строится без учета нелинейных слагаемых.
Изменяя начальные условия и коэффициенты в критерии оптимальности можно построить различные фазовые портреты и наблюдать изменение фазовых портретов после введения управления.
На рисунке 2.1 изображен фазовый портрет с одной особой точкой -неустойчивым узлом, до введения управления. Рисунок 2.1 – Фазовый портрет с 1 особой точкой до введения управления Самый простой случай получается, когда после введения управления неустойчивый узел превратился в устойчивый (рисунок 2.2).
Рисунок 2.2 - Фазовый портрет (устойчивый узел) На рисунке 2.3 приводится фазовый портрет для случая, когда до введения управления существовало четыре особые точки: неустойчивый узел (ки,к2 = о) , два устойчивых узла (ки = о,к2 ) и (ки ф ,к2 = ) , и седло (ки Ф о,к2 Ф о). После введения управления остается только одна особая точка (Ku,K2t = о) - устойчивый узел, и фазовый портрет системы аналогичен фазовому портрету, который изображен на рисунке 2.2.
Если фазовый портрет системы до введения управления имеет одну особую точку (рисунок 2.1), то другой вариант его изменения при введении управления приводит к появлению четырех особых точек (рисунок 2.4): устойчивый узел (ки,к2т = о), два неустойчивых узла (ки = о,к2т Ф О) и [ки Ф о,к2т = о), и седло (киФО,к2 Фо\. В этом случае область притяжения особой точки (ки,к2 =о) ограничивается сепаратрисами, которые соединяют седло и неустойчивые узлы (рисунок 2.4). Если уменьшить весовой коэффициент "с" в критерии оптимальности (2.27), то управление по модулю увеличивается, и Рисунок 2.3 – Фазовый портрет до введения управление (4 особых точки) область притяжения точки (ки,к2# = о) расширяется. Рисунок 2.4 - Фазовый портрет после введения управления (4 особые точки) Фазовый портрет с двумя особыми точками: седлом (ки = o,K2it Ф О) и неустойчивым узлом (ки,к2=о) до введения управления изображен на рисунке 2.5. После введения управления возможно два варианта: а) устойчивый узел (ки,к2 = о) и седло (ки = о,к2т Ф о) (рисунок 2.6); б) один устойчивый узел (рисунок 2.2). Рисунок 2.5 – Фазовый портрет до введения управления (2 особые точки) Случай, когда имеется три особые точки: неустойчивый узел (ки, к = о седло (ки Ф о,к2т Ф о) , устойчивый узел (ки Ф о,к2т = о) до введения управления изображен на рисунке 2.7. После введения управления имеем одну особую точку - устойчивый узел (рисунок 2.2).
Фазовый портрет до введения управления (3 особые точки) Если до введения управления имеется одна неустойчивая особая точка -неустойчивый узел (ки ,K2jf = о) (рисунок 2.1), то после введения управления в зависимости от действующих нелинейных возмущений возможно и другие варианты фазовых портретов. Так, например, может иметь место фазовый портрет с тремя особыми точками (рисунок 2.8): устойчивый узел (ки,к2т=о) , неустойчивый узел (ки ФО,К2 = о) и седло (ки ФО,К2 Ф о). Или фазовый портрет с четырьмя особыми точками (рисунок 2.9): устойчивый узел (ки,к2 = о), два седла (ки ФО,К2 =О) и(ки = о,к2 Ф О), и неустойчивый узел 1ки Ф о,к2 Ф о Рисунок 2.8 - Фазовый портрет после введения управления (3 особые точки) Еще один вариант изменения фазового портрета получается, если сначала имеется четыре особые точки (рисунок 2.10) вида: фазовый: неустойчивый узел (ки,к2 = о), два седла (ки Ф О,К2 = о) и (ки = о,к2 Ф О), и устойчивый узел (ки Ф о,к2 Ф о). После введения управления имеет место одна устойчивая точка - устойчивый узел (рисунок 2.2) (ки = о,к2т = о). 63 Рисунок 2.9 – Фазовый портрет после введения управления (4 особые точки) Рисунок 2.10 - Фазовый портрет после введения управления (4 особые точки) Приведенные примеры показывают, что изменение фазовых портретов при введении приближенно оптимального управления может быть очень разнообразным. Однако в любом случае появляется область притяжения устойчивой особой точки (ки =о,ки = о) - устойчивого узла, которая может быть ограничена или неограниченна в зависимости от действующих нелинейных возмущений. Причем область притяжения устойчивой точки (ки =о,ки = о) можно увеличить, уменьшая весовой коэффициент "с" в критерии оптимальности (2.27).
Приближенно оптимальное управление колебательной системой с двумя степенями свободы
В данной главе рассматривается приложение разработанной методики синтеза приближенно оптимальных управлений к задачам стабилизации колебаний твердого тела, КА и наноспутника относительно характерных для этих задач направлений. Сначала рассматривается модельная задача движения ТТ вокруг неподвижной точки, близкая к движению волчка Лагранжа. Стабилизируются пространственные колебания тела в окрестности статически устойчивого положения равновесия (относительно направления вертикали) при действии малых линейных возмущений. Решение данной модельной задачи позволяет перейти к решению прикладных задач: стабилизации движения КА в атмосфере относительно вектора скорости и наноспутника в составе космической тросовой системы относительно направления троса.
Сравнение математических моделей, описывающих движение твердого тела вокруг неподвижной точки в случае Лагранжа [68], движение относительно центра масс КА в атмосфере [69] и колебания спутника на тросе [41] показывает, что для малых углов нутации (атаки) эти модели можно записать в одной и той же комплексной форме d2 - d% 2 ( d% \ і J za z + a n% = є F\%, ,а г,Ф + su , (3.1) dt 2 z z at n { dt d =ef(t,ax,o), (3.2) dt dO ( d\ oz + єФ I %,— J, (3.3) dt dt где = p + ia , І = -і , Ф = if/ + cpn , ц/ и cpn - углы Эйлера прецессии и собственного вращения, Jz = JzlJ, J = {Jx + Jy)l2, Jxyz - осевые моменты инерции ТТ (КА, НС) в связанной системе координат, % - частота колебаний в плоском случае, u = up+iua- управление, и р,иа - с точностью до множителя ( j 1) малые управляющие моменты, со z - проекция угловой скорости ТТ (КА, спутника) на продольную ось г связанной системы координат, F , є f и є Ф возмущения, которые характерны для каждой из рассматриваемых задач.
В возмущающие функции системы (3.1 - 3.3) входят нелинейные слагаемые по углу нутации, диссипативные и дестабилизирующие моменты, зависящие от угловых скоростей, а также члены, характеризующие малую массово-инерционную асимметрию твердых тел, близких к телу вращения. Предполагается, что для всех рассматриваемых задач на твердые тела действует восстанавливающий момент, который по модулю существенно превосходит действующие возмущения. При движении твердого тела вокруг неподвижной точки это момент от силы тяжести, при движении КА в атмосфере - момент от аэродинамической силы, при движении спутника на тросе - момент от силы натяжения троса. Так как рассматриваемые возмущения имеют разнородный характер, то для упрощения асимптотического анализа все возмущающие функции масштабируются одним малым параметром є , то есть невозмущенное движение тела описывается следующими уравнениями — -1Т7сэ7—+а)и = 0, (3.4) dt2 dt п = со со = const . (3.5)
Управление ищется в классе малых управляющих воздействий, сравнимых по порядку с возмущающими моментами. Управление вводится с целью компенсации влияния возмущений, действие которых может привести к динамической неустойчивости движения твердого тела. Динамическая неустойчивость проявляется в возрастании амплитуды колебаний угла нутации твердого тела (КА, спутника), определенного относительно характерных для каждой задачи направлений. Предлагаемая методика синтеза регулятора основывается на развитии классического метода АКОР (аналитическое конструирование оптимальных регуляторов) - метода Беллмана-Летова-Калмана [1, 13, 17]. Модификация рассматриваемого метода применительно к данным задачам заключается в использовании метода усреднения для приближенного решения уравнения в частных производных Гамильтона - Якоби - Беллмана. Это позволяет существенно упростить решение задачи синтеза регулятора, а в случае линейных возмущающих моментов получить аналитической решение.
Синтез регулятора будем проводить для малых углов нутации, то есть невозмущенная система представляет собой линейную систему с гироскопическими членами. После преобразования системы к нормальным координатам [70] синтез управления осуществляется по квадратичному критерию оптимальности на асимптотически большом интервале времени. Обратное преобразование координат позволяет записать уравнение регулятора в исходных переменных и, тем самым, решить поставленную задачу.
Уравнения (3.1 - 3.3) представляет собой слабоуправляемую систему [11] по переменной и являются неуправляемыми по переменным (О z и Ф . В связи с этим можно отметить следующее. В рассматриваемых задачах угол Ф определяет периодические возмущения, характеризующие влияние малой массово-инерционной асимметрии [4, 41]. При этом в системе возможны нерезонансные и резонансные случаи движения. На нерезонансных участках влияние малой асимметрии тела на его движение невелико, что проявляется в малом периодическом изменении амплитуды колебаний угла нутации и других переменных системы («биения») [41]. В этом случае влияние малой массово-инерционной асимметрии тела на его движение проявляется только во втором и последующих приближениях метода усреднения. Далее рассматривается нерезонансный случай движения твердого тела, а угловая скорость со z рассматривается как некоторый параметр, от которого зависит правая часть уравнения (3.1).
Приближенно оптимальное управление при решении задачи стабилизации движения твердого тела вокруг неподвижной точки
1) компоненты момента от силы натяжения троса м t = Аг хт , где вектор А г определяет положения точки крепления троса относительно центра масс НС; 2) малые управляющие моменты, заданные в связанной системе координат OXYZ . Для построения оптимального управления используется модель углового движения НС для малых углов нутации, записанная в комплексном виде (3.1-3.3). Привидение уравнений (3.53) к комплексной форме проводится аналогично, как это было сделано выше для ТТ. В этом случае уравнение для комплексного угла нутации = веіц/ = j3 + ia имеют аналогичный вид, причем со2п (х) = Т (х )Л г / J , х = (L,L,3t,$A - вектор медленных переменных. Приближенно оптимальные управления в данном случае определяются в соответствии с методикой, изложенной в разделе 3.1. Критерий оптимальности задается в виде (3.7). Формулы для оптимального (3.14-3.15) и приближенно оптимального (3.32-3.33) управлений также не изменяются. Усредненные уравнения без управления и с управлением изменяются в соответствии с действующими возмущениями.
Возмущнное угловое движение НС зависит от ошибок его отделения от базового КА и от изменения силы натяжения троса в соответствии с выражениями (3.51)-(3.52). Резкое увеличение амплитуд колебаний, например, имеет место при уменьшении силы натяжения троса в момент перехода от первого этапа развртывания системы ко второму этапу. Изменение силы натяжения троса ведт к изменению частот системы а 12.
В этом случае определение усредннных уравнений для амплитуд колебаний с учтом медленного изменения частот дат ( КЛЛ і \ 1 ( со1К1 -1 \ = (RK (к, р,х))=—\ . , (3.54) {К2 J V 2сов усо2К2 j где изменение производных со1 2 определяется в силу уравнений (3.49)-(3.50). 101 Тогда оптимальные управления будут определяться формулами 1 2 к ua = Z (-1) (ВкКкС0 Фк)+є-, (3.55) 2 k = X u =— (-\)k + l (ВкКквтфк) + є... , (3.56) В - \ ) \ к к ІС\ 6 k = X где B 12= 2с,й)л +o,2 + Jfi i22 + 6i 7 /cl Управления (3.55)-(3.56) с точностью до постоянных множителей (моментов инерции) представляют собой моменты сил относительно осей oxt и OYt (рисунок 3.24). Требуемые моменты относительно связанных осей системы координат OXYZ можно получить через стандартную матрицу перехода (3.48), где угол атаки а п надо формально заменить на угол нутации в .
После введения управления, усредненные уравнения для амплитуд колебаний приводятся к виду (3.34): Kl2 sKl dt 2со0 yjal,2 +b\,2 lcl . (3.57) Так как dKl2/dt 0 , то производная dw Idt , определнная в силу усредннной системы, есть функция отрицательно определнная. Отсюда следует асимптотическая устойчивость решения кх = к2 = о . Рассматривается НС массой т = 4кг : J =J = J = 0.0Пкгм , J =0A, У L = о.2м , в(0) = л /2 , 0(0) = о , (0) = lc"1 , fi z(0) = 0.5с"1 . Параметры законов управления (3.51)-(3.52) соответствуют развртыванию КТС на 30км. Процесс выпуска троса занимает около 2,3 часа. -1 а п, с Изменение частоты плоских колебания НС без введения управления показано на рисунке 3.25. На рисунке 3.26 показано изменение угла нутации без управления. Угол нутации превышает п I 2 . Значения угла нутации в данном 102 случае являются не допустимыми, так как трос касается поверхности НС и возможно его провисание. Значения модуля угловой скорости также является достаточно большими после окончания развертывания КТС, что может привести к беспорядочному вращения НС после отделения от КТС.
Изменение модуля угловой скорости НС без управления После введения управления для различных весовых коэффициентов критерия оптимальности процесс стабилизируется. Это наглядно можно наблюдать на рисунках 3.28 (Ъ1 = Ъ2 = с = 1 / 3 ) и 3.29 (Ъ1 = Ъ2 = 1 /12, с = 5 / 6 ) -на них показаны графики изменения угла нутации. Сравнение рисунков 3.28 и 3.29 показывает, что изменяя коэффициент с по сравнению с коэффициентами Ь1, Ь2 всегда можно уменьшить амплитуды колебаний до требуемых значений (рисунок 3.28)
Изменение угла нутации при использовании приближенно оптимального управления ( b1 = Ь2 =1/12, с = 5 / 6 ) На рисунках 3.30 и 3.31 показаны графики изменения модуля поперечной угловой скорости J D2X +о2у при использовании приближенно оптимального управления. Так же как и на графиках для угла нутации коэффициенты в критерии оптимальности у них отличаются, что приводит к уменьшению угловых скоростей (рисунок 3.30). Рисунок 3.30- Изменение модуля поперечной угловой скорости при использовании приближенно оптимального управления ( Ъ 1 = и 2 = С = 1 /3 ) 105 Рисунок 3.31- Изменение модуля поперечной угловой скорости при использовании приближенно оптимального управления (й1=62=1/12, с = 5 / 6 ) На рисунке 3.32 показано изменение модуля управляющего момента. Как видно управляющий момент относительно большой в начальные моменты времени, но с течением времени, когда процесс стабилизируется, модуль управляющего момента уменьшается. Рисунок 3.32- Изменение модуля управляющего момента (й1=62=1/12, с = 5/6 ) На рисунке 3.33 показан процесс демпфирования колебаний относительно центра масс НС при развртывании КТС согласно (3.51)-(3.52) с использованием 106 определнного приближенно оптимального управления по исходной нелинейной модели движения (3.53). Переходный процесс на плоскости [в,в) имеет колебательный характер, причм сначала происходит гашение колебаний в , а потом точка на фазовой плоскости приближается к началу координат по оси абсцисс (в = о ).
Процесс демпфирования колебаний по углу нутации Рассматриваемый метод оптимального управления позволяет не только обеспечить динамическую устойчивость углового движения НС, но и формировать тип его прецессионного движения вокруг направления троса. Это особенно важно для уменьшения влияния резонансов на движение системы, которые могут привести к неустойчивости углового движения НС. Так, например, если после отделения НС от базового КА реализуется прямая прецессия вокруг направления троса (oz o, o), то это создает благоприятные условия для реализации длительных резонансных режимов движения, неизбежно приводящих к неустойчивости угловых колебаний НС. Поэтому необходимо обеспечить приоритетное демпфирование амплитуды колебаний кх , что достигается увеличением весового коэффициента ъх в критерии оптимальности (3.7) по сравнению с другими весовыми коэффициентами. На рисунке 3.34 показан пример изменения вида прецессии при движении КА (с прямой на обратную прецессию, когда со z о , у/ о ), обеспеченный посредством увеличения коэффициента ъх.
Приближенно оптимальное управление в задаче стабилизации движения наноспутника на тросе
В диссертационной работе принцип Беллмана используется в сочетании с методом усреднения, который в настоящее время часто используется для анализа движения колебательных систем [4]. Поэтому остановимся на основных особенностях этого метода.
Метод усреднения является разновидностью метода малого параметра [4, 11, 63].
Малый параметр задачи обычно обозначают е . Существует два основных способа введения малого параметра в динамическую систему [61]:
1. Приведение системы к безразмерному виду и сравнение величин коэффициентов в безразмерной системе. Здесь малыми считаются коэффициенты, которые принимают значения много меньше единицы. Способ используется для простых уравнений и систем с небольшим количеством уравнений.
2. Предполагается, что решения системы с возмущением мало отличается от невозмущенного решения определенного вида, например, гармонических колебаний. При этом все слагаемые в системе делятся на две группы: основные и возмущающие. Возмущающие функции масштабируются путем введения перед ними множителя - малого параметра є . Успех применения асимптотического метода определяется близостью решений рассматриваемой системы к известным решениям.
В данной работе используется второй способ введения в систему малого параметра є .
Метод усреднения позволяет исследовать колебания в нелинейных системах, в частности, обнаружить и изучить такие эффекты присущие только нелинейным системам, как режимы автоколебаний (колебания с постоянной или с почти постоянной амплитудой, которые поддерживаются, несмотря на неизбежные потери энергии в системе). Примером возникновения автоколебаний может служить колебательный контур [64] при наличии в нем нелинейного элемента, на который подается дополнительный ток специального вида.
Основные этапы применения метода усреднения для анализа движения колебательных систем следующие: 1. Приведение колебательной системы к стандартной форме метода усреднения. Чаще всего это система с быстрыми фазами dJL=,R{z,,), .,(1)(!,М, (1.26) dt dt где х - вектор медленных переменных, ср - вектор фаз, со (х) - вектор-функция частот системы, а вектор - функции д(х, р)иФ(х, р) периодичны по каждой из фаз p1, p2,... pv с периодом 2 я- . 2. Усреднение системы (1.26) по фазам. Обычно основной интерес представляет поведение медленных переменных х . Усредненные уравнения первого приближения для медленных переменных имеют вид — =є(я(х,(р])=єА1(х0), (1.27) dt \ У І У где (...) - стандартный оператор усреднения по фазам q 1,q 2,...q v на периоде колебаний 2п . Здесь и далее в работе рассматриваются нерезонансные случаи движения системы (1.26), то есть частоты системы не должны удовлетворять целочисленным соотношениям к1со1 + к2со2 + ... + kvcov = 0, (1.28) где k1, k2,...kv - малые целые числа. Если в систему (1.26) входит управление и и решена задача синтеза управления и (х) , то после подстановки управления в исходную систему зо обыкновенных дифференциальных уравнений получаем систему в форме (1.26), и дальнейшее получение усредненных уравнений ничем не отличается от предыдущего случая неуправляемой системы. Полученная усредненная система (1.27) существенно проще исходной системы (1.26), так как уравнения для медленных переменных не зависят от уравнений фаз, и могут быть проинтегрированы отдельно.
Видимо впервые процедуру усреднения при расчете движения небесных тел применил Лаплас. Дальнейшее развитие процедуры усреднения можно связать с именем голландского инженера Ван-дер-Поля, применившего описанную процедуру усреднения при исследовании нелинейных колебаний в электрических цепях [3]. Современный вариант метода усреднения включает в себя метод Ван-дер-Поля как нулевое приближение, при этом приближенные решения метода усреднения ищутся в виде асимптотических рядов где и (к,ф), и (к0J0 ),…, v (x,(p),s2v (х, р),...- ограниченные функции, периодичные по фазам ср , и имеющее нулевое среднее. Причем новые переменные х, р удовлетворяют дифференциальным уравнениям, которые не содержат вектор фаз ср в правых частях
Применение метода усреднения для анализа и управления колебательными системами обосновывается рядом теорем [11, 65, 66], наиболее важной из которых является теорема Боголюбова Н.Н. [65]. Основные условия применения метода усреднения: 1. Исходная система дифференциальных уравнений должна удовлетворять стандартным условиям теоремы о единственности и существовании решений [61] при некоторых начальных условиях x(t0), q (t0), где t0 - начальное время. 2. Существуют и могут быть определены средние от функций R(x, p) , Ф (х, ф), стоящих в правых частях системы (1.26). 3. Метод усреднения имеет смысл применять только при достаточно малом значении малого параметра є , который определяет погрешность решений усредненной системы: