Содержание к диссертации
Введение 3
Глава 1. Постановка задачи и исследование особенностей 9
Постановка задачи 9
Частный случай: vo = Vf 14
Кусочно-постоянное и постоянное управления 25
Особенности решения задачи принципа максимума 31
Полученные результаты 39
Глава 2. Решение задачи в многомерном случае 41
Частный случай: xq = Xf 41
Частный случай: vq = 0 49
Вариация величины и направления скорости 56
Вариация величины и направления радиус-вектора 67
Полученные результаты 74
Заключение 79
Список литературы 83
Введение к работе
Многомерные задачи возникают в различных приложениях теории оптимального управления и теории дифференциальных игр. Их решение весьма затруднено большим количеством параметров, от которых зависят искомые величины, сложностью решения систем нелинейных дифференциальных уравнений, трудностью представления и интерпретации полученных результатов.
При решении возникает необходимость исследовать искомые величины при изменении заданных параметров, что приводит к большому количеству частных случаев, подлежащих учету, и большим вычислительным трудностям. По этой причине до недавнего времени эти задачи не могли быть решены вследствие отсутствия соответствующих вычислительных мощностей, а рассматривались лишь для небольшого количества параметров или при дополнительных упрощающих предположениях.
Среди задач этого типа можно выделить задачи оптимального управления [22, 48, 49, 58, 59, 71]. В них некоторая величина должна удовлетворять заданному интегральному или терминальному функционалу, который минимизируется или максимизируется. Наиболее распространенными с точки зрения практического применения являются задачи предельного быстродействия, то есть управления за минимальное время. Решению этих задач посвящено большое количество работ [3-14, 20-22, 25, 38, 40-49, 55-59, 70-72, 78, 79, 81-84].
Первоначально для решения задач оптимального управления использовались методы вариационного исчисления [22-24, 34, 36, 53, 58, 65, 66], а также различные методы, основанные на интерпретации условий задачи, метод фазового пространства [78].
Существенное развитие методов решения задач оптимального управления стало возможным после создания метода динамического программирования [19] и принципа максимума Л.С. Понтрягина [71].
На основе метода динамического программирования, созданы методы решения задач оптимального управления, основанные на вариации в пространстве состояний системы, доставляющие максимум гамильтониану по выбранной управляющей функции [1, 19, 24, 64, 77, 82]. Другая группа методов основана на аппроксимации области ограничения управления посредством выпуклых многогранников [24, 77, 82].
Принцип максимума позволил свести решение задачи оптимального управления к решению системы дифференциальных уравнений [21, 62, 71, 77, 82]. Если уравнения в сопряженных переменных удается проинтегрировать в аналитической форме, то решение задачи сводится к численному решению системы нелинейных уравнений [24, 26, 77, 82]. В противном случае, использовалась разностная аппроксимация системы уравнений в сопряженных переменных. В [32, 33, 75, 77] для решения задачи были использованы различные численные методы, основанные на применении разностных схем и различных аппроксимаций множества искомых параметров. Для решения задач оптимального управления применялся также метод усреднения [2, 79, 81] и метод малого параметра [3, 16, 20, 37].
Если задача не решается в общей постановке, то иногда целесообразно рассматривать частные случаи, основанные на упрощении (приближении) функционала или условий окончания процесса. Хорошо известны решения задач с нефиксированной финальной скоростью или финальным положением [3, 21, 22, 48, 58, 59]. В работах [5, 49, 58, 59, 71] рассмотрены случаи одномерного движения с учетом воздействия различных внешних сил -
линейной диссипации и силы упругости, силы сухого трения и др.
Для некоторых систем удается доказать характерные особенности управляющей функции, позволяющие упростить процедуру решения задачи. В работах [5, 84] были рассмотрены системы третьего порядка, в которых возможно провести аналитическое исследование. В задачах большего порядка решение строилось с учетом того, что управление будет релейной функцией, содержащей конечное число переключений [31, 32].
При решении многомерных задач оптимального управления весьма важно построить область управляемости динамической системы, позволяющая существенно упростить решение задачи и определить качественные особенности оптимального движения [18, 21, 22, 27, 30, 39, 49, 59, 60, 61, 68, 73, 74, 80]. Также получили развитие методы построения квазиоптимальных управлений [16, 27].
Задачи оптимального по быстродействию управления динамическим объектом посредством ограниченного по величине управляющего ускорения возникают в различных областях теории управления. В области управления КЛА [15, 17, 28, 31, 35], самолетами [54, 63, 67, 69, 85], мобильными роботами и транспортными средствами [29]. В задачах гашения колебаний [76, 81, 86], задачах оптимального управления с учетом фазовых ограничений [4, 12, 22], а также теории дифференциальных игр [1, 50-52, 83].
Следует отметить также различные задачи наведения на неподвижные объекты с учетом возмущений [49, 60], а также на подвижные объекты [31], задачи оптимального уклонения от препятствий [12] и минимизации промаха [56].
Диссертация посвящена решению задачи наискорейшего приведения многомерного динамического объекта в заданное фазовое состояние посред-
ством управляющего ускорения, ограниченного по абсолютной величине. Движение происходит в геометрическом пространстве произвольной размерности. Цель работы исследовать оптимальное управление и время быстродействия. Построить синтез оптимального управления, исследовать время быстродействия как функцию начальных данных (функцию Беллмана) и определить качественные особенности движения.
В диссертационной работе обобщены уже известные решения задач с нефиксированной финальной скоростью и нефиксированным начальным положением динамического объекта. Эти случаи соответствуют особенностям на графиках направления управления и времени быстродействия при вариации по величине и направлению начальной скорости и начального радиус-вектора. Результаты работы [3], в которой была подробно исследована задача с нефиксированной финальной скоростью в диссертационной работе обобщены на случай равенства начальной и финальной скоростей.
Случай нулевой финальной скорости был рассмотрен в работе [11], где проинтегрированы уравнения движения, а решение задачи сведено к численному решению трансцендентного уравнения. Для этого случая получены новые результаты, основанные на выборке по величине и направлению начального положения динамического объекта.
В работе [71] рассмотрен случай одномерного движения. Характерные особенности управления и уравнения движения соответствуют случаям постоянного и кусочно-постоянного управлений в плоском случае.
Данная задача использовалась для тестирования различных численных алгоритмов [33, 77]. Рассматривались уравнения движения третьего порядка [84]. В качестве тестовых использовались как разностные схемы, так и аппроксимации множества начальных приближений.
В работах [40, 49] показана связь этой задачи с I - проблемой моментов.
Диссертация состоит из введения, двух глав, заключения и списка литературы.
В главе 1 рассматривается постановка задачи оптимального управления и исследуются особенности решения задачи принципа максимума.
В разделе 1.1 ставится задача принципа максимума. Уравнения движения интегрируются аналитически. Решение задачи сводится к численному решению системы нелинейных уравнений. Находятся неизвестные вектора сопряженных переменных.
В разделе 1.2 рассмотрен случай равенства начальной и финальной скоростей. Исследованы оптимальное управление и время быстродействия. Найдены случаи неединственности решения задачи принципа максимума.
В разделе 1.3 вводится классификация управлений. Найдены начальные условия, соответствующие различным типам управлений. Исследован случай управления, содержащего точку переключения.
В разделе 1.4 исследуется решение задачи принципа максимума. Доказывается теорема о единственности оптимального решения. Приводятся случаи неединственности решения задачи принципа максимума.
В разделе 1.5 суммируются основные результаты главы 1.
В главе 2 подробно рассмотрен случай плоского движения: случай совпадения начального и финального положений, нулевой начальной скорости, вариации по величине и направлению начальной скорости и начального радиус-вектора.
В разделе 2.1 рассмотрен случай совпадения начального и финального положений. Исследовано оптимальное управление в начальной и финальной точках и время быстродействия в зависимости от величины и направ-
ления начальной скорости.
В разделе 2.2 рассмотрен случай нулевой начальной скорости. Исследовано оптимальное управление в начальной и финальной точках и время быстродействия в зависимости от величины и направления радиус-вектора начального положения.
В разделе 2.3 приводится выборка по величине и направлению начальной скорости. Исследовано время быстродействия и оптимальное управление. Получены условия максимума и минимума времени быстродействия для этой выборки.
В разделе 2.4 приводится выборка по величине и направлению радиус-вектора начального положения. Исследовано время быстродействия и оптимальное управление. Получены условия максимума и минимума времени быстродействия для этой выборки.
В разделе 2.5 суммируются основные результаты главы 2.
В заключении описаны наиболее существенные результаты диссертационной работы и возможные их приложения.
Основные результаты докладывались на 9-м Всероссийском съезде по теоретической и прикладной механике в 2006 году, на конференциях МФТИ в 2002-2006 годах, а также на семинаре Института проблем механики РАН "Теория управления и динамика систем" под руководством академика Ф. Л. Черноусько. Они опубликованы в центральных научных журналах РАН [6-8, 10] и трудах конференций [9, 42-47].