Содержание к диссертации
Введение
1 Связь между понятиями минимаксного решения и обобщенного слабого решения, основанного на идемпотентном анализе 17
1.1 Введение 17
1.2 Основы минимаксных решений 18
1.3 Обобщенная линейность уравнения Гамильтона-Якоби 25
1.4 Формула представления минимаксных решений 29
1.5 Эквивалентность минимаксных и обобщенных слабых решений . 36
1.6 Некоторые вспомогательные результаты 39
2 Свойства областей достижимости для каскадных управляемых систем 44
2.1 Введение 44
2.2 Представление области достижимости 45
2.3 Топологические свойства области достижимости каскадной управляемой системы 57
2.4 Область достижимости каскадных управляемых систем при эллип соидальных ограничениях 59
3 Области достижимости трехмерной каскадной управляемой системы и двумерной билинейной управляемой системы 64
3.1 Введение 64
3.2 Внешняя оценка границы области достижимости трехмериой каскадной управляемой системы 65
3.3 Точная область достижимости для трехмерной каскадной управляемой системы и задача о быстродействии 69
3.4 Область достижимости для двумерной билинейной управляемой системы 78
3.5 Иллюстрации 80
Заключение 87
Библиография 88
- Обобщенная линейность уравнения Гамильтона-Якоби
- Эквивалентность минимаксных и обобщенных слабых решений
- Топологические свойства области достижимости каскадной управляемой системы
- Точная область достижимости для трехмерной каскадной управляемой системы и задача о быстродействии
Введение к работе
Математическая теория процессов управления была мотивирована потребностями прикладных наук, в том числе задачами управления движением, автоматики, робототехники и т.д. В дальнейшем она нашла применения в таких областях как экономика, финансовая инженерия и моделирование медикобиологических процессов. Последнее время задачи управления стали возникать при изучении квантовых процессов в физике, при конструировании коммуникационных систем и т.п.
Центральной в теории оптимального управления является задача синтеза управления. Цель данной задачи состоит в том, чтобы построить управляющие воздействия, переводящие систему, описываемую уравнениями динамики, в предписанное конечное состояние. При этом управление в задаче синтеза является позиционным, то есть является функцией как времени, так и фазовой переменной. Последнее обусловлено решением практических задач в условиях неполной или неточной информации при наличии возмущений.
Большой вклад в решение задач синтеза управлений внесли Л.С. Понтрягнн, Н.Н. Красовский, В.Г. Болтянский, Р.В. Гамкрслидзс, М.И. Зеликин, В.Ф. Кротов, А.Б. Куржанский, Е.Ф. Мищенко, Ю.С, Осипов, Б.Н. Пшеничный, А.И. Субботин, Ф.Л. Черноусько, R. Bellman, II. Brockett, A.I. Bryson, Ch.I. Byrnes, R. Isaacs, A. Isidori, A. Krener, P. Kokotovic, G. Leitmann, S. Mitter, S. Sastry, E. Sonntag, II. Sussman, P, Varaiya и другие.
Одним из методов решения задач программного управления (то есть когда управление является функцией лишь времени, но не фазовой переменной) опирается на принцип максимума Понтрягина [22], в рамках которого изучаются необходимые условия оптимальности управления. Этот метод используется при решении задачи синтеза, причем последняя решается с точки зрения некоторого критерия оптимальности, например, в быстродействии перехода управляемой системы из одного состояния в другое.
Подчеркнем, что в условиях отсутствия возмущений (которые приняты в данной диссертации и выполнение которых подразумевается везде ниже) значение критерия оптимальности при синтезированных позиционных стратегиях такое же, как и при программных управлениях. Однако особенно важно решать задачи синтеза при наличии возмущений, являющиеся предметом игровых задач динамики, то есть теории дифференциальных игр. В последнем случае для этих задач программных управлений недостаточно.
Наряду с принципом максимума Понтрягина, обобщая подходы классического вариационного исчисления [5, 18, 37], рассматривается метод динамического программирования Р. Беллмана [1], посвященный достаточным условиям оптимальности и восходящий к формализму уравнений Гамильтона-Якоби. Таким способом оказывается также возможным изучать эволюцию по времени областей достижимости управляемых систем. Подобластью достижимости в данный момент времени подразумевается множество всевозможных состояний системы, в которые можно перейти при помощи соответствующего допустимого управляющего воздействия из фиксированного в заданный начальный момент времени состояния (или множества состояний) [10, 17, 53, 63]. Эволюцию областей достижимости в прямом времени описывает трубка достижимости, а в обратном времени ~ трубка разрешимости. Теории трубок траекторий посвящена работа [49].
Задача синтеза состоит в поиске позиционного управления, переводящего систему в предписанное конечное состояние (или множество), которое для этого должно удерживать траекторию внутри соответствующей трубки разрешимости (или моста) на заданном отрезке времени. Это составляет существо "правила экстремального прицеливания", введенного Н.Н. Красовским [10, 11].
При данном подходе основные этапы решения задачи синтеза управления сосредоточены в нахождении областей достижимости. При этом в нелинейном случае, когда решение найти трудно, полезным является изучение различных качественных свойств областей достижимости, таких как ограниченность, замкнутость, выпуклость, непрерывная зависимость от параметров (см., например, [2, 17, 33, 34, 35]).
Эволюция по времени области достижимости в фазовом пространстве исследуемой системы может быть охарактеризована при помощи следующих способов: поточечное представление, описание при помощи параметрического задания границы, использование аппарата опорных функции (в том случае, если области выпуклые) и представление в виде множеств уровня локально липшицевых функций.
В рамках последнего представления было показано, что для описания динамики областей достижимости можно использовать задачи динамической оптимизации [51]. А именно, вводилась функция цены V(i,x) = min ^(1((0),^0), где минимум берется по всем допустимым траекториям системы х('), выпущенным в обратном времени из позиции {t,x}. Здесь d?(x{to),Xo) — квадрат эвклидова расстояния от левого конца траектории x(to) до выпуклого компактного множества начальных состояний AV Как показано в [51], область достижимости в момент времени t совпадает с множеством {х: V{t,x) < 0}. Отметим, что для функции V{t,x) справедливо полугрупповое свойство V(t, х) = V(t, x\tQ, V(t0, )) = V(t, х\т, V(t, -\t0, V(t0, <))), t0 8V(t,x) ( 0V(t,x)\ —д^ + Н{*>Х>—дх-)~> (1) V(t0,x) = cP{x,X0). Для линейно-выпуклых управляемых систем (то есть систем с линейными уравнениями динамики и жесткими "мгновенными" геометрическими ограничениями на управление в виде выпуклых компактов) функция цены V(t, х) вычислялась средствами выпуклого анализа [9, 16, 50, 51, 58]. Также были вычислены и опорные функции областей достижимости, являющихся в данном случае выпуклыми компактами, при этом было показано, что функция V(t,x) представляет собой классическое решение задачи (1) [50, 51]. Однако для нелинейных управляемых систем функция V(t, х) является, вообще говоря, дифференцируемой лишь для почти всех значений аргументов. Поэтому V(ttx) является решением (1) лишь в обобщенном смысле. Отметим, что мы не можем определить решение просто как функцию, удовлетворяющую уравнению Гамильтона-Якоби почти всюду, ибо данному условию может удовлетворять бесконечно много функций (см., например, [44]). Для того, чтобы отвечающее заданному краевому условию решение было единственно, необходимо наложить на него дополнительные условия, приводящие к различным понятиям обобщенного решения. Обобщенные решения уравнений в частных производных первого порядка играют исключительно важную роль не только в теории оптимального управления, но и во многих теоретических и прикладных областях. Рассмотрим некоторые понятия обобщенного решения уравнения Гамильтопа-Якоби, не претендуя на полный обзор. Для гамильтониана H(t,x,s), выпуклого по импульсной переменной 5, что характерно для задач оптимального управления, понятие обобщенного решения было введено С.Н. Кружковым [13]. При помощи метода исчезающей вязкости были построены вязгеие решения [14, 20, 43]. В отсутствии предположения о выпуклости гамильтониана было предложено несколько понятий обобщенного решения уравнения Гампльтона-Якоби. М.Дж. Крэндалл и П.-Л. Лионе всели понятие вязкостного решения [38, 39, 44, 54[, использующее суб- и супердифференциалы в качестве обобщения понятия производной. Эквивалентное ему понятие минимаксного решения было предложено А.И. Субботиным [29, 30, G2]. Понятие минимаксного решения по сути основывается на обобщении метода характеристик Коши [30, G2] и также, как и понятие вязкостного решения, может быть определено в инфиннтезимальиой форме при помощи различных средств негладкого анализа, таких как производные по направлениям, конусы касательных направлений и т.д. В.П. Маслов и его сотрудники исследовали уравнение Гамильтона-Якоби с точки зрения идемпотсптіюго анализа. При условии выпуклости гамильтониана ими была предложена концепция обобщенного решения, введенного по аналогии с классической теорией распределений [8]. В идемпотентном анализе традиционная структура поля над R с операциями а + Ь и а- Ь заменяется структурой полукольца А = RU{-foo} с операциями афЬ = min{c, b) и аЬ = а + Ь. В [8] понятие обобщенного слабого решения определялось через оператор, сопряженный к эволюционному оператору, разрешающего задачу Коши (1) для подходящего класса краевых условий. Сопряжение понимается по отношению к "скалярному произведению" функций (/,д)л = infi(/(x) + д(х)). Все обобщенные слабые решения имеют представление, сводящееся в случае, когда H(t,x,s) = H(s), к формуле Лакса-Олейник [20, 46, 52, 54]. Кроме того, в [19] для гамильтониана H(t,x,s), уже не обязательно выпуклого по з, опять же на основе идемпотеитпого анализа слабое решение определено подобно другому классическому подходу, принятому в математической физике, который использует понятие слабой сходимости. В силу разнообразия способов формализации понятия обобщенного решения важным является исследование вопроса об структурных взаимоотношениях между различными его определениями. Эквивалентность большинства определений, данных в инфинитезимальной форме и использующих конструкции негладкого анализа, доказана в [29, 62]. Эквивалентность идемпотентных решений из [19], введенных при помощи слабой сходимости, и вязкостных решений исследовалась в [45]. Кроме того, в [41] было показано, что для специального случая задач оптимального управления, формализованных при помощи введенных в [40] процессов Беллмана-Маркова, понятия обобщенного слабого решения из [8] и вязкостного решения совпадают. Цель данной работы состоит в исследовании связи между обобщенными решениями уравнения Гамильтона-Якоби, основанными на негладком анализе, и идем поте нтны ми решениями, введенными по аналогии с классической теорией распределений, а также в изучении применимости обобщенных решений уравнения Гамильтона-Якобн и обобщенных уравнений Гамильтона, описывающих характеристики этого уравнения, к задачам достижимости и синтеза управления в конкретных билинейных управляемых системах каскадного типа. Перейдем к описанию основных результатов диссертации. Первая глава посвящена прямому доказательству эквивалентности понятия минимаксного решения и обобщенного слабого решения из [8], введенного при помощи идемпотентного анализа, для задачи Коши Ш + Н(і,Х, ^)=0, (1,,)60-[0.Г)Х1Р. р) V{T,x) = tp{x), іеК" в случае гамильтониана H{t,x,s), вогнутого и глобально липшицевого по s (последнее условие влечет за собой линейный рост гамильтониана по импульсной переменной). Отметим, что краевое условие здесь задано, в отличие от (1), на правом конце, что сделано лишь для совместимости с определениями минимаксного решения, данными в [29, 30, G2|. Чтобы рассмотреть задачу Коши па левом конце, надо сделать замену времени t — to + Г — г, г > to. Отметим основную трудность доказательства эквивалентности решений, введенных при помощи идемпотентного анализа, и других обобщенных решений. Как уже было отмечено выше, многие обобщенные решения, как, например, вязкостные и минимаксные, могут быть определены инфиннтезнмально, подобно классическим решениям. Это означает, что в определении фиксируется, в каком смысле данное решение удовлетворяет уравнению Гамильтона-Якоби в данной точке. Таким образом, некоторая функция является решением уравнения тогда и только тогда, когда она удовлетворяет этому уравнению во всех точках. В отличие от этого, идемпотснтныс обобщенные слабые решения определены при помощи эволюционного оператора, разрешающего уравнение. Следовательно, этот оператор должен быть сконструирован, хотя и для достаточно хороших краевых условий, перед тем, как становится возможно ввести идемпотентные решения. Значит, эволюционный оператор должен быть построен, основываясь на другом понятии обобщенного решения. В диссертации для этого использовано понятие минимаксного решения. Первая глава состоит из шести разделов. В первом из них формулируется исследуемая задача Коши. Во втором разделе все необходимые определения и результаты, касающиеся вещественнозначных минимаксных решений, естественным образом распространены на случай минимаксных решений, принимающих значение в полукольце A = R U {+оо}, которые являются либо непрерывными в метрике р(а, b) = | ехр(-а) —ехр(-6)|, либо полунепрерывными снизу по отношению к естественному порядку А. Это необходимо для рассматриваемого в главе доказательства эквивалентности, так как идемпотентные обобщенные слабые решения могут принимать в некоторых точках значение +оо. Для того, чтобы проиллюстрировать это расширение, рассмотрим следующий пример. Пусть п = 1и H(ttxts) = —1«|. Последовательность функций 14((, х) = <рь(х + Т — і), к = 1,2,..., сходится при к —> со равномерно относительно метрики р[а,Ь) к функции V(t,x) = 2х + 2к, х<1/к, V>k(x) = < к = 1,2,.... 1/2, X > 0, [ 1/х, X > 1/Л, Так как для любого натурального числа Л; функция 14((, х) является классическим решелиел* уравнения Гамильтона-Якоби, то функцию V(t,x) можно нптре-претировать как решение задачи (2). В третьем разделе первой главы гамильтониан, удовлетворяющий основным предположениям из [29] и, кроме того, вогнутый по импульсной переменной, представлен двумя способами в виде, характерном для задач оптимального управления. На основе этих формул представления в рамках А-значних минимаксных решений показана линейность уравнения Гамильтона-Якоби по отношению к операциям ф = min и О = +. Это является основным результатом дайной главы. В четвертом разделе на основе идемпотентного анализа, используя полученную обобщенную линейность уравнения Гамильтона-Якоби, для А-значных минимаксных решений задачи Коши получена следующая формула представления: V(*,x)« н(Ь((,1,0 + *»()) (3) Здесь i(,:r, ) — некоторая Л-значная (функция, которая ограничена снизу и полунепрерыва снизу по переменной . Необходимо отметить, что для случая, когда гамильтониан H(t,x,$) вогнут по 5 и стремится к —со при ||s|] —> оо, а также когда функция <р равномерно ограничена и равномерно непрерывна, соответствующее вязкостное решение задачи Коши (2) удовлетворяет формуле представления того же вида [39]. В пятом разделе на основе (3) показано, что минимаксные решения эквивалентны идемпотентиым слабым решениям в том случае, когда гамильтониан #((,х, s) = H(t,s), а функция <р такова, что оба вида обобщенных решений определены. Л именно, ip является Л-значноіі ограниченной снизу и полунепрерывной снизу по отношению к порядку А функцией. Отмечено, что для любой R-значной ограниченной снизу непрерывной функции <р соответствующее вязкостное решение, а также обобщенное решение с смысле С.Н. Кружкова задачи Коши (2) совпадают с ее идемпотентиым слабым решением. Кроме того, при помощи формулы Хопфа для неавтономного уравнения Гамильтона-Якоби [24, 61] представление (3) приведено к явному виду, обобщающему классическую формулу Лакса-Олейник [20, 46, 52, 54]. В шестом разделе первой главы приведены доказательства некоторых вспомогательных результатов. Do второй главе исследуется каскадная управляемая система, уравнения которой возникают в робототехнике [57]. А именно, рассматривается система следующего вида: Х\ — «ь &г = xi - и2, із = а?2 «з, ,.. і (4) „_1 = Хп-2 "„_!, L in = «n-1, n > 3. Здесь измеримое управление u(-) — (иі(*),«г(*)) ,u„_i('))'удовлетворяет мгновенным "жестким" ограничениями вида u(t) е?,і Є [0>^]- Множество V является непустым выпуклым компактом из Е""1. Центральная задача данной главы — изучение свойств области достижимости системы (4). Пусть p(t, x,s, г) = — #(i,x, — 5, г). Из леммы 1.6.2, приведенной ниже в разделе 1.6, содержащем вспомогательные результаты, следует, что р выпукла и положительно однородна по (s,r), а также непрерывна по совокупности переменных. Средствами выпуклого анализа [23] мы получаем, что для всех точек (t,x) 6 G она является опорной функцией некоторого непустого выпуклого компакта, непрерывно зависящего от (t, х). Таким образом, существует многозначное отображение G Э (t,x) н» P(t,x) Є conv(RnxK) такое, что для всех (s, г) є E"xR справедливы равенства Из равенства Н(іл x, s, 1) = H(t, x, s) и, кроме того, из липшицевости H(t, х, s, г), по теореме 13.3.3, приведенной в [23], P{t,x) С y/2LK{x)-B, следовательно, справедлив следующий результат: Теорема 1.3,1. Если выполнено предположение 1.2.1, тогда Кроме того, для любых точек (t,x) G и (/, ?) P(t,x) справедливо неравен-cmeo\\f\\2+g2 2Ll{x). Формула (1.3.2) является примером формул представления для гамильтониана. В данном случае гамильтониан имеет вид, характерный для оптимального управления (см. пример 1.2.1). Б общем случае, когда гамильтониан Н не обязательно выпуклый или вогнутый по импульсной переменной, он может быть представлен в виде, характерном для теории дифференциальных игр [42, 47]. Уточним для последующего формулу (1.3,2). По теорема 8.1 из [56] у P(t, х) существует непрерывный селектор p(t,x) = (p(t,x),q(t,x)), то есть непрерывное на G однозначное отображение p(t, х) такое, что p(t, х) V(t, х) для любой точки (t,x) Є G. Пусть Vo{t,x) — P{t,x) p(t,x). Рассмотрим следующий функционал: Замечание 1.3.2. Если {u,v) ф 0, то функционал "){1,x,u,v) является обратным к функционалу Минковского n{t,x,utv) — inf{A 0 (u,v) A- Po(t,x)}. Из выпуклого анализа [23] хорошо известно, что при помощи функционала Минковского стандартным способом можно преобразовать каждый выпуклый компакт, имеющий непустую внутренность, в единичный шар. Теперь обозначим для (и, v) Є В В таком случае из теоремы 1.3.1 и леммы 1.6.3, приведенной ниже в разделе 1.6, содержащем вспомогательные результаты, следует следующий результат: Лемма 1.3.1. Для любой точки (u,v) Є В функции f(t,x,u,v) и g(t,x,u,v) непрерывны по (ttx) Є G, неравенство ]/(f,x,«,u)][2 + g2{t,x,u,v) 1L2{x) вы полнепо для всех (t, х) Є G и, кроме того, Таким образом, множества Р и Q, где Р = Q = В, и отображения удовлетворяют условиям a), 0), j). Теперь мы можем доказать следующую важную теорему: Теорема 1,3,2. Пусть гамильтониан H(t,x,s) удовлетворяет предполооїсєпию 1,2,1. Если функции ір1, ір2 Є C(Rn, А), числа А1, А2 Є А, и, кроме того, функции Vl(t,x) и V2(i,x) являются минимаксными решениями задачи Коши (1.1.1), отвечающим краевым условиям, определяемым функцияліи (р и v?2 соответственно, тогда функция V(t,x) = min{A1 + Vl((,x), A2 + V2(t,x)} является минимаксным решением задачи Коши (1.1.1), отвечающим краевым условиям с (р(х) - min{A1 + p1(x)l\2-i-ip2(x)}. Доказательство. Нетрудно видеть, что достаточно рассмотреть лишь случай, когда А1 = А2 = 0. Пусть отображения F\j(t,x,q),Fn(t,х,р) определены формулой (1.3.4). Мы покажем, что функция V(t,x) = minfV ff.a;), V2(t,x)} удовлетворяет определениям 1.2.1 и 1.2.2. Очевидно, что V(t,x) удовлетворяет указанному краевому условию. Проверим неравенство (1.2.2). Так как функции V (t, х) удовлетворяют (1.2.2), тогда для всех (t0)x0) Є G, т) Є (to,T]t q є Q, і — 1,2 Найдется число г о такое, что V(totXo) = Vio(ta,xo) и V(t,x) V" (t,x) для всех ((,а;) Є clG. Следовательно, Покажем, что V(t, х) является нижним решением. Из неравенства (1.2.3) ми имеем, что для всех (іоі о) Є G, г? Є (to,T), (u,v) Є В, і = 1,2 Но включение ї( ) Є Xu(to,x0,Q,v,,v) эквивалентно системе обыкновенных дифференциальных уравнений имеющей единственное решение. Далее, V(t7, х(тЭ)) = F,0(i?, х(&)) для некоторого числа г о. Тогда Замечание 1.3.3. Полезно переформулировать доказательства п терминах слабой инвариантности над- и подграфиков по отношению к характеристическим дифференциальным включениям. Нетрудно видеть, что совокупность слабо инвариантных множеств замкнута относительно операции объединения Так как epi(min{l/1, V2}) = ері Vі UepiF2, то минимум двух произвольных верхних решений задачи (1.1.1) также является верхним решением той же задачи Коши. Далее, hypo(min{K!, У2}) = hypo Vі Л hypo V2. В общем случае пересечение двух множеств, слабо инвариантных по отношению к некоторому дифференциальному включению, не является слабо инвариантным по отношению к этому включению. Достаточным условием замкнутости совокупности слабо инвариантных множеств относительно операции пересечения (а значит, для того, чтобы минимум двух нижних решений был нижним решением) является единственность решения соответствующего дифференциального включения при фиксированных начальных данных. Именно поэтому так важно, чтобы отображение Fn(t,x,p) было однозначным. Замечание 1.3.4. Из теоремы 1.3.2 вытекает, что поточечный минимум любых двух минимаксных решения также есть минимаксное решение. В следующем разделе мы покажем, что нижнее замыкание поточечного ннфимума по произвольному семейству минимаксных решений является минимаксным решением (здесь по определению нижним замыканием функции ф называется наибольшая полунепрерывная снизу функция ф такая, что ф ф). Дадим по аналогии с [8, с. 81] следующую интерпретацию линейным опера с гамильтонианом H (t,s) — H(t,—s) сопряженной к задаче Коши (1.4.1). Очевидно, гамильтониан HM(tis) удовлетворяет предположению 1.4.1, таким образом, для всех t [О, Т] оператор Щ является сужением эволюционного оператора Щ задачи (1.5.2) па пространство С(Жп,А). Лемма 1.6.1. Если р Є LSC(B.n, Л), тогда существует неубывающая последовательность конечнозначных непрерывных функций pk Є C(R",R), сходящаяся при к — со поточечно к функции (р. Доказательство. Введем в рассмотрение неубывающую числовую последователыюсть at = тіп[тт{(р(х) \ х Є -0І(О)},О], І = 1,2,— Определим следующую функцию: Нетрудно видеть, функция (г) неубывающая и непрерывная по г, кроме того, неравенство С{ЦЇ) р(х) выполнено для всех х Є R". Рассмотрим произвольную МОНОТОННО любое і = 1,2, Рассмотрим для произвольной точ ки х Є ВІ(0) непрерывную функцию Эта функция совпадает с так называемой оболочкой Моро (см. [23, определение 1.22]) полунепрерывной снизу функции ip(x) + S(x ВІ(0)). Здесь по определению { +0О, xC для множества С С Кп. Из теоремы 1.25 в [23] следует, что для любой точки х В»(0) последовательность i/ ijtx) неубывает по j и стремится при j Чоо к р(х). Пусть btij = max{ jj(x) — аі+і \ і — 1 [х[ г} 0 и { тах[ (я),С(х)1, х Є Д-і(0), тах[ (х) - tij - ([x - t + 1),C(N)], x Є B,(0)\ft_i(0), (i), i?i(0). Нетрудно доказать, что ij( ) Є C?(Rn,R), кроме того, ,-j-(x) (р(х) для любой точки х Є Ж", t,j(x) —J- (х) при j - со для всех х Є Bj-i(0). Перенумеровывая это счетное множество непрерывных функций и обозначая через tpk поточечный максимум первых к членов упорядоченно последовательности, состоящей из функций ipij, мы получаем требуемую последовательность щ, Ar = 1,2,... Лемма 1.6.2. Если выполнено предположение 1.2.1, тогда функция #(t,x,s, г), определенная о (1.3.1), вогнута и положительно однородна по (s, г) Є К" xR для есех (t,x) Є G. Кроме того, H(t,x, s,r) непрерывна по совокупности переменных па G х Е" х R и липшицсва по (s, г) Є Е" х Е для всех (, х) Є G, то есть для любых (t,x) G G,($ ,r ), (s",r") ЄЕ" хЕ выполнено неравенство Доказательство. Функция H(t} x, s, г) положительно однородна по своему определению. Следовательно, для того, чтобы показать, что H{t,x,s,r) вогнута по (5, г) Є Жп х R, достаточно доказать, что она полуаддитивна по {$, г), то есть для всех (s .r ), (s", г") Є R" х R выполнено неравенство шшлиотккл Рассмотрим следующие случаи: Из пункта г) предположения 1.2.1 и положительной однородности Я вытекает, что H(t,x,s,r) непрерывна по (s,r) S R" х R и, кроме того, в рассматриваемом случае выполнено неравенство (1.6.1). Функция H(ttx,$,r) полуаддитивна для г 0 и, значит, также и для г 0 вследствие непрерывности Я. Значит, функция Ho(t,xts) = H(t,x, 5,0) полуаддитивна и липшицева по s Є En. 2) r\r" 0. В этом случае из полуаддитивности Ho(t,x,s) по s вытекает, что Из липшицевости #о(, х, $) 3) r 0, r" 0. Сначала пусть г + г" 0. Так как функция H(t,x, $, г) липши цева для г 0, то Из полуаддитивности H(t,x,s,r) Из последних двух неравенств следует, что Теперь пусть г 4- г" 0. Из лнпшицевости /7(,х, 5, г) для г 0 вытекает, что функция Ho(t,xts) полуаддитивна, то Из последних двух неравенств следует, что Проверим неравенство {1.6.1). Из лнпшицевости H(t,x,s,r) мы получаем, что Следовательно, справедлива следующая цепочка неравенств: Функция H[t, x,s, г) непрерывна по совокупности переменных вследствие теоре мы 10.7 из [59]. Лемма 1.0.3. Функция f(ttx,u,v), определенная посредством (1.3.3), непрерывна по (t, х) G для всех (и, v) Є В. Кроме того, Доказательство. Случай, когда (и, v) = О, очевиден, пусть О Ф (и1 v) Є В. Так как О Є P0(tlx),TOf(t}x,utv) 0 —со. Для а 0, а(и, v) Є Po(t,x), из включения V(t,x) С j2LK(x) B вытекает, что a(u,v)+p(t,x) Є \/2LK(х)-В, следовательно, a(]u[2 +v2)1 2 - (р((,х)2 + ((, х))1 2 у/2Ьл(х). Значит, (t,x,u)V) со. Далее, супремум в (1.3.3) достигается, т.к. PQ(t,x) есть непустое компактное множество для всех (t,x) Є c\G. Зафиксируем произвольную точку (ta,xo) Є c\G и число є 0. Тогда из непрерывности Po(t, х) следует, что существует число 6 0, такое что нз \\х — XQ\\2 + (t — to)2 5 вытекает, что расстояние между точками 7(f, х, utv)(u,v) Є Po(t,x) и 7((o,Xo,«, t )(u,v) Є PofabSo) меньше г. Следовательно, функция -y(t,x,u,v) непрерывна. Докажем (1.6.2). Обозначим левую часть (1.6.2) через QQ(t,x). Очевидно, что О Q(t,x). Зафиксируем точку (u,v) Є В. Тогда из неравенств -y(t}xtu,v) О и ju2 + v2 1 следует, что 7( .э?1 w,v)(ju2 + v2y 2(u,v) Є Po(t,x). Значит, Q(t,x)Cp0(t,x). Пусть (/, g) є Pa{t,x). Если (f,g) = 0, то {f,g) Є (f,x). Если (f,g) ф 0, тогда (М) = (f,9)/(\\f\\2 + 92)t/2 Є Я. Следовательно, t{t,x,k,l) (№ + ?г)І/2 0. Легко видеть, что 7(f (x, Aw, Аг) = 7(f, r, w, z)/X для любой точки (w, :)єЕ"хЕ и любого числа А 0. Рассмотрим точку (и,г») = {ftg)li{t,x,k,l). Во-первых, (и, v) Є В, так как (j w[2 + и2)1/2 = (Ц/3 + g2)i/2/"f{t, г, , 0 1- Во-вторых, следовательно, 7((, 1 и. v)(uj2-l-v2)1/2(u,t;) = (/,#) Отсюда Po(t,x) С Q(f,x) и, наконец, В этом разделе, основываясь на дифференциально-геометрических методах, приведенных в [48], мы получим вспомогательный результат, связанный с полной размерностью области достижимости каскадной управляемой системы, т.е. с тем свойством, что внутренние точки области достижимости составляют ее всюду плотное подмножество. Таким образом, Л" гЛі] представляет из себя область достижимости системы (2Л.1) для управлении, близких к управлению w{t). Справедлива следующая Лемма 2.3.1. Предположим, задана произвольная точка (/о») [0,Х] х К, число 6 0 и некоторое гладкое управление w : [tQ,T] —ї Rrt_1. Тогда для всех моментов времени t Є (to,T\ множество int LJttto x) непусто, причем Доказательство. Будем пользоваться результатами из [48], а именно, теоремой 1.8.10. Для этого сначала модифицируем систему (2.1.1). Пусть хп+\ = t, т.е. добавим к системе (2.1.1) уравнение хп+1 = 1. Обозначим х = (#!,... ,xn,xn+i) . Введем в рассмотрение следующие функции: таком случае область достижимости управляемой системы x(t) — f(x(t)) + G(x(t))u(t) из точки х = (xJ,...,x,fo) при ограничении и(()[ 5, в точности совпадает с множеством Л ,Л(] х {t}. Пусть / (х) = д1(х). Тогда для j = 2,3,... п — 1 положим т.е. векторное поле /г;(х) равно скобке Ли гладких векторных полей Л)-1(х) и у {х). Очевидно, Тогда очевидно, что наименьшим распределением, содержащим поля д ,...д и инвариантным относительно этого же семейства полей, будет распределение, порожденное полями Л1, Л2,..., /і"-1, а также дп 1, т.е. Р{х) = Е"х {0} (подробнее см. [48, раздел 1.8]). Таким образом, dimP(x) = п для любой точки х Є R"+1, т.е. распределение Р невырождено. Невырожденным является и распределение Я(х) = Р{х) + Пп{/(х)}, т.к. R{x) = Ym{h\x) ...,hn-l{x), jn-\x)J{x)} = R"+1 и &m\R(x) = n + 1 для всех точек х Rn+1. Из невырожденности распределений Р(х) и R(x) по теореме 1.8.10 из [48] для любого 5 0 существует такое число tt б (о,Т), что для любых t Є (to,tt] множество L,\{t,tQ,x) имеет непустую внутренность. Но так как разрешающий оператор Rt,tt системы обыкновенных дифференциальных уравнений ставящий в соответствие любой точке х значение, которое принимает решение этой системы с начальным условием x(te) = х в момент времени t Є (tstT], является гомеоморфизмом, то множество Л ,,[і] имеет непустую внутренность для всех t Є [to,T]. Кроме того, непосредственно из определения XL Л(] вытекает, что intA(.j[t] С intA (-,I ] для любого числа а Є (0,6) и d(x(t)/mtX lty -» 0 при а — 0. Следовательно, d(i(),mt Y ,J(]) = 0. В этом разделе мы уточним приведенные в разделе 2.2 свойства для управляемой системы (2.1.1) в случае, когда множество V есть эллипсоид (0,Р), где Р Є К "-1)4 1), Р = Р 0. Мы покажем здесь, что справедливо включение dX(t,to,x) С r(t,to,x) и что граница области достижимости состоит с точностью до операции замыкания из точек, получаемых из принципа максимума Понтрягина при неособых режимах управления, что дает основу для численной схемы. Пусть г(и) = — (1 — (и, Р и))1!2. Очевидно, что эта функция сильно выпукла на множестве V. Гамильтониан системы (2.1.1) и его возмущение есть соответственно tfA(x,s) = -(( , ЗДРС (я)з) + А2)1/2 для матричной функции G(x), определенной п предыдущем разделе. Выпишем для данного случая гамильтоиовы системы (2.2.G) и (2.2.17) с гамильтонианами #А(х, s) и #(х, $) : Здесь Єї = (1,0, ...,0), e2 = (0,1,.. .,0),..., e„ = (0,0,... ,1). Справедлива следующая Лемма 2.4.1. Для любой точки (to, х) [0, Т]хШ.п и любого момента времени t {toiT] множество intX(t, to, х) непустое, причем Доказательство, Зафиксируем произвольную точку s R". Из вида гамильтониана Hx(x,s) и соответствующей ему системы (2.2.G) вытекает, что является гладкой функцией своих аргументов. Определим при t Є [ о Т] гладкое управление w\t] = w(t,t0 x,sa) = u (xA(t,f0,a:0»s0),sA(t)fo,x0,s0))1 порождающее в управляемой системе (2.1.1) траекторию xx[t] = xA(f,fot:c0ts0)- Ясно, что Рассмотрим теперь систему (2.2.17) с гамильтонианом H(x,s), отвечающую принципу максимума Понтрягина. Ее решение определено п том и только в том случае, если H(x,s) Ф 0. Но для этого достаточно, т.к. значение функции Н{х, s) постоянно вдоль всех траекторий этой гамильтоновой системы, чтобы #(x,s) ф 0. Следовательно, если 5 kerG (xa), то принцип максимума даст в этом случае единственную траекторию, причем, как и в доказательстве теоремы 2.2.3, x\(t,ta,x0,$0/fi) - x(t,ta x0,$) при fi - 0. Если же s є kerG (x), то имеет место случай особого режима, о котором принцип максимума Понтрягина не дает никакой информации, кроме той, что H(x(t),s(t)) = 0 для t Є [to,T]. Далее будем рассматривать случай общего положения для начальной позиции {to,x0}. А именно, предположим, что? Ф Одля всех = 1,2,,..,л — 3. Тогда включение s kerG (x0) эквивалентно тому, что $1 = 0 при г = 1,2,... ,п — 2 и sn-i хп-2 + $п — 0- Так как s ф 0, то случай, когда $"_[ = 0, невозможен. Следовательно, особый режим может возникать только когда s_x ф 0. Т.к. В этом разделе мы построим при помощи Г(, to, х) точную область достижимости для системы (3.1.1), а также решим задачу о быстродействии перехода из одного состояния (3.1.1) D другое. Итак, пусть далее везде в этом разделе отображение z[t] = x(t,to,x,aQ) определено посредством формул (3.2.2) и (3.2.3) для $ — а0, где Яд и \ заменены на Н и соответственно. Мы покажем, что dX(t,to,x) равно множеству точек x(t,to,x,aa), где ст Є 5 и \аг1 — 2тг/(4тг2 ч- det P (t — to)2)1 2- Последнее неравенство эквивалентно неравенству ! 2тг. Кроме того, мы установим, что dX(t,to,x) есть замкнутая неса-мопересекающаяся поверхность с двумя особенностями при і,г = ±2т, причем прообраз любой точки плоскости {х%,Хг) при проектировании па эту плоскость множества OX\t\ состоит из не более, чем двух точек. Таким образом, множество dfV(t, to,x) гомеоморфію сфере в R3. Пусть Я(х,7) ф 0. Изучим сначала проекции x(t, 10,х,а0) на плоскость (д;!, Хз)- Обозначим Ах[t] = (xi[t] — xj, х3[(] — х) . Нетрудно видеть, что где D() = 2(1 — cos())/2. Здесь по непрерывности мы полагаем, что D(0) = 1. Лемма 3.3.1. Функция D(0 четная, принимает значения из отрезка [0,1], строго возрастает от 0 до 1 при Є [—2тг, 0] и строго убывает от \ до 0 при f Є[0,2тг]. Доказательство. Функция () является неотрицательной, причем наименьши ми по модулю корнями этой функции являются i,2 = ±2тг. Далее, D (Q) = 0и (0 = ( sin(0 - 2(1 - cos(f)))/3 при f Є (0, 2тг], откуда (2тг) = 0. Покажем, что () 0 для всех (0, 2х). Для этого достаточно показать, что функция 7) s n()/U " cs(0) строго убывает при 6 (0,2л-), т.к. 7(0) = 2. В самом деле, У() = (sin() — )/(1 — cos()) 0. Лемма доказана. Замечание 3.3.1. Из Рис. 3.2 видно, что точки x{t,t(,,xtff) проектируются в разные точки плоскости (хі,гз) при разных по абсолютной величине значениях f Є [-2тг, 2тг]. Кроме того, и из Рис. 3.2, и из (3.3.1) видно, что для заданного при соответствующих значениях а0 Є S получающаяся из х{1 ц,хй,ай) линия проектируется в эллипсоид. Замечание 3.3.2. Из леммы 3.3.1 вытекает, что множество точек x(t, to,xa,o) при а0 Є 5 и Є [-2тг, 2тг] образует замкнутую поверхность дЩі] = dl(t,to,x) (вообще говоря, самопересекающуюся), так как для i,2 = ±2л- из системы (3.2.3) вытекает, что Xi[t] = xf, Хг[і] = xjj =F y/debP (t — IQ)2/{A-K) И ХЗ[(] = x (см. также Рис. 3.2). Предложение 3.3.1, Поверхность dQ[t] при t t0 пе является самопересекающейся. Прообраз любой точки плоскости (хі,хз) при проектировании на эту плоскость поверхности 0Cl[t] состоит не более, чем из двух точек, а значит, поверхность dl[t\ гомеоморфна сфере в R3. Доказательство. Рассмотрим произвольную точку х1 Є R3 и найдем момент времени t to и точку а0 Є 5 такие, что [-2л-, 2т] и х((,(0, 0. 0) = хх- Обозначим Дх = х1 — х и Дх = (Дії, Дхз). Предположим сначала, что Дх = 0. Из равенства (3.3.1), леммы 3.3.1, формул, которые приведены в конце замечания 3.3.2, и определения следует, что = -27rsign(Ax3), t = t0 + (4n\Ax2\/VdetPy/2, а\ = /(47г2 + 4л- /detЯ-1Даг2І)1/2, а на а\ и о\ наложено лишь одно ограничение, что (о )2 + (o Xy-i-7)2 = 1 — ( г)2 Теперь пусть Дх ф 0. Тогда из леммы 3.3.1 с необходимостью 2я\ Далее мы покажем, что в этом случае и момент времени t, и точка ст 5 определяются соотношениями x(ttto,x,a) = х1 и Є (—2тг,2л") единственным образом. Отсюда будет следовать то, что поверхность dQ[t] при ( to не пересекает сама себя. Таким образом, из леммы 3.3.1 будут вытекать и остальные утверждения доказываемого предложения. Покажем, что искомая точка а0 Є 5 однозначно определяется значением Є (-271-,2711). для которого выполнено (Дх,Р-1Дх) = D()(t — t0)2. Во-первых, определим т- Так как точка ст Є S, то #(х, 7) = (1 - {о )2)112-, откуда о\ = /(2 + detP (/ — to)2)1?2. Разрешим первое и третье уравнение системы (3.2.2) пли (3.2.3), в зависимости от того, равно ли нулю а\ или нет. Пусть 5 0, откуда а\ ф 0. Тогда из (3.2.3) Относительно переменных а\ и а\х\ + о% система (3.3.2) является линейной системой алгебраических уравнений с матрицей, определитель которой равен 2(1 - COS())/(CT2)2, т.е. не равен нулю при 0 [] 2к. Если же мы имеем случай, Таким образом, при соотношениях x t tcx0, ) = х\, Xi(t,to,xto) = 3 и (3.3,1) искомая точка ст есть функция { и . Чтобы достигнуть точки х1, необходимо добиться выполнения соотношения X2(t7to,x,a0) = х\. Найдем соответствующий момент времени t и значение параметра Є (—2тг, 2тг). Подставляя точку ег, полученную при ф 0 из системы (3.3.2), а для = О равную ( 7i,0, 7j) , где (ег?,сг) = —Р_1Дх/(і — о), во второе равенство (3.2.2) и (3.2.3) соответственно, осуществляя несложные преобразования, получим следующее уравнение: (3.3.4) Здесь /{/о} означает индикатор множества { 0}, то есть мы тем самым подразумеваем, что при — 0 третье слагаемое в левой части уравнения (3.3.4) отсутствует. Из (3.3.1) вытекает, что t — (0 = ((Дх,Р-1Дх)/Г?() . Значит,Обобщенная линейность уравнения Гамильтона-Якоби
Эквивалентность минимаксных и обобщенных слабых решений
Топологические свойства области достижимости каскадной управляемой системы
Точная область достижимости для трехмерной каскадной управляемой системы и задача о быстродействии
Похожие диссертации на Методы гамильтонова формализма в задачах нелинейного синтеза управлений