Содержание к диссертации
Введение
1. Приведение систем к нормальной форме 11
2. Классификация нормальных форм класса С3 26
2.1. Критерий существования синтеза 27
2.2. Вспомогательные утверждения 30
2.3. Лемма о гиперболической точке 35
2.4. Особые режимы 44
2.5. Некоторые свойства системы. 54
2.5.1. Поведение системой 57
2.5.2. Производная отображения Пуанкаре 60
2.5.3. Поведение системы при и = 1 68
2.6. Случай ф 72
2.7. Случай ф Є 78
2.7.1. Построение отображения Пуанкаре 79
2.7.2. Производные отображения Пуанкаре 82
2.7.3. Определяющий существование синтеза цикл 86
2.7.4. Связь между функцией ф и интегралом 89
2.7.5. Построение оптимального синтеза 98
3. Аналитические нормальные формы 103
3.1. Предварительное исследование 103
3.2. Синтез с особым режимом 108
3.3. Синтез со спиралевидной структурой 115
3.4. Синтез с кривой дисперсии 124
4. Результаты 149
Литература 153
- Критерий существования синтеза
- Производная отображения Пуанкаре
- Определяющий существование синтеза цикл
- Синтез со спиралевидной структурой
Введение к работе
Данная работа относится к области оптимального управления. Предметом исследования являются аффинные по скалярному управлению системы х = f(x) -\- ид{х) на плоскости. Здесь и меняется в интервале [0,1], а / обладает особой точкой типа фокуса или центра. Функционал цены ква-дратический с точностью до членов более высокого порядка. Рассмотрена группа симметрии, ассоциированная с этим классом систем, найдены канонические формы и проведена классификация этих форм.
Вместо того, чтобы исследовать отдельные объекты, в математике часто целесообразнее рассматривать целые классы объектов. Эта точка зрения оправдана существованием групп преобразований, которые переводят разные объекты друг в друга и устанавливают между ними соотношение эквивалентности. Таким образом, идентифицировав в каждой орбите группы преобразований канонического представителя наиболее простого вида, и исследовав эти конкретные объекты, мы получим информацию и о всех других объектах соответствующих орбит. Нахождение и классификация канонических представителей представляет собой одну из наиболее часто встречающихся в математике проблем.
В теории оптимального управления группой преобразований служит группа feedback. В узком смысле термин feedback group зарезервирован для систем, в которых управление может принимать любые значения в вещественном векторном пространстве Шп. В зависимости от поставленной задачи, однако, рассматриваются и различные подходящие подгруппы группы feedback. Нахождение канонических систем по отношению к группе feedback и их классификация является самостоятельной задачей, которой посвящено много работ.
В 1970 году П. Бруновский [23] расклассифицировал линейные системы по действию группы feedback и ввёл соответствующую каноническую форму, форму Бруновского. Впоследствие классификации линейных систем были посвящены работы многих авторов (см. например [21],[22],[24],[36],[43], [55],[57],[61],[62],[74],[76]). В этих работах эта проблема была сведена к чи- сто алгебраической конечномерной задаче.
В задаче классификации нелинейных систем группа feedback бесконечномерная, что существенно усложняет ситуацию (см. например [19],[26],[30], [60],[71] и обзор [40]). Смежным вопросом является стабилизация точек равновесия посредством динамического управления (см. например обзор [68]). Особый интерес здесь представляет нахождение орбит линейных систем, т.е. характеризация нелинейных систем, которые могут быть переведены в линейную преобразованием из группы feedback. Для таких систем тогда можно применить аппарат, разработанный для линейного случая. Характе-ризации линеаризуемости посвящены, например, работы [52],[69],[72]. Локальное условие линеаризуемости сводится к бесконечному набору условий на скобки Ли входящих в правую часть системы векторных полей.
Чтобы не рассматривать бесконечный набор условий, было введено понятие приближённой группы feedback, переводящую системы друг в друга с точностью до членов порядка выше некоторого значения. Условия эквивалентности систем по отношению к приближённой группе feedback были найдены А. Кренером (см. например [49],[50]). Это конечный набор условий на джеты того порядка, который соответствует порядку приближённой группы feedback. Статья [51] представляет обзор по линеазизации и приближённым группам feedback.
Действие приближённой группы на джеты исследовал К. Чон (см. например серию работ [70]-[72]). Он показал, что оно сводится к действию конечномерной группы Ли. В. Канг и А. Кренер исследовали нормальные формы по отношению к действию на джеты второго порядка [44],[53].
Пусть множество допустимых управлений является полиэдром. Тогда множество допустимых фазовых скоростей является выпуклой оболочкой конечного множества векторных полей. Поэтому действие подгруппы группы feedback, сохраняющая множество допустимых управлений, сводится к действию группы диффеоморфизмов на семейства векторных полей. Этот предмет был подробно изучен многими авторами. В этой связи вспоминается серия работ Р.И. Богданова (см. [4]-[6],[17]), где было изучено действие групп диффеоморфизмов различной степени гладкости на векторное поле на плоскости. Подробную классификацию пар векторных полей на плоскости провёл А.А. Давыдов в монографии [25]. Там же рассмотрен и случай более, чем двух, полей. Тесно связанной с вопросами классификации множеств векторных полей является проблема классификации распределений. Этому вопросу посвящена, например, работа [79]. Дальнейшие результаты по классификации особых точек на плоскости и в трёхмерном пространстве см. например [9],[10],[28],[73].
Классификации различных классов систем оптимального управления на плоскости были проведены многими авторами. М.М. Байтман [3] исследовал двумерные системы с функционалом быстродействия. А. Брессан и Б. Пикколи недавно провели полную классификацию таких систем в окрестности особой точки дрейфогого поля по отношению к топологической эквивалентности возникающих оптимальных синтезов [20]. Б. Якуб-цик и В. Респондек провели классификацию двумерных систем с неограниченным управлением по отношению к группе feedback и слабой группе feedback, которая помимо диффеоморфизмов фазового пространства и преобразований feedback включает ещё гладкое изменение масштаба времени [41],[42].
Стандартный метод решения задач оптимального управления состоит в применении принципа максимума Понтрягина [15]. Он приводит к гамиль-тоновым системам с разрывной правой частью. Нахождение оптимального управления сводится к нахождению лагранжевых сечений в расширенном фазовом пространстве этих гамильтоновых систем. Пусть Н = Н(и,х,ф) — функция Понтрягина, зависящая от одномерного управления и Є Ы С R. Уравнения Гамильтона имеют вид дф^ дх'
Здесь х — совокупность переменных фазового пространства X, ф — сопряжённые переменные, параметризующие слой в кокасательном расслоении Т*Х. Принцип максимума определяет управление и следующим образом: и(х,ф) = argmaxu(EZ/#(u, ,?/<).
Может случится, что максимум функции Н по и достигается больше, чем в одной точке множества U. Тогда принцип максимума не определяет управления и однозначно.
В задачах, аффинных по управлению, функция Гамильтона зависит аф-финно от и: Н(и,х,ф) = Щ(х,ф) + иН\(х,ф). Часто возникает ситуация, когда Н\ = 0 на некоторой траектории в течение некоторого интервала времени. Соответственные траектории называются особыми и являются самостоятельным предметом исследования. В частности, интерес представляет стыковка неособых траекторий с особыми. Глобальным порядком особого режима называется такое натуральное число д, при котором в окрестности особого режима имеют место соотношения
Теорема Кэлли [46] гласит, что особая траектория чётного глобального порядка не может стыковаться с неособой траекторией, если точка переключения изолирована. Тем не менее, неособая траектория может выходить на особый режим чётного глобального порядка, если точка стыковки является точкой накопления переключений управления. Этот феномен известен под названием четтеринга. Простейшим примером возникновения четтеринга является задача Фуллера, исследованная впервые в 60-х годах (см. например [29],[32],[75] и содержащиеся там ссылки). Теория четтерни-га развита М.И. Зеликиным и В.Ф. Борисовым в монографии [78].
Теорема Кэлли применима только в том случае, если реализованное на особом режиме управление и лежит во внутренности множества допустимых управлений Ы. В данной работе исследуется синтез в окрестности особого режима, управление на котором лежит на границе множества U.
Мы рассмотрим аффинные по управлению системы дифференциальных уравнений следующего вида на плоскости. Минимизируется интегральный функционал J= (F(x)+uG(x))dt -> min (0.1) по траекториям системы х = А{х) + В(х)щ х Є U С R2, и Є [0,1], lim x(t) = х. (0.2)
Терминальным многообразием служит фиксированная точка х Е R2. Окре стность U точки х является односвязной. Предполагается, что управление u(t) — измеримая функция от времени t. А, В — векторные поля, a F,G— скалярные функции. Мы исследуем случай, когда эти величины при надлежат классу и случай Сш. Поле А имеет в точке х особенность типа фокуса или центра: якобиан (#) имеет комплексно-сопряжённые собственные значения и А(х) = 0. Поле В в окрестности U невырожде но. Главным членом в разложении Тейлора функции F в точке х является квадратичная форма, т.е. сама функция F и её градиент в х исчезают. Функция G также исчезает в х. Допустимые траектории х (t) не выходят за пределы окрестности U.
Такие системы возникают, например, в популяционной динамике систем хищник-жертва, где управлением служит интенсивность отлова одного из видов. Невозмущённой системой в этом случае является система Вольтерра-Лоттка. Системы в окрестности особой точки типа фокуса с интегральными функционалами специального вида рассматривались, например, в работах [11],[54]. В [11] исследовался математический маятник, который требуется привести в состояние покоя приложением односторонней ограниченной силы с минимальным средне-квадратическим отклонением. В этой работе также исследовались управляемые системы Вольтерра-Лоттка. В работе [54] тоже рассматривались системы популяционной динамики, но функционал при этом зависел от времени. Мы здесь рассматриваем общий случай автономной системы.
В разделе 2.3 данной работы доказано утверждение о структуре диффеоморфизма в окрестности гиперболической неподвижной точки, которое представляет самостоятельный интерес.
В литературе описаны три разных подхода к этой задаче. История исследования гиперболических точек диффеоморфизмов и динамических систем восходит к Пуанкаре. Он нашёл достаточные условия на собственные значения линейной части аналитической системы ОДУ, чтобы она была линеаризуемой в некоторой окрестности особой точки [59]. Идея Пуанкаре состояла в том, чтобы вычислить коэффициенты ряда Тейлора осуществляющего эквивалентность диффеоморфизма фазового пространства исходя из разложения векторного поля нелинейной системы вокруг особой точки. Накладываемые условия на собственные значения при этом гарантируют сходимость. В качестве частного случая вытекает, что двумерная аналитическая система ОДУ в окрестности гиперболической особой точки (т.е. седла) имеет устойчивый и неустойчивый усы, задающиеся аналитическими функциями.
В начале века Адамар предложил иной подход [33]. Он рассматривал устойчивый и неустойчивый усы как графики функций, неподвижных относительно трансформации графиков, индуцированной исследуемым диффеоморфизмом в окрестности неподвижной гиперболической точки. Оказалось, что в подходящем пространстве функций эта трансформация является сжимающей, что позволяет применить теорему Банаха о неподвижной точке (разумеется, в то время, когда вышла публикация Адамара, теоремы Банаха в нынешней формулировке ещё не существовало). С одной стороны, подход Адамара позволил доказать существование инвариантных подмногообразий также для диффеоморфизмов конечной гладкости. С другой стороны он гарантировал только липшицевость этих многообразий. Хотя Адамар рассматривал только двумерные системы, его подход легко обобо-щается на системы в R".
Третий подход был предложен О. Перроном, который построил интегрально-функциональное уравнение для функций, задающих инвариантные усы [58].
В 30-х годах И.Г. Петровский показал, что если правая часть системы непрерывно дифференцируема, то инвариантные многообразия в окрестности гиперболической точки также непрерывно дифференцируемы [13].
В 50-х годах Ш. Штернберг [66] доказал существование инвариантных усов для гомеоморфизмов на плоскости, дифференцируемых только в гиперболической точке и удовлетворяющих определённому условию Липшица. В случае диффеоморфизма он доказал, что инвариантные усы имеют ту же гладкость, что и сам диффеоморфизм. При этом для доказательства существования инвариантных многообразий использовался метод Адамара, а для доказательства гладкости — метод Пуанкаре. В дальнейшем Штернберг обобщил результаты Пуанкаре на случай конечной гладкости, при этом степень гладкости зависела от собственных значений линейной части системы (см. [64]-[67]). Далее он разработал метод, с помощью которого случай системы ОДУ сводился к случаю диффеоморфизма [65].
Около I960 года Д.М. Гробман и П. Хартман ([7],[8],[34]) независимо друг от друга доказали, что для системы класса С2 в окрестности гиперболической неподвижной точки существует гомеоморфизм, линеаризующий систему. Позже Хартман доказал это утверждение также для систем класса С1 (см. [35]). Заметим, что из существования инвариантных многообразий гладкости Ск не следует существование линеаризующего диффеоморфизма гладкости Ск. Так, Хартман в своей работе [34] привёл пример аналитической нелинейной системы в R3, для которой не существует даже диффеоморфизма класса С1, переводящего её в линейную систему.
Позже были найдены аналогичные результаты для бесконечномерных пространств (см. например [37],[38],[39],[56],[63]), и развиты дальше результаты для конечномерных пространств (см. например [16],[31],[47],[48]).
В разделе 2.3 данной работы исследованы гомеоморфизмы на плоскости, происходящие от системы ОДУ с асмптотикой х = 0(\х\ In |х|), следовательно, не имеющие производных в неподвижной точке. Показано, что при условиях, в некотором смысле утверждающих гиперболичность неподвижной точки, инвариантные усы существуют и имеют степень гладкости, совпадающую со степенью гладкости гомеоморфизма в проколотой окрестности неподвижной точки. Для этого использовался метод Адамара. Показано также, что если гомеоморфизм некоторым (негладким) преобразованием координат можно перевести в аналитическое отображение, то инвариантные усы в исходной системе координат задаются аналитическими функциями. Для этого использовался метод Пуанкаре.
В данной работе мы покажем, что решением задачи (0.1),(0.2) в случае общего положения функций A,B,F,G является решение одного из нижеследующих трёх типов:
I.тип: Оптимальный синтез в окрестности точки х существует и имеет следующий вид. Имеются кривая переключения с 1 на 0 и особый режим, стыкующиеся в х. Существует в точности одна траектория, которая за конечное время попадает в х. Остальные траектории за конечное время попадают на особый режим, а по нему асимптотически достигают х.
П.тип: Оптимальный синтез в окрестности точки х существует и имеет следующий вид. Имеются две кривые переключения, с 0 на 1 и наоборот, которые стыкуются в точке х. Траектории оборачиваются вокруг х бесконечное количество раз, пересекая попеременно эти кривые и при каждом обороте приближаясь к ж со скоростью геометрической прогрессии. Моменты переключения управления накапливаются к бесконечности.
Ш.тип: Оптимального синтеза не существует. Существует последовательность допустимых траекторий, на которых значения функционала J стремятся к — оо. Это возможно, потому что интеграл (0.1) берётся до +оо.
В данной работе мы не ставили себе целью дать полную классификацию синтезов для всех систем вида (0.1),(0.2). Мы ограничимся такими функциями А, В, F, G, для которых главные члены в разложении Тейлора определяют поведение системы в окрестности я, и исследуем также бифуркацию между типами I и И. Нас интересует структура синтеза оптимального управления в окрестности U точки х. Точнее, мы исследуем ростки синтезов вокруг х в зависимости от ростков функций Л, В, F, G.
Диссертация структурирована нижеследующим образом.
В первой главе найдена группа симметрии задачи и построена каноническая форма относительно этой группы. Группа включает в себя максимальную подгруппу канонических преобразований расширенного фазового пространства, сохраняющую структуру задачи. Эта подгруппа состоит из группы локальных диффеоморфизмов фазовой плоскости и из группы преобразований подинтегральной функции функционала, которую можно охарактеризовать как пространство замкнутых 1-форм на фазовой плоскости. Далее группа преобразований включает в себя изменение масштаба времени и умножение функционала на постоянную величину. Исследовано действие этой группы на линейные джеты системы, найдена каноническая форма в пространстве этих джетов и полный набор инвариантов этого действия, являющихся координатами на факторпространстве джетов.
Во второй главе исследованы канонические формы систем класса С3. На фактормногообразии джетов выделены три открытые области, объединение которых является плотным множеством. Каждая из областей при этом соответствует одному из вышеназванных типов оптимального синтеза. В параграфе 2.3 сформулированы и доказаны утверждения о существовании и гладкости инвариантных многообразий у вырожденного гомеоморфизма в окрестности неподвижной точки, имеющей в некотором смысле гиперболический характер.
В третьей главе исследована бифуркация при переходе значений инвариантов на фактормногообразии джетов из области, соответствующей типу I оптимального синтеза в область, соответствующую типу П. Точнее, проведена полная классификация аналитических систем, значения инварианотв которых лежат на границе между этими областями. При этом установлено, что возникает ещё один тип синтеза, топологически неэквивалентный типам I и II.
В последней главе ещё раз подытожены результаты в виде точно формулированных теорем.
Автор рад представившейся возможности выразить глубокую благодарность своему научному руководителю профессору М.И. Зеликину за оказанное внимание и помощь во время аспирантуры. Автор также благодарен Н.Б. Мельникову за поддержку при оформлении диссертации.
Критерий существования синтеза
Доказательство: Рассмотрим кривую 7лв и вычислим на ней главную, квадратичную часть функции F. В силу леммы 3 кривую 7л5 в окрестности х можно параметризовать переменной х . Разложим ограничение функции F на кривую 7лв в ряд Тейлора в точке х. Первая производная jj- в силу леммы 3 равна -(х) = О, так как вектор - касателен к кривой 7л5- По той же причине имеем для второй производной
Следовательно, имеем F = — Щ х\ + 0( ) на кривой 7лв- Рассмотрим функцию х = F — -Q-G. В силу соотношений (2.3) и леммы 3 имеем на кривой 7АВ: А\ = X2+ O(xl), В\ = 1 + 0( )- Следовательно, — = —Х2 + 0( 1), -1 = 0(х1) и на кривой 7лв имеем
Рассмотрим точку х на ветке 7AS и зададим в ней управление щ = — -. Если точка 5 достаточно близка к ж, то wo = —Ж2+0(#2) лежит в интервале допустимых управлений [0,1]. Тогда х\ = А\+ щВ\ = О, x i = A i 4- М0-В2 = —jj-dAB = 0 и фазовая точка с этим управлением может неограниченно долго находиться в х. Значение подынтегральной функции F + uG функционала (2.2) в точке х с управлением щ равно х- Имеем cos ф 0, и для точки ж, достаточно близкой к х, имеем F + UQG = — -х\ + 0{х\) 0. Таким образом выполнены условия леммы 1, при этом контур / вырожден в точку х. Применение леммы 1 завершает доказательство.
Предоставим некоторые вспомогательные средства из математического анализа. Пусть F : R2 Э D — R аналитическая функция, определённая в некоторой окрестности D нуля (х,у) = (0,0). Пусть F(0,0) = 0,VF(0,0) = О, г(0,0) = —с, где с 0 некоторое число. Пусть в пересечении любой окрестности нуля с правой полуплоскостью {х 0} существуют точки, в которых F 0. Утверждение 2.2. Множество точек, в которых Of- = 0, в окрестности точки (0,0) представляет собой кривую ртах, задаваемую аналитической функцией у — х(х)) пРи этом х{0) = 0. Множество точек, в которых F — 0, в правой полуплоскости представляет собой пару кривых Рв-,Рн, которые задаются функциями у = Хв{х)іУ = Хн(х)- Функции Хн,Хв аналитичны при х 0 и раскладываются в ряд по степеням л/х. При этом Хв{х) х{х) Хн(х) для всех х О. Доказательство: Существование и единственность кривой ртах следует из теоремы о неявной функции [27]. Обозначим аналитическую функцию F(x,x{x)) через Fmax. В силу условий утверждения она положительна при х 0. Проведём аналитическую замену координат в окрестности нуля. Пусть новые координаты задаются уравнениями х = х, у — у — х(х)- Имеем Следовательно, в системе координат (х ,у ) градиент функции F принимает вид Заметим, что кривая ртах переходит в ось Ох , поэтому производная 4 = тождественно равна нулю на этой оси. Отсюда следует, что в разложении Тейлора функции F в точке х в новой системе координат отсутствуют члены вида (х )ку . Таким образом, F(x ,y ) = — {y )2f\(x ,y ) + f2{x ), где /1,/2 — аналитические функции. Обратим внимание на то, что ji = Fmax и /і(0,0) = с. Таким образом, функции ХніХе задаются равенством Fmax = Проведём в правой полуплоскости {х 0} ещё одну замену координат. Пусть х — у/х ,у = у . Подставим эти соотношения в степенные ряды функций Fmax и /і, заменив х на (ж )2. В разложениях этих функций по новым координатам переменная х появляется только в чётной степени, причём старший коэффициент в разложении Fmax и нулевой коэффициент / 0,0) = с в разложении /і положительны. Поэтому корень jFmax явля-ется аналитической функцией от переменной ж , a y/J[ — аналитической функцией от ж , у . сится к верхней полуплоскости {у 0}, т.е. к функции Хв, а знак к функции Хн- Имеем - {y/Fmax =F У VTi) (0,0) = T\//i(0,0) = TVC Ф 0. Отсюда вытекает по теореме о неявной функции, что Хв и Хн, задаваемые как функции у = у (ж ), являются аналитическими. Переходя снова к системе координат (ж , у ), находим, что они задаются как степенные ряды от у/х . В исходных координатах (ж, у) к ним прибавляется ещё аналитическая функция х- Таким образом, функции ХвіХн в этих координатах также задаются степенными рядами по у/х. При х 0 замена х -Н- у/х аналитична, поэтому функции Хв(ж)3Хн(#) аналитичны при х 0. Пусть Z — векторное поле. Через Dz обозначим производную (Z, V) по направлению Z. Для дифференцируемых векторных полей У, Z обозначим скобку Ли как обычно через [У, Z] = DyZ — DzY. Обозначим через г, /? полярные координаты на фазовой плоскости, г2 = Определим следующие порядковые соотношения. Определение: Пусть DcR" — множество, /, w : D — R — отображения. Будем говорить, что величина / имеет порядок w, в обозначениях / = 9(w), если найдётся такое число с 0, что для всех точек из s Є D имеет место \f(s)\ c\w(s)\. Будем говорить также, что величина / имеет строго порядок w, в обозначениях / = O(w), если найдутся такие числа а Ь 0, что для всех s Є D имеет место aw(s) f(s) bw(s), если ги 0; aw(s) f(s) bw(s), если w 0. Координаты x\,X2 и радиус г служат малыми параметрами разложения, по отношению к которым определяются главные члены рассматриваемых функций. Утверждение 2.3. Пусть Z)cRn — окрестность нуля, / : D — R — функция класса Ск, к 0. Пусть функция f(x) имеет порядок в(\х\1), І Є N+, I к. Тогда производные Jj- на любом заданном наперёд компакте DQ С D имеют порядок 0{\х 1).
Производная отображения Пуанкаре
Уравнение (2.21) задаёт сечения М+ и М-. Покажем, что при замыкании множества Л4+ в 7 ( 7] к нему добавляется полупрямая {х = 0,ф\ = 0, 2 0}.
Границей множества {х Є U UAB{X) 0} в (7 служит прямая JAB- Поэтому предельная точка множества М.+-, не лежащая в М.+, должна принадлежать прообразу ТГ І/УАВ]- Пусть {(хп,ф(хп)) Е М.+] — последовательность точек, сходящаяся к предельной точке (х,ф) $. М.+. Тогда х Є JAB-Рассмотрим два случая. І.хфх. Имеем ф2(хп) = Bld[xBf}}Xn), где х = F - jf-G. Справедливо Ишп- ооБ Жп) ф 0, limn_ 00dyiB(a:n) = 0, и в силу соотношения (2.6) и неравенства cosф 0 справедливо Итп х п) 0. Далее, Ві{хп) 0, (ІАВ{ХП) 0, поэтому limn_ oo 02( n) = —оо. Следовательно, последовательность {(хп,ф(хп))} не сходится. 2.x = x.BU имеем в силу (2.3) Вх = 1 + 0(г), Ах = в (г), G = 0(r2), F = (БІпфхІ — соБфхІ) +9(г3). Поэтому —В\х = {{—sinфх\ + cosфxf) + #(г3). Выберем такой угол (ро, что ctg2(/?otg / 1. Это возможно, поскольку Пусть точка х Є U такая, что ctg2 /? = Ц ctg2 /?o- Тогда имеем где к — положительное число. Следовательно, в области, задающейся неравенством ctg2 ctgVo? имеем — В\х = — (г2). Пусть бесконечное число точек последовательности {(хп,ф(хп))} лежат в этой области. Тогда без ограничения общности можно считать, что вся последовательность лежит в этой области, это не меняет предел (ж, ф). Отсюда находим limnoo j = 1іт„_юо . ( ) = Hmr 0 0{r) = 0. Поэтому Если неравенство ctg2y? ctg2 o выполнено только для конечного числа точек последовательности {(хп,ф(хп))}, то без ограничения общности можно считать, что оно не выполняется ни для одной точки. В этом случае на точках хп имеем tgV = Ч tgVo следовательно, х\ — 0(х\), г2 = в(ж2), х\ = 0(г). Тогда СІАВ = х\ + #(г2) = 6(г). Для предела ф фі = limn oo i( n) = lim o Щг) = 2 = Іішп-юо г п) = Итг_ю Щг) = -Так как множество таких последовательностей непусто, точка (х = ф = 0) является предельной для множества Л4+. Покажем, что любая точка полупрямой {(х, ф) \ х = 0, ф\ = 0, -02 0} может быть предельной. Рассмотрим семейство парабол 7гс = {х \ Х\ = еж2,} на фазовой плоскости. Разложим функцию d g в ряд Тейлора в точке х. Учитывая (2.5), ИМееМ d,AB = Хі + кцх\ + 2кі2Х\Х2 + к22х\ + в{г ), ГДЄ &п, &12, 22 — вторые частные производные функции й/,в в х. Ограничивая dAB на кривую 7ГС, получаем dAB — (+ 22) 2+ ( 2)- Таким образом, для любого числа с — &22 найдётся такое є = є (с) 0, что кусочек {х \ х\ = сх\,х2 Є (0,є)} параболы 7ГС лежит в области {х \йлв(х) 0} С U. Рассмотрим функции (2.21) на этом кусочке и исследуем предел -02 = lim o 2( 2)- Имеем _ -В\х _ \{ шіфх\ +cosфх\) + 9(х\) _ cos0 Таким образом, 02 — 2(с+/ у Имеем cos ф 0, следовательно, для произвольного к 0 найдётся такое с —&22, что 2(с+/ ) = к. Поэтому точка (х = 0,-01 = 0,-02 = &) является предельной для множества М.+. Аналогично показывается, что при замыкании множества М- в [{7] к нему добавляется полупрямая {х = 0, ф\ = 0,02 0}. В силу непрерывности функций #0, #1 предельные точки множеств М+, ЛІ- принадлежат М.. Покажем, что множество Л4 состоит только из многообразий М.+, М.- и прямой {(х, ф) х = 0, ф\ = 0}. Для этого достаточно показать, что если х Є 7АВ то из (х, ф) Є Л4 следует х = 0, ф\ = 0. В случае с в = 0 столбцы матрицы коэффициентов в (2.16) коллинеар-ны вектору правой части, т.е. определитель составленной из них матрицы исчезает: AX(G + Яі) - Bi{F + Я0) = Ai(G + Щ) - BX(F - иЩ) = 0. (2.22) Подставляя Н\ = 0, получаем х — F —в — 0 как условие разрешимости системы (2.16). В силу уравнения (2.6) оно выполнено только в точке х. Подставляя G(x) = 0 и, в силу (2.3), В\(х) = 1,. (я) = 0, из второго уравнения (2.16) получаем ф\ = 0. Здесь ф2 — свободный параметр решения. Утверждение 2.8 доказано. Введём в окрестности U систему координат (xi,C), где = - . Она определена всюду, кроме оси 0x2. Зафиксируем два произвольных числа С«?С/?- Рассмотрим множество /С = {(Х\,Х2) Є U\ — j2 Є [(«,(/?]} U {х}. Если окрестность U достаточна мала, то множество /С пересекается с кривой /АВ только в точке х. При удалении точки х множество К распадается на два множества /С+ = {{х\,Х2) Є К, \х\ 0}, /С_ = {(жі, ) Є /С j жі 0}. При этом на множестве /С+ имеем (ІАВ 0, а на множестве /С_ — йдв 0. На множествах К+,1С- замена координат (х\,Х2) -н- (x\,Q взаимно-однозначна. Пусть точке х в системе координат (жі,С) соответствует отрезок {0} х [Са,С/?]. В /С переменные х\,Х2 аналитически зависят Согласно утверждению 2.8 множества /С+,ЛЗ_ обладают поднятиями на многообразия М+,М- в Т Х. На этих поднятиях уравнения (2.21) задают ф как функции от х и, после замены переменных, как функции от жі,. Утверждение 2.9. Пусть функции A, -B,F, G принадлежат классу Ck, где к 1 (классу Сы). Тогда функции (2.21) на множестве JC+ U /С_, рассматриваемые как функции от х\,(, допускают продолжение нулём на отрезок {0} X [Со; С/?] до функций класса Ck l (класса Сш). Доказательство: Представим ф в виде Переменные х являются аналитическими функциями от xi,(- Поэтому выражения в скобке как функции от переменных #i, принадлежат классу Ск (Сш), ровно как и величина d B- На множестве /С выражения в скобке имеют порядок 9(г2) = 0(х\), а &АВ имеет порядок в(жі). По лемме Адама-ра соотношение продолжается на {0} х [С , С/?] до функции класса Ск 1 (Сш), не обращающейся в нуль. Поэтому соотношение f - также продолжается до функции класса Ск 1 {Сш) по переменным #i,. Соотношение выражений в скобке и х\ по лемме Адамара тоже продолжается до функций класса Ск 1 {Си). Отсюда следует утверждение. D
Определяющий существование синтеза цикл
Правая часть уравнения (2.21) принадлежит классу С по х. Поэтому фо является класса С3 по XQ. Правая часть системы (2.43) принадлежит классу С2 по х,ф. Следовательно, по теореме о непрерывной дифференцируемости решений дифференциального уравнения от начальных данных, переменные х,ф на этих решениях дважды непрерывно дифференцируемо зависят от времени t и начальных данных хо,фо, и, таким образом, от t и XQ. ТО же справедливо для функции Н\ на этих решениях, поскольку Н\(х,ф) Є С3. Момент времени t пересечения многообразия М. задаётся уравнением H\(t,XQ) = 0. В силу условий утверждения имеем Щ (ї) = Hi(t) = j -(t) ф 0. Тогда по теореме о неявной функции t дважды непрерывно дифференцируемо по XQ. Следовательно, х(ї(хо),хо) также принадлежит классу С2 по XQ.
В этом параграфе мы исследуем гамильтоновую систему с гамильтонианом Щ + Н\, которая получается из системы (2.1),(2.17) подстановкой и = 1. Пусть р — точка на многообразии .М _, и — траектория системы (2.54), проходящая через р в момент времени t = 0, и = пх о а — её проекция на фазовую плоскость. Утверждение 2.23. Пусть при всех таких t 0, что a(t) Е U, выполняется неравенство C(a(t)) 0. Тогда траектория а при всех таких t 0, что a(t) Є U, удовлетворяет принципу максимума (2.15). Доказательство: При всех таких t 0, что a(t) Є U, на траектории а имеем d B 0. Следовательно, уравнение (2.28) не имеет особенностей при t 0, и функция H\(t) на а задаётся уравнением (2.29), в которое подставлено Яі(о) = 0, to = 0. В силу условий утверждения при t 0 имеем -(a(t)) 0. Поэтому выражение (2.29) положительно при 0, и управление и = 1 на траектории 7 оптимально в соответствии с (2.15). Исследуем траектории а системы (2.54), проходящие через точки множества /С, определённого в параграфе 2.4, в момент времени t = 0. Параметризуем их совокупность значениями переменных хіХ в точках 5"(0). Эти траектории лежат на нулевом уровне функции Щ + Н\ и параметризованы времением t. В силу теоремы о дифференцируемой зависимости решений дифференциального уравнения от начальных данных и утверждения 2.9 переменные х,ф на гиперповерхности, образованной совокупностью этих траекторий, являются функциями класса С2 от переменных i,,. Следовательно, Н\ как функция от xi,C,t на совокупности этих траекторий также принадлежит классу С2. Определим функцию Н\(х\, (, t) следующим образом: Н\ = при t ф 0 и Н\ = Н\ при t — 0. Точки т(0) лежат на многообразии М. Таким образом, Щ — 0 при t = 0, и по лемме Адамара функция Н\ принадлежит классу С1 по совокупности переменных x\,(,t. Допустим, что sin ф 0. Пусть Є [Са,С/?] произвольно. Вычислим частные производные от функции Н\ в точке (#!,,) = (0, ,0). Эта точка в системе переменных х, ір соответствует началу координат. В силу утверждения 2.10 в ней справедливо Hi = #i = 0. С учётом (2.5), (2.26) и (2.30) имеем По теореме о неявной функции справедливо следующее утверждение. Утверждение 2.24. Допустим, чтоБЇпф ф 0. Тогда в окрестности точки (х\,() = (0, С ) существует единственная функция t (xiX), "такая, что справедливо тождество Hi(xi,(,t (xi,0) = 0 wi (0,( ) = 0. Эта функция принадлежит классу С1. Её производные имеют вид Следовательно, мы можем выбрать окрестность U настолько малой, чтобы не существовало таких значений x\,(,t, что t ф t (#i,C),#i(#i,(,) = О, и точка a(t) лежит в окрестности С/", где и — проекция траектории т, соответствующей значениям х\,(. Рассмотрим произвольную точку р Є /С с координатами хі(р),((р). Обозначим траекторию системы (2.54), проходящую через поднятие точкир на К в момент времени t = О, через т, а её проекцию на фазовую плоскость — через и. Утверждение 2.25. Пусть существует такое число є О, что при всех t Є (—,0) справедливо неравенство -f-(a(t)) 0. Тогда справедливы следующие утверждения: 1. Если t (xi(p),((p)) 0, то на траектории а принцип максимума (2.15) удовлетворён при ecext 0, таких, что а [і) лежит в окрестности V. 2. Если t (x\(p) ((p)) 0, то на траектории а принцип максимума (2.15) удовлетворён при всех t Є [ ,0]. Доказательство: Пусть t ф 0. Тогда точка р не совпадает с х. Отсюда следует АВ(СГ()) ф 0 для всех t Є (—,0], и уравнение (2.28) не имеет особенностей на этом интервале. Поэтому его решение даётся выражением (2.29) при о = 0, Hi(to) — 0. Это выражение в силу условий утверждения положительно при t Є (—,0). Таким образом, H\(t) 0 при t Є (—,0). В случае t (xi(p),((p)) 0 функция H\(t) на траектории а при t 0 не обращается в нуль, если cr(t) Є U. Значит, она во всех этих точках имеет тот же знак, что и на интервале t Є (—,0), т.е. положительна. В случае #(а?і(р), С(р)) 0 функция Н\(і) на траектории а не обращается в нуль при t Є ( ,0). Значит, она в этих точках имеет положительный знак. В соответствии с принципом максимума управление и = 1 на рассмотренных интервалах оптимально. где г Є С1, и отношение — равномерно стремится к нулю при Х\ —\ 0. Исследуем зависимость (#!,), исходя из уравнения (2.28). Утверждение 2.26. Допустим, что ф Є (к, 7г); и пусть (спС/? имеют один и тот же знак. Тогда на множестве JC- U /С+ справедливы оценки -ctg K(0)C(i ) = 1 + 0(r(O)), x2(U) = я2(0) + 0(s2(O)). Доказательство: Имеем сЩф 0, поэтому t = — 6(a;i(0)) = ±0(r(O)). Далее, f = 0(1)? поэтому на интервале t Є [0,і ] справедлива оценка r() = 0(r(O)) = 0(хі(0)). В силу условий утверждения справедлива оценка (0) = ±е(і).
Синтез со спиралевидной структурой
Следовательно, кривая р\$ удовлетворяет условиям утверждения 2.6, применение которого завершает доказательство.
Утверждение 2.32. Поток траекторий системы х = А, выходящих из точек кривой piQ, и поток траекторий системы х = А + В, входящих в точки кривой piQ, не пересекаются друг с другом. Поток траекторий системы х = А, входящих в точки кривой 7сз и поток траекторий системы х = А + В, входящих в точки кривой 7сз не пересекаются друг с другом.
Доказательство: В силу утверждений 2.11 и 2.31 кривые 7сз и pw удовлетворяют условиям утверждения 2.7, применение которого даёт требуемое. Утверждение 2.32 гарантирует, что траектории подходят к кривой рю слева с управлением и = 1, переключают на ней управление и уходят направо с управлением и = 0. Затем они справа примыкают к кривой 7сз? и по ней движутся дальше с особым управлением. Слева к 7сз подходят траектории с управлением и = 1. Таким образом, кривые 7сз? Рю и точка х делят окрестность U на две области (см. рис. 2.1). Мы показали, что в правой области применяется управление и = 0, и движение происходит от рю к особой траектории. Покажем, что в левой области принцип максимума приводит к управлению и = 1. Для области снизу от кривой 7- это гарантируется утверждением 2.27. Исследуем область сверху от кривой 7-- В силу утверждения 2.8 кривая переключения /9ю имеет поднятие /$ю на Л4+. Пусть ф Є (,тг)- Тогда sin 0. На кривой рю имеем С = — 6(Г2),С?АВ = в (г). Следовательно, - = _в(г) 0, -3 = 0(r) = 0(si). Поэтому выражение (2.56) положительно, и выполнены условия утверждения 2.25. Следствие 2.5. Пусть ф Є (, 7г). Траектории системы (2.54), выходящие на piQ в момент времени t = 0, при t 0 удовлетворяют принципу максимума Понтрягина, пока их проекции находятся в окрестности U. П В точке (х,ф) = (0,0) согласно уравнению (2.26) справедливо неравенство Н\ = Бтф 0. Следствие 2.6. Пусть ф Є (,тг)- Траектория 7- системы (2.54), выходящая в начало координат (х,ф) = (0,0) в момент времени t = 0, при t 0 удовлетворяет принципу максимума Понтрягина, если выбрать окрестность U достаточно малой. Рассмотрим в пространстве Т Х множество точек Л/", состоящее из точек траекторий системы (2.43), соединяющих кривые рю,7сз? траекторий системы (2.54), выходящих на кривые рю,7сз5 траектории 7- и точки (х,ф) = (0,0). Утверждение 2.32 гарантирует, что проекция пх взаимно-однозначно отображает множество J\f на окрестность U, т.е. задаёт некоторую функцию ф(х). Утверждение 2.33. Функция ф{х) непрерывна в окрестности U и непрерывно дифференцируема всюду, кроме на кривых 7сз 7- Рю и в точке х. На кривых 7сз? 7- и Рю имеют место разрывы производных первого рода.
Доказательство: Рассмотрим кривую 7 на фазовой плоскости, состоящую из веток 7сз Рю и точки х. В силу утверждений 2.11 и 2.31 кривая 7 принадлежит классу PC1 с разрывом производных в точке х. В системе координат (#1,() она задаётся функцией C(#i) В силу (2.35) и (2.58) функция С(жі) является липшицевой при х\ ф 0, а при х\ = 0 имеет разрыв первого рода. В силу утверждений 2.11 и 2.30 она при х\ ф 0 принадлежит классу С2.
Рассмотрим поднятие 7 кривой 7 на М, состоящее из веток 7сз Рю и точки (х = 0,ф = 0). Кривая % задаётся уравнениями (2.21) и в силу утверждения 2.9 непрерывна. Рассмотрим ограничение функции ф на 7 : Ф(хі) = Ф(хіЛ(хі))- Имеем - = - + f . В силу утверждения 2.9 производная -Л непрерывна и равна нулю при х\ = 0. Отсюда и из ограниченности производной JJ- следует равенство lim o dx — НтЖ1- .±о J -. ЭТИ два односторонних предела существуют, поскольку существуют пределы 1ітЖі_ ±оС(:сі)? но они не совпадают.
Мы доказали, что кривая % принадлежит классу PC1 с разрывом производных в точке (х,ф) = (0,0). Исследуемая функция ф(х) задаётся траекториями систем (2.43),(2.54), проходящими через точки %. Доказательство завершает теорема о дифференцируемой зависимости решения дифференциального уравнения от начальных данных. Утверждение 2.34. Пусть М — двумерное непрерывно дифференцируемое интегральное многообразие гамилътоновой системы с некоторым гамильтонианом Н , заданном в пространстве Т Х. Пусть Л/7 является локальным сечением кокасателъного расслоения над некоторой областью U С U. Тогда функция ф{х), задающая Я , имеет потенциал и(х) Є C2(U ).
Доказательство: Покажем лагранжевость сечения Л/ , т.е. замкнутость формы фйх. Вычислим значение дифференциала формы ipdx на паре касательных к М векторов в случае, если один из них равен вектору фазовой скорости -щ. Пусть v — произвольный касательный вектор. поскольку H — первый интеграл. Но тогда форма d(ipdx) равна нулю на любой паре векторов, потому что Л/" двумерно. Следовательно, в области U существует такая функция и Є С2, что duo = ijidx. В силу утверждения 2.33 множество N является сечением расслоения Т Х. Соответствующая функция ф{х) удовлетворяет условию Кэлли [46] на особом режиме, а в силу утверждения 2.27 и следствий 2.6 и 2.5 — принципу максимума.
Утверждение 2.35. Пусть ф{х) — непрерывная функция на U, удовлетворяющая принципу максимума. Пусть окрестность U разделена конечным числом непрерывно дифференцируемых кривых, стыкующихся в точке х, на конечное число областей \]\, в каждой из которых функция ф(х) непрерывно дифференцируема. Пусть производные функции ф(х) терпят на этих кривых разрыв первого рода. Тогда ф(х) имеет потенциал со{х) класса С1. Доказательство: В силу утверждения 2.34 функция ф(х) имеет потенциалы uJi во всех областях дифференцируемости. Отнормируем их так, что lim jcj; = 0. В силу непрерывности ф(х) функции и І тогда совпадают на кривых, разделяющих области дифференцируемости и образуют одну функцию ш Є Cl(U).
В силу утверждения 2.33 функция ф(х), определяемая сечением Л/", удовлетворяет условиям утверждения 2.35 и имеет потенциал и (х). Функция и(х) удовлетворяет в окрестности U уравнению Беллмана. Поэтому построенный синтез оптимален. Фазовая точка приходит по особому режиму в точку х только за бесконечное время, так как на нём х% = віх?). Теорема 2 доказана.