Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Окулевич Алла Ивановна

Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями
<
Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Окулевич Алла Ивановна. Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями : : Дис. ... канд. физ.-мат. наук : 01.01.02 Москва, 1995 117 с. РГБ ОД, 61:95-1/259-3

Содержание к диссертации

Введение

ГЛАВА 1.

1. Предварительные сведения и обозначения. 20

2. Постановка задачи. 24

3. Аппроксимирующее семейство и его свойства . 26

4. Необходимые условия первого и второго порядка в классе обобщенных управлений . 49

ГЛАВА 2.

5. Условия невырожденности принципа максимума. 56

6. Условия непрерывности гамильтониана. Примеры . 63

7. Необходимые условия первого порядка в задаче с

фазовыми ограничениями. 72

8. Условия невырожденности принципа максимума в задаче с фазовыми ограничениями. 88

ГЛАВА 3.

9. Минимаксная задача. 93

10. Необходимые условия первого порядка в задаче с промежуточными и смешанными ограничениями. 100

11. Необходимые условия первого и второго порядка в классе обычных управлений. 107

Литература.

Введение к работе

В современной теории экстремальных задач и оптимального управления одним из интересных (как с теоретической, так и с практической точек зрения) направлений исследований являются дифференциальные уравнения с разрывными правыми частями (разрывные системы). Своеобразным фундаментом для изучения разрывных систем являются исследования, посвященные оптимизации систем с промежуточными ограничениями на траекториях.

Основы в теории оптимального управления были заложены академиком Л.С.Понтрягиным и группой его учеников [33]. Новые постановки задач оптимального управления привели к необходимости разработки принципиально новых методов исследований. Большой вклад в их создание внесли советские ученые: Л.С.Понтря-гин, В.Г.Болтянский, Р.В.Гамкрелидзе, Е.Ф.Мищенко [33], Е.Р.Аваков [1], А.А.Аграчев и Р.В.Гамкрелидзе [2] - [3], А.В.Арутюнов [8], В.И.Благодатских [9], [43], А.Я.Дубо-вицкий и А.А.Милютин [23], Ю.Н.Жидков [24], А.Д.Иоффе и В.М.Тихомиров [25], Р.В.Гамкрелидзе и Г.Л.Харатишви-ли [20] - [21], А.М.Тер-Крикоров [35] и другие.

Диссертационная работа посвящена исследованию необходимых условий оптимальности в задачах оптимального управления с промежуточными ограничениями на траекториях. Основным аппаратом исследований

являются методы возмущений. При этом исходная экстремальная задача погружается в семейство аппроксимирующих ее задач, причем возмущенные задачи оказываются качественно проще исходной. После анализа и преобразования аппроксимирующих задач получаем результаты для исходной задачи предельным переходом по параметру возмущения.

В данной работе использованы следующие два метода возмущений: метод штрафов и метод ц - возмущений. Метод штрафов впервые был использован Р.Курантом [44] и позднее развивался многими авторами (см. например, [37], [27], [28]).

Опишем суть метода штрафов. Для получения необходимых условий экстремума наряду с задачей

fo(x) —> min, х є Х0, где множество Х0 задает ограничения, рассматривается семейство задач ft(x) -> min, зависящих от коэффициентов штрафа t, в которых ограничения отсутствуют, а функция ft подбирается так, что

ft(x) ^ fo(x), t^ooVxe Х0, It(x) -> +00, t -» оо V х е Х0.

Для произвольного фиксированного значения коэффициента штрафа t в задаче без ограничений выписываются необходимые условия первого, второго порядка и затем, переходя к пределу при t -> од, получаем необходимые условия для исходной задачи.

Метод ц - возмущений был разработан А.В.Арутюновым [7] - [8]. Рассмотрим модельную задачу быстродейс-

твия:

х = f(x,u,t),x(0) = х0,х(Т) = х„ <иєи = {иєЕк:г(и)<0}, Т -> min.

Здесь хєЕ\иєЕк; — (H)^OV«efc:r(«) = 0, все отображения

достаточно гладки, а минимум ищется в классе существенно ограниченных функций со значениями в U. Пусть u0(t), t. є [О, Т0] - оптимальное управление в этой задаче. Предположим, что для любой функции \j/, удовлетворяющей этому управлению в силу принципа максимума, max(y/(T0),f(x1,u,T0))>0.

Рассмотрим семейство задач минимизации

интегрального функционала с нефиксированным временем

г г

Jl-juiyj-r(u) dt + jju2\u- u^tfdty

о 0

зависящего от числовых параметров u^ > 0, ц2 ^ 0. При фиксированных щ > 0 эту задачу назовем ц - задачей. Ясно, что при фиксированном ц2 > 0 и ц^ -» 0+0 решения ц-задач сходятся к щ. Но теореме 1 из [7J любое, удовлетворяющее принципу максимума управление \х - задачи и^ принимает значения из int U и для п. в. t расстояние от u^t) до 5U не меньше некоторого положительного числа, зависящего от Hi- Таким образом, в ц - задаче ограничение на управление можно не учитывать, превратив ее в задачу Лагранжа. При этом искомые необходимые условия получаем предельным

переходом при Ці —> 0+0.

В диссертационной работе задачи исследуются в классе обобщенных управлений [17], [20], а не обычных [33], поскольку минимум в классе обобщенных управлений достигается в силу его слабой секвенциальной компактности [20] при весьма общих предположениях.

Отметим, что исследованию задач оптимального управления с промежуточными ограничениями на траекторию посвящены работы Л.Т.Ащепкова [12] - [14], В.В.Величенко [15], Г.Маурера [45] и др.

Большое внимание в диссертационной работе уделено условиям невырожденности формулируемых необходимых условий оптимальности. Дело в том, что в определенных ситуациях принцип максимума может вырождаться. Последнее означает, что оптимальной паре соответствует набор множителей Лагранжа, у которого vj/(t) = 0 для п.в. t, с0 = 0. Более того, можно привести примеры, в которых известным вариантам принципа максимума удовлетворяют только такие множители Лагранжа. Чтобы сделать принцип максимума содержательным, на изучаемую оптимальную пару накладываются дополнительные ограничения, что и продемонстрировано в данной диссертации.

Перейдем к изложению основных результатов диссертационной работы.

Первая глава диссертации посвящена задаче оптимального управления с промежуточными ограничениями.

В 1 приводятся основные определения и обозначения,

вводятся понятия условной сходимости [8], существенных пределов измеримой функции [8], пространства вариаций обобщенных управлений Дг2 и Д^ [17].

В 2 приведена постановка задачи и сделаны основные предположения. Рассматривается задача:

х = (f{x,u,t), v{t))\ t є [tlt tm], ^(4;

K,{p) < 0; K2(p) = 0; ^

Д(ж,и,/) < 0; R2(x,u,t) = 0; К0(р) -» тіл,

где р = (tb ..., tm, хі, ..., хт), Хі = x(t0, І =1, т, tj < ... < tm. Здесь х є En, u є Er, K0 - скалярная, a Kj, K2 - векторные функции, которые предполагаются непрерывно дифференцируемыми. Вектор-функции f, Ri, R2 предполагаются непрерывно дифференцируемыми по (х, и) для п. в. t, ограниченными вместе со своими частными производными по (х, и) на любом ограниченном подмножестве и измеримы по t для любых фиксированных х, и.

В качестве допустимых управлений рассматриваются

обобщенные управления. Обобщенным управлением

называется [20] слабо измеримое по t финитное семейство

вероятностных мер Радона v(t), сосредоточенных для п. в. t

из некоторого отрезка [tb t2] на множествах

U(x, t) = {ueEr: Rx(x, u, t) < 0; R2(x, u, t) = 0}. Положим

кі = \kX, к2 = te,,};:,, Rt = {,,}; r2 = {rv}*.

Будем изучать оптимальную пару (x0(t), v0(t)), t є [t1>0, tm0], положив Po = (tlj0, ..., tmj0, x1)0, ..., xm0),

xi0 = x(ti0)? і = l, т. Обозначим через I = {і: k^Po) = 0} -
множество активных индексов неравенственных

ограничений. Положим

IE(x, u, t) = {і: |г(х, u, t)| < є) для є > 0;

'A,. . . - . . fc

Re(x, U, t) = Lin \-lf-(x,uj\ і є IE(u,t); ~^-{x,u,t), і = l,n4 ,

[at au J

C0(x, u, t) - матрица ортогонального проектирования Er на

7<;(x, u, t); К - (|1|+п2)-мерная функция, имеющая коорди-

наты ku, і є І, к, і = 1, п2,

B(t) = /|^(*0,н,)с0и,м), v0(o\;

Фундаментальную матрицу линейного уравнения

х = (~(x^,u,t), v0(t)\x

обозначим через Z(t, t10) и определим матрицы Qb Q2 и Q по формулам:

1,(=1 ах, )

=1~(Ро)Що^и) \z^(t,tl0)B(t)B\t) (z^,t10))'dtz\ti0,tu) ^~(л);

Q = f^ll;q = dimKerQ.

Для задачи (*) будем считать выполненным следующее

предположения:

а) смешанные ограничения регулярны, то есть
существует є0 > 0: d(x, u, t) > є0 V(x, u) для п.в. t, где
d(x, u, t) - максимальный по модулю из всех миноров по
рядка |ІЄо(х, u, t)| + n4 матрицы, строками которой являют
ся вектора -JU-(x,u,t), і є Io(x, u, t); ~^{x,u,t), і = Щ;

си си

б) множества U(t) ограничены равномерно по почти
всем t, лежащим в окрестностях точек tij0, і = I, т.

Третий параграф посвящен построению семейства аппроксимирующих задач и изучению его свойств в предположении, что смешанные ограничения не зависят от х.

Доказано, что решения ц - задач существуют, и их семейство аппроксимирует исходную задачу (*), то есть последовательность оптимальных управлений ц - задач слабо сходится к оптимальному управлению исходной задачи. Получен принцип максимума для ц - задачи, условия трансверсальности по времени и доказаны необходимые условия второго порядка.

На основе проведенных исследований ц - задач в 4 выводятся необходимые условия первого и второго порядка в классе обобщенных управлений.

Пусть Н(х, u, t, у) = ц/> -функция Гамильтона - Понтрягина и

1(р, с) = с0К0(р) + lf К!(р)> + <с2, К2(р)>,

ТІ ТІ

где с = (с0, сх, с2); с0 є Е1; сх є Е *; с2 є Е 2 - малый лагранжиан.

Теорема 1.

Оптимальная пара (х0, v0) удовлетворяет принципу максимума, то есть существуют ненулевой вектор с, кусочно непрерывная слева функция \y0(t), t є [t10, tmj0L имеющая в промежуточных точках ti0, і = 2, ..., m-1 разрывы первого рода, абсолютно непрерывная на интервалах (tij0, ti+1)0), і = 1, ..., m-1 и удовлетворяющая на каждом из них сопряженному уравнению:

да для п. в. t условию максимума

max H(u, t) = H(u, t) Vu є S(t),

иєУ0

условиям трансверсальности по времени:

ess й^ (sup H(x0(tmj0), u, t, - -— (p0, c))) - —-(po, c) > 0,

ess Jim (sup H(x0(tm0), u, t, - —(Po, c))) - — (p0, c) < 0,

t->t„o "ёЕ7о(0

»1

ЙГ/_ -ЧЧЧ , ЙГ

&_ v ' *

ess lijn (sup H(x0(ti>0), u, t, -(p0, c))) + ^-(po, c) > 0, ess Jjm. (sup H(x0(ti)()), u, t, -^-(po, c))) + 4(Po> c) < 0,

і = 1, ..., m-1,

условиям трансверсальности:

Vo(ti,0) = J-(P0, С), Vo(tm,o) = - ~(Р0, С),

в промежуточных точках равенствам:

Уо(Чо + 0) - уо(Чо) = j^(Po, с), і = 2, ..., m-1;

условиям дополнительной нежесткости

c0 > 0; Cl > 0; 0), Сі> = 0. Кроме того, если f непрерывно дифференцируема, а многозначное отображение U постоянно, то для Н имеет место представление:

max H(t) = - J —-(т)йт + -z-(p*,c), t є (tw,/,+li0), і = l.m-1 .

Будем предполагать, что все отображения, участвующие в формулировке задачи, дважды непрерывно дифференцируемы по (х, и), а соответствующие производные измеримы по t и существенно ограничены на любом ограниченном множестве.

Рассмотрим подпространство @ с Enx Ar2[t10, tm^0], состоящее из таких пар (а, 6), что, если бх(-) - соответствующее 6 решение уравнения в вариациях

Ьх = f (t) ox + 0(u, t), v0(t)>, 5x(tM) = a,

at ck

то для п. в. t

J,J

(u,t),Su(t)\ = 0,

\ du '/

Vu є S(t): RsiK0= 0, s = l,2Vi;

p=l Щ

На @ определим квадратичную форму їі по формуле

U{a,S) = - J /-^^(uj)[SK(t),S(uj)]\va(t))dt + //(й,С)Иі.).-^)Г»

где бх(-) - соответствующее решение уравнения в вариациях. Теорема "2-Для оптимальной пары (х0, v0) существуют такие

(с> Уо)> удовлетворяющие ей в силу принципа максимума, что индекс построенной по ним квадратичной формы U на подпространстве 0 не превышает min (nm, q).

Вторая глава посвящена условиям невырожденности необходимых условий первого порядка в задаче оптимального управления с промежуточными и фазовыми ограничениями.

В 5 доказано, что при выполнении определенных условий имеет место принцип максимума с усиленным условием нетривиальности, а именно:

Теорема 3.

Пусть для каждого номера j: 1 < j < ш-1 существует

такой вектор hj, что выполняются условия:

а) B*Jij > 0; B*^hj = 0,

в*ц - |Чр) ф(іт, tk), в*щ = ^(р) o(tm, tk),

Звездочка * обозначает операцию транспонирования;

б) столбцы матрицы B*2j линейно независимы.
Тогда

с0 + j\j/(t)| ^0 Vte (tj, ti+1), j = 1, ..., m-1. Здесь Ф(х, t) - фундаментальная матрица сопряженного уравнения ^(t) = - -r-(t) и, как известно, для любых т, tx, t2 матрица Ф(т, т) является единичной и имеют место

соотношения: <3>(t2, tx) Ф(т, t2 ) = Ф(т, tx); Ф(t, т) = Ф (т, t).

Теорема 4.

Если выполняются условия теоремы 3 и, кроме того, условие

с) 0,j, hj> > О, то

|\|/(t)j * О V t є (tj, tj+i), j = 1, ..., m-1.

В шестом параграфе исследуется вопрос о необходимом условии непрерывности гамильтониана для частного случая задачи (*), и приведены примеры. В первом из них функция Гамильтона-Понтрягина терпит разрыв первого рода в промежуточной точке. Во втором - функция \j/(t) вырождается на одном из интервалов непрерывности.

7 посвящен изучению задачи (*) при наличии фазовых ограничений:

'* = (f(x,u,t), v(t)), t [tlftm], t, < /„,; Кх(р)<Ъ, K2(^) = 0;

< gj(x,t) < 0, je J; K0(p) -> min,

где gj - скалярные непрерывно дифференцируемые по совокупности переменных функции.

Введем несколько определений и обозначений.

J(t) = {j eJ:gj(t) = 0}.

Будем говорить, что фазовое ограничение gj согласовано с промежуточными ограничениями в точке ро, если

вложение:

{р: Ip-pol < є, К0(р) < К00), Кх(р) < 0, К2(р) = 0} с с {р: gj(Xi,ti) < 0, i=l, ... m}.

Обозначим через J} множество тех индексов jeJ, для которых фазовое ограничение gj согласовано в точке р0 с промежуточными. В дальнейшем будем предполагать, что промежуточные ограничения, к которым добавлены неравенственные ограничения gj^, tj) < 0, jeJXJj регулярны, то есть

rang ^(р0) = п2; 3 р^Е^4"1): ^Чр0)Р = 0,

Будем считать, что заданное управление v0(t) и соответствующая траектория x0(t) оптимальны в рассматриваемой задаче и удовлетворяют следующему предположению:

а) существует такое 8 > 0, что множества U(t) равномерно ограничены по t, лежащим в є - окрестностях точек tlj0, ..., tmj0.

Теорема 5.

Пусть пара (x0(t), v0(t)), t є [t10, tmo] оптимальна для задачи и выполняется предположение а). Тогда существуют одновременно неравные нулю вектор с, регулярная борелевская неотрицательная векторная мера n0j, j є J и непрерывная слева функция ограниченной вариации v|/0(t), te[tlj0> tmj0L удовлетворяющие следующим соотношениям:

V t є (tii0, ti+lj0], і = 1, ..., m-1;

для п. в. t условию максимума

max H(u, t) = H(u, t) Vu є S(t);

ueUa(t)

условиям трансверсальности по времени:

ess ц^ (sup H(x0(t1Ilio), u, t, - —(Po, c))) - — (po, c) > 0,

ess Mm (sup H(x0(tm,0), u, t, - --(p0( c))) - -f(p0, c) < 0,

яг sg

ess Jim (sup H(x0(tij0), u, t, —(Po, c))) + — (po, c) > 0, ess Ит (sup H(x0(ti)0), u, t, —(po, c))) + —(p0, c) < 0,

і = 1, ..., m-1, условиям трансверсальности: o(*i,o) = |Цро, с),

в промежуточных точках ti0, і = 2, ..., m-1 равенствам: Vo(4o+0) - Уо(Чо) = ~(Ро, с) + Е ^(Чо) Ло,і(Чо)і

условиям дополнительной нежесткости:

с0 > 0; Cl > 0; <К!(ро), сг) = 0. Если, кроме того, і непрерывно дифференцируема, а многозначное отображение U постоянно, то для Н имеет место представление:

ШаХ H(ust) = - J ~—(т)йт + 2, J -z-(r)d%j + 2. -г-(л,с)>1 є tii0,*(4li0

а условия трансверсальности по времени принимают вид: max Щи, tij0, —- (po, с)) + —(р0, с) = 0, і = 1, ..., m-1,

шах Щи, tm,0, - -^(Po, с)) - -f-(Po, с) = 0.

Для доказательства теоремы построена последовательность возмущенных задач и доказаны оценки, обеспечивающие возможность предельных переходов.

Чтобы сделать принцип максимума содержательным, в
восьмом параграфе на изучаемую оптимальную пару
накладывается ограничение, предполагающее ее

управляемость.

Определение.

Пара (х, v) управляема в промежуточных и концевых точках, если существует щ є U, і = 1, .,., m:

\\^(ti>f(x(ti>ui>0) + ^Ц > О, У**//,) = 0J є J,i = йГі; \\^(Оі/(МО,ит,оУ^(о\ < 0,Vf.gj(tm) = 0,У є /.

Теорема 6.

Пусть выполняются предположения теоремы 3, а также

1) оптимальная пара (х, v) управляема в промежу
точных и концевых точках;

  1. фазовые ограничения согласованы с промежуточными;

  2. вектора'\-~(t)J:gj(t) = o[jє/ позитивно линейно

независимы Vt є [tL, tm], то есть для любого t существует вектор g = g(t) такой, что (-%^>s(0)<0 v/ ej(t).

Тогда пара (х, v) удовлетворяет принципу максимума со следующим условием нетривиальности:

c0 + mes {t: \)/(t) ф 0} > 0. 9 посвящен решению минимаксной задачи. На решениях задачи с промежуточными ограничениями

x = (f{x(t)Mt),t),vit)),t^[tlJmltim,

Кх(р) < 0, К2(р) = 0

требуется минимизировать функционал J[x, u] = max 0(р).

Теорема 8.

Пусть выполнены условия согласованности, управляемости и

*(*,/)* о ах

для всех пар (х, t), для которых cp(x(t), t) + KQ(p) = J0. Тогда найдется оптимальная пара (x0(t), v0(t)), t є [t10, tm0] и число \j/ < 0, удовлетворяющие принципу максимума для функции

Н(х, u, t, \|/, \|/) = Н(х, u, t, у) + \|Лр(х, t) и условию невырожденности

с0 + mes {t: \y0(t) ф 0} > 0. В 10 рассматривается задача оптимального

управления со смешанными ограничениями:

х = (f(x,u,t), v(t)), te [*,,*„], t, < tm; ^ K^zQ, K2(p) = 0;

ДДх.и.О < 0, R2(x,u,t) = 0;

K0(p) -> min.

Теорема 9.

Оптимальная пара (x0(t), v0(t)), t є [tlj0, tm,0] удовлетворяет принципу максимума, то есть существуют ненулевой вектор с = (с0, сі, с2), слабо измеримые (по t)

семейства п3- и п4-мерных мер Радона ax(t), a2(t) и кусочно непрерывная слева функция \\fo(t), t є [t10, tm о], имеющая в промежуточных точках ti0, і = 2, ..., m-1 разрывы первого рода, абсолютно непрерывная на интервалах (4<ь tj+i,o]> і = 1, ..., m-1 и удовлетворяющая сопряженному уравнению на каждом из них:

t ЙҐ ye/ ( Ш к=іл-\ U&k

для п. в. t условию максимума

max H(u, t) = H(u, t) Vu є S(t);

иєиа(і)

ess 1^ (sup H(x0(tmj0), u, t, - —(Po, c))) - —(p0, c) > 0, ess Ит (sup Н(х0(+.Юї0), u, t, - —(Po, c))) - —(p0, c) < 0,

условиям трансверсальности по времени:

С? / u\ Я

ess 1^ (sup H(x0(ti)0), u, t, —(Po, c))) + — (po, c) > 0,

ess lim (sup H(x0(tij0), u, t, —(Po, c))) + — (po, c) < 0,

і = 1, ..., m-1, условиям трансверсальности:

ПІ j^f

^o(tl,o) = ^-(P0> c)> Vo(tm,o) = * ^(PO^ с

1 m

в промежуточных точках tif0> і = 2, ..., m-1 равенствам: Vo(4o+0) - о(Чо) = -^(Po, с) + Z %(Чо)Ло,і(Чо)ї

условиям дополнительной нежесткости:

>

c0 > 0; Cl > 0; (K^po), Сх) = О, меры ai(t), a2(t) абсолютно непрерывны относительно меры

v0(t), меры ajfj(t) сосредоточены на множествах

(ueU(t): rj4(x0, u, t) = 0}, j = 1, 2, ax = (an, ..., aln3),

(—Ци.О.аХО) = Ё(—(«)0.aii(0/ и аналогично для а2.

\ди J і=\\ди J

В 11 исследованы различные задачи оптимального управления с промежуточными ограничениями на траекториях в классе обычных управлений. Для них получены необходимые условия оптимальности.

Аппроксимирующее семейство и его свойства

1. Пространства Лг2(Сх[а, b]) и Лгя(Сх[а, Ь]) являются ба наховыми. Если же, кроме того, множество С компактно, то пространство дг2(Сх[а, Ь]) сепарабельно (если С некомпакт но, то второе утверждение неверно). 2. Подпространство дгж(С х [a, b]) всюду плотно в Дг2(Сх[а, Ь]).

В ниже рассматриваемых задачах допустимыми являются обобщенные управления. Обобщенным управлением называется [17], [20] слабо измеримое по t финитное семейство вероятностных мер Радона v(t), сосредоточенных для п. в. t из некоторого отрезка [tlt t2] на множествах U(x, t) = {иєЕг: Ri(x, u, t) 0; R2(x, u, t) = 0}, где вектор-функции Rj, R2 предполагаются непрерывно дифференцируемыми по (х, и) для п. в. t, ограниченными вместе со своими частными производными по (х, и) на любом ограниченном подмножестве и измеримыми по t для любых фиксированных х, и.

Отметим, что класс обобщенных управлений включает в себя часто рассматриваемый класс обычных управлений, состоящий из существенно ограниченных измеримых функций u(t), принимающих значения из U(t). При этом управление u(t) отождествляется с обобщенным управлением v(t) = 5U(t), где 6U - мера Дирака, сосредоточенная в точке и. В силу аппроксимационной леммы [20] множество обычных управлений слабо всюду плотно во множестве обобщенных. Отметим также, что множество обобщенных управлений слабо секвенциально компактно. Для краткости обобщенные управления будем называть управлениями, а действие меры будем обозначать с помощью угловых скобок: /(х, u, t), v(t) = Jf(x,u,t) dv(t).

Введем еще несколько определений. Порядком анормальности оператора А называется значение codim (Im А).

Рассмотрим банахово пространство X и последовательность лежащих в нем выпуклых замкнутых конусов \КаУп_х Множество всевозможных предельных точек таких последовательностей {хп}, что хп є Кп V п, называется верхним пределом последовательности {Кп} и обозначается Ls Кп.

2. Постановка задачи. Рассмотрим следующую задачу: где p = (tb ..., tm, xi, ..., Xm), Xi = x(ti), І =1, m, tx ... tm. Здесь x є En, u є Ег, K0 - скалярная, а К1? K2 - векторные функции, которые предполагаются непрерывно диффе ренцируемыми. Вектор-функции f, R1; R2 предполагаются непрерывно дифференцируемыми по (х„ и) для п. в. t, ограниченными вместе со своими частными производными по (х, и) на любом ограниченном подмножестве и измеримы по t для любых фиксированных х, и. Положим Ki= { „}ы к2= M Ri" ЫГ кз= Ы1 Будем изучать оптимальную пару (x0(t), v0(t)), t є [t10, tm0], положив p0 = (t1 0, ..., tmi0, xlj0, ..., хШ]0), xi;0 = x(ti;0), і = 1» т. Через S(t) обозначим носитель меры v(t) и положим 1={і: к!д(р0) = 0} - множество активных индексов неравенственных ограничений; Ie(x, u, t) = {і: г1Д(х, u, t) є} для є 0; Rs(x, u, t) = Lin l-±L(x,u,t\ і є 7,(и,f); - -(x,u,t), і = Ц , C0(x, u, t) - матрица ортогонального проектирования Er на i (x, u, t); К - (1+п2)-мерная функция, имеющая

Будем предполагать, что смешанные ограничения регулярны, то есть существует 0 0: d(x, u, t) s0 V(x,u,t), где d(x,u,t) - максимальный по модулю из всех миноров порядка 1Бо(х, u, t) + п4 матрицы, строками которой являются вектора — -{x,u,t), і є ІЄп(и ); — (JC.K,/), / = 1 , а множества ди ди U(t) ограничены равномерно по всем t, лежащим в окрестностях точек ti)0, і = 1, т. Фундаментальную матрицу линейного уравнения х = ( -(x0,u,t), v0(t)\x обозначим через Z(t, tX)o) и определим матрицы Qj, Q2 и Q по формулам: Ql = -т-0 о) ( (,оЛо) Q2 = т ЯК Ч 9 і « ЯК Q = f l; q = dimKerQ. Далее для упрощения записи будем опускать нижний нулевой индекс там, где это не вызовет недоразумений и считать, что смешанные ограничения не зависят от х.

3. Аппроксимирующее семейство и его свойства. Введем в рассмотрение семейство скалярных функций осє(-), которые удовлетворяют следующим условиям: ае(-) являются гладкими, монотонно невозрастающими функциями при є 0

Необходимые условия первого и второго порядка в классе обобщенных управлений

Из (1.19) и (1.20) вытекает, что порядок анормальности оператора F равен q. В [8, стр.163] сформулирована и дока зана теорема 3.1. Она позволяет получить оценку снизу для последовательности выпуклых замкнутых конусов {Кд}00, где Кп = {хєХ: Anx = 0), An = А + Мп п- А именно, доказано существование замкнутого подпространства П: codim П = codim (Im А) dim X, Ls Kn =2 Ker A n П.

Применяя непосредственно эту теорему к семейству конусов {Ker F }, получаем утверждение Леммы 1.4.

Необходимые условия первого и второго порядка в классе обобщенных управлений. Введем в рассмотрение функцию Гамильтона - Понтря-гина Н(х, u, t, у) = f(x, u, t), \/ и малый лагранжиан 1(р, с) = с0К0(р) + сь Кх(р) + с2, К2(р) , где с = (с0, сь с2); с0 є Е1; сх є Еп ; с2 є Е Ч

Оптимальная пара (х0, v0) удовлетворяет принципу максимума, то есть существуют вектор с, кусочно непрерывная слева функция Уо( )» t є [ 1,0 т,о1 имеющая в промежуточных точках t o, і = 2, ..., m-1 разрывы первого рода, абсолютно непрерывная на интервалах (t o ti+io)

Будем рассматривать семейство функций v/ (-), полученных при делении \уц(-) на cj (сохраняя прежнее обозначение). Тогда в силу условий трансвервальности на правом и левом концах и условий скачков в промежуточных точках

А поскольку удовлетворяет сопряженному уравнению, то семейство функций \/ц( ) равномерно ограничено по t, ц. Поэтому равномерно на (ti,o» tm о) [20], где Уо( ) " решение (1.21), отвечающее построенному с.

Тогда, совершая предельный переход при \ь— О, получим (1.23) - (1.25) из (1.6) - (1.8), (1.13) - (1.15). Докажем (1.28). Как известно, в \х - задаче частная производная гамильтониана по переменной t совпадает с его полной производной на каждом из интервалов (tij0, ti+h0), i=l,...,m-l. Исследуем полуинтервал (tm_ho,tm,o)-Из вышесказанного следует, что для любого t из этого полуинтервала справедливо представление H (t) = - ) (r)dr + --{рм,см). (1.30) —-(г)дг + — а д С другой стороны, из условия скачка (1.25) получаем условие скачка для функции Н: max Нц(и, tj +0) - max H (u, ti4l) = - —, і = 2, ..., m-1.

Тогда, используя это условие при і = m-1 из (1.30), имеем: H t) = - J—4r)A-+ r-(Pfl,cfl)+--—(pfltc/l)7t&(tm.2tQt m-ltoy Продолжая эту процедуру, получим представление гамильтониана для любого t из интервала (ti0, іі4-і,о) - 53 дни f , ш а H t) = -{—4r)dr+ If- сДі = l,m-l.

Осуществляя в этом соотношении предельный переход при ц - 0, получим искомое представление (1.28). Причем, в этих предположениях условия трансверсальности по времени (1.23) принимают вид: max Щи, ti(0, —(Po, c)) + -(Po c) = 0, і = 1, ..., m-1; max H(u, tmj0, - —(p0, c)) - — (p0, c) = 0.

Докажем (1.22). Пусть u(t), t є [t10, tm,o] - произвольная измеримая ограниченная функция со значениями в U(t). Тогда вследствие регулярности смешанных ограничений существует равномерно сходящееся (условно) при цчОк u(t) семейство ограниченных функций u (t). Из (1.6) следует, что Т НцК ) М ) )dt Т H K(t), u, t), v (t))dt, а при предельном переходе под знаком интеграла при ц - 0 получаем, что J H(u(t), t)dt \ H(u, t), v0(t))dt. l,0 Поскольку интегральное и поточечное условия максимума равносильны, то (1.22) справедливо. Докажем (1.28). Если с0 = 0 и \]/o(t) = 0 для некоторого - 54 t, то \/o(t) = 0. Значит, из (1.23) - (1.25) можно заключить, что —(Ро, с) = 0, а в силу (1.26) и регулярности концевых Ф ограничений с1 = 0, с0 = 0 = с = 0. Получили противоречие, что и завершает доказательство теоремы. Будем предполагать, что все отображения, участвующие в формулировке задачи дважды непрерывно дифференцируемы по (х, и), а соответствующие производные измеримы по t и существенно ограничены на любом ограниченном множестве. Рассмотрим подпространство 0 с Enx Ar2[t10, tm0], состоящее из таких пар (а, 5), что, если 5х() - соответствующее 5 решение уравнения в вариациях

Условия непрерывности гамильтониана. Примеры

Тогда по второй теореме Хелли [26, стр.368] можно выбрать последовательность, сходящуюся в каждой точке интервала (t , tm ). Предельная функция этой последовательности ;(-) является функцией ограниченной вариации по первой теореме Хелли [26, стр.366].

Таким образом, функция (-) - непрерывна везде, кроме, быть может, счетного числа точек. Мера r\ j - регулярная борелевская мера. Значит, мера rj, j є J непрерывна везде, кроме счетного числа точек. Поэтому существуют такие множества полной меры Tj, j є J, что rj непрерывна во всех точках t є Tj, причем () также непрерывна в точках t є Tj.

Теперь устремим ц к нулю и воспользуемся доказанной условной сходимостью всех величин, входящих в это выраже ние. Заметим, что 5 может быть выбрано таким образом, что в точках tj -б и tij(i+5 \/ц( ) \/( ), ц — 0. Имеем: (/, + )- (/,-.У) = -(Ас)- { —Hr)dT+Y, j (т) 7,.

Устремляя 5 к нулю, получаем условие скачка функции \/(-) в произвольной промежуточной точке tj! где rj(ti) - атомарная составляющая меры ц в точке tj. Теорема доказана.

В формулировке принципа максимума для задач с фазовыми ограничениями вид условий нетривиальности имеет большое значение, поскольку, как отмечалось в [5], [7], [10], [22], принцип максимума может вырождаться. Это происходит в случае, когда оптимальной паре соответствует набор множителей Лагранжа, в котором \/(t) = 0 для п.в. t, с0 = 0. Кроме того, известны примеры, в которых принципу максимума удовлетворяют только такие множители Лагранжа.

Чтобы сделать принцип максимума содержательным, на изучаемую оптимальную пару часто накладываются дополнительные ограничения, например, требуется ее невырожденность или регулярность [10]. С этой же целью в [22] введено понятие управляемости в концевых точках. Отметим, что в этом случае имеет место принцип максимума с более слабым, чем поточечное, условием нетривиальности.

Рассмотрим задачу оптимального управления с фазовыми ограничениями (2.25). Будем предполагать, что функция f непрерывно дифференцируема, а многозначное отображение U() постоянно, то есть U(t) = U.

Пусть выполняются предположения теоремы 3, а также 1) оптимальная пара (х, v) управляема в промежуточных и концевых точках; 2) фазовые ограничения согласованы с промежуточными; 3) вектора J— (t),f.gAt) = 0\,j:e/ позитивно линейно {ас j независимы Vt є [tj, tm], то есть для любого t существует вектор g = g(t) такой, что / j ,g(f)) 0 Y/єДО Тогда пара (х, v) удовлетворяет принципу максимума со следующим условием нетривиальности: Откуда, в силу управляемости в промежуточных и концевых точках 4j(« = 0Vj= — - (р,с) = 0. Исследуем промежуточные точки t2, ... , tm.!. Поскольку \(/(t) = 0 Vt є (tb tmJ, то условие скачка (2.40) принимает вид %1 i. US- T,-li-(fiWh) = (P.c)yi = 2tm-U (2.44) С другой стороны, если представление (2.42) для Н записать последовательно для промежуточных точек от tm_! до t2, то получим: Рассмотрим точку tx. В силу (2.39) и (2.41), а также предположения (2.38) имеем % да дкх Подставляя полученное соотношение в (2.42) при t = t1? получаем согласно предположению 1) 4j(ti) = 0 Vj є J (р,с) = 0. Откуда из (2.43) при і = 1 вытекает, что Итак, мы показали, что —(р,с) = 0 и меры ЛІ( І) = О V jeJ. Ф

Поскольку с0 — 0 (в силу (2.38)), то из предположений теоремы 3 следует, что с = 0. Это приводит к противоречию: предположение (2.38) не может иметь места, поскольку с и Hj Vj є J не могут быть равны нулю одновременно. Теорема доказана. Рассмотрим следующую задачу оптимального управления: требуется минимизировать функционал на решениях задачи с промежуточными ограничениями: х = (f(x(t),u(t),t), v(t)), t є fc, /J, b tm; (3.2) Kx(p) 0, К2(р) = 0. (3.3)

Здесь, как и ранее, р = (t1? ..., tm, хь ..., xm), где Xj = x(ti), і = l, m, и выполняются все предположения, вве-денные в параграфе 2, а (р - заданная непрерывно дифференцируемая функция.

Будем говорить, что пара (x0(t), v0(t)), t є [tM, tmj0], оптимальна, если она удовлетворяет ограничениям (3.2), (3.3) и функционал (3.1) достигает на ней наименьшего значения.

Задачи такого вида были исследованы в работах [9], [23], [41]. В частности, в работе [41] были получены невырожденные необходимые условия оптимальности первого и второго порядков. Воспользуемся предложенным в [9] методом сведения минимаксной задачи к задаче с фазовыми ограничениями.

Необходимые условия первого порядка в задаче с промежуточными и смешанными ограничениями.

Как уже отмечалось, класс обобщенных управлений включает в себя класс обычных управлений. Будем рассматривать задачу (1.1) - (1.4) в классе обычных управлений.

Пусть множество Р(х, t) = {р(х, t) = f(x, u, t), u є U} выпукло для всех (х, t), то есть Р(х, t) = conv Р(х, t). Тогда управление щ{Ц, оптимальное в классе обычных управлений, будет оптимальным и в классе обобщенных управлений. Доказательство.

По теореме А.Ф.Филиппова ([20], теорема VIII.3) решение задачи в классе обычных управлений существует. Обозначим это решение через (x0(t), u0(t)). Отождествим обычное управление u0(t) с обобщенным управлением v0(t) следующим образом: где 6U - мера Дирака, сосредоточенная в точке и. Докажем, что jf(x0(t),u,t)dv»(t)P(x,t). (3.36) Предположим противное, то есть

Тогда по теореме отделимости существует ненулевой непрерывный линейный функционал 1, разделяющий множество Р(х, t) и вектор h. А именно, имеют место неравенства: I, h а, (3.37) 1, р а Vp. (3.38) Тогда из (3.38) следует, что Последнее неравенство противоречит (3.37). Значит, имеет место Откуда вытекает, что существует обычное управление u (t), удовлетворяющее равенству

Очевидно, что управлению u (t) соответствует оптимальная фазовая траектория x0(t). А это означает, что управление u (t), оптимальное в классе обобщенных управлений, совпадает с обычным управлением u0(t). Лемма доказана.

Будем предполагать, что множество {f(x, u, t), ueU}-выпукло для всех (х, t). Тогда доказанная лемма позволяет сформулировать необходимые условия оптимальности первого и второго порядка в классе обычных управлений, являющиеся следствиями теорем 1,2 и 5.

Оптимальная пара (х0, и0) удовлетворяет принципу максимума, то есть существуют ненулевой вектор с, кусочно непрерывная слева функция \/o(t), t є [t1)0, tm0], имеющая в промежуточных точках tij0, і = 2, ..., m-1 разрывы первого рода и удовлетворяющая сопряженному уравнению на каждом из интервалов непрерывности Пусть пара (x0(t), u0(t)), t є [t10, tm0] оптимальна для задачи с фазовыми ограничениями и выполняются необходимые предположения. Тогда существуют одновременно неравные нулю вектор с, регулярная борелевская неотрицательная векторная мера И непрерывная слева функция ограниченной вариации \/o(t), te[tli0, tmj0], удовлетворяющие следующим соотношениям:

Рассмотрим семейство задач минимизации интегрального функционала с нефиксированным временем зависящего от числовых параметров u^ > 0, ц2 ^ 0. При фиксированных щ > 0 эту задачу назовем ц - задачей. Ясно, что при фиксированном ц2 > 0 и ц^ -» 0+0 решения ц-задач сходятся к щ. Но теореме 1 из [7J любое, удовлетворяющее принципу максимума управление \х - задачи и^ принимает значения из int U и для п. в. t расстояние от u^t) до 5U не меньше некоторого положительного числа, зависящего от Hi- Таким образом, в ц - задаче ограничение на управление можно не учитывать, превратив ее в задачу Лагранжа. При этом искомые необходимые условия получаем предельным переходом при ЦІ —> 0+0.

В диссертационной работе задачи исследуются в классе обобщенных управлений [17], [20], а не обычных [33], поскольку минимум в классе обобщенных управлений достигается в силу его слабой секвенциальной компактности [20] при весьма общих предположениях.

Отметим, что исследованию задач оптимального управления с промежуточными ограничениями на траекторию посвящены работы Л.Т.Ащепкова [12] - [14], В.В.Величенко [15], Г.Маурера [45] и др.

Большое внимание в диссертационной работе уделено условиям невырожденности формулируемых необходимых условий оптимальности. Дело в том, что в определенных ситуациях принцип максимума может вырождаться. Последнее означает, что оптимальной паре соответствует набор множителей Лагранжа, у которого vj/(t) = 0 для п.в. t, с0 = 0. Более того, можно привести примеры, в которых известным вариантам принципа максимума удовлетворяют только такие множители Лагранжа. Чтобы сделать принцип максимума содержательным, на изучаемую оптимальную пару накладываются дополнительные ограничения, что и продемонстрировано в данной диссертации. Перейдем к изложению основных результатов диссертационной работы.

Похожие диссертации на Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями