Содержание к диссертации
Введение
1 Некоторые сведения из теории позиционных дифферен циальных игр 7
2. Производные многозначных отображении 15
3, Стабильные множества 44
4. Стабильные множества с кусочно-гладкой границей . 58
5. Разбиение стабильных мостов 78
6 . Условия стабильности множества программного погло щения 85
7. Стабильные множества в линейной задаче сближения . 89
Литература
- Производные многозначных отображении
- Стабильные множества
- . Условия стабильности множества программного погло щения
- Стабильные множества в линейной задаче сближения
Введение к работе
В диссертации рассматриваются задачи управления по принципу обратной связи, в которых требуется гарантировать приведение управляемой системы на заданное целевое множество при любых зара -нее неизвестных помехах. Эти задачи исследуются в рамках теории дифференциальных игр, и они представляют большой практический и теоретический интерес. Среди первых результатов, относящихся к теории дифференциальных игр, можно отметить работы зарубежных математиков Р.Айзекса и У.Флеминга. Фундаментальный вклад в теорию дифференциальных игр составили исследования советских математиков Н.Н.Красовского, Л.С.Понтрягина, Б.Н.Пшеничного и их сотрудников.
Объектом исследования в диссертационной работе являются
U -стабильные мосты. Согласно подходу, описанному в монографии [J9] , U -стабильный мост определяется как множество в пространстве позиций, соединяющее начальную позицию с целевым множеством и обладающее специальным свойством, которое позволяет определить позиционную стратегию, гарантирующую удержание движений на этом мосту вплоть до их встречи с целевым множеством. Если LL -стабильный мост построен, то относительно просто можно определить стратегию, доставляющую решение задачи сближения. Этим обстоятельством объясняется важность изучения
U. -стабильных мостов и разработка вычислительных методов для их построения. Вопросы, связанные с исследованием стабильных мостов, а также эквивалентных или близких к ним понятий и конструкций рассматривались многими авторами (см., например, работы\ш Как правило, в задачах, рассматриваемых в теории дифференпиальных игр, возникают различного рода сингулярности функции цены и границы стабильных мостов не обладают гладкостью (дифференцируемостью), которая позволила бы ограничиться классическими методами. Поэтому представляет интерес попытка использовать не -которые подходы, развитые в последние годы при изучении задач недифференцируемой оптимизации. Как известно, в этих задачах ин-финитезимальный анализ опирается на такие понятия как субдифференциал, обобщенная производная, конусы возможных или касательных направлений и т.д. (см., например, [б, 9 № IB , 5 5, 56, ( о, 9] ). В работах [бо- 62] были рассмотрены ивфинитезимальные свойства локально-лишпицевых функций цены дифференциальной игры. Были получены неравенства для производных по направлению, которые выражают свойства стабильности функции це -ны, обобщают основное уравнение теории дифференциальных игр и единственным образом выделяют функцию цены. Данную работу можно рассматривать как продолжение упомянутых исследований. Основным результатом, представленным в диссертации является определение стабильного моста, базирующееся на понятии производной многозначного отображения, которое по своему содержанию близко к известному понятию конуса возможных направлений. В качестве следствия основного результата дано описание стабильного моста с кусочно-гладкой границей, рассмотрено конечное разбиение стабильного моста на замкнутые подмножества, приведен критерий стабильности множества программного поглощения в случае, когда это множество имеет непустую внутренность.
Диссертация состоит из семи параграфов. Для удобства ссылок в § I приведены некоторые общие определения и известные факты из теории дифференциальных игр. В § 2 дано определение производной многозначного отображения и рассмотрены некоторые свойства этой производной. Приведенные в § 2 результаты можно разбить на три группы. Первую группу составляют свойства, которые сразу следуют из определения производной. Ко второй группе относятся менее
- 5 очевидные факты, в частности, здесь дано описание производных для множеств с кусочно-гладкой границей. В третью группу включены вспомогательные результаты, которые используются в § 3. Основной результат диссертации - теорема 3.1, доказанная в § 3. Эта теорема устанавливает эквивалентность исходного определения стабильного моста и двух новых определений, данных в § 3. В исход -ном определении свойство стабильности определяется с помощью известного оператора программного поглощения (см., например, [я9, Новые определения представляют собой инфинитезимальную форму свойства стабильности. Отметим, что в определении 3.3 свойство стабильности определено в так называемой унифицирован -ной форме, это определение опирается на конструкции, предложен -ше в работах [26, 6 ] .В§4 рассматриваются множества с кусочно-гладкой границей. Указаны достаточные условия, при выполнении которых такие множества будут U -стабильными мостами. Получены также необходимые условия, близкие к достаточным. Эти результаты являются следствием основных теорем, установленные в § 2 и § 3. Значительное место в § 4 занимает анализ соответствующего примера. В следующем параграфе рассмотрено разбиение ста -бильного моста на конечное число замкнутых подмножеств. Показано, что такое разбиение индуцирует разбиение множества допустимых управлений второго игрока. Указанные разбиения согласованы таким образом, что каждая составляющая стабильного моста обладает свойством (X чзтабильности относительно соответствующего подмножества управлений второго игрока. Результаты, представленные в § 6, дополняют исследования условий регулярности множеств программного поглощения [н,29у 63j уо] . Здесь рассмотрен неособый случай (множество программного поглощения с непустой внутренностью). Для этого случая установлен критерий стабильности программного поглощения. В отличие от известных ранее условий регулярности для проверки полученного критерия требуется рассматривать лишь точки, лежащие на границе множества программного поглощения, В последнем параграфе исследуются жнейная дифференциальная игра в случае, когда сечения стабильных мостов являются выпуклыми множествами. Указаны необходимые, а также достаточные условия ста -бильности в рассматриваемом случае. В этих условиях фигурируют верхние и нижние производные по времени опорной функции сечений исследуемых множеств.
Производные многозначных отображении
Пусть дано замкнутое множество W С. R X Я # Рассмотрим многозначное отображение t — W± , где множество VO . вве дено соотношением (1,4). Для этого отображения определим произ водное множество. Для (-в, ь&) 6 R х R полагаем DWkifihUtR :! , Urn (гїк- )/( к- )=ої{.
Определение 2.1. Множество DW ( і/У) назовем про -изводным множеством мюгозначного отображения -Ь - \Х/± (в дальнейшем просто будем называть производным множеством), определенным в точке
Отметим, что приведенное здесь понятие тесно связано с известным понятием конуса возможных направлений, которое используется в современной теории оптимизации (см., например[6, lhSSJ ), в данном параграфе собраны некоторые утверждения, относящиеся к производным множествам. Эти утверждения можно разделить на три группы. Первую из них составляют простые свойства производного множества. Доказательства их приведены для полноты изложения. Ко второй группе относятся менее очевидные утверждения. К третьей группе относятся вспомогательные утверждения, которые будут ис -пользованы ниже при изучении стабильных мостов.
Итак, рассмотрим некоторые простые свойства производного множества. Символами ifl W и д W будем обозначать соответственно внутренность и границу множества W в пространстве Утверждение 2.1. Если (б,с5)&СПЄ W , ToPW{tfu5)-= R ,
Если (, иУ) $ W , то DW(t,vd) = 0 . -16 Это утверждение сразу следует из определения производного множества Утверждение 2.2. Производное множество явля ется замкнутым. Доказательство. Пусть и linx о/с = е(0 . Покажем, что Ыа DW ( ,и?) . С— о Поскольку Ы± 6 DW (-6 ьё) , то по определению 2.1 существует последовательность (с,к С.к) такая, что ОІс = &%№, -&)/( , - ) ГДЄ -ii)k t ( = ! - ) и tCk — t при /с- о . Возьмем последовательность \с\ , где ес Ec+i О ( с 1, 2, - - ) и - о при 6 —9 с . Выберем индекс К (і) так, чтобы /14 - К, ксп - )/( i, ta - ф с, Ъыо - Так как tern, of с - с/0 , то Получаем, что Ы0Ь DV/(t,t). П . Приведем другое эквивалентное определение производного множества. Полагаем , если I , если Ч/ь-0 Здесь символом ottS (w, w J обозначено расстояние от точ - 17 ки до множества W , то есть =, тс п Ц иУ- иг II Введем обозначение zittk) - + Здесь tun in f - НЖНИЙ предел при о — +o Утверждение 2.3. Для Любого (,uT) 6 W 1 вал) і
Доказательство этого утверждения опускаем. В следующем утверждении устаювлена связь между определениями производного множества и конусом возможных положительных направлений (см., например, [і У] ).
Пусть по-прежнему \Х/ с R х R - замкнутое множество. Конус возможных положительных направлений определяется следующим соотношением К Ь,Л) [u,2)efo )x R : 3к , «.yj Л ,о.)х Ra, 1 ,Я )=Ь,я)+г(у,г) + Рк- О, II fall- О при к—[. - 18 Из определений множеств DW(t,u)) и К (,&) сразу получаем
Утверждение 2.4. Для любого
Следующее утверждение характеризует производное множество OW(t u5) в случае, когда \Х/ есть объединение множеств W .
Утверждение 2.5. Пусть W- Vr W , где W С-С /? х л - замкнутые множества, І" - конечное множество. Тогда для любого (-,и?) R х R bW(i,d )= U DWc(t,«y) , U UWLdti). (2.D Здесь D W ( ь ) - производное множество многозначного отображения ь н-+ W± , T (t,i)- {L&T: (t,u ) 6WL\ .
Доказательство. Если С I \ 1 Ы, ) о ( -6} i5) $ W L и в силу утверждения 2.1 D\X/ ( t, us) -= 0 . Поэтому U DWL(ttf)= U DWL(,u)). (2.2) Докажем, что U D\yL(t,u}) (С DW(t,ur) (2.3)
Пусть с/ е .U Ow four) . Тогда существует LQ 6 (rlxfcuS) такой, что а UW (ї,и?) Следовательно, су - 19 ществует последовательность ( ki v5K ) \x/ такая, что of- 6cm [ьбк-глУ)/(K- і) . Очевидно, что (Kiik)e W . Поэтому of & /)W(-6,u7) . Итак вложение (2.3) доказано. Остается показать, что OWfart) О U 0WC(t,«y). (2.4) Ui Пусть cf PW(t,iv) # Тогда по определению множества DW(tfiO) существует последовательность (tk гІЇк) У Этакая, что tint (uJK- иї)/(їк--ь) -of . Так как W - U W и множество I конечное, то существует индекс Сй I и подпоследовательность ( к и к ) такие, что ( у tirK .) (г W при всех у - 4«?,- - .. Очевидно, что turn (tSk. - jy)/(tK: -+)- of Є UW(t,i&) . Итак, вло жение (2.4) доказано. Из соотношений (2.2)-(2.4) следует соотношение (2.1). Q. Перейдем ко второй группе утверждений. Изучим структуру производного множества О W (t, и ) для множеств W специаль ного вида.
Стабильные множества
В этом параграфе с помощью рассмотренного выше понятия производной многозначного отображения дано определение условия стабильности в инфинитезимальной форме.
Пусть движение конфликтно-управляемой системы описывается дифференциальным уравнением (1,1) и правая часть системы удовлетворяет указанным в I условиям 1)-3).
Напомним исходное определение условия U стабильности множества \Х/ С Гх/? в задаче (/Л,Ы) -сближения, где 7 = f -c 9] .
Определение 3.1. Замкнутое множество \Х/с Т R удовлет -воряет условию U -стабильности в задаче (ҐІ, Ы) -сближения, если, каковы бы ни были f , wJ j V/ , { (t } &1 , гГ (г Q , существует решение дифференциального включения bS() 6 F(t а (О, t ] , а( )= и м (3.1) удовлетворяющее условию jhUH )): ] ПЦ4 ) 0- (3.2) Здесь F(?) и 3) и Л ( ) определены соответственно соотношениями (1.5) и (1.8).
Теперь приведем другие определения U -стабильности. Од -нако, прежде чем давать эти определения, введем некоторые обоз -начения. Пусть = {SeR : l/Sl/= і]. Для (&, г Х S) & Тх R х S полагаем - 45 T fa иб} і) = max лип Sy fa ід, и,Я) fe«3) 0 xttQ uf-P r /7 fau?,0 ={ / #": S,tf Jfat s)j- (3.4) Определение 3.2. Замкнутое множество Wc- Tx R называ -ется U -стабильным, если для любых fatu) Є dW\ Л1 и DWfacD) П F fauX, хУ) ?. (3.5) Л Определение 3.3. Замкнутое множество \Х/ с- Т R называется U -стабильным, если Со PWfeu» П П(&,1#, і J 0 (3.6) для любых ( ,() еЪ\К/\ Л\ и S -S Напомним, что DW ( , ) /? для / , ) б-с/? V/ . Поэтому Л -стабильное множество удовлетворяет соотношениям (3.5) и (3.6) не только при fa ) Э\ ЛМ, да и в любой точке
Основным результатом этого параграфа является следующая Теорема 3.1. Определения 3.1, 3.2, 3.3 эквивалентны. Доказательство. Шаг I. Докажем, что из определения 3.1 следует определение 3.2. Пусть (tt и)„)?\Х/\№ ш тУ Є Q . Тогда согласно -46 определению 3,1 для любого t (г (i«t д J существует иї( ) 6 X & 7 ) такое, что J (t,d5( )) . 4, 4 -6 1 1 П к ( ) 0 . Здесь X( ,i 3 ) тУ) - множество решений дифференциального включения (3,1), Полагаем 6(U,t", S„Z) = J(t,iSM): Uin ,tS(-)(-X( „ 5„ й)\. Пусть tK ( к- 1,2,... ) - последовательность такая, что щ и Ьк —9 при К — о Так как/ ,1-J $-М и М - замкнутое множество, то при всех К К t где К достаточное большое число. Следовательно, существует и5к( ) X / , « , х?"} , та« кое, что (-6-ї , о$к(-б)) &W. Многозначное отображение (,ь$)\—» F(,,$) непрерывно, а функции w5 f ) удовлетворяют условию Липшица с общей константой. Поэтому из определения решений и к () (г X (t vb, г ) следует, что u K(t )-= + -( - ±«) + +fr(tl9) , где е- F(U, tZ f)(K /О, //# // — О при К —» о . Без ограничения общности можно принять, что /к - / при К - ? , где 6 Я , «Д: , i \) . Тогда получаем Напомним, что (tK } u)K (tK )) & W . По определению производного множества D\K/ (iV) іл) ) имеем - 47 6 PW( ,i ). Итак доказано, что пересечение непусто и содержит элемент 1К Импликация определение 3.1 =ф определение 3.2 установлена. Шаг 2 Докажем, что из определения 3.2 следует определение 3.1. Пусть замкнутое множество \Л/ с: ТX R удовлетворяет определению 3.2. Выберем (tщt ь5ч) ьЧ/ , і ( , Pi, гУ & Q Определим множества
Пусть А постоянная Липшица в условии (1.2), в ко -тором полагаем G- G . , Рассмотрим функцию yV J= I [\ pfcA)+ ] ol 0. (3.7) Очевидно» что р ( , ) го при -ь & Г , і ] так Iff , /): -6 -б m [ -+о при {-»о. Поэтому можно выбрать а(0 о так, чтобы р(-6,л) 1 при всех [ ) ± 1 я ol [о, и0 ] - 48 Для ( ,&, ) (rl lxR х(о,л0) и гдО) tX(i t 4 О) полагаем [cUHr($t%)-P( M) , если Wt 0 I &o , если VC = 0 T ( () ) 6 [t ]: fit, tSMj) oj Т0(и ()}Л) = так] : -6 6 Т(ъ5(), 0()\ t - /rc (ts(-1 u): tS(-) б X(u , J) j .
Отметим, что функция (і, «5") —» ole l-efiS, W j (при W+ - 0 полагаем oUs-6 (іл), W+ ) — v ) полунепрерывна снизу. Этот факт - следствие замкнутости множество V/ , Поскольку функция непрерывна, то функция (, &) — /4 4 тоже полунепрерывна снизу. Учитывая непрерывность функции 11-+ i(t) , получаем, что функция — frfariftltt) полунепрерывна снизу, а множество T(t 5()? и) замкнуто. Покажем, что функционал t5() i- r (t(-)t.ol) полунепреры -вен сверху.
Пусть г&к[-) — и5 (-) , 6Іе Ть(ідк())Сі) Гі(ТфжК- . Требуется показать, что Т0[ь5 (-)) 4 ) , Z . Поскольку множества Tft6K(-)t и) замкнуты, то lk, tbK(ik)}0l) o (к - і, 2- -,J. Из сходимости (-6 к І к ( )) —-» {Т ., «3«Yr )J и полу непрерывности снизу функции (-6, и ) і—9- 1//(-6, глУл ) следует, что /Yr « fr jJ O, Т.Є, Г (гГ(и ь( ),чі) и T0(uJ()jD ) Гл .
. Условия стабильности множества программного погло щения
Справедливо следующее необходимое условие U -стабильности множества \Л/ вида (4.6). Теорема 4.3. Пусть множество U/c Г R вида (4.6) яв -ляется U -стабильным мостом в задаче М, Ы) чзближения.
Тогда для любого (tt иУ) е Ь W \ (Л тактів rrua /пах vg UttY (/) . О, (4.7) где #(rQ , feF( ,tfi,t ) , Ltrlol tO) ,jtZ(i,tt иУ ) . - 62 Здесь множества 10 () ьд) и Уа (t} t, і 5) опреде -лены соотношением (2,22).
Доказательство этой теоремы совпадает, в основном, с дока -зательством теоремы 4,1, Отличие состоит в замене множества /У/-;ыУ) (2,19) на множество ///-б, кУ) (2.23).
Сформулируем достаточное условие U -стабильности множества \Х/ вида (4.6). Теорема 4.4, Пусть задано множество ]//cz Тх R вида (4.6), удовлетворяющее условиям Y/ с /V , V/& С А)е . Пусть для каждой точки (, -&) bW\ /Л выполнено соотношение/ - (t u$) г0 при всех С & То (-6, иУ) и неравенство (4.7), где множество Hi it, t&) определено соотношением (2.25).
Тогда множество W является (А -стабильным мостом в задаче ((А} ы) -сближения.
Чтобы установить справедливость этого утверждения, можно воспользоваться доказательством теоремы 4.2, в котором следует заменить множество Н { , ьд) (2.19) множеством // fa z$) (2.23) и ссылку на теорему 2.2, ссылкой на теорему 2.3, Поэтому доказательства этой теоремы опускаем.
Отметим одно следствие теоремы 4.4 и утверждения 2.8. Полагаем Х.рлгіфу.ил )- ШМ1;0 I1 где с 6 1.(і, tS). Следствие 4.2. Пусть задано множество \К/с Т /? вида (4.6), удовлетворяющее условиям W d N , WQCZ Л1$ . Пусть при всех (t,i&) 6-bW\tA выполняется неравенство (4,7). И пусть для всех ( -Ь) ьСг) Є Ъ W \ /Л и І е- Т0 fa с) справедливо неравенство Ч —L : о при всех - 63 j& jfofijt, г&) \ Jo» ( Ljt, t) и существует такой век тор такой, что Тогда множество \Х/ является U -стабильным мостом в задаче fAl, N) -сближения,
В приведенных ниже примерах используются полученные достаточные условия ІІ -стабильности множеств с кусочно-гладкой гра -ницей.
Пример 4.1. Пусть поведение конфликтно-управляемой системы описывается уравнением t = t5l-h j гя- U3 (4.8) где управляющие воздействия U и х) стеснены ограничениями / U I 1 , \хХ 11 1 . Игра происходит на промежутке времени Т - [о, z] . Для вектора і - (О, і ) имеем -— , с ) О . Итак, условия утверждения 4.1 при (Ъ,и ) f2 Wy выполняются. Поскольку множество \Д/ является симметричным относитель но оси времени, то для точек проверка условии утверждения 4.1 проводится аналогично случаю [6, ьд) & d\X/L Значит при ( t,i) & Sz все условия утверждения 4,1 выполняются. Так как множество \Л/ симметричное относительно оси времени, то условия утверждения 4.1 для точек (t,tS) & $3 и (t, z3) Є 5ч проверяются аналогичным образом.
Итак, из соотношения (4.10) следует, что для каждой точки (-,ъ5) бЭ\У условия утверждения 4 1 выполняются. Следовательно, множество W вида (4.9) является U -стабильным мостом в задаче сближения для системы (4.8). Значит при всех (-6, сд) &rdV/ условия утверждения 4.2 выполняются. Следовательно, множество U/ , определенное соотношением (4.15) является U -стабильным мостом в задаче А1уА/у-сближения системы (4.14).
Стабильные множества в линейной задаче сближения
Теорема 6.1« Пусть для множества программного поглощения имеет место неособый случай. Тогда для того, чтобы множество программного поглощения было U -стабильным мостом в рассмат риваемой задаче (h,N) -сближения необходимо и достаточно, чтобы для любых -6 6 (- v) & J и ъБ t bV/ выполнялось не равенство тих /кс/г /пах [ Ш)и }% - теп Ш)и, S + + CMd } s -max CM j s J o.
Доказательство. Отметим, что при / = О имеем W$ -= jiJtftn: /па [ S,uy -p(s)]$0(f # Следовательно, \Х/$ = ІЛ .
Согласю теореме 3.1 и утверждению 6.2 соотношение (6.6) означает, что множество программного поглощения обладает свойством U -стабильности. .
Отметим, что условие стабильности (б.6) по форме близко к известным условиям стабильности программного поглощения р9, 6V] . Отличие теоремы 6.1 от упомянутых результатов состоит в том, что " »v tiP для проверки условия (6.6) рассматриваются точки ыТ e&W ± , в то время как в работах [ 29 6 ] аналогичное условие про -веряется в области U,i5) (- , &]х R : о у fau)) о/ ( , где СС - некоторое положительное число. - 89 7, Стабильные множества в линейной задаче сближения. В этом параграфе, как и в предыдущем, рассматривается задача сближения с выпуклым целевым множеством и фиксированным моментом окончания.
Пусть конфликтно-управляемая система описывается дифференциальным уравнением х = АМх + Лк,с/,с ). (7.1) Предполагается, что А № - П X /2 -мерная непрерывная матрица-функция, h () Т х Р KQ І— R непрерывна по совокупности аргументов и удовлетворяет условию men max S} h U u ) - max men S, A/ и,гУ) , В задаче (PA,N)-сближения, которая рассматривается для системы (7.1) будем полагать, что А1 - {(0,х)\ X & Л1 , где РА - выпуклый компакт в R , а N - замкнутое множе -ство с выпуклыми сечениями /V. - f Х& R : /V,)c)/Vj . Известно, что систему (7.1) можно привести в виду Cj - 4 (t,U,x ). (7.2) При этом фазовое ограничение Л/ преобразуется в множе -ство /\/ =//4/).- = 9V , J V 4х) &N\ , где Ср( ,е) удовлетворяет матричному дифференциальному уравнению Ф( -.6) = - 4 (t, в) ЛМ, ЯР( , 0)= Е, - 90 где В - единичная П X /I -мерная матрица. Как известно (см., например, [29, 6Z] ), достаточно уметь решать соответствующую задачу сближения для системы (7 2). Поэтому в дальнейшем результаты и их доказательства приведены для преобразованной системы.
Пусть задано замкнутое множество \Х/сТ Р Будем пред -полагать, что при каждом Т W . является выпуклым компактом. Отметим, что этим требованиям удовлетворяет максимальный U -стабильный мост (см., например, [Я9, 6Z] ). Поскольку S & S произвольное, то получаем утверждение теоремы. О.
Рассмотрим достаточные условия U -стабильности. Справедливо Утверждение 7.1. Пусть задаю замкнутое множество \Л/ с: 7"V R , удовлетворяющее условиям \X/cz /V , V/g AI . Предположим, что при всех -Ь Т выполняется неравенство Ln [о/ "/ M/d&- так trua sJ ffac/, гї) I о, (7.6) тде S & S , гУЄ-Q , С/ Р . Тогда множество W является U -стабильным мостом в задаче (Л1, N) нзближения системы (7.2).
Доказательство. Пусть l , и$ ) &\М , &(t - B] t5 & Q Символом Х( , , х5 j обозначаем множество - 93 -всех абсолютно-непрерывных решений дифференциального уравнения дМ = $( иМл ), ЯЦ,)= «J при всевозможных измеримых управлениях Щ) : [t ,&] — Р Для S S , гб(-) Xf ,u , ) обозначим s = S"pf Го(Ж-Ъ s): () 6 Хи , Л )\.
Из замкнутости множества W следует, что множество T(tjS( )i SJ тоже замкнуто. Далее можно проверить, что функционал ttS f) — Т0 (гб(-1 S ) полунепрерывен сверху (см. анало -гичные рассуждения в доказательстве 3,1),