Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разрывная функция цены в игровых задачах быстродействия Камнева Людмила Валерьевна

Разрывная функция цены в игровых задачах быстродействия
<
Разрывная функция цены в игровых задачах быстродействия Разрывная функция цены в игровых задачах быстродействия Разрывная функция цены в игровых задачах быстродействия Разрывная функция цены в игровых задачах быстродействия Разрывная функция цены в игровых задачах быстродействия Разрывная функция цены в игровых задачах быстродействия Разрывная функция цены в игровых задачах быстродействия Разрывная функция цены в игровых задачах быстродействия Разрывная функция цены в игровых задачах быстродействия
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Камнева Людмила Валерьевна. Разрывная функция цены в игровых задачах быстродействия : диссертация... кандидата физико-математических наук : 01.01.02 Екатеринбург, 2007 120 с. РГБ ОД, 61:07-1/978

Содержание к диссертации

Введение

1 Достаточные условия совпадения разрывной функции с функцией цены в игровых задачах быстродействия 15

1.1 Постановка задачи 15

1.2 Свойства и- и г>-стабильных функций 17

1.3 Свойства функции цены игры 22

1.4 Теорема 1 о достаточных условиях 24

1.5 Теорема 2 о достаточных условиях 31

1.5.1 Корректно сжимаемые множества 31

1.5.2 Формулировка и доказательство теоремы 34

1.5.3 Пример 39

2 Достаточные условия стабильности функции в терминах сингулярных точек 44

2.1 Критерии стабильности полунепрерывной функции 44

2.2 Простейшие сингулярные точки 49

2.3 Рассеивающие и экивокальные сингулярные точки 51

2.4 Теорема 3 о достаточных условиях стабильности 53

3 Управление материальной точкой на прямой при наличии помехи 56

3.1 Постановка задачи 56

3.2 Обоснование решения задачи 61

4 Игровая задача о брахистохроне 70

4.1 Постановка задачи 70

4.2 Характеристическая система для уравнения Айзекса - Белл-мана 71

4.3 Первичные семейства характеристик 77

4.4 Построение рассеивающей линии 87

4.5 Построение экивокальной линии при h > w2 87

4.6 Вторичное поле характеристик при h> w2 94

4.7 Определение функции

4.8 Обоснование решения задачи 100

Литература 114

Введение к работе

В диссертации исследуются вопросы, связанные с обоснованием аналитического построения разрывной функции цены в дифференциальных играх быстродействия. Используется подход, основанный на теории минимаксных решений краевой задачи для уравнения в частных производных первого порядка, разработанной А.И. Субботиным.

В теории дифференциальных игр изучаются задачи управления по принципу обратной связи в условиях неопределенности и помех. Исследования дифференциальных игр начались в 1950—60-е годы с рассмотрения математических моделей конфликтных ситуаций. В этих моделях динамика управляемой системы описывается обыкновенными дифференциальными уравнениями, в правую часть которых входят управляющие воздействия. Полезное управление рассматривается как действие первого игрока, минимизирующего некоторый функционал на множестве траекторий системы, а помеха считается результатом управления второго игрока, цель которого состоит в максимизации того же функционала. Управления игроков стеснены геометрическими ограничениями.

В отчетах Р. Айзекса [44-48] и его монографии [1] был предложен метод исследования игровых задач управления и рассмотрено большое число содержательных примеров. Однако строгой математической постановки дифференциальной игры при этом не было.

В дальнейшем были разработаны различные варианты формализации дифференциальных игр, среди которых отметим подход W.H. Fleming [43], основанный на аппроксимации дифференциальной игры многошаговыми играми, а также подход, использующий понятие неупреждающих стратегий и развитый в работах R.J. Elliott и N.J. Kalton [42].

Удобной с практической точки зрения является позиционная формализация дифференциальных игр, изложенная в книге Н.Н. Красовского и А.И.Субботина [6]. В рамках позиционной формализации подход к реше-

Введение

нию дифференциальной игры заключается в поиске функции цены, которая каждой точке пространства состояний системы ставит в соответствие оптимальный гарантированный результат в игре, начинающейся из этой точки. На базе функции цены можно построить стратегии оптимального управления по принципу обратной связи [5]. Отметим, что цена позиционной дифференциальной игры для заданной начальной точки совпадает с ценой в смысле W.H. Fleming или с ценой в классе неупреждающих стратегий в случаях, когда обе величины существуют.

В диссертации рассматриваются игры, в которых функционалом платы является время до попадания фазовой точки на заданное замкнутое терминальное множество М С Rn. Такие игры называются дифференциальными играми быстродействия. К ним относятся, например, задачи преследования-уклонения, а также задачи оптимального быстродействия в теории управления, которые можно рассматривать как игровые задачи при нулевом ограничении на управление второго игрока.

Предположим, что динамика управляемой системы описывается уравнением

x(t) = f(x{t),u{t), v(t)), t > 0, x(0) = x0eRn\M.

Здесь x(t) Є Rn - фазовый вектор в момент времени t; u(t) Є Р и v(t) Є Q - управления минимизирующего и максимизирующего игроков; Р и Q -компакты в конечномерных пространствах. Пусть функция / непрерывна по совокупности переменных, удовлетворяет условию подлинейного роста и локальному условию Липшица по переменной х. Кроме того,

Н(х,р) = min max (р, f(x, u, v)) = max mm{p,f(x,u,v)).

uGP veQ v.Q иЄР

В рамках позиционной формализации указанные условия обеспечивают существование функции цены Xq ь-> Т(хо) [0, со] дифференциальной игры быстродействия.

Рассмотрим краевую задачу для уравнения в частных производных первого порядка (уравнения Айзекса - Беллмана):

#(s,Vr(s)) = -l, xeRn\M, (0.1)

Т(х) = 0, х G дМ. (0.2)

В книге Р. Айзекса [1] показано, что классическое решение задачи (0.1), (0.2) (если оно существует) совпадает с функцией цены Г(-)

Введение

дифференциальной игры быстродействия. Таким образом, при некоторых дополнительных условиях гладкости для нахождения дифференцируемой функции цены может быть использован метод классических характеристик [9] решения краевой задачи (0.1), (0.2).

В общем случае функция цены дифференциальной игры быстродействия может быть негладкой, разрывной, и, кроме того, может принимать несобственное значение со. Метод построения кусочно-гладкой или разрывной функции цены, предложенный Р. Айзексом, заключается в последовательном нахождении гладких ветвей решения при помощи классических характеристик. Основная трудность применения метода Айзекса состоит в обнаружении поверхностей стыковки (сингулярных поверхностей) гладких ветвей функции цены. Р. Айзексом были рассмотрены различные типы сингулярных поверхностей и некоторые способы их построения.

В связи с большими техническими сложностями исследования конкретных задач в настоящее время известно не очень много работ, в которых проведены аналитические построения функции цены дифференциальных игр быстродействия. Среди таких исследований отметим результаты А.А. Меликяна [12,13], B.C. Пацко [14,15], С.А. Чигиря [29], J.V. Breakwell, J.Lewin, A.W.Merz, G.J. Olsder [51,52,54], J. Shinar [60]. Трудность аналитического решения игровых задач быстродействия требует численных алгоритмов решения, которые разрабатывались B.C. Пацко, В.Л.Туровой [27, 58, 59], В.Н.Ушаковым [61], M.Bardi, M.Falcone, P.Soravia [31-34], P.M.Cardaliaguet, M.Quincampoix, P.Saint-Pierre [38,40] и другими авторами.

В теории оптимального управления аналогом подхода к решению задачи на базе функции цены является метод динамического программирования. Если функция оптимального результата (функция Беллмана) дифференцируема, то ее поиск сводится к решению соответствующей краевой задачи для уравнения в частных производных (УЧП) первого порядка. В этом случае с помощью функции Беллмана определяется оптимальное управление по принципу обратной связи. Если функция Беллмана является негладкой, но непрерывной, то для решения задачи в классе управлений по принципу обратной связи может быть использован регулярный синтез В.Г.Болтянского [2]. Задачи оптимального быстродействия с разрывной функцией Беллмана исследовались, например, в работах G. Leitmann, Н. Frankowska, P. Cannarsa [37,50] и многих других [30,55].

Введение

Поскольку для краевой задачи Дирихле (0.1), (0.2) на множестве Rn\M функция цены Т(-) содержательно определяет единственное разрывное решение, то конструкции теории позиционных дифференциальных игр можно использовать для определения обобщенных решений краевых задач для УЧП первого порядка. Такой подход лежит в основе теории минимаксных решений А.И. Субботина [22,23], которую можно применить для обоснования правильности построения функции цены.

В своих работах А.И. Субботиным дано определение разрывного минимаксного решения и(-) краевой задачи Дирихле:

H{x,Vu>{x))-u(x) = -l, xeRn\M, (0.3)

ш(х) = 0, хе dM. (0.4)

Для этого сначала вводятся определения верхних и нижних минимаксных решений уравнения (0.3). Верхнее (нижнее) минимаксное решение уравнения (0.3) определяется как полунепрерывная снизу (сверху) функция

и(-):Д"\М->Д,

надграфик (подграфик) которой слабо инвариантен относительно соответствующего характеристического дифференциального включения. Указанные свойства слабой инвариантности совпадают со свойствами u-стабильности и -у-стабильности функции цены. Кроме того, существуют различные эквивалентные способы определения верхних и нижних минимаксных решений.

Верхним решением задачи (0.3), (0.4) называется верхнее минимаксное решение и(-) уравнения (0.3), удовлетворяющее краевому условию (0.4) и оценке

\и(х)\<1, xeRn\M. (0.5)

Нижним решением задачи (0.3), (0.4) называется нижнее минимаксное решение си(-) уравнения (0.3), непрерывное в каждой точке х Є дМ, удовлетворяющее краевому условию (0.4) и оценке (0.5). '

Минимаксным решением задачи (0.3), (0.4) называется функция и(>) : Rn\M —> R такая, что существует последовательность верхних решений си^(-) и последовательность нижних решений uJk{-), к Є N, которые поточечно сходятся к функции и(-).

Введение

Определения верхних и нижних решений несимметричны: нижние решения должны быть непрерывны в каждой точке х Є дМ, что не требуется для верхнего решения. Это связано со свойством единственности минимаксного решения.

В работах А.И.Субботина доказано существование и единственность минимаксного решения краевой задачи (0.3), (0.4) и его совпадение с минимальным верхним решением. Классическое (т.е. гладкое) решение задачи (0.3), (0.4) (если оно существует) удовлетворяет определению минимаксного решения. Кроме того, показано, что функция цены Т(-) дифференциальной игры быстродействия и минимаксное решение uj(-) связаны равенством

ш(х) = 1 - exp(-T(z)), х Є Rn\M. (0.6)

Отмечено также, что в случае непрерывного минимаксного решения оно одновременно является верхним и нижним решением соответствующей краевой задачи. Преобразование вида (0.6), предложенное С.Н. Кружковым [7], используется в теории УЧП первого порядка в тех случаях, когда нужно перейти к ограниченным решениям.

Опираясь на связь функции цены дифференциальной игры и минимаксного решения краевой задачи (0.3), (0.4), получаем, что в задачах быстродействия функция цены является единственной полунепрерывной снизу «-стабильной функцией, удовлетворяющей нулевому краевому условию на границе множества М, к которой поточечно сходится последовательность полунепрерывных сверху ^-стабильных функций, удовлетворяющих тому же краевому условию и непрерывных на границе множества М. Однако проверка существования указанной последовательности и, тем более, ее построение во всем пространстве игры затруднительны при решении даже задач на плоскости.

Отметим, что существуют другие подходы к определению обобщенных решений краевой задачи (0.3), (0.4). Наиболее известно понятие непрерывного вязкостного решения, которое ввели в начале 80-х годов M.G. Crandall и P.L. Lions [41]. В работах M.Bardi, I. Capuzzo-Dolcetta [32], S.Bottacin, М. Falcone [31], P. Soravia [34] было предложено и исследовано понятие разрывного е-решения (envelope solution) краевой задачи (0.3), (0.4), определение которого опирается на понятия вязкостных верхних и нижних решений, отмечено совпадение е-решения с минимаксным решением и разработаны численные схемы построения е-решения.

Введение

Краткое содержание работы

Первая глава диссертации состоит из пяти параграфов и посвящена формулировке и доказательству двух теорем о достаточных условиях совпадения разрывной тестируемой функции с функцией цены рассматриваемой дифференциальной игры.

В параграфе 1.1 описывается дифференциальная игра быстродействия в позиционной формализации и дается определение ее функции цены

T(-):Rn\M^R+.

Предположим, что на замкнутом множестве Q С Rn определена некоторая функция

>(): А->[0,оо].

Задача состоит в нахождении таких условий на функцию (/?(), при которых выполнено равенство ip(x) = Т(х), х Є IX Искомые условия должны быть удобными для практической проверки.

В параграфе 1.2 определяются понятия и- и ^-стабильных функций на открытом множестве G С Rn.

Определение 0.1. Функция и(-) : G — [0, со] и-стабильна на открытом множестве GC Д", если она полунепрерывна снизу и для любых у$ Є G, v* Є Q существуют г > 0 и такое решение у(-) : [0,т] —> G дифференциального включения

y(t) Є со {f(y(t),u,v*):ueP}, у{0) = у0,

что выполнено неравенство u){y(t)) < to{yo) — t,t Є [0, г].

Определение 0.2. Функция <>() : G —> [0, со] v-стабильна на открытом множестве G С Rr\ если она полунепрерывна сверху и для любых у$ Є G, w* Є Р существуют г > 0 и такое решение у(-) : [0, г] —> G дифференциального включения

y(t) Є со {f(y(t), и,, v):v Q}, у(0) = у0,

что выполнено неравенство ui(y(t)) > й(уо) — t,t Є [0, г].

По аналогии с теорией минимаксных решений в леммах 1.1,1.2 устанавливается связь и- и ^-стабильных функций с функцией цены Т(-) дифференциальной игры.

Введение

Основные свойства функции цены игры, которые используются в дальнейшем, приведены в параграфе 1.3. Там же доказана лемма 1.3 о непрерывном изменении цены игры для заданной начальной точки при расширении терминального множества.

Параграф 1.4 посвящен формулировке и доказательству теоремы 1 о достаточных условиях. В работах А.И. Субботина при доказательстве теоремы о связи функции цены игры и минимаксного решения соответствующей краевой задачи последовательность v-стабильных функций (нижних решений) используется для конструирования подходящих позиционных стратегий уклонения от окрестности множества М на заданном промежутке времени. Если указанная последовательность определена лишь в некоторой открытой окрестности, пересекающейся с множеством М, то такие же методы построения позиционных стратегий уклонения можно применить для начальных точек, из которых допустимые траектории системы не покидают эту окрестность на заданном промежутке времени. Эта идея используется для доказательства теоремы 1. Условия теоремы требуют проверки свойств, аналогичных свойствам разрывного минимаксного решения, но в сколь угодно малых окрестностях подмножеств, на которые разбиваются границы множеств уровня тестируемой функции. Рассмотрение нескольких окрестностей делает полученные условия более удобными для практической проверки, чем непосредственное использование определения разрывного минимаксного решения. Применение теоремы 1 проиллюстрировано в третьей и четвертой главах диссертации на двух примерах игровых задач быстродействия на плоскости.

В параграфе 1.5 формулируется и доказывается теорема 2 о достаточных условиях. Условия теоремы предполагают проверку и-стабильности тестируемой функции, ^-стабильности ее перезамыкания (т.е. функции с замкнутым подграфиком) и проверку введенного в диссертации свойства корректной сжимаемости множеств уровня тестируемой функции. Проверка последнего свойства затруднительна. Поэтому применение теоремы 2 не иллюстрируется. Однако приводится пример игровой задачи быстродействия на плоскости, показывающий, что требование корректной сжимаемости множеств уровня тестируемой функции исключить нельзя (без какой-либо замены).

Предлагаемые в первой главе достаточные условия оптимальности справедливы и для задач управления, поскольку задачи теории управле-

Введение

ния можно рассматривать как частный случай задач теории дифференциальных игр (при нулевом ограничении на управление второго игрока). Однако каких-либо упрощений в формулировке условий не появляется.

Условия обеих теорем включают в себя проверку свойств и- и ^-стабильности полунепрерывных функций. Во второй главе, состоящей из четырех параграфов, сформулированы утверждения, упрощающие такую проверку. При этом используются различные инфинитезимальные критерии и- и ^-стабильности.

В параграфе 2.1 в виде утверждения 2.1 сформулированы инфинитезимальные критерии стабильности функции

w(.):G->[0,oo]

на открытом множестве G, доказанные в работах А.И. Субботина. Такие критерии предполагают в каждой точке рассматриваемой области проверку неравенств для верхней или нижней производной по направлению функции, получаемой после преобразования Кружкова. Утверждения 2.2-2.7 упрощают проверку указанных неравенств в некоторых частных случаях.

В теории дифференциальных игр для функции цены Т(-) известны [1,35,53] различные типы сингулярных поверхностей, в точках которых оптимальные движения имеют те или иные особенности. Классификация основана на анализе поведения оптимальных траекторий в окрестности сингулярной поверхности и учете возможности особых оптимальных движений, идущих вдоль самой сингулярной поверхности. В частности, важными являются рассеивающие и экивокальные сингулярные поверхности. На них функция цены Т(-) является недифференцируемой. Экивокальные сингулярные поверхности характерны именно для дифференциальных игр и не могут возникать в задачах управления с одним игроком. В параграфах 2.2, 2.3 понятия рассеивающей и экивокальной сингулярных поверхностей распространяются на случай функции lu(-) : G —> R. В параграфе 2.4 для класса игр с автономной разделенной динамикой и ограничением на управление второго игрока в виде линейного отрезка доказана теорема 3 о том, что в точках рассеивающей и экивокальной сингулярных поверхностей автоматически выполнены инфинитезимальные свойства и-и ^-стабильности. Теорема 3 используется в главах 3 и 4 для доказательства свойств и- и ^-стабильности на сингулярных линиях.

Введение

Третья глава диссертации состоит из двух параграфов. В ней рассматривается игровая задача быстродействия на плоскости, представляющая собой модификацию известной задачи "мальчик и крокодил" [19,21]. Динамика системы и ограничения на управления игроков имеют вид

Х\=Х2~ V, X2 = U, \и\ < Ц, 0 < V < V.

Первый игрок минимизирует время перевода фазовой точки х = {х\,Х2) из заданного начального положения xq на терминальное множество М = (О, а)т, а > v, интересы второго противоположны.

Ранее исследования такой игры проводились в работах B.C. Пацко [14, 15] и М.Ю. Филимонова [28]. Основываясь на результатах этих работ, в параграфе 3.1 на некотором ограниченном множестве описывается построение тестируемой функции, которая разрывна на области определения. В параграфе 3.2 проведена проверка всех условий теоремы 1, которая дает совпадение тестируемой функции с функцией цены игры.

В четвертой главе, состоящей из восьми параграфов, рассматривается игровая задача о брахистохроне.

Впервые вариант игровой постановки задачи о брахистохроне был исследован в книге Р. Айзекса, где классическая задача вариационного исчисления о кривой наискорейшего спуска [10] была записана в виде задачи управления. Кроме того, в динамику системы была добавлена помеха, рассматриваемая как действие второго игрока. Выбраны множества ограничений на управление второго игрока и терминальное множество. Решение, приведенное в книге Р. Айзекса, в дальнейшем было уточнено и дополнено в работах М.Л. Лидова [И] и С.А. Чигиря [29].

Постановка рассматриваемой в четвертой главе задачи о брахистохроне отличается от постановки Р. Айзекса формой терминального множества и ограничением на управление второго игрока. Динамика системы и ограничения на управления игроков имеют вид

х\ = , Х2 = ^/x~2~smu-hwv,

иЄР=[0,2тг], v Є Q = [-1,1), >0, я0ЄР+,

где R2+ - верхняя полуплоскость. Первый (второй) игрок минимизирует (максимизирует) время достижения терминального множества М = [-g!,0] х [0,Л]; ги, d,h>0.

Введение

В параграфах 4.1-4.7, основываясь на методе Айзекса обработки полей классических характеристик, строится тестируемая функция Щ_. В процессе построения возникают барьерные линии, на которых функция ip(-) является негладкой. Отметим, что экивокальные сингулярные линии являются специфическими именно для дифференциальных игр и не могут возникать в задачах управления с одним игроком. Исследована зависимость функции ^() от высоты h терминального множества.

С помощью теоремы 1 в параграфе 4.8 показывается совпадение тестируемой функции с функцией цены игры. Обоснование решения задачи усложняется тем, что правая часть динамики системы не удовлетворяет классическим условиям существования цены игры, а именно, локальному условию Липшица по фазовой переменной.

Основные результаты диссертации

1. Доказаны две теоремы о достаточных условиях совпадения раз
рывной тестируемой функции с функцией цены дифференциальной игры
быстродействия.

  1. Доказана теорема о достаточных условиях выполнения инфинитези-мальных свойств стабильности в терминах сингулярных (рассеивающих и экивокальных) точек.

  2. Исследована задача о брахистохроне в игровой постановке, полученное решение обосновано.

Автор работы выражает глубокую благодарность научному руководителю к.ф.-м.н. Пацко Валерию Семеновичу за постоянное внимание к работе.

Свойства и- и г>-стабильных функций

Первый игрок минимизирует время перевода фазовой точки х = {х\,Х2) из заданного начального положения XQ на терминальное множество М = (О, а)т, а v, интересы второго противоположны. Ранее исследования такой игры проводились в работах B.C. Пацко [14, 15] и М.Ю. Филимонова [28]. Основываясь на результатах этих работ, в параграфе 3.1 на некотором ограниченном множестве описывается построение тестируемой функции, которая разрывна на области определения. В параграфе 3.2 проведена проверка всех условий теоремы 1, которая дает совпадение тестируемой функции с функцией цены игры. В четвертой главе, состоящей из восьми параграфов, рассматривается игровая задача о брахистохроне. Впервые вариант игровой постановки задачи о брахистохроне был исследован в книге Р. Айзекса, где классическая задача вариационного исчисления о кривой наискорейшего спуска [10] была записана в виде задачи управления. Кроме того, в динамику системы была добавлена помеха, рассматриваемая как действие второго игрока. Выбраны множества ограничений на управление второго игрока и терминальное множество. Решение, приведенное в книге Р. Айзекса, в дальнейшем было уточнено и дополнено в работах М.Л. Лидова [И] и С.А. Чигиря [29].

Постановка рассматриваемой в четвертой главе задачи о брахистохроне отличается от постановки Р. Айзекса формой терминального множества и ограничением на управление второго игрока. Динамика системы и ограничения на управления игроков имеют вид где R2+ - верхняя полуплоскость. Первый (второй) игрок минимизирует (максимизирует) время достижения терминального множества М = [-G!,0] х [0,Л]; ги, d,h 0. В параграфах 4.1-4.7, основываясь на методе Айзекса обработки полей классических характеристик, строится тестируемая функция /?(), определенная в полуплоскости Щ_. В процессе построения возникают барьерные линии, на которых функция /?() разрывна, а также рассеивающие и экивокальные сингулярные линии, на которых функция ip(-) является негладкой. Отметим, что экивокальные сингулярные линии являются специфическими именно для дифференциальных игр и не могут возникать в задачах управления с одним игроком. Исследована зависимость функции () от высоты h терминального множества. С помощью теоремы 1 в параграфе 4.8 показывается совпадение тестируемой функции с функцией цены игры. Обоснование решения задачи усложняется тем, что правая часть динамики системы не удовлетворяет классическим условиям существования цены игры, а именно, локальному условию Липшица по фазовой переменной.

Основные результаты диссертации 1. Доказаны две теоремы о достаточных условиях совпадения раз рывной тестируемой функции с функцией цены дифференциальной игры быстродействия. 2. Доказана теорема о достаточных условиях выполнения инфинитези-мальных свойств стабильности в терминах сингулярных (рассеивающих и экивокальных) точек. 3. Исследована задача о брахистохроне в игровой постановке, полученное решение обосновано. Автор работы выражает глубокую благодарность научному руководителю к.ф.-м.н. Пацко Валерию Семеновичу за постоянное внимание к работе.

Формулировка и доказательство теоремы

Полунепрерывную сверху функцию /? () : Дп —» [0,оо], определяемую формулой (1.35), будем называть верхним замыканием функции () : ft - [0,оо]. Замечание 1. Пусть для функции () выполнены условия (А1)-(АЗ) и условие корректной сжимаемости множеств D(t) нарушено лишь в некоторой точке а Є (0, supzea p{z)). Тогда теорему о достаточных условиях можно применить сначала к функции (/?() : D{a) — [0, со).

Это даст равенство р(х) = Т(х;М), х Є D(a). Далее, вводя обозначения теорему можно применить к функции /?]. : Q — [0, со] и дифференциальной игре с терминальным множеством М\. Отсюда, используя соотношение Т(х] Mi) = Т(х; М) — а, получаем равенство р(х) = Т(х; М) для всех х Є Q. Аналогичным образом теорема может быть применена в случае, когда корректная сжимаемость множеств уровня D(t) функции р(-) нарушена в конечном числе точек из интервала (0, supzeQip(z)). Замечание 2. Из свойства tx-стабильности функции цены и свойства -стабильности верхнего замыкания функции цены следует, что условия (А1)-(АЗ) являются необходимыми для функции цены.игры Т(-;М) : Дп- [0,оо]. После доказательства теоремы будет приведен пример, показывающий, что в случае разрывной функции (р(-) условий (А1)-(АЗ) недостаточно для выполнения равенства (1.36), т.е. нельзя отказаться от условия (А4). Докажем сначала несколько вспомогательных утверждений. Лемма 1.5.

Пусть замкнутое множество М С Rn и полунепрерывная снизу функция /?() : Q [0, со] удовлетворяют условиям (А1) и (А2). Тогда Т(х0;М) р{х0),х0 Є ft. Доказательство. Если XQ Є М, то по условию (А1) имеем Из условия (А2) следует, что W - w-стабильный мост [6] в задаче приведения точки (t,x(t)) на множество [0,$ ] х М. Так как (0,2) Є W , то первый игрок обладает [6] позиционной стратегией, гарантирующей попадание на множество М на отрезке времени [0, $ ]. Из определения цены игры, для любого 5 0 второй игрок обладает позиционной стратегией, гарантирующей уклонение от окрестности мно жества М на отрезке времени [0, #о — ] ПРИ любых действиях первого игрока. Отсюда имеем неравенство $о — $ для любого 5 0. Следо вательно, Лемма 1.6. Пусть замкнутое множество М С йл и полунепрерывная снизу функция /?() : fi -» [0, со] удовлетворяют условиям (А1) и (A3). Кроме того, пусть intM 0. Тогда р (х0) Т(х0; Доказательство. Пусть XQ Є і?" и г? = ( о) сю. Положим Из условия (A3) следует, что W - f-стабильное множество [6]. Так как (0,2) Є W , то второй игрок обладает [6] позиционной стратегией, гарантирующей удержание системы в множестве то второй игрок уклоняется от некоторой окрестности множества МИ на отрезке времени [0, & ] при любых действиях первого игрока. Но первый игрок обладает позиционной стратегией, гарантирующей попадание на МИ на отрезке времени [0, Т(х0; МЩ. Таким образом, її Т(х0; Множество Woo замкнуто и (0, ж0) Є Woo- Из условия (A3) следует, ЧТО И оо - -стабильное множество. Поскольку ц {х) = 0 для любого х G intM, то

Теорема 3 о достаточных условиях стабильности

Если точка х Є E(w) -рассеивающая или экивокальная, причем /2(х ,у+) ф /2(2 , г;-), то в ней выполнены условия стабильности (2.8), (2.9). Доказательство. Рассмотрим точку х Є E(w) и предположим, что вектор р+ — р направлен из G в G+. Учитывая выражение (2.15) для производной по направлению в простейшей сингулярной точке и разделенную динамику системы (1.1), перепишем условия стабильности (2.8), (2.9) в точке х в следующем виде: 1) для любого вектора v Є Q существует такой вектор ipv Є со fi(x , Р), что (р±,фу + 2) для любого вектора и Е Р существует такой вектор фи Є /2(2 , Q), что либо одноэлементно и содержит один из концов отрезка /г (ж, Q), либо совпадает со всем отрезком f2(x,Q). По определению имеем Поскольку G± - регулярные области, то f2(x,V (x)) Є С1 ((2і). Следовательно, /г(ж, (я)) - один из концов отрезка /2(0;, (5) Для любого ж Є С . Введем обозначения Из определения векторов v± и условия /2+ т Л" получаем, что Д - различные концы отрезка В силу определения экивокальной точки получаем, что Следовательно

Таким образом, верно неравенство (2.18). Для случая экивокальной точки и-стабильность доказана. Выполнение условия 2) в точке х следует из неравенства если положить фи = f . Заметим, что предположение о направлении векторар+—р из G в G+ обеспечивает выполнение неравенств (2.9) в рассеивающей и экивокальной точках без тех ограничений на динамику системы (1.1), которые указаны в условии теоремы. Аналогично, если вектор р+ —р направлен из G+ в G , то условия теоремы не используются при доказательстве неравенств (2.8) в рассеивающей и экивокальной точках. Управление материальной точкой на прямой при наличии помехи Рассматривается игровая задача быстродействия на плоскости, представляющая собой модификацию известной задачи "мальчик и крокодил" [19,21]. Цель первого игрока привести движение как можно скорее в заданную точку на плоскости, второй игрок препятствует этому. Ранее исследования такой игры проводилось в работах [14,15,28]. Основываясь на результатах этих работ, на некотором ограниченном множестве описывается построение тестируемой функции, которая разрывна на области определения. Далее проводится проверка всех условий теоремы 1, что дает совпадение тестируемой функции с функцией цены игры. Таким образом, в данной главе результаты глав 1 и 2 применяются к примеру, решение которого известно.

Характеристическая система для уравнения Айзекса - Белл-мана

Построим первичные характеристики, выходящие с допустимой зоны Л(М) [1] терминального множества М. Допустимая зона терминального множества. Дадим сначала определение внешней нормали [4] к замкнутому множеству М С Rn и определение допустимой зоны Л(М). Вектор v[z) Є R2, \v(z)\ = 1, называется внешней нормалью к замкнутому множеству М в точке z Є дМ, если существует такое є 0, что Обозначим через N{z; М) множество внешних нормалей к множеству М в точке z Є 9М. Точка z Є дМ принадлежит допустимой зоне Л(М) множества М, если существует вектор v Є J\f(z;M), такой, что H(z,u) 0. В этом случае вектор v называется допустимой внешней нормалью. Если z Є Л(М) - точка гладкости границы дМ, то множество M{z\ М) одноэлементно и нормаль v Є AT(z; М) является допустимой. Для точек негладкости границы дМ. будем дополнительно указывать множество допустимых внешних нормалей. В случае 2 G Гі имеем J\[(z\M) = {ei} = {(1,0)т}. Поскольку H(z, ei) = - / 0, z2 Є (0, /г), то Гі С Л(М). В случае z Є Г2 имеем J\f(z;M) = {е2} = {(0,1)т}. Поскольку #(2, е2) = їй — Vh, то Г2 С Л(М) только при h w2. Пусть z = (0,h)T. Поскольку ех = (1,0)г N{z;M) и H(z,ev) = то z Є Значения параметра 5, соответствующие допустимым нормалям us Є J\f(z;M), определяются неравенством Таким образом, при h w2 допустимыми являются все нормали из множества J\f(z; М)\ при h w2 допустимыми являются нормали us Є M{z; М) при s Є [0, arcsinVTi/iu). Пусть z = (0,0)г. Очевидно, что тozЛ(M). Характеристики, выходящие из вертикального участка. Построим нижнее поле характеристик, выходящее из множества IY Зададим параметризацию множества Гі: Определим начальные условия (s), (s), s Є (0, /І), для характеристической системы (4.5) в точках множества IY Дифференцируя тождество получаем 2(5) = 0.

Условие (4.6) принимает вид Отсюда следует, что (i(s) = l/y/s. Таким образом, учитывая параметризацию множества Гі, получаем следующие начальные условия Имеем 1(5) ф 0. Следовательно, первые интегралы характеристической системы (4.5) заданы равенствами (4.9), (4.20), (4.22). Поскольку i(s) 0 и величина р\ постоянна вдоль характеристик, то //і = 1. Из эвристических соображений положим \±i — — 1. Значение D = D(s) получаем подстановкой в левую часть уравнения (4.22) начальных условий (4.24) и значения \ii = — 1. Имеем Из формулы (4.13) и начальных условий (4.24) находим значение и = c((s)) для характеристики с параметром s. Получаем Значение Со- = С+(5), s Є (0, /г), для частей характеристик, выходящих из допустимой зоны, находим подстановкой в левую часть уравнения (4.20) начальных условий (4.24) и значений /її = I, Ц2 = —I, a = І. В результате получаем Поскольку [І2 = —1, и = 1, то найдется момент времени f(s) 0, в который произойдет смена значения a = и{р) с +1 на — 1. Множество точек смены значения a = a(p) всех характеристик с параметром s Є (0, /г) образуют кривую С. Явное выражение для кривой С имеет вид Функция L(-) монотонно возрастает и вогнута. Значение Сa = C-(s), s Є (0, h), для частей характеристик, выходящих из точек кривой Д находится подстановкой в левую часть уравнения (4.20) Система алгебраических уравнений (4.9), (4.20), (4.22) неявно задает функции х(-, s), р(-, s) от переменной т [0, со) для значений параметра se(0,/i). Поле первичных характеристик х = x(r,s), выходящих из точек множества Гі, показано в верхней части рис. 4.3 для параметров h — б, w = 2.

Похожие диссертации на Разрывная функция цены в игровых задачах быстродействия