Содержание к диссертации
Введение
Глава 1. Квазилинейные конфликтно управляемые процессы с дополнительными ограничениями 43
1. Групповое преследование одного убегающего 43
2. Конфликтно управляемые процессы с нефикси рованным временем 57
Глава 2. Пример Л.С.Понтрягина со многими участниками 72
3. Вспомогательные результаты 72
4. Положительный базис 74
5. Поимка одного убегающего в примере Л. С. Понтрягина со многими участниками 88
6. Многократная поимка одного убегающего в примере Л. С. Понтрягина 120
7. Нестационарный пример Л. С. Понтрягина 132
8. Линейная задача уклонения от многих преследователей в конусе 143
9. Преследование группы убегающих 148
Глава 3. Преследование группы жестко скоорди нированных убегающих 158
10. Простое преследование группы жестко скоординированных убегающих 158
11. Преследование группы жестко скоординированных убегающих в примере Л.С.Понтрягина 175
Глава 4. "Мягкая" поимка в примере Л. С. Понтрягина 188
12. "Мягкая" поимка одного убегающего 188
13. "Мягкая" поимка группы инерционных объектов 205
14. " Мягкая" поимка группы жестко скоординированных инерционных объектов 214
Глава 5. Существование значения игры преследования со многими участниками 221
15. Постановка задачи, определения, предположения 221
16. Существование цены игры 226
Список литературы
- Конфликтно управляемые процессы с нефикси рованным временем
- Поимка одного убегающего в примере Л. С. Понтрягина со многими участниками
- Преследование группы жестко скоординированных убегающих в примере Л.С.Понтрягина
- Мягкая" поимка группы жестко скоординированных инерционных объектов
Введение к работе
Объектом исследования диссертации являются конфликтно управляемые процессы со многими участниками.
Теория конфликтно управляемых процессов представляет собой интенсивно развивающийся раздел современной математики. В данной теории исследуются задачи управления динамическими процессами в условиях конфликта, который предполагает наличие двух или более сторон, способных воздействовать на процесс с противоположными или несовпадающими целями и оптимизировать заданные функционалы качества процесса. Динамические процессы могут описываться дифференциальными, интегральными, разностными, гибридными и другими уравнениями. Конфликтно управляемые процессы, описываемые обыкновенными дифференциальными уравнениями, называют дифференциальными играми ([7]), термин был введен Р.Айзексом — одним из основоположников теории дифференциальных игр.
Одной из первых работ в этой области, по всей видимости, следует считать работу Г. Штейнгауза, опубликованную в 1925 году, в которой он формулирует задачу преследования.
Становление теории дифференциальных игр относится к началу 60-х годов XX века и связано с именами советских и зарубежных математиков Н.Н. Красовского, Л. С. Понтрягина, Л. А. Петросяна, Б. Н. Пшеничного, Р.Айзекса, У.Флеминга. Крупный вклад в развитие теории дифференциальных игр внесли А. А. Азамов, А. Я. Азимов, Э. Г. Альбрехт, М. Барди, В. Д. Батухтин, Т. Башар, Ю. И. Бердышев, А. Брайсон, М. С. Габриэлян, Н. Л. Григоренко, Р. В. Гамкрелидзе, П. Б. Гусятников, М. И. Гусев, В. Г. Гусейнов, В. И. Жуковский,
В. В. Захаров, М. И. Зеликин, Д. Зонневенд, Р. П. Иванов, А. Ф. Клейменов, А. В. Кряжимский, А. Б. Куржанский, А. Н. Кра-совский, Дж. Лейтман, В. Н. Лагунов, Ю. С. Ледяев, Н. Ю. Лукоянов,
A. А. Меликян, А. В. Мезенцев, Е. Ф. Мищенко, М. С. Никольский,
B. В. Остапенко, Ю. С. Осипов, А. Г. Пашков, В. С. Пацко, Н. Н. Пе
тров, Г. К. Пожарицкий, Е. С. Половинкин, Б. Б. Рихсиев, И. С. Раппо
порт, Н. Ю. Сатимов, А. И. Субботин, Н. Н. Субботина, В. Е. Третьяков,
В. Н. Ушаков, В. И. Ухоботов, У. Флеминг, А. Фридман, Хо-Ю-Ши,
А. Г. Ченцов, Ф. Л. Черноусько, А. А. Чикрий, СВ. Чистяков, Р. Эллиот,
Л. П. Югай и многие другие математики.
Красовским Н.Н. и представителями его научной школы ([66], [68], [69],[8], [10], [65], [70], [71], [187], [186]) создана теория позиционных игр, в основе которой лежит понятие стабильного моста и правило экстремального прицеливания. Для широких классов дифференциальных игр доказана теорема об альтернативе ([66], [68], [69], [186]). Обоснованы методы детерминированных и стохастических программных конструкций. Решение игровой задачи сводится к последовательному выбору экстремальных управлений, сохраняющих траекторию конфликтно управляемого процесса на стабильном мосту и приводящих траекторию по нему на терминальное множество.
Принятая схема позиционной игры такова ([68]). Пусть движение конфликтно управляемого вектора z описывается системой вида
z = f(z,u,v), (0.1)
где z 6 Rn,u Є U,v Е V,U С Rm,V С Rk,f — непрерывная функция. В пространстве Rn задано непустое целевое множество М. Формулируются две задачи о позиционном подходе (т.е. управлении по принципу
обратной связи). Первая задача (стоящая перед первым игроком) — задача о сближении с целевым множеством М внутри заданных фазовых ограничений JV; вторая задача (стоящая перед вторым игроком) — задача об уклонении вектора z от М. Совокупность этих (противоположных) задач есть дифференциальная игра сближения-уклонения.
Связь между задачами раскрывается центральным результатом теории позиционных дифференциальных игр — теоремой об альтернативе, которая утверждает, что в рамках принятой формализации всегда, при подходящем выборе классов стратегий игроков, разрешима одна и только одна из указанных задач.
Таким образом, задачи сближения-уклонения являются взаимоисключающими и взаимодополняющими. Отсюда следует важный вывод о принципиальной неулучшаемости позиционного способа управления. Кроме того, теоремы об альтернативе позволяют рассматривать каждую из задач сближения или уклонения как критерий разрешимости противоположной задачи.
Большое внимание в работах данной школы уделяется вопросам практической реализации процедур управления и численного решения прикладных задач теории дифференциальных игр ([192], [198], [102]).
В работах А. И. Субботина ([189], [190]) условия стабильности сформулированы при помощи производных по направлению. В результате получены дифференциальные неравенства, обобщающие основное уравнение дифференциальных игр, записанное Р. Айзексом. Данный подход был применен к построению теории обобщенных решений уравнений Гамильтона-Якоби.
Наилучшее решение позиционной дифференциальной игры сближения-уклонения доставляют максимальные стабильные мосты в фазовом
пространстве. Однако эффективное построение таких мостов для исследования реальных конфликтно управляемых процессов весьма затруднительно или даже невозможно. Удобнее строить мосты, не являющиеся максимальными, но обладающие свойством стабильности и дающие эффективно реализуемые процедуры управления. Одним из способов построения таких мостов связан с программным или первым поглощением ([8], [66], [163], [202], [213], [219]). Условие регулярности и обеспечивает окончание игры за время первого поглощения ([66],[213]). При этом обосновывается преследование по кривой погони. Программные конструкции положены в основу метода программных итераций ([201]).
Одним из способов построения стабильных мостов являются попятные процедуры, позволяющие вскрыть структуру дифференциальной игры. Начальные идеи в этом направлении принадлежат Л.С.Понтря-гину и реализованы им в методе альтернированного интеграла ([151], [152]). В линейном случае этот метод дает эффективные достаточные условия разрешимости задачи преследования. Попятные процедуры с дискриминацией убегающего распространены на нелиненйые системы в работе Б. Н. Пшеничного ([160]). При этом рассмотрены случаи фиксированного и нефиксированного времени.
Идею рассматривать дифференциальную игру с двух точек зрения предложил и развил Л. С. Понтрягин ([147]). При таком подходе выдвигается на первый план один из игроков, которому предоставляется право строить управление на основе определенной информационной дискриминации противника.
Приведем более подробное описание формализации дифференциальных игр, предложенных Л. С. Понтрягиным ([148]). Пусть движение конфликтно управляемого объекта z описывается системой (0.1). Л. С. Пон-
трягин подчеркивает: "... мы связываем с дифференциальной игрой две разные задачи.
Нашей целью является завершение игры , т.е. приведение точки z на множество М; при этом для осуществления этой цели в нашем распоряжении находится управляющий параметр и, так что в каждый момент времени t мы выбираем значение u(t) этого параметра, используя z(s) и v(s) на отрезке t—ії ^ s ^ t, где "&- подходящим образом выбранное положительное число. Таковы привила преследования.
Нашей целью является предотвращение конца игры, т.е. предотвращение прихода точки z на множество М. При этом для достижения этой цели в нашем распоряжении находится управляющий параметр v, так что в каждый момент времени t мы выбираем значение v(s) этого параметра, используя z(s),v(s) на отрезке t — 'd^.s^t. Таковы правила игры убегания."
Основопологающие результаты по решению дифференциальных игр преследования и убегания получили Л. С. Понтрягин и Е. Ф. Мищенко. В работе ([151]) сформулированы достаточные условия разрешимости задачи преследования в нелинейных дифференциальных играх. В ней использован формализм принципа максимума - одного из центральных методов теории управления. Основной результат заключается в описании множества начальных позиций, из которых гарантируется возможность завершения преследования, а также в вычислении времени преследования, и способ формирования управления преследователя, реализующего процесс преследования.
Упрощение результатов работы ([151]) привело к созданию Л. С. Пон-трягиным первого и второго методов решения задачи преследования для линейных дифференциальных игр ([147]). Наиболее простым и достаточ-
но эффективным для решения конкретных задач преследования является первый метод Л.С.Понтрягина. Данный метод дает удобно проверяемые достаточные условия разрешимости задачи преследования в классе контрстратегий. Первый метод Л.С.Понтрягина послужил основой для многих обобщений, в частности, ([62],[92], [94],[89], [83], [217], [146]). Данный метод имеет тесную связь с методом разрешающих функций.
Основополагающие результаты по решению линейных дифференциальных игр убегания принадлежат Понтрягину Л. С. и Мищенко Е. Ф. ([153]) Они получили условия на параметры процесса, достаточные для разрешимости задачи уклонения на всем бесконечном полуинтервале времени. Условия убегания в работах Понтрягина Л. С. и Мищенко Е. Ф. формулируются в геометрической форме, а при решении конкретных задач убегания доказаны новые геометрические свойства решений дифференциальных уравнений. Метод Л.С.Понтрягина-Е.Ф.Мищенко получил название метод маневра обхода. Нелинейная задача уклонения рассматривалась в ([210], [91]), где был предложен другой метод решения задачи уклонения, получивший название метода уклонения по направлению. Достаточно тонкие условия убегания дает метод инвариантных подпространств. Плодотворным оказался метод Ф. Л. Черноусько ([204]), дополненный в работах ([255], [47]). Новый метод исследования квазилинейных дифференциальных игр убегания предложили Р. В. Гамкрелидзе и Г. Л. Харатишвили.
Естественным обобщением дифференциальных игр двух лиц являются дифференциальные игры с участием группы преследователей и одного или группы убегающих. Новые способы решения дифференциальных игр с участием группы преследователей были предложены в работах Е. Ф. Мищенко, Л. А. Петросяна, Б. Н. Пшеничного, А. А. Чикрия,
Н. Л. Григоренко, М. С. Никольского, Н. Ю. Сатимова, И. С. Раппопорта, П. Б. Гусятникова, Б. Б. Рихсиева, В. И. Жуковского, А. А. Азамова, Р. П. Иванова, В. Л. Зака и многих других математиков ([137], [164], [218], [182], [172], [91], [39], [32], [22]).
Отметим, что одной из первых работ, посвященных задаче группового преследования была работа Л.А.Петросяна ([136]), где было введено понятие стратегии параллельного преследования.
Толчком к появлению большого числа работ по указанной тематике послужила статья Б. Н. Пшеничного ([159]), в которой рассматривался случай простого преследования несколькими объектами одного преследуемого объекта при одинаковых возможностях всех участников. Было показано, что поимка происходит тогда и только тогда, когда начальная позиция убегающего принадлежит внутренности выпуклой оболочки начальных позиций преследователей.
Задачи преследования и убегания с участием групп преследователей и убегающих в литературе представлены достаточно слабо. Это объясняется в первую очередь сложностью данного класса задач.
Задача о поимке двух убегающих группой преследователей в квазилинейных дифференциальных играх рассматривалась в [29]. Были получены достаточные условия поимки.
В работе [220] А.А. Чикрием и Прокоповичем П.В. рассматривалась задача уклонения группы из т убегающих от группы из п преследователей, в которой закон движения каждого из участников имел вид
z = Az + w, w Є V, z Є Rk,
где А- квадратная матрица, V- выпуклый компакт, к ^ 2. В терминах начальных позиций и параметров игры были получены достаточные
условия уклонения хотя бы одного убегающего от группы преследователей из заданных начальных позиций и из любых начальных позиций (в последнем случае предполагается, что величины п, т фиксированы.
В работе [179] Сатимовым Н.Ю. и Маматовым М.Ш. была рассмотрена линейная задача преследования группой преследователей группы убегающих, при условии, что все убегающие используют одно и тоже управление. Были приведены достаточные условия поимки хотя бы одного убегающего.
В работе [112] Петровым Н.Н. и Прокопенко В. А. была рассмотрена задача простого преследования группой преследователей группы убегающих при равных возможностях всех участников и при условии, что убегающие в момент t = О выбирают свои управления на весь интервал [О, со), сообщают о своем выборе преследователям, а каждый преследователь ловит не более одного убегающего. Были получены необходиыме и достаточные условия поимки.
В работе [204] Ф.Л. Черноусько рассматривалась задача уклонения управляемой точки, скорость которой ограничена по величине, от встречи с любым конечным числом преследующих точек, скорости которых также ограничены по величине и строго меньше скорости уклоняющейся точки. Был построен такой способ управления, котороый обеспечивает уклонение от всех преследователей на конечное расстояние, причем движение уклоняющейся точки остается в фиксированной окрестности заданного движения.
Обобщением данной работы являются работы В. Л. Зака ([47], [48], [49]). В работе [47] В.Л. Зак рассмотрел динамические объекты первого порядка
ii = щ, щ Є Ufa х) С Rk, і = 1,..., n,
у = A(t)y + v,ve V{t) С R\ (0.2)
где A(t)— квадратная матрица, измеримо зависящая от t, V(t) — выпуклый компакт, кусочно-непрерывно зависящий от , а каждое из множеств Ui(t,x) полунепрерывно сверху по х относительно включения. Предполагается, что y(t) — экстремальная траектория уравненения (0.2) и включения
Ui(t,x)cInt(A(t)x + V(t))
выполняются для всех t ^ 0 и всех х из некоторой окрестности траектории y(t). Предложен конструктивный способ построения кусочно-программных стратегий, гарантирующих уклонение от встречи.
В работе ([28] Н.Л. Григоренко получены необходиые и достаточные условия уклонения от встречи одного убегающего от нескольких преследователей, при условии, что убегающий и преследователи обладают простым движением, и множество допустимых управлений каждого из игроков - один и тот же выпуклый компакт.
В работе [232] Хайдаров Б.К. рассмотрел задачу позиционной /- поимки в случае простого группового преследования.
В работах ([60], [170]) получены условия оптимальности времени преследования в дифференциальной игре одного убегающего и нескольких преследователей, движением которых является простым.
В работе [30] Григоренко Н.Л. получены необходимые и достаточные условия r-кратной поимки убегающего в задаче простого преследования.
Следует отметить, что абсолютное большинство работ посвященных как задаче преследования, так и задаче убегания рассматривались при определенном преимуществе одной из сторон. Работ, посвященных задачам преследования и уклонения при равных динамических и инер-
ционных возможностях игроков достаточно мало. Основная часть работ указанного типа относится к задаче простого преследования. Также практически неизученными являются дифференциальные игры с участием нескольких лиц и при наличии дополнительных ограничений на состояния одной из сторон.
Данная работа посвящена исследованию некоторых классов дифференциальных игр преследования и убегания, а также решению ряда конкретных игровых задач.
Кратко остановимся на содержании диссертации. Диссертация состоит из введения, пяти глав, шестнадцати параграфов и списка литературы.
Первая глава диссертации посвящена квазилинейным дифференциальным играм со многими участниками и дополнительными ограничениями на состояния убегающих.
В первом параграфе рассматривается дифференциальная игра п + 1 лиц, описываемая системой вида
Zi = AiZi + (pi(ui,v) (0.3)
Zi^Rn\ щЄііі, veV, ф) = г1
Здесь Аі — квадратная матрица порядка щ, Щ,У — непустые компакты соответственно пространств Rmi,Rm, функции (pi :UiXV Ч- RUi непрерывны по совокупности переменных. Здесь и всюду далее і = 1,..., п.
Терминальное множество М состоит из множеств Мі, каждое из которых представимо в виде
Мі = М} + Mf, (0.4)
где М} — линейное подпространство Rn\ Mf — выпуклый компакт, принадлежащий L] — ортогональному дополнению к М} в Rni.
Дополнительно предполагается, что в пространстве R заданы система вида
y = Ay + Cv, veV, у(0) = у, (0.5)
и множество
D = {y:yGR\ (р;,у)^щ, і = 1,...,г}, (0.6)
где А, С — заданные матрицы, у0 Є D — заданный вектор,
Pi,...,pr — единичные векторы Rk, /zi,..., \lt — вещественные числа,
такие что IntZ) ф 0.
Назовем предисторией управления убегающего в момент t,t^0 функцию
vt(') — {vis) ' vis) Є V, s Є [0,t], v(s) — измерима}
Определение 0.1. Будем говорить, что задана квазистратегия преследователя Pi, если определено отображение Ui(t,z,vt(-)), ставящее в соответствие начальному состоянию z = (г,..., z) моменту t и произвольной предыстории управления убегающего Vt(-) измеримую функцию щ(і) =Ui(t,z,Vt(-)) со значениями в Ui.
При этом предполагается, что должно быть выполнено условие "физической осуществимости", то есть если v1, v2 — два допустимых управления убегающего Е, причем v1 (t) = v2(t) для почти всех t, то соответствующие им при отображении lk(t, z, ty(-)) функции и1, и2 также равны почти всюду при t ^ 0.
Определение 0.2. Будем говорить, что в игре Г из начального состояния z = (zi, ...,z) происходит поимка в момент T(z),
если существуют квазистратегии Ui(t, z, Vt(-)),.. .,Un(t, z, Vt(-)) преследователей Pi,..., Pn, номер q такие, что zq(T(z0)) Є Mq. Предполагается, что предыстория Vt(-) обладает свойством: y(s) Є D для всех s Є [0,t].
Перейдем к описанию схемы преследования. Обозначим через 7Г; оператор ортогонального проектирования из RUi на L].
Предположение 0.1. Точка z такова, что щеАі*$ f М? при t ^ 0 и
для всех 0 ^т ^t
Пусть для точки z выполнено предположение 0.1 и введем функции
Xi{t, т, v) = sup{A 0| - Afae^z? - М}) П ще^А'<р0и v) ф 0}
O^r^t < со, veV. Пусть далее
ОД = {«(): v : [0,*]-> V, у{т) Є D, тє[0,*]}.
T(z) = M{t ^ 0, inf max / Лг(і, r, v(r))dr ^ 1}.
«()efi(*) г J
Предположение 0.2. 0 < T(z) < со.
Теорема 0.1. Пусть точка z = (zi,...,z) такова, что выполнены предположения 0.1,0.2.
Тогда в игре Г происходит поимка в момент T(z).
Замечание. К сожалению, проверка выполнения предположения 0.2 возможна в очень редких случаях.
Предположение 0.3. Существуют р Є Rk,fi Є R1 такие, что для множества
Яі = {у:уЄД*,(р,у)і}
справедливо включение D С D\. Обозначим через
I(q) = {1, ...,n + g}, d = max{|v|, v Є V},
An+i(f,r,u) = (B(t-r)v,p),
где Б — непрерывная матричная функция.
Предположение 0.4. Существуют непрерывная функция /3(t,v), неотрицательные непрерывные функции Xj(t,v),gi(t,r),g(t,T), матричная функция B(t), константа с > 0 такие, что
Ai(*,r,v) Z gi(t,T)\}(t,v),
Xn+1(t,r,v) = g(t,r)P(t,v), t
f\\eA^-^C-B{t~r)\\dT^c
для всех 0 ^ т ^ < со, v EV.
Пусть
f(t)= 9& T)dr, \ln+l (t, v) = p(t, v) + а/и, о
S(t) = inf max \}(t,v).
veVleI(l)
Предположение 0.5. Существуют константы а, Сі,С2,сз,С4 такие, что q ^ 0 и
||ел<уо|| ^ сі для всех О 0;
а/і ^ 0, p(t, v) ^ — сі для всех і ^ 0, vE^;
для каждого t > 0 существует множество 7() С [0, ] такое, что
n(E{t)) ^ с3, / g(t, r)dr ^ с4, min&(, г) ^ #(*, г)
E(t)
для всех t > О, т Є [0,t] \ E(t);
/, д непрерывные функции;
5 ограниченная на [0, со) функция и выполнено одно из следующих двух условий:
а) lim f(t)8(t) = со при аи < О
->оо
б) lim f(t)52(t) = со при аи = 0.
Теорема 0.2. Пусть для игры Г выполнены предположения 0.1,0.3,0.4,0.5. Тогда в игре Г из состояния z = (z,..., z) происходит поимка в момент T(z).
Во втором параграфе первой главы рассматривается дифференциальная игра Г, описанная в первом параграфе. Получены достаточные условия разрешимости задачи преследования в нефиксированный момент времени.
Определение 0.3. Будем говорить, что в игре Г из начального состояния z = (z,..., z) происходит поимка, если существуют момент T(z), квазистратегииU\(t, z, vt(-)),... ,Un(t, z, vt{-)) преследователей Pi,...,Pn, такие, что что для любой измеримой функции v(-),v(t) Є V, y(t) Є D, t Є [0,T(z0)] найдутся номер q Є {1,...,п} и
q-
момент Г ^ T(z) такие, что zq(T) Є М(
Предположение 0.6. Для точки z такой, что щеАіі2$ (f. Мі для всех і, t справедливы соотношения
соп(М? - meAitz4) П щеЛ^-Т^г(и{, v) ф 0 (0.7)
для всех І, 0 ^ Т ^ t < 00, V EV.
Пусть для точки z выполнено предположение 0.6. Определим функции
\i(t,r,v) =
= sup{A : A ^ 0, -X(Mf - щеМіг\) П щеАі{1~т)ifi{Uh v) ф 0}. Пусть далее
ОД = -К) :«:[(),*]- У, і/(г) Є Д г Є [0, і]}, T(z) = min{t ^ 0 : inf max / \i(t, r, v(t))<1t ^ 1}.
«()ЄП(0 і J 0
Теорема 0.3. Пусть Mf = {0},щЛі = Аіщ для всех і, выполнено предположение 0.6 и T(z) < со. Тогда в игре Г происходит поимка.
Предположение 0.7. Существует р Є Rk,p ф 0,ц Я1 такие, что для множества
Di = {y: {р,у) ^ ц}
справедливо D С D\.
Полагаем An+i(, t,v) = (р, B(t — т)г;(т)), где B(t) — непрерывная матричная функция.
Предположение 0.8. \t(t,r,v), І Є /(1) не зависят от t, т.е.
\i(t,т,v) = Л/(т,v) для всехг )0,d6F.
Пусть
5(т) — inf max Л(т, v).
Предположение 0.9. Существуют положительные числа с, ci,C2 непрерывная матричная функция B(t) такие, что
t 1- \\еАіУо\\ < сь / ||ел(і"г) - B(t - r)\\dr ^ c2 для всех t ^ 0;
2. An+i(r, u) ^ —с(т) для всех г ^ 0, v Є V;
t-> + 00 g
3. lim J S(r)dT = oo.
Теорема 0.4. Пусть выполнены предположения 0.6—0.9. Тогда в игре Г происходит поимка.
Более подробно рассмотрен конфликтно управляемый процесс (0.3), (0.4), (0.6) в случае, когда Лі, А — нулевые матрицы, С — единичная матрица.
Следует отметить, что задача группового преследования (0.3), (0.4), (0.6) рассматривалась также в работах ([167], [168], [169]) с той разницей, что граница фазовых ограничений считалась "линией смерти" для убегающего. Был предложен метод решения указанных задач преследования путем сведения к задачам без фазовых ограничений.
Вторая глава диссертации посвящена задаче преследования группой преследователей одного или нескольких убегающих в примере Л.С.По-нтрягина при одинаковых динамических и инерционных возможностях игроков.
Третий параграф диссертации носит вспомогательный характер и посвящен некоторым свойствам почти периодических функций.
В четвертом параграфе диссертации изучаются свойства положительного базиса [106], необходимые в дальнейшем.
В своей работе [148] Понтрягин Л.С. рассмотрел дифференциальную игру двух лиц, в которой закон движения преследователя Р имеет вид
х + aix^-l) + + арх = и, иЄР, (0.8)
а закон движения убегающего Е имеет вид
у(я) + biyh-D + ... + bqy = V: veQj (0.9)
где x,y,u,v Є Rk(k ^ 2),IntQ ф 0. Условие поимки - х(т) = у(т) при некотором т.
Было показано, если выполнено условие маневреннего превосходства убегающего (q < р или существует \i > 1 и а Є Rk, что рР + а С Q), убегающий использует квазистратегии, то в данной игре происходит уклонение от встречи.
Дальнейшее изучение дифференциальной игры двух лиц, описываемой уравнениями (0.8), (0.9), при условии, что Р = Д)(р),<5 = Д)(сг) проводилось в работе [182] Было показано, что если выполнено хотя бы одно из условии
а) р> q,a > 0 нк> q + l;
б) Р = q, с > 0, существуют неотрицательные целые числа к\, &2,
0 ^ к\ ^ р — 1, 0 ^ &2 ^ V такие, что щ = bj, 6р_у = ap-.j для всех і = 0,..., к\ - 1, j = 0,..., fc2, где а0 = /о, Ьо = о и к ^ min{g + ^i + 1,р + ^ — кч — 1}, то в игре происходит уклонение от встречи, при условии, что убегающий использует квазистратегии.
В работе [152] рассматривалась игра двух лиц, в которой законы движения преследователя Р и убегающего Е имеют вид
х + ах = рщ \\и\\ < 1, y + (ly = av, , ||и||< 1,
где х, y,u,v Є Rk, а, Р,р,а - положительные числа. Было показано, что
если
Р сг р^сг и -^ -,
а р причем хотя бы одно из неравенств строгое, то в игре происходит поимка
при условии дискриминации убегающего (условие поимки х = у).
Пятый параграф диссертации посвящен задаче преследователей группой преследователей одного убегающего в примере Л.С.Понтрягина при равных динамических и инерционных возможностях всех игроков.
В пространстве R (к ^ 2) рассматривается дифференциальная игра Г п + 1 лиц: п преследователей Pi,...,Pn и убегающий Е. Закон движения каждого из преследователей Pj имеет вид:
xf + aizf-1) + + сцхі = щ, щ е V. (0.10)
Закон движения убегающего Е имеет вид:
у{1) + aiy{l~l) + + щу = v, veV. (0.11)
Здесь Х{, у, щ, v Є Rk, ai,..., щ Є R1, V — выпуклый компакт Rk. При t = 0 заданы начальные условия:
*!а)(0) = xl, j,W(0) = уа, а = 0,... ,1 - 1, (0.12)
причем Xfl—г/ц ^ Мг- для всех г, где Мг- — выпуклые компакты і2*\ Здесь и всюду далее г = 1,..., п. Дополнительно предполагается,что убегающий І2 не покидает пределы выпуклого множества
D = {y:yeR\ (Рі,у)^^, j = l,...,r], (0.13)
где pi,...,pr - единичные векторы Rk, /ii,..., цг - вещественные числа такие, что ІпШ ф 0.
Определение 0.4. Будем говорить,что в игре Г происходит поимка, если существуют момент Т и квазистратегии Ui(t, z, vt(-)),... ,Un(t, 2, vt(-)) преследователей Pi,..., Pn, что xq{r) — у(т) Є Mq при некоторых q, t Є [0,T] для любой измеримой функции v(t), v{t) Є V, y(t) Є A te [0,r].
Вместо систем (0.10), (0.11) рассмотрим систему
z\ -f a\z\ ~1' + H a/Zi = щ-у, щ, v Є V, (0.14)
Ф) = 4 = 4 - vl , 4-1)№ = 4-і = 4-і - rf-i-
Пусть z = {zl,a = 0,... ,1-1}.
Обозначим через
p{t), p = 0,1... ,1 — 1 решения уравнения
w{l) + aV_1) H + a,w = 0
с начальными условиями
«;(0) = 0,...,w^-1)(0) = 0, «^(0) = !, w(p+1)(0) = 0,...,^-1)(0) = 0.
Предположение 0.12. Все корни характеристического уравнения
Xl + a1Xl~1 + --' + ai = 0 (0.15)
имеют неположительные вещественные части.
Предположение 0.13.
Обозначим через Лі,..., As(Ai <,...,< As) — вещественные корни, Hi ± iv\,..., lip ± ii/p, (//і ^ \іі ^ ... ^ fip) — комплексные корни урав-нения (0.15), ks - кратность As,mQ - кратность корня ца ± %va. В силу предположения 0.13 lip ^ As. Пусть далее
ii(t) = ЫФю + 4>i{t)A + '- +
т^(і) = ^oWi/o0 + viWi/i + + W-l Wrf-l-
Так как
V?(0 = S eAj%M + S ^'Wfla W COS Vat + Rqa{t) Sin I/at),
j-\ a=l
T0 ^(0)^(0 представимы в виде
(i(t) = <*Ц + ^ WJaW COS ^ + Д?в(*) Sin Vat),
j=l a=\
Vtt) = E <^*Ф) + E eM№a W C0S "a* + Д W 8ІП ^O-
Считаем, что &() ^ M; для всех г и і > 0, ибо если Q() Є Ма при некоторых а и то преследователь Ра ловит убегающего Е, полагая ua(t) = v{t).
Считаем также, что Pji(t) ф О для всех г, ибо в противном случае, преследователи первоначально добиваются выполнения указанного условия.
Обозначим через ji - степень многочлена P}i(t), 70 - степень многочлена Pg(t), 7 " степень многочлена Psi-i(t). Можно считать, что 7? = 7 для всех г, ибо в противном случае преследователи Р{ первоначально добиваются выполнения данного условия.
Предположение 0.14. та < ks для всех а Є I = {а : ца = Xs}.
Определим функцию Л : comp(i?fc) х V —> R1
Х(А, v) = sup{A I Л > О, -ХА n(V-v)^ 0}.
Здесь comp(Rk) - пространство выпуклых компактных подмножеств Rk с метрикой Хаусдорфа. Пусть далее
2? = Hm PlJt\ / = {n + l,...,n + r}, d = max{||t;||, vEV},
t—>00
. —1/a, если As < 0 \ zf - Mi, если As = 0, ks = 1
Ь = < , Щ = \
0, если As = 0 zf, в противном случае
(Pj-n, V) + bfjlj-n, j = n + 1,... n + r
fe-n, V) + 6^_п, J = П + 1, . . . , П + Г
J = inf max fa {v), 50= inf max 0\ (v),
veV jel(r) vGV jel(r) J
V^iv.veV, A(Mi,«) = 0, z = l,...,n}, e«W = e"v6W.
Предположение 0.15. 0 ^ M*, функции А; непрерывны во всех точках (М/,г>) таких, что АДМ^г*) > 0.
Теорема 0.5. Пусть для игры Г выполнены предположения 0.12 - 0.15, As < 0, S0>0,D = Rk, Mt = {0}. Тогда в игре Г происходит поимка.
Теорема 0.6. Пусть для игры Г выполнены предположения 0.12 — 0.15, А5 < 0, 5q > 0,0 Є D, Мі = {0} и выполнено хотя бы одно из следующих двух условий:
а) г = 1;
б) min_max((pj, v) + buj) > 0.
Тогда в игре Г происходит поимка.
Теорема 0.7. Пусть для игры Г выполнены предположения 0.12 - 0.15, As = 0, 60 > 0, D = Я*. Тогда в игре Г происходит поимка.
Теорема 0.8. Пусть для игры Г выполнены предположения 0.12 — 0.15, As = 0, 6q > 0 и выполнено хотя бы одно из следующих двух условий:
а)г=1]
б) min тах(р-,-,гр > 0.
uGcoFi J
Тогда в игре Г происходит поимка.
Следствие 0.1. Пусть выполнены предположения 0.12 — 0.15, Мі = {0}, As = 0, V = >i(0), п ^ к, D — многогранник. Тогда в игре Г происходит поимка.
Пусть система (0.14) имеет вид
k - XiZi + щ-и, Zi(0) = z\, ||иг-|| ^ 1, ||v|| ^ 1, (0.16)
где Z{ Є Rk, Af Є Rl, терминальные множества Мі = {0}. Обозначим Xf = max{0, Аг},
о „л -
А(4>)
W, v) + V«,02 + ICT(i-IMIa)
kll2
Теорема 0.9. В игре T, описываемой (0.16) происходит уклонение от встречи тогда и только тогда, когда
min max(A(4>, w) - Аг+)< 0. (0.17)
Последнее утверждение обобщает результаты работ [159], [166].
В шестом параграфе рассмотрена задача об г-кратной поимке убегающего группой преследователей в примере JI.C. Понтрягина при равных динамических и инерционных возможностях всех игроков.
Седьмой параграф диссертации посвящен нестационарной задаче преследования группой преследователей одного убегающего в примере Л.С. Понтрягина при одинаковых динамических и инерционных возможностях игроков.
В пространстве Rk(k ^ 2) рассматривается дифференциальная игра Г п + 1 лиц: п преследователей Pi,... Рп и убегающий Е,
Закон движения каждого из преследователей Р^ имеет вид
xf + аій^/_1) + + ai(t)xi = щ, щ Є V. (0.18)
Закон движения убегающего Е имеет вид
У{1) + ai{t)y«-l) + + ai{t)y = v, v V. (0.19)
Здесь Х{, у, щ, v, Rn, аі,...,щ — непрерывные на [о,о) функции, і = 1,... п. При t = to заданы начальные условия
я*(*о) = 4, x(t0) = xil,...1 arf _1)(*0) = 4-ь
у(к) = у0, у(к) = у1,...,у{1-1)(к) = уІь
причем Хіо ф у.
Дополнительно предполагается, что убегающий в процессе игры не покидает пределы выпуклого многогранного множества D вида (0.И).
Вместо систем (0.18), (0.19) рассмотрим систему
zf + ai(t)z?_1) + + at(t)zi = щ-ь, щ, veV, (0.20)
zi(k) = 4 = хіо -Уо> > 4/_1)(^o) = 4-і = 4-і ~ 2/f-i-
Определение 0.5. Говорят, что в игре Г происходит поимка, если существуют момент T(zo), квазистратегии Ui(t,zfj,Vt(-)) преследователей Pi такие, что zq(T) = 0 при некоторых q Є {1,..., n}, Т [0,Т(^о)] для любой допустимой функции v(t) Є У, t Є [0,Т(^о)], где Zj(i) - решение системы (0.20), соответствующее набору управлений ui(t),v(t).
Обозначим через
q(t,s), q = 0,..., / — 1, (t ^ s ^ to) решения уравнения
ги(/) + ai(t)w{l~l) + + aj(t)iy = 0
с начальными условиями
w(j\s) = 0, j = 0,...,q-l, g+l,...,/-l, >>(*) = 1.
Предположение 0.16.
Ш = vo{t, *o)4 + vi(*. *o)4 + + ^_i(t, t0)*8_i,
ry(t) = y?o(<, *o)2/ + >i(*> *o)j/i + + W-i(*, *o)2/?-i-Предположение 0.17. Существуют функции (Зі Є С[о,со), векторы г-3, zf ф 0 такие, что
1. Д() > 0 для всех t > to;
2. lim #(*)&(*) = *?.
I->00
Пусть далее
/?(t) = min/ЗД, Лі (и) = Л(г?, v) = 8ир{Л : Л ^ 0, -Лг? Є V - v}.
^j+n(v) = (Pj, v), j = 1,..., r, I(q) = {l,...,n + q}, So = inf max Xa(v),
veVqeI(r) Ч
Vi = {v : v Є V, \i(v) = 0, і = 1,..., n}, f(t) = / у?,_і(і, s)cfe.
Предположение 0.18. Функции Л;(г, г;) непрерывны во всех точках (z,v) таких, что \i(z,v) > 0.
Предположение 0.19. lim j3(t)f(t) = со.
t-too
Предположение 0.20. Для каждого т > to выполнены следующие условия:
1. ||/3()?7()|| ограничена на [г, сю);
2. (3{t) J (pi-i(t, s)ds ограничена на [г, сю).
Теорема 0.10. Пусть для игры Г выполнены предположения 0.16 — 0.20, 8о > 0, fij = 0, j = 1,... , г и выполнено хотя бы одно из следующих двух условий:
r = l;
min max.(pj,v) > 0.
vecoVi j
Тогда в игре Г происходит поимка.
Предположение 0.21. Функции Д ограничены на [^,оо).
Теорема 0.11. Пусть для игры Г выполнены предположения 0.16 — 0.21, $о > 0, 0 Є IntD и выполнено хотя бы одно из следующих двух условий:
г=1;
min max(pj,v) > 0.
vcoVi j
Тогда в игре Г происходит поимка.
В восьмом параграфе диссертации рассматривается задача уклонения одного убегающего от группы преследователи в конусе, в которой закон движения каждого из преследователей Pi имеет вид
Хі = ахі + щ, \\щ\\ ^ 1, а Є R1. (0.21)
Закон движения убегающего Е имеет вид
y = ay + v, IHI^l. (0.22)
При t = 0 заданы начальные положения преследователей х,..., ж^ и начальное положение убегающего у0, причем а^ ф у0, г = 1,..., п.
Предполагается, что убегающий Е в процессе игры не покидает выпуклый конус
D = {y:yRk, (р,-,у)^0, j = l,...,r},
где pi,... ,pr - единичные векторы /2* такие, что IntD ф 0.
Пусть и - некоторое разбиение 0 = to < t\ <,...,< ts,..., интервала [0, со), не имеющее конечных точек сгущения.
Определение 0.6. Кусочно-программной стратегией V игрока Е, заданной на [0, со), соответствующей разбиению а, называется семейство отображений {bl}^lQ, ставящих в соответствие величинам
(ti,xi{ti),...,xn(ti),y(ti))
измеримую функцию v = vi(t), определенную для t Є [ti,ti+i) и такую, что|М*Ж1, УЙЄД t[thtl+1).
Обозначим данную игру через Г.
Определение 0.7. Будем говорить, что в игре Г происходит уклонение от встречи, если существуют разбиение а интервала [0, сю), стратегия V игрока Е, соответствующая разбиению а такие, что для любых траекторий жі (),...,xn(t) преследователей Р\,... ,Рп имеет место
Xi(t) фу(і), t^O, i = l,...,n,
где y(t) - реализовавшаяся в данной ситуации траектория игрока Е.
Теорема 0.12. Если а < 0, п < к, то в игре Г происходит уклонение от встречи.
Данная теорема дополняет соответствующий результат Р.П. Иванова [58] для задачи простого преследования.
Девятый параграф диссертации посвящен задаче преследования группой преследователей группы убегающих в примере Л.С.Понтрягина при равных динамических и инерционных возможностях игроков и при условии, что каждый преследователь ловит не более одного убегающего, а каждый убегающий принимает решение о своем поведении в начальный момент времени на весь интервал [0, со).
Предполагается, что закон движения каждого из преследователей Pi имеет вид (0.10), а закон движения каждого из убегающих Ej,j = 1,..., т имеет вид (0.11), причем V = .Di(O). При t = 0 заданы начальные условия
хі(о) = 4, іііо) = 4. - *.'"" (о) = 4-і. уіФ) = у% »(о) = и,-, г/Г» = $-і>
причем х% ф у0 Для всех Ь J- Дополнительно предполагается, что каждый из убегающих Ej не покидает пределы выпуклого многогранного множества D вида (0.13).
В дальнейшем прдполагается, что сначала все убегающие выбирают свои программные управления для t Є [0, со), а затем преследователи определяют свои движения на основе информации о выборе убегающих и, кроме того, каждый преследователь ловит не более одного убегающего.
Определение 0.8. Будем говорить, что в игре Г возможна поимка, если существует момент Г > 0, такой, что для любой совокупности траекторий убегающих
{yj(t) : yf(0) = yja, а = 0,1,...,/- 1, Vj{t) Є D, t Є [0, oo)}
найдутся траектории преследователей
{*,(*) : 4>(0) = 41-
обладающие следующим свойством: существуют множества индексов JV С {1,2, ...,п}, М С {1,2, ...,т} мощности q (т.е. \N\ = \М\ = q) такие, что каждый убегающий Ej, j Є М "ловится" не позднее момента Т некоторым преследователем Рі, і Є N, причем, если преследователь Д
"ловит" убегающего Ej, то остальные убегающие считаются им не пойманными. Выражение Р{ "ловит" Ej означает, что существует момент Tij Є (О,Г], что Xi(Tij) = yj(Tij). Считаем, что п ^ q.
Предположение 0.21. Корни уравнения (0.15) вещественны и неположительны.
Условие G. Для каждого р Є {0,1, ..., q — 1} верно следующее: для всякого множества N С {1,2,..,,n}, \N\ = п — р найдется такое множество М С {1,2,..., т}, \М\ — q—p, что для всех (З Є М выполнено
0 Є Ысо{х% -у% а Є N, ph .. .,pr}. (0.23)
Теорема 0.13. Пусть выполнено предположение. 0.21, Xs < 0, иа = 0, а = 1,... ,г. Для того,чтобы в игре Г имела место поимка достаточно выполнения условия G. При I = 1,а\ > 0 условие G является и необходимым.
Теорема 0.14. Пусть выполнено предположение 0.21, \s = 0. Для того,чтобы в игре Г имела место поимка достаточно выполнения условия G. При I = l,ai — 0 условие G является и необходимым.
Данная теорема обобщает результат работы [112], в которой рассматривалась задача простого преследования в данной постановке и при отсутствии фазовых ограничений.
Третья глава диссертации посвящена задаче преследования группой преследователей группы убегающих в примере Л.С.Понтрягина при равных динамических и инерционных возможностях игроков и при условии, что все убегающие используют одно и тоже управление (жестко скоординированы).
В десятом параграфе диссертации рассматривается задача простого преследования группой преследователей группу жестко скоординированных убегающих. Получены необходимые и достаточные условия разрешимости указанной задачи в предположении, что множество допустимых управлений — строго выпуклый компакт с гладкой границей.
В пространстве Rk(k ^ 2) рассматривается дифференциальная игра п+т лиц: п преследователей и га убегающих. Законы движения каждого из преследователей Д ( с управлением щ) и каждого из убегающих Ej (с управлением v) имеют вид:
Хі = щ, щ Є V; г/j = v, v Є V; xit yj: щ, v Є Rk. (0.24)
При t = 0 заданы начальные условия
s<(0) = s?, у№ = Уі, причем хЧфу] (0.25)
Дополнительно предполагается, что убегающие в процессе игры не покидают пределы выпуклого многогранного множества D вида (0.13). Пусть Т > 0 и а - некоторое конечное разбиение
0 = to < tl < t2 < < tq < tq+1 = T
отрезка [0, T].
Определение 0.9. Кусочно-программной стратегией W убегающих Ej, соответствующей разбиению а, будем называть семейство отображений d (l = 0,l,...,q): ставящих в соответствие величинам
{ti,Xi{ti),yj(ti), min imn\\xi{t) -yj(t)\\) (0.26)
te[0,U] г
измеримую функцию v(t), определенную для t Є [ti, ti+i) и такую, что
v(t)eV,yj(t)(ED, te[th tl+1) 33
Отметим, что действия убегающих можно трактовать следующим образом: имеется центр, который по величинам (0.26) для всех убегающих Ej выбирает одно и то же управление v{t), t [ti, U+\).
Определение 0.10. Кусочно-программной контрстратегией Uі преследователя Pi, соответствующей разбиению сг, будем называть семейство отображений Ь\ (I = 0,1,..., q), ставящих в соответствие величинам (0.26) и управлению v(t), і Є [ti, fy+i) измеримую функцию Ui(t), определенную для t Є [ti, ti+i) и такую, что
щ(г) Є V, t Є [ti, ti+i)
Определение 0.11. В игре Г происходит уклонение от встречи, если для любого Т > 0 существуют разбиение а отрезка [0, Т] и стратегия V убегающих Ej, такие, что для любых траекторий Xi(t) преследователей Pi
Xi{t)^yj{t), ІЄ[0,Т]
Определение 0.12. В игре Г происходит поимка, если существует Т > 0 и для любой стратегии V убегающих Ej существуют кусочно-программные контрстратегии U{ преследователей Д, момент т Є [0, Т] и номера s Є {1,2,..., m}, г Є {1,2,..., п}, такие, что
хг(т) = Уз(т)
Будем предполагать в дальнейшем, что выполнено следующее условие: любые к векторов из совокупности
Ы - Vj,yq -У*,чф г, pi,... ,рг} линейно независимы и уУ Є IntD.
Теорема 0.15. Пусть V — строго выпуклый компакт с . гладкой границей, D = Rk,
Intco{sJ} П co{yJ} = 0.
Тогда в игре Г происходит уклонение от встречи.
Теорема 0.16. Пусть V — строго выпуклый компакт с гладкой границей, D = Rk,
Intco{s?} П co{s#} ф 0. (0.27)
Тогда в игре Г происходит поимка.
Теорема 0.17. Пусть V = Di(0),
0(Ысо{х(-у1ръ...1Рг}. (0.28)
Тогда в игре Г происходит уклонение от встречи.
Теорема 0.18. Пусть V = -Di(O), п ^ к — 1. Тогда в игре Г происходит уклонение от встречи.
Теорема 0.19. Пусть V = D\(0), n ^ к и
0eMco{xi-yj,ph...,pr} (0.29)
Тогда в игре Г происходит поимка.
Определение 0.13. В игре Г происходит поимка двух убегающих, если существует Т > 0 и для любого разбиения а отрезка [0,Т], для любой стратегии V убегающих Ei,...,Em существуют контрстратегии Ui,...,Un преследователей Pi,...,Pn моменты времени тї,тг, номера I, s Є {1,..., m}, її, s\ Є {1,..., n} такие, что
я/іСгі) = У/(п), seifa) = уДт2). 35
Теорема 0.20. Пусть т = 2, D = R , V — строго выпуклый компакт с гладкой границей и выполнены следующие условия: 1). co{yl ?/} С IntcoW,..., хп};
2). Существуют множества Ji, J2 С {1,... , п}, ii,/2 С /о \ (<Л U J2), ^1 П h = 0, такие, что наборы векторов
{z^,i Є Ji, -с}, {4,г Є J2, с}, (4, 4, 4, */«, ^ Ji \ (Ji П J2), 5 Є J2 \ (Л П J2), а Є /і, /З Є /2}
образуют положительный базис, причем \Iq \ (J\ П J2)| ^ А; + 1, (10 = {1,...,п}).
Тогда в игре Г происходит поимка.
В параграфе 11 диссертации рассматривается задача о преследовании группой преследователей группу жестко скоординированных убегающих, при условии, что законы движения участников конфликта имеют вид (0.10), (0.11) и цель группы преследователей состоит в поимке хотя бы одного убегающего.
Теорема 0.21. Пусть выполнены предположения 0.12 — 0.14, D = Rk, n^k+lu
0 Є Intco{Z?} (0.30)
Тогда в игре Г происходит поимка.
Теорема 0.22. Пусть выполнены предположения 0.12 — 0.14, n^k, V = Di(0) и
0єМсо{4,Рі,--.,М,г^1. (0.31)
Тогда в игре Г происходит поимка.
Кроме того, в данном параграфе рассматривается задача о поимке двух жестко скоординированных убегающих, при условии, что законы движения участников имеют вид
Х{ + а\Х{ = «і, Щ Є V,
yj + aiyj = v, veV, (0.32)
X{, yj, щ, v Є Rk, a\, Є B},ai > 0.
а*(0) = *?, yj(0) = yj.
причем x\ ф yQj для всех i,j, V— строго выпуклый компакт с гладкой границей.
Теорема 0.23. Пусть т = 2,D = Rk, V — строго выпуклый компакт с гладкой границей и выполнены следующие условия: 4.со{у},у8}сМсо{я?,...,а;};
2). Существуют множества 3\, J2 С {1,... , n}, I\, h С Iq\ (Ji U J2), h П h = 0) такие, что наборы векторов
{z^,ieJh -с}, {z%,ieJ2, с}, (4, 4, 4i. */й. /Є Ji \ (Ji П J2), s Є J2 \ (h П J2), аІі,Рє h}
образуют положительный базис, причем \Iq \ (J\ П J2)| ^ к + 1, (Jo = {l,...,n}).
Го2(9а б игре Г происходит поимка.
Четвертая глава диссертации посвящена задаче о "мягкой" поимке группой преследователей одного или нескольких убегающих в примере Л.С.Понтрягина при равных динамических и инерционных возможностях игроков.
В параграфе 12 диссертации получены досточные условия "мягкой" поимки группой преследователей одного убегающего в примере Л.С.По-нтрягина.
Предполагается, что закон движения каждого из преследователей Р{ имеет вид (0.10), а закон движения убегающего имеет вид (0.11). При t = 0 заданы начальные условия
*<(о)(0) = *?в, У{а)(0) = УІ a = 0,...,J-l
причем х% ф г/g, х\х ф у\.
Определение 0.14. В игре Г происходит "мягкая" поимка, если существуют Т > 0 и квазистратегии Ui(t, z, vt(-)) преследователей Pi такие, что хя(т) = у(т), хд(т) = у(т) при некоторых q и т Є [0,Г].
Предполагается, что все корни уравнения (0.15) вещественны и неположительны. Пусть далее
4> = lim Ш, 2j = Um 9iziM, (/i = degg;.!,),
5 = inf тахА(г,и), Ji = inf тахтіп{А(^,г;),Л(^,г;)}.
Предположение 0.22 Функции A(z, и) непрерывны во всех точках вида (zf, v) для которых X(zf, v) > 0.
Теорема 0.24. Пусть выполнено предположение 0.22, А5 = 0, ks^ 2,5 > 0. Тогда в игре Г происходит "мягкая" поимка.
Предположение 0.23 Функции X(zf, v), \(г}, v) непрерывны во всех точках {zf,v), (zj,v) таких, что \{zf,v) > 0, X(zj,v) > 0.
Теорема 0.25. Пусть выполнено предположение 0.23, Л5 = 0, ks = 1,^1 > 0. Тогда в игре Г происходит "мягкая" поимка.
Теорема 0.26. Пусть выполнено предположение 0.22, As < 0, 6 > 0. Тогда в игре Г происходит "мягкая" поимка.
В параграфе 13 диссертации рассматривается задача о "мягкой" поимке группой инерционных объектов группу инерционных объектов в игре Г(п,т, z), где п - число преследователей, т - число убегающих, z - вектор начальных позиций, законы движения каждого из преследователей Pi и каждого из убегающих Ej имеют вид
Xi = щ, Хі(0) = х(, Хі(0) = х\, \\щ\\ ^ 1, (0.33)
щ = f* уМ = у1 уМ = vh N1 ^ L (-34)
Вводится функция / : N -> N вида
f(n) = min{m : в игре Г(п, m, z) происходит уклонение при любых z0}.
В данном параграфе получены некоторые достаточные условия разрешимости задачи уклонения в игре Г(п,т, z) и доказана
Теорема 0.27. Существуют константы с\,С2 > 0 такие) что для всех п Є N, п ф 1 справедливо неравенство
С2П ІП П ^ f(n) ^ С\П ІП 72.
В параграфе 14 диссертации рассматривается задача о "мягкой" поимке группой инерционных объектов группы инерционных жестко скоординированных объектов с законами движения (0.33), (0.34).
Теорема 0.28. Пусть
Intco{zJ} П со{у]} ф 0. (0.35)
Тогда в игре Г происходит "мягкая" поимка. Теорема 0.29. Пусть
Intco{zJ} П со{у}} = 0. Тогда в игре Г происходит уклонение от "мягкой" поимки.
Дифференциальные игры сближения-уклонения с участием нескольких игроков являются обобщением игры двух лиц. Однако данный класс игровых задач принципиально отличается от ситуации с одним целевым множеством. Именно, класс стратегий для которых справедлива теорема об альтернативе в игре двух лиц, в игре с участием нескольких игроков оказывается явно не достаточным для решения игры. Встает актуальный вопрос о минимальной дополнительной информации, используемой для управления в каждый момент времени, при которой существует решение. При этом с практической точки зрения, безусловно желателен был бы конечномерный характер этой информации. В работе Габлиэ-ляна М.С., Субботина А.И.([25]) доказано существование ситуации є-равновесия в классе кусочно-позиционных стратегий в задаче о встрече с т целевыми множествами.
Пятая глава диссертации посвящена доказательству существования цены игры в дифференциальной игре п-\-т лиц, в которой закон движения каждого из преследователей Р{ имеет вид
Хі = /і{хі, щ), Хі(0) = ж, щ Є U{. (0.36)
РОССИЙСКАЯ
ГОСУДАРСТВЕННАЯ
БИБЛИОТЕКА
Закон движения каждого из убегающих Ej имеет вид
Уз = 9і(Уі, vj), у,-(0) = yj, Vj Є Vj. (0.37)
Здесь Хі, yj Є Rk, Ui Є Rni, Vj Є Rmj, C/j, Vj — компакты. Пусть
Обозначим через Г(Хо, lo, Jt) игру, начинающуюся в момент t = 0 из начальных позиций (Xq, Yq) с функцией выигрыша
JT{xi{t),yj{t)) = Y^mrmn\\xi{t)-yj{t)\\.
При m = n = 1 данная игра рассматривалась в [108]. Будем предполагать, что для систем (0.36), (0.37) выполнены следующие условия:
1. функции fi(gj) определены и непрерывны на Rk X U{(Rk х Vj);
2. функции fi(gj) удовлетворяют по Xi(yj) локальному условию Липшица с константой, не зависящей от щ(уі);
3. для всех (жг-, щ) Є Rk х Ui, (yji Vj) E Rk xVj справедливы неравенства
\{хьЬ(х{,щ))\ <С*(1+|М|2)>
І(Уі,Рі(Уі,«і))|<^(1 + ||УіІ|2).
Определение 0.15. Кусочно программной стратегией Qi преследователя Pi называется пара {a, Qa}, где а Є :
0 = *о < *1 < * * ' < *г < *г+1 = Г,
a Q(j — семейство отображений &', / = 10,..., г ставящих в соответствие величинам
(ti, xi(ti),..., xn(ti), yi(t{),... ут(Ь),
min min \\xi(t) - yi{t)\\,..., min min \\xi(t) - ym(t)\\) (0.38)
te[Q,tt] г te[0,tt] г
измеримую функцию щ = Ui(t) Є Щ, определенную для t [tl,ti+i).
Определение 0.16. Кусочно программной стратегией Sj убегающего Ej называется пара {a, Sa}, где а Є S :
0 = t0 < h < < tr < tr+i = Г,
a Sa — семейство отображений с'-, I = 0,... ,г ставящих в соответствие величинам (0.38) измеримую функцию Vj = Vj(t) Є Vj, определенную для t Є [ti,ti+i).
Совокупность (Qi,...,On,Si,...,Sm) называется ситуацией. В силу наших предположений, в каждой ситуации (Qi,..., Оп, Si,..., Sm) определены траектории Х{ = xi(t),yj = yj(t) для t Є [0,Т] и, определено значение функции выигрыша
K(Qh...,Qn,Sh...1Sm) = Y^t^]^Mt)-yj(t)\\- (0.39)
Игрок Р стремится минимизировать величину K(Q\,..., Qn, Si,..., Sm), игрок E — максимизировать данную величину.
Игру из начальных позиций (Xq,Yo) с функцией выигрыша J при условии игроки используют кусочно программные стратегии обозначим
Г(Х0,Уо),аеецену-Т/(Х0,Уо).
В диссертации доказывается существование цены игры в игре
V(Xq,Yq), а также приводится некоторое дополнение к данному утверждению.
Конфликтно управляемые процессы с нефикси рованным временем
Объектом исследования диссертации являются конфликтно управляемые процессы со многими участниками.
Теория конфликтно управляемых процессов представляет собой интенсивно развивающийся раздел современной математики. В данной теории исследуются задачи управления динамическими процессами в условиях конфликта, который предполагает наличие двух или более сторон, способных воздействовать на процесс с противоположными или несовпадающими целями и оптимизировать заданные функционалы качества процесса. Динамические процессы могут описываться дифференциальными, интегральными, разностными, гибридными и другими уравнениями. Конфликтно управляемые процессы, описываемые обыкновенными дифференциальными уравнениями, называют дифференциальными играми ([7]), термин был введен Р.Айзексом — одним из основоположников теории дифференциальных игр.
Одной из первых работ в этой области, по всей видимости, следует считать работу Г. Штейнгауза, опубликованную в 1925 году, в которой он формулирует задачу преследования.
Становление теории дифференциальных игр относится к началу 60-х годов XX века и связано с именами советских и зарубежных математиков Н.Н. Красовского, Л. С. Понтрягина, Л. А. Петросяна, Б. Н. Пшеничного, Р.Айзекса, У.Флеминга. Крупный вклад в развитие теории дифференциальных игр внесли А. А. Азамов, А. Я. Азимов, Э. Г. Альбрехт, М. Барди, В. Д. Батухтин, Т. Башар, Ю. И. Бердышев, А. Брайсон, М. С. Габриэлян, Н. Л. Григоренко, Р. В. Гамкрелидзе, П. Б. Гусятников, М. И. Гусев, В. Г. Гусейнов, В. И. Жуковский, В. В. Захаров, М. И. Зеликин, Д. Зонневенд, Р. П. Иванов, А. Ф. Клейменов, А. В. Кряжимский, А. Б. Куржанский, А. Н. Кра-совский, Дж. Лейтман, В. Н. Лагунов, Ю. С. Ледяев, Н. Ю. Лукоянов, A. А. Меликян, А. В. Мезенцев, Е. Ф. Мищенко, М. С. Никольский, B. В. Остапенко, Ю. С. Осипов, А. Г. Пашков, В. С. Пацко, Н. Н. Пе тров, Г. К. Пожарицкий, Е. С. Половинкин, Б. Б. Рихсиев, И. С. Раппо порт, Н. Ю. Сатимов, А. И. Субботин, Н. Н. Субботина, В. Е. Третьяков, В. Н. Ушаков, В. И. Ухоботов, У. Флеминг, А. Фридман, Хо-Ю-Ши, А. Г. Ченцов, Ф. Л. Черноусько, А. А. Чикрий, СВ. Чистяков, Р. Эллиот, Л. П. Югай и многие другие математики.
Красовским Н.Н. и представителями его научной школы ([66], [68], [69],[8], [10], [65], [70], [71], [187], [186]) создана теория позиционных игр, в основе которой лежит понятие стабильного моста и правило экстремального прицеливания. Для широких классов дифференциальных игр доказана теорема об альтернативе ([66], [68], [69], [186]). Обоснованы методы детерминированных и стохастических программных конструкций. Решение игровой задачи сводится к последовательному выбору экстремальных управлений, сохраняющих траекторию конфликтно управляемого процесса на стабильном мосту и приводящих траекторию по нему на терминальное множество.
Связь между задачами раскрывается центральным результатом теории позиционных дифференциальных игр — теоремой об альтернативе, которая утверждает, что в рамках принятой формализации всегда, при подходящем выборе классов стратегий игроков, разрешима одна и только одна из указанных задач.
Таким образом, задачи сближения-уклонения являются взаимоисключающими и взаимодополняющими. Отсюда следует важный вывод о принципиальной неулучшаемости позиционного способа управления. Кроме того, теоремы об альтернативе позволяют рассматривать каждую из задач сближения или уклонения как критерий разрешимости противоположной задачи.
Большое внимание в работах данной школы уделяется вопросам практической реализации процедур управления и численного решения прикладных задач теории дифференциальных игр ([192], [198], [102]).
В работах А. И. Субботина ([189], [190]) условия стабильности сформулированы при помощи производных по направлению. В результате получены дифференциальные неравенства, обобщающие основное уравнение дифференциальных игр, записанное Р. Айзексом. Данный подход был применен к построению теории обобщенных решений уравнений Гамильтона-Якоби.
Поимка одного убегающего в примере Л. С. Понтрягина со многими участниками
Удобнее строить мосты, не являющиеся максимальными, но обладающие свойством стабильности и дающие эффективно реализуемые процедуры управления. Одним из способов построения таких мостов связан с программным или первым поглощением ([8], [66], [163], [202], [213], [219]). Условие регулярности и обеспечивает окончание игры за время первого поглощения ([66],[213]). При этом обосновывается преследование по кривой погони. Программные конструкции положены в основу метода программных итераций ([201]).
Одним из способов построения стабильных мостов являются попятные процедуры, позволяющие вскрыть структуру дифференциальной игры. Начальные идеи в этом направлении принадлежат Л.С.Понтря-гину и реализованы им в методе альтернированного интеграла ([151], [152]). В линейном случае этот метод дает эффективные достаточные условия разрешимости задачи преследования. Попятные процедуры с дискриминацией убегающего распространены на нелиненйые системы в работе Б. Н. Пшеничного ([160]). При этом рассмотрены случаи фиксированного и нефиксированного времени.
Идею рассматривать дифференциальную игру с двух точек зрения предложил и развил Л. С. Понтрягин ([147]). При таком подходе выдвигается на первый план один из игроков, которому предоставляется право строить управление на основе определенной информационной дискриминации противника.
Приведем более подробное описание формализации дифференциальных игр, предложенных Л. С. Понтрягиным ([148]). Пусть движение конфликтно управляемого объекта z описывается системой (0.1). Л. С. Пон трягин подчеркивает: "... мы связываем с дифференциальной игрой две разные задачи.
1. Нашей целью является завершение игры , т.е. приведение точки z на множество М; при этом для осуществления этой цели в нашем распоряжении находится управляющий параметр и, так что в каждый момент времени t мы выбираем значение u(t) этого параметра, используя z(s) и v(s) на отрезке t—ії s t, где "&- подходящим образом выбранное положительное число. Таковы привила преследования.
2. Нашей целью является предотвращение конца игры, т.е. предотвращение прихода точки z на множество М. При этом для достижения этой цели в нашем распоряжении находится управляющий параметр v, так что в каждый момент времени t мы выбираем значение v(s) этого параметра, используя z(s),v(s) на отрезке t — d .s t. Таковы правила игры убегания."
Основопологающие результаты по решению дифференциальных игр преследования и убегания получили Л. С. Понтрягин и Е. Ф. Мищенко. В работе ([151]) сформулированы достаточные условия разрешимости задачи преследования в нелинейных дифференциальных играх. В ней использован формализм принципа максимума - одного из центральных методов теории управления. Основной результат заключается в описании множества начальных позиций, из которых гарантируется возможность завершения преследования, а также в вычислении времени преследования, и способ формирования управления преследователя, реализующего процесс преследования.
Упрощение результатов работы ([151]) привело к созданию Л. С. Пон-трягиным первого и второго методов решения задачи преследования для линейных дифференциальных игр ([147]). Наиболее простым и достаточ но эффективным для решения конкретных задач преследования является первый метод Л.С.Понтрягина. Данный метод дает удобно проверяемые достаточные условия разрешимости задачи преследования в классе контрстратегий. Первый метод Л.С.Понтрягина послужил основой для многих обобщений, в частности, ([62],[92], [94],[89], [83], [217], [146]). Данный метод имеет тесную связь с методом разрешающих функций.
Преследование группы жестко скоординированных убегающих в примере Л.С.Понтрягина
Основополагающие результаты по решению линейных дифференциальных игр убегания принадлежат Понтрягину Л. С. и Мищенко Е. Ф. ([153]) Они получили условия на параметры процесса, достаточные для разрешимости задачи уклонения на всем бесконечном полуинтервале времени. Условия убегания в работах Понтрягина Л. С. и Мищенко Е. Ф. формулируются в геометрической форме, а при решении конкретных задач убегания доказаны новые геометрические свойства решений дифференциальных уравнений. Метод Л.С.Понтрягина-Е.Ф.Мищенко получил название метод маневра обхода. Нелинейная задача уклонения рассматривалась в ([210], [91]), где был предложен другой метод решения задачи уклонения, получивший название метода уклонения по направлению. Достаточно тонкие условия убегания дает метод инвариантных подпространств. Плодотворным оказался метод Ф. Л. Черноусько ([204]), дополненный в работах ([255], [47]). Новый метод исследования квазилинейных дифференциальных игр убегания предложили Р. В. Гамкрелидзе и Г. Л. Харатишвили.
Естественным обобщением дифференциальных игр двух лиц являются дифференциальные игры с участием группы преследователей и одного или группы убегающих. Новые способы решения дифференциальных игр с участием группы преследователей были предложены в работах Е. Ф. Мищенко, Л. А. Петросяна, Б. Н. Пшеничного, А. А. Чикрия, Н. Л. Григоренко, М. С. Никольского, Н. Ю. Сатимова, И. С. Раппопорта, П. Б. Гусятникова, Б. Б. Рихсиева, В. И. Жуковского, А. А. Азамова, Р. П. Иванова, В. Л. Зака и многих других математиков ([137], [164], [218], [182], [172], [91], [39], [32], [22]).
Отметим, что одной из первых работ, посвященных задаче группового преследования была работа Л.А.Петросяна ([136]), где было введено понятие стратегии параллельного преследования.
Толчком к появлению большого числа работ по указанной тематике послужила статья Б. Н. Пшеничного ([159]), в которой рассматривался случай простого преследования несколькими объектами одного преследуемого объекта при одинаковых возможностях всех участников. Было показано, что поимка происходит тогда и только тогда, когда начальная позиция убегающего принадлежит внутренности выпуклой оболочки начальных позиций преследователей.
Задачи преследования и убегания с участием групп преследователей и убегающих в литературе представлены достаточно слабо. Это объясняется в первую очередь сложностью данного класса задач.
Задача о поимке двух убегающих группой преследователей в квазилинейных дифференциальных играх рассматривалась в [29]. Были получены достаточные условия поимки.
В работе [220] А.А. Чикрием и Прокоповичем П.В. рассматривалась задача уклонения группы из т убегающих от группы из п преследователей, в которой закон движения каждого из участников имел вид z = Az + w, w Є V, z Є Rk, где А- квадратная матрица, V- выпуклый компакт, к 2. В терминах начальных позиций и параметров игры были получены достаточные условия уклонения хотя бы одного убегающего от группы преследователей из заданных начальных позиций и из любых начальных позиций (в последнем случае предполагается, что величины п, т фиксированы.
В работе [179] Сатимовым Н.Ю. и Маматовым М.Ш. была рассмотрена линейная задача преследования группой преследователей группы убегающих, при условии, что все убегающие используют одно и тоже управление. Были приведены достаточные условия поимки хотя бы одного убегающего.
В работе [112] Петровым Н.Н. и Прокопенко В. А. была рассмотрена задача простого преследования группой преследователей группы убегающих при равных возможностях всех участников и при условии, что убегающие в момент t = О выбирают свои управления на весь интервал [О, со), сообщают о своем выборе преследователям, а каждый преследователь ловит не более одного убегающего. Были получены необходиыме и достаточные условия поимки.
Мягкая" поимка группы жестко скоординированных инерционных объектов
Теорема 0.2. Пусть для игры Г выполнены предположения 0.1,0.3,0.4,0.5. Тогда в игре Г из состояния z = (z,..., z) происходит поимка в момент T(z).
Во втором параграфе первой главы рассматривается дифференциальная игра Г, описанная в первом параграфе. Получены достаточные условия разрешимости задачи преследования в нефиксированный момент времени.
Определение 0.3. Будем говорить, что в игре Г из начального состояния z = (z,..., z) происходит поимка, если существуют момент T(z), квазистратегииU\(t, z, vt(-)),... ,Un(t, z, vt{-)) преследователей Pi,...,Pn, такие, что что для любой измеримой функции v(-),v(t) Є V, y(t) Є D, t Є [0,T(z0)] найдутся номер q Є {1,...,п} и q момент Г T(z) такие, что zq(T) Є М( Предположение 0.6. Для точки z такой, что щеАіі2$ (f. МІ ДЛЯ всех і, t справедливы соотношения соп(М? - meAitz4) П щеЛ -Т г(и{, v) ф 0 (0.7) для всех І, 0 Т t 00, V EV. Пусть для точки z выполнено предположение 0.6. Определим функции \i(t,r,v) = = sup{A : A 0, -X(Mf - щеМіг\) П щеАі{1 т)ifi{Uh v) ф 0}. Пусть далее ОД = -К) :«:[(), ]- У, і/(г) Є Д г Є [0, і]}, T(z) = min{t 0 : inf max / \i(t, r, V(T)) 1T 1}. «()ЄП(0 і J 0 Теорема 0.3. Пусть Mf = {0},ЩЛІ = Аіщ для всех і, выполнено предположение 0.6 и T(z) со. Тогда в игре Г происходит поимка. Предположение 0.7. Существует р Є Rk,p ф 0,ц Я1 такие, что для множества Di = {y: {р,у) ц} справедливо D С D\. Полагаем An+i(, T,V) = (р, B(t — т)г;(т)), где B(t) — непрерывная матричная функция. Предположение 0.8. \t(t,r,v), І Є /(1) не зависят от t, т.е. \i(t,т,v) = Л/(т,v) для всехг )0,D6F. Пусть 5(т) — inf max Л(т, v). Предположение 0.9. Существуют положительные числа с, ci,C2 непрерывная матричная функция B(t) такие, что t 1- \\еАіУо\\ сь / ел(і"г) - B(t - r)\\dr c2 для всех t 0; 2. An+i(r, u) —с(т) для всех г 0, v Є V; t- + 00 g 3. lim J S(r)dT = oo. Теорема 0.4. Пусть выполнены предположения 0.6—0.9. Тогда в игре Г происходит поимка.
Более подробно рассмотрен конфликтно управляемый процесс (0.3), (0.4), (0.6) в случае, когда ЛІ, А — нулевые матрицы, С — единичная матрица.
Следует отметить, что задача группового преследования (0.3), (0.4), (0.6) рассматривалась также в работах ([167], [168], [169]) с той разницей, что граница фазовых ограничений считалась "линией смерти" для убегающего. Был предложен метод решения указанных задач преследования путем сведения к задачам без фазовых ограничений.
Условие поимки - х(т) = у(т) при некотором т. Было показано, если выполнено условие маневреннего превосходства убегающего (q р или существует \i 1 и а Є Rk, что рР + а С Q), убегающий использует квазистратегии, то в данной игре происходит уклонение от встречи.
Дальнейшее изучение дифференциальной игры двух лиц, описываемой уравнениями (0.8), (0.9), при условии, что Р = Д)(р), 5 = Д)(сг) проводилось в работе [182] Было показано, что если выполнено хотя бы одно из условии а) р q,a 0 нк q + l; б) Р = q, с 0, существуют неотрицательные целые числа к\, &2, 0 к\ р — 1, 0 &2 V такие, что щ = bj, 6р_у = ap-.j для всех і = 0,..., к\ - 1, j = 0,..., fc2, где а0 = /о, Ьо = о и к min{g + i + 1,р + — кч — 1}, то в игре происходит уклонение от встречи, при условии, что убегающий использует квазистратегии. В работе [152] рассматривалась игра двух лиц, в которой законы движения преследователя Р и убегающего Е имеют вид х + ах = рщ \\и\\ 1, y + (ly = av, , и 1, где х, y,u,v Є Rk, а, Р,р,а - положительные числа. Было показано, что если Р сг р сг и - -, а р причем хотя бы одно из неравенств строгое, то в игре происходит поимка при условии дискриминации убегающего (условие поимки х = у).
Пятый параграф диссертации посвящен задаче преследователей группой преследователей одного убегающего в примере Л.С.Понтрягина при равных динамических и инерционных возможностях всех игроков. В пространстве R (к 2) рассматривается дифференциальная игра Г п + 1 лиц: п преследователей Pi,...,Pn и убегающий Е. Закон движения каждого из преследователей Pj имеет вид: