Содержание к диссертации
Введение
Глава 1. Линейно-квадратичные дифференциальные кооперативные игры с бесконечным временем окончания. 13
1.1 Постановка задачи и определение дифференциальной игры 13
1.2 Лемма о допустимом наборе управлений 17
1.3 Теорема о существовании равновесия до Нэшу 18
1.4 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов 21
1.5 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов с перекрестными слагаемыми 34
1.6 Метод последовательных приближений 36
1.7 Построение решений кооперативной игры 43
1.7.1 Пропорциональное решение 43
1.7.2 Решения, основанные на построении характеристической функции 46
1.8 Процедура распределения дележа 48
1.9 Условие Янга 50
1.10 Построение супераддитвной характеристической функции 52
Глава 2. Линейно-квадратичные дифференциальные кооперативные игры с конечным временем окончания 71
2.1 Постановка задачи и определение дифференциальной игры 71
2,2 Теорема о существовании равновесия по Нэшу 73
2.3 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов 74
2.4 Построение решений кооперативной игры 86
2.4.1 Пропорциональное решение 87
2.4.2 Решения, основанные на построении характеристической функции 89
Список литературы 91
Приложение 98
- Постановка задачи и определение дифференциальной игры
- Лемма о допустимом наборе управлений
- Постановка задачи и определение дифференциальной игры
Введение к работе
Актуальность темы. Существенным разделом математической теории игр является теория дифференциальных игр. Она имеет большое количество приложений, так как основным объектом исследования этой теории выступает математическая модель конфликтно-управляемого процесса, который развивается непрерывно с течением времени. Именно благодаря этому свойству, управление процессом оперативно реагирует на изменения системы.
Основным инструментом исследования построенной математической модели является система дифференциальных уравнений, которая описывает динамику развития процесса во времени. Цели, преследуемые игроками, описываются с помощью функций выигрыша, которые имеют различный вид, что позволяет описать множество конфликтно-управляемых процессов в терминах теории дифференциальных игр.
Одной из первых работ по теории дифференциальных игр является "Дифференциальные игры" Р. Айзекса. В работе были предложены общие подходы к решению дифференциальных игр; одним из таких подходов является решение основного уравнения дифференциальных игр, которое часто называют уравнением Айзекса-Беллмана.
В развитие теории дифференциальных игр свой вклад в различное время внесли Красовский Н.Н., Понтрягин Л.С, Зубов В.И., Субботин А.И., Никольский М.С., Петросян Л.А, Данилов Н.Н., Томский Г.В., Basar Т., Olsder G.J.,Yeung D. W. К. Большинство работ по дифференциальным играм посвящено некооперативным играм, в которых в качестве решения используется равновесие по Нэ-шу (неантагонистический случай) и ситуация равновесия (антагонистический случай).
Развитие исследования решения линейно-квадратичных дифференциальных игр связано с выходом в свет работы "Dynamic noncooperative game theory", Basar Т., Olsder G.J.. В этой работе большое внимание уделено исследованию бескоалиционных линейно-квадратичных дифференциальных игр многих лиц, а также играм двух лиц. Дальнейшие работы направлены на более детальное изучение таких игр с дополнительными ограничениями. Для этих частных случаев выведены условия существования решений бескоалиционных игр в различных классах допустимых управлений(програмных, синтезирующих), также рассматриваются
вычислительные аспекты построения решения. Более детально исследовано поведение решения линейно-квадратичных дифференциальных играх в скалярном случае.
Зачастую, самой постановкой многих задач, формализуемых как дифференциальные игры, диктуется необходимость объединения игроков в коалиции, поэтому исследование кооперативных дифференциальных игр - действительно актуальная задача.
В кооперативной теории дифференциальных игр изначально предполагается, что игроки, действуя сообща, выбирают управления, оптимальные в смысле максимизации суммарного выигрыша, и вопрос заключается в определении "справедливого" (оптимального) дележа этого суммарного выигрыша. В классической статической теории кооперативных игр сформулированы многочисленные принципы оптимальности (С-ядро, вектор Шепли, NM- решение). Однако, попытки переноса известных в статической теории принципов оптимальности на различные виды дифференциальных игр без дополнительного исследования невозможны, так как почти всегда могут привести к выбору заведомо не реализуемых решений. Это связано с потерей динамической устойчивости (состоятельности во времени) принципов оптимальности. Это обстоятельство было впервые обнаружено Пет-росяном Л.А. Им же предложен метод регуляризации, основанный на построении процедуры распределения дележа (ПРД), приводящий к динамически устойчивым решениям. Этот метод впервые применяется для регуляризации решений линейно-квадратичных кооперативных дифференциальных игр.
Основной целью работы является нахождение решений линейно-квадратичных кооперативных дифференциальных игр с бесконечным и конечным временем окончания. Построение с этой целью характеристической функции различных видов в классе стратегий, гарантирующих экспоненциальную устойчивость реализуемых траекторий, для игр с неограниченной продолжительностью. Построение состоятельных во времени (динамически устойчивых) оптимальных дележей и соответствующих им ПРД. Вывод необходимых условий, гарантирующих неубыточность кооперативного поведения при неблагоприятных сценариях развития игры (условие Д.В.К. Янга) для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания.
Научная новизна. В работе впервые построены основы теории линейно-квад-
ратичных кооперативных дифференциальных игр как с конечным, так и с бесконечным временем окончания. Это потребовало выработки новых подходов для построения характеристической функции и решений, получаемых на её основе. Предложена новая модификация метода последовательных приближений В.И. Зубова для нахождения управлений оптимальных в смысле максимизации суммарного выигрыша игроков, входящих в коалицию. Произведена регуляризация классических принципов оптимальности кооперативной теории применительно к данной задаче, исследованы свойства решений.
Практическая ценность. Результаты, полученные в диссертационной работе, могут быть положены в основу теории линейно-квадратичных кооперативных дифференциальных игр. Практическая ценность работы обусловлена областью применения линейно-квадратичных дифференциальных игр. Такие игры применяются при математическом моделировании взаимодействия подвижных объектов в условиях конфликта технических и технологических процессов, а также при моделировании развития сложных социально-экономических систем. Поэтому сферу применения полученных результатов можно оценить описанной областью применения линейно-квадратичных дифференциальных игр, в которой имеет содержательный смысл кооперации игроков.
Основные положения, выносимые на защиту:
вывод необходимых и достаточных условий для существования набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалиции" для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания при дополнительном условии экспоненциальной устойчивости реализуемых траекторий движения,
построение метода последовательных приближений для определения набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалиции" для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,
построение супераддитивной характеристической функции для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем
окончания,
построение состоятельного во времени дележа и процедуры распределения дележа, которая соответствует этому дележу, и определение необходимых условия для выполнения условия Д.В.К. Янга для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,
вывод необходимых и достаточных условий для существования набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалиции" для линейно-квадратичных кооперативных дифференциальных игр с конечным временем окончания.
Апробация работы. Основные результаты были доложены на семинарах кафедры математической теории игр и статистических решений, на семинаре кафедры теории управления, семинарах Центра теории игр, на Международном семинаре "Теория управления и теория обощенных решений уравнений Гамильтона-Якоби" (Екатеринбург, 2005), на Международной конференции "Устойчивость и процессы управления" (Санкт-Петербург, 2005), на "Summer School on Game Theory in Computer Science" (Aarhus, Denmark, 2006), на семинаре "Российско-финской летней школы "Динамические игры и многокритериальная оптимизация" (Петрозаводск, 2006), на семинаре Воронежской весенней математической школы "Понтрягинские чтения-XV" (Воронеж, 2004), XXXIV научной конференции "Процессы управления и устойчивость"(Санкт-Петербург, 2003 г.), XXXV научной конференции "Процессы управления и устойчивость"(Санкт-Петербург, 2004 г.).
Публикации работы. Материалы исследований опубликованы в [1-5].
Структура и объем работы. Диссертационная работа состоит из введения, двух глав (14 параграфов), списка используемой литературы и приложения. Общий объем диссертации 106 страницы. Список используемой литературы включает 50 наименований.
Постановка задачи и определение дифференциальной игры
Основным инструментом исследования построенной математической модели является система дифференциальных уравнений, которая описывает динамику развития процесса во времени. Цели, преследуемые игроками, описываются с помощью функций выигрыша, которые имеют различный вид, что позволяет описать множество конфликтно-управляемых процессов в терминах теории дифференциальных игр (см.[26])
Одной из первых работ по теории дифференциальных игр является [1]. В работе были предложены общие подходы к решению дифференциальных игр; одним из таких подходов является решение основного уравнения дифференциальных игр, которое часто называют уравнением Айзекса-Беллмана.
В развитие теории дифференциальных игр свой вклад в различное время внесли Красовский Н.Н., Понтрягин Л.С, Зубов В.И., Субботин А.И., Никольский М.С., Петросян Л.А, Данилов Н.Н., Томский Г.В.. Basar Т-, Olsdcr G.J.,Yeung D. W. К. Большинство работ по дифференциальным играм посвящено некооперативным играм, в которых в качестве решения используется равновесие по Нэшу (пеантагонистический случай) и ситуация равновесия (антагонистический случай) (см.[9. 10, 18, . 19, 20, 21, 28, 31,32,36]).
Лемма о допустимом наборе управлений
Для определения оптимальных стратегий необходимо каким-то образом варьировать управления игроков, однако эти изменения не должны выводить наборы управлений из класса допустимых в смысле определения 1. Иначе говоря, нужно показать при каких условиях множество допустимых наборов управлений непусто.
Лемма 1. Если для системы (1.1.1) существует, хотя бы, один допустимый набор управлений вида (1.1.3). то для любого S С JV и для любого набора (г х т) — матриц К jit), j Є S с вещественными, непрерывными и ограниченными, при і Є [0, со) элементами существует EQ О такое, что для любого \є\ EQ набор управлений
Постановка задачи и определение дифференциальной игры
Таким образом мы получили, что набор управлений (1.10.17) доставляет J максимині-гос значение.
Если условия теоремы 7 выполнены для любой коалиции S С Лг, то характеристическая функция, определенная по правилу (1.10.2) будет определена на всей своей области определения 2Л. Тогда для определения решения кооперативного варианта игры мы можем пользоваться любым известным принципом оптимальности. Построенная по правилу (1.10.2) будет суипераддитивной.