Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Высокос Мария Ивановна

Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников
<
Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Высокос Мария Ивановна. Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников : диссертация ... кандидата физико-математических наук : 05.13.17.- Москва, 2006.- 129 с.: ил. РГБ ОД, 61 06-1/1209

Содержание к диссертации

Введение

Глава 1. Бескоалиционная игра трех лиц при неопределенности

1. Постановка задачи 8

2. Свойства гарантированных решений 18

3. Достаточные условия 41

4. Существование 45

5. Приложение 54

Глава 2. Дифференциальная бескоалиционная игра трех лиц при неопределенности

6. Нелинейная математическая модель 68

7. Достаточные условия .84

8. Линейно-квадратичная дифференциальная игра 102

9. Применение метода малого параметра 118

Заключение 124

Литература

Введение к работе

Развитие общества сопровождается неизбежными конфликтами. Конфликт — это не только борьба двух, но и любое столкновение нескольких, может и не враждующих сторон. Конфликты неизбежны в экономике, экологии, в механике управляемых систем. Исследование математических моделей принятия оптимальных решений при конфликтах составляет содержание теории игр.

Теория игр возникла в начале XX века и первые ее результаты в монографии Джона фон Неймана и Оскара Моргенштерна "Теория игр и экономическое поведение", опубликованной в 1944 году (на русском языке [47]). Первые этапы развития теории игр были посвящены исследованию "статических" игр, в них не учитывалась динамика объекта управления. Однако уже во второй половине XX века, в связи с запросами динамики управляемых объектов, начинает активно развиваться теория динамических игр [1], [41], [48],[19], [21-23], [34], [35], [37], [39], [49], [52], [57].

Одно из направлений теории игр — бескоалиционные игры, которым и посвящена данная работа. В таких играх каждый игрок действует самостоятельно (не имея возможности объединяться с партнерами в выборе своего поведения) с целью достичь возможно лучшего осуществления своей цели.

Первый вопрос, который возникает по поводу любой игры или любого класса игр, заключается в выборе для этой игры (класса игр) принципа оптимальности. После выбора принципа оптимальности необходимо ответить еще на два вопроса: "Существует ли данное оптимальное решение? Как его найти?". Ответы на все эти три вопроса и составляют содержание теории игр, в частности, игр бескоалиционных.

Наличие неопределенности занимает особое место в конфликтных ситуациях. Неполнота или неточность информации об условиях реализации своей стратегии (своего выбора) и есть неопределенность. Она возникает в процессе принятия решений и может быть вызвана различными причинами [16], [17], [26], [29], [35], [28], [33].

Если о неопределенностях априори известны необходимые статические характеристики, то игра при неопределенности ( с помощью перехода к математическим ожиданиям) обычно сводится к игре без неопределенности. В диссертации же используются только такие неопределенности, о которых известны лишь границы изменения, и может реализоваться любая из возможных (в заданных границах), а какие-либо статистические характеристики отсутствуют (по тем или иным причинам).

Для однокритериальных задач при неопределенности в 50-х годах прошлого века были созданы несколько принципов, на основе которых могут быть построены оптимальные решения [43]. К ним относятся — принцип гарантированного результата (максиминной полезности или принцип Вальда), принцип минимаксного сожаления (принцип Севиджа), принцип пессимизма-оптимизма (принцип Гурвица) и др. В настоящей работе подход к принятию решений основывается на подходящей модификации принципа Вальда.

Все вышеперечисленные принципы были предложены для однокритериальных задач при неопределенности. Переход к более сложным бескоалиционным играм требует модификации применяемых принципов. В связи с этим особое значение приобретает активно развивающееся направление теории принятия решений, получившее название "многокритериальные задачи при неопределенности". В России такие задачи исследовались В.А. Гореликом [18], В.И. Жуковским и B.C. Молоствовым [29], М.С. Никольским [48], М.Е. Салуквадзе [31] и др. Параллельно за рубежом ведутся работы F. Ferro [64, 65], T.Tanaka [70-72], W.L. Chan и W.T. Lau [60], G.Y. Chen [61], J.G. Lin [68]. Основные результаты исследования базируются на принципе гарантированного результата. Такой подход обеспечивает определенные гарантии ЛПР (лицу, принимающему решение) по всем критериям. Впервые попытка обозначить теоретические основы бескоалиционных игр при неопределенности была предпринята в книге Жуковского В.И. [26]. Предложенные там подходы стали основой исследований в предлагаемой работе.

Диссертация посвящена бескоалиционным играм трех лиц при неопределенности. В первой главе рассматривается "статический" вариант игры, с расширением цели одного игрока. Предполагаем, что в такой игре второй игрок стремится не только к "собственной выгоде" (как принято в бескоалиционных играх), но и желает "помочь" первому игроку и "препятствует" третьему в достижении их целей. Возникновение игр данного вида связано с тем, что в настоящее время в большинстве экономических задач становится неэффективным действовать в одиночку, не обращая внимания на остальных участников игры, пусть и находящихся с тобой в конфликте.

Во второй главе диссертации исследуется динамический вариант. Здесь рассматривается бескоалиционная дифференциальная игра трех лиц с переключением во время игры интересов одного участника (второго игрока), т.е. второй игрок до априори заданного момента времени "поддерживает" первого игрока и "препятствует" третьему, в оставшееся время действует наоборот: "мешает" первому и "помогает" третьему.

Целью работы является формализация и исследование гарантированных решений бескоалиционных игр трех лиц при неопределенности и с указанной особенностью. При этом предполагается, что о неопределенных факторах известна лишь область значений, а какие-либо вероятностные характеристики отсутствуют (по тем или иным причинам).

Объектом исследования является теория бескоалиционных игр при неопределенности.

Предмет исследования — бескоалиционные игры трех лиц при неопределенности, в которых учитывается отношение одного из участников к своим партнерам.

Проблема заключается в формализации решений таких бескоалиционных игр при учете неопределенных факторов, исследование свойств решений и способов построения.

В основу исследования положена следующая гипотеза: на основе модификации принципа гарантированного результата, понятий векторных оп-тимумов, равновесия по Нэшу и, следуя [73], можно определить возможные решения данных бескоалиционных игр, получить условия существования и предложить способ их построения.

Для реализации поставленной цели и проверки сформулированной гипо- к: тезы потребовалось решить следующие задачи:

формализовать понятие бескоалиционной игры трех лиц при неопределенности с "расширением" цели отдельного игрока; У

формализовать решение указанной бескоалиционной игры на основе понятия равновесности по Нэшу (из теории бескоалиционных игр), векторных оптимумов (из теории многокритериальных задач) и аналога седловой ''Ь точки (из теории принятия решений в сложных управляемых системах); исследовать свойства такого решения и условия существования;

для бескоалиционной дифференциальной игры трех лиц при неопределенности и с переключением во время игры интересов отдельного игрока ввести понятие гарантированного решения, выявить условия существава-ния и алгоритм построения;

найти явный вид ситуации и неопределенности, реализующих гарантированные решения для линейно-квадратичных задач;

рассмотреть приложение к конкретным экономическим задачам.

Методологическую основу работы составляют методы и подходы теории многокритериальных задач при неопределенности, теории игр, выпуклого анализа, теории матриц и квадратичных форм, дифференциальных уравнений, теории оптимального управления и динамического программи-

рования.

Научная новизна. В работе впервые исследуется бескоалиционная игра при неопределенности, в которой происходит переключение интересов отдельного игрока. Формализация понятий решения данной игры основывается на концепции равновесности по Нэшу и векторных оптимумов; объединение, которых базируется на аналоге векторной седловой точки.

Практическая значимость работы. Результаты диссертации могут быть применены к различным прикладным задачам прогнозирования и планирования в экономике, экологии, механике управляемых систем. В качестве приложения исследована математическая модель функционирования трех фирм на рынке.

Основные положения, выносимые на защиту:

формализовано понятие гарантированного решения для бескоалиционных игр трех лиц при неопределенности и с расширением цели второго игрока;

предложены достаточные условия существования указанных решений в чистых, смешанных и квазисмешанных стратегиях при обычных в теории игр ограничениях;

для линейно-квадратичных игр найдены явный вид ситуации и неопределенности, реализующих указанное решение;

для бескоалиционной дифференциальной игры трех лиц при неопределенности и с переключением интересов второго игрока во время игры формализовано понятие решения; с помощью динамического программирования установлены достаточные условия существования;

для линейно-квадратичного случая динамического варианта игры найден явный вид ситуации и неопределенности, реализующих указанное гарантированное решение.

Апробация. Результаты диссертации докладывались на Воронежской весенней математической школе "Понтрягинские чтения - XVI " "Современные методы теории краевых задач" (Воронеж, 2005), на XIII международной конференции "Математика. Экономика. Образование" (Ростов-на-Дону, 2005), на пятнадцатой Крымской осенней математической школе-симпозиуме "Spectral and Evolutionary Problems" (Simferopol, 2005), на Международной конференции "Современные проблемы прикладной математики и математического моделирования" (Воронеж, 2005), на семинаре факультета ВМиК МГУ "Риски в сложных системах управления" (Москва, 2005), на научно-методическом семинаре кафедры информатики и дискретной математики МПГУ (Москва, 2006).

Перейдем к краткому изложению содержания диссертации. Диссертация состоит из двух глав, разбитых на девять параграфов.

В первой главе (1-5) вводятся гарантированные решения в бескоалиционной игре трех лиц с "симпатиями" и "антипатиями" второго игрока. Именно в 1 определяются основные составляющие элементы такой бескоалиционной игры, описывается процесс принятия решения, определяются цели (на достижение которых направлен процесс управления), рассматриваются различные виды гарантированных решений, формализованных на основе понятий минимума по Слейтеру, Парето, Борвейну, Джоффриону и Л-минимума ( из теории многокритериальных задач), понятия равновесия по Нэшу ( из теории бескоалиционных игр) и аналога седловой точки ( из теории принятия решений в сложных управляемых системах).

Далее в 2 исследуются свойства гарантированных решений, устанавливается связь между решениями.

Затем в 3 получены достаточные условия существования гарантированного по Джоффриону решения и Л-гарантированного равновесия.

В 4 приводятся теоремы существования для смешанного расширения и квазирасширения игры.

Наконец в 5 представлены экономические модели конкуренции трехь фирм.

Содержание второй главы (6-9) составляет формализация гарантированных решений и исследование этих решений в бескоалиционных диффе-Ц ренциальных играх трех лиц при неопределенности и изменением отношения отдельного игрока к своим партнерам в процессе игры.

В 6 определяются основные элементы такой игры, формализуется поня-1 тие гарантированного решения.

Далее в 7 на основе метода динамического программирования установлены достаточные условия существования гарантированного решения.

Затем в 8 найдены коэффициентные ограничения, при которых существует гарантированное решение линейно-квадратичного варианта дифференциальной игры, и при выполнении таких ограничений построен явный вид пары ситуация-неопределенность, порождающей гарантированное решение.

Наконец, в 9 с помощью метода малого параметра выделен класс линейно-квадратичных дифференциальных игр, в которых существует гарантированное решение.

Основные результаты опубликованы в работах [7], [8], [9], [10], [И], [12], [13], [27].

Свойства гарантированных решений

Справедливость таблицы 2.2 следует из таблицы 2.1. Стрелки в таблице 2.2 означают, что например G-гарантированный G-равновесный выигрыш f{xG,yc) одновременно является В-гарантиро-ванным G-равновесным /(хс,ув) и G-гарантированным В-равновесным f(xB,yG) и т.д.

Замечание 2.1. Из таблицы 2.1 получаем, например, что любая Аі-га-рантированная Аг-равновесная пара (аИ2, ) игры (1.1) при любых постоянных 3 X 3-матрицах Аі и Аг (с положительными элементами) одновременно будет L-гарантированной К-равновесной при всех К = S, Р, В, G, Аг и L = S,P,B,G,Ai, а например, G-гарантированная G-равновесная пара (хс,ус) этой игры одновременно будет L-гарантированной К-равновесной при K,L = S,P,B,G. Аналогичный смысл таблицы для L-гарантирован-ных выигрышей.

Из таблицы 2.1 также получаем, что множество всех L-гарантированных К-равновесных пар (хк,уь) при любых конкретных К = S,P,B,G,A2 и L = S,P,B,G,Ai является подмножеством S-гарантированных S-равно-весных пар {(xs,ys)}. Замечание 2.2. Из утверждений 2.1 и 2.2 следует, что

a) необходимые условия существования S-гарантированной S-равновес-ной пары (xs,ys) игры (1.1) остаются необходимыми и для остальных 24 таких решений (из определения 1.1);

b) большинство свойств, присущих S-гарантированной S-равновесной паре (xs,ys), остаются справедливыми и для остальных;

c) достаточные условия существования Аі-гарантированной Аг-равно-весной пары игры (1.1) будут достаточными для L-гарантированной К-равновесной при всех K,L = S,P,B,G,A2(Ai); факт существования Аі-гарантированной Аг-равновесной пары (xA2,yAl) игры (1.1) обеспечивает существование всех остальных L-гарантированных К-равновесных пар игры (1.1) при всех К, L = S, Р, В, G;

d) из существования G-гарантированной G-равновесной пары (xG,yc) игры (1.1) следует существование всех остальных L-гарантированных К-равновесных пар игры (1.1) при всех K,L = S,P,B,G.

Утверждение 2.3. Предположим, что для двух постоянных ЗхЗ-матриц Аг (г = 1,2) с положительными элементами и двух постоянных векторов 7 Є {а = (аі,а2,аз)\аі О, Ei=iQi 0} (І = 1,2) выполнены равенства max fi(xuxA\xA2,yAl) = h(xA2,yAl), ХіЄЛі max /з(хі2,Х22,х3,уАі) = h(xM,yM) Ж3Є-Х3 ть02)] А2фї2,Х2,хі\уАі) = [ } А2фА уАі), (2.1) Ж2Є-Л2 тЫт ГАх/ .у) = [7(1)] Ai/(s у ). (2.2)

Тогда пара (xA2,yAl) Є X х Y является Аі-гарантированной Аг-равно-весной в игре (1.1) и поэтому L-гарантированной К-равновесной при всех K,L = S,P,B,G,A2(A1).

В (2.1) и (2.2) и далее штрих сверху означает операцию транспонирования, то есть [7 ] есть вектор-строка; напомним, что трехкомпонентные вектора-столбцы / = (/і,/2,/з) и ір = (у?ь /?2, з) = (/1,/2,-/3)- Доказательство непосредственно следует из общеизвестных достаточных условий существования максимальных и минимальных по Слейтеру альтернатив из теории многокритериальных задач [53, с. 66-67]. Аналогично устанавливается справедливость следующего Утверждение 2.4. Предположим, что для двух постоянных векторов 7(і) Є {а = (аиа2,а3)\оц 0} (j = 1,2) (2.3) выполнены равенства тахХіЄА-х fi(xi,x,xf,yG) = fi(xG,yG), тахЖзЄХз /з(я?» жз, Ус) = /з(яс, Ус), тъхХ2еХ21ч] р{х?,х2,х$,у0) = [7(2)]V( G,2/G), (2.4) тіпуЄу[7(1)]7( ,2/) = b{1)} f(xG,yG)- (2.5)

Тогда пара (хс,уд) является G-гарантированной G-равновесной для игры (1.1) и, следовательно, L-гарантированной К-равновесной при всех K,L = S,P,B,G.

Замечание 2.3. На основаниии утверждения 2.3 можно предложить следующий способ построения Аі-гарантированной Аг-равновесной пары игры ал). a) игроки прежде всего должны выбрать две постоянные ЗхЗ-матрицы Аі = (а\к ) и Аг = (% ) с положительными элементами afk (і, к = 1,2,3; 3 = 1,2); b) затем нужно выбрать два постоянных ненулевых вектора 7(і) = (70),70),70)) таких, что 70) о (г Є {1,2,3}) и lti# У=1,2); c) следует составить две вспомогательные скалярные функции

Тогда Ai-гарантированное Аг-равновесие игры (1.1) имеет вид (ж ,2/Лі) и эта же пара является L-гарантированной К-равновесной данной игры для BcexK = S,P,B,G,A2 HL = S,P,B,G,AI.

Замечание 2.4. С помощью утверждения 2.4 предложим способ построения G -гарантированной G-равновесной пары (хс,уа) игры (1.1) о) прежде всего нужно выбрать два постоянных вектора 7 = (Ті 72 »7з ) 0=1» 2) с положительными компонентами 7,- (г Є {1,2,3}, j = 1,2); 6) затем следует составить две функции xi{ y)=Hi)v(x,y) = j:1f)fi(x,y), Iі (2-8) Х2{х,у) = Ь{2)] ф,у) = Е7І2)Л(ж,у) - 7з2)/з(ж,2/); с) найти пару (xG,yo) Є X х Y удовлетворяющую четырем равенствам max /i(zi,a#,af ,г/с) = h(xG,yG), хіЄЛі max /з(я? ,а#,а;з,2/с) = h(xG,yG), max X2(a;f, x2, af, yG) = x2(zG, 2/G), ягЄлг тіпхі(жс,у) = хі(а;с,ї/с), где х;(ж,і/) определены в (2.8).

Тогда пара (хс,уд) будет G-гарантированной G-равновесной в игре (1.1), а значит и L-гарантированной К-равновесной при всех K,L = S,P,B,G; напомним, что здесь вектор (p=((pi, (р2, з)=(/ъ /2, -/з) 2.2. Компактность множества S-гарантированных S-равновес-ных пар Свойство 2.1. Если в игре (1.1) 1) множества X х Y суть непустые компакты ( непустые замкнутые и ограниченные подмножества евклидовых пространств Rn и Rm соответственно); 2) критерии fi{x,y) (г = 1,2,3) непрерывны на X х У, то множество всех S-гарантированных S-равновесных пар (xs, ys) игры (1.1) является компактом в X х Y (может и пустым). Доказательство. Рассмотрим последовательность {{х к\у(к))} (А; = 1,2,...) S-гарантированных S-равновесных пар игры (1.1).

Существование

Лемма 4.2. Пусть 1) функция fi(x,y) вогнута по х\ Є Хі при любом фиксированном наборе (гг2, а?з у) Є Хг х Хз х У, вогнута по Х2 Є Хг при любом фиксированном наборе (x\,xz,y) Є Xi х Хз х У; 2) функция /г(ж,у) вогнута по Х2 Є Хг при любом фиксированном наборе (яі,яз,у) Є ХіхХ3х У; 3) функция fz(x,y) вогнута по жз Є Хз при любом фиксированном наборе (жі,жг,у) Є Xi х Хг х У и выпукла по жг Є Хг при каждом фиксированном наборе (жі,жз,у) Є Xi х Хз х У; 4) функции fi(x,y) (г = 1,2,3) выпуклы по у Є У при каждой ситуации жЄХ. Тогда функции Fi(x,y) из (3.11), (3.13) и (3.15) вогнуты по Х{ (г = 1,2,3), a F{{x,y) вогнута по у Є У соответственно.

Доказательство. Пусть функция /і(ж, у) вогнута по х\ Є Xi при любом фиксированном наборе (жг,жз,у) Є Хг х Хз х У и /з(ж,у) вогнута по жз Є Хз при любом фиксированном наборе (жі,жг,у) Є Xi х Хг х У. Тогда, согласно (3.11), функции Fi(x,y) и з(ж,у) вогнуты по хі Є Х\ при любом фиксированном наборе (жг, жз, у) Є Хг х Хз х У и по жз Є Хз при при любом фиксированном наборе (х\,хч,у) Є Xi х Хг х У соответственно.

Пусть функции f\(x,y) и /ч{х,у) вогнуты по жг Є Хг при любых фиксированных наборах (жі,жз,2/) Є Х\ х Хз х У. Тогда функции агу/і(я,2/) и ai2 h{xi 2/) ( = 1? 2,3) также вогнуты по жг Є Хг при любых фиксированных наборах (жі, жз 2/) Є Xi хХз хУ, так как постоянные а\- 0 (i,j Є {1,2,3}). Если функция fz(x,y) выпукла по xi при любых фиксированных наборах (xhxhV) Є Xi х X3xY, то функция -аі3/3(х,у) (і = 1,2,3) вогнута по х-і при любых фиксированных наборах (жі,жз,г/) Є Х\ х Хз х У, так как -а;з = consi 0. Следовательно, Ji(x,y) из (3.12) вогнута по жг Є Xi при любых фиксированных наборах (жі, жз, у) Є Хі х Хз х У как сумма вогнутых по хч Є Хг функций с положительными коэффициентами. Отсюда получаем, что Ёч(х,у) из (3.13) также вогнута по жг Є Хч при любых фиксированных наборах (xi,xz,y) Є Х\ х Хз х Y как сумма вогнутых по хч Є Хч функций с неотрицательными коэффициентами (не равные нулю одновременно).

Аналогично, если функции fi(x,y) (і = 1,2,3)выпуклы по у Є Y при каждом х Є X и элементы а- (г, j Є {1,2,3}) постоянной 3 х 3-матрицы Аі положительны, тогда функции к(х,у) из (3.14) так же являются выпуклыми по у Є Y при каждом х Є X. Поэтому функции —7»(Е,2/) будут уже вогнуты по у Є У при каждом х Є X, так как постоянные — 7» 0 (г = 1,2,3) и не все равны нулю. Значит вогнута по у Є У при каждом х Є X и функция F (x,y) из (3.16). Теорема 4.2. Пусть в игре (1.1) 1) множества Х{ (і Є {1,2,3}) и У — выпуклые непустые компакты; 2) функции fi(x,y) (г = 1,2,3) непрерывны на X х У; 3) функция /і (ж, у) вогнута по х\ Є Х\ при любом фиксированном наборе {х2, жз У) Є Хг х Хз х У и вогнута по хч Є Хг при любом фиксированном наборе (жі, жз, у) Є Xi х Хз х У; функция /г(ж, у) вогнута по хч Є Хч при любом фиксированном наборе (жі, жз, у) Є Xi х Хз х У; функция /з(ж, у) вогнута по жз Є Хз при любом фиксированном наборе (жі, жг, у) Є Х\ х Хч х У и выпукла по Ж2 Є Хг при любом фиксированном наборе (жі,жз,і/) Є Х\ х Хз х У; функции fi(x,y) (г = 1,2,3) выпуклы по у Є У при каждом ж Є X.

Тогда в игре (1.1) при любом выборе постоянных 3 х 3-матриц Аг (г = 1,2) с положительными элементами существует Аі-гарантированное Аг-равновесное решение, и по утверждению 2.2 тогда существуют все остальные гарантированные равновесия при L = S,P,B,G,Ai и K = S,P,B,G,A2.

Доказательство. Из непрерывности на X х Y функций Дсс, у) следует непрерывность на X х Y функций Щх,у) (г Є {1,2,3}), определенных в (3.11), (3.13) и (3.15) (как сумма непрерывных функций). Кроме того (по лемме 4.2) функция Fi(x,y) вогнута по х\ Є Х\ при любом фиксированном наборе (х2, хз, у) Є Хч х Х$ х Y, fyx, у) вогнута по хг Є Хч при любом фиксированном наборе (хі, хз, у) Є Х\ х Х$ х У, Р$(х, у) вогнута по х$ 6 Х$ при любых фиксированных наборах (х\,Х2,у) Є Х\ х X-i х Y и Fi(x,y) вогнута по у Є Y при любых х Є X. Следовательно (по теореме [4,с.90]) в игре (3.10) существует равновесная по Нэшу ситуация (хе,уе) (= X х Y.

Согласно утверждению 3.2 эта пара будет для игры (1.1) Аі-гарантиро-ванной Аг-равновесной пара. Отсюда следует, что в игре (1.1) существует и Аі-гарантированное Аг-равновесное решение.

Достаточные условия

Тогда пара (/7, Z) G U х Z отвечает всем требованиям определения 6.1 и, следовательно (замечание 6.5), порождает ГіР (U, ,7(/7, Z, to, XQ)) игры (6.1) с начальной позицией (о,#о) Є [0,t{) х Rn.

В (7.5) n-вектор x (ti) — значение решения x \i), t Є [ о» і]» системы (6.2), порожденное ситуацией (Щ \щ ,Щ ) 6 Ы и неопределенностью 2М Є Ж1), т.е. решение системы х = f(t,x,u \t,x),u{2\t,x),u{ (t,x),z (t,x)), x(t0) = x0, где u[1] -г uP(t,x), Of -г 4435) ( = 2.3). (1) -5" 2(%ж) именно те стратегии, которые используются игроками на первом этапе игры [ o i] и, соответственно, неопределенность, которая реализовалась на этом этапе при осуществлении неравенства из (7.5); аналогично, x (t\) — значение решения x (t), t Є [ о і]» системы (6.2), порожденное ситуацией (U[ \щ \щ ) Є U и неопределенностью Z \ которые реализовались на этом этапе [to i] при оценке критерия /з(#) в (7.6); xW(ti) — значение решения x (t), t Є [to,t\], системы (6.2), порожденного реализовавшимися на этом этапе ситуацией (U\ \щ ,Щ ) Є l№ и неопределенностью 2 Є Z \ при осуществлении неравенства (7.7); x \t\) — значение решения x (t), Є [to, i], системы (6.2), порожденного реализовавшимися на первом этапе ситуацией U Є l№ и неопределенностью Z 6 Z (при осуществлении неравенства (7.9)); x(t{) —значение решения x(t), t Є [to,ti] системы (6.2), порожденного ситуацией и неопределенностью (1) є 2(1). наконец в (7.7) и (7.8) фигурируют пары (U ,Z ) Є U х Z и (C/(2), (2)) е U х Z — любые из возможных в игре (6.1).

Доказательство, а) Неравенства (7.5) и (7.6) с учетом обозначений /W = jW Ц = if + lf\ вида множеств uf (j = 1,3; г = 1,2) и (6.17) неравенства (7.5) (соответственно, (7.6)) эквивалентны требованию (6.22) (соответственно (6.23)) определения 6.1. Заметим, что, например, (6.22) можно представить, благодаря (6.31), в виде max [і[1\и[1\йД1\2 »,і0іх0)+ y 2W (7.10) +/f\[/{ \i/i ),tb,W(tO)] = /i1H 1) (1),to o)+ +i?\uW,zAAh)), или, возвращаясь к функции выигрыша ,7і(-) в игре (6.1), это же равенство примет вид max Ji(Uu U2, Щ, Z, tQ, x0) = max (1) (1) , o,zo)+ uKuW +j?\u?\u?\uf\zVM \h))\ = J Vo oH +Л(2)( 2), Z \ tux(ti)) = J{U,Z,tQ,x0), (7.11) где п-вектор x (ti) есть значение (при t = 1) решения x (t),t Є [o i]j системы (6.2) при tii = и[ (t,x), щ = й\ (t,x), щ = Щ (t,x) z = zM(t,x), ( Uf - uf\t,x) (j = 1,2), UP + 4\t,x), UP Є 1#\ m - sWft )), а ж(іі) — значение (при t = t\) решения x(i), t Є fab iL системы (6.2), порожденного набором (fj[ \щ \щ \2 ). Аналогично, неравенство (7.6) можно записать в эквивалентном виде: max [І?фР№\і%\2 хь)+ или max [4l\ul1\ul1),uil\z{1),to.xo)+ vwy J + ( , , , ,41, (0)1 = ( ), ( )+ +jf\uw,zV),hAh)). Отметим, еще раз, что последнее совпадает с (6.23). Ь) Неравенства (7.7) и (7.8). С учетом обозначений (7.2), (6.17) и (6.18) неравенство (7.7) представим в виде - [ ( f4. 1}. з(1). (1).«to, о) + ( , 2 , i,««(ti))] = Idem{uP - й\х(Ь) - x(tx)}, (7.13) где Idem{uP - uP,x(h) - x(ti)} означает повторение выражения в фигурных скобках {...} с заменой Щ на Щ ) и x \t\) на x{t\)\ в (7.13) 4(1)(tf(1U(1U, o) = Г fi(t, (1)М, ttW[t],zW[ i) , т(2) причем (tf 2U(2U, ( i)) = fF x it ltlz dt, Jti ffrt _ J (1)W при t Є [Mi], непрерывное решение системы х = f(t,x,u(t,x),z(t,x)), x(t0) = ar0, порожденное парой (С/ , 1)) Є U х Z на этапе [Mi] и парой на этапе [ti,#], гг-m 77 гм- J Ul1) u{il\t,x)npntelt0,tl), . . 1/= ((/1,(/2,(/3) = (2). (2),. х .,, « ( = 1,2,3) [ Uj + v,} (t,x) при t Є [ii,tf), ,я) при t Є [t0) і), ,ж) при і Є [ti,$), vff t] = иг)( ,жМ(«)), zM[t] = z (t,x (t)) (r = 1,2); подчеркнем еще раз, что в (7.13) n-вектор x (ti) — значение (при t = t\) решения системы (6.2), порожденного набором {й\и$\й$\Щ eUxZM на этапе [Mi], а я(1) — также значение решения x(t) системы (6.2), порожденного уже парой (#W Z(1)) Є UM х 2W; постоянные а,- (г = 1,2,3) в (7.13) положительны.

Выполнение равенства (7.13) является (при щ — const 0 (г = 1,2,3)) достаточным условием [53,с. 71] того, чтобы стратегия Щ была максимальной по Парето в трехкритериальной задаче (6.33), что, в свою очередь, означает несовместность системы неравенств (6.24), из которых хотя бы одно строгое.

Применение метода малого параметра

Рассмотрим снова дифференциальную линейно-квадратичную бескоалиционную игру трех лиц при неопределенности ({1,2,3},Ее, {адг=1,2)з, 2,{Ji(U,Z,t0,x0)}i=w), (9.1) отличающуюся от (8.1) лишь тем, что изменение управляемой системы Х)е описывается дифференциальным векторным уравнением х = Ах + и\ + eu-i + ещ + ez, x(to) = XQ, (9.2) где є = const О — малый параметр и А — постоянная п х п-матрица, а в функциях выигрыша «/;() добавлено терминальное квадратичное слагаемое х (#)С х($), здесь предполагается, что постоянные п X n-матрицы С симметричны (г = 1,2,3), т.е. функция выигрыша г -го игрока примет вид ЦІЇ, Z, t0, х0) = х\$)С1х{д) + /(Е Цй Ai«iM + z[t)DiZ[t])dt to І=1 (2 = 1,2,3). Такую игру естественно называть (при малых є ) дифференциальной игрой с малым влиянием второго, третьего игроков и неопределенности на скорость изменения фазового вектора.

Замечание 9.1. Для игры (9.1) справедливо утверждение 7.1 с заменой /f () из (7.2) на (& = l,a,3,7), где матрицы Сі = CW, Са = аіСЩа2С- хзС, Cp -PiCQkfyCM+foC, С7 = Y i=\li \ имеет место также утверждение 7.2 с заменой в (7.18) условия VJ(0,x) = O на в лемме 7.1 (в условии (8.15)) граничное условие 6(1)) = 0ПХП заменяется на 0(4) = С, где С — симметричная постоянная пхп матрица, уравнение (бывшее (8.15)) в + B (t)9 + 0B(t) + G(t) = 0„xn, 0(d) = С имеет решение О = 0(t) = [X-\t)UC + J Х (т)в(т)Х(т) 1т}Х-1(і); лемму 7.2 следует изменить на: уравнение (8.20) с граничным условием 72 (ti,x) = х Срх имеет решение V(t,x) = x9(t)x. 9.2. Существование пары (U, Z) Утверждение 9.1. Если для игры (9.1) выполнено требование 1 утверждения 8.1 и С = Сі 0, то при достаточно малых є 0 в такой игре существует гарантированное -равновесие. Доказательство. Если в игре (9.1) существует пара (U,Z), удовлетворяющая требованиям определения 6.1, то тогда существует и гарантированное -равновесие (І7, J(U,2,Ц,хо)) (замечание 6.6). Для доказательства существования (U, Z) будем следовать этапам, сформулированным в замечании 7.1, с учетом замечания 9.1 а) Согласно (7.17) введем функции W (t, х, щ z, V," ) = + [ф[Ах + щ + е(иг + щ + z)]+ (9#3) +u\Djiui + u2Dj2U2 + u 3Dj3U3 + z DjiZ (j = 1, a, 3,7,/3; r = 1,2), где Di4 = D\, D34 = D3, а матрицы Dak, -D7jt, D/% (к — 1,2,3,4) определены в (8.23). Тогда достаточные условия (8.40)-(8.43) приводят к равенствам 2DllUV(t,x,V) + = 0П =» (4,3:,7) = 41 2 2 ( )+ = 0П = t41}( . - ) = -% , (9 4) , — v,n —г «-з ,-,, г у — 2- 33 &Е » 2VW(t,x,V) + е%- = 0n =» zM(t,x,V) = -11 2D )(ttxtV)+e - = 0n = u i\t,x,V) = -11 А достаточные условия (8.48)-(8.51) к — 2Dnu{?(t,x,V) + = 0П u?\t,x,V) = -\D X 2D?24\t, х, V) + ed- = On= 4\t, x, V) = -11 2D334\t,x,V) + ed- = 0n = ig\t,x,V) = -f C 2Dl4zW(t,x, V) + eb\- = 0n = z(t, x, V) = -\D (9.5) b) Здесь докажем прежде всего существование решения первой системы из (7.22), построенной для игры (9.1). Вначале составим саму первую систему (7.22) с граничными условиями Vj2){ dtx) = СІ V Є Rn (і = 1,/3,3,7). (9.6)

Для этого щ (t,x,V) (і = 1,2,3), z (t,x,V) из (9.5) подставим в (9.3) и воспользуемся первой системой из (7.22), (9.6), получаем (2) 3 +11 = 0 U = l,/3,3,7), V(bx) = Cj Ищем решение (9.7) в виде V}2)(t,x) = xOf]x, [ef\ = Of. (9.8)

Подставляя (9.8) в (9.7) получаем, что первая система уравнений из (7.22) с граничными условиями (9.6) имеет решение в виде (9.8), если симметричные п х n-матрицы 6j (j = 1,/3,3,7) являются продолжимым на [i,#] решением системы дифференциальных уравнений типа Риккати. «!"( ) = G; {9-9) «ff + А + АО + DJDMDU1 + e24 m(9m) = 0»x», f9 w) б№{0) = Ст(т = 0,$л), в (9.9), (9.10) матрицы ф}(в№) (j = 1,/3,3,7) порядка n x n и состоят из квадратичных слагаемых относительно матриц

Докажем, что при выполнении (8.27), С\ 0 и достаточно малом є О система (9.9), (9.10) имеет непрерывное решение 6j(t,e) (j = 1,/3,3,7), продолжимое на [ti,d]. В самом деле, при є = 0 система (9.9), (9.10) превращается в 0f) + оА + Ав - е$Ь$в? = 0nxn, 0f\ti) = Ch (9.11) ] + 0&]A + Л 42) + e D D D e? = 0nxn, 42)(tf) = Cm ,q 19v (m = /3,3,7). ( j

Система (9.11) не зависит от и является матричным диффе ренциальным уравнением типа Риккати (появившейся в позиционной линейно-квадратичной задаче оптимального управления). Так как п 0 = Drf 0 и Сі 0, то (9.11) имеет [42, с.207] единственное непрерывное решение в[ (t), продолжимое на интервал [і,#]. Подставляя указанное в[ = в[ (t) в (9.12), получаем систему дифференциальных ли-неиных неоднородных уравнении относительно элементов матрицы вт с непрерывными (по t) коэффициентами & + в А + А в + 0f\t)D DmlD 0f\t) = 0nxn, ) = Cm(m = /3,3,7).

Эта система также имеет единственное непрерывное решение &m(t), продолжимое на [tijfl] (как линейная неоднородная система дифференциальных уравнений с непрерывными (по t) коэффициентами [54, с. 29]). Итак нулевое приближение (при е = 0) системы (9.9), (9.10) имеет единственное непрерывное решение, продолжимое на [i,$]. Так как остальные слагаемые в (9.9), (9.10) квадратичны относительно в[ , 6І , в$ ,в\ и содержат множителем є2 (квадрат малого параметра є), то (по теореме о непрерывной зависимости решений от параметра [44, с. 8]) при достаточно малых є 0 и решение 2)(і,є) = (Qf\t,e),ef{t,),ef\t,e),e[ ](t,e)) системы (9.9), (9.10) определено на том же отрезке [i,#]. Кроме того по теореме Анри Пуанкаре об аналитичности решения по параметру [44, с. 8] решение системы (9.9), (9.10) представимо в виде ряда по целым положительным степеням параметра є, сходящегося равномерно по t Є [і,#] при достаточно малых є 0.

Похожие диссертации на Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников