Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Механизмы регулирования в иерархически управляемых динамических системах Дубров Денис Владимирович

Механизмы регулирования в иерархически управляемых динамических системах
<
Механизмы регулирования в иерархически управляемых динамических системах Механизмы регулирования в иерархически управляемых динамических системах Механизмы регулирования в иерархически управляемых динамических системах Механизмы регулирования в иерархически управляемых динамических системах Механизмы регулирования в иерархически управляемых динамических системах Механизмы регулирования в иерархически управляемых динамических системах Механизмы регулирования в иерархически управляемых динамических системах Механизмы регулирования в иерархически управляемых динамических системах Механизмы регулирования в иерархически управляемых динамических системах
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Дубров Денис Владимирович. Механизмы регулирования в иерархически управляемых динамических системах : диссертация ... кандидата физико-математических наук : 05.13.18.- Ростов-на-Дону, 2006.- 241 с.: ил. РГБ ОД, 61 06-1/1144

Содержание к диссертации

Введение

1 Модели иерархически управляемых динамических систем 11

1.1 Задачи, описываемые при помощи иерархически управляемых динамических систем 11

1.2 Виды классификации иерархических игр 21

2 Ресурсный механизм регулирования (линейный случай) 36

2.1 Пошаговый механизм регулирования 38

2.2 Глобальный механизм регулирования 84

2.3 Применение ресурсного механизма в задаче лесопользования 87

2.4 Программная реализация поиска оптимального управления лесопользованием 107

3 Целевой механизм регулирования 130

3.1 Статическая постановка задачи 131

3.2 Модель глобальной оптимизации. Свойство динамической устойчивости 141

3.3 Свойство сильной динамической устойчивости 161

Заключение 181

Литература

Введение к работе

Объект исследования и актуальность темы. Разработка методов при-

нятия решений для сложных (в частности, эколого-экономических) систем
управления невозможна на практике без учёта интересов всех участвую
щих сторон. В связи с этим представляется целесообразным исследование

» подобных систем при помощи математических моделей, отвечающих кон-

цепции иерархически управляемых динамических систем (ИУДС) [68]. В данных моделях над объектом существует некоторая иерархия, состоящая

из нескольких субъектов управления, у каждого из которых есть собствен
ные цели и ограничения. Субъект самого верхнего уровня имеет возмож
ность управлять системой лишь опосредованно через иерархию. В каче-

стве объекта исследования представляет интерес простейшая из подобных моделей, которая предусматривает иерархию над управляемой системой, состоящую всего из двух субъектов: верхнего и нижнего уровня. Практика

даёт большое число ситуаций, которые могут изучаться при помощи данной модели. К ним относятся системы вида «комитет но охране окружающей среды — предприятие — природный объект», «управление лесами--

t леспромхоз — лесная экосистема» и т. д.

Степень разработанности предмета исследования. Классические разделы теории игр [55, и т. д.] имеют ограниченную применимость в реальных

0 задачах принятия решений ввиду искусственности постановок рассматри-

ваемых ими задач. В связи с этим, начиная с 70-х годов XX века, значительные усилия исследователей при разработке математических моде-

9 лей управляемых систем были направлены на использование в этих целях

аппарата иерархических игр. Основные результаты в области теории игр с иерархической структурой изложены в монографиях Гермейера Ю. Б.,

4 Моисеева Н. Н., Петросяна Л. А. [7,46,65], разнообразные примеры мате-

матических моделей, построенных на основе этой теории, можно найти в работах Горелика В. А., Горелова М. А., Кононенко А. Ф., Крапивина В. Ф., Кукушкина Н. С, Моисеева Н.Н. [10,11,33-35,37,47].

В настоящее время при исследовании различных игр, в том числе иерархических, особое внимание уделяется таким важным практическим проблемам, как выбор сторонами принципа оптимального поведения, информированность игроков об интересах партнёров, влияние субъективности и неполноты информации, поступающей игрокам, сокрытие и искажение информации об интересах сторон, влияние порядка ходов и обмена информацией, характерного для иерархических систем. Очень важными являются также вопросы адекватности построенных игровых моделей реальным ситуациям. Особенно это актуально при переходе к динамическим постановкам задач, когда на практике стороны в любой момент времени имеют возможность изменить ранее принятое решение. Данная проблема исследуется в работах Петросяна Л. А. [61], где вводится такое важное по-нятие для свойств принципов поведения игроков, как динамическая устойчивость.

« Цель и задачи исследования. Основной целью настоящей диссерта-

ционной работы является разработка методов нахождения оптимального управления в моделях ИУДС [68], включающих в себя, кроме собственно

ш объекта управления, хотя бы простейшую иерархию, состоящую из двух

управляющих субъектов; в различных частных случаях управляющих механизмов, которыми располагает субъект верхнего уровня (данные модели

щ описывают некоторые из типичных случаев, встречающихся на практике).

Несмотря на уже проведённые многочисленные исследования в области теории игр, посвященные широкому кругу проблем —в первую очередь, в работах указанных выше авторов — разнообразие постановок задач, решаемых в них, далеко не исчерпывает все возможные ситуации. В связи с этим накопленные в данной области результаты представляются недостаточными для достижения поставленной цели, и решение вопроса требует дополнительных исследований.

В соответствии с целью исследования были поставлены следующие задачи:

  1. Разработать метод поиска оптимального управления для заданного класса моделей в случае ресурсного управляющего механизма.

  2. Разработать модель управления лесопользованием и получить для неё метод нахождения оптимального управляющего воздействия со стороны органа, контролирующего деятельность хозяйствующих

* субъектов.

t;

* 3. Реализовать полученные алгоритмы решения в виде программной

библиотеки, пригодной для использования в задачах численного моделирования.

^ 4. Привести заданный класс моделей в случае целевого механизма ре-

гулирования к уже изученным игровым задачам и получить метод нахождения его оптимального (в некотором разумном понимании)

^ решения.

5. Исследовать корректность указанных постановок задач и методов решения в случае динамических моделей.

Методы исследования. В настоящей диссертационной работе в качестве теоретической и методологической основы выступают методы системного анализа, теории иерархических игр, а также методы теории оптими-зации.

Научная новизна исследования. В рамках настоящей работы были впервые получены следующие результаты:

1. В случае ресурсного механизма регулирования для линейной модели
удалось в явном виде найти управление, обеспечивающее устойчивое

щ развитие системы.

  1. При помощи полученного метода нахождения оптимального управления в модели общего вида было найдено решение задачи динамического двухуровневого управления лесопользованием.

  2. В случае целевого механизма регулирования задача нахождения оптимального управления была сведена к решению иерархической игры двух лиц. Был получен приемлемый с практической точки зре-

f> ния принцип оптимального поведения управляющей стороны, а так-

же способ нахождения управления, удовлетворяющего данному критерию.

# 4. Был получен критерий принадлежности модели глобального целево-

го механизма регулирования к классу игр, для которых выбранный принцип является динамически устойчивым.

# 5. Для случая глобального целевого механизма регулирования было вве-

дено понятие сильной динамической устойчивости, характеризующее заданные модели как обладающие большей корректностью получаемых решений с практической точки зрения. Был получен критерий сильной динамической устойчивости для данных моделей.

Практическая значимость исследования. Результаты, изложенные в данной работе, могут служить теоретической основой для построения экономических и административных механизмов управления сложными системами самой разнообразной природы: биологическими ресурсами, промышленными предприятиями, общественными организациями, государственными системами, и т. д., а также для анализа эффективности уже существующих механизмов управления в указанных прикладных областях. Кроме того, результаты исследования могут быть использованы как основа учебных курсов в высших учебных заведениях по прикладной математике, теории игр, исследованию операций.

# Положения, выносимые на защиту.

1. Разработан способ нахождения оптимального управления в явном виде в частном случае задачи ресурсного иерархического управления —

для пошагового и глобального механизмов управления (в последнем случае —в предположении бескорыстности Ведущего).

  1. В рамках данной модели сформулирована игровая постановка задачи оптимального управления лесопользованием на основе модели динамики лесного фонда и найдено её решение.

  2. Разработаны программные библиотеки для решения двух предыдущих задач. Данные библиотеки пригодны для использования в численных экспериментах над моделями оптимального управления, в том числе для подбора их оптимальных параметров.

  1. Модель целевого механизма иерархического управления сведена к одной из разновидностей игр Гермейера, таким образом, указан путь для нахождения оптимальных решений данной модели.

  2. При переходе к динамической постановке задачи целевого управления (случай глобальной оптимизации) выделен класс моделей, для которых принцип наилучшего гарантированного результата обладает свойством динамической устойчивости.

  3. Для задач глобального целевого иерархического управления даны определения слабой и сильной динамической устойчивости (более сильное свойство, чем динамическая устойчивость), и получен критерий сильной динамической устойчивости.

Достоверность результатов исследования подтверждена строгим математическим обоснованием, для случая механизма ресурсного управления—также результатами расчётов различных примеров, которые были получены при помощи разработанного программного обеспечения.

Апробация работы. Основные результаты работы докладывались и обсуждались на школе-семинаре «Экология. Экономика. Информатика» (Дюрсо, 1998, 2000), на школе-семинаре «Системное моделирование социально-экономических процессов» им. С. С. Шаталина (Дивноморск, 2000), на семинарах кафедры прикладной математики и программирования механико-математического факультета Ростовского государственного университета, на семинаре факультета прикладной математики — процессов управления Санкт-Петербургского государственного университета, на семинаре ЮГИНФО РГУ.

Публикации. По теме диссертационного исследования опубликовано б печатных работ [17-21,69], в том числе 3 работы в соавторстве:

  1. В [20] автору принадлежит эвристический метод построения экологически допустимого решения в двухуровневой модели ресурсного управления.

  2. В [69] автору принадлежит алгоритм нахождения оптимального управления в двухуровневой задаче ресурсного регулирования.

  3. В [21] автору принадлежит адаптация алгоритма нахождения оптимального управления в двухуровневой задаче ресурсного регулирования к модели управления лесопользованием.

Структура и объём работы. Диссертационная работа состоит из введения, трёх глав, заключения, списка литературы и приложения. Работа изложена на 241 странице машинописного текста (201 без учёта приложений) и содержит 14 рисунков. Библиография включает 140 наименований.

Виды классификации иерархических игр

Соотношения (1.1) и (1.2) (где максимум ищется по v и по и соответственно) вместе с уравнением динамики УДС (1.3) образуют динамическую игру двух лиц (Ведущего и Ведомого) на дискретном отрезке времени от О до Т — 1. При этом, в случае, когда периоды планирования игроков не совпадают, можно, например, считать, что игроки решают различные задачи в разные моменты времени. Например, если период планирования Ведомого равен 1, можно считать, что в каждый момент времени от 0 до Tv — 1 он решает отдельную задачу вида (1.2).

Как известно, игру с запрещёнными ситуациями можно всегда представить в виде игры без запрещений при помощи функций штрафов. Случайный (неконтролируемый) параметр игры может быть заменен своим средним значением (математическим ожиданием) М, если известен закон его распределения, и данный переход в условиях игры является допустимым с точки зрения игроков. В противном случае считается, что этот параметр контролируется третьим игроком — «природой», цель которого неизвестна или (что эквивалентно) тождественна константе [7].

Соотношения (1.4) сами по себе ещё не являются полным описанием игры [7,11]. Для того чтобы полностью описать игровую ситуацию с формальной точки зрения, необходимо также определить так называемый регламент игры (правила поведения и информированности игроков). Для этого предположим, что Ведущий и Ведомый имеют право выбора стратегии на заданных множествах Ф„ и Фи соответственно. Под стратегией будем понимать функцию, определённую на множестве обстановок со зна 25

чениямн во множестве выборов игрока [И]. Под обстановкой для игрока будем понимать всю имеющуюся у него информацию об игре и о ходе противника (точную или приближённую/искажённую) [7]. Таким образом, задание множеств обстановок для игрока и его оппонента формально определяет информированность игрока и возможности при передаче информации своему противнику. При необходимости понятие стратегии для игрока можно расширить, включив него также факт наличия/отсутствия передачи информации, степень достоверности передаваемой информации, и т. п. Это позволяет производить описание игр, в которых игрок, например, имеет возможность выбора содержания передаваемой информации противнику.

Кроме задания множеств допустимых стратегий игроков для описания регламента игры также необходимо определить правила выбора стратегий игроками. Нахождение правил рационального выбора стратегии является отдельной задачей для описания каждой конкретной модели, известно лишь, что в общем случае для игр (в том числе и (1.1)-(1.3)) не существует каких-либо правил выбора, являющихся для сторон наиболее предпочтительными во всех ситуациях (в качестве иллюстрации можно привести классический пример биматричной игры «дилемма заключённого»). Будем считать, что каждый игрок осуществляет свой выбор стратегий, исходя из некоторого критерия оптимальности. Знание игроком критерия оптимальности противника может быть включено в обстановку для него.

Естественно, могут существовать и другие виды стратегий игроков, однако указанных здесь случаев вполне достаточно для изучения большинства практических приложений. Аналогичную классификацию игр по видам стратегий участников (вместе с рассмотрением более сложных случаев) можно встретить в литературе, посвященной иерархическим играм двух лиц, например, [5,7].

Рассмотрим теперь те критерии оптимальности, которые могут быть использованы игроками в описанных ситуациях. В первом случае Ведомому на момент принятия решения будет известен выбор Ведущего v = V . Таким образом, параметр v в его целевой функции становится константой, и вся его задача сводится к максимизации определённой (не зависящей от неизвестных параметров) функции при заданных ограничениях и EU.

Во втором случае Ведомому на момент принятия решения становится известной стратегия Ведущего ф вида v — у (и), и поэтому его выигрыш будет равен Зи{і{(и,ф )) = Ju(u,ip (u)). Следовательно, его задача в этом случае также сводится к максимизации известной ему функции.

При этом величина 5 должна быть известна Ведущему, что позволяет ему сузить множество прогнозируемых ходов Ведомого (при заданной ф ) до множества элементов и , удовлетворяющих (1.5).

Глобальный механизм регулирования

Случай изменения базиса оптимального решения задачи Ведомого (необходимость введения корректирующих переменных), а также случай существования различных базисов начального оптимального решения Ведомого рассматриваются совершенно аналогично задаче пошагового управления. 2.3 Применение ресурсного механизма в задаче лесопользования

В качестве примера использования описанного выше механизма рассмотрим динамическую двухуровневую модель лесопользования, в которой верхний уровень обеспечивает выполнение экологических ограничений, а нижний максимизирует доход от рубок.

Модели динамики лесного фонда, описывающие изменения структуры лесных площадей и таксационных показателей древостоев во времени в результате естественного роста насаждений и комплекса целенаправленных внешних воздействий, являются математической основой оптимизации процессов управления лесными ресурсами [13,27,28,45].

Лесной фонд рассматривается как множество природно-хозяйствен-ных единиц (хозсекций), каждая из которых представляет собой совокупность элементарных участков (таксационных выделов), однородных в лесо-водственном и хозяйственном отношении. Однородность в лесоводствешюм плане обеспечивается путём включения в каждую хозсекцию участков лесного фонда с одной преобладающей породой и одинаковым типом условий произрастания. Хозяйственная однородность достигается путём объединения в одну хозсекцию участков лесного фонда, характеризуемых единым режимом ведения лесного хозяйства (единой системой лесохозяйственных мероприятий). В качестве классификационных признаков для отнесения участков лесного фонда к единому режиму хозяйствования используется возраст древостоя и способ рубки и транспортировки древесины (технология лесосечно-транспортных работ). Каждая из сформированных таким образом хозсекции представляет собой совокупность участков лесного фонда, характеризуемых одинаковым типом условий местопроизрастания, одной главной породой, одинаковым возрастом и лесосечно-транспортной технологией.

Исходя из относительной лесоводствешюй и хозяйственной однородности участков, образующих каждую хозсекцию, предполагается, что в пределах хозсекции имеется сходная естественная динамика древостоев и сходные реакции насаждений на внешние воздействия.

Изменение во времени структуры и состояния лесного фонда происходит в результате естественной сукцессии лесных биогеоценозов, а также воздействия комплекса антропогенных факторов. К числу целенаправленных (управляющих) воздействий относится комплекс лесохозяйственных мероприятий, включающий рубки главного пользования (сплошные, по-степенные, выборочные) и рубки ухода.

Модель динамики лесного фонда, учитывающая воздействие комплекса антропогенных и природных факторов, должна включать в себя описание реакции насаждений на каждое из таких воздействий.

Воздействие к-то мероприятия определено, если известно правило, определяющее, какой возраст будет у хозсекции после проведения мероприятия. Площадь, где допустимо проводить к-с мероприятие, определяется путём анализа повыдельной информации и проверки условий допустимости проведения этого мероприятия.

Под допустимым размером лесопользования понимается обеспечение возможности сохранения гомеостаза для дальнейшего воспроизводства экологического и ресурсного потенциала лесов. Условию сохранения ресурсного потенциала лесов соответствует требование неубывания лесопользования на интервале расчёта. Сохранение экологического потенциала эквивалентно поддержанию экологического равновесия окружающей среды путём своевременного воспроизводства лесов с пеухудшающеися породной структурой.

Программная реализация поиска оптимального управления лесопользованием

Для численного решения рассмотренной задачи пошагового ресурсно-го управления (см. параграф 2.1: «Пошаговый механизм регулирования»), а также её частного случая — задачи ресурсного управления лесопользованием (см. параграф 2.3: «Применение ресурсного механизма в задаче лесопользования»), была разработана специализированная программная библиотека.

В качестве средства реализации библиотеки был выбран язык про-граммирования C++ стандарта ISO/IEC 14882:2003. Этому выбору способствовали следующие свойства данного языка:

Объектно-ориентированный подход в программировании, упрощаю щий как разработку и тестирование самой библиотеки, так и её использование в других программных проектах.

Наличие большого количества готовых вспомогательных библиотек, облегчающих разработку: как связанных с методами оптимизации и линейной алгебры, так и общего назначения. Широкая распространённость и доступность совместимых компи ляторов практически для всех современных вычислительных платформ.

Библиотека доступна в виде исходных текстов, таким образом, её использование в вычислительной системе возможно при наличии любого компилятора, совместимого со стандартом языка (например, gcc).

Основным классом в модуле HierModel является CHierModel, представляющий собой контейнер для исходных данных задачи и результатов счёта. После заполнения входных данных пользовательская программа должна вызвать метод CHierModel::Solve(), являющийся основным расчётным блоком. После этого программа через соответствующие свойства класса CHierModel может получить доступ к результатам вычислений.

Класс COptimization является интерфейсом для представления про v извольной задачи оптимизации Ведущего. В числе его виртуальных ме тодов есть всё необходимое для работы с задачей оптимизации Ведущего методом CHierModel::Solve(): нахождение оптимального решения, добавление в задачу новой линейной переменной, добавление нового линейного ограничения, и т. д.

Класс CLPProblem является объектно-ориентированной оболочкой для библиотеки lp_solve и представляет собой описание задачи линейного программирование вместе с методами для нахождения её оптимального решения.

Класс CHierModel взаимодействует с тремя указанными классами следующим образом. При конструировании экземпляра CHierModel ему в качестве входных параметров передаются ссылки на экземпляр класса COptimization, содержащий информацию об оптимизационной задаче Ведущего, CLPProblem, содержащий описание линейной оптимизационной задачи Ведомого, а также CReproduction, являющийся описанием модели динамики УДС. Экземпляр класса CHierModel использует эту инфор-мацию в дальнейшем во время вычислений. Такое взаимодействие между классами с точки зрения языка UML может быть классифицировано как отношение зависимости со стереотипом "use" (использование) [4].

В качестве входных данных для класса CHierForestModel используется описание модели динамики воспроизводства древостоя, которое определяется интерфейсом CForestReproduction, описанным в модуле. В модуле также определена одна реализация этого интерфейса, представляющая модель вида (2.60). Этой реализацией является класс CLinearForestReproduction, в котором определены свойства, представляющие приращение возраста древостоя на следующем шаге ио времени (Ат), а также векторы коэффициентов прироста и отпада древостоя для каждой породы (є(т) и d{r) соответственно).

Укрупнённая блок-схема алгоритма, реализованного в методе CHierModel: :Solve(), представлена на рис. 2.7 на с. 115 (более подробное описание данного алгоритма см. на рис. 2.3 на с. 66, а также в пояснениях к нему на на страницах 65-67). Для сравнения на рис. 2.8 на с. 116 приведена блок-схема алгоритма для решения той же самой задачи, но использующего традиционный подход имитационного моделирования: перебор всех возможных значений параметров модели (в данном случае — управления Ведущего) и поиск среди них наилучшего. Применительно к данной задаче традиционный алгоритм предусматривает перебор значений управления Ведущего в заданных промежутках изменения с заданным шагом и выполнение для каждого из них следующих шагов.

Модель глобальной оптимизации. Свойство динамической устойчивости

Следует отметить, что данная постановка задачи отличается от динамического случая игры Гг, рассмотренного в [7]: в игре (3.18)-(3.20) целевые функции обеих сторон являются аддитивными по времени (это свойство будет использоваться в дальнейшем при доказательстве утверждений), в то время как в [7] это ограничение не накладывается. С другой стороны, в постановке [7] имеется ограничение на множества допустимых ходов сторон: Vі eV и1еи1 V e[0,T-l]z в то время как в игре (3.18)-(3.20) ограничения имеют более общий вид (выбор игрока в некоторый момент времени может повлиять на множе ство допустимых ходов в дальнейшем), что наделяет игру определёнными особенностями (см. далее). д

Итак, чтобы найти решение игры (3.18)-(3.20), достаточно её рассматривать как частный случай игры (3.1)-(3.2). Однако предполагаемые ранее для неё правила поведения игроков (см. параграф 3.1: «Статическая постановка задачи») сильно сужают применимость данной модели к реальной ситуации в динамическом случае. Действительно, пусть игроки произвели выбор стратегий в момент t = 0. Согласно правилам, они должны придерживаться своего выбора на всём промежутке времени от 0 до Т — 1. Между тем, может произойти так, что в некоторый момент t = т игроки окажутся в такой ситуации, что кому-то из них было бы выгоднее произвести выбор, отличный от первоначального (даже с учётом того, что такое изменение стратегии станет известно противоположной стороне). Если этим игроком будет Ведомый, возможно даже, что это новое его поведение не будет допустимым для УДС. Разумеется, для учёта подобных ситуаций необходимо допустить в правилах поведения для игроков возможность изменения ими своих стратегий в произвольный момент времени, что было бы недопустимо при рассмотренном ранее регламенте (либо может быть достигнуто за счёт сильного увеличения размерностей пространств выборов для игроков).

Замечание: Приведённое определение отличается от аналогичного, введённого в [61], в следующем отношении. Определение, данное Л. А. Петрося-ном, относится к принципу оптимального поведения участников игры: при использовании ими определённого таким образом принципа оптимального поведения, рассматриваемые в [61] классы игр приобретают важные с практической точки зрения свойства. С другой стороны, если указанное выше определение также переформулировать в терминах принципа поведения («принцип оптимального поведения игроков называется динамически устойчивым, если для любой игры Г ...»), то очевидно, что для рассматриваемого нами принципа наилучшего гарантированного результата условия, приведённые в определении, будут выполняться не для всех игр из исследуемого класса. В этом смысле, принцип наилучшего гарантиро ванного результата не будет «динамически устойчивым». Поскольку даль нейшей целью исследования является выделение наиболее широкого клас са игр, обладающего данными свойствами, для упрощения формулировок условимся далее принцип поведения игроков считать зафиксированным, а термин «динамическая устойчивость» относить к играм. д

Введём следующие предположения о действиях игроков (ограничения на их действия). Первое из них касается Ведущего: если в игре Г сторонами была выбрана траектория (и, v), и в игре Г(м, v, т) Ведомый выбрал снова управление и, то Ведущий (в игре Г (и, v, г)) не имеет права выбирать в ответ никакого другого управления, кроме v. Другими словами, в игре Г(и, v, т) множество стратегий Ведущего должно быть следующего вида: Фт (и, v) = {Vy:U- Щ(у) р(и) = v} (3.24)

Это предположение выглядит правдоподобно не только с практической точки зрения, но и с точки зрения ранее данного определения игры Г в статическом случае: Ведущий должен выбрать своё управление после хода Ведомого строго в соответствии с заявленной стратегией: v = р(ії). Но ведь выбор в игре Г(м, V,T) стратегии фт, такой что (рт{и) ф v и следование ей в дальнейшем фактически означает невыполнение ранее заявленного правила ф, то есть, блеф.

Второе предположение касается обоих игроков и заключается в определённой инерционности их действий. Для Ведомого это означает следующее: если Ведущий в игре Г(и, v, т + 1) выбирает стратегию так, что гарантированный результат Ведомого увеличивается по сравнению с его результатом в игре Т(и, v,r) не более, чем на величину 25, то Ведомый продолжает придерживаться своей прежней стратегии, выбранной в момент т. Это обстоятельство должен учитывать Ведущий при выборе своей стратегии, если он по каким-либо причинам желает вынудить Ведомого сделать ход, отличный от сделанного в прошлом.

Условия (3.25) и (3.26) делают понятие оптимальной стратегии более узким: стратегия считается оптимальной не только в том случае, когда она доставляет максимум целевой функции с некоторой точностью, но и тогда, когда выигрыш от её использования не очень отличается от выигрыша при ранее выбранной стратегии.

В предыдущем параграфе показано, что игра Г эквивалентна игре (3.8)-(3.9), в которой Ведущий следует принципу наибольшего гарантированного результата. Все результаты, которые изложены ниже, верны для динамических игр более общего вида, чем (3.18)-(3.20), а именно: (3.8)-(3.9), где множество Vn(7) имеет произвольную природу, а функции Jv и Ju имеют тот же вид, что и в игре (3.18)-(3.20). Для упрощения обозначений в дальнейшем стратегию Ведущего в игре ((3.8)-(3.9) будем также обозначать через ф, подразумевая, что при обратном переходе к игре (3.18)-(3.20) определение оптимальной стратегии дополнится согласно (3.10). крайней мере, не даёт никаких преимуществ) выбирать стратегию, которая не порождает б-оптимальную траекторию, выбранную в игре Г, в случае, когда Ведомый также продолжает придерживаться своей оптимальной по игре Г стратегии. Таким образом, изменение изначально оптимальной траектории при переходе от игры Г к Г(и, v, т) может быть выгодно только Ведомому. Используя этот факт, окончательно приходим к следующему утверждению:

Похожие диссертации на Механизмы регулирования в иерархически управляемых динамических системах