Содержание к диссертации
Введение
Глава 1. Теоретико–игровые задачи управления возобновляемыми ресурсами с участием центра 21
1.1. Методы исследования теоретико-игровых задач управления возобновляемыми ресурсами 21
1.1.1. Методы решения задач оптимального управления 21
1.1.2. Динамические игры и методы их решения 25
1.1.3. Арбитражные схемы 30
1.2. Теоретико–игровые модели управления возобновляемыми ресурсами с участием центра 33
1.2.1. Модель с одним участником 34
1.2.2. Арбитражные решения 42
1.3. Модели с меняющейся долей территории эксплуатации 46
1.3.1. Задача определения территории эксплуатации с функционалом I1 46
1.3.1.1. Стратегии специального вида 48
1.3.1.2. Стратегии общего вида 55
1.3.2. Задача определения территории эксплуатации с функционалом I2 58
Глава 2. Поддержание кооперативного поведения в непрерывных теоретико–игровых моделях управления возобновляемыми ресурсами 63
2.1. Методы поддержания кооперации в непрерывных моделях 63
2.1.1. Модель с линейной функцией роста и конечным горизонтом планирования 69
2.1.2. Модель с бесконечным горизонтом планирования
2.2. Модель с разделением территории
2.2.1. Модель с конечным горизонтом планирования 86
2.2.2. Модель с бесконечным горизонтом планирования 92
2.3. Модель с разделением территории и
Глава 3. STRONG Стимулирование кооперативного поведения в дискретных теоретико-игровых моделях
управления возобновляемыми ресурсами STRONG 114
3.2. Методы поддержания кооперации в дискретных моделях
управления возобновляемыми ресурсами 120
3.2.1. Модель с логарифмическими выигрышами 125
3.2.2. Модель с квадратичными выигрышами 130
3.3. Модель разделения ресурсов 137
3.3.2. Кооперативное регулируемое равновесие 143
3.3.3. Другие функции развития популяции 151
3.3.4. ПРД и условия, стимулирующие кооперативное поведение 155
3.4. Модель, учитывающая миграцию 159
3.4.2. Кооперативное регулируемое равновесие 165
3.4.3. ПРД и условия, стимулирующие кооперативное поведение 167
3.5. Методы построения характеристической функции в моделях
управления возобновляемыми ресурсами со многими участниками 174
3.5.1. Модель с отсутствием информации 176
3.5.2. Модель с информированными игроками 181
Глава 4. Задачи управления возобновляемыми ресурсами с асимметричными агентами 189
4.1. Устойчивость коалиционных разбиений 190
4.1.2. Формирование коалиционного разбиения 199
4.1.3. Внутренняя и внешняя устойчивость коалиций 202
4.1.4. Коалиционная устойчивость 204
4.2. Модели с различными коэффициентами дисконтирования 212
4.2.1. Асимметричная модель «рыбных войн» 214
4.2.2. Общий коэффициент дисконтирования
4.2.2.1. Пропорциональное разделение 216
4.2.3. Кооперативное равновесие 221
4.2.3.1. п-шаговая игра и арбитражная схема Нэша 221
4.2.3.2. п-шаговая игра и рекурсивная арбитражная процедура 226
4.3. Модели с различными горизонтами планирования 237
4.3.1. Асимметричная модель «рыбных войн» и равновесие по Нэшу 239
4.3.2. Модель с фиксированными временами участия
4.3.3. Случайные времена участия в процессе эксплуатации 246
4.3.3.2. Кооперативное равновесие
- Теоретико–игровые модели управления возобновляемыми ресурсами с участием центра
- Модель с бесконечным горизонтом планирования
- Модель разделения ресурсов
- Внутренняя и внешняя устойчивость коалиций
Введение к работе
Актуальность темы. Диссертационная работа посвящена одному из актуальных разделов теории динамических игр, связанному с задачами рационального использования возобновляемых ресурсов. Одной из таких задач является разработка эффективных и рациональных схем управления в эколого-экономических системах эксплуатации промысловых популяций. Для решения поставленной проблемы необходимо количественное обоснование соотношений между величинами ресурсов и интенсивностью эксплуатации, а также разработка природоохранной политики.
Актуальной задачей является разработка и применение новых схем поддержания кооперативного поведения агентов эколого-экономичес-кой системы, что обусловлено тем, что при кооперации устанавливается более «щадящий» режим эксплуатации. Для задач оптимального управления и рационального использования возобновляемых ресурсов особенно важны условия, необходимые для продолжительного существования кооперативного соглашения, т.к. кооперативное поведение благоприятно влияет на состояние экологической системы. Еще одной актуальной и мало исследованной задачей является учет несимметричности агентов эколого-экономической системы (использование различных коэффициентов дисконтирования и горизонтов планирования). Степень разработанности проблемы в литературе. Математическое моделирование динамики биологических популяций не только актуальная, но и чрезвычайно интересная проблема. Исследованиям моделей управления биологическими популяциями посвящено большое количество работ таких авторов, как Абакумов А.И., Базыкин А.Д., Батурин В.А., Гимельфарб А.А., Гинзбург Л.Р., Ильичев В.Г., Полуэктов Р.А., Пых Ю.А., Ратнер В.А., Рохлин Д.Б., Свирежев Ю.М., Селю-тин В.В., Скалецкая Е.И., Соловьева Н.Г., Угольницкий Г.А., Фрисман Е.Я., Шапиро А.П., Chaudhuri K., Clark C.W., Goh B.S., Silvert W.
Разработке теоретико-игрового подхода к задачам управления биоресурсами посвящены работы Васина А.А., Захарова В.В., Клейменова А.Ф., Петросяна Л.А., Щепкина А.В., Ehtamo H., Hamalainen R.P., Haurie A., Kaitala V., Leitmann G., Levhari D., Mirman L.J., Tolwinski B. Задача поддержания кооперативного соглашения начала свою историю с работы Osborn D.K. и нашла применение в экологических задачах в работе Ehtamo H., Hamalainen R.P. Однако, проведенные исследования предполагают самоорганизацию агентов эколого-экономической системы и отсутствие контролирующих органов. Принцип динамической устойчивости кооперативных решений, предложенный и обоснованный
Петросяном Л.А., получил большое распространение в работах по динамическим играм, например, Haurie A., Zaccour J., Yeung D.W.K.
Анализу стабильности международных экологических соглашений посвящены работы таких авторов, как D’Aspremont C., Barrett S., Bloch F., Carraro C., Finus M., Ioannidis A., Ray D., Yi S.S. При этом исследования проблем устойчивости коалиций, в основном, проводились для моделей загрязнения, и только несколько работ посвящены устойчивости кооперативных соглашений в задачах эксплуатации ресурсов (De Zeeuw A., Lindroos M., Kulmala S., Pintassilgo P.), но при условии формирования одной коалиции. В задачах управления биоресурсами с несимметричными игроками стоит отметить работы Шевкопляс Е.В., Breton M., Keoula M.Y., Marin-Solano J., Sorger G.
Объектом исследования в диссертационной работе являются динамические системы, связанные с процессами использования возобновляемых ресурсов, предметом – методы управления такими эколого-экономическими системами.
Целью работы является разработка методов управления возобновляемыми ресурсами на основе теории динамических игр и условий, стимулирующих кооперативное поведение участников процесса эксплуатации ресурса, для повышения эффективности функционирования эколого-экономических систем. Достижение этой цели требует решения следующих основных задач:
-
Разработка кооперативных и некооперативных схем управления возобновляемыми ресурсами с участием центра и сравнение их эффективности.
-
Разработка метода поддержания кооперативного поведения агентов эколого-экономической системы в форме стратегий наказания (кооперативное регулируемое равновесие).
-
Применение динамически устойчивой процедуры распределения дележа (ПРД) и разработка методов определения характеристических функций для ее построения.
-
Разработка достаточных условий, стимулирующих агентов эколого-экономической системы соблюдать кооперативное соглашение, достигнутое в начале периода планирования.
-
Разработка методов стимулирования кооперативного поведения в моделях с несимметричными агентами:
(a) Разработка условий устойчивости для моделей, в которых могут
формироваться несколько кооперативных соглашений.
(b) Построение кооперативных стратегий и выигрышей агентов
эколого-экономической системы в случае использования различных
коэффициентов дисконтирования.
(c) Построение кооперативного поведения в задачах управления возобновляемыми ресурсами с различными (фиксированными и случайными) горизонтами планирования. Методы исследования. В диссертационной работе используются методы теории динамических игр, теории оптимального управления, оптимизации и теории вероятностей.
Достоверность полученных в диссертационной работе результатов обусловлена строгостью математических доказательств. Научная новизна
-
Разработаны методы управления возобновляемыми ресурсами, в том числе с участием центра, задачей которого является выбор оптимальной доли эксплуатируемой территории для поддержания стабильного развития ресурса. В условиях индивидуального и кооперативного поведения агентов эколого-экономической системы найдены оптимальные стратегии, выигрыши и проведено их сравнение.
-
Разработана схема кооперативного регулируемого равновесия с участием центра. В традиционном подходе игроки сами контролируют поведение друг друга, наказывая отклонившихся изменением оптимальной стратегии. В диссертационной работе контроль над соблюдением кооперативного соглашения является стратегией центра.
-
Сформулировано условие, стимулирующее агентов эколого-экономической системы соблюдать кооперативное соглашение на каждом шаге. Предложенное условие легко проверяемо, а часто используемое в теории динамических игр условие «защиты от иррационального поведения» является его следствием.
-
Введено понятие коалиционной устойчивости, расширяющее условие внутренней и внешней устойчивости коалиций в моделях, в которых возможно формирование нескольких кооперативных соглашений. Предложенное условие учитывает возможность перехода множества участников из одной коалиции в другую.
-
Разработан метод определения общего коэффициента дисконтирования в задачах, учитывающих несимметричность агентов эколого-экономической системы. При наличии различных коэффициентов дисконтирования предложены схемы построения кооперативного выигрыша и распределения его между агентами с использованием арбитражной схемы Нэша (Nash bargaining solution).
-
Сформулирована и исследована модель управления возобновляемыми ресурсами в случае наличия у агентов различных (фиксированных и случайных) горизонтов планирования. Предложена схема определения кооперативного поведения с использованием арбитражного
ресурсами.
Таблица 1. Теоретико-игровые задачи
управления возобновляемыми ресурсами
решения, учитывающая возможность выхода партнера из кооперации при определении кооперативных выигрышей. В табл. 1 представлены основные теоретические результаты работы и существующие разработки в области управления возобновляемыми
Оптимальное
управление
и регулирование
Регулирование
с участием центра
Кооперативное поведение
Различные горизонты планирования
Теоретическая и практическая значимость исследования. Полученные в диссертационной работе теоретические результаты относятся к теории динамических игр и приложений. Их значимость заключается в разработанных схемах управления возобновляемыми ресурсами, методах поддержания кооперативного договора, достигнутого в начале периода планирования, условиях, стимулирующих кооперативное поведение, и методах определения кооперативных стратегий и выигрышей агентов эколого-экономической системы.
Практическая значимость работы определяется применимостью разработанных методов экологического регулирования для совершенствования управления процессами эксплуатации возобновляемых ресурсов. Разработанные в диссертационной работе методы управления промысловыми популяциями, связанные с введением закрытых для эксплуатации территорий и поддержанием кооперативного поведения участников, особенно важны для закрытых водоемов, в которых затруднена возможность управления эксплуатацией путем введения ограничений (квот). При этом полученные результаты могут быть применены
как для управления стабильно развивающимися популяциями, так и для сохранения и поддержания численности регрессирующих популяций. Практическая организация предлагаемой в диссертационной работе природоохранной схемы значительно проще, чем регулирование процесса эксплуатации с использованием квот.
Проведенные исследования поддержаны программой президиума РАН («Теория оценки риска природных катастроф»), программами ОМН РАН («Алгебраические и комбинаторные методы математической кибернетики и информационные системы нового поколения», «Математические и алгоритмические проблемы информационных систем нового поколения») и грантами РФФИ («Динамические потенциальные игры с векторными платежами», «Равновесие по Нэшу в несимметричных динамических моделях управления биоресурсами», «Методы построения стратегий, гарантирующих кооперативное поведение в задачах управления биоресурсами», «Экологический менеджмент биоресурсов водоемов Карелии», «Равновесие в задачах управления биоресурсами»).
Результаты диссертационной работы используются в учебном процессе Петрозаводского государственного университета при преподавании курсов «Теория систем и системный анализ», «Теория игр», «Современные проблемы прикладной математики» и др. Положения, выносимые на защиту:
-
Метод управления возобновляемыми ресурсами в эколого-экономи-ческой системе с участием центра, задачей которого является выбор оптимальной доли эксплуатируемой территории для поддержания стабильного развития экологической системы.
-
Схема поддержания кооперативного поведения агентов эколого-эко-номической системы с участием центра (кооперативное регулируемое равновесие). Стратегией центра является разделение территории, а агент, нарушивший кооперативное соглашение, наказывается центром изменением территории эксплуатации.
-
Условие, стимулирующее кооперативное поведение агентов на каждом шаге.
-
Метод построения характеристической функции, учитывающий наличие информации у агентов о формировании коалиции, и метод определения динамически устойчивой процедуры распределения дележа с неравными компонентами.
-
Понятие коалиционной устойчивости, учитывающее возможность перехода множества участников из одной коалиции в другую.
-
Методы построения кооперативных выигрышей и стратегий агентов эколого-экономической системы с использованием арбитражной схемы Нэша в несимметричных задачах (агенты различаются коэф-
фициентами дисконтирования). 7. Методы построения кооперативного поведения с использованием арбитражной схемы Нэша в случае наличия различных - фиксированных и случайных - горизонтов планирования у агентов эколого-экономической системы. Апробация результатов исследования. Основные результаты диссертационной работы докладывались на Международных симпозиумах по динамическим играм и приложениям (Вроцлав, 2008, Банф, 2010, Амстердам, 2014), Международных совещаниях по динамическим играм и приложениям (Падуя, 2011, Барселона, 2013, Глазго, 2015), Международных конференциях «Теория игр и менеджмент» (Санкт-Петербург, 2007-2015), Международных симпозиумах по исследованию операций (Рим, 2013, Барселона, 2014, Глазго, 2015), Московских международных конференциях по исследованию операций (Москва, 2004, 2007, 2010, 2013), Международных совещаниях «Сетевые игры и менеджмент» (Петрозаводск, 2009, 2012, 2015), Венском совещании «Оптимальное управление, динамические игры и нелинейная динамика» (Вена, 2012), Международной конференции по системному моделированию и оптимизации (Берлин, 2011), Всероссийских симпозиумах по прикладной и промышленной математике (Сочи, 2003, Санкт-Петербург 2005, 2009, Петрозаводск, 2012), Международном конгрессе «Нелинейный динамический анализ» (Санкт-Петербург, 2007), Всероссийской конференции «Моделирование в задачах городской и региональной экономики» (Санкт-Петербург, 2011), Всероссийских конференциях «Устойчивость и процессы управления» (Санкт-Петербург, 2005, 2011), Всероссийских школах «Математические методы в экологии» (Петрозаводск, 2001, 2003, 2008), Международных конференциях «Вероятностные методы в дискретной математике» (Петрозаводск, 2004, 2012). Структура и объем работы. Диссертация состоит из введения, 4 глав, заключения и приложения; включает 283 страницы, 16 таблиц и 109 графиков. Список литературы включает 195 наименований. Публикации. По теме диссертационной работы автором опубликованы 83 научные работы, в т.ч. 4 монографии и главы в монографиях, 20 статей, опубликованных в ведущих рецензируемых научных журналах (Доклады РАН, Известия РАН. Теория и системы управления, Прикладная математика и механика, Управление большими системами, Математическая теория игр и ее приложения, Ecological Modelling, Advances in Dynamic Games, International Game Theory Review) из списка, рекомендованного ВАК.
Все основные результаты, выносимые на защиту, получены автором самостоятельно.
Теоретико–игровые модели управления возобновляемыми ресурсами с участием центра
Динамическая игра может быть рассмотрена как на конечном, так и на бесконечном промежутке планирования. Стратегии игроков представляют собой функции щ = щії), і = 1,... ,п. В зависимости от выбранных стратегий каждый из игроков получает выигрыш, зависящий от действий других игроков. Таким образом, динамическая игра - это многокритериальная задача управления со многими участниками, действующими в условиях конфликта.
Непрерывные игры Рассмотрим динамические игры с непрерывным временем. Выигрыш игрока і, і = 1,..., га имеет вид Т ЗЛиъ...,ип)= / дг(хи),щи),...,ипи))(И + Сг(х(Т)) ыж (1.14) для конечного горизонта планирования, и Ji(u1,...,un)= / gl(x(t))ul(t))...)un(t))dt m (1.15) 0 щеи для бесконечного горизонта планирования. Также будем рассматривать выигрыши игроков в специальном виде, так называемые задачи экономического роста: Т .1г(щ,...,ип)= / e- gi(x(t),u1(t),...,un(t))dt + Gi(x(T)) inax (1.16) o щєи для конечного горизонта планирования, и Ji(u1,...,un)= / e" oi(z(t),ui(t),...,ura(t))dt- max (1.17) Jo ui& для бесконечного горизонта планирования, где 0 р 1 - коэффициент дисконтирования, связанный с инфляцией, амортизацией и т.д., т.е. уменьшающий выигрыш во времени относительно выигрыша в начальный момент игры. Введем стандартное обозначение Определение 1.2. Равновесием по Нэшу в динамической игре Г называется набор стратегий (и\,... ,Un), для которого выполняются следующие условия: Ми П Ми ) для произвольных стратегий щ Є Ui} і = 1,..., га. Таким образом, для каждого игрока г условие равновесия по Нэшу выполняется, когда максимум Ji достигается на и при динамике x (t) = f(x(t),u (t)), что является задачей оптимального управления для каждого игрока г. Поэтому для построения оптимального по Нэшу решения динамической игры Г используются методы решения задач оптимального управления - метод динамического программирования и принцип максимума Понтрягина, описанные в разделе 1.1.1. Приведем утверждения о существовании и методах построения решения для конечного горизонта планирования.
Утверждение 1.1. Пусть /, & - непрерывно дифференцируемы. Тогда, еслии {ї) -равновесие по Нэшу в игре (1.12), (1.14) и x {t) - соответствующая ему траектория процесса, то существует набор т-мерных непрерывно дифференцируемых функций фі(-) : [0,Т] -» Rm, і =
Для игр типа (1.12), (1.16) уравнение Гамильтона-Якоби-Беллмана аналогично, но вместо gi(x,u) в уравнении будет gi(x,u)e-pt, г=1,...,п. Заметим, что применение принципа Беллмана в задаче с конечным горизонтом планирования сопряжено с решением дифференциальных уравнений в частных производных, в которых редко удается получить решение в аналитическом виде. Поэтому, в дальнейших разделах диссертационной работы для определения оптимальных стратегий в играх с конечным горизонтом планирования будем использовать принцип максимума Понтрягина (теорема 1.5).
Применение же принципа максимума для решения задач с бесконечным горизонтом планирования связано с проблемой определения условия трансверсальности на бесконечности [4], поэтому для построения оптимальных стратегий в динамических играх с бесконечным временем будем применять метод динамического программирования.
В динамических теоретико-игровых задачах экономического роста с выигрышами вида (1.17), как было показано в разделе 1.1.1, удобно использовать метод динамического программирования, т.к. стратегии строятся в виде функций с обратной связью, и уравнение Гамильтона-Якоби-Беллмана является обыкновенным дифференциальным уравнением. Приведем соответствующий результат.
Утверждение 1.3. В динамической игре (1.12), (1.17) стратегии и (х) образуют равновесие по Нэшу тогда и только тогда, когда существуют функции V- : Rm -» R, такие, что выполнены следующие условия:
Утверждение 1.4. Пусть ft, д\ - непрерывно дифференцируемы. Тогда, если u t - равновесие по Нэшу в игре (1.13), (1.18) их - соответствующая ему траектория процесса, то существует набор т-мерных векторов такой, что выполнены следующие условия:
Утверждение 1.5. В динамической игре (1.13), (1.18) стратегии uf{xt) образуют равновесие по Нэшу тогда и только тогда, когда существуют функции Vj{xt), такие, что выполнены следующие условия:
В дальнейших исследованиях все приведенные методы решения динамических игр будут применены для определения оптимальных стратегий игроков не только в равновесии по Нэшу, но и при кооперативном поведении (за исключением главы 4). Так как в кооперации игроки максимизируют общий выигрыш, то определение оптимальных кооперативных стратегий является задачей оптимального управления.
В разделе 1.2 настоящей главы и в главе 4 в качестве решений используются арбитражные схемы Нэша и Калаи-Смородинского. Поясним данные концепции решения для игры с двумя участниками.
Конфликт двух игроков формулируется парой (S, Н), где S С В2 - допустимое множество решений и Н = (Я, Я2) Є Я2 - точка статус-кво. Если игроки не могут достичь соглашения, то они получают в качестве выигрыша компоненты вектора Я0. Обычно предполагается, что S - замкнутое, выпуклое множество. Так как ни один рациональный игрок не примет соглашения, которое хуже, чем выигрыш без соглашения, то ограничим допустимое множество: S = {Н \ Н Є S, Я Я0}. Для к = 1, 2 обозначим Я = тах{Яй (Яь Я2) Є S}, так называемую идеальную точку. Определим функцию д : [Hi,Hl] — [Н Н ] так, что S = {Я Я Нх Я , Я2 Я2 д{Нг)} и предположим, что д - строго убывающая и вогнута. Заметим, что граница Парето задана графиком функции д на [Я, Щ].
Модель с бесконечным горизонтом планирования
В данной главе исследованы теоретико-игровые задачи управления возобновляемыми ресурсами с применением аппарата решения динамических игр. В игре участвует центр (контролирующий орган), который разделяет территорию эксплуатации между участниками, и агенты (страны или фирмы), эксплуатирующие возобновляемый ресурс. Каждый из агентов принимает решение независимо, руководствуясь максимизацией своей прибыли от продажи ресурса. В главе 1 диссертационной работы был разработан новый подход, задачей центра в котором является определение оптимальной доли закрытой для эксплуатации территории. Автором были исследованы различные модели динамических игр управления промысловыми популяциями с участием центра, в которых учитывалось распределение популяции по территории, ее возрастная структура, миграция между участками, распределение выигрыша между игроками [36-39], [126-128], [131-136].
В данной главе описанный подход с участием центра применяется к задаче разделения территории эксплуатации между двумя агентами (игроками) эколого-экономической системы, действующими в кооперации. Задача поддержания кооперативного поведения агентов особенно важна для управления возобновляемыми ресурсами, что связано с тем, что кооперация благотворно влияет на состояние экологической системы. Особое значение кооперативного регулирования использования «общих ресурсов» было подчеркнуто Нобелевским лауреатом E. Ostrom [157].
Существует несколько методологических схем для исследования задачи определения и поддержания кооперативного соглашения, достигнутого в начале периода планирования. Одной из них является построение кооперативного регулируемого равновесия. Данное понятие было введено в статье [103], и является естественным продолжением работы [155] об устойчивости картеля. Регулируемое равновесие применяется для поддержания кооперативного договора и наказания участников, отклоняющихся от первоначального решения о кооперации. В традиционном подходе агенты сами контролируют поведение друг друга, наказывая отклонившихся изменением своей оптимальной стратегии. Построение такого кооперативного регулируемого равновесия показано в данной главе для моделей управления возобновляемыми ресурсами с конечным и бесконечным горизонтом планирования.
В диссертационной работе предлагается новая схема поддержания кооперативного по 64 ведения агентов, где контроль над соблюдением кооперативного договора является задачей центра. Стратегия центра здесь - разделение эксплуатируемой территории. Участник, нарушивший договоренности, достигнутые в начале периода планирования, наказывается центром изменением территории эксплуатации. В данной главе предложенная схема поддержания кооперации применена к задачам управления возобновляемыми ресурсами. При этом показано принципиальное отличие данной схемы от традиционной, выражающееся в экономической целесообразности и выгодности для агентов, соблюдающий кооперативный договор.
Для поддержания кооперативного поведения агентов эколого-экономической системы в разделе 2.2 применяется динамически устойчивая процедура распределения дележа. Понятие динамической устойчивости впервые было математически формализовано и обосновано Л.А. Петросяном [48]. В работе [50] было введено понятие процедуры распределения дележа для кооперативных решений (ПРД). Динамическая устойчивость заключается в том, что следуя кооперативной траектории, игроки используют один и тот же принцип оптимальности в каждый момент времени и поэтому не имеют мотивов отклонятся от кооперативного поведения. Основная идея процедуры распределения дележа заключается в распределении кооперативного выигрыша по всему периоду продолжения игры.
При этом во всех моделях данной главы найдены оптимальные кооперативные и некооперативные стратегии агентов эколого-экономической системы и условия их существования. Приведены результаты численного моделирования с использованием реальных данных о многотычинковом сиге озера Сямозера.
Основные определения Рассмотрим динамическую модель эколого-экономической системы в непрерывном времени. Агенты (страны или фирмы) эксплуатируют возобновляемый ресурс на конечном или бесконечном промежутке времени.
Динамика развития ресурса с учетом эксплуатации описывается уравнением x (t) = f(x(t),m(t),...,un(t)), х(0)=хо, (1.1) где x{t) 0 - размер эксплуатируемого ресурса в момент времени t, щ{ї) 0 - стратегия (интенсивность эксплуатации) г-го агента в момент времени t, г = 1,...,п, f(x(t),Ul(t),.. .,un(t)) - функция развития возобновляемого ресурса.
Обозначим u(t) = (m(t),.. .,un(t)) - профиль стратегий всех агентов (игроков). Как показано в главе 1 выигрыши агентов могут быть представлены функционалами различного вида. В данной главе будут рассматриваться выигрыши в следующем виде:
В связи с использованием кооперативных стратегий возникает задача поддержания соглашения, достигнутого в начале периода планирования, и наказания отклоняющихся участников. Одним из методов поддержания кооперативного поведения агентов эколого-экономической системы является кооперативное регулируемое равновесие [103]. Приведем определение данного понятия для игры двух лиц.
Стратегией г-го игрока является отображение 7г : Uj Щ (щ Є Uj), г, j = 1, 2, i j, где UІ - множество допустимых стратегий игрока г, і = 1,2.
Определение 1.1. [103] Пара стратегии (71,72) называется кооперативным регулируемым равновесием, если Таким образом, при использовании в качестве решения регулируемого равновесия агентам невыгодно отклонятся от кооперативного договора, достигнутого в начале периода планирования. Доход при отклонении любого участника будет меньше, чем его доход при использовании кооперативной стратегии. Применение данной схемы поддержания кооперативного поведения агентов эколого-экономической системы представлено на рис. 2.1. В предложенной в [103] схеме кооперативного регулируемого равновесия игрок, соблюдающий кооперативный договор наказывает отклоняющегося изменением своей кооперативной стратегии на величину, пропорциональную величине отклонения.
Модель разделения ресурсов
Рассмотрим случай, когда сразу после отклонения игрок возвращается к начальному кооперативному поведению. Число шагов 12. Начальный размер популяции ж0 = 0.8. Момент времени отклонения второго игрока щ = 5 и размер отклонения А = 0.1.
Стационарный размер популяции при кооперативном поведении составляет 0.2022, что больше значения 0.1512 стационарного размера популяции в равновесии по Нэшу.
На рисунках показана разница переменных задачи в случае кооперативного поведения (темная линия) и в случае отклонения второго игрока на промежутке [щ, Щ + 1] (светлая линия). На рис. 3.1 представлена динамика популяции. На рис. 3.2 представлено разделение эксплуатируемой территории (st). Заметим, что st уменьшается от 0.5 до 0.43 на промежутке [щ, П0 + 1]. На рис. 3.3 и 3.4 показаны выловы игроков, соответственно (v\ = (1 — St)xtu1, v\ = StXtUf). Заметим, что вылов первого игрока немного увеличивается на промежутке [5,7]. Тогда как вылов второго игрока резко падает на промежутке [5,6] и увеличивается при его возвращении к кооперации.
Заметим, что при применении схемы поддержания кооперативного поведения с участием центра, вылов «честного» игрока увеличивается за счет увеличения его территории эксплуатации на промежутке [п0,п0 + 1]. Отклоняющийся же игрок (второй) наказывается уменьшением St, вследствие чего его вылов падает на промежутке [щ,Щ + 1]. При этом размер популяции при отклонении практически не меняется, но увеличивается при возвращении обоих игроков к кооперативному поведению (см. рис. 3.1). Таким образом, предложенная в диссертационной работе схема кооперативного регулируемого равновесия не вредит состоянию экологической системы.
В сравнении с кооперативным поведением первый игрок выигрывает 0.806 Ю-7 при отклонении игрока 2, а второй игрок проигрывает 1.263 Ю-7.
Как было показано (следствие 3.3) участие центра в регулировании кооперативного поведения дает преимущество «честному» игроку. Его выигрыш увеличивается, а отклонившийся игрок терпит убытки.
Если сравнить выигрыши игроков в процентном соотношении, беря кооперативный выигрыш за 100 %, то получим:
Первый игрок получает больше на 0.1%, когда второй игрок отклоняется, и меньше на 8,6 %, когда игроки используют стратегии Нэша.
Второй игрок получает меньше на 0.008%, когда отклоняется, и больше на 7,3 %, когда игроки ведут себя некооперативно.
Если сравним сумму выигрышей обоих игроков, то при отклонении второго они получают меньше на 0.001%, а при использовании стратегий Нэша - на 0.1% .
В данном разделе диссертационной работы проведено исследование динамической игры управления возобновляемыми ресурсами в дискретном времени. Эксплуатируемая территория разделена на две части, в каждой из которых игрок эксплуатирует ресурс. Агентами эколого-экономической системы являются центр (арбитр), который разделяет территорию между участниками, и игроки (страны или фирмы), эксплуатирующие возобновляемый ресурс.
Предполагается, что между частями территории эксплуатации существует миграционный обмен. Таким образом, размер возобновляемого ресурса в одном районе (где ведет эксплуатацию первый игрок) зависит не только от размера ресурса и интенсивности эксплуатации в предыдущий момент времени, но и от размера ресурса и интенсивности эксплуатации в другом районе (где возобновляемый ресурс эксплуатирует второй игрок).
Существует альтернативная интерпретация данной модели. Можно рассмотреть ресурсы двух видов, каждый из которых эксплуатируется игроком [107]. В этом случае миграции соответствует процесс межвидового взаимодействия.
Получены равновесие по Нэшу и кооперативное равновесие для бесконечного горизонта планирования. Для поддержания кооперативного соглашения, достигнутого в начале периода планирования, используется разработанная схема кооперативного регулируемого равновесия (центр наказывает игроков за отклонение изменением территории эксплуатации) и динамически устойчивая процедура распределения дележа (в случае, когда центр принимает участие в игре). Получен в аналитическом виде вектор Шепли и динамически устойчивая процедура распределения дележа. Проверено выполнение условия, стимулирующего рациональное поведение на каждом шаге.
Разделим эксплуатируемую территорию на две части: s и 1-s, где ведут эксплуатацию два игрока. Агентами эколого-экономической системы являются центр (арбитр), который разделяет территорию и игроки (страны или фирмы), эксплуатирующие возобновляемый ресурс на своей выделенной территории на бесконечном промежутке времени. Модель может иметь другую интерпретацию: имеются два вида возобновляемого ресурса и игрок может эксплуатировать только один из них.
Здесь ojj представляет эффект прямого влияния размера популяции на размер в следующий момент времени на этой территории. (ЗІ представляет эффект миграции между двумя частями эксплуатируемой территории. Будем предполагать, что а% (ЗІ, г = 1, 2, что соответствует ситуации, когда внутренний рост сильнее влияет на развитие популяции, чем миграционные обмены.
Первый игрок эксплуатирует xt, а второй ведет вылов популяции yt. Можно заметить, что в предложенной модели интенсивность миграции зависит также и от доли эксплуатируемой территории. Это предположение естественно, поскольку размер среды обитания уменьшается, когда s уменьшается, и популяция должна мигрировать в другой район.
Внутренняя и внешняя устойчивость коалиций
В данном разделе исследованы теоретико-игровые модели управления возобновляемыми ресурсами в дискретном времени. Агентами эколого-экономической системы являются игроки (страны или фирмы), эксплуатирующие ресурс на конечном или бесконечном промежутке времени. При этом агенты используют различные коэффициенты дисконтирования, что можно интерпретировать как их различные предпочтения во времени. Динамика развития возобновляемого ресурса имеет вид Xt+1 = f{Xt,U1t,U2t), Х0 = х, (2.1) где xt 0 - размер эксплуатируемого ресурса в момент времени t, f(xt,U1t,U2t) - функция развития возобновляемого ресурса, uit 0 - стратегия (интенсивность эксплуатации) агента і в момент времени t, і = 1,2.
Каждый агент заинтересован в максимизации конечной или бесконечной суммы дисконтированных «мгновенных» выигрышей: прибыль игрока г в момент времени t, 0 5t 1 - коэффициент дисконтирования агента г, і = 1,2. Обозначим uN = «,0 - равновесие по Нэшу в задаче с бесконечным горизонтом планирования (2.1), (2.3), а соответствующие выигрыши - Vi(x,6i) , г = 1,2. и = (м ,м ) - равновесие по Нэшу в задаче (2.1),(2.2), а соответствующие выигрыши в гг-шаговой игре -V(x,5t) , г=1,2.
Основной проблемой в данной ситуации является то, что нет возможности определить выигрыши агентов эколого-экономической системы при кооперативном поведении стандартными способами. В работе [94] было предложено построение кооперативного выигрыша как взвешенной суммы индивидуальных, но данный подход не является традиционным для кооперативной теории игр, где при кооперации определяется общий выигрыш всех участников, а потом используются схемы его распределения. Более того, используя различные методы для определения весовых коэффициентов, авторы показали, что существуют области параметров задачи, при которых кооперативные выигрыши игроков меньше, чем некооперативные. Поэтому, для построения и стимулирования кооперативного поведения в диссертационной работе предложено использование арбитражной схемы Нэша.
Для задачи с бесконечным горизонтом планирования (2.1),(2.3) в диссертационной работе предлагается определение кооперативного поведения путем построения общего коэффициента дисконтирования. Предполагаем, что агенты эколого-экономической системы используют общий коэффициент дисконтирования 6, который подлежит определению. Таким образом, они решают задачу
Предположим, что кооперативный выигрыш распределяется между игроками в некоторой пропорции ryV(x,6) : (1 — Vix ). Для существования кооперативного соглашения должны выполняться условия рациональности кооперации
В разделе 4.2.2 для модели «рыбных войн» определены условия существования общего коэффициента дисконтирования в случаях, когда кооперативный выигрыш распределяется между агентами пропорционально их коэффициентам дисконтирования (7 = s ls ) и в пропорции 7 : (1 — т). Получено множество допустимых параметров 5 и у, поэтому для выбора конкретных из них в диссертационной работе предлагается использование арбитражной схемы Нэша. Таким образом, общий коэффициент дисконтирования и пропорция распределения кооперативного выигрыша определяются из решения задачи
Для задачи с конечным горизонтом планирования (2.1),(2.2) разработана схема определения кооперативного поведения без построения общего коэффициента дисконтирования. Для определения кооперативных стратегий и выигрышей агентов эколого-экономической системы предлагается использование арбитражной процедуры Нэша. Исследованы две переговорные схемы: для всего периода продолжения игры и рекурсивная арбитражная процедура. В первом случае кооперативное поведение агентов определяется из решения следующей задачи: а во втором - арбитражная схема применяется на каждом шаге игры. В разделе 4.2.3 для модели «рыбных войн» применены обе схемы построения кооперативного поведения в случае асимметричности агентов эколого-экономической системы. Показано, что при использовании арбитражной схемы для определения кооперативного поведения выигрыши игроков будут больше или равны выигрышам в равновесии по Нэшу, что является отличительной особенностью разработанных схем, и не всегда выполняется при применении других подходов определения кооперативного поведения [94].
Пусть два агента (страны или фирмы) эксплуатируют возобновляемый ресурс на протяжении бесконечного или конечного ([0, тг]) горизонта планирования. Динамика развития ресурса с учетом эксплуатации имеет вид Xt+1 = (Xt - ult - u2t)a , x0 = x, (2.4) где xt 0 - размер эксплуатируемого ресурса в момент времени t, є Є (0,1) - коэффициент естественной выживаемости, а Є (0,1) - коэффициент естественного роста, uit 0 -стратегия (интенсивность эксплуатации) игрока г в момент времени t, г = 1, 2. Предполагаем логарифмический вид функций выигрышей игроков и наличие различных коэффициентов дисконтирования.