Содержание к диссертации
Введение
1 Исследование некоторых классов нелинейных одномерных задач оптимального управления с особыми режимами 8
1.1 Модифицированная модель Рамсея с постоянной эластичностью 9
1.1.1 Решение задачи на основе специального интегрального представления функционала 10
1.1.2 Классификация типов оптимальных решений задачи 14
1.1.3 Решение задачи с помощью принципа максимума Понтрягина и достаточных условий оптимальности 15
1.1.4 Решение задачи с помощью метода динамического программирования
1.1.5 Исследование характера зависимости оптимального значения функционала от параметров задачи 27
1.2 Модифицированная модель Рамсея с переменной эластичностью 31
1.2.1 Случай кусочно-гладкой непрерывной функции є(-) 31
1.2.2 Случай кусочно-постоянной функции є(-) с одним переключением 35
1.3 Модифицированная модель экономического роста 44
1.3.1 Постановка задачи 44
1.3.2 Вилка для допустимых траекторий 46
1.3.3 Задача на конечном промежутке времени 47
1.3.4 Задача на бесконечном горизонте планирования 71
2 Исследование ряда нелинейных двумерных и трёхмерных задач оптимального управления 76
2.1 Модель двухсекторной экономики на конечном горизонте планирования 77
2.1.1 Каноническая форма задачи 77
2.1.2 Сведение более общей задачи управления к канонической форме 78
2.1.3 Анализ задачи с помощью принципа максимума Понтрягина 80
2.1.4 Анализ дифференциальных уравнений движения и сопряжённой системы при различных режимах управления 90
2.1.5 Анализ финального участка времени [в,Т] 100
2.1.6 Построение экстремального решения в случае 0. Обоснование его оптимальности 106
2.1.7 Численные эксперименты 109
2.2 Модель двухсекторной экономики на бесконечном горизонте планирования 115
2.2.1 Постановка задачи 115
2.2.2 Краевая задача принципа максимума 117
2.2.3 Нахождение максимизатора функции Гамильтона-Понтрягина 118
2.2.4 Вычисление возможного особого режима задачи 120
2.2.5 Решение краевой задачи (2.94) в случае, когда начальная точка лежит на особом луче 125
2.2.6 Решение задачи (2.94) в случае, когда начальная точка лежит ниже особого луча 127
2.2.7 Обоснование оптимальности экстремального решения в случае, когда начальная точка лежит ниже особого луча 131
2.2.8 Формулировка основного утверждения 135
2.2.9 Оценка роста фазовых переменных задачи 136
2.2.10 Метод прогонки для решения краевой задачи (2.117) 138
2.2.11 Численные эксперименты 139
2.3 Модель распространения вируса гриппа 141
2.3.1 Постановка задачи 141
2.3.2 Исходная модель 143
2.3.3 Исследование системы дифференциальных уравнений модели 144
2.3.4 Краевая задача принципа максимума 147
2.3.5 Численные эксперименты 148
Заключение 155
Список литературы
- Решение задачи с помощью принципа максимума Понтрягина и достаточных условий оптимальности
- Сведение более общей задачи управления к канонической форме
- Решение задачи (2.94) в случае, когда начальная точка лежит ниже особого луча
- Исследование системы дифференциальных уравнений модели
Решение задачи с помощью принципа максимума Понтрягина и достаточных условий оптимальности
В этой главе исследуются некоторые нелинейные одномерные задачи и классы нелинейных одномерных задач оптимального управления, имеющие приложения в теории экономического роста. Важной особенностью исследуемых задач, осложняющей поиск оптимального решения, является наличие особых режимов [40], а именно таких режимов управления, для которых принцип максимума обращается в тождество на некотором интервале времени на некотором подмножестве области управления (подмножество состоит более, чем из одного элемента). Эффективным методом решения этих задач является метод специального интегрального представления функционала [41,42], который может быть применён для исследования некоторых одномерных задач оптимального управления на бесконечном горизонте планирования. В работе он был обобщён для случая неавтономной разрывной правой части в дифференциальном уравнении.
В первом разделе главы рассматривается модифицированная модель Рамсея с постоянной эластичностью производства. Она исследуется с помощью трёх различных подходов: первый основан на методе специального интегрального представления функционала, второй — на основе принципа максимума Понтрягина и достаточных условий оптимальности (см. работу [14]), третий — метод динамического программирования Беллмана. В диссертации подробно излагается решение задачи с помощью каждого из указанных способов, что представляет методический интерес и является базой для дальнейших исследований усложнённых версий этой задачи. Кроме того, в работе находится оптимальное значение функционала в зависимости от параметров задачи, проводится исследование этой зависимости и указывается возможное приложение полученного результата к задаче с неопределённостью в параметрах.
Далее во втором разделе модифицированная модель Рамсея обобщается на два класса задач оптимального управления с переменной эластичностью производства. Здесь термин «класс» считается применимым, потому что в постановке задачи фигурирует произвольная функция из некоторого функционального класса, удовлетворяющая некоторым дополнительным ограничениям. Первый класс — это задачи с кусочно-гладкой непрерывной функцией эластичности и ограниченной производной, второй класс — задачи с кусочно-постоянной функцией эластичности с одним переключением.
Оказывается, что для первого класса решение задачи остаётся качественно тем же самым, а во втором классе возникают некоторые технические трудности за счёт разрыва в правой части дифференциального уравнения, которые преодолеваются специальным подходом к решению задачи, состоящим в разбиении задачи на две по временному интервалу, решения каждой из полученных задач, а затем «склейки» оптимальных решений. Обсуждаются возможности обобщения предложенного подхода для задач с кусочно-постоянной функцией эластичности с конечным или бесконечным числом изолированных переключений.
В последнем разделе главы исследуется одномерная экономическая модель на конечном и на бесконечном горизонтах планирования. Для нахождения оптимального решения этой задачи используется метод специального интегрального представления функционала, причём в случае конечного промежутка времени метод используется в совокупности с принципом максимума Понтрягина. Большое внимание уделяется проблеме поиска численного решения нелинейного уравнения для особого режима задачи. где одномерная фазовая переменная х(-) играет роль фондовооружённости, управление и(-) -- доля инвестиций от производственного выпуска -- принадлежит классу кусочно-непрерывных управлений (см. приложение A.2) и подчинено геометрическому ограничению u{t) Є U = [0,1], t 0, параметр ц 0 - коэффициент амортизации производственных фондов (случай (і = 0 может быть рассмотрен по такой же схеме), параметр и 0 - коэффициент дисконтирования, параметр є Є (0,1) — коэффициент эластичности по производственным фондам. Функция F(x) = хє, встречающаяся в дифференциальном уравнении и в функционале, является масштабированной производственной функцией Кобба-Дугласа. Функционал качества J (и) играет роль дисконтированного удельного потребления на бесконечном промежутке времени 0 t +00. Задача состоит в поиске такого допустимого управления и(-) из класса допустимых управлений Уи, которое максимизирует значение функционала J (и) по всем допустимым управлениям из класса допустимых управлений. Задача (1.1) с произвольной производственной функцией неоклассического типа и на конечном промежутке времени, 0 t Т, исследовалась в работах [43, стр. 159-170], [44].
Для задачи (1.1) даётся полная классификация типов оптимальных решений, рассматриваются три подхода к её решению: на основе специального интегрального представления функционала (см. также [41]), с помощью принципа максимума Понтрягина [1] с привлечением теоремы [14] о достаточных условиях оптимальности в терминах конструкций принципа максимума, а также на основе метода динамического программирования Беллмана [16,45].
Сведение более общей задачи управления к канонической форме
Эта глава посвящена разработке методов поиска аналитических и численных решений задач оптимального управления различных размерностей. Она состоит из трёх разделов, два из которых посвящены изучению двумерной модели двухсекторной экономики с производственной функцией Кобба-Дугласа при различных коэффициентах амортизации на конечном и бесконечном горизонтах планирования, а третий — численному исследованию трёхмерной модели распространения вируса гриппа A(H1N1).
В обеих задачах для модели двухсекторной экономики имеет место особый режим, ко-торый находится путём дифференцирования по времени соотношения на сопряжённые пе-ременные, при котором он может возникнуть. Обе задачи решаются с помощью построения экстремального решения краевой задачи принципа максимума в явном виде и обоснования его оптимальности способом, изложенным в [14].
В задаче на конечном горизонте планирования интерес представляет полученное опти-мальное решение, потому что обычно в задачах, имеющих приложение в теории экономического роста, в некоторый момент времени, близкий к окончательному, происходит переключение с особого режима на нулевой или другой режим управления, вытекающий из принципа максимума. В данной же модели существует так называемый «калибровочный» режим управления, который соединяет особый и нулевой режимы.
В задаче на бесконечном горизонте не удалось найти решение в аналитическом виде краевой задачи принципа максимума на начальном промежутке времени в случае, если начальная точка не находится на особом луче. Для этого случая был разработан алгоритм, позволяющий найти решение краевой задачи численно.
Для модели распространения вируса гриппа A(H1N1) строится шестимерная краевая задача принципа максимума. С помощью средств пакета Maple 11 с использованием метода продолжения по параметру [59 60 62] удаётся найти численное решение краевой задачи. Основную сложность представлял выбор подходящего начального приближения. Далее осуществляется численный поиск наилучших управлений с точки зрения значения функционала в двух классах кусочно-постоянных управлений с одним переключением. Эти управления интересны для приложений, так как имеют понятную интерпретацию. Оказывается, что значение критерия качества на наилучшем режиме управления в одном из классов кусочно-постоянных управлений хуже (больше) значения функционала на экстремальном решении (численном решении краевой задачи принципа максимума) примерно на 10%. Ці, 1 2 — положительные коэффициенты амортизации. Коэффициент дисконтирования v 0. Фазовые переменные характеризуют факторы производства (например, основной капитал и человеческий капитал, как это используется в работе [63]), а функционал — интегральный объём потребления на отрезке времени [0,Т] с учётом дисконтирования. Задача состоит в поиске такого допустимого управления u{t) из класса допустимых управлений, которое максимизирует значение функционала J(u) по всем допустимым управлениям из класса допустимых управлений. Набор исходных данных задачи управления (2.1) состоит из положительных чисел и параметров (2.3). Длительность Т горизонта планирования предполагается «достаточно большой»; это высказывание в дальнейшем конкретизируется.
Исследование задачи (2.1) примыкает к статье [22], в которой подробно исследован случай \ \ = 1 2 для этой задачи. В работе подробно рассматривается случай \і\ ф \i2, как представляющий наибольший интерес.
Замечание 2.1.0.1. Задача вида (2.1) при других типах производственной функции F(x) допускает [64] биологическую интерпретацию в модели сбалансированного роста растений, в которой xi характеризует степень развития корневой системы, х2 — побегов (кроны), а функционал — массу выросших плодов на заданном промежутке времени (сельскохозяйственный сезон). В [64] приведён следующий вид функции F(x) :
Решение задачи (2.94) в случае, когда начальная точка лежит ниже особого луча
Краевая задача (2.117) выгодно отличается от краевой задачи (2.113) тем, что неизвест-ный параметр г 0 не входит в формулы для граничных значений. Это позволяет пред-ложить для её решения специальный численный метод, описанный ниже. Решив краевую задачу (2.117) на [0,г], немедленно получим решение краевой задачи (2.113): зная s(0), и параметр г, найдём р2(0) = s{0)/F{x{0)), после чего решение p2(t), x2(t) краевой задачи (2.113) находится как решение соответствующей задачи Коши на отрезке [0,г].
Замечание 2.2.2.3. Полученные в подразделе 2.2.6 результаты для решения задачи (2.90), когда начальная точка находится ниже особого луча, справедливы и для случая /і = 0. Для этого случая нужно положить zsng = 1.
Обоснование оптимальности проводится аналогично схеме, предложенной в [14]. В этом подразделе предполагается, что и Є (0,z g]. Выше для этого случая было построено решение задачи (2.94) на полуинтервале [0,+оо). При этом соответствующее решение x(t), pit) является решением краевой задачи (2.110) на некотором известном участке времени [0,т) и определяется следующим образом на полуинтервале от [г, +оо): xxit) = y(t), x2{t) = y{t) zsng, Pl(t) = p2{t) = q{t), tE[r, + oo). Здесь у it) и q(t) определяются формулами (2.109), где ут ---- Хі(т). По данному решению строится решение (x(t),ip(t)), t Є [0, + оо) краевой задачи принципа максимума (2.93): x(t) совпадает с построенным выше, а (t) = е р ), і = 1,2. Экстремальное управление в программной форме находится следующим образом: u(t) = и (x(t),p(t)), t 0. Здесь и (х,р) определяется формулой (2.95). Таким образом, имеем экстремальную тройку ixit),ijit),uit)), іє[0, + оо). Процесс (пара траектория, управление) {x{t),u{t)), 0 t +oo, (2.118) будем называть экстремальным процессом; он удовлетворяет необходимым условиям оптимальности в форме принципа максимума Понтрягина с участием сопряжённой переменной Фіі). Обоснуем оптимальность экстремального решения (2.118). для траектории и функционала. Оптимальность экстремального процесса (2.118) будет доказана, если установить неравенство AJ O (2.120) для любого допустимого процесса (2.119). Доказательство неравенства (2.120) опирается на полученное ниже специальное интегральное представление приращения функционала A J. В этом представлении важная роль отводится функции максимума М(і,х,ф) = К(і,х,ф,и)\и=иЧx,ф) = e vtk : где к определяется формулой (2.96). В случае ж2(0) Жі(0) zsng и ф == ф(ї) (здесь ф(ї) - решение краевой задачи принципа максимума (2.93)) функция максимума M(t,x,ip(t)) = = m(t,x) принимает вид m(t,x) = e v\- \n{evtMt)/e2) + evtMt)F{x)/e2 - 1) - ІнфіХг - іі2ф2х2. (2.121) Так как ф2{Ь) 0 Vi 0, см. соотношения (2.109), (2.113), то из равенства (2.121) вытекает что функция m(t,x) обладает следующими свойствами: выполняется для любых х,х + Ах Є R\, t Є [0, + оо). Вогнутость функции m(t,x) по х Є R\ вытекает из формулы (2.121), положительности функции ф2(г) Vt 0, вогнутости линейной функции и вогнутости по х Є R\ функции Кобба-Дугласа F(x) = х\гхє2, єг + є2 = 1,
Переходим непосредственно к обоснованию оптимальности процесса (2.118). Для удобства изложения напомним основные свойства экстремальной тройки x(t),ip(t),u(t) и процесса (2.119), вытекающие из полученных формул. Выбрав в качестве управления и{і) произвольную кусочно-непрерывную на любом сегменте [0,Т] функцию со значениями из множества U, рассмотрим нелинейную динамику фазовых переменных задачи (2.90).
Покажем, что скорости роста фазовых переменных не превосходят экспоненциальную. Для этого сложим умноженное на є і первое уравнение и умноженное на є2 второе уравнение. Получим ЄіЖі + Є2Х2 = (Щ + U2) Х ХІ2 - ЦхВхХх - /і2є2х2, (2.131) откуда, используя условие и\ + и2 1 и применяя неравенство Юнга: хє- хє2 В\Х\ + 62X2, справедливое для положительных х\, Х2, Є\, Є2 при условии Є\ + Є2 = 1, имеем дифференци-альное неравенство
В частности, любые постоянные функции со значениями из U принадлежат классу допустимых управлений.
Примером управления, не принадлежащего классу допустимых управлений, может слу-жить следующее управление щ(г) + u2{t) = 1 - е-6"". Для такого управления функционал расходится, так как справедлива оценка
В данном подразделе предлагается конструктивный алгоритм поиска решения краевой задачи (2.117), аналитический вид которого найти не удалось. Разделим второе уравнение задачи (2.117) на первое и рассмотрим следующую задачу Коши 11= «("-si/0- -1 e( ) = Jk (2134) dz (1-1/s) /e + fJLz {8т //(Єі+ sng) Будем рассматривать задачу Коши (2.134) относительно функции s(z) на отрезке [z0,zsng]. Из рассуждений предыдущего подраздела вытекают следующие неравенства
На рисунке 2.12 показан вид оптимальной траектории на фазовой плоскости хгх2 (стрелками показано направление движения фазового вектора). На первом участке времени [0, г] происходит переход фазовой точки из начального состояния х = х(0) на особый луч Lsng, вдоль которого фазовая точка перемещается на бесконечном промежутке времени [г, + оо). Неравенство 4lg - Ui - і/ 0 обеспечивает при движении фазовой точки вдоль особого луча Lsng удаление от начала координат. Неравенство zsng 1 соответствует расположению особого луча Lsng над биссектрисой хг = х2 первой четверти фазовой плоскости хгх2.
На рисунке 2.13 построены графики координат xi(t), x2(t) оптимальной траектории в зависимости от времени t. Графики функций X\(t), x2{t) имеют одну точки излома при t = т. Рисунок 2.14 содержит графики координат Ul{t), u2{t) оптимального управления u{t), 0 t +оо. На особом участке [г,+оо) имеем: іц{ї) = єг(1 - v/z g) = 0.691338, u2{t) = = є2{1 - vzIL) = 0.197754. Функции щ(і), u2{t) имеют одну точку переключения при t = т.
Исследование системы дифференциальных уравнений модели
В апреле 2009 года в Мексике и США началась пандемия нового штамма вируса гриппа A(H1N1), которая затем распространилась почти по всему миру. В СМИ этот вирус был популярен под названием «свиного» гриппа. В связи с этим событием для моделирования распространения этого заболевания в статье [68] была предложена модель (2.137) (без управляющих слагаемых ±uS в системе ОДУ и функционала).
Для борьбы с эпидемией правительства нескольких государств решили провести массовую вакцинацию населения. В этом контексте в работе [4] была предложена и исследована задача оптимального управления (2.137). Рассмотрим модель (2.137). Здесь общая популяция хозяев N разделена на три категории: S(t) — количество восприимчивых индивидов (susceptible, см. работы [4,68]) в момент времени t; I(t) - количество инфицированных индивидов (infective) в момент времени t; R(t) — количество иммунных индивидов (removed) в момент времени t.
В дифференциальных уравнениях модели (2.137) имеются следующие эпидемиологические параметры: Л — скорость притока людей в популяцию, /і — удельная скорость естественной гибели и гибели от причин, не связанных с болезнью, d - удельная скорость гибели от болезни, г — удельная скорость выздоровления, /3 — параметр трансмиссивности, объединяющий большое количество эпидемиологических, природных и социальных факторов, влияющих на скорость передачи инфекции. Слагаемое /3S{j показывает, что новые случаи инфекции возникают пропорционально численности восприимчивых и доли инфицированных хозяев.
Для модели (2.137) имеет важное значение параметр R0 = -- базовая скорость репродукции инфекции. Это среднее число вторичных инфекций, вызываемых внедрением одного инфицированного индивида в популяцию, состоящую исключительно из восприимчивых хозяев. Ясно, что для внедрения и закрепления в популяции хозяев паразитические виды должны иметь базовую скорость репродукции инфекции До 1.
Параметр и характеризует скорость вакцинации, описывающую переход восприимчивых индивидов S(t) в класс иммунных R(t) (долю восприимчивых индивидов, подвергающихся вакцинации, в единицу времени). Задача оптимального управления состоит в минимизации количества инфицированных индивидов и стоимости вакцинации. Математически это формулируется в виде интеграла в модели (2.137), подлежащего минимизации, а параметр А характеризует соотношение «важности» между количеством инфицированных и стоимостью вакцинации (чем больше параметр А, тем важнее минимизировать расходы на вакцинацию по сравнению с количеством инфицированных).
В данной работе исследована модификация модели (2.137), когда общая численность населения N = N(t) меняется со временем t. Для удобства были введены новые обозначения для переменных и параметров задачи Х\ = S, xw = 60; Ъ\ = /і, а = Л, Х2 = I, X2Q = ЗО; Ъ2 = fi + d + r, с = /3, Хз = R, жзо = 91о, Ьз = т. Q = 1/А T = tf. 2.3.3 Исследование системы дифференциальных уравнений модели Положительность фазовых переменных Рассмотрим систему дифференциальных уравнений для задачи (2.136). Так как xi0 О, і = 1,2,3, из этого следует, что существует такое время г, что на всём отрезке [0,г] решение x(t) лежит в Е+ (все компоненты Xiit) 0). Справедливы следующие оценки, верные на отрезке [0,г]:
Предположим, что существует такой момент времени t = s, что xi(s) = О, xiit) 0,te [0,s). На полуинтервале [0,s) верна оценка X\(t) — (и + Ъ\ + c)xi(t), или, по теореме сравнения Чаплыгина, Xl{t) xwe- a+bl+c . Переходя к пределу при t стремящемся к s в этом неравен стве, получим, что что противоречит исходному предположению. Таким образом, Xl{t) 0 на любом отрезке t Є [0,s],s 0, на котором определено реше ние задачи Коши (2.136) при некотором допустимом управлении u{t). Аналогичным образом легко установить, что x2{t) 0 и x3(t) 0 при t Є [0,s],s 0. Продолжимость решения Обозначим X = хг + х2 + х3. Сложив три дифференциальных уравнения задачи (2.136), получим следующее дифференциальное уравнение: уравнение для матрицы Якоби системы Тогда в силу положительности переменных X\{t), x2{t) и x3{t) оказывается, что каждая из этих компонент ограничена для любого t 0: Рассмотрим систему дифференциальных уравнений задачи (2.136) при и = 0. Запишем характеристическое дифференциальных уравнений задачи (2.136):