Содержание к диссертации
Введение
1 Синтез управления нагревом тела при случайных внешних воздействиях 25
1.1 Математическое описание процесса управления нагревом тела. Постановка задачи 25
1.2 Сведение исходной задачи к задаче управления бесконечной системой стохастических дифференциальных уравнений первого порядка 30
1.3 Уравнение Гамильтона-Якоби-Беллмана для системы стохастических дифференциальных уравнений первого порядка 35
1.4 Решение уравнения Гамильтона-Якоби-Беллмана. Задача распределенного управления. Функционал Майера . 37
1.5 Решение уравнения Гамильтона-Якоби-Беллмана. Задача управления одним актуатором. Функционал Майера. 56
1.6 Решение уравнения Гамильтона-Якоби-Беллмана. Задача управления несколькими актуаторами. Функционал Майера 58
1.7 Решение уравнения Гамильтона-Якоби-Беллмана. Задача распределенного управления. Функционал Лагранжа 60
1.8 Решение уравнения Гамильтона-Якоби-Беллмана. Задача управления одним актуатором. Функционал Лагранжа. 67
1.9 Пример. Численный расчет линии переключения во "внутренней" области для TV = 3, х1 = |, функционал Лагранжа 71
1.10 Решение уравнения Гамильтона-Якоби-Беллмана. Задача управления несколькими актуаторами. Функционал Лагранжа 80
2 Управляемые колебания балок и пластин при случайных внешних воздействиях 85
2.1 Постановка задачи 85
2.2 Сведение исходной задачи к задаче управления бесконечной системой стохастических дифференциальных уравнений первого порядка 88
2.3 Уравнение Гамильтона-Якоби-Беллмана для системы стохастических дифференциальных уравнений 90
2.4 Решение уравнения Гамильтона-Якоби-Беллмана. Задача распределенного управления. Функционал Майера 92
2.5 Решение уравнения Гамильтона-Якоби-Беллмана для распределенного управления. Функционал Лагранжа 110
2.6 Решение уравнения Гамильтона-Якоби-Беллмана в случае управления актуаторами.
Функционал Майера 120
2.7 Решение уравнения Гамильтона-Якоби-Беллмана в случае управления актуаторами. Функционал Лагранжа 128
2.8 Управление колебаниями пластины 129
Заключение 131
Список литературы 133
- Сведение исходной задачи к задаче управления бесконечной системой стохастических дифференциальных уравнений первого порядка
- Решение уравнения Гамильтона-Якоби-Беллмана. Задача распределенного управления. Функционал Майера
- Сведение исходной задачи к задаче управления бесконечной системой стохастических дифференциальных уравнений первого порядка
- Решение уравнения Гамильтона-Якоби-Беллмана. Задача распределенного управления. Функционал Майера
Введение к работе
Диссертация посвящена задачам синтеза оптимального управления распределенными системами, на которые действуют детерминированные и случайные силы в виде гауссовского белого шума. Рассматривается два вида управления - сосредоточенное в заданных точках (управление с помощью актуаторов) и распределенное. Предполагается, что абсолютные величины управляющих функций ограничены. В качестве критерия оптимальности рассмотрены стандартные функционалы - Майера (минимизация целевой функции к фиксированному моменту времени) и Лагранжа (минимизация функции цели на заданном интервале времени).
Одним из основных методов решения задачи синтеза оптимального управления для стохастических систем является метод динамического программирования Р. Беллмана [6]. Основная трудность при практическом применении этого метода заключается в необходимости решения задачи Коши для уравнения Гамильтона-Якоби-Беллмана (далее сокращенно: уравнения ГЯБ) во всем пространстве. Параболическое уравнение Беллмана является квазилинейным. Это обусловлено наличием операции вычисления минимума по всем возможным управлениям, в результате чего возникает нелинейная зависимость от величин частных производных функции Беллмана.
Отыскание точного решения уравнения Гамильтона-Якоби-Беллмана представляет сложную математическую проблему. Поэтому имеется лишь небольшое число задач, решение которых было получено с помощью непосредственного решения уравнения Беллмана. Исключением является задача управления с квадратичным критерием качества [2, 21, 32, 65]. Однако, как отмечено в работе [66], часто рецепт синтеза оптимального управления невозможно применить на практике в силу того, что управляющая функция допускает бесконечно большие значения. В то время как в ряде важных с практической точки зрения задач управления тепловыми и диффузионными процессами, а также в задачах гашения колебаний упругих тел содержатся ограничения на управление [12, 18, 22, 26, 37, 43, 54].
В связи с тем, что точное решение квазилинейного уравнения Беллмана, как правило, получить не удается, усилия исследователей посвященны разработке методов численного решения подобных уравнений. Так, в монографии [3] приведен пример численного решения уравнения Гамильто-
5.
на-Якоби-Беллмана для задачи оптимального по быстродействию управления движением материальной точки. В монографии [1] описаны результаты применения этого же метода к задаче с последействием. В диссертационной работе [40] предложен метод приближенного решения уравнения Беллмана для задачи оптимального управления динамической системой, описываемой векторным дифференциальным уравнением, со свободным правым концом траектории и фиксированным интервалом управления.
В работе [35] для случая интегрального ограничения на управление был предложен метод решения уравнения Беллмана с использованием локальных решений (т.е. решений внутри некоторой части пространства), которые являются аппроксимацией функции Беллмана при достаточно больших зна-чениях фазовой переменной.
Здесь и далее под локальным решением будем понимать функцию, удовлетворяющую начальным условиям и уравнению Гамильтона-Якоби-Бел-лмана в некоторой, возможно неограниченной, части пространства.
В работе [10] рассмотрена задача оптимального управления колебаниями математического маятника при ограничении на суммарный ресурс управления (интеграл от управляющей функции в произвольной неотрицательной степени не превосходит некоторой величины). Цель управления - минимизация заданной функции фазовых переменных к фиксированному моменту времени. Рассмотрен случай, когда на систему действуют случайные возмущения в виде гауссовского белого шума. Доказано, что найденные локальные решения уравнения Гамильтона-Якоби-Беллмана могут быть продолжены на все пространство.
В работах [67, 68] был предложен метод построения численно-аналитического (гибридного) решения уравнения Гамильтона-Якоби-Беллмана.
Под гибридным решением понимается непрерывно дифференцируемое решение задачи Коши для уравнения. Гамильтона-Якоби-Беллмана, которое в некоторой неограниченной части пространства (далее в тексте: "внешняя" область) задается аналитически (локальное решение), а в остальной части пространства ("внутренней" области) достраивается численно как решение краевой задачи для соответствующего уравнения Беллмана.
В диссертации представлено дальнейшее развитие метода численно-аналитического конструирования гибридного решения уравнения Гамильтона-Якоби-Беллмана в применении к задачам построения синтеза оптималь-
6.
ного управления стохастическими тепловыми и колебательными процессами в распределенных системах при наличии ограничения на величину управляющих функций.
В диссертации использованы методы функционального анализа, теории дифференциальных уравнений с частными производными, теории численных методов, теории случайных процессов и теории управления.
Для задач синтеза оптимального управления тепловыми и колебательными процессами в распределенных системах, находящихся под действием детерминированных и случайных сил, при заданных ограничениях на величины управляющий функций: рассмотрены случаи как распределенного так и сосредоточенного управления (управления актуаторами); получены в явном аналитическом виде локальные решения задач Коши для соответствующих уравнений Гамильтона-Якоби-Беллмана; реализованы численные алгоритмы решения квазилинейных уравнений Беллмана; построены гибридные непрерывно дифференцируемые решения задачи Коши для уравнений Беллмана, позволяющие построить синтез оптимального управления.
Достоверность полученных результатов обусловлена корректностью поставленных задач управления и строгостью их решения математическими методами. Часть полученных результатов подтверждена с помощью альтернативных методов [72].
Полученные в диссертации результаты могут найти применение в задачах управления с обратной связью тепловыми и колебательными процессами в телах, на которые действуют как детерминированные, так и внешние случайные силы в виде белого шума, при заданном ограничении на величину управляющих функций.
В работе предложены и программно реализованы численные методы решения рассматриваемых уравнений Гамильтона-Якоби-Беллмана, которые могут быть использованы при решении практических задач синтеза оптимального управления.
В первой главе рассмотрена задача управления процессом нагрева (охлаждения) физического тела конечного объема D.
Замечание. Во введении нумерация формул и утверждений совпадает с нумерацией в основном тексте диссертации.
В п. 1.1 описана постановка задачи управления тепловым процессом при случайных внешних воздействиях.
7.
Уравнение, описывающее распределение температуры тела имеет вид
du(x,t)
= -Аи(х, t) + a) 6(х - xl)v.i(t) -f /3w(x, t) + f(x, t) +
— - -n»^,tj-ru / v
«'=1
(1.1)
Здесь - время, 0 < t < T; x = (хі,х2,хз) - пространственная переменная; u(x,t) - температура тела в момент времени t в точке х; /(ж, t) - плотность внутренних тепловых источников; Vi(t) - плотность управляемых тепловых актуаторов, находящихся в точке хг — (х\,хг2,хг3), і = 1,2, ...,&; 5(х — хг) - дельта-функция Дирака; w(x, t) - плотность распределенных управляемых тепловых источников; а и (3 - числа, принимающие значения 0 или 1; (t) - гауссовский белый шум единичной интенсивности; a(x,t) - заданная функция; А - дифференциальный оператор, характеризующий процесс теплопередачи. Так, в одномерном случае (D - стержень конечной длины)
А= -аА—?. дх2
Управление процессом нагрева (охлаждения) тела осуществляется путем выбора сосредоточенных функций v»(t) (а = 1, /3 = 0) или распределенных функций w(x,t) (а = 0, /3 = 1).
На интенсивности Vi(t) управляемых тепловых актуаторов наложены ограничения:
К'(01 — Pit г = 1,2,..., к, pi — const > 0. (1.3)
В случае распределенного управления управляющая функция w(x,t) удовлетворяет интегральному ограничению
/
w2(x,t)dx < R2. (1.4)
К уравнению (1.1) необходимо добавить начальные условия, которые определяют температуру стержня в некоторый начальный момент времени, например, при t — 0
и(х,0)=и{х), (1.5)
где и(х) - заданная функция; а также краевые условия на границе области D, вид которых зависит от температурного режима на границе: поддерживается заданная температура, задан теплопоток, происходит теплообмен с окружающей средой.
8.
Не умаляя общности, сделав замену переменных и изменив соответствующим образом функцию f(x,t), можно полагать, что все краевые условия являются однородными.
Цель управления - минимизация одного из функционалов - Майера или Лагранжа соответственно:
Е (u(x,t) -u*(x,t))2dx
(1.9)
t=T
(1.10)
*//M,,,)-<-(,,0)W,
0 D
где E обозначает математическое ожидание, u*(x, t) - заданная функция. Можно сделать следующую замену
и(х, t) = wi(x, t) + и*(х, t)
(1.11)
и далее считать, что функция w*(x,i) = 0. Относительно функции ui(x,t) получим уравнение (1.1) с новой функцией fi(x,t):
/i(M) = f(x,t) - ^^ - Au*(x,t).
(1.12)
После замены (1.11), (1-12) функционалы (1.9) и (1.10) запишутся в виде
/ u2(x,t)dx
(1.13)
t=T
Е I u2(x,t)dxdt.
(1.14)
0 D
Решение краевой задачи (1.1) - (1.6), (1.7) или (1.8) с соответствующими условиями Коши (1.5) будем искать среди функций u(x,t) таких, что при каждом фиксированном х являются решением стохастического уравнения (1.1) в смысле Ито [15, 29], а при каждом фиксированном t функция и(х, ), как функция переменной ж, принадлежит соответствующему энергетическому пространству На (пространству Соболева), порожденному симметричным положительно-определенным оператором А (1.2) (см., например, [44, 49]).
9.
В случае стержня (0 < х < /) норма элемента пространства На задается выражением
И||Я*= У1и2+(9)^' (2-14)
N о
Одним из наиболее эффективных способов решения краевых задач для уравнений в частных производных является метод разделения переменных (метод Фурье, метод собственных функций) [13, 18, 22]. Метод Фурье позволяет произвести декомпозицию исходной задачи и свести задачу синтеза управления уравнением теплопроводности к задаче синтеза управления системой стохастических дифференциальных уравнений первого порядка.
Метод декомпозиции исходной задачи на несколько более простых задач применялся в работах [45, 46, 59] для синтеза управления динамическими системами, описываемыми уравнениями Лагранжа 2-го рода. В работе [60] был предложен метод построения управления, основанный на декомпозиции системы и применении оптимального по быстродействию управления для каждой моды движения, полученной в результате разложения решения по методу Фурье.
В п. 1.2 описан метод декомпозиции. Решение u(x,t) уравнения (1.1) можно представить в виде разложения по собственным функциям оператора Л
u(x,i) = ^2uj{t)il)j(x), (1.19)
i=i где иj{t) определяются по формуле
і*і(0 = («(М),^(ж)). (L18)
Здесь скобки означают скалярное произведение в пространстве L2.
Представления (1.19) записываются также для функций w(x,t), f(x}t) и a(x,t). Подставляя функции в виде полученных разложений (1.19) в исходное уравнение (1.1) и умножая скалярно обе части уравнения на собственные функции фі(х), ф2Іх)-, і Фп(х), ..., получаем бесконечную систему стохастических дифференциальных уравнений первого порядка:
uj(t) = -Xjujit) + aj:ФЛ*1Ы*) + /W) + Ш + *і№«*), ,, on,
»=l yl.ZOj
.7 = 1,2,....
10.
Здесь и далее _;-ое уравнение системы (1.20) будем считать эквивалентной записью уравнения следующего вида
duj{t) = -XjUj(t)dt + a ^2 ^fa^Viifjdt + /3wj(t)dt + fj(t)dt + aj(t)dw(t),
где dw(t) - стандартный винеровский процесс [41, 47].
В задаче управления тепловыми актуаторами (а = 1, /3 = 0) интенсивности Vi(t) удовлетворяют ограничениям (1.3). Для задачи распределенного управления (а = 0, /3 = 1) ограничение на управление (1.4) примет вид
«#)<# (1-22)
Функционалы Майера (1.13) и Лагранжа (1.14) после подстановки вместо функции и(х, t) ее разложения (1.19) можно записать следующим образом:
я «?(«)
(1.23)
Е '
о з=1
После замены
3=1
t=T
/оо
Y,u)(t)dt. (1.24)
«i(*) = «i(*) + ViW. I1-25)
і.
4>3\t) = е~х'* / fj{s)exr4s (1.26)
о систему (1.20) можно представить в виде
f=i ^1.2/)
.7 = 1,2,....
Таким образом, исходная задача (1.1) сводится к задаче построения синтеза оптимального управления бесконечной системой стохастических дифференциальных уравнений (1.27) (в смысле Ито) при ограничениях (1.3) на
11.
интенсивности тепловых актуаторов или ограничениях (1.22) на интенсивность распределенного управления соответственно для функционалов качества Майера и Лагранжа следующего вида
Я Х>;(0+ >;(*))'
(1.31)
t=T
>;(*) +
о i=1
В п. 1.3 описан метод динамического программирования и уравнения Гамильтона-Якоби-Беллмаиа.
Известно, что к изучению процессов, протекающих во времени, к каковым относится и изучаемый процесс нагрева (охлаждения) стержня, можно подходить двумя различными способами. Один из подходов состоит в рассмотрении отдельных траекторий системы [39], а другой - в изучении свойств всего множества траекторий [6]. Метод динамического программирования является одним из распространенных методов построения оптимального управления в виде синтеза и основан на изучении всего множества траекторий системы.
Функцией Беллмана называется функция, равная инфинуму минимизируемого (максимизируемого) функционала (критерия качества для управления) на траекториях исследуемой системы по всем допустимым управлениям.
Рассмотрим систему (1.27), составленную из первых N уравнений. Обозначим функцию Беллмана через Hn(u,t) - минимальное значение функционала Майера (1.31) или Лагранжа (1.32) при условии, что в момент времени т — Т — t система находится в состоянии й — [щ, «2, } un)-
В задаче Майера с функционалом (1.31) уравнение Гамильтона-Якоби-Беллмана для функции Hn(u,t) имеет вид
LM(HN(% г)) + a mm j — ф^)ф) \ +
j=i j ,;=i
= 0 (1.33)
12.
с начальным условием
#"М) = >; + ^(о))2, (1-34)
где функции (fj(r), j — 1, 2,..., N задаются формулой (1.26), т = Т — t -"обратное"время, Ьм - линейный дифференциальный оператор, определяемый равенством
МЯ"(в,г» = --^- + (-ал— + ^W-es-) (1.35)
Для задачи Лагранжа с функционалом (1.32) уравнение Гамильтона-Якоби- Белл мана для функции Беллмана Нм(й,т) имеет вид
N п тТдг к
j=l j t=l
N nrjN
+0 ^min ^^(Т) ^=o (1.36)
Е^2<Д2 lj=i J
І=1
с нулевым начальным условием
#JV(u,0) = 0. (1.37)
Здесь Ll - линейный дифференциальный оператор следующего вида:
LL(HN(u, т)) = - — + 22 {-Х^-д^~ + 2^ (Т)"^Г + {Uj + ^'(Т)) J *
(1.38) Если найдено непрерывно дифференцируемое решение поставленной задачи Коши, то оптимальное управление будет определяться равенствами
N dHN
Vi(r) - -Pi sign^22^3^)-^-^ t = 1,2,...,*. (1.100)
В зависимости от управления (сосредоточенное или распределенное) и от вида минимизируемого функционала (Майера или Лагранжа) в диссертации рассмотрены четыре разные задачи Коши для уравнения Гамильтона-Якоби-Беллмана.
13.
Описанные в п. 1.3 уравнения Гамильтона-Якоби-Беллмана являются квазилинейными параболическими уравнениями, следовательно, согласно [30, 57], решение задачи Коши для уравнения Гамильтона-Якоби-Беллмана существует и единственно.
В следующих параграфах рассмотрены все описанные выше задачи. Получены в аналитическом виде локальные решения соответствующий уравнений Гамильтона-Якоби-Беллмана. Приведены результаты численных расчетов, построены гибридные решения.
В п. 1.4 представлены в аналитическом виде локальные решения уравнения Гамильтона-Якоби-Беллмана в случае распределенного управления и функционала Майера.
Введем предположение о том, что каждый из коэффициентов разложения Wj(r) удовлетворяет следующему ограничению
К(т)|<г,-, (1.39)
rj = , 3 = 1,2,..., (1.40)
/ оо .»=1
Xj - собственные значения, соответствующие собственным функциям i>j(x). Оптимальное управление в этом случае будет определяться равенствами
. дНм(й,т)
wj{r) = -rj sign ^-^-, j = 1,2,..., N. (1.43)
Утверждение 1.1.
Пусть выполняются ограничения (1.39) для распределенной управляющей функции, тогда функция
Я"(й,т) = я'"(«,-,т),
о т
Я>(«,-,т) = ((Vj + 2^А'Т '* + у,-(0))" + Ja)(s)e-^ds, (1.55)
_ . дН3(щ,т)
о где
^ = sign ^-^, j = l,N, (1.56)
14.
является решением задачи (1.42) с. начальным условием (1-34) в области DN:
DN = (J D\ где D> = Uhr : |и,- + ^(0)еА'т| > !1(ех*т - 1)| . (1.57)
Значения
Из утверждения 1.1 следует, что локальное решение (1.55) справедливо в области DN (1.57). Д алее будем называть эту область "внешней". Для того, чтобы построить решение задачи Коши во всем пространстве, поставим задачу отыскания функции Беллмана в оставшейся части пространства ("внутренней" области) численно, как решение соответствующей краевой задачи для уравнения Гамильтона-Якоби-Беллмана. При этом на границах области будем задавать значения функции из найденного локального решения (1.55).
Известно [56, 73], что функция Беллмана, определяющая синтез оптимального управления, должна быть непрерывно дифференцируемым решением уравнения Гамильтона-Якоби-Беллмана. Для того чтобы получить непрерывно дифференцируемое гибридное решение задачи Коши для уравнения Беллмана во всем пространстве, применяется следующий подход. Краевая задача с заданными границами "внутренней" области заменяется на краевую задачу с нефиксированными границами. При этом на границах задаются значения функции, определяемые локальным решением во "внешней" области. В процессе численного решения уравнения Гамильтона-Якоби-Беллмана границы "внутренней" области расширяются до тех пор, пока не произойдет склейка производных функции Беллмана, полученных в результате численного решения краевой задачи во "внутренней" области, и производных, заданных аналитически во "внешней" области. Непрерывность самой функции Беллмана следует из постановки задачи. Сдвиг границ осуществляется за счет сужения "внешней" области.
В этом пункте также представлены результаты численных расчетов линии переключения во "внутренней"области. Построены непрерывно дифференцируемые гибридные решения H*(uj,t) для j = 1,2.
В п. 1.5 представлены в аналитическом виде локальные решения уравнения Гамильтона-Якоби-Беллмана для управления одним актуатором в случае функционала Майера.
В п. 1.6 представлены в аналитическом виде локальные решения уравне-
15.
ния Гамильтона-Якоби-Беллмана для управления к актуаторами в случае функционала Майера.
Утверждение 1.3.
Пусть для интенсивностей актуаторов выполняются ограничения (1.3), тогда функция
к л-
N AXjUj + Y, 2{р{фЖхг))е-х*т - Y^ гіРіфі(х{)
A,
Я*(в,т) = ( =!
і=і
2 r
+>;(<>)) + J' cr](s)e~2^ds,
QffN
z.i = sign^WM-o—> г = 1,&,
удовлетворяет уравнению Гамильтона-Якоби-Беллмана (1.33) с начальными условиями (1.34) в области DN, определяемой неравенством
* is / ,*ч2
N („1,*\2
>
^V*e-2A''(«;+>i(0)eA'r)
j=l г=1 j=l
Здесь ф*, — max фу{хг).
J 1<і<к
В п. 1.7 представлены в аналитическом виде локальные решения уравнения Гамильтона-Якоби-Беллмана для распределенного управления в случае функционала Лагранжа.
Утверждение 1.4.
Пусть выполняются ограничения (1.39) для распределенной управляющей функции, тогда функция
.7=1
(1.82)
HJ(uj,r) = J-^Ayti,- + zjrjfil - e~2V) - AzjrjiXjUj + zjrj)(l - еГА'т) +
16.
т т
)
С 1 — е~ jS 2e~XjT Г
2*,-r
}^- J
A,
+ J a%s)—^x. ds + -^—(XJUJ + zJrj) J
где
du.;
. дНЧщ,т)
Zj = sign ^-*-—, j
l.JV
во "внешней"области DN = (J Z)J, где
^= V =
"i + ^731 J *Me' ds
>
Tj ЄХіт — 1
Xj e V + 1
(1.83)
удовлетворяет уравнению Гамильтона-Якоби-Беллмана (1.76) с начальным условием Hi(uj, т — 0) = 0, j — 1, iV.
Также представлены результаты численных расчетов функции Беллмана во "внутренней"области. Построены непрерывно дифференцируемые гибридные решения Hj(uj,t) для первой моды.
В п. 1.8 представлены в аналитическом виде локальные решения уравнения Гамильтона-Якоби-Беллмана для управления одним актуатором в случае функционала Лагранжа а также оценки ширины "внутренней"области.
В п. 1.9 рассмотрен пример численного решения уравнения Гамильтона-Якоби-Беллмана для управления одним актуатором в случае функционала Лагранжа. В случае трех мод уравнение Беллмана решено численно во "внутренней"области. Построено гибридное решение уравнения Беллмана для N = 3.
В п. 1.10 представлены в аналитическом виде локальные решения уравнения Гамильтона-Якоби-Беллмана для управления к актуаторами в случае функционала Лагранжа.
Утверждение 1.6-
Пусть для интенсивностей актуаторов выполняются ограничения (1.3), тогда функция
N / 1 / к
HN(u,r) = Ef^UV, + 5>*(*')Л)2(1 - е-5*")-
7=1 ^ J ^ » = 1
17.
к к / к \ 2 \ \
г_і 0
л / ^(s)^ + / (fi2j(s)ds,
о о
j=i -7
удовлетворяет уравнению Гамильтона-Якоби-Беллмана (1.99) с нулевыми начальными условиями HN(u,r = 0) = 0 в области
D^ = {«,-,т:
>
І—1 n
>
M Ґ.І.*\2
,:=і j=i і
е~х>т)2}-
Здесь ф*і = max ф;(xl). J iJ
Во второй главе изучена задача управления поперечными колебаниями балки или пластины, подверженных случайным внешним воздействиям.
В п. 2.1 описана постановка задачи управления. Уравнения, описывающие состояние колебательной системы, можно записать в следующем виде
du(x,t)
dt ~
p(x,t),
-Au(x, t) + a Y, 5(x - x{)vi(t) + (3w(x, t) + a(xy t)(t).
i=l
(2.2)
Здесь t - время, 0 < < T; x Є D - пространственная переменная, скаляр для балки и стержня, вектор х = (я^, ж2) в случае пластины; и(х, і) - отклонение (смещение) системы от положения равновесия в момент времени t в точке х; p(x,t) - скорость смещения; V{(t) - управляющие функции (актуа-торы), сосредоточенные в точках х\ і — 1, 2,..., к; 8(х—хг) - дельта-функция Дирака; w(x,t) - распределенная по системе управляющая функция; а и /3
18.
- числа, принимающие значения 0 или 1; () - гауссовский белый шум единичной интенсивности; а(х, t) - заданная функция; А - дифференциальный оператор, определяющий упругие свойства системы. В случае балки оператор А имеет вид
А = „'—. (2.3)
Управляющие функции vi удовлетворяют ограничениям (1.3), функции w(x,t) -ограничениям (1.4).
К системе дифференциальных уравнений (2.2) необходимо также добавить начальные условия
и(х,0) = <рі(х), р(ху0) = (р2(х) (2.7)
и краевые условия, которые зависят от способа закрепления стержня или пластины [51].
Управление колебаниями стержня или пластины осуществляется путем выбора управляющих функций V((t), удовлетворяющих ограничениям (2.5) (или (1.3)), в случае управления актуаторами или функций w(x, t) при ограничении (1.4) в случае распределенного управления.
При этом в качестве цели оптимального управления можно задать один из функционалов качества: Майера или Лагранжа. В первом случае ставится задача отыскания такого управления, что математическое ожидание полной энергии системы будет минимально к некоторому заданному моменту времени t = Т (задача Майера)
-Е {(Аи, и) + (р,р)}|<=т -> min; (2.11)
во втором случае (задача Лагранжа) следует минимизировать математическое ожидание интегрального значения полной энергии колебательной системы за время 0 < t < Т:
Е I ((Аи,и) + (p,p))dt> -^ min. (2.12)
Здесь Е - знак математического ожидания, а операция (, ) обозначает вычисление скалярного произведения в пространстве L2(D).
19.
Решение задачи (2.2) с соответствующими начальными и краевыми условиями будем: искать среди функций u(x,t), p(x,t) таких, что при каждом фиксированном х функции и(х, t) и р(х, t), как функции переменной t, являются решением стохастического уравнения (2.2) в смысле Ито [8, 56], а при каждом фиксированном t функция u(x,t), как функция переменной ж, принадлежит соответствующему энергетическому пространству На (пространству Соболева), порожденному симметричным положительно-определенным оператором А (2.3) (или (2.4)).
В случае балки (0 < х < I) норма элемента пространства ЯА задается выражением (2.14).
Далее также полагаем, что при каждом фиксированном значении t функция р(х, t) принадлежит пространству L2(D), т.е.
(Р>Р) = / P2dx = ЇЙ2 < +оо.
Аналогичное предположение сделаем относительно функции a(x,t).
В п. 2.2 описан метод декомпозиции.
Исходная задача для распределенной системы сводится к задаче построения синтеза оптимального управления бесконечной системой стохастических дифференциальных уравнений (2.17) при ограничениях на распределенное управление (1.22) или на сосредоточенное управление (1.3) с целью минимизации одного из функционалов качества Майера (2.19) или Лагран-жа (2.20):
Uj(t) =Pj(t),
pj(t) = -xjUj(t) + «E ^M*.-(0 + Pv>At) + *ї(*Ж0> (2-17)
J-1,2,...;
функционалы Майера (2.11) и Лагранжа (2.12) примут вид
гя)(аі«і(')+р?(*))
-> min, (2.19)
t=T
т _
1 f
оЕ / I>;«?w + p2Mdt -+min (2-2)
1 І і=і
20.
В п. 2.3 описан метод динамического программирования и уравнения Гамильтона-Якоби-Беллмана для управляемых колебательных процессов. Для функционала Майера уравнение Беллмана имеет вид:
N п -rrN *
LM(HN{u,p, т)) + а min і ]Г Щ-~ ]Г ф3(х%(т) \ +
4-^^min J>;(t)—[=0, (2.22)
здесь Hn(u,P,t) - функция Беллмана, равная минимальному значению (а точнее, инфинуму) функционала (2.19) при условии, что в момент времени г = Т — t система находится в состоянии й — (щ, и2, , 4/v)> Р — (pi,P2, ,Pn)', т — Т — t ~ "обратное"время, Ьм(Нм(й,р,т)) - линейный дифференциальный оператор, определяемый равенством
dHN А/ днм ж dHN і 2/ ,d2HN*
LM(HN(u,p}r)) = -^- + ^^-- - A^.^i- + ^а2(т) ^
(2.23) Начальные условия для функции Нм(й,р,т) следующие:
Н\щр,0) = \"(\гі + р*). (2.24)
і=і
Для задачи Лагранжа уравнение Гамильтона-Якоби-Беллмана можно записать в следующем виде:
Г N FiHN к 1
LL(HN(u,p, г)) + a min і 1>— Е^И^М > +
Г ^ аяМ
+/3 min ^Wi(T) l=o, (2.25)
n і *—' - ' dpj
7=1
riV/V. m
7=1
где Ll{Hn(йур,т)) - линейный дифференциальный оператор вида
дя^ А/ ая^ , ая^ і „ ,<э2я^
-. г-r-rN / \\ Un V^l ^^1 л U1 L 9/ \'
21.
+|(*i«i+*?))> (2-26)
В этом случае начальные условия для функции Беллмана нулевые.
Метод динамического программирования позволяет свести задачу оптимального управления системой дифференциальных уравнений к отысканию решения задачи Коши для нелинейного уравнения в частных производных.
Если найдено непрерывно дифференцируемое решение уравнения Гамильтона-Якоби-Беллмана (2.22) или (2.25) с начальными условиями (2.24) или (2.27) соответственно, то синтез оптимального управления определяется по нижеследующим формулам:
N p. jj-JV / _ _ ч
Vi{r) = -Pj signJ^VjH fl . * = 1.2,..., к. (2.28)
dHN(u,p,r)
Wj{r) = -rj sign Kd \Ft \ j = 1,2,..., N. (2.29)
Формула (2.29) получена в предположении, что функции Wj(t) удовлетворяют ограничению (1.39) в уравнении (2.25).
В п. 2.4 представлены в аналитическом виде локальные решения уравнения Гамильтона-Якоби-Беллмана в случае распределенного управления и функционала Майера.
Утверждение 2.1.
Пусть выполняются ограничения (2.30) на коэффициенты разложения управляющей функции, тогда функция
j=i HJ{ujlPj,r) = -( lpj-^:smy/XJTJ +
2 T
+ (yX~jUj + -^(1- cos у%т)^ +Ja*(s)ds\ (2.42)
* j о
22.
является решением задачи Коши (2.32), (2.24) в области DN:
DN = (J D\ где 1У = \ и,-,р,-,т : |Pi| > -j= \ . (2.43)
В качестве примера приведены результаты численных расчетов функции Беллмана и линии переключения управления. Построены непрерывно дифференцируемые гибридные решения HJ(uj,Pj,t) для j = 1,2.
В п. 2.5 представлены в аналитическом виде локальные решения уравнения Гамильтона-Якоби-Беллмана в случае распределенного управления и функционала Лагранжа.
Утверждение 2.4.
Пусть выполняются ограничения (2.30) на управляющую функцию, тогда функция
Hn(u,P,t) = ^Hj(uj,pj,t),
T'Z' I \
H3(uj,pj, r) = -~-1 pj(cos -1)+ ^jujT — ujy\ sin v \т ) +
T
+ тЧ r 4=J- ) + -(Xju2 +p])r + -J s
АД v^ J 2
дН]{щ,рі,т)
Zj = sign J j = 1, N,
является локальным решением задачи Коши (2.61), (2.62) по "внешней"об-
ласти DN — \J D3\ где D3 определяются неравенствами:
Dj = luj,pj,T : \PjT\ > ^-(1 - cos у/\]т)\ .
В качестве примера рассмотрена задача оптимального управления колебаниями свободно опертого стержня прямоугольного сечения. Построены непрерывно дифференцируемые гибридные решения Hj(uj,Pj,t) для І = 1,2.
В п. 2.6 представлены в аналитическом виде локальные решения уравнения Гамильтона-Якоби-Беллмана в случае управления актуаторами для функционала Майера.
23.
Утверждение 2.6.
Пусть управляющие функции г>;(), г = 1, 2,..., к, удовлетворяют ограничениям (2.5), тогда функция
Hj(uj,Pj,t)= 7>\\Pj
Ё Pi^j{xl)zi
i'=l
sin v AjT ) +
J^J
+ ( лД7^7 +
РіФі(хг)їі
i=l
лА;
(l-cos^/VOj + a](s)dsY (2.89)
2; = sign^Vj(^)
dHJ(uj,pj,T) dpj
, г = 1, fc
(2.90)
является локальным решением задачи (2.76), (2.24) в случае управления актуаторами (а = 1, /3 = 0) в следующей "внешней"области
>
\/fc
* W)2
\| і=і і=і Vа.
(2.91)
(2.92)
-0* = max фАхг).
3 1<і<к J
В п. 2.7 представлено локальное решение уравнения Гамильтон а-Якоби-Беллмана в случае управления актуаторами для функционала Лагранжа. Утверждение 2.7. Пусть выполняются условия утверждения 2.6. Тогда функция
N f i=1o
(2.93)
где H3(v,j,pj, г) определяются по формуле (2.89), является локальным решением уравнения Гамильтона-Якоби-Белл мана (2.25), (2.26) с начальными
24.
условиями (2.27) для случая управления актуаторами (а — 1, /? = 0) в
области вида
iv
Е ^ r > 2V^ i=i
где величины ipj определяются из (2.92).
В п. 2.8 рассмотрена задача управления колебаниями прямоугольной пластины со свободно опертыми краями.
Основные результаты, изложенные в диссертации, опубликованы в работах [11], [19], [20], [69], [70], [74].
Результаты работы докладывались на восьмом Всероссийсоком съезде по теоретической и прикладной механике в августе 2001 г., на научных конференциях "Неделя науки - 2002 г.", "Неделя науки - 2003 г." в Московском государственном университете путей сообщения (МИИТ), на четвертой международной конференции "Nonlinear Oscillations" ("Euromech02") в августе 2002 г., на конференции по теории управления, посвященной памяти академика Бориса Николаевича Петрова, в Институте проблем управления им. В.А. Трапезникова РАН в марте 2003 г., на четвертой международной конференции "Tools for mathematical modelling" ("MathTools03") в июне 2003 г., на международной конференции "Physics and Control" ("PhysCon03") в августе 2003 г., на научном семинаре "Управление и устойчивость" в Московском государственном институте электроники и математики (МИЭМ), на семинаре Института проблем механики РАН "Теория управления и динамика систем" (руководитель семинара - академик РАН Ф.Л. Черноусько).
Структура и объем диссертации. Диссертационная работа состоит из введения, двух глав, заключения, списка литературы, содержащего 76 наименований. Общий объем работы - 139 машинописных страниц.
Работа выполнена под руководством Александра Сергеевича Братуся, которому автор приносит свою глубокую благодарность.
25.
Сведение исходной задачи к задаче управления бесконечной системой стохастических дифференциальных уравнений первого порядка
Можно сделать следующую замену и далее считать, что функция u (x,t) = 0. Относительно функции ui(x,t) получим уравнение (1.1) с новой функцией /і(ж, і): Решение краевой задачи (1.1) - (1.6), (1.7) или (1.8) с соответствующими условиями Коши (1.5) будем искать среди функций u(x,t) таких, что при каждом фиксированном х являются решением стохастического уравнения (1.1) в смысле Ито [56], а при каждом фиксированном t функция u(x, t) как функция переменной х принадлежит соответствующему энергетическому пространству НА (пространству Соболева), порожденному симметричным положительно-определенным оператором А (1.2) (см., например, [44, 49]). Так в случае стержня (0 х I) норма элемента пространства Нд задается выражением Одним из наиболее эффективных способов решения краевых задач для уравнений в частных производных является метод разделения переменных (метод Фурье, метод собственных функций) [13, 18, 22]. Метод Фурье позволяет произвести декомпозицию исходной задачи и свести задачу синтеза управления уравнением теплопроводности к задаче синтеза управления системой стохастических дифференциальных уравнений первого порядка.
Следует отметить, что метод декомпозиции исходной задачи на несколько более простых задач применялся в работах [45, 46, 59] для синтеза управления динамическими системами, описываемыми уравнениями Лагранжа 2-го рода. В работе [60] был предложен метод построения управления, основанный на декомпозиции системы и применении оптимального по быстродействию управления для каждой моды движения, полученной в результате разложения решения по методу Фурье. Будем искать решение u(x,t) уравнения (1.1) с начальным условием (1.5) и одним из краевых условий (1.6), (1.7) или (1.8) в виде разложения по собственным функциям оператора А. Рассмотрим следующую краевую задачу на собственные числа здесь А - дифференциальный оператор вида (1.2). Предполагается, что на границах х = 0 и х — 1 заданы граничные условия одного из трех видов (1.6), (1.7) или (1.8). Если под решением уравнения (1.15) понимать дважды непрерывно дифференцируемую по переменной х функцию (см. п. 1.1), то для оператора А при заданных краевых условиях имеют место следующие утверждения [18]. 1. Существует счетная система собственных значений краевой задачи (1.15), причем все собственные значения Аг- вещественны и могут быть упорядочены следующим образом: 2. Каждому собственному значению
А; соответствует собственная функ ция фі(х), і — 1,2, Функции фі(х) удовлетворяют условиям нормировки где Sij - символ Кронекера, (, ) обозначает скалярное произведение в пространстве L2. 3. Собственные функции фі(х) образуют полную систему в пространстве НА, т.е. любую функцию f(x), удовлетворяющую условию можно однозначно представить в виде разложения по полной системе собственных функций, т.е. где fi - коэффициенты разложения функции f(x) в ряд Фурье, которые определяются по формуле Система собственных функций оператора Л {ФІ(Х)} образует полную ортонормированную систему на отрезке [0,1] в пространстве НА Ввиду справедливости утверждений 1-3 имеют место следующие представления где w_/(i), Wj(t), fj(t) и т/() - коэффициенты разложения соответствующих функций в ряд Фурье, которые определяются по формуле (1.18). Из постановки задачи (см. п. 1.1), а именно, из условия принадлежности функции u{x,t) пространству НА следует [44], что функцию u(x,t) можно представить в виде ряда Фурье Yl Uj(t)if)j(x). j=i Подставляя функции в виде полученных разложений (1.19) в исходное уравнение (1.1) и умножая скалярно обе части уравнения на функции фі(х), V 2(#), і Фп{х), і получим бесконечную систему стохастических дифференциальных уравнений первого порядка:
В этом случае изменятся и функционалы (1.23), (1.24): следует заменить Uj(t) по формуле (1.25). Замечание. Стохастические процессы. Многие природные природные процессы можно моделировать с помощью систем обыкновенных дифференциальных уравнений, содержащих член Ї/(), представляющий воздействие некоторых возмущений: В том случае, когда возмущения носят непредсказуемый характер, предполагается, что v{t) - некоторый случайный процесс. Будем предполагать, что v{t) является белым шумом (t) единичной интенсивности, умноженным на коэффициент a(x(t),t): u(t) = a(x(t),t)(t). В итоге имеем систему стохастических дифференциальных уравнений dx(t) = a(x(t), t)dt + r(x(t), t)dw(t). (1.28) Здесь w(t) - стандартный винеровский процесс. Уравнение (1.28) эквивалентно следующему тождеству Определение (1.29) решения стохастического уравнения (1.28) должно быть дополнено указанием способа вычисления стохастического интеграла в выражении (1.29), поскольку различные стохастические интегралы определяют разные решения уравнения (1.28). В настоящей работе везде будем понимать под стохастическим интегралом интеграл Ито [25].
Также будем далее рассматривать стохастические уравнения вида (1.28) в смысле Ито. Следует заметить, что часто вместо уравнения (1.28) пишут уравнение Уравнение (1.30), вообще говоря, можно считать эквивалентной записью уравнения (1.28), так как оно получено в результате деления левой и правой частей уравнения на dt. Поясним это утверждение. - - означает производную по времени винеровского процесса w(t). На самом деле производная не существует, так как винеровский процесс w(i) не дифференцируем ни в одной точке [13]. Белый шум () является производной винеровского процесса w(t) в классе обобщенных функций. Вследствие сказанного при изучении управляемых стохастических дифференциальных уравнений будем считать выражения (1.28) и (1.30) эквивалентными записями исследуемых уравнений.
Решение уравнения Гамильтона-Якоби-Беллмана. Задача распределенного управления. Функционал Майера
Из (1.22) следует, что в случае распределенного управления (а — 0, /3 — 1) ограничения на интенсивность управляемого теплового источника определяются следующим образом:
Гкй.Ч ГГП Ж Р исходных ограничений следующая: исходная сфера заменяется на вписанный в нее параллелепипед. Ясно, что при такой замене величина минимизируемого функционала HN(U,T) может лишь увеличиться.
Выбор величин rj отражает известное наблюдение о том, что вклад каждой моды в разложениях (1.17) обратно пропорционален величине собственного значения, что отражено в равенстве (1.40). Величина гу, определяющая возможную величину амплитуды управления WJ(T), обратно пропорциональна величине Л/ЛУ С коэффициентом нормировки
Рассмотрим отдельно задачу для j-ой моды. Требуется найти непрерывно дифференцируемое решение H (UJ,T) уравнения ГЯБ (1.59), удовлетворяющее начальным условиям (1.60) и краевым условиям на границе области Qj (1.58).
На границах области Qi можно задать либо значение функции Беллмана iJJ(wj,r), либо значение ее производной —#" (но не одновременно значения и функции, и производной - в таком случае задача будет некорректно поставленной). Краевые условия будем задавать из найденного в аналитическом виде локального решения задачи (1.59), (1.60) (см. утверждение 1.1). Зададим, например, значения функции HJ(UJ,T) на границах области Q i. Будем решать уравнение ГЯБ во "внутренней"области численно. В этом случае, согласно поставленным краевым условиям, полученное гибридное решение будет непрерывным, однако частные производные функции Беллмана на границах области Q3 могут оказаться разрывными.
Согласно теореме 1.1 [3], функция Беллмана должна быть непрерывно дифференцируемой. Если получено разрывное решение уравнения ГЯБ или решение с разрывными производными, то соответствующее ему управление не обязательно будет оптимальным.
Ясно, что решение поставленной выше краевой задачи может не дать непрерывно дифференцируемого гибридного решения задачи Коши (1.59), (1.60).
Видоизменим краевую задачу следующим образом. Будем расширять область QJ до тех пор, пока на ее границах соответствующие частные производные получаемого гибридного решения не станут непрерывными (если это возможно). Иными словами, в процессе численного решения краевой задачи для уравнения ГЯБ попытаемся осуществить такие изменения границ, при которых производные функции Беллмана на границе совпадут с некоторой наперед заданной точностью. Отметим, что изменение (расширение) области Qi происходит в сторону "внешней"области D , где известно локальное решение уравнения ГЯБ (1.59).
Следует отметить, что согласно [30, 57], решение задачи Коши для квазилинейного уравнения ГЯБ существует и единственно. Отсюда следует единственность полученного численно-аналитического (гибридного) решения. Конечно-разностная схема.
Для решения поставленной задачи во "внутренней"области Qi (1.58) необходимо найти решение квазилинейного параболического неоднородного уравнения ГЯБ (1.59), удовлетворяющее начальному условию (1.60) и краевым условиям (1.55). В процессе решения следует произвести такие изменения границ области, при которых искомая функция и ее первые производные не будут иметь разрыва.
Сначала рассмотрим задачу с фиксированными границами и будем решать уравнение ГЯБ методом сеток в области Qi (1.58). Схема 1. В этой схеме будем использовать следующие конечно-разностные аппроксимации функции Беллмана и ее производных [4, 16, 48, 63]: НІ - значение функции Н(и,т) в точке и = ih, т — кАт где h и Ат -шаги конечно-разностной схемы по переменным и и т соответственно,
В полученном конечноразностном уравнении вне зависимости от номера схемы присутствует слагаемое с модулем. Заметим, что под знаком модуля стоят значения функции на слое с номером к. В процессе численного решения уравнения ГЯБ (1.63), (1.64) или (1.65) будем раскрывать модуль с нужным знаком в зависимости от того, положительно или отрицательно стоящее под модулем выражение, равное производной функции Беллмана по и на предыдущем слое сетки.
Все вышесказанное относилось к постановке задачи с фиксированными границами. Однако, как уже было отмечено, решение задачи с фиксированными границами может быть неклассическим, т.е. оно не даст решение задачи оптимального управления. Опишем теперь задачу с нефиксированными границами.
При такой постановке начальные условия и вид конечно-разностного уравнения ГЯБ остаются прежними. Требуется найти такую границу, на которой будут склеиваться численное решение уравнения (1.63), (1.64) или (1.65) и точное решение (1.55), а также первые производные функции Беллмана.
Сведение исходной задачи к задаче управления бесконечной системой стохастических дифференциальных уравнений первого порядка
Таким образом, исходная задача (2.2) для распределенной системы сводится к задаче построения синтеза оптимального управления бесконечной системой стохастических дифференциальных уравнений (2.17) при ограничениях на распределенное управление (2.18) или на сосредоточенное управление (2.5) с целью минимизации одного из функционалов качества Майера (2.19) или Лагранжа (2.20). Замечание. Как и в главе 1, будем рассматривать стохастическую систему уравнений (2.17) в смысле Ито. Возможности применения методов динамического программирования для построения оптимального управления обсуждались в первой главе, поэтому сразу перейдем к записи уравнения ГЯБ для рассматриваемой колебательной системы. Как и ранее, вместо бесконечной системы (2.17) стохастических дифференциальных уравнений рассмотрим конечную систему, составленную из первых N уравнений. Для функционала Майера здесь HN(u,p,r) - функция Веллмана, равная минимальному значению (а точнее, инфинуму) функционала (2.21) при условии, что в момент времени т — Т — t система находится в состоянии й = (щ,щ,..., гідг), р — (pi,P2i ,РЛГ); т — Т — t - "обратное"время, Ьм(Нм(й,рут)) - линейный дифференциальный оператор, определяемый равенством Начальные условия для функции HN(U,P,T) следующие: Для задачи Лагранжа уравнение Гамильтона-Якоби-Беллмана можно записать в следующем виде: Метод динамического программирования позволяет свести задачу оптимального управления системой дифференциальных уравнений к отысканию решения задачи Коши для нелинейного уравнения в частных производных. Если найдено непрерывно дифференцируемое решение уравнения ГЯБ (2.22) или (2.25) с начальными условиями (2.24) или (2.27) соответственно, то синтез оптимального управления определяется по следующим формулам: ИЛИ для уравнения ГЯБ (2.25), в котором минимум берется по wj(i) гу, для чего проведены все рассуждения, аналогичные рассуждениям главы 1.
В случае распределенного управления будем считать, что коэффициенты разложения u j(t) управляющей функции w{xyt) по собственным функциям il)j(x) удовлетворяют ограничению (2.30). Уравнение ГЯБ для функционала Майера имеет вид (2.22) при а = 0, /3 = 1, начальные условия для функции HN(u,p,r) задаются формулой (2.24). Вычислим минимум в (2.22) и подставим полученное выражение в уравнение ГЯБ, окончательно получим уравнение где LM(HN(U,P,T)) определяется по формуле (2.23). Отметим, что решения всех описанных задач Копій для квазилинейных уравнений ГЯБ, согласно [30, 57], существуют и единственны. Чтобы получить решение этого уравнения рассмотрим, как и ранее, вспомогательную задачу следующего вида: где Н(и,р,т) - искомая функция трех переменных и, р и т, R и X - некоторые действительные числа, а2(т) - заданная функция от т. ,эн Как и ранее, заменим модуль на выражение z-jfr, где Будем искать решение задачи (2.33) в области знакопостоянства функции z в виде функции трех переменных Н(х,у,т), где Здесь а - некоторая постоянная, которую мы будем подбирать для того, чтобы уравнение относительно новых переменных ж, у и t максимально упростилось. удовлетворяет начальному условию (2.38) и является решением уравнения (2.37). Подставим (2.35) в (2.39) учитывая, что а = %, получим выражение для функции Я(и,р,т) вида которая является решением вспомогательной задачи (2.33) в области знако-постоянства функции z (2.34). Найдем эту область. Рассмотрим два случая: 1. 4р 0, тогда z = +1. Из уравнения (2.40) следует, что с увеличением номера j уменьшается. Собственные значения Xj, как было замечено ранее, растут с увеличением номера j, следовательно, величины Tj, удовлетворяющие равенству (1.40), будут убывать пропорционально величине -4=. В таком случае, величины -4= из (2.44) будут обратно пропор циональны соответствующим собственным значениям A,-: - = у— 0 при увеличении j.
В соответствии с предложенным в главе 1 численно-аналитическим методом построения гибридного решения задачи Коши для уравнения ГЯВ, для решения задачи (2.32) - (2.24) во всем пространстве, достроим функцию Беллмана HN(u,p,r) во "внутренней"области, являющейся объединением Формула (2.42) дает локальное решение уравнения ГЯБ в области DN, определенной в (2.43). Отметим, что формула (2.42) справедлива для любых N. Оценка погрешности состоит из двух частей: погрешности, возникающей при учете первых N уравнений системы (2.17), и погрешности решения соответствующей "гибридной"задачи. Для оценки первой погрешности формулы (2.42) во "внешней"области достаточно оценить сумму для достаточно больших М N
Решение уравнения Гамильтона-Якоби-Беллмана. Задача распределенного управления. Функционал Майера
Вычислим минимум в (2.22) и подставим полученное выражение в уравнение ГЯБ, окончательно получим уравнение где LM(HN(U,P,T)) определяется по формуле (2.23). Отметим, что решения всех описанных задач Копій для квазилинейных уравнений ГЯБ, согласно [30, 57], существуют и единственны. Чтобы получить решение этого уравнения рассмотрим, как и ранее, вспомогательную задачу следующего вида: где Н(и,р,т) - искомая функция трех переменных и, р и т, R и X - некоторые действительные числа, а2(т) - заданная функция от т. ,эн Как и ранее, заменим модуль на выражение z-jfr, где Будем искать решение задачи (2.33) в области знакопостоянства функции z в виде функции трех переменных Н(х,у,т), где Здесь а - некоторая постоянная, которую мы будем подбирать для того, чтобы уравнение относительно новых переменных ж, у и t максимально упростилось. удовлетворяет начальному условию (2.38) и является решением уравнения (2.37). Подставим (2.35) в (2.39) учитывая, что а = %, получим выражение для функции Я(и,р,т) вида которая является решением вспомогательной задачи (2.33) в области знако-постоянства функции z (2.34). Найдем эту область. Рассмотрим два случая: 1. 4р 0, тогда z = +1. Из уравнения (2.40) следует, что с увеличением номера j уменьшается. Собственные значения Xj, как было замечено ранее, растут с увеличением номера j, следовательно, величины Tj, удовлетворяющие равенству (1.40), будут убывать пропорционально величине -4=. В таком случае, величины -4= из (2.44) будут обратно пропор циональны соответствующим собственным значениям A,-: - = у— 0 при увеличении j. В соответствии с предложенным в главе 1 численно-аналитическим методом построения гибридного решения задачи Коши для уравнения ГЯВ, для решения задачи (2.32) - (2.24) во всем пространстве, достроим функцию
Беллмана HN(u,p,r) во "внутренней"области, являющейся объединением Формула (2.42) дает локальное решение уравнения ГЯБ в области DN, определенной в (2.43). Отметим, что формула (2.42) справедлива для любых N. Оценка погрешности состоит из двух частей: погрешности, возникающей при учете первых N уравнений системы (2.17), и погрешности решения соответствующей "гибридной"задачи. Для оценки первой погрешности формулы (2.42) во "внешней"области достаточно оценить сумму для достаточно больших В силу сделанных ранее предположений, и Є НА при каждом фиксированном t Є [О, Т], где НА - энергетическое пространство, порожденное положительно-определенным симметрическим оператором А. Следовательно, для любой функции и НА скалярное произведение (Аи, и) будет конечной величиной. Подставляя в это скалярное произведение разложение (2.16) для функции u(x,t) получим, что ряд является сходящимся. Проводя аналогичные рассуждения для функции р(х, t) с учетом (2.14) получим, что сходящимся будет так же следующий ряд: Поэтому для достаточно больших М выражение (2.45) можно сделать сколь угодно малой величиной. На границе "внешней" области функция (2.45) определяет краевые условия для соответствующей функции, которая является решением квазилинейного параболического уравнения в области, дополнительной к области DN ("внутренней" области). Применяя принцип максимума [57] получим, что во "внутренней" области решение не превосходит значений на границе, которые, как показано ранее, могут быть сделаны сколь угодно малыми при достаточно больших N и М N. При условии гладкой склейки функции Беллмана и ее соответствующих производных на границе расширенной "внутренней" области погрешность, возникающая при решении гибридной задачи полностью определяется точностью используемых численных (разностных) методов. Аналогичные рассуждения применимы и в случае управлений с помощью актуаторов, а также в случае функционала Лагранжа. Из утверждения 2.1 следует, что решение уравнения ГЯБ во "внеш-ней"области устроено аддитивным образом и его можно представить в виде суммы N функций W(UJ, pj, г), определяемых формулой (2.42)
Будем исходить из предположения, что во "внутренней"области где области Qi задаются неравенствами (2.44), решение задачи Коши (2.32) - (2.24) также можно представить в виде суммы N решений j-ой задачи следующего вида Поставим краевую задачу отыскания решения H (UJ,PJ,T) уравнения (2.46) в области Q (2.44), удовлетворяющего начальным условиям (2.47) и заданным граничным условиям. "Внутренняя"область QJ представляет собой неограниченную полосу в пространстве (UJ,PJ,T) в каждый момент времени г (см. рис. 2.1). Легко видеть, что уравнение (2.46) является параболическим относительно переменных г и pj (для этого достаточно положить Uj = const). Известно, что для параболического уравнения на границах можно задавать либо значения функции, либо значения производной, либо их комбинацию, что соответствует краевым условиям 1, 2 или 3-го рода, которые были подробно описаны в главе 1.
В качестве краевых условий на границе pj = ±-д= = ± 2 области QJ (см. рис. 2.2) зададим значения функции HJ(UJ,PJ,T) из найденного в аналитическом виде локального решения (2.42) уравнения ГЯБ. Как видно из рис. 2.1, область, в которой следует искать решение уравнения ГЯБ численно, не ограничена слева и справа. Будем рассматривать ограниченную область, для чего введем границы слева и справа: Uj = —d\ и Uj = -\-d\. Чтобы решать задачу численно в построенной области, следует задать краевые условия при Uj — ±di (см. рис. 2.2). Исследуем уравнение (2.46) относительно переменных г и uj, для чего положим pj = const = Сі; получим дифференциальное уравнение с частными производными первого порядка следующего вида: уравнение характеристики для этого уравнения записывается так Учитывая, что с\ =Pj, получим окончательно