Содержание к диссертации
Введение
1 Постановка задачи 23
1.1. Системы с запаздыванием по управлению 23
1.2. Синтез управления с обратной связью 24
1.3. Стабилизирующее управление с обратной связью 28
1.4. Обобщенный квадратичный критерий качества 29
1.5. Вид обобщённых уравнений Риккати 32
2 Обобщённые уравнения Риккати 33
2.1. Вывод обобщённых уравнений Риккати 33
2.2. Явные решения ОУР 46
2.2.1. Вариант 1 47
2.2.2. Вариант 2 52
2.2.3. Вариант 3 - специальное (стационарное) решение . 56
3 Построение и анализ регулятора 60
3.1. Явный вид управления с обратной связью 61
3.2. Достаточные условия стабилизируемое 64
3.3. Алгоритм проверки устойчивости линейных систем с последействием 65
3.4. Решение матричных уравнений 70
3.4.1. Алгебраическое уравнение Риккати 70
3.4.2. Экспоненциальные матричные уравнения 70
4 Примеры 72
4.1. Пример 1 (1-мерная система) 72
4.2. Пример 2 (1-мерная, система) 74
4.3. Пример 3 (2-мсрная система) 76
4.4. Пример 4 (Управление регулятором гирорамы с запаздыванием) 79
5 Пакет прикладных программ S3
5.1. Программное обеспечение для пакета Matlab 83
5.2. Использование MATLAB в приложениях пользователя . 84
5.3. Интеграция пакета программ в Интернет 85
Литература 105
- Синтез управления с обратной связью
- Вид обобщённых уравнений Риккати
- Программное обеспечение для пакета Matlab
- Интеграция пакета программ в Интернет
Введение к работе
Диссертация посвящена разработке конструктивных методов аналитического конструирования регуляторов для систем с последействием.
Многие свойства реальных объектов определяются эффектом последействия, состоящего в том, что дальнейшее состояние объекта зависит не только от настоящего, но и от прошлого, т.е. от его предыстории. Моделировать такие процессы позволяют функционально-дифференциальные уравнения (ФДУ), называемые также уравнениями с запаздыванием или уравнениями с последействием.
Возникновение подобных систем, связанных с эффектом последействия, потребовало развития соответствующей теории, которая активно развивалась такими математиками как Н.В. Азбелев, Г.А. Каменский, В.Б. Колмановский. Н.Н. Красовский, А.В. Кряжимский, А.Б. Куржап-ский, Г.И. Марчук, А.Д. Мышкис, В.Р. Носов, СБ. Норкин, Ю.С. Осипов, Л.С. Понтрягин, С.Н. Шиманов, Л.Э. Эльсгольц, С.Н.Т. Baker, Н.Т. Banks, R. Bellman, K.L. Cooke, R.D. Driver. J.K. Hale, V. Lakshmikantam. V. Volterra и многими другими.
Полученные в этой области фундаментальные результаты сформировали качественную теорию дифференциальных уравнений с запаздыванием. Вместе с тем, полное решение различных задач для подобных систем, в том числе задач управления и стабилизации, аналитическими методами удается получить лишь в исключительных случаях. Поэтому
проблема создания эффективных численных методов решения задай и разработка их программной реализации современными вычислительными средствами является особенно актуальной.
Для конечномерных систем л и ней н о- квадратичная теория (получившая название аналитического конструирования регуляторов - АКОР), разработанная А.М.Летовым и Р.Калманом в начале 60-х годов, благодаря ясной постановке и конструктивным результатам играет особую роль среди различных подходов к синтезу управлений. Вычисление коэффициентов матрицы усиления (стабилизирующего) управления па основе теории АКОР сводится к решению алгебраического уравнения Риккагпи (АУР), причем соответствующее управление, если оно существует, стабилизирует систему.
Для конечномерных систем линейно-квадратичная теория (получившая название аналитического конструирования регуляторов), разработанная А.М.Летовым и Р.Калманом в начале 60-х годов, благодаря ясной постановке и конструктивным результатам играет особую роль среди различных подходов к синтезу управлений. Вычисление коэффициентов матрицы усиления (стабилизирующего) управления на основе теории АКОР сводится к решению алгебраического уравнения Риккатн (АУР), причем соответствующее управление, если оно существует, стабилизирует систему.
Исследование задач АКОР для систем с последействием инициировано статьей Н.Н. Красовского [17], в которой было показано, что оптимальное стабилизирующее управление является линейным непрерывным функционалом на функциональном (фазовом) пространстве системы с последействием, а также были выведены соотношения, описывающие параметры оптимального управления и оптимального значения фупкцио-
нала качества.
Основой построения общей теории АКОР для систем с последействием, также как и общей теории функционально-дифференциальных уравнений (ФДУ), является предложенная Н.Н.Красовским [16,17] функциональная, трактовка решений таких систем.
К настоящему времени теоретические аспекты АКОР для систем с последействием разработаны с достаточной полнотой, (см., например, [13,17.21-25,29-32,35,38] и ссылки в них) однако, в силу бесконечномерной природы систем с последействием, практическое применение теории наталкивается на ряд принципиальных трудностей. Поэтому разработка конструктивних алгоритмов АКОР для систем с последействием постоянно находится в центре внимания математиков и инженеров.
Одной из основных трудностей, сдерживающих практическое использование АКОР в задачах синтеза управления для систем с последействием, является необходимость решения специальной системы обобщенных уравнений Риккати (ОУР), описывающей коэффициенты оптимального управления и представляющей собой систему алгебраических уравнений, обыкновенных дифференциальных уравнений и дифференциальных уравнений с частными производными.
Поэтому уже в первых работах, где были получены ОУР [34,35], проблема АКОР для систем с последействием была сформулирована в виде двух задач:
Задача А : нахождение явных решений ОУР;
Задача В : разработка методов исследования стабилизирующих свойств управлений, соответствующих явным решениям ОУР.
Отметим, что для систем с последействием, в отлично от конечномерных систем, линейное управление с обратной связью, построенное
на основе решения ОУР, не всегда является стабилизирующим. Поэтому выделение исследования устойчивости в отдельную Задачу В представляется естественным.
В данной работе разрабатываются методы исследования и решения Задачи А и Задачи В.
Явные реиіеиия ОУР (Задача А). Предложенные в [13,22.34-36] приближенные методы решения ОУР являются сложными и неэффективными для практической реализации, поэтому в настоящее время задача нахождения явных решений ОУР имеет принципиальный характер.
Разработанные в данной диссертации методы построения явных решений ОУР основываются на идее введения дополнительных слагаемых в функционал качества.
Модификация функционала качества в теории АКОР для конечномерных систем была предложена в работе А.А.Красовского [14]. Введение дополнительного квадратичного слагаемого в функционал качества позволило упростить матричные уравнения, описывающие коэффициенты оптимального стабилизирующего управления (В рамках такого подхода оптимальное стабилизирующее управление определяется матрицей усиления являющейся решением нс АУР, а более простого уравнения Ляпунова). Соответствующая процедура называется аналитическим конструированием по критерию обобщенной работы, так как добавочное слагаемое в функционале качества может быть интерпретировано как "энергия" (обобщенная работа) оптимального управления.
Обобщение данного подхода на системы с последействием было реализовано в работах [11,32] и других авторов.
Отметим, что в рамках разрабатываемого подхода обобщенный квад-
ратичный функционал качества не может быть произвольно заданным, а определяется в соответствии с некоторыми правилами и имеет специальную структуру. Однако наличие подобного рода ограничений на функционал качества можно считать естественным, так как в задачах стабилизации, как правило, критерий качества не связан с физической природой объекта управления, а его структура и параметры определяются исходя из инженерных требований (простоты вычислений, времени переходного процесса и т.д.). В пашем случае таким требованием является нахождение решений ОУР в явной форме.
Проверка стабилизирующих свойств управлений (Задача В). Ввиду бесконечномерности фазового пространстка- линейных систем с последействием, исследование стабилизирующих свойств синтеза управлений существенно сложнее, чем в случае конечномерных систем.
В теории АКОР для систем с последействием исследование стабилизирующих свойств синтеза управления может быть проведено на основе использования функционалов Ляпунова- Красовского или на основе анализа фундаментальной матрицы системы.
Цель диссертации состоит в разработке конструктивных аналитических и численных методов синтеза стабилизирующих управлений для систем с последействием в управлении на основе минимизации обобщенных квадратичных функционалов качества.
Методика исследования основана па функциональном подходе в качественной теории функционально-дифференциальных уравнений. Систематически применяются понятия и методы функционального анализа, теории устойчивости и управления, и численные методы.
Научная новизна. Разработаны новые конструктивные алгоритмы анализа и синтеза управлений для систем с последействием в управляю-
іцих параметрах на основе решения линейно-квадратичных задач управления.
Теоретическая и практическая ценность. Развитые в диссертации методы позволяют строить и анализировать синтез управления для систем с последействием. Разработанные методы и алгоритмы реализованы в пакете прикладных программ Time-dday System Toolbox в системе MATLAB [37].
Основные результаты
в задаче управления для линейных систем с запаздыванием по управлению с модифицированным квадратичным критерием качества получена система обобщенных уравнений Риккати (ОУР);
получены варианты явных решений ОУР, позволяющие свести задачу к численному решению нелинейного матричного уравнения и затем получить управление в явном виде;
получены необходимые и достаточные условия стабилизируемое линейных систем с запаздыванием по управлению с помощью сведения к задаче стабилизации линейной системы с последействием в координатах и анализа фундаментальной матрицы этой системы:
разработана методика численного моделирования линейных дифференциальных уравнений с запаздыванием по управлению и решения соответствующих экспоненциальных матричных уравнений;
разработанные алгоритмы численного моделирования реализованы в виде комплекса программ для системы Matlab. Реализован интерфейс для использования комплекса программ в сети интернет ().
Структура и объем работы. Диссертация состоит из введения, 5 глав и списка литературы. Главы разбиты на параграфы, нумерация
глав и параграфов в работе сквозная. Нумерация формул и утверждений двойная: первый индекс -- номер параграфа, второй индекс — порядковый номер формулы внутри параграфа. Общий объем работы составляет 109 страниц, библиография содержит 40 наименований.
Апробация работы. Результаты диссертации докладывались и обсуждались на
— Региональной молодежной конференции «Проблемы теоретической
и прикладной математики» (Екатеринбург, 2002-2003);
- конференции «Алгоритмический анализ неустойчивых задач» (Екатеринбург, 2004); -- Russian-Korean workshop on Telecommunications (Екатеринбург, 2005);
— конференции «Теория управления и математическое моделирова
ние» (Ижевск, 2006);
научных семинарах в Институте математики и механики УрО РАН
и Уральском государственном университете.
Публикации. Основные результаты диссертации опубликованы в работах |2-5,7,8,27,28]. Результаты, вошедшие в диссертацию, получены автором самостоятельно.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы исследований, сформулирована цель диссертационной работы и пути её достижения, отмечена новизна и практическое значение работы.
В первой главе дается введение в проблему АКОР для систем с запаздыванием в управлении.
Основным объектом исследования является система с последействием
x(t) = Ax{t) + Bu(t) + BAu(t - Д) + / G{v)u{t + v)dv , (1)
-Д
где А., В, BA - постоянные матрицы размерностей пхп/пхг:пхг, соответственно; G(-) - матрица размерности п X г с кусочно-непрерывными на [—Д,0) коэффициентами, х Є .Rri - фазовый вектор, и Є R'' - управляющее воздействие (управление). Состоянием системы является пара {x,w(-)} Є RnxQ[—Д, 0). где Q[—Д, 0) - пространство кусочно-іюпрерьі-вных на [—Д, 0) r-мсрных функций,
w(-) = w{s), -А < s < 0 = щ(-) = u(t + 5), - Д < s < 0.
Стабилизирующее управление с обратной связью ищется в классе линейных отображений
о
и(х, w(-)) = Ex + J L{v)w(v)dv , (2)
-д
где Е - постоянная г х п матрица, Ь(-) - матрица размерности г х г с кусочно-непрерывными на [—Д, 0] коэффициентами.
В разделе 1.2 формализуются понятия замкнутой системы,
о x(t) = Ax{t) 4- Bu{t) + BAu(t - Д) + / <ЭДи(* + v)di/ ,
(3)
u(t) = ж() + / (v)u(* + i/)di/ ,
-д
замкнутой системы в дифференциальной форме.
о x{t) = Ax{t) + Bu(t) +- BAu(t - A) + / G(u)u(t + v)dv ,
-д
u{t) = EAx(t) + [EB + i(0)]u(i) + [EBA - L{-A)]u(t - Д)+ (4)
/
-Д
SG(^ dL{v
(t + v)dv .
Устанавливается эквивалентность этих систем.
Теорема 1. Пусть заданы система (1) и линейный синтез управления (2), причем элементы матрицы Ь(-) непрерывны и имеют кусочно-непрерьшныо производные. Для любої'О начального условия {x,w(-)} существует единственный допустимый процесс {#(), и(-)}, удовлетворяющий:
системе (3) при і > О,
начальному условию
x(ta) = ж0,
u(t0 + v)= w(v), -Д < у < О,
и условию
u{0) = ExQ+ f L{v)w\v)dv .
-д
При этом функция и{-) является непрерывной и кусочно-дифференцируемой при t > 0 и, следовательно, удовлетворяет системе (4).
В разделе 1.3 вводится понятие стабилизирующего управления с обратной связью и показывается, что рассматриваемая в диссертации задача может быть сформулирована следующим образом
Задача С. Для заданной системы (1) найти управление (2), при котором замкнутая система (3) является асимптотически устойчивой.
В разделе 1.4. для получения соотношений, описывающих параметры одного из возможных стабилизирующих управлений вида (2), на управление накладывается дополнительное требование минимизации обобщенного квадратичного функционала качества
7=
о * -д
о о
+ / u'(t + s)V2{s,v)u{t + v)dsdv+ (5)
-Д-Л
о -,
+ / u'{t + s)*3(s)u(i + s)ds + u'{t - Д)Ф4«(* - A) \dt
на траекториях замкнутой системы. Здесь Фо ~ постоянная п х п матрица, Фі(-) - матрица размерности п х г с кусочно-непрерывными на [—А, 0] коэффициентами, 2(-, ) матрица размерности г х г е кусочно-непрерывными на [—Д,0] х [—Д,0] коэффициентами. Фз(-) ~ матрица размерности г х г с кусочно-непрерывными на [—Д, 0] коэффициентами. М, Ф4 ~ постоянные симметричные положительно определённые Г X г матрицы.
Весовым функционалом состояния в (5) является квадратичный функционал
-д
0 0 0 ,„,
+ / / гу'(8)Ф2(з, v)w(i/)dsdv + / u/(s^3(s)iu(s)ds+
-Д-Д _д
+ ш'(-Д)Ф4ш(-Д), 13
определенный на пространстве Н = Rn х Q[—A, 0),
Отметим, что в большинстве работ рассматривается квадратичный критерий качества
Ъ= [ {х'{і)%х{і) + u'{t)Mu{t)} dt, (7)
о однако, принимая во внимание определенный произвол в выборе матриц Фо, Фі(')> Фг(т)' Фз(-)? ^4 задача (1), (5) имеет больше "степеней свободы".
Коэффициенты Фо, ^ функционала качества (5) можно выбирать с определённым произволом, так как основная задача состоит в построении стабилизирующего управления.
В разделе 1.5. приводится система обобщенных уравнений Риккати (ОУР), на основе которой будет исследовать задача АКОР.
Во второй главе приводится вывод системы ОУР, а также рассматривается три варианта выбора весовых коэффициентов таким образом, что система. ОУР упрощается и решение можно выписать в явном виде.
Целью раздела 2.1 является вывод обобщённых уравнений Риккати (необходимых условия оптимальности), которым, в случае разрешимости задачи оптимальной стабилизации, удовлетворяют коэффициенты оптимального регулятора и обобщённого квадратичного функционала качества. Оптимальное значение (функционал Беллмана) для задачи (1), (5) в точке {x,w(-)} Є Я обозначается ТУ[ж,ги(-)].
Теорема 2. Пусть:
существует решение задачи (1), (5),
оптимальное значение функционала качества (5) имеет вид
W[x,w(-)] = x'Px + 2x' / D(s)w{s)ds+
-A
о и о
-h / / w'(s)R(s,v)w(v)dsdv + / w'(s)U(s)w{s)ds
-A -A -A
причем
a) P - симметричная n X n матрица,
коэффициенты nxr матрицы D(-) и rxr матрицы П(-) непрерывны и кусочно-дифференцируемы на [—Д,0],
коэффициенты гхг матрицы R(-, ) и её производных Щ и ^ непрерывны всюду на [—Д, 0] х [—Д, 0], исключая линию s = v.
для матрицы R(-, ) выполняется условие
R'(v,s) = R{s,v), {Slu) Є [-Д,0] X [-Д,0].
Тогда матрицы Р, D(-), #(,)> П(-) являются решением системы обобщённых уравнений Риккати (ОУР)
РА + А'Р + Фг
Р'В + D(0)1 [П(0) + М]_1 \в'Р + #(0)1 = 0, (Ї
-і
-MD{s)-4!l{s)-P'G{s
Р'Р + Р>(0) [11(0) +M] B'D{s) + R(0,s
= 0,
(9)
+
5P^) + ^)_ #(s)B + R{s, 0)1 [П(0) + Ml-1 B'>(s) + й(0, s
= 0.
(10)
^7
- ФзМ = 0,
(11)
с граничными условиями
D'(S)SA = i?,(S]-A), Ф4 = П(-Д).
(12)
(13) (14)
и условиями симметричности
P' = P,#(ks) = j?(s^)
(15)
В разделе 2.2 приводится первый вариант выбора матриц Фі(-), ФгО, )> позволяющий свести задачу к численному решению нелинейного матричного уравнения и затем: получить управление в явном виде.
Теорема 3. Пусть симметричная пхп матрица Р является решением экспоненциального матричного уравнен ия
?' туЛА
PA + AfP + %- PfB + eAAP!BA К В'Р + ВАРе^А = 0, (16)
К =
+ М
-і
матрицы D(s), n(s) и J2(s, v) имеют вид:
R{s,v)
D(s) = eA'^P>BA,
П(й) = / ФзМ^+Ф4
-д
Q{s)D(v) для (5,//) Є Оь 5'(s)Q'M дпя(в,і/)єП2,
(17) (18)
(19)
Пі = {(s, і/) Є [-Д, 0] х [-Д, 0] : 5 - v < 0}, П2 = {(s, и) Є [-Д, 0] X [-Д, 0] : s - v > 0}
QW = B^~A'(e+A). Если в функционале качества (5) весовые матрицы выбраны Фо,Фз(-)>^4 выбраны произвольным образом, а матрицы Фі(-),Ф2(-, ) - в виде
Фі(в) - [Р'В + 5(0)] Я [B'5(s) + Д(0, s)] - PG{s), (20)
*2(s, v) = [S'(5)B + (s, 0)] X [B'.D(s) + Й(0, з)] - 25#(e)G(s), (21)
тогда матрицы P, -D(s) и R{s,v) являются решениями соответствующей системы ОУР (8)-(15).
В разделе 2.3 приводится второй вариант выбора матриц Фі(-), Ф2(-> Теорема 4. Пусть симметричная п х п матрица Рипхг матрица D(0) являются решением системы матричных уравнений
Я(0) - е-[Р'чд(ож-А']Др/Вд = 0
РА + А'Р + Фп -
P'B + D
В'Р + '
-:0
(22) (23)
if =
-і
Фз(я)Й5 + Ф4 + М ., матрицы D(s), Щз) и R(s,u) имеют вид:
-Л
5(s) = е~[Р'-0А'В'+5(о)л--Л'](.,+Д)рВд ^
5'
fi(s) = / ФзМ^У-(-Ф4
~д
(24) (25
Д(.9, Z/) =
Q(s)Z>H для (s,u) Gfil, 5'(s)Q'M для {s,u) Є fi2)
(26)
Oi - {(s, і/) Є [-А, 0] X [-Д, 0] : s - v < 0}, Q2 = {(s, j/) e [-Д, 0] X [-Д, 0] : s - v > 0}
Q{s) = b'J?'bkb'+d^k-a'^+^ ,
Если в функционале качества (5) весовые матрицы выбраны Фо; Фз(-)> ^4 выбраны произвольным образом, а матрицы Фі(-), ^(S ) " в виде
Фі(з) - P'BKB'R{{),s) + 5(0)іЩ0,а) - Р'ОД, (27)
Ф2(з, і/) = P'(s) + -R(s, 0)]K[B'D(s) + P(0, s)] - 2D'(s)G(s). (28)
тогда матрицы P, D(s) и P(s, їу) являются решениями соответствуюіцей системы ОУР (8)-(15).
В разделе 2.4 приводится специальный (стационарный) вариант выбора матриц Фі(-); 2(-, )-
Теорема 5. Пусть симметричная пхп матрица Р является решением экспоненциального матричного уравнения
РА + А'Р + Фг
Р'В + Р'ВА
В'Р + В!АР
= 0,
(29)
К =
і -і
Фз(з)<І5 + Ф4-|-М , матрицы D{s), TI(.s) и R{s,v) имеют вид:
-д
D(s) = Р'ВА,
П(в)= [y3(v)dv + %
(ЗО) (31)
-Д
R(s,v) = B'APBA. (32)
Если в функционале качества (5) весовые матрицы выбраны Фо, Фз(-)> ^;4 выбраны произвольным образом, а матрицы Фі(-), ФэО, ) ~ в виДе
ФЦ5) = [Р'В + -D(O)] AT [B'5(s) + Л(0, s)} - P'G(s) - A'/3(s), (33)
*2(s, v) = [D'{s)B + R{s, 0)] К [B'D{s) + Д(0, s)} - 2D'(a)G(s), (34)
тогда матрицы P> -D(s) и R(s, v) являются решениями соответствую гцей системы ОУР (8)-(15).
Третья глава посвящена построению и анализу свойств регулятора.
Приводится управление с обратной связью, полученное в ходе вывода системы ОУР. Это управление отвечает необходимым условиям оптимальности:
i*{xtw{-)) = - П(0) + М
U і
В'\Рх+ D(s)w(s)ds | +
-А ' (35
+'(0)ж + / R(0,v)w[v)dv
-д
Для построения управления с обратной связью необходимо; согласно разработанному подходу
вычислить матрицу Р. являющуюся решением соответствующего матричного уравнения;
вычислить матрицы D(s) и R{s,v) подстановкой Р в соответствующую формулу, вычислить матрицу П(0);
3) построить управление с обратной связью, подставив в формулу (35
атрицы Р, D(s), R{s, v) и П(0);
Следующей задачей, после нахождения явного вида регулятора, является задача исследования его стабилизирующих свойств.
В разделе 3.1 приводится полный вид управлений с обратной связью и замкнутых систем, соответствующих рассмотренным вариантам явных решений ОУР.
В разделе 3.2 получены достаточные условии стабилизируемое
Теорема 6. Пусть матрицы Р, D(s), R(s, v), U(s) являются решением системы (8) - (15);
Если
весовой квадратичный функционал (6) является положительно определенным на Я = Rn х Q[—Л, 0).
квадратичный функционал
W[x,w(-)]=x'Px + 2x' / D(s)w'(s)ds+
-А
0 0 0
+ / / w'(s)R(s,v)w(v)dsdv+ / w'(s)Il(s)w(s)ds
-Д-А -Д
является полооїсительно определенным па Я = Rn х Q[—Д,0),
тогда система (1) стабилизируема и управление с обратной связью
п-1
u*(x}w(-)) = - П(0) + М
В'ІРх+ / D(s)w(s)ds
-д
(36)
+^'(0)ж+ / R{0,v)w(v)dv
-д
является решением ЛКЗУ (1), (5) в классе стабилизирующих управлений, а минимальное значение функционала качества J, соответствующее начальной позиции {ж,ш(-}}, имеет вид (36).
В разделе 3.3 получены необходимые и достаточные условия стабили-зируемости линейных систем с запаздыванием, ио управлению с помощью сведения к задаче стабилизации линейной системы с последействием в координатах и анализа фундаментальной матрицы этой системы.
Систему (4) можно рассматривать как систему с запаздыванием по
состоянию относительно переменной у = [х^иу.
-А
о
у = Лї/ + Бдї/(-Д)+ / G{s)ds (37)
А В \ ,. /О Вд
А - I Ь Яд =
А ЕВ + Щ)! і О ЕВ-Ь(-А)
О (?(s
(is Фундаментальной матрицей системы (37) называется матрица, F[t\
размерности n-\-r х п + г, которая является решением матричного уравнения с запаздыванием
о <^ = AF[t] + BAF[t-A]+ f G{s)F[t + s]ds, t >0 , (38)
-д с начальными условиями
F[0] = I,
(39) F[t] = 0 при t < 0.
Теорема 7. Система (37) асимптотически устойчива тогда и только тогда, когда существует число Т > 0, такое, что
( maxJ|F[T + s]||J І1 + Д||д|| + і f \\G{v)\\dvds\ < 1. (40)
Практическая реализация алгоритмов проверки устойчивости на основе данной теоремы может быть осуществлена на основе численного моделирования фундаментальной матрицы системы, например, с использованием программы chwkstab из.Time-Delay System Toolbox [37]. Алго-
ритм checkstab основан на проверке указанных выше свойств фундаментальной матрицы системы, а также работах [10,26]. При этом, в ряде случаев, удобно переформулировать теорему следующим образом.
Теорема 8. Система (37) асимптотически устойчива тогда и только тогда, когда существует натуральное число к > 1, такое, что
( max \\F[kA±s}\\\ |і + Д||Бд]| + f S \\G{v)\\dvds\ < 1. (41)
Отметим, что параметры управления находятся на основе необходимых условий оптимальности. Поэтому, вообще говоря, найденные управления, даже если они стабилизируют систему, могут не быть оптимальными.
Четвертая глава содержит ряд примеров, иллюстрирующих результаты проведенных исследований.
Пятая глава описывает программную реализацию разработанных алгоритмов численного моделирования для системы Matlab. В этой же главе описывается интерфейс для использования комплекса программ в сети интернет ().
Синтез управления с обратной связью
Возникновение подобных систем, связанных с эффектом последействия, потребовало развития соответствующей теории, которая активно развивалась такими математиками как Н.В. Азбелев, Г.А. Каменский, В.Б. Колмановский. Н.Н. Красовский, А.В. Кряжимский, А.Б. Куржап-ский, Г.И. Марчук, А.Д. Мышкис, В.Р. Носов, СБ. Норкин, Ю.С. Осипов, Л.С. Понтрягин, С.Н. Шиманов, Л.Э. Эльсгольц, С.Н.Т. Baker, Н.Т. Banks, R. Bellman, K.L. Cooke, R.D. Driver. J.K. Hale, V. Lakshmikantam. V. Volterra и многими другими.
Полученные в этой области фундаментальные результаты сформировали качественную теорию дифференциальных уравнений с запаздыванием. Вместе с тем, полное решение различных задач для подобных систем, в том числе задач управления и стабилизации, аналитическими методами удается получить лишь в исключительных случаях. Поэтому проблема создания эффективных численных методов решения задай и разработка их программной реализации современными вычислительными средствами является особенно актуальной.
Для конечномерных систем л и ней н о- квадратичная теория (получившая название аналитического конструирования регуляторов - АКОР), разработанная А.М.Летовым и Р.Калманом в начале 60-х годов, благодаря ясной постановке и конструктивным результатам играет особую роль среди различных подходов к синтезу управлений. Вычисление коэффициентов матрицы усиления (стабилизирующего) управления па основе теории АКОР сводится к решению алгебраического уравнения Риккагпи (АУР), причем соответствующее управление, если оно существует, стабилизирует систему.
Для конечномерных систем линейно-квадратичная теория (получившая название аналитического конструирования регуляторов), разработанная А.М.Летовым и Р.Калманом в начале 60-х годов, благодаря ясной постановке и конструктивным результатам играет особую роль среди различных подходов к синтезу управлений. Вычисление коэффициентов матрицы усиления (стабилизирующего) управления на основе теории АКОР сводится к решению алгебраического уравнения Риккатн (АУР), причем соответствующее управление, если оно существует, стабилизирует систему.
Исследование задач АКОР для систем с последействием инициировано статьей Н.Н. Красовского [17], в которой было показано, что оптимальное стабилизирующее управление является линейным непрерывным функционалом на функциональном (фазовом) пространстве системы с последействием, а также были выведены соотношения, описывающие параметры оптимального управления и оптимального значения фупкцио нала качества.
Основой построения общей теории АКОР для систем с последействием, также как и общей теории функционально-дифференциальных уравнений (ФДУ), является предложенная Н.Н.Красовским [16,17] функциональная, трактовка решений таких систем.
К настоящему времени теоретические аспекты АКОР для систем с последействием разработаны с достаточной полнотой, (см., например, [13,17.21-25,29-32,35,38] и ссылки в них) однако, в силу бесконечномерной природы систем с последействием, практическое применение теории наталкивается на ряд принципиальных трудностей. Поэтому разработка конструктивних алгоритмов АКОР для систем с последействием постоянно находится в центре внимания математиков и инженеров.
Одной из основных трудностей, сдерживающих практическое использование АКОР в задачах синтеза управления для систем с последействием, является необходимость решения специальной системы обобщенных уравнений Риккати (ОУР), описывающей коэффициенты оптимального управления и представляющей собой систему алгебраических уравнений, обыкновенных дифференциальных уравнений и дифференциальных уравнений с частными производными.
Вид обобщённых уравнений Риккати
Модификация функционала качества в теории АКОР для конечномерных систем была предложена в работе А.А.Красовского [14]. Введение дополнительного квадратичного слагаемого в функционал качества позволило упростить матричные уравнения, описывающие коэффициенты оптимального стабилизирующего управления (В рамках такого подхода оптимальное стабилизирующее управление определяется матрицей усиления являющейся решением нс АУР, а более простого уравнения Ляпунова). Соответствующая процедура называется аналитическим конструированием по критерию обобщенной работы, так как добавочное слагаемое в функционале качества может быть интерпретировано как "энергия" (обобщенная работа) оптимального управления.
Обобщение данного подхода на системы с последействием было реализовано в работах [11,32] и других авторов.
Отметим, что в рамках разрабатываемого подхода обобщенный квадратичный функционал качества не может быть произвольно заданным, а определяется в соответствии с некоторыми правилами и имеет специальную структуру. Однако наличие подобного рода ограничений на функционал качества можно считать естественным, так как в задачах стабилизации, как правило, критерий качества не связан с физической природой объекта управления, а его структура и параметры определяются исходя из инженерных требований (простоты вычислений, времени переходного процесса и т.д.). В пашем случае таким требованием является нахождение решений ОУР в явной форме.
Проверка стабилизирующих свойств управлений (Задача В). Ввиду бесконечномерности фазового пространстка- линейных систем с последействием, исследование стабилизирующих свойств синтеза управлений существенно сложнее, чем в случае конечномерных систем.
В теории АКОР для систем с последействием исследование стабилизирующих свойств синтеза управления может быть проведено на основе использования функционалов Ляпунова- Красовского или на основе анализа фундаментальной матрицы системы.
Методика исследования основана па функциональном подходе в качественной теории функционально-дифференциальных уравнений. Систематически применяются понятия и методы функционального анализа, теории устойчивости и управления, и численные методы.
Научная новизна. Разработаны новые конструктивные алгоритмы анализа и синтеза управлений для систем с последействием в управляю іцих параметрах на основе решения линейно-квадратичных задач управления.
Теоретическая и практическая ценность. Развитые в диссертации методы позволяют строить и анализировать синтез управления для систем с последействием. Разработанные методы и алгоритмы реализованы в пакете прикладных программ Time-dday System Toolbox в системе MATLAB [37].
1) в задаче управления для линейных систем с запаздыванием по управлению с модифицированным квадратичным критерием качества получена система обобщенных уравнений Риккати (ОУР);
2) получены варианты явных решений ОУР, позволяющие свести задачу к численному решению нелинейного матричного уравнения и затем получить управление в явном виде;
3) получены необходимые и достаточные условия стабилизируемое линейных систем с запаздыванием по управлению с помощью сведения к задаче стабилизации линейной системы с последействием в координатах и анализа фундаментальной матрицы этой системы:
4) разработана методика численного моделирования линейных дифференциальных уравнений с запаздыванием по управлению и решения соответствующих экспоненциальных матричных уравнений;
5) разработанные алгоритмы численного моделирования реализованы в виде комплекса программ для системы Matlab. Реализован интерфейс для использования комплекса программ в сети интернет (http://matlab.fde.nran.ru).
Структура и объем работы. Диссертация состоит из введения, 5 глав и списка литературы. Главы разбиты на параграфы, нумерация глав и параграфов в работе сквозная. Нумерация формул и утверждений двойная: первый индекс -- номер параграфа, второй индекс — порядковый номер формулы внутри параграфа. Общий объем работы составляет 109 страниц, библиография содержит 40 наименований.
Программное обеспечение для пакета Matlab
На основе разработанного метода создано программное обеспечение для системы Matlab: medel, mede3 - решение матричных уравнений (2.27), (2.67) emed2 - решение экспоненциально-матричного уравнения (2.48), clcsol ... Clcso3 - построение управления (3.1) и решение замкнутой системы (1.5) для трёх вариантов явных решений оур, intlc - численное интегрирование, Clcsim - реп ген ие замкнутой системы функционально-дифференциальных уравнений с запаздыванием в управлении (1.5) (с произвольно заданными параметрами управления с обратной связью), checkstabc - проверка асимптотической устойчивости замкнутой системы (1.5) Замкнутая система (1.5) рассматривается и моделируется как система с запаздыванием по состоянию относительно переменной у = (ж, и): У = ау + вау(-а) + g(s)ds (5.1) J-a , а в \ , /о зд А=\ , зд = а ев + щ \0 ев-ц-а) О g(s
На основании введенных пользователем матриц А, В, Бд, G (-) и сконструированных по результатам работы алгоритма главы 3 матриц Е, строится указанная выше замкнутая система, которая затем численно моделируется методом Рунге-Кутты 4(5) порядка с автоматическим выбором шага и интерполяцией вырожденными кубическими сплайнами.
Отметим, что вид матрицы L(s) при построении управления (3.1) для трёх, вариантов явных решений ОУР известен заранее, поэтому матри dL(s) е цу —++ можно записать в алгоритме тоже в явном виде, не прибегая к численному дифференцированию. Алгоритм checkstabc основан на проверке свойств фундаментальной матрицы системы (Теорема 3.3.).
Если классифицировать MATLAB по типу исполнения программ, то он относится к интерпретирующим математическим средам.
Для использования вычислительных возможностей MATLAB в первую очередь используются М-файлы, содержащие последовательность исполняемых команд. Использование М-файлов мало отличается от простого набора команд в соответствующем окне пакета. Кроме применения встроенных функций, MATLAB позволяет вызывать подпрограммы, написанные на языках C/C++ и Fortran, так, словно они тоже являются встроенными функциями. Для этого существует механизм МЕХ-файлов. Наконец, в MATLAB можно использовать классы Java, что даёт возможность получить доступ к различным ресурсам Интернет.
Процесс расширения функциональных возможностей не од посторонен. Во-первых, MATLAB позволяет вызывать своё ядро из программ на C/C++ и Fortran. Во-вторых, используя MATLAB С/С-г+ Math Library, можно писать независимые (stand-alone) программы. В-третьих, MATLAB поддерживает современный интерфейс COM/DCOM.
Интеграция пакета программ в Интернет
Подходы к решению вопроса интеграции пакета прикладных программ Time-delay System Toolbox в сеть интернет с возможностью интерактивных или пакетных вычислений описаны в работах [2,3].
Работа с вычислителем традиционно организуется при помощи терминального доступа. В последнее время более популярна идея давать доступ к вычислителю через веб-интерфейс.
Веб-сервер, организующий веб-интерфейс, может единообразно предоставлять доступ не к одному вычислителю, а к многим, размещающимся в различных местах, реализованных на разных платформах и работающих под управлением различных операционных систем.
Рассматриваются два варианта: вычислитель на платформе Intel под управлением ОС Windows 2000/2003 и на платформе Alpha под управлением ОС Digital Unix. Оба варианта разрабатываются и предназначены для организации доступа к вычислительным алгоритмам решения функционально-дифференциальных уравнений, реализованным как модули на языках С и FORTRAN, а также как расширения для систе мы MATLAB. В качестве веб-сервера используется Microsoft Internet Information Server.
В первой модели взаимодействие с вычислительной компонентой (MATLAB) может быть организовано несколькими способами, например, посредством создания СОМ-объекта Matlab.Application и управления им.
К сожалению, имеющиеся у этого объекта возможности, хотя и достаточны для выполнения всех численных расчётов, но абсолютно не рассчитаны на работу в распределённой среде. Более того. MATLAB не предоставляет никаких средств для контроля выполняемых программ.
Для создания вычислительного сервера созданы следующие компоненты: FDE.Spooler - общее управление задачами {постановка в очередь, снятие, изменение приоритета и т.п.). Эта компонента создаётся на том же компьютере, где работает веб-сервер. Спулер работает с правами стандартного пользователя для внешних приложений IIS и не производит никаких физических действий с файлами.
FDE.Task - этот СОМ-объект обслуживает конкретную задачу вычислителя, содержит такие свойства, как идентификатор за/і,ачи, её имя, необходимые для просчёта текстовые файлы (в свойствах) и др. Этот объект создаётся спулером на тех компьютерах, где располагаются вычислительные компоненты, по протоколу DCOM. Никакого файлового обмена между веб-сервером, спулером и объектом Task нет, а, следовательно, нет и проблем с правами доступа к диску. Вместо этого происходит обычное чтение/запись свойств СОМ-объекта, либо вызов методов. Компонента готовит и создаёт в определённом каталоге файлы, необходимые для успешного просчёта задачи в MATLAB. При этом надо учитывать, что MATLAB имеет доступ к файлам только из каталога с задачей, то есть пользователь (умышленно или нет) не сможет нанести сколько-нибудь существенный вред системе в целом.
Очередь задач периодически проверяется на наличие задач сервисом, запущенным на вычислителе. Именно этот сервис непосредственно взаимодействует с MATLAB, при этом он, как было указано выше, работает от имени пользователя, сильно ограниченного в правах.
При разрастании вычислительного сервера (подключении дополнительных вычислителей) возможно создание дополнительного набора компонент FDE.Agent, выполняющих различную техническую работу.
Во второй модели (вариант гетерогенной среды) создание компонент становится задачей если и решаемой, то очень сложной. Вместо этого используется протокол SOAP над транспортом EMAIL. При этом на UNIX-машине должен быть установлен интерпретатор Perl с библиотекой SOAP. Передача файлов, необходимых для запуска вычислительных модулей, осуществляется пакетами SOAP. Проблема безопасности, существовавшая в первой модели, при таком подходе не возникает.
Модули, размещённые и запускаемые на вычислителе, могут быть написаны на языках С, FORTRAN или на любых других языках, компиляторы которых будут установлены па UNIX-машине.
При этом, независимо от языка, на котором написан модуль, он должен быть приведён в соответствие с определёнными интерфейсными требованиями (это сводится к созданию описания модуля на языке XML его автором).
Ещё одной особенностью данной модели является требование обязательного наличия в системе по крайней мере одного почтового сервера и почтовых клиентов на каждой из машин (и на веб-сервере, и на вычис лктєлях).
Управление очередью задач на конкретном вычислителе (при этом подразумеваются задачи, запущенные в рамках нашей системы) может решаться двумя способами: либо запуском специального демона на самом вычислителе, либо организацией сервиса-спулер а на Windows-машине. Это может быть тот же компьютер, где работает веб-сервер, либо отдельный, расположенный в непосредственной близости к вычислителю (в одной локальной сети).
Передача функций управления очередью задач отдельному компьютеру, а также стандартизация интерфейсов вычислительных модулей позволяет также перейти к следующему шагу масштабирования системы -созданию вычислительной решётки.