Содержание к диссертации
Введение
1 О методе динамического программирования для линейных управляемых систем с запаздыванием 18
1.1 Определения и обозначения 19
1.2 Линейная управляемая система с запаздыванием 21
1.3 Основные постановки 24
1.4 Функционал цены для задачи разрешимости. Принцип опти мальности 28
1.5 Вычисление функционала цены V(t,x (-)) методами выпуклого анализа 30
1.6 Дифференциально-функциональное уравнение типа Гамильтона Якоби-Беллмана 31
1.7 Множество разрешимости и функционал цены в случае конечномерного целевого
множества 36
1.8 Задача быстродействия 39
1.9 Синтез управлений 40
1.10 Функционал цены для задачи достижимости 42 з
1.11 Функционал цены для задачи достижимости: конечномерный случай 45
1.12 Задачи достижимости и разрешимости в течение заданного промежутка времени 47
1.13 Задачи достижимости и разрешимости в течение заданного промежутка времени: конечномерный случай 49
1.14 Заключение 51
2 Эллипсоидальное оценивание множеств достижимости для линейных управляемых систем . 52
2.1 Система 53
2.2 Конечномерный случай
2.2.1 Множество достижимости 54
2.2.2 Внутренние оценки 56
2.2.3 Пример 58
2.3 Функциональный случай 58
2.3.1 Множество достижимости 58
2.3.2 Внутренние оценки
2.4 Внешние оценки 68
2.5 Пример 70
3 Аппроксимация системы с запаздыванием 73
3.1 Аппроксимация исходной системы уравнением нейтрального типа 73
3.2 Аппроксимация исходной системы методом прямых 75
3.3 Аппроксимация исходной системы методом прямых для случая постоянных коэффициентов
3.4 Регуляризация задачи синтеза 88
4 Управление аппроксимирующей системой обыкновенных дифференциальных уравнений 90
4.1 Метод динамического программирования 91
4.2 Эллипсоидальный синтез 94
Заключение 97
Список литературы
- Вычисление функционала цены V(t,x (-)) методами выпуклого анализа
- Функционал цены для задачи достижимости: конечномерный случай
- Множество достижимости
- Аппроксимация исходной системы методом прямых для случая постоянных коэффициентов
Введение к работе
Актуальность темы
Исследование систем с запаздыванием обусловлено существованием процессов, законы развития которых включают в себя не только текущее состояние, но и предысторию. Подобные процессы возникают в механике, электродинамике, химии, биологии, медицине.
Возникает запаздывание в задачах управления по результатам наблюдений. Запаздывать могут как сами измерения, так и передача сигналов наблюдений.
В механике системами с запаздыванием описываются состояния напряженной деформации ряда материалов. Это задачи наследственной упругости или вязкоупругости. А также задачи аэроавтоупругости, изучающие движения тел с учетом взаимодействия с окружающей средой.
В биологии задачи с последействием возникают при описании эволюции различных биологических систем, в медицине - при описании функционировании систем жизнедеятельности организма (например кровообращения).
Активное изучение уравнений с запаздыванием началось в 50-е года 20-го века. Исследованием таких уравнений начали заниматься А.Д. Мышкис [36-38] и Б.С. Разумихин [32]. В этих работах текущее состояние системы рассматривалось только в конечномерном пространстве. Что существенно ограничивало круг решаемых задач.
Начало принципиально нового этапа развития теории дифференциальных уравнений с запаздыванием связано с именем И.И. Красовского [11-17]. Он первым предложил использовать функциональную структуру решений уравнений с запаздыванием [12]. Это позволило вывести теорию уравнений с запаздыванием на уровень с той же степенью детализации как у теории для обыкновенных дифференциальных уравнений.
Дальнейшее изучение систем с запаздыванием продолжились в работах Р. Беллмана, К. Кука [4, 39], Дж. Хейла [35, 40]. Методы управления системами с запаздыванием развиты в работах С.Н. Шиманова [37], Ю.С. Оси-пова [29], А.Б. Куржанского [18-20], В.Б. Колмановского [2], Р.Ф. Габасова, Ф.М. Кирилловой [5], Н.В. Азбелева [1], Л.Э. Эльсгольца, СБ. Норкина [38], Г.А. Каменского [8], A.M. Зверкина [6], А.В. Кима [9], Н.Ю. Лукоянова [22].
В подходе Н.Н. Красовского исследуемую систему можно рассматривать как эволюционное уравнение в функциональном пространстве, элементами которого являются значения функций с предысториями. Это позволяет воспользоваться методом динамического программирования, особенностью применения которого будет являться структура данного пространства.
Возникающие при этом уравнения, рассматривающиеся в функциональном пространстве, требуют введения обобщенных решений в данном пространстве и соответствующих функциональных производных. Различные подходы к введению этих производных можно посмотреть в [2, 9, 22].
Другой проблемой при рассмотрении данных задач является некорректность постановки задачи восстановления начального состояния. Подходы для решения данной проблемы хорошо известны для систем с распределенными параметрами - метод регуляризации А.Н. Тихонова [34], метод квазирешений В.К. Иванова [7], метод квазиобращения Ж.-Л. Лионса - Р. Латтеса [21] и ДР-
При обращении решения в системах с запаздыванием можно воспользоваться методом прямых [18], а также сведением к уравнению нейтрального типа [4]. В первом случае возникает система обыкновенных дифференциальных уравнений, которая аппроксимирует исходную систему. Для нее при решении задач управления хорошо развит метод эллипсоидального оценивания [55-58]. С помощью эллипсоидов оцениваются множества достижимости и разрешимости. Это позволяет получать параллельные алгоритмы для нахождения искомых множеств и позволяет строить синтез управления в режиме
реального времени. Известно множество алгоритмов для различных классов задач. Расширение границ применения данного метода для задач позволит решать более широкий класс задач, включая и задачи с запаздыванием.
Цель работы
Применить метод динамического программирования для задачи целевого управления. Построить требуемые функционалы цены и получить для них соответствующие уравнения типа Гамильтона-Якоби-Беллмана. Выписать принцип оптимальности.
Построить эллипсоидальные оценки множества достижимости для задач с запаздыванием.
Совмещая метод прямых и эллипсоидальное исчисление получить алгоритм вычисления синтеза для задач с запаздыванием. При этом исходная система с запаздыванием аппроксимируется системой обыкновенных дифференциальных уравнений, для которой строится синтез управления с помощью эллипсоидальных методов оценивания.
Научная новизна
Полученные результаты являются новыми.
Получены явный вид функционала цены и уравнение динамического программирования для линейной управляемой системы с постоянным запаздыванием. Рассмотрены случаи нахождения множеств достижимости и разрешимости.
Получены новые формулы исчерпывающих эллипсоидальных оценок для множества достижимости в конечномерном и функциональном пространствах.
С помощью эллипсоидального исчисления построен алгоритм вычисления синтеза управления в реальном времени для аппроксимирующей линейной управляемой системы, описываемой обыкновенными дифференциальными уравнениями.
Теоретическая и практическая ценность
Работа носит в основном теоретический характер. Методы, развитые в
работе, позволяют получать оценки множеств, которые активно используются при решении задач управления. Каждая оценка считается независимо от другой, что позволяет активно пользоваться суперкомпьютерными вычислениями. Алгоритмы синтеза управления позволяют работать в реальном времени, что существенно при решении практических задач.
Методы исследования.
Использован метод динамического программирования для построения функционала цены и вывода уравнения типа Гамильтона-Якоби-Беллмана. С помощью методов выпуклого анализа получен аналитический вид искомого функционала. С помощью методов эллипсоидального исчисления получены формулы исчерпывающих эллипсоидальных оценок для множества достижимости и синтез управления для аппроксимирующей системы.
Апробация работы
Результаты работы докладывались на научном семинаре "Прикладные задачи системного анализа" под руководством академика А. Б. Куржанского на кафедре системного анализа факультета ВМК МГУ имени М.В. Ломоносова, на международный семинаре "Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби" (CGS'2005, Екатеринбург, 2005), на симпозиуме "Управление упругими колебаниями" (Переславль-Залесский, 2006), на конференции "Ломоносовские чтения-2013" (Москва, 2013), на XX Международной конференция по автоматическому управлению "Автоматика - 2013", (Николаев, Украина, 2013), на конференции "Ломоносовские чтения-2014" (Москва, 2014)
Публикации.
Результаты диссертации опубликованы в 3-х работах [45-47], список которых приведен в конце автореферата. Все они опубликованы в журналах из перечня ВАК.
Работы [45, 47] подготовлены автором самостоятельно.
Работа [46] подготовлена совместно с А.Н. Дарьиным и А.Б Куржан-
ским. Идея исследований принадлежит научному руководителю автора, академику А. Б. Куржанскому. Автором получены формулы эллипсоидальных оценок и эллипсоидального синтеза управлений. А.Н. Дарьин провел численное моделирование.
Структура и объем диссертации.
Вычисление функционала цены V(t,x (-)) методами выпуклого анализа
Данная глава посвящена применению метода динамического программирования для задач, описываемых линейными дифференциальными уравнениями с запаздыванием. Подобные уравнения были изучены в работах [36], [19], [5], [49]. Задачи управления в традиционных и в игровых постановках рассматривались в работах [24], [27]. Уравнения с запаздыванием также изучались в [7], [33]-[35]. Особенности применения метода динамического программирования для рассматриваемых задач порождены, как известно, функциональной природой решений систем с запаздыванием. Поэтому, следуя [19], в качестве текущего фазового состояния рассматривается пара - вектор зна 18 чения решения в текущий момент времени и функция, описывающая предысторию решения на интервале, зависящем от величины запаздывания. Соответственно определяется и функциональное пространство, на котором рассматриваются задачи оптимизации некоторых функционалов цены за счет выбора соответствующих управлений.
В данной главе рассмотрены задачи построения прямых и попятных областей достижимости [28] для систем с запаздыванием, а также указаны пути построения стратегий синтеза целевых управлений, подверженных априорным геометрическим ограничениям. Вследствие этого приведены постановки задач как в прямом, так и попятном времени. Получены выражения для функционалов цены, используемых для решения упомянутых задач. На основе приведенных вариантов принципа оптимальности выведены соответствующие уравнения типа Гамильтона-Якоби-Беллмана, используя которые, оказывается возможным найти позиционные стратегии синтезированных целевых управлений. Основное содержание данной главы опубликовано в работе [63].
Определение 3. Классом U[TI,T2] допустимых программных управлений назовем множество функций из пространства L00([ri,T2],Kn); удовлетворяющих на этом отрезке ограничению (1.5). Решение системы (1.4) будем понимать в смысле Каратеодори и рассматривать в виде функции жт(-), принимающей значения в Н и определяемой выражением (1.2) ([49]). Зафиксируем начальную позицию {t,x (-)} (t Є [to}ti}} x (-) Є H)} а именно, ф) = х {т), т Є [-/і,0]. (1.6) Под xT(-,t,x (-),u(-)) (при т і) будем понимать решение хт(-) системы (1.4)), (1.6) в момент г при соответствующей начальной позиции {,# ()} и управлении и(-). Такое решение существует, единственно и выписывается в следующем виде ([5], с.ЗЗЗ, [49], с.51, [27] с.1400):
В случае, когда начальное значение х (-) является абсолютно непрерывной функцией, выражение (1.4) можно рассматривать как эволюционное уравнение в пространстве Н функции жт(-), а именно ? = АгХт(-) + Вти(т), (1.12) где Ат - неограниченный линейный оператор в пространстве Н ([19], с.162): (Л-жт(-))(0) = А0(т)хт(0) + Лі(г)жт(-Ч, (Лжт(-))(0 = %, Для п.в. С Є [-/1,0). Оператор Вт определяется соотношениями: (Вт«(г))(0) = В(тМг), 1.14) {Вти{т)){) = О, для п.в. Є [-/г,0). Заметим, что при т t + h решение хт(-) задачи Коши (1.4)-(1.6) будет абсолютно непрерывно при любом допустимом начальном условии, что следует непосредственно из определения решения.
Уравнение (1.4) можно упростить, а именно, обнулить матрицу Ao(t), оставив в правой части только слагаемое с запаздыванием.
Для введенной выше линейной управляемой системы с запаздыванием (1.4), (1.6) будем рассматривать задачи целевого управления из заданного множества X начальных состояний.
То есть фиксируются начальное множество X () С Н и целевое множество M(-). И требуется привести траекторию системы (1.4), (1.6) из начального состояния Xt0(-): в конечное состояние, принадлежащее множеству M(-). В силу функциональной природы текущего фазового состояния возможны две постановки - функциональная и конечномерная. В первом случае требуется попасть в целевое множество M(-) состояний, заданных в функциональном пространстве Н:
В частности, если требуется привести систему в состояние покоя, то необходимо удерживать систему в этом состоянии в пространстве Шп в течении всего отрезка времени длительностью h. В этом случае множество M(-) состоит из нулевой функции из пространства Н.
Во втором случае требуется попасть во множество M конечномерного пространства Шп: x(ti) = xtl(0) Є M, M єГ. Здесь отсутствует требование удержать систему в этом множестве после попадания в него. В основном будут рассмотрены задачи с геометрическим ограничением на управление, когда в каждый момент времени управление принадлежит непустому выпуклому компактному множеству: и(т) Є Р(т) при г Є [to,ti]. В частности, будет рассмотрены эллипсоидальные ограничения на управления, когда множество Р(т) является эллипсоидом: P(r)=e(q(r),Q(r)) Мотивацией для рассмотрения такого класса управлений является возможность получения семейств исчерпывающих эллипсоидальных оценок в исследуемых задачах. Введем понятие текущей позиции. Определение 4. Текущая позиция {t}xt(-)} системы (1.4) есть пара, состоящая из текущего момента времени t и функции Xt(-) - решения в текущий момент времени вместе с предысторией на интервале [t — h,t).
Подчеркнем факт того, что текущая позиция системы имеет функциональную структуру как в конечномерной так и в функциональной постановке, так как для продолжения решения уравнения (1.4) начиная с момента t обязательно нужно знать решение в текущий момент времени вместе с предысторией на интервале [t — h,t).
Возможны два класса управлений - программные u{t) и синтезированные u(tM-)) В первом случае управление ищется в виде функции u{t), которая зависит только от текущего момента времени. Во втором случае управление ищется в виде функции U(t,Xt(-)) (вообще говоря многозначной), которая зависит от текущей позиции \t,Xt(-)} системы (1.4). При этом синтезированное управление должно быть допустимым, то есть удовлетворять априорным ограничениям на управление, и в случае подстановки его в уравнение (1.4) удовлетворять условию теоремы существования решения дифференциального уравнения (дифференциального включения в случае многозначного синтезированного управления).
Функционал цены для задачи достижимости: конечномерный случай
Данная глава посвящена нахождению исчерпывающих внутренних и внешних оценок множества достижимости у линейной управляемой системы с запаздыванием при геометрических ограничениях на управление. Используются результаты [57], [58] где приводится техника эллипсоидального оценивания для интегралов от эллипсоидов и множеств достижимости линейных управляемых систем, описываемых обыкновенными дифференциальными уравне 52 ниями.
Прямым применением формулы для оценки интегралов от эллипсоидов получены исчерпывающие внутренние и внешние оценки для рассматриваемых в конечномерном пространстве множеств достижимости у задачи с запаздыванием. Переносом схемы оценки интегралов от эллипсоидов на функциональное пространство и множества эллипсоидального типа, получены исчерпывающие внутренние оценки в функциональном пространстве для множества достижимости у системы с запаздыванием. В частном случае получены рекуррентные формулы для вычисления внутренних оценок множества достижимости в функциональном пространстве. Основное содержание данной главы опубликовано в работе [61].
Решение системы (1.4), (1.6) можно рассматривать в конечномерном пространстве, как векторную функцию ж(т), определенную в каждый момент времени г Є [to — /і, t\]. так и в пространстве Н. Таким образом, проблему нахождения областей достижимости данной системы можно рассматривать в двух постановках - конечномерной и функциональной (соответствующие определения даны ниже). Цель данной главы - получить исчерпывающие внутренние эллипсоидальные оценки множества достижимости в конечномерном и бесконечномерном пространствах на интервале времени t Є [о,і] и определить, какие из них можно вычислять рекуррентно по t, тем самым уменьшая объем требуемых вычислений.
Наложим на управление и начальные условия следующие ограничения: и(т) Є (q(r),Q(r)) при г Є Мі], (2-3) Ж(.) ЕХ(.), (2.4) где X () - некоторое подмножество пространства Н. Определение 16. Множеством достижимости X[t] = X(t,to,Xo(-)) в момент t системы (1.4), (1.6) при ограничениях (2.3); (2.4) называется объединение X[t]=X(t X(-)) = \J{x(t x\lu(-))} всевозможных состояний системы (1.4); (1.6) в момент t, при ограничениях (2.3), (2.4). В дальнейшем, ограничение (2.4) полагаем следующим: х0(т)єЄ(хо(т),Х0(т)), тє[ 0-Мо]. (2-5) Из (2.2) следует, что множество достижимости можно представить в виде суммы эллипсоида и интегралов от эллипсоидов:
Выбором матриц То(-) и Т(-) ([57], с.204) можно добиться совпадения опорных функций множества достижимости и внутренней оценки для любого заранее фиксированного вектора / из Шп: Теорема 17. Для любого вектора І Є Rn существуют функции То(-) и Т(-) такие, что p(l\X[t]) = p(l\E(x-(t),X-(t))). (2.16) Искомые То(-) и Т(-) находятся, исходя из следующих уравнений: ЗДо)Х01/2(0тМо)/ = XiOToiOX1/2 ) + h)S (t, + h)l = = \{T)T{T)QV2(T)B (T)S% T% (2.17) А(т) 0, Л(О 0, Є [«o-Mo),TE (М Таким образом, каждому вектору / из Жа соответствуют значения То(/, ), Т(/, ) и X (l,t), при которых выполняется (2.16). Теорема 18. Множество достижимости есть объединение эллипсоидов по всевозможным векторам I из единичной сферы: X[t] = \J{S(x-(t),X-(l,t))\l ЄШП : / = 1}. Поскольку величины То(-) и Т(-) в общем случае зависят от t, для вычисления внутренних оценок в другой момент времени, требуется заново решать систему (2.12)-(2.13).
Проиллюстрируем графически формулы для оценки множества достижимости. Рассмотрим следующий пример: / і о \ / -і о\ /іо\ /і о Ло=[ , Аг =[ , Q =[ , 5 = у о -і J у о і J \010/ \01 (А 1 \ Х0(т)= , те [to-Л, to], о = 0, #i = l, п = 2. Vі -5/ И четыре случая, отличающиеся друг от друга величиной запаздывания h: h=0, h=0.01, h=0.1, h=0.3. Рисунки демонстрируют внутренние эллипсоидальные оценки множества достижимости в момент t = t\, полученные по формулам (2.12), (2.13)) и (2.17), и соответствующие опорные плоскости, полученные из формулы (2.8). Продемонстрировано влияние величины запаздывания на множество достижимости.
Рассматривается система (1.4), (2.1) при ограничениях (2.3), (2.4). Определение 17. Под решением (или состоянием) xt{-) = Xt(-}to}x(-)}u(-)) системы (1.4); (2.1) в функциональном смысле в точке t будем понимать h = h = 0. /i = 0.1 /i = 0.3 решение системы х(т) на отрезке [t — h}t] при соответствующих начальном условии х(-) и управлении и(-).
Замечание. В дальнейшем, чтобы не усложнять запись, считаем, что t to + h. Случай t to + h рассматривается no аналогичной схеме, разбивая отрезок [t — h}t] на два: [t — h}to] и [to,t], с рассмотрением решения xt(-) на каждом из них.
Множество достижимости
Соответственно произведение всех трех сомножителей будет стремиться к нулю при т стремящейся к бесконечности равномерно по S Є [#о?і] Таким образом, для любых положительных чисел є 0, 5о 0, а 0 существует число М(є, So, сх) такое, что для любого t Є (ah + So,t\], для любых т M(s,So,a) для любых натуральных і, таких, что і am следует, что \\Гг2(t)\\ є равномерно по всем начальным распределениям удовлетворяющим (3.19).
Рассмотрим первое слагаемое в (3.18). t I}(t) = hi_iyJ »WC - ry e-f dT = j y0(T)ll(T)dT о 0 Зафиксируем «о Є (0,1]. Пусть t = a\h + S, где 1 a\ «о, S So. И рассмотрим при фиксированном т такие і, что «о ъ/т а\. Заметим во-первых, что любой индекс і можно представить в виде і = [am], где а Є [ско, а\]. При этом am = [am] — xmj где ят Є [0,1).
Зафиксируем некоторое положительное число 5\ такое, что min{6o,aoh} Оценим по модулю первый и третий интегралы. Так как уо(т) равномерно ограничена при всех г Є [0,і] и m некоторой константой Ко7 то подынтегральная функция равномерно при всех 5 5о и при всех а Є [ско і] может быть оценена в каждом из двух случаев произведением показательной функцией с основанием меньше единицы (оцениваем скобку в первом сомножителе согласно (3.20)) и полинома. Следовательно, эти два интеграла равномерно сходятся к нулю.
Второй же интеграл можно с любой точностью равномерно приблизить к величине yo(a\h + 5 — ah). Действительно, разложив по формуле Тейлора в точке (i\h + 5 — ah выражение, стоящее в первом множителе получаем V ah/ Т _2\\т („—, Т)п . / 2\\т Тогда для любого є 0 можно найти такое 5\, что для любого г Є [—5\, 5\] функцию в скобке можно равномерно оценить сверху и снизу:
Таким образом, предел второго интеграла будет лежать в диапазоне [(1 — є)уо(), (1 + є)г/о(ОЬ гДе точка лежит в -окрестности точки a\h + 5 — ah.
Осталось рассмотреть і Є [1, [скот]]. Применяя теорему о среднем получаем, и интегрируя выражение для вычисления у І через у і-і получаем, что нормы соседних функций отличаются на величину не превосходящую Ке 0. Таким образом, чтобы обеспечить для всех у І чтобы они отстояли друг от друга на величину є нужно потребовать, чтобы аогпКе h 0 є что достигается при достаточно больших т. Таким образом сначала фиксируем MQ при которой у с точностью до є приближается к г/о- После фиксируется «о г/о(х\) — Уо(х2) при \\х\— Ж2І aoh После этого фиксируем 5\ : min{6o, aoh} 5\ 0 для которого справедлива оценка (3.22). Также 5\ берется таким, чтобы сомножители не входящие в предел по т были близки к 1 с точностью до є. После определяются все М и берется максимальное значения чтобы все интегралы сходились с требуемой точностью.
Которое отличается от исходного уравнения на величину не превосходящую любую наперед заданную при стремлении m к бесконечности. Из чего можно сделать вывод, (например используя лемму Гронуолла-Беллмана) что yo(t) равномерно сходится к x{t). 3.3 Аппроксимация исходной системы методом прямых для случая постоянных коэффициентов
Заметим, что решения систем (3.24), (3.25) и (3.26), (3.27) растут не быстрее экспоненты. Следовательно, существует такое положительное число Д), что при р Ро справедливы следующие выражения
Соответственно сходятся друг к другу выражения (3.32), (3.33) изображений Х(р) и Yo(p) 3.4 Регуляризация задачи синтеза Рассмотрим линейную управляемую систему с запаздыванием (1.4)-(2.1) на отрезке [o,i], t\ to + h. Зафиксируем целевое ограниченное множество .М(-) из пространства C[—h, 0]. Не ограничивая общности, считаем, что Ос Є int Л4(-). Зафиксируем равномерно ограниченное множество управлений вида (1.5). Не ограничивая общности, считаем, что 0 Є int Р(т).
Фиксируем є - требуемую точность попадания на целевое множество. Фиксируем параметр регуляризации К\- максимально допустимую норму начальной функции. Согласно теореме 30 существует число ш, обеспечивающее точность аппроксимации є/2. Для этого m строим систему (3.12) с ограничением на правом конце: yih) є Mm. (3.38) Множество Л4т строится по множеству .М(-) таким образом, что для любого вектора у Є Л4т, построенная из него ломаная у(-) Є C[—h,0] будет лежать на расстоянии от множества Л4(-) в пространстве С[—h, 0] не более чем є/2: d(y(-),M(-)) s/2. (3.39)
После этого строим множество разрешимости Wm[t] системы. Пропорционально уменьшая целевое множество Л4т и множество управлений, в силу ограниченности множества разрешимости линейной системы обыкновенных дифференциальных уравнений, можно добиться условия Wm[o] К\. Вместо этого можно взять в качестве искомого множеста пересечение множества разрешимости с шаром радиуса К\, тем самым гарантируя выполнения ограничения на максимальную норму начальной функции. Таким образом, если двигаться из такого множества разрешимости в силу системы (3.12) при любом управлении, удовлетворяющем ограничению, то в момент t\ соответствующая ломаная у будет аппроксимировать реальное решение системы (1.4) с любым начальным условием, удовлетворяющим (3.13)) с точностью є/2. А построенный синтез для обыкновенной системы на множество Л4m будет обеспечивать попадание на множество Л4(-) решения системы (1.4) С ТОЧНОСТЬЮ ДО Є.
Аппроксимация исходной системы методом прямых для случая постоянных коэффициентов
В данной главе рассмотрены методы управления системой обыкновенных дифференциальных уравнений, аппроксимирующей систему с запаздыванием. Основные методы и выражения, используемые в данной главе, опубликованы в работе [62]. Определив порядок т для аппроксимации системы с запаздыванием системой обыкновенных дифференциальных уравнений методом прямых получаем следующую систему. где ви/- соответственно нулевая и единичная квадратные матрицы размерности п х п. Ограничение на управление остаются преждними (3.11). Целевое множество Л4 строится согласно (3.39). Для решения задачи управления можно воспользоваться методом динамического программирования. Для этого вводится функция цены
Которую можно аналитически выписать используя аппарат выпуклого анализа [56] V{t,x) = max{{X{tut)x,l) - [ p(-B 0(т)X (thт)l\P(т))dт l { (4-5) -р{1\М)- 1/4 (/,/)} Данная функция цены удовлетворяет уравнению Гамильтона-Якоби-Беллмана dzm+min( tA{t)x+Bo{t)u) (4.6) dt ueP(t) \ дх I V(thx)t = d2(x(t1),M) (4.7) Требуемый синтез управления здесь состоит из минимизаторов и в (4.6) U(t,x) = Argmin (в 0(і)Щ А,и) . ueP(t) \ ox I Для упрощения вычислений заметим, что функция цены может быть выражена через множество разрешимости VK[]. Применяя методы выпуклого анализа, получаем [56]: V{t, х) = d2{X{tht)x, X{tht)W[t}). (4.8) Где X(t\,t) фундаментальная матрица системы (4.1): dX(t,T) A(f\Y(f \ ——— = A{t)X{t,T), Х(т,т) = І. (4.9) V(t,x) = max{(Xf(tht)l,x) - p(Xf(tht)l\W[t])-j(l,l)} = max{(l,x) -p(l\ W[i\) - - (X (t,ti)l,X (t,ti)l)} v ТІ В силу сильной выпуклости максимизатор единственный, поэтому можно выразить полную производную функции цены, используя теорему о дифференцировании функции максимума [9]. Пусть / единственный максимизатор в выражении (4.9), тогда производная
Заметим, что стратегия управления U(t,x) является многозначным отображением, поэтому, уравнение (4.1) превращается в дифференциальное включение х(т) Є А(т)х(т) + Bo(r)U(t,x(r)), г Є Мі], (4.11) Но поскольку размерность системы велика, данные выражения, несмотря на свой явный вид, обладают большой вычислительной сложностью. Но если заменить точное множество W[t] на его внутреннюю эллипсоидальную оценку W\t\ то выражения существенно упростятся.
Вывод уравнений эллипсоидальной аппроксимации [56, 57], основан на эволюционном уравнении для множества разрешимости и его аппроксимаций: с конечным условием W[t\\ = Л4. Здесь h+(X,Y) = min{r 0\Х СУ + Вг{0)} — полуметрика Хаусдорфа в пространстве компактных подмножеств Ж (т+1)п_ Наибольшее по включению решение (4.12) совпадает со множеством разрешимости W[t].
Для целей синтеза управлений важно следующее свойство решений эволюционного уравнения [56]: Теорема 31. Пусть Z[t] — такое решение эволюционного уравнения (4.12), что функция p(l\ Z[t\) дифференцируема по t для любого І Є Шт+1 п. Тогда функция Z(t,x) = d2(X(tht)x,X(tht)Z[t}) удовлетворяет дифференциальному неравенству min &ЖМ) =Zt+ min (Zx, A(t)x + и) 0. (4.13) ueP(t) dt ueP(t) Как следствие (4.13) выполняется следующее свойство позиционного управления, определённого как множество минимизаторов в (4.13): Uz(t,x) = Aigmm{Zx, B(t)u). (4.14) uP(t) Если начальная точка x(to) траектории дифференциального включения (4.11) находится внутри Z[to]: то остальная часть траектории также лежит в трубке. Z[to] Последнее верно, поскольку расстояние от x{t) до Z[t] является невозрастающей функцией.
Следовательно, если внутренняя аппроксимация множества разрешимости является решением эволюционного уравнения, то позиционная стратегия (4.14) решает задачу целевого управления на множество Л4 для всех начальных состояний из Z[to]. При этом управление может быть вычислено по формулам (4.9)-(4.10) с заменой W[t] на Z[t]. Такую стратегию управления можно интерпретировать как "прицеливание" на трубку Z[t].
Полученная таким образом эллипсоидальная аппроксимация касается множества разрешимости вдоль "хороших" направлений l (t) = X (to,t)lo: p(l (t)\S(x-(t),X-(t))) = p(nt)\W[t]). (4.21) При этом управление может быть вычислено по формулам (4.9)-(4.10) с заменой W[t] на (x-(t),X_(t)). .
Заметим, что при каждом фиксированном /о происходит касание точного множества W[t] и внутренней эллипсоидальной оценки вдоль "хороших" направлений l (t) = X (to,t)lo V(t,x) = max{(l,x) - p(l\S(x-(t),X_(t))) -j(l,l)} (4.22) v ТІ в качестве начального х взять точку касания точного множества и внутреннего эллипсоида. В случае эллипсоидальной аппроксимации максимизатор в формуле (4.9), необходимый для вычисления управления, может быть найден как 1 = 2X(X_(t) + AF ))"1 ) - x-(t)), F{t)=Xf{t,t1)X{t,t1), где Л — единственный неотрицательный корень уравнения (X_(t) + XF(t))-\x{t) - x_{t)),X_{t){X_{t) + \F{t))-\x{t) или = О, если (4.24) не имеет неотрицательных решений. Ниже приведены графические иллюстрации. Эллипсоидальные оценки множества разрешимости: