Содержание к диссертации
Введение
ГЛАВА 1. Задача импульсной оптимизации
1.1 Постановка задачи и основные определения 21
1.2 Условия разрешимости задачи 26
1.3 Свойства множеств достижимости импульсной системы 28
1.4 Принцип максимума в задаче импульсного управления 40
1.5 Оптимизация при "двойном" ограничении на импульсы 47
1.6 Примеры 52
ГЛАВА 2. Внешние эллипсоидальные оценки множеств достижимости импульсной системы
2.1 Постановка задачи 71
2.2 Первый метод оценивания 72
2.3 Второй метод оценивания 82
2.4 Построение е-оценок областей достижимости 93
2.5 Об одном предельном свойстве 97
Список литературы
- Условия разрешимости задачи
- Принцип максимума в задаче импульсного управления
- Первый метод оценивания
- Построение е-оценок областей достижимости
Введение к работе
В настоящее время математический аппарат решения задач теории управления детерминированными системами, изменение состояний которых во времени описывается обыкновенными дифференциальными уравнениями, хорошо разработан. К фундаментальным результатам, полученным в этой области теории управления, можно отнести принцип максимума Л.С. Понтрягина, теорию необходимых и достаточных условий оптимальности, теоремы об условиях существования оптимальных управляющих воздействий, теорию линейных систем, исследование свойств управляемости, теорию гарантированного оценивания.
Одним из важных разделов динамической оптимизации является исследование задач оптимального импульсного управления, где изучаются динамические процессы с разрывными траекториями и обобщенными управлениями импульсного типа — векторными мерами и другими распределениями (обобщенными функциями).
Многие задачи оптимального управления, первоначально поставленные как классические, не имеют решения в традиционном классе абсолютно непрерывных траекторий и измеримых управлений. Если в классической задаче оптимального управления множество допустимых значений управления неограничено, то в общем случае нельзя ожидать, что задача оптимизации имеет решение в классе обычных управлений с непрерывными траекториями. При этом основное условие оптимальности - принцип максимума - в своей классической форме оказывается неприменим - ведь он требует, чтобы оптимальное управление существовало. Поскольку траекторные компоненты минимизирующих последовательностей в таких нерегулярных, вырожденных задачах сходятся к разрывным функциям, а управляющие функции характеризуются наличием дельтообразных составляющих и сходятся в смысле распределений, то возникает проблема расширения этого класса задач, направленная на включение предельных элементов в множество допустимых процессов. На этом пути и возникают задачи импульсного оптимального управления.
Помимо этого, важным стимулом для развития теории импульсного управления является моделирование процессов, управление которыми осуществляется в течение столь кратковременных промежутков, что их можно идеализировать как мгновенные, а результаты воздействия приводят к быстрому изменению процесса — скачкам фазовой траектории моделируемой системы. Формализация таких процессов невозможна без перехода к управлениям импульсного типа и динамическим системам с разрывными траекториями. Важные примеры подобных ситуаций можно найти в механике, ракето динамике (одной из первых задач является известная задача Лоудена о переводе космического корабля с одной орбиты на другую при минимальном количестве топлива), квантовой электронике (лазерное излучение является импульсным по своей природе), робототехнике, медио-терапии, математической экологии и экономике и т.д.
В становление и развитие теории оптимального импульсного управления важнейший вклад внесли работы Н.Н, Красовского, А.Б, Куржан-ского, А.Г. Ченцова, А. Брессана, Дж. Варги, Р. Винтера, В.И. Гурмана, В.А. Дыхты, СТ. Завалищина, А.Д. Иоффе, Г.А. Колокольниковой, Б.М. Миллера, Ю.В. Орлова, Ф. Перейры, Ф. Рампаццо, Р. Ришела, Р. Ро-кафеллара, А.Н. Сесекина, В.М. Тихомирова, Т.Ф. Филипповой и др.
Вопросам оптимизации динамических систем, описываемых дифференциальными уравнениями с управляющими функциями импульсного типа, посвящено большое число исследований, в том числе [26, 37, 42, 54, 60] (см. также библиографию к указанным работам). Одним из центральных вопросов математической теории управления динамическими системами является проблема построения множества достижимости системы, то есть построения множества тех состояний фазового пространства, куда фазо 5
вая точка может быть переведена из начального состояния (или множества начальных состояний) за заданное время при помощи некоторого допустимого управления.
Задача о переводе начальной области XQ (t = to) вовнутрь заданного множества фазового пространства за определенный момент времени рассматривалась ранее в работах [1, 6, 9, 54, 56, 57, 60, 66] и работах многих других авторов для систем обыкновенных дифференциальных уравнений, наиболее полно изучены вопросы управляемости, существования оптимального управления, необходимые условия оптимальности (основным из которых является принцип максимума Л.С. Понтрягина), достаточные условия оптимальности и другие. Для импульсных систем подобные задачи рассматривались в работах Н.Н. Красовского, А.Б. Куржанского, Р. Винтера, М.И. Гусева, В.И. Гурмана, В.А. Дыхты, СТ. Завалищина, В.Ф. Кротова, О.Н. Самсонюк, Ю.В. Орлова, Ю.С, Осипова, Ф. Перейры, А.Н. Сесекина, Т.Ф. Филипповой и др. В случае одноточечных множеств XQ И Х\ при обычном требовании равноограниченности вариации решение указанной задачи хорошо известно [43, 54, 60]. В работах [3, 60] рассматривалась подобная задача при добавочном ограничении на управление в виде конуса.
Для решения задач указанного круга принципиальной является проблема точного или приближенного построения множеств достижимости управляемой системы. Во многих прикладных задачах точное нахождение множества достижимости может оказаться затруднительным, и для формирования оптимального управляющего воздействия исследуемую задачу "огрубляют", заменяя точное множество достижимости его оценкой по включению (внешней и, если возможно, внутренней). При этом класс, в рамках которого выбирают оценивающие множества, предполагают состоящим из множеств более простой геометрической структуры, в частности, это может быть семейство многогранников (полиэдров, политопов) или класс эллипсоидов. Одним из возможных методов построения внутренних и внешних аппроксимаций для множеств достижимости является метод эллипсоидальных аппроксимаций. Для управляемых систем, описываемых линейными дифференциальными уравнениями с классическими (измеримыми) управлениями, в настоящее время разработана полная теория построения оценок (внешних и внутренних) множеств достижимости таких систем, основанная на технике эллипсоидального исчисления [60, 88, 99, 106]. В рамках этого подхода основная задача состоит в нахождении эллипсоида (или семейства эллипсоидов) в фазовом пространстве, оценивающего сверху или снизу по отношению к операции включения множеств искомую область достижимости. Впервые техника эллипсодального оценивания рассматривалась в работах А.Б. Куржанского [60,106], Ф.Л. Черноусько [88], F.C. Schweppe [117]. В работах А.Б. Куржанского [106, 107, 108, 109, ПО] используется аппарат эллипсоидальных аппроксимаций, позволяющий строить тугие внутренние и внешние эллипсоидальные аппроксимации для множеств достижимости и разрешимости управляемых систем, описываемых обыкновенными дифференциальными уравнениями. Объединение тугих внутренних и пересечение внешних эллипсоидальных аппроксимаций позволяет построить множество достижимости для таких систем.
Отметим, что аппроксимации множеств достижимости иного типа (в виде многогранников или параллелотопов) для динамических систем с обыкновенными (измеримыми) управлениями (или возмущениями) рассмотрены в работах Е.К. Костоусовой [53, 103].
В настоящей работе рассмотрены схемы построения множеств достижимости и их внешних оценок для управляемых импульсных систем. При этом предполагается, что на управляющие функции наложено специальное ограничение, задаваемое обобщенным "эллипсоидом" в пространстве функций ограниченной вариации. В частности, при данном ограничении вектор точечного импульсного управляющего воздействия обязан лежать в заданном конечномерном эллипсоиде. Задачи такого рода возникают в тех случаях, когда возможности управления импульсной динамической системой стеснены ограничениями, неравномерными по различным направлениям (например, при движении летательных аппаратов вблизи поверхности планеты или в узких ущельях, а также при движении подводных управляемых устройств в условиях сложных подводных рельефов). Поэтому рассмотрение эллипсоидальных ограничений на импульсное управление указанного выше специального вида позволяет, с одной стороны, отразить специфику постановки задачи, а с другой стороны, дает возможности использовать в анализе теоретических и прикладных методов управления такими системами достижения эллипсоидального исчисления, разработанного для управляемых систем обыкновенных дифференциальных уравнений.
Цель данной работы состоит в построении и исследовании множеств достижимости линейных управляемых систем импульсного типа и развитии эллипсоидальных методов аппроксимации областей достижимости на специфический круг объектов: линейных управляемых импульсных систем с специальным ограничением в виде обобщенного "эллипсоида" в пространстве функций ограниченной вариации.
Условия разрешимости задачи
Предположим далее, что начальное состояние системы (1.1.1) точно не известно, но задано ограничивающее компактное множество XQ, содержащее это состояние: х( 0) = XQ Є Л"о Пусть XQ и Х\ - заданные выпуклые компакты в Rn.
Исследуется задача о переводе начальной области XQ (t = 0) вовнутрь заданного множества Х\ фазового пространства в момент времени і = Т. Такая задача рассматривалась ранее в работах [1, 6, 9, 54, 56, 57, 60, 66] и работах многих других авторов для систем обыкновенных дифференциальных уравнений, наиболее полно изучены вопросы управляемости, существования оптимального управления, необходимые условия оптимальности (основным из которых является принцип максимума Понтрягина), достаточные условия оптимальности и другие. Для импульсных систем подобные задачи рассматривались в работах Н.Н. Красовского, В.И. Гурмана, В.Ф. Кротова, СТ. Завалищина, А.Н. Сесекина, Ю.В. Орлова, Р. Винтера, Ф. Перейры, В.А, Дыхты, О.Н. Самсонюк и др. В случае одноточечных множеств XQ И Х\ при обычном требовании равноограниченности вариации решение указанной задачи хорошо известно [43, 54, 60]. В работах [3, 60] рассматривалась подобная задача при добавочном ограничении на управление в виде конуса. В данной работе (в отличие от предыдущих работ) изучается задача о переводе начальной области XQ (t — 0) вовнутрь заданного множества Х\ фазового пространства в момент времени t — Т при добавочном ограничении на управляющую функцию в виде обобщенного "эллипсоида" U в пространстве функций ограниченной вариации.
Теперь перейдем к точным постановкам. Дадим необходимые определения. Определение 1.1.2. Управление и {-) назовем допустимым, если и {-) еЫ и при любом начальном условии х(0) = XQ Є XQ решение системы (1.1.1) при u(t) = u (t) удовлетворяет требованию: х{Т) = х{Т;и (-),х0)=хг Є Лі.
Определение 1.1.3. Множеством достижимости Х(Т, XQ) (ИЗ начальной точки #о) в момент времени Т назовем множество всех точек фазового пространства R", в которые можно перейти на промежутке времени [0,Т] из заданного начального состояния XQ ПО решениям системы (1.1.1) при всех возможных управлениях Следовательно, щ Є . Таким образом, содержит все свои -слабые предельные точки, т.е. множество замкнуто в -слабой топологии. Лемма доказана.
Следствие. Множество U = является выпуклым и -слабо компактным. Доказательство. Выпуклость множества U и его ограниченность в V следует из определения данного множества. В лемме 1.2.1 доказана его -слабая замкнутость. Таким образом, U -слабо компактно.
Теорема 1.2.1. Для того, чтобы задача 1.1.1 была разрешима, необходимо и достаточно, чтобы множество допустимых управлений было не пусто.
Доказательство. Необходимость очевидна. Докажем достаточность. Предположим, что множество допустимых управлений не пусто. Рассмотрим множество норм допустимых управлений {Щг)1кр} Это множество ограничено снизу нулем, следовательно, найдется его точная нижняя грань си : 0 а со. Пусть {ип(-)} - такая последовательность допустимых управлений, что wn( )i/,p — а. Так как в V, снабженном -слабой топологией, ограниченные множества счетно-предкомпактны [49], то из последовательности {ип(-)} можно извлечь -слабо сходящуюся. Будем считать, что это уже сделано. Обозначим предел {и.п(-)} через и (-). Зафиксируем произвольное є 0. Опишем структуру множеств достижимости Х(Т, XQ) ИЗ каждой точки XQ Є XQ И полного множества достижимости Х(Т) XQ).
Рассмотрим множество С?, свойства которого дадут возможность в дальнейшем искать оптимальное управление в классе кусочно-постоянных функций с конечным множеством точек разрыва. Пусть G — подмножество пространства V\ состоящее из нулевой функции и функций дв (-) из следующего класса функций: для каждого 9 [0,7] и каждого , таких что QQ1 = 1, положим Очевидно, что множество G есть множество кусочно-постоянных функций, со скачком в момент времени 9 Є [0,Т], причем принадлежат границе эллипсоида
Принцип максимума в задаче импульсного управления
Следствие. Для любой точки х\, принадлежащей множеству достижимости Х{Т,Хо}, существует кусочно-постоянная функция и(-) Є U с не более чем 71 + 1 точками разрыва непрерывности и векторами скачков /\щ = u(ti) — u(U — 0) лежащими в эллипсоиде $ и начальные значения XQ Є XQ такие, что ж(Т; м(-), х$) — Х\.
Доказательство. Доказательство следствия вытекает из теоремы 1.3.1 и формулы (см следствия 1-2 леммы 1.3.2):
Из теоремы 1.3.1, учитывая специфику множества G, получаем следующую теорему, позволяющую искать оптимальное управление в классе кусочно-постоянных функций с меньшим числом точек разрыва непрерывности.
Теорема 1.3.2, Для любой точки х\, принадлежащей границе множества достижимости Д(Т, До) существует кусочно-постоянная управляющая функция и(-) Є U с не более, чем п точками разрыва непрерывности на отрезке [0, Г] и векторами скачков Ащ — u(ti) — u(ti — 0), лежащими в эллипсоиде $, и начальные значения хо Є До такие, что х(Т; U(-),XQ) = х\.
Доказательство. Пусть точка х\ лежит на границе множества достижимости Д(Г, До). Тогда найдутся м(-) Є U и XQ Є До, что х\ = Х(Т)х0 + А(и(-)). Обозначим х\ = х\ -Х(Т)х0 = А(и(-)). Рассмотрим вспомогательную задачу 1.1.1 (подобную задаче 1.1.1): найти управление щ Є U, переводящее XQ = 0 в х\ и имеющее минимальную норму 1Ы")1к = Wo"«o(0] = mm{«Olloo I О Є И, я(Т;«(), )) = її}.
Повторяя дословно доказательство теоремы 1.2.1 для указанной нормы , получим, что из непустоты класса допустимых управлений следует существование оптимальное управление ио(-), решающего эту новую задачу 1.1.1 . Следовательно, найдется управление щ(-) Є Ы, переводящее XQ В Х\У имеющее минимальную норму ио( )Н Эо а$- Если ао = О, то доказываемое очевидно. Рассмотрим случай, когда 0 0- Рассмотрим, вектор
Покажем, что х принадлежит границе множества А{Ы). Действительно, в противном случае найдется число $ 1 такое, что $х є A(W), то есть для некоторого щ(-) є U дх = А(щ(-)). Имеют место следующие равенства її = АЦ(.)) = А(ао« (0) = «оА(« (.)) - j № = AQ Щ(-)). an Управление — « () Є W, поскольку имеет место оценка iia / мі a и ми a - / 1 II- - M-)\\Q0 = j IMOIk - «о і an Таким образом, оказалось, что — щ(-) — допустимое управление, перево v дящее 0 в х\, причем из предыдущего неравенства следует, что это управление имеет норму, меньшую ao. Полученное противоречие доказывает, что х = А(и ( )) является граничной точкой множества А(Ы).
Таким образом, вектор х принадлежит п +1-мерному симплексу с вершинами А(щ(-)) є A{U). Поскольку х — граничная точка А(Ы), то либо ж лежит на грани симплекса, либо внутренность симплекса пуста и симплекс принадлежит некоторой гиперплоскости (размерности на 1 единицу меньше) . В каждом из этих случаев вектор ж является комбинацией п вершин симплекса: =ЛИ-)) = А?ЛК(-)), А? = І. А? с Очевидно, что управляющее воздействие u(t) = a0J2W(t), «f(-)eG, j=l является допустимым по ограничениям и(-), удовлетворяет требованиям теоремы о числе точек разрыва, и п \H-)ho «ОХ!А? \\иК )\\Яо ао-1=1 Следовательно, ІЩОІІФо = «о, и управление и(-) удовлетворяет равенствам А(и(-)) — яг, х\ X(T)XQ + А(и(-)). Теорема доказана.
В этом параграфе сформулировано необходимое условие оптимальности для рассматриваемой задачи 1.1.1 в форме принципа максимума. Предварительно примем следующее предположение.
Первый метод оценивания
В данной главе рассматриваются задачи оценивания решений динамических систем, описываемых дифференциальными уравнениями, содержащими обобщенные (импульсные) управляющие функции. При этом предполагается, что на управляющие функции наложено специальное ограничение, задаваемое обобщенным "эллипсоидом" в пространстве функций ограниченной вариации. В частности, при данном ограничении вектор точечного импульсного управляющего воздействия обязан лежать в заданном конечномерном эллипсоиде. Для управляемых систем, описываемых линейными дифференциальными уравнениями с классическими (измеримыми) управлениями, в настоящее время разработана полная теория построения оценок (внешних и внутренних) множеств достижимости таких систем, основанная на технике эллипсоидального и полиэдрального исчисления [60, 106, 88, 99]. В рамках этого подхода основная задача состоит в нахождении эллипсоида (или семейства эллипсоидов) в фазовом пространстве, оценивающего сверху или снизу по отношению к операции включения множеств искомую область достижимости. Специфика импульсной управляемой системы приводит здесь к необходимости построения эллипсоидальных оценок для выпуклой оболочки объединения семейства эллипсоидов (данный вопрос не возникает в случае задач оценивания состояний динамических систем с управлениями классического типа).
В этой главе рассмотрены схемы построения оценок множеств достижимости управляемых импульсных систем, основанные на идеях и методах эллипсоидального исчисления [88, 60].
Определение и оценивание множеств всевозможных фазовых состояний системы в различные моменты времени является одной из фундаментальных задач теории управления динамическими системами. Точное или приближенное знание множеств достижимости импульсной управляемой системы позволяет оценить предельные возможности системы, выбрать оптимальное управление. Однако практическое построение точного множества достижимости импульсной системы, основываясь на теоремах главы 1, в общем случае является весьма сложной задачей. Во многих случаях для решения прикладных задач достаточно построить аппроксимацию или оценку множества достижимости [53, 88,103, НО]. В данной задаче (при данном начальном множестве (2.1.2), и ограничениях на управляющую функцию (1.1.6)) как будет показано далее, учитывая инвариантность эллипсоидов относительно афинных преобразований и то, что эллипсоид в Шп определяется сравнительно небольшим числом параметров, удается эффективно построить внешнюю эллипсоидальную оценку множества достижимости.
Целью данной главы является построение эллипсоидальных оценок, внешних по отношению к операции включения множеств, для множе ства достижимости Х{Т\Х) системы (2.1.1) при ограничениях вида (1.1.6),(2.1.2).
Предположим вначале, что начальное состояние системы XQ точно известно. Не ограничивая общности и используя замену координат, можно считать Д о = {0}. Обозначим, как и ранее, символом Х{Т) = Х(Т\ {0}) область достижимости системы (2.1.1) при ограничениях вида (1.1.6),(2.1.2). Заметим, что в силу результатов главы 1 множество Г составлено из тех моментов времени т , где возможны скачки оптимальных (приводящих на границу области достижимости) управлений щ(-). Сначала сделаем следующее предположение, которое будет важно для описания алгоритма построения внешней эллипсоидальной оценки. Общий случай, когда данное предположение не выполнено, рассмотрен ниже в 2.5.
Таким образом, максимум достигается только в точках т = 0 или т = Т (в зависимости от выбора направления І). Нетрудно проверить, что при I, удовлетворяющем условию 1{Т + 1% — —І2-, максимум достигается в обеих точках т — 0 и т = Т. При других I т определяется однозначно (либо О, либо Т). Следовательно, множество % конечно.
Замечание 2.2.2. В общем случае экстремальное множество Г,(і) = {п Є [0,Т] j (G(r„0) = max (G(r,0) } не обязано быть конечным и (а, следовательно, и % = 1){Т (1), І ф 0} может быть бесконечным) (см. ниже пример 2.5.1). Поэтому предположение П существенно. В следующей теореме получим представление множества достижимости системы (2.1.1), которое будет необходимо для построения алгоритма.
Построение е-оценок областей достижимости
Ранее предполагалось, что выполнено предположение П. Рассмотрим общий случай, когда это предположение может быть не выполненным. Справедлива следующая теорема
Теорема 2.4.1, Для любого числа е 0 существует 5 О и конечное множество Т$ С [О, Т] такие, что при всех І Є Кп имеют место оценки Функция f{r,l), очевидно, непрерывна в [О, Г] х Ж71 и, следовательно, равномерно непрерывна на компакте [О, Т] х S. Поэтому для любого є О можно найти $ 0 такое, что Отсюда, воспользовавшись положительной однородностью функции f(r, /) по /, получим неравенства (2.4,1). Таким образом, применяя процедуру, описанную в 2,2-2.3 для конечного Т = Г , можно получить внешние эллипсоидальные аппроксимации множества Х(Т\Х$) +є5 при любом достаточно малом є 0.
Пример 2.4.1 Оценим множество достижимости ( /21) импульсной системы дифференциальных уравнений, построенное в примере 1.6.2 (см. Рис.1.6) для системы:
Нетрудно проверить, что предположение П здесь не выполнено, так как моменты т ; в которых достигаются максимальные значения в (1.6.6), зависят от направления /, Поэтому в соответствии с теоремой 2.4.1 воспользуемся процедурой построения е-эллипсоидальных оценок. Отметим, однако, что для любого конечного набора точек Т = {0 = TQ т\ ... 7 Г}, уже на первом шаге процедуры 2.3 при построении эллипсоида Е исходя из То и ЕГ1, получим шар Еч = 5(0, й) = {х \ х х R }, R = max{a, Ь}. Тогда нетрудно проверить, что при г 2 вновь будем иметь Е{ = 5(0, і?) и, следовательно, X{-KJ2\XQ) С 5(0,Я) + sS при любом є 0, откуда получаем Х(ж/2\ До) Q S(0, R), что иллюстрирует Рис. 2.7.
Отметим, что другие подходы к построению внешних эллипсоидов, содержащих объединение двух заданных эллипсоидов, описаны в опубликованной недавно работе [12]. Методы, представленные в указанной работе, базируются на идеях [60, 106, 88] аппроксимации заданного множества бесконечными семействами эллипсоидов, пересечение которых дает оцениваемое множество. В рассматриваемом примере (для случая двух эллипсоидов) эллипсоиды, построенные в соответствии с результатами работы [12], изображены на рис. 2.8. Отметим, что методы оценивания, предложенные в [12], для решения задач оценивания множеств достижимости импульсных систем не применялись.
В этом параграфе рассматриваются вопросы зависимости от числового параметра є О множеств достижимости и оптимальных решений задачи о переводе начального выпуклого компакта XQ вовнутрь другого заданного выпуклого компакта Х\ по траекториям импульсной дифференциальной системы (1.1.1) при эллипсоидальных ограничениях на импульсы.
Отметим, что результаты, приведенные в теореме 2.5.1, могут быть получены также и без введения предельной системы (2.5.2), а сразу для исходной системы (1.1.1), но при коническом ограничении К на импульсы [3] частного вида — подпространстве П : К = П .
Далее в этом параграфе будем предполагать, что предельная задача 2.5.2 разрешима. Установим связь решения е-задачи 2.5.1 и решения задачи 2.5.2 (при є - 0).
Теорема 2,5.2. Пусть предельная задача 2.5.2 разрешима и &о — минимальное значение нормы допустимого управления, причем йо О 1. Тогда существует є 0 такое, что -задача 2.5.1 при всех 0 є є также разрешима.
Доказательство. Рассмотрим предельную задачу, полагая в ней ро = 2. Нетрудно видеть, что в силу предположения теоремы о разрешимости задачи при заданном значении р (вообще говоря, р и ро - разные), разрешимость задачи также имеет место и при р$ — 2, причем соответствующее оптимальное значение вариации UQ также положительно