Содержание к диссертации
Введение
Глава I. Оптимизация критерия качества во внутренних точках выпуклых множеств . 17
1. Необходимые и достаточные условия оптимальности управления. 17
2. Частные случаи условий оптимальности для некоторых видов функционалов .27
Глава II. Решение задачи оптимизации для точек выпуклого многогранника . 40
1. Схема поиска оптимального управления для выпуклых многогранников . 40
2. Минимизация радиуса конечной окрестности для линейных систем .
Глава III. Задача оптимизации для систем с неизвестным видом общего решения . 74
1. Постановка задачи. Общий вид решения нелинейной системы. 74
2. Критерий оптимальности для точек границы множества допустимых управлений 82
3. О необходимых условиях существования оптимальных управлений внутри множества 92
Заключение. 106
Приложение. 107
Литература. 109
- Частные случаи условий оптимальности для некоторых видов функционалов
- Схема поиска оптимального управления для выпуклых многогранников
- Минимизация радиуса конечной окрестности для линейных систем
- Критерий оптимальности для точек границы множества допустимых управлений
Введение к работе
Актуальность темы. В настоящей работе изучаются управляемые системы обыкновенных дифференциальных уравнений. Для таких систем ставится задача управления в условиях неопределенности. Целью исследования является поиск среди допустимых программных управлений оптимального, являющегося таковым для всех движений рассматриваемой системы.
Необходимость решения данной задачи возникает при математическом моделировании физических, химических, биологических, социально-экономических и других процессов [5,11,12,18,30,59,62,63,81,84,86,91], так как большое число реальных процессов описывается системами дифференциальных уравнений, содержащими управляющий параметр. Например, в системе "хищник-жертва" в качестве управляющего воздействия можно рассматривать изъятие особей, при описании химических реакций - количество катализатора. Особый интерес представляют методы исследования нелинейных систем, динамика которых описывается дифференциальными уравнениями высокого порядка, поскольку именно такие модели характерны для большинства реальных объектов. При этом возникает задача об управляемости системы, причем зачастую одновременно требуется оптимизировать некоторый критерий качества.
Предмет теории оптимальных процессов известен широко. Принципиальные ее положения, касающиеся математической стороны вопроса, -фундаментальный принцип максимума Л.С. Понтрягина и необходимые условия оптимальности, теория линейных систем, основы метода динамического программирования [10,29,56], - приобрели характер классических результатов. Существенный вклад в теорию управления внесли Р. Калман, Н.Н. Красовский, В,И. Зубов, Р. Беллман, В.Г. Болтянский, Р.В. Гамкрелид-зе, А.Б. Куржанский. Дальнейшее развитие эта теория получила в работах Р.Ф. Габасова, Ф.М. Кирилловой, Е.Л. Тонкова [16,23,70,71].
Хотя математические постановки задач программного управления стимулировались практическими потребностями, классические их варианты были рассчитаны на идеальные условия, а именно, на существование безупречной по строгости математической модели системы и на полную априорную информацию об исходных данных. Однако далеко не каждая прикладная задача управления укладывается в подобные классические рамки. Неполнота исходных данных приводит к так называемым информационным задачам.
Весьма распространенной при исследовании математической модели является ситуация, когда априорные данные о неизвестных параметрах системы минимальны: какое-либо статистическое их описание отсутствует, а соответствующая информация ограничивается заданием лишь допустимых областей изменения неизвестных величин. Изучение ситуаций, характеризующихся указанными информационными ограничениями, приводит к теории управления в условиях неопределенности. Такие задачи носят весьма общий характер.
Решение задачи поиска оптимального управления в условиях неопределенности проводится в работе [37]. Оно осуществляется в рамках детерминированного подхода, основанного на методах минимакса. Однако полученная теория относится сугубо к системам, линейным как по фазовым переменным, так и по управлению. В связи с этим целесообразно рассмотреть поставленную задачу для нелинейных систем, которые наиболее часто встречаются при описании реальных объектов.
Следует заметить, что применение элементов выпуклого анализа, например, поиск выпуклой оболочки функции, верхней огибающей и т. п., само по себе является нетривиальной задачей. Поэтому представляют интерес методы, позволяющие получить ответ на вопрос об оптимальности управления без использования подобных конструкций.
Изложенные факты позволяют считать тему диссертации актуальной.
Цель работы. Рассматривается система обыкновенных дифференциальных уравнений
x = f{t,x,u), (0.1)
в которой f(t,x,u) - «-мерная вектор-функция, хей" - фазовая перемен
ная, u%Rp — управление, р<п. Предполагается, что начальное состояние
системы неизвестно заранее, а задано лишь ограничение на допустимые
значения этой величины: х еХ, где Xа - выпуклое компактное множест
во в К". Для системы (0.1) строится множество
X(t; «()) = (х | j: = x(t; х,«()), х єХи\. Определяется функционал
Ф(и(;))-т&х<р(х), хеХ(Т;и{)), где Т - фиксированное число, <р{х) - функция,
определенная вй".
Ставится задача определения положения допустимого управления и" (), удовлетворяющего условию
ф(н('))=тштахф(лс), де є ЛГ(Т;и(-))- (0.2)
Целью работы является получение необходимых и достаточных условий того, что допустимое управление удовлетворяет равенству (0.2).
Методика исследования. Допустимые управления ы() отыскиваются в виде u(t) = K(t)c, где K(t) - рх п -матрица ограниченных измеримых известных функций, сеС - неизвестный постоянный вектор, С - выпуклое компактное множество в пространстве R".
Исследования опираются на свойства коэффициентов в разложении функций по формуле Тейлора в окрестности исследуемого на оптимальность управления в случае, когда известно общее решение системы (0.1), или в окрестности известного движения, если общее решение системы (0.1) неизвестно.
В случае, когда известен вид общего решения системы (0.1), необходимые и достаточные условия оптимальности управления для внутренних и
граничных точек множества С формулируются в терминах разрешимости систем недифференциальных уравнений и неравенств.
Если известно только одно частное решение системы (0.1), то задача решается на сужении исходного множества с. Доказательства теорем о существовании управлений, удовлетворяющих необходимому условию оптимальности, основаны на применении метода неподвижной точки нелинейного оператора.
Основные результаты, имеющиеся по данной проблеме. Математическая теория управления возникла сравнительно недавно, ее интенсивное развитие приходится на вторую половину XX века и связано с совершенствованием техники и усложнением социальных процессов [11,30,57,58,78]. Одной из основных задач теории управления является проблема перевода управляемого объекта в заданное конечное состояние. При постановке задачи управления часто требуется оптимизировать характеристики протекающего процесса. Работы [2,10,24,49,56,60], посвященные вопросам оптимального управления, основываются на предположении об управляемости системы.
Одновременно с классической возникла информационная теория управления, исследующая задачи с неполными априорными данными или сведениями о текущем состоянии системы. Теорию стохастического управления составляют задачи, в которых описание недостающих величин носит вероятностный характер. В работе [52] неизвестные входные воздействия, начальные данные и параметры моделируются при помощи марковских случайных процессов с заранее известными характеристиками. Вопросам о наилучшей оценке положения траектории вероятностной системы по доступным измерению величинам посвящена теория стохастической фильтрации. В работах [25,83] проблема оценки положения траекторий рассматривается для линейных систем и квадратичного критерия оптимума. Ограничения на применение теории стохастического оценивания связаны с тем,
что процессы, рассматриваемые во многих прикладных задачах, имеют только ограниченное число наблюдений, характеризуются неполнотой информации о данных задачи и отсутствием статистических характеристик возмущений и ошибок измерений. Часто требуется находить оценки, обеспечивающие некоторый гарантированный результат. Требования такого рода возникают в различных задачах механики, инженерии, биомедицины, проблемах, связанных с изучением окружающей среды. Они типичны для задач навигации и оценивания движения механических систем. Альтернативой вероятностному подходу к задачам оценивания стал гарантированный подход, основанный на представлении априорной информации о неизвестных параметрах при помощи задания множеств, содержащих эти параметры. На основе этого подхода получила развитие теория позиционного наблюдения. В рамках этой теории оценки состояний динамических систем с неопределенными возмущениями по данным наблюдений формируются апостериори по ходу процесса наблюдения в виде функций от наблюдаемого сигнала. Ключевым здесь является понятие информационного множества, определяемого как множество всех возможных состояний системы, совместимых с результатами измерения и априорными ограничениями на неизвестные возмущения и ошибки измерений. В работах А.Б, Куржанского [33,35,38] содержатся исследование свойств информационных множеств и минимаксных оценок, описание их динамики, изучение вопросов устойчивости, разработка вычислительных процедур для их построения. Куржан-ским А.Б. разработаны алгоритмы позиционного управления по неполным данным в условиях противодействия и помех, когда в качестве позиции рассматривается информационное множество системы, исследованы вопросы сочетания процедур управления и наблюдения [34,36]. В работе [39] созданы конструктивные методы описания семейств траекторий некоторых дифференциальных включений, сохраняющихся в течение предписанного времени в пределах заданного множества фазового пространства. В линей-
ном случае доказана теорема о точном описании областей достижимости дифференциальных включений с фазовыми ограничениями.
Предложенный в работе [19] подход позволяет для систем с неопределенностью при двойных ограничениях x(t)~B(t)u(t), k(t) = \\u(t}\2, t є [/„,/,] указать области достижимости и разрешимости. В работе [76] свойства множества достижимости исследуются для нелинейной системы x = Ax + u
со скалярным ограниченным управлением. Никольским М.С. [51] для системы х = f(x,u) получена оценка изнутри для множества достижимости D(t): 0 є ШК с D(f), где К - некоторый эффективно вычислимый выпуклый компакт. Для системы х = Ах + Ви в банаховом пространстве X с линейным оператором В множество достижимости строится в работе [89], там же указываются условия управляемости. Задача определения области управляемости для указанной системы с постоянными параметрами, в которой xeR", и є Л', ||ы|<Л/>0, рассматривается в работах
[10,25,26,41,56,60,74,75], получено ее исчерпывающее решение. Нармано-вым А.Я., Петровым Н.Н. [49] рассматривается вопрос о структуре множества управляемости, в частности, о его размерности и границе. В работе [90] получены условия управляемости и достижимости линейных систем с переключениями, дана полная геометрическая характеристика этих множеств.
Проблема управляемости дифференциальных уравнений исследуется в работе [29] Красовского Н.Н. Для системы линейных уравнений x = A(t)x + B(t)u + w(t), x(ta) = xa задача об управлении рассматривается как
проблема моментов. Формулируются необходимые и достаточные условия существования оптимального решения, определяется его зависимость от краевых условий. Там же ставится задача управления квазилинейными объектами, поведение которых в окрестности точки х = 0 описывается системой вида х = f(t,x)+g{t,x)ui x(ta) = xa, *((д) = - В предположении, что сие-
тема линейного приближения вполне управляема на отрезке l*tt,^J, методом последовательных приближений доказывается существование релейного управления, разрешающего краевую задачу и отличающегося от оптимального на величину второго порядка малости по |х"|.
Исследованию квазилинейных систем уделяли внимание Альбрехт Э.Г., Соболев О.Н. В работах [3,4] для управляемой системы х = A(t)x + b(t)u + fsf(x,t), x(ta)=x", x{tp) = Q в предположении о полной управляемости системы первого приближения указывается итерационный метод построения оптимального управления.
Проблеме синтеза управления, разрешающего краевую задачу, много внимания уделяется Зубовым В.И. [23]. В ряде случаев им синтезируется семейство требуемых управлений, с помощью метода последовательных приближений рассматривается возможность численного решения задачи.
Исследованию свойств локальной управляемости систем посвящены работы [46,47,48,49,54,65,69]. В работах [65,69] изучаются системы, не являющиеся в общем случае управляемыми, исследуется проблема определения множества управляемости.
Пантелеевым В.П. в работе [54] устанавливается критерий локальной управляемости линейной по состоянию нестационарной динамической системы x = A(t)x + b(t,u).
В работах [46,47,48] Митрохиным Ю.С., Степановым А.Н. исследуется система вида х= f(x)+Bu. В случаях, когда система линейного приближения неуправляема, формулируются необходимые и достаточные условия управляемости нелинейной системы в малом.
В работе Тонкова Е.Л. [70] в предположении полной управляемости системы линейного приближения получены достаточные условия управляемости нелинейной системы. Проблема полной управляемости линейных нестационарных систем рассмотрена в статье [45].
Львовой Л.Л. [42,43] для нелинейной системы в предположении, что система линейного приближения может не быть вполне управляемой, получены условия существования пары "управление-параметр", которая переводит объект из нулевого начального в нулевое конечное состояние. В работах [79,80] Шарафеевым Д.Р. найдены условия существования тройки "начальное значение-управление-параметр", разрешающей периодическую краевую задачу. Устойчивость управления по параметру исследуется в работах [66,67]. В работах [21,22] получены достаточные условия существования кусочно-постоянного управления, разрешающего глобальную краевую задачу.
В статье [28] приводятся достаточные условия существования семейства управлений и(хп,х'\), переводящих точку х e.R" в точку хт ей" и непрерывно зависящих от ха,хт, для систем, матрица коэффициентов систем линейного приближения которых является треугольной, В качестве следствия получена полная управляемость равномерно ограниченных возмущенных систем данного класса при условии глобальной липшевости правой части по х и и .
Проблема управляемости исследуется Воскресенским Е.В. В работах [13,14,15] методом сравнения определены условия управляемости нелинейных систем как за конечное, так и за бесконечное время.
Метод сравнения используется в работах Павлова А.Ю. В статье [53]
система — = A{t)x+B(t)u+f(t7x,u)+F(t) сравнивается с соответствующей ли-dt
нейной системой в предположении, что в фиксированном классе допустимых управлений система сравнения управляема.
Для поиска управлений, разрешающих краевую задачу, Терехин М.Т., Землякова Л.С. [68] предлагают метод вариации промежуточной точки, Га-басов Р.Ф., Кириллова Ф.М. [16] используют метод приращений, рассматриваемых на траекториях системы.
Задачам управления и оценке координат системы в условиях неопределенности посвящена монография Куржанского А.Б. [37]. В ней рассматривается система обыкновенных дифференциальных уравнений x = A(t)x + B(t)u + w(t), t0
Задача управления по неполным данным исследуется в работе Ананьиной Т.Ф. [8]. В ней рассматривается управляемая система х = f(t,x,u) и доказывается, что управление ы"() является оптимальным, если выполнено условие
max min min Js(r 11,хУ())Щт,х{т J х\и0()\и0(т)^{т)~иа{т))іт = 0,
\ f x * (/Li-
где s(r) = s(r |i,je",H(,(-)) -решение сопряженной системы.
В статье [88] рассматриваются параметрические управляемые системы, описываемые нелинейными эволюционными уравнениями. Доказывается теорема существования для соответствующей минимаксной задачи. Рассмотрены также непараметрические задачи с немонотонными операторами.
В статье [20] рассматривается задача программного управления обыкно
венным дифференциальным уравнением в классе ограниченных измери
мых функций. Функционалом качества является
'і /(*(-),«(),/,) = sup JF(x,u,y,v)dt. Ставится задача минимизации этого функцио-
нала при известных ограничениях. Указываются необходимые условия то-
го, что тройка л^О^О-Л является оптимальным процессом поставленной задачи.
В работе [9] для задачи оптимального управления x = f(x,u>t), x(tn) = x", *єЬо>*і\> u{t)tU, ^jc(/,))->min строится третья вариация приращения опти-
мизируемого функционала качества (p{x(tx))~
на пакете вариаций управления.
В статьях [31,32] рассмотрены задачи оптимального управления линейными системами при различных ограничениях на фазовые координаты системы, выявлены некоторые свойства оптимальных решений.
В работе [19] Дарьиным А.Н., Куржанским А.Б. рассматривается задача о нелинейном синтезе управления в системе с линейной структурой x{t) = B(t)u(t), k(t)=\]fi(tJl2, /є[f„,f,] при одновременном воздействии двух ви-
дов ограничений на управление — интегральных І]|и(/)|(г^ґ k(t(l) и геометри-
ческих |ы(г)[| < м. Решение задачи проводится на основе метода динамического программирования. Указывается структура разрешающих стратегий. Предложенный авторами подход допускает распространение на системы с неопределенностью.
В работе [82] задача оптимизации квадратичного функционала на траекториях системы у = Ау + /(є,у)+Ви на [о,т] также решается с помощью методов динамического программирования.
Авторами работы [87] получен аналог критерия Калмана для систем с запаздыванием. Применению критерия Калмана к исследованию систем посвящена статья [85].
В последнее время появились работы [6,7], направленные на численное решение задач математической теории управления. В работе [6] указывается алгоритм получения управления, переводящего систему в состояние покоя. В качестве примера рассматривается задача об управлении материаль-
ной точкой неизвестной массы, перемещающейся вдоль горизонтальной прямой, В статье [7] исследуется задача управления механической системой, представляющей собой две материальные точки, соединенные пружиной и перемещающиеся вдоль параллельных прямых. Предполагается, что массы точек и жесткость пружины неизвестны и на точки действуют силы сухого трения с неизвестными переменными коэффициентами. Строится закон управления, приводящий первую массу в заданное положение за конечное время. Эффективность предлагаемого закона управления демонстрируется с помощью численного моделирования.
Содержание работы. Работа посвящена исследованию управляемости системы в условиях неопределенности. В отличие от работ [22,42,43,67,80], в которых задано начальное положение объекта, в диссертации информация о начальных значениях ограничивается заданием допустимой области их изменения. Управление выбирается одним и тем же для всего ансамбля движений системы. Одной из основных задач, решаемых в теории оптимального управления, является выяснение условий, гарантирующих существование оптимального управления для некоторого управляемого процесса. Достаточные условия оптимальности управления, сформулированные в работе [8], опираются на выпуклость функционала качества. В настоящей работе оптимизируемый функционал не ограничен требованиями выпуклости. Задача управления в условиях неопределенности рассматривается в монографии Куржанского А.Б. В ней необходимые и достаточные условия оптимальности формулируются исключительно для систем, линейных как по фазовым переменным, так и по управлению. В данной работе для нелинейных систем приводится критерий оптимальности для граничных точек множества допустимых управлений, указываются условия, при выполнении которых возможно существование оптимальных управлений внутри рассматриваемого множества. Необходимые условия оптимальности, сформулированные в работах [8,37], используют конструкции выпуклого
анализа, и их проверка сама по себе представляет нетривиальную задачу. В диссертации необходимые и достаточные условия оптимальности управления формулируются в терминах разрешимости систем недифференциальных уравнений и неравенств. Применение сформулированных условий иллюстрируется примерами.
Диссертация состоит из введения, трех глав, разбитых на параграфы и приложения. Во введении содержатся обоснование актуальности темы, цель работы, методика исследования, краткий обзор результатов других авторов, краткое содержание работы.
В 1 главы I дается постановка задачи, вводятся основные определения. Формулируются необходимые и некоторые достаточные условия оптимальности управления для внутренних точек области допустимых управлений. Приводится пример управляемой системы с неопределенностью по начальным данным, для которой находится управление, переводящее все траектории данной системы в наименьшую окрестность начала координат, В 2 на основе теорем предыдущего параграфа формулируются условия оптимальности, более удобные для применения на практике, но требующие наложения дополнительных ограничений на оптимизируемый критерий качества. Приводится пример линейной управляемой системы, для которой находится оптимальное управление.
Вторая глава посвящена получению условий оптимальности управления для граничных точек множества допустимых управлений в случае, когда это множество и множество начальных значений являются выпуклыми многогранниками. В 1 находятся необходимые и достаточные условия оптимальности управления для рассматриваемого случая. Вводится определение правильной грани, исследование точек правильных граней проводится с применением базиса особого вида, доказывается существование такого базиса и независимость результатов от его выбора. Приводится схема исследования, которая позволяет найти управление, решающее задачу опти-
мизации на всем ансамбле траекторий системы. Применение найденного алгоритма проиллюстрировано примерами. В 2 рассматривается приложение теории к линейным системам в случае, когда оптимизируемый функционал представляет собой евклидову метрику, указываются простые по структуре множества, элементами которых являются оптимальные управления.
Проблемам поиска оптимального управления для нелинейных систем с неизвестным видом общего решения посвящена глава III. Предполагается, что известно одно частное решение системы при некотором значении управления. В 1 вводятся основные определения и обозначения. Заменой переменных исследуемая система сводится к более удобному для изучения виду. Предлагается способ определения вида решения нелинейной системы с точностью до членов нужного порядка. В 2 исследование проводится на сужении исходных множеств допустимых управлений и начальных значений. Рассматривается случай, когда внутренние точки множества допустимых управлений не удовлетворяют необходимому условию оптимальности. Для граничных точек этого множества формулируется критерий оптимальности. В качестве примера приводится управляемая система "хищник-жертва", для которой указывается возможное положение оптимального управления. Вопросу о наличии оптимального управления внутри множества С посвящен 3. Рассматриваются условия, при выполнении которых возможно существование таких управлений. Указывается оценка окрестности нулевого управления, в которой может быть расположено оптимальное. Применение теории иллюстрируется примерами.
В приложении содержится программа, написанная на языке Pascal и позволяющая найти приближенное значение оптимального управления для системы двух дифференциальных уравнений.
Необходимые сведения по математическому анализу взяты из [73], по теории дифференциальных уравнений - из [50,55,77], по линейной алгебре
- из [17,40], по выпуклому анализу - из [61], по функциональному анализу -из [1,27,44,72].
На защиту выносятся следующие положения:
Необходимые и достаточные условия оптимальности управления.
Условия, при которых оптимальными могут быть только граничные точки множества допустимых управлений, и соответствующий критерий оптимальности.
Условия, при которых управления, удовлетворяющие необходимому условию оптимальности, находятся внутри множества и оценка их положения.
Апробация диссертации. Основные результаты докладывались на заседаниях научно-исследовательскрго семинара по качественной теории дифференциальных уравнений в Рязанском государственном педагогическом университете, на IV, V, VII Всероссийских научно-технических конференциях студентов, молодых ученых и специалистов "Новые информационные технологии в научных исследованиях и в образовании" в Рязанской государственной радиотехнической академии, на V Международной конференции "Дифференциальные уравнения и их приложения" в г.Саранске, на III Всероссийской научной конференции "Современные проблемы математики, механики, информатики" в г.Туле, на X Международной конференции "Математика. Компьютер. Образование." в г.Пущино.
Основные результаты исследований опубликованы в работах [92-106].
Частные случаи условий оптимальности для некоторых видов функционалов
Часто требуется находить оценки, обеспечивающие некоторый гарантированный результат. Требования такого рода возникают в различных задачах механики, инженерии, биомедицины, проблемах, связанных с изучением окружающей среды. Они типичны для задач навигации и оценивания движения механических систем. Альтернативой вероятностному подходу к задачам оценивания стал гарантированный подход, основанный на представлении априорной информации о неизвестных параметрах при помощи задания множеств, содержащих эти параметры. На основе этого подхода получила развитие теория позиционного наблюдения. В рамках этой теории оценки состояний динамических систем с неопределенными возмущениями по данным наблюдений формируются апостериори по ходу процесса наблюдения в виде функций от наблюдаемого сигнала. Ключевым здесь является понятие информационного множества, определяемого как множество всех возможных состояний системы, совместимых с результатами измерения и априорными ограничениями на неизвестные возмущения и ошибки измерений. В работах А.Б, Куржанского [33,35,38] содержатся исследование свойств информационных множеств и минимаксных оценок, описание их динамики, изучение вопросов устойчивости, разработка вычислительных процедур для их построения. Куржан-ским А.Б. разработаны алгоритмы позиционного управления по неполным данным в условиях противодействия и помех, когда в качестве позиции рассматривается информационное множество системы, исследованы вопросы сочетания процедур управления и наблюдения [34,36]. В работе [39] созданы конструктивные методы описания семейств траекторий некоторых дифференциальных включений, сохраняющихся в течение предписанного времени в пределах заданного множества фазового пространства. В линейном случае доказана теорема о точном описании областей достижимости дифференциальных включений с фазовыми ограничениями.
Предложенный в работе [19] подход позволяет для систем с неопределенностью при двойных ограничениях x(t) B(t)u(t), k(t) = \\u(t}\2, t є [/„,/,] указать области достижимости и разрешимости. В работе [76] свойства множества достижимости исследуются для нелинейной системы x = Ax + u p(x)b + d со скалярным ограниченным управлением. Никольским М.С. [51] для системы х = f(x,u) получена оценка изнутри для множества достижимости D(T): 0 є ШК с D(f), где К - некоторый эффективно вычислимый выпуклый компакт. Для системы х = Ах + Ви в банаховом пространстве X с линейным оператором В множество достижимости строится в работе [89], там же указываются условия управляемости. Задача определения области управляемости для указанной системы с постоянными параметрами, в которой xeR", и є Л , ы Л/ 0, рассматривается в работах [10,25,26,41,56,60,74,75], получено ее исчерпывающее решение. Нармано-вым А.Я., Петровым Н.Н. [49] рассматривается вопрос о структуре множества управляемости, в частности, о его размерности и границе. В работе [90] получены условия управляемости и достижимости линейных систем с переключениями, дана полная геометрическая характеристика этих множеств.
Проблема управляемости дифференциальных уравнений исследуется в работе [29] Красовского Н.Н. Для системы линейных уравнений x = A(t)x + B(t)u + w(t), x(ta) = xa задача об управлении рассматривается как проблема моментов. Формулируются необходимые и достаточные условия существования оптимального решения, определяется его зависимость от краевых условий. Там же ставится задача управления квазилинейными объектами, поведение которых в окрестности точки х = 0 описывается системой вида х = f(t,x)+g{t,x)ui x(ta) = xa, ((д) = - В предположении, что система линейного приближения вполне управляема на отрезке l tt, J, методом последовательных приближений доказывается существование релейного управления, разрешающего краевую задачу и отличающегося от оптимального на величину второго порядка малости по х".
Исследованию квазилинейных систем уделяли внимание Альбрехт Э.Г., Соболев О.Н. В работах [3,4] для управляемой системы х = A(t)x + b(t)u + fsf(x,t), x(ta)=x", x{tp) = Q в предположении о полной управляемости системы первого приближения указывается итерационный метод построения оптимального управления.
Проблеме синтеза управления, разрешающего краевую задачу, много внимания уделяется Зубовым В.И. [23]. В ряде случаев им синтезируется семейство требуемых управлений, с помощью метода последовательных приближений рассматривается возможность численного решения задачи. Исследованию свойств локальной управляемости систем посвящены работы [46,47,48,49,54,65,69]. В работах [65,69] изучаются системы, не являющиеся в общем случае управляемыми, исследуется проблема определения множества управляемости. Пантелеевым В.П. в работе [54] устанавливается критерий локальной управляемости линейной по состоянию нестационарной динамической системы x = A(t)x + b(t,u). В работах [46,47,48] Митрохиным Ю.С., Степановым А.Н. исследуется система вида х= f(x)+Bu. В случаях, когда система линейного приближения неуправляема, формулируются необходимые и достаточные условия управляемости нелинейной системы в малом. В работе Тонкова Е.Л. [70] в предположении полной управляемости системы линейного приближения получены достаточные условия управляемости нелинейной системы. Проблема полной управляемости линейных нестационарных систем рассмотрена в статье [45]. Львовой Л.Л. [42,43] для нелинейной системы в предположении, что система линейного приближения может не быть вполне управляемой, получены условия существования пары "управление-параметр", которая переводит объект из нулевого начального в нулевое конечное состояние. В работах [79,80] Шарафеевым Д.Р. найдены условия существования тройки "начальное значение-управление-параметр", разрешающей периодическую краевую задачу. Устойчивость управления по параметру исследуется в работах [66,67]. В работах [21,22] получены достаточные условия существования кусочно-постоянного управления, разрешающего глобальную краевую задачу.
В статье [28] приводятся достаточные условия существования семейства управлений и(хп,х \), переводящих точку х e.R" в точку хт ей" и непрерывно зависящих от ха,хт, для систем, матрица коэффициентов систем линейного приближения которых является треугольной, В качестве следствия получена полная управляемость равномерно ограниченных возмущенных систем данного класса при условии глобальной липшевости правой части по х и и .
Схема поиска оптимального управления для выпуклых многогранников
В 1 доказаны необходимые и достаточные условия оптимальности управления для внутренних точек области допустимых управлений. Исследование оптимальности управления выполнено с помощью разложения по формуле Тейлора заданного функционала. Необходимое и достаточное условия оптимальности связаны со свойствами коэффициентов этого разложения.
В 2 на оптимизируемый критерий качества наложены дополнительные ограничения, которые позволяют сформулировать условия оптимальности, более удобные для практического применения. 1. Нобходимые и достаточные условия оптимальности управления. Пусть движение управляемой п -мерной системы подчиняется уравнению где f(t,x,u) - п-мерная вектор-функция, xsR" - фазовая переменная, ueRp - управляющее воздействие, р п, t [ttl;T]. Пусть С -ограниченное замкнутое выпуклое множество в пространстве R". Допустимые управления «() представляются в виде u(t)=K(t)c, где K(t) - рхп-матрица ограниченных измеримых известных функций, с С - неизвестный постоянный вектор. Обозначим 17(-) - класс допустимых управлений. Так как множество значений управления u(t) ограничено, то существует выпуклый компакт V ей , такой, что u(t)eU при t є[r0;т]. Предположим, что функция f(t,x,u)t определенная на множестве О = [ 0;Т]хГх1/, где Г открыто в R", такова, что при любом u{)eU() для любого /еГ существует единственное решение системы (1.1) x = x{t;x,«()), определенное на отрезке \t0;T] и удовлетворяющее начальному условию х" =x(t0,xa,u(;)). Будем считать, что начальное состояние системы неизвестно заранее и задано лишь ограничение на допустимые значения этой величины, а именно, условие /еґ, где Xа - заданное выпуклое компактное множество в R". Тогда в каждый момент времени t известно множество х( и(;))=\х\х = х ;ха,и{)\ха JT0}, объединяющее все траектории системы, полученные при одном и том же управлении и = и(() и при всех возможных векторах "el". Будем говорить, что множество X{t;u{)}, t0 t Tt есть ансамбль траекторий, порожденных множеством Xа и управлением «(). Учитывая, что u(t)=K(t)c, множеству x(t,u{)) поставим в соответствие множество X(t;c) \x\x = x\f;x[),c\xn &Х\. Выбирая функцию u(t), можем управлять положением ансамбля в пространстве. Отметим, что управление определяется в форме программы, то есть, в виде функции времени. Тем самым предполагается, что никакой дополнительной информации о процессе, кроме заданной в самом начале, в систему не поступает. Будем считать, что для всех сеС и всех х" ЕХС решения системы (1.1) определены на всем отрезке [ „;Г], непрерывно зависят от начальных данных и параметра и имеют частные производные по начальным данным и параметру до третьего порядка включительно. Определим множество я(м()) вариаций управления и()є/() равенством H(u0$=fa)\h{f) = u{t)-u(t\te[t0\T\u() =U{)}. Ему соответствует множество Я(С)={ЛА = С-С,СЄС}, где a0(f)=tf(f)c\ u(t) = K(t)c. Предположим, что р = р(х) - функция в R", имеющая частные производные по всем координатам вектора х до третьего порядка включи тельно и принимающая конечные значения. Определим функционал Ф() на множестве и{) равенством Ф(и())= max # ( ), хєХ(т-уи{)). Ему соответствует функция Ф(с)= тах р{х\ х є Л с), определенная на множестве С. Ставится следующая задача: в классе функций /() найти оптимальное управление и(,(), удовлетворяющее условию или же во множестве С найти такое с\ что ф(с )= min max р(х\ с є С, х є Х Т; с), или, что то же самое, Управление, удовлетворяющее этому минимаксному равенству, решает задачу оптимизации на всем ансамбле траекторий системы (1.1). Подобная задача ставится в работах [8,37} Пусть Ає[0;і]. Дадим вектору с0 є С приращение М, такое, что с+ЛАєС. Разложим по формуле Тейлора функцию (Т; ", ;)) в окрестности точки си, получим где }гъН(сп), о{т;хи,са) - л-мерный вектор из производных р\, y(t;x\ сп, Лк) = x(t;x\ca +Ah) x({t;x" ,с9)). Заметим, что y(t;x{i,c( ,M)=F(t;xa c : )Ah+oi\Ah\)t где F{t;xn ,с") - пхп-матрица Якоби из производных х с. Убедимся, что Й»0У) есть ( ЛА). Действительно, F{t;x",c") ограничены. Таким образом, разложение функции р[х\Г;хп,сц в окрестности точки сп можно представить в виде Теорема 1.1. (Необходимоеусловие оптимальности)Пусть с0 eintC. Тогда для того, чтобы точка с0 доставляла минимум функции Ф(с), необходимо, чтобы для любого направления Ае#(с)\{о} выполнялось условие max(z)(7,;je,c ))fc) 0. Доказательство. Зафиксируем h є я(с)\{о} и рассмотрим приращение функции Ф(с) в точке с0 Пусть вопреки утверждению тах(о(г;д:(,,с(,) ) 0. Так как существует такое число 0, что для любого Ж б справедливо неравенство , то в достаточно малой окрестности нуля знак суммы matx[D\r;x(,,c0)iUi)+max(p Ah{f} определяется знаком первого слагаемого. Следовательно, при Л 8 выполнено неравенство ф{е+ЛЛ)-ф(с) 0, что противоречит условию теоремы. Теорема доказана.
Минимизация радиуса конечной окрестности для линейных систем
Получено противоречие с определением значения с", доказывающее утверждение теоремы.
Лемма 1.5. Пусть с0 - внутренняя точка множества С. Тогда для того, чтобы при всяком АєЯ(с) выполнялось равенство max(/ (r;xtl;c0)h)=:0, необходимо и достаточно, чтобы для любого вектора хп Х было справедливо равенство D{T; хп, сь )= 0.
Доказательство. Докажем необходимость условия. Зафиксируем значение х1 є Xй. Тогда для любого вектора йє#(сп) справедливо неравенство DyT;x\ca)h 0, Докажем, что для всякого йе#(с) выполняется равенство О\Г;х\сУі = 0. Предположим противное, пусть существует вектор А ея(с), такой, что D\T;x\c0 0. Так как с0 - внутренняя точка множества С, то найдется число а О, такое, что вектор h = -ah принадлежит множеству Я (с0). Для этого вектора имеет место неравенство D\T;x\cyi 0, что противоречит условию теоремы. Таким образом, для всякого вектора Лея{с) выполняется равенство D\T ,xl,c{ )fr = 0. Пусть векторы А ,.-,Авея(с") линейно независимы. Тогда в системе алгебраических уравнений относительно координат вектора D{T;X1,C{ ) матрица коэффициентов является неособенной. Следовательно, система имеет единственное решение D{f;x\c)=Q, что и требовалось доказать. Достаточность утверждения очевидна. Лемма доказана. Теорема 1.5. Пусть с eintC, для любого вектора АєЯ(с)\{о} множество X ( р{х(Т;х0,е)))пX (л(г;л,е)ь) не пусто и выполнено равенство . Тогда для того, чтобы значение с" минимизировало функцию Ф(с), необходимо, чтобы для любого х" єХ выполнялось равенство О(г;л:\с(,)=0. Глава 1 31 Доказательство. При выполнении условий теоремы для того, чтобы значение са минимизировало функцию Ф(с), необходимо, согласно теореме 1.4, чтобы для любого вектора Ає#(с)\ {о} выполнялось равенство тах{г (г;;с0,с0)ft)=0. По лемме 1.5 для выполнения указанного равенства необходимо, чтобы для любого х =Х было справедливо 2 (т; ,с0)=0. Теорема доказана. Лемма 1.6. Пусть ceintC и Аєя(с)\{о} - некоторое направление, для которого множество X - того, чтобы значение с" минимизировало функцию Ф(с) по направлению h, необходимо, чтобы для всякого вектора хвХ выполнялось неравенство D(T;X,C)I 0 . Доказательство. Предположим противное. Пусть с" минимизирует функцию ф(с) по направлению h и существует вектор J є X , такой, что й{т;х,саУі 0. По определению o(JAft) для выбранного вектора существует положительное число S, такое, что при всяком А, удовлетворяющем условию Я 5, выполнено неравенство Тогда при X S справедлива оценка ф(с + АЛ)= тах{ р(х(т;х,с" + Лк)})=тах( р(х(Т;х\са))+о(т;хй,с{])лк + фА))= = с(г;ж,с))+1)(г;г,с0) + о( }= е(г;х,с0)) ф(с0). Таким образом, Ф{с +ял) ф(с), что противоречит выбору с0. Полученное противоречие доказывает утверждение леммы. Теорема 1.6. Пусть сєімС и при всяком йея(с)\{о} множество X = [}Х (??(л:(:Г;л;и,с0 + Aft))) не пусто. Тогда для того, чтобы значение с" Лф;і] минимизировало функцию Ф(с), необходимо, чтобы для любого вектора АєЯ(с())\{0} при всяком хєХ выполнялось неравенство Dlf;x,cn)k 0. Глава 1 32 Доказательство. В предположении теоремы для любого вектора Лея(с)\{о} выполнено условие леммы 1.6. Поэтому для всякого АеЯ(с)\{о) при каждом значении хєХ выполнено неравенство (г;xyca)h 0, что и требовалось доказать. Теорема 1.7. Пусть с — внутренняя точка множества С и множество X = [ Х ( (х(7 ;дгп,с +ЛЛ))) не пусто. Тогда для того, чтобы значение с минимизировало функцию Ф(с), необходимо, чтобы для любого вектора йєЯ(с)\{о} при всяком хєХ выполнялось равенство D(r;je,c)h = 0, Доказательство. Пусть значение с" минимизирует функцию Ф(с). А так как при всяком йєя(с)\{о} справедливо включение X zX, то по лемме 1.6 для любого направления heH{c)\{o} при всяком XGX выполнено неравенство (г;;с,сп)ft 0. Для доказательства предположим, что вопреки утверждению теоремы существуют такое направление Л ея(с)\{о} и значение хєХ, для которых /)(г; ,с)й 0. Так как cn eintC, то найдется положительное число а, такое, что вектор k= ah принадлежит множеству я(с). Тогда для указанного вектора выполнено неравенство D{T;x,cfi 0, что противоречит лемме 1.6. Таким образом, для любого направления Аея(с)\{о} при всяком значении хєХ выполнено равенство D\T; х, с0 ft = 0. Теорема доказана. Лемма 1.7. Пусть ceintC. Тогда для того, чтобы при любом кєн(сп)\{о] при всяком значении хєХ выполнялось равенство Z (r;xsc)fc = 0, необходимо и достаточно, чтобы для любого вектора х еХ было выполнено равенство D\T;x,с)= 0.
Критерий оптимальности для точек границы множества допустимых управлений
Рассмотрим решение поставленной в 1 главы 1 задачи поиска оптимального управления при условии, что множества Xй и С являются выпуклыми многогранниками в пространстве R".
Пусть числа (Я, )є[0;і]. Зафиксируем значение сеС. Дадим переменной х" є Xй приращение jug такое, что JC + /# е Х. Разложим по формуле Тейлора функцию ЦГ; 0 ,с)) в окрестности произвольной, но фиксированной точки хп, получим тор. Тогда приращение & р\ха) оптимизируемой функции определяется равенством
Теорема 2.1. Для того, чтобы вектор х еЫХ при фиксированном значении с&С доставлял максимум функции (х(г; й,с)), необходимо, чтобы выполнялось равенство
Доказательство. Пусть вопреки утверждению теоремы р(Т;х",с) 0. Докажем, что тогда существует вектор g, такой, что р(р-,х",с)к 0. Предположив, что для любого g выполнено равенство p(r;jt(),c)g = 0, и взяв систему из п линейно независимых векторов ,,.,.,#„, получим систему линейных алгебраических уравнений относительно координат вектора Р(Г;Х,С). Очевидно, что матрица этой системы неособенная, поэтому система имеет единственное решение р{Г;х,с)=0, что противоречит предположению доказательства. Таким образом, существует вектор gy такой, что Р\Т;х1) ,c)g 0. Поскольку х{} -внутренняя точка множества А"0, то существует вектор g , для которого выполнено неравенство P\T;xt tc)fig Q. Из равенства (2.1) следует, что при малых значениях у. знак приращения А р(х11) определяется знаком первого слагаемого. Следовательно, в малой окрестности нуля выполнено неравенство р{х\Г;х0 +/jg,c)) p(x(:T;;c0,c)), что противоречит условию теоремы. Теорема доказана.
Пусть множество 5 - выпуклый многогранник в пространстве Rn, Произвольную грань многогранника S, для которой несущей плоскостью является гиперплоскость пространства R", обозначим B" (s). Через Вп 4(s) обозначим грань многогранника S, которая может быть получена пересечением ровно q его граней вида Bn (s), где # = 2,...,/1. Поскольку грань 5""ч(5) имеет размерность n-q, то в ней можно указать п - ц линейно независимых векторов из множества S .
Заметим, что для всякой точки 5 є5 множество tf(s)=S-s(\ где S-s" ={s-s JSGSJ, является выпуклым, и точкам границы 6H(S) соответствуют точки границы clS, а грани B" Q(s) соответствует грань B" "{sn,H) многогранника я(хп). Каждой точке множества H[S") поставим в соответствие радиус-вектор с концом в этой точке.
В пространстве R" гиперплоскость задается уравнением L{s) = 0, где l(s)=t +l2s2 +... + lnsn + /„;/, є і?, ( = 0,..., л. Тогда несущая плоскость грани B" l,(s) определится системой линейных уравнений где V(s) = 0, і =1,...,q - уравнение гиперплоскости в пространстве R", причем ранг матрицы этой системы равен q. Пусть й"" (х) - грань, несущая гиперплоскость b(s) которой задается уравнением V (s) = о. Определение 2.1. Назовем грань B" 4{s) многогранника S правильной, если она принадлежит ровно q граням вида В" }(s). Нетрудно видеть, что в пространстве R2 все грани любого выпуклого многогранника являются правильными; в пространстве Я3 все ребра любого выпуклого многогранника являются правильными гранями; в пространстве R3 вершины куба являются правильными, а вершины октаэдра -нет. Лемма 2.1, Пусть sa е5" (5) не принадлежит никакой грани меньшей размерности многогранника S и грань Bn "(s) правильная, q = lf...,и. Тогда во множестве Я 1) существует система линейно независимых векторов к ,...,кп, таких, что для любого вектора Лея(хп) возможно разло жение h = dkihi, где Ар...,Ал_ч принадлежат грани Ba 4{sa,H) и коэффи циенты кй_ 0,...,кп 0. Доказательство. I. Докажем утверждение для грани многогранника S, несущей плоскостью которой является гиперплоскость пространства R", то есть, q = \. Тогда во множестве Bn_1(sll,H) можно выбрать систему линейно независимых векторов л,,...,й„_,. Выбрав в качестве Ая произвольный вектор из множества H{s)\ B" l (s ,Н), получим систему векторов А,,...,АЯ, которые являются линейно независимыми, так как по способу выбора вектор Ая не принадлежит линейной оболочке векторов A]s..., hnA. Поскольку H{su) - выпуклое множество, то все его точки лежат в одном полупространстве относительно несущей гиперплоскости грани B" 1(S,H), Тогда для всех векторов А из множества я(х) и-я координата в базисе hx,...,ha имеет один и тот же знак, а так как An =i/(s), то к 0. 2. Пусть \ q n. Пусть B. liS) - грань, несущая гиперплоскость b s) которой задается уравнением L (s)=0,i=l,..., /, Ba 4(s) - грань, несущая плоскость которой образована пересечением q гиперплоскостей b (s). Заметим, что ранг этой системы равен q.