Содержание к диссертации
Введение
ГЛАВА I. Задачи со свободой правым концом 13
I. Оптимальность систем на конечном интервале времени 13
2. Оптимальность систем на бесконечном полуинтервале времени 34
3. Оптимальность нестационарных систем 42
ГЛАВА 2. Задачи с закрепленным правым концом 50
4. Оптимальность стационарных систем с закрепленным правым концом 50
5. Оптимальность нестационарных систем с закрепленным правым концом 75
ГЛАВА 3. Задачи с двумя ограничениями на управление j35
6. Оптимальность систем со свободным правым концом при двух ограничениях на управление 85
7. Оптимальность систем с закрепленным правым концом при двух ограничениях на управление 90
ГЛАВА 4. Примеры 121
Заключение
- Оптимальность систем на бесконечном полуинтервале времени
- Оптимальность нестационарных систем
- Оптимальность нестационарных систем с закрепленным правым концом
- Оптимальность систем с закрепленным правым концом при двух ограничениях на управление
Введение к работе
Математическая теория оптимального управления, основы которой были заложены в трудах Л. С,Понтрягина, А.М.Летова., Н.Н.Кра-совского, Р.Беллмана, В.А.Троицкого, А.А.Фельдбаума ( см./ 1-60 и других математиков, переживает за последнее десятилетие период бурного развития. Принцип максимума, разработанный коллективом советских математиков во главе с академиком Л.С.Понтрягиным, представляет собой одно из крупных достижений современной математики. Принцип максимума Понтрягина и метод динамического программирования приобрели характер классических результатов математической теории оптимального управления.
В данной диссертационной работе рассматриваются задачи оптимального управления, описанные линейными дифференциальными связями, квадратичным критерием качества и ограничениями на управление.
Большим вкладом в исследования данного типа задач являются работы, выполненные А.М.Летовым / 2-4 /, Р.Е.Калманом /9/ и др. В работах А.М.Летова с использованием метода динамического программирования получено решение задачи без ограничений на управление в случае, когда время процесса предполагается бесконечным. Известны трудности, которые возникают при обосновании метода Беллмана, когда в задаче Летова на управление наложены ограничения | 1/ Vw | 1 , Эти трудности связаны, например, с обоснованием гладкости функции Беллмана ( см. / 10 / ).
Среди множества методов решения задач оптимального управления с линейными дифференциальными связями, квадратичным критерием качества и ограничениями на управление следует выделить принцип максимума Понтрягина / I /, /II/ , метод динамического программирования / 3 /, /12/, метод проблемы моментов Н.Н.Кра-
СОБСКОГО / 5 / .
Целью данной диссертационной работы является обоснование метода штрафов для задач оптимального управления с линейными дифференциальными связями, квадратичным критерием оптимальности, ограничениями на управление, со свободным и закрепленным правым концом траектории, стационарных и нестационарных.
Идея метода штрафов - сведение задач на условный экстремум к задачам без ограничений путем введения штрафа за нарушение ограничений - известна давно. Впервые этот метод был предложен, видимо, Р.Курантом / 13 / в 1943 г. в связи с решением вариационных задач. Простота и универсальность схемы решения задач минимизации на множествах объясняет популярность метода штрафов. Различные прикладные и теоретические аспекты метода штрафов исследованы в / 14-25/. Использование идеи метода штрафных функций для решения задач оптимального управления содержится, например, в работах /12/ /17/, /1^, /20-22/, /24/, /2&-4<У. К одним из первых работ в этом направлении можно отнести работы Н.Н.Кра-совского, Л.И.Шатровского, Г.М.Островского. В работе Л.И.Шатров-ского /27/ вводятся штрафы за нарушение ограничений на управление и траекторию. Полученный функционал со штрафами минимизируется одним из итерационных методов градиентного типа. В работах /26/, /2Є/ задача с измененным функционалом ( путем добавления штрафов ) исследуется приемами вариационного исчисления. В качестве модельных задач в этих работах рассмотрены задачи быстродействия.
При использовании метода штрафов имеется достаточно богатый выбор штрафных функций и большое разнообразие в способах снятия штрафами всех ограничений или же какой-либо части ограничений. Эти причины породили большое количество работ, посвященных модификациям метода штрафов, их приложениям к конкретным
задачам оптимального управления. В книге Р.П.Федоренко /20 / достаточно полно показаны достоинства и слабые стороны метода штрафов при его численной реализации для задач оптимального управления.
Одним из основных вопросов, возникающих при обосновании метода штрафов, является, естественно, вопрос сходимости приближенных решений. Теоретические исследования в этом направлении нельзя считать завершенными, они содержат множество интересных проблем. В работе Б.Т.Поляка / 25 / доказана сходимость и оценка скорости сходимости метода штрафов, примененного к задаче минимизации функционала г(я) в гильбертовом пространстве при ограничениях вида 0(х)=0 . Результаты имеют место для достаточно гладких функционалов fW , Q'"*"' и при выполнении условий невырожденности для О (X / .В общем случае для задач оптимального управления, рассматривая управление и траекторию из некоторого гильбертова пространства, имеется слабая сходимость приближенных решений ( см. /12 /, /22 /, /30/).
Из всего круга работ, содержащих модификации метода штрафов в задачах оптимального управления, следует выделить работы, использующие метод штрафов в сочетании с методом Ееллмана и метод штрафов в сочетании с принципом максимума Понтрягина. Например, в работах В.Я.Глизера, М.Г.Дмитриева/ 41 /, P. Brun0iT9&jj? 3. Kon\OVY\Lt / 42 / исследуется линейно-квадратичная задача оптимального управления с закреплениями траектории в двух концах. Условия, наложенные закреплением траектории в правом конце, штрафуются и добавляются к значению исходного функционала. Для полученных задач со свободным правым концом траектории применяется метод Беллмана, выписываются уравнения типа Риккати для определения функции Беллмана и затем исследуется вопрос о сходимости
— б **
решений возмущенных задач ( с добавлением штрафа ) к решению исходной задачи.
Среди работ, использующих метод штрафов в сочетании с принципом максимума Понтрягина, можно отметить, например, работы В.В.Федорова /43 /, /33 /. В них с помощью метода штрафных функций доказывается принцип максимума для минимаксных задач оптимального управления. В работах Г.М.Островского, Ю.М.Волина, А.В.Финкелыптейна /34-36 / с помощью метода штрафов выводятся необходимые условия оптимальности в форме принципа максимума для обобщенных, в некотором смысле, решений задачи оптимального управления. Б.Ш.Мордуховичем /37 /, /30 получены необходимые условия оптимальности типа принципа максимума для задач оптимального управления с негладкими функционалами, с промежуточными фазовыми ограничениями. В основу схемы получения необходимых условий оптимальности положена аппроксимация исходной задачи семейством задач безусловной оптимизации функционалов штрафного типа.
Для задачи оптимального управления с линейными дифференциальными связями, с интегральным выпуклым функционалом качества и с двумя закрепленными концами траектории в статье Т.Р.Гичева /31 / исследуется сходимость приближенного решения к точному в пространстве непрерывных функций. В качестве приближенного выбирается решение, полученное на основе принципа максимума Понтрягина, записанного для задачи со свободным правым концом траектории. К функционалу добавляется штраф за нарушение попадания правого конца траектории в заданную точку. Ограничения на управление в этой работе не накладываются.
В данной диссертационной работе проведено обоснование метода штрафов для решения задач оптимального управления,описанных
- 7 ~
линейными дифференциальными связями, квадратичным критерием качества и ограничениями на управление. Доказана сходимость приближенных решений, получены уравнения для приближенных решений. Получены интегральные уравнения типа Фредгольма, единственным решением которых является оптимальное управление. Интегральный уравнения получены для нахождения оптимального управления как в форме программного управления іі-ИІч , так и в форме синтеза И^НуЛ,^) ( по принципу обратной связи ). Доказана сходимость к оптимальному управлению последовательности функций ііціч таких, которые обеспечивают малые невязки уравнений для приближенных решений.
Работа состоит из четырех глав. В главе I рассматриваются задачи оптимального управления со свободным правым концом. В I исследуется стационарная задача с линейными дифференциальными связями
^j" = A* + 6u , х(10)=х0 ,
(I)
квадратичным критерием качества
(2)
конечным интервалом изменения времени t^Luo,Mi N *" С> одномерным управлением U.(l) , на которое наложены ограничения
alt) U\. О)
Показано существование и единственность точек минимума функционалов, полученных из (2) добавлением штрафов
, , ч -«„ „. A(t-W ft AMI ,,, „г. Фк(х,и)=кЦа:(і)-Є i,-U Ш\)іЩ + 00
** о —
+
;4lUaW4)+fL2+||(-a(l)4)+||L2al ,
где 6ц Ю7 Ц + =Г№Х-(0,а) . Доказана сходимость в С.[і0і.Д последовательности точек минимума функционалов со штрафами к решению исходной задачи (1)-(3). Выведены уравнения для приближенных решений-, получены необходые и достаточные условия оптимальности. Чтобы найти оптимальное управление, необходимо решать интегральные уравнения типа Фредгольма и проверять выполнение соотвествующих неравенств. Оптимальное управление находится как в форме программного управления ( теорема 1.3), так и в форме синтеза (теорема 1.4 ). Доказана сходимость приближенных ( в смысле малости невязок ) решений к оптимальному управлению ( теорема 1.5 ).
В 2 рассмотрена задача типа (1)-(3) на бесконечном полу
интервале времени u^L"t0c>o) І, =с?0 . Получены все анало
гичные результаты, в том числе доказана сходимость к оптималь
ному управлений последовательности функций іц(і) таких,
которые обеспечивают малые невязки уравнений для приближенных
решений ( теорема І.ІО ).
В 3 исследуется нестационарная задача с линейными неоднородными дифференциальными связями
gj»AW**B(i)u*ip(t), x(i0)=xo,
(5)
свободным правым концом траектории, квадратичным функционалом
качества
>[[Ш,мы1)Ш1),ттш ^,
"to
(б)
конечным интервалом изменения времени "ц < і многомерным управлением u({) = (u (i),U (ц ..., IL (і)) , на координаты которого наложены ограничения
|u4t)UpL , UU, ...(m.
1 (7)
Для этой задачи имеют место все аналогичные результаты, полученные для стационарной задачи; в том числе получены уравнения для нахождения оптимального управления ( теорема I.I2 ) и схо-димость приближенных решений ( в смысле малости невязок ) к оптимальному управлению ( теорема I.I3 ).
В главе 2 рассмотрены задачи с закреплением траектории в
правом конце хЦц) = Х.| . В 4 исследуется стационарная
задача типа (I) - (3) при дополнительном закреплении траектории Xl^l'l^ . Здесь также выводятся уравнения для приближенных решений, являющихся точками минимума функционалов со штрафами. Штрафные функционалы, по сравнению с соответствующими штрафами типа (4) для задач главы I, содержат дополнительное слагаемое
Фк(хи)-є-;іі^-е№-\-^А,ІИк^іігКп
штраф за нарушение попадания траектории в заданную точку Хц в момент времени "Ь=,Ц , как и для задач, рассмотренных в главе I, здесь получены уравнения для приближенных решений, доказана сходимость в С [*t0 I4J приближенных решений IlJI) к оптимальному управлению, выведены интегральные уравнения для оптимального управления ЦДІ) в форме программного управления ( теорема 2.3 ) и для управления U\t, / в форме синтеза ( теорема 2.4 ). Теорема 2.5 обеспечивает сходимость прибли-
женных ( в смысле малости невязок ) решений к оптимальному управлению.
В 5 рассмотрена нестационарная задача типа (5)-(7) при закрепленном правом конце траектории i(iJ=X^ . Здесь также получены все аналогичные результаты, имеющие место для стационарной задачи 4.
В главе 3 исследованы задачи при двух ограничениях на управление
(8)
иЮШ, ЫЩ; IU(l)||Ll[i0|W.
Дополнительное, по сравнению с предыдущими задачами, ограничение
II alt) II \д ^ С снимается добавлением следующего штрафа
?R(x.u)=6,;(llaWlluMrc)' .
В б рассмотрена задача типа (I), (2) со свободным правым
концом и при ограничениях на управление ц.(^) вида (8).
В параграфе 7 исследуется задача (I)-, (2) с закрепленным правым
концом траектории х(,ч)='ЭС<, , при ограничениях на управле-
ние вида (8). Здесь , как и для ранее рассмотренных задач, полу
чены уравнения для приближенных решений 11ц W ; доказана
сходимость в С u.o,t-i] последовательности jU-niw)^ к
оптимальному управлению; получены интегральные уравнения-, зависящие от параметра, для нахождения оптимального управления. Оптимальное управление можно находить как в форме программного управления ( теоремы 3.3, 3.8 ), так и в форме синтеза ( теоремы ЗА, 3.9 ).
В теоремах 3.5, 3.10 доказывается сходимость приближенных ( в смысле малости невязок ) решений к оптимальному управлению соответствующей задачи.
- II -
В главе 4 рассмотрено несколько примеров, получено решение конкретных задач оптимального управления. В примерах проиллюстрировано, какой конкретный вид имеют интегральные уравнения типа Фредгольма и соответствующие им неравенства, как отыскивается их решение - оптимальное управление. На примерах показаны различные способы нахождения оптимального управления. Примеры иллюстрируют практическое приложение основных результатов работы.
Результаты данной диссертационной работы могут использоваться для нахождения численного решения задач оптимального управления, для нахождения оптимального управления в форме обратной связи, например,в задачах анажтического конструирования регуляторов.
Основные результаты диссертации опубжкованы в /44-51/ и докладыважсь на научном семинаре кафедры дифференциальных уравнений и прикладной математики ( под руководством профессора А.П.Хромова ), на объединенном научном семинаре кафедр математической кибернетики и дифференциальных уравнений и прикладной математики ( под руководством профессора А.М.Богомолова ) Саратовского государственного университета, на конференции молодых ученых в г.Уфе ( 1981 г., см. /47 /), на III и ІУ Всесоюзных конференциях " Оптимальное управление в механических системах " ( 1979г. г.Киев, см./44 /; 1982 г., г.Москва ):, на XXII научно-технической конференции " Функционально-дифференциальные уравнения " ( 1982г. г.Пермь ), на научном семинаре в Институте математики и механики УНЦ АН СССР в г.Свердловске ( под руководством члена- корреспондента АН СССР А.Б.Куржанского), на летней школе молодых математиков Института математики и механики УНЦ АН СССР ( 1983 г.), на Ш Поволжской конференции " Алгоритмы, средства и системы автоматического управления " ( Волгоград, 1984 г.), на конференции молодых ученых "Саратовскому университету - 75 лет" ( 1984 г.),
на научном семинаре в отделе дифференциальных уравнений ( под руководством д.ф.-м.н. Ю.С.Осипова ) в Институте математики и механики УНЦ АН СССР ( Свердловск, 1984 г.).
Автор выражает искреннюю благодарность научному руководителю профессору А.П.Хромову за большое внимание к работе.
- ІЗ -
Оптимальность систем на бесконечном полуинтервале времени
Сходимость норм в некотором энергетическом пространстве и слабая сходимость последовательности обеспечивает ( см./ 5h /) сходимость по норме в 1_р \."fc0lu4i последовательности Теорема доказана. Очевидно, что аналогичная теорема имеет место для управления Ы 1"Ь;Х) в форме синтеза .
Теорема 1.5. имеет практическое приложение. Одним из способов нахождения UL U) является применение градиентных методов для нахождения точки минимума функционала D ІХ,u.) ,9 определенного формулами (1.5), (1.3), (1.6). Ф нцционалы О, J (xfu)f ф и) удовлетворяют условиям теоремы, обеспечивающей сходимость градиентного метода ( см./24 / ) для, нахождения точки минимума Хц1"к),ЦД"0] функционала JH(x,u.) Погрешности, неизбежно возникающие при вычислениях, не позволяют найти точное значение точки минимума. Согласно теореме 1.5 можно находить приближенное значение іц(і) точки минимума такое, чтобы, например, выполнялось неравенство
Такая последовательность приближенных решений й„(±) будет сходиться к оптимальному управлению задачи (І.І) -(1.4).
Другим способом нахождения и.ц("ч является непосредственное решение интегрального уравнения (І.ІІ) для URU) . Интегральный оператор Кк вида (I.I2) с ядром (I.I3) является неотрицательно определенным. Существует множество приближенных методов решения интегральных уравнений с неотрицательно определенным оператором. Используя численные методы решения интегральных уравнений, для каждого ц можно находить только приближенное решение ЇЇ.ц(І) уравнения (І.ІІ). Возможно находить такое Ц-цШ чтобы, например, выполнялось неравенство (1.40). Тогда по теореме 1.5 такая последовательность приближений П.„({) будет сходиться при ц0 к оптимальному управлению \л[{)
Еще одним способом нахождения UK("t) , вытекающим из результатов I данной работы, является численное решение уравнений для оптимального управления, которые получены в теореме 1.3 или в теореме 1.4. Эти интегральные уравнения типа Фредгольма имеют неотрицательно определенный интегральный оператор. Используя какую-либо итерационную процедуру решения этих уравнений, нужно находить такое приближенное решение йДи $ которое удовлетворяет, например, неравенству (1.40). Тогда последовательность І к Ним , согласно теореме 1.5, будет сходиться к оптимальному управлению u(i) . Рассмотрим задачу оптимального управления для случая Минимизируемый функционал имеет вид
Предполагаем, что А - матрица размерности П П. гурвицева , г! - матрица П П неотрицательно определенная, о - Л -вектор. Задача типа (І.4І) - (1.44) является задачей аналитического конструирования регуляторов. Свойства системы (І.4І) -(1.43) рассматривались, например, в / 55 /.
Решение URU) уравнения (1.48) не зависит от t0 . доказательство. Для вектор- функции fRU) выполним за мену переменного Ъ- t0 , ТбІО.оо") , получим 7к( і0) = -Г e (E-6tt\A)M MeMvbd О где fl o Получим, что }ц(Ъ + о) совпадаете вектор-функцией І іч , соответствующей задаче вида (І.4І) (1.44), рассмотреннйй на полуинтервале їє\.0, ) . Аналогично оператор Ц для задачи на полуинтервале eUo, ) совпадает с соответстующим оператором для задачи на полуинтер вале ібі0!00) . Отсюда получаем справедливость леммы. Теорема 1.7. Если последовательность функций, являющихся решениями уравнений (1.48) [\k-\,Zl ... ) , то имеет место сходимость IM)-u(lHILilu,wl-0, IKW-i4t)UCUOWr0, -.» где И\ч - оптимальное управление задачи (I.4I) - (1.44),
Доказательство, Функционалы 3 вида (I.4I), Фц(х,и) вида (1.45), множество Ц , определенное условиями вида (1.42) - (1.44) удовлетворяют условиям леммы 1.3. Отсюда получаем схо димость LuU) к оптимальному управлению иДі) в пространстве
Пусть Ті - достаточно большое ( больше 9 - последней точ ки переключения u(i)) . При ifetto.Vl аналогично доказа тельству теоремы 1.2 получим равномерную ограниченность и равно степенную непрерывность UiU) і и, следовательно, сходимость в С [ІоДЛ . При достаточно больших t из уравнений (1.48) для \x. W\ и формул для "Rg , \ [ї) получаем, что ицIt)- 0 , U- DQ .То есть, при достаточно больших t ограничения (1.44) на управление не действуют.
Оптимальность нестационарных систем
Доказательство этой теоремы не имеет дополнительных принципиальных трудностей по сравнению с доказательством теоремы 1.3. Необходимость доказывается путем обоснования предельного перехода при Єц 0 в уравнениях (І.6І). Достаточность доказывается через построение вспомогательной последовательности, удовлетворяющей условиям леммы 1.4. Теорема І.ІЗ. Пусть последовательность вектор-функций {йц(±)Ц!4 такова чт0 - о , гДе AUU.LLR) есть невязка системы уравнений (1.61).Тогда где U(і) - оптимальное управление задачи (1.53) - (1.56).
Доказательство проводится аналогично доказательству теоремы 1.5. Сначала, используя малость невязки уравнений (І.6І), доказывается ограниченность норм II ІЦІчІІ [іоіЛ о -.Затем, используя выпуклость функционалов JRI . ) , определенных через (1.55),(1.57), слабую полунепрерывноеть снизу функционалов J , ФкІХ.а) , получим слабую сходимость, и затем - сильную сходимость LLRU) К единственному оптимальному управлению задачи (1.53) - (1.56).
Итак, в главе I обоснован метод штрафов для трех типов задач оптимального управления со свободным правым концом. Получена сходимость прибжженных решений U«.U) в пространстве непрерывных функций к оптимальному управлению и (і) и уравнения для оптимального управления. Чтобы найти оптимальное управление, необходимо решать интегральные уравнения типа Фредгольма и проверять выполнение соответствующих неравенств.
Так как показано, что для оптимальности ц[ї) необходимо и достаточно, чтобы \l[i) удовлетворяла интегральным уравнениям типа Фредгольма, то эти уравнения, естественно, можно получить и из принципа максимума Понтрягина.
После доказательства теоремы 1.3 на примере нескольких конкретных ситуаций показано, какой непосредственный вид будут иметь уравнения типа Фредгольма для нахождения оптимального управления и какой вид будут иметь соответствующие им неравенства.
Одни из основных результатов- теоремы 1.5,1.10, I.13 дают сходимость " приближенных " решений, обеспечивающих малые невязки соответствующих уравнений, к оптимальному управлению. Эти теоремы имеют практическое приложение, так как при численных расчетах удается находить лишь приближенные решения соответствующих уравнений.
Все аналогичные результаты можно получить, например, для следующих задач: для нестационарной задачи типа (1.53) -(1.55) с ограничениями на управление вида р ЩГ М , іН га ; (1Л2) для нестационарной задачи типа (1.53) - (1.55) на бесконечном полуинтервале времени tt"to,w) с ограничениями на управление вида (1.72), если фундаментальная матрица однородной системы .XUjt) имеет экспоненциальную оценку.
В главе 2 исследуются стационарная ( 4) и нестационарная (5) задачи с закрепленным правым концом траектории. Закрепление траектории CC[{J = 1 снимается путем введения дополнительного штрафа к ранее рассмотренным штрафам. Это дополнительное слагаемое вносит определенные трудности в исследование уравнений для приближенных решений ІЦМ », в доказательство всех основных результатов.
Для задач с закрепленным правым концом доказывается сходимость приближенных решений 1ц(Ц в с[Ьо,Ы к оптимальному управлению, получены интегральные уравнения для нахождения оптимального управления в форме программного управления и в форме синтеза. Одними из основных результатов являются теоремы 2.5, 2.8, в которых доказана сходимость приближенных ( в смысле малости невязок ) решений к оптимальному управлению
Оптимальность нестационарных систем с закрепленным правым концом
Теорема 2.5 имеет практическое приложение. Для нахождения приближенных значений й.ц№) можно использовать, например, один из следующих способов: I) при помощи градиентных методов мини мизируем функционал j %u.V: 5 + ф lx,u) , определенный формулами (2.3), (2.5), находим приближенное значение ( X W , и,цМ) точки минимума функционала JH(X.IX) ; 2) при помощи численных методов решения интегральных уравнений находим прибли женное решение СцЫ уравнения (2.6); 3) при помощи численных методов решения интегральных уравнений находим приближенное ре шение йцШ уравнений, полученных в теореме 2.3 или в теореме
В любом случае возможно находить такие приближенные значе ния Ец(,1) , чтобы, например, выполнялись неравенства (1.40). Тогда, согласно теореме 2.5, последовательность 1СцЫ Г5 сходится при ц10 к оптимальному управлению задачи (2.1)- (2.4). Оптимальность нестационарных систем с закрепленным правым концом
Рассмотрим нестационарную задачу с закрепленным правым концом, дифференциальные связи и минимизируемый функционал имеют вид нестационарные матрицы, размерности гигц ajtm, rtxri, rax га соответственно, с достаточно гладкими элементами, M(i) - неотрицательно определенная, R[t) - положительно определенная матрица.
Решение этой задачи не содержит принципиальных трудностей по сравнению с решением стационарной задачи, рассмотренной в 4. Поэтому в этом параграфе подробные доказательства будут опущены, а будут приведены точные формулировки результатов и некоторые пояснения по способу их доказательства.
Штрафные функционалы ФЦ М) выбираем в виде »ки)»ё;11Ки.№-рМй +И(-аШ-р +4]+ HxU) - X ItW ЇО -\J0I U. BWaW A -"ЇІЦ«4+C2#36) -i, где R V 0 і л( )Ц)" Фундаментальная матрица решений одно родной системы 3I = AWx , Кф-Е, определено в (1.56). Аналогично тому, как это сделано для стационарной задачи, можно доказать, что функционал DR[X,U.) вида (1.5),(2.34), (2.36) является ограниченным в пространстве LfclioW 77 равномерно выпуклым, шиі (x,u) в соответствии с (1.7) определяется по формуле (1.59) и формуле то + + 2e"RlUU)-p)+-lLU)"p)+] - (г#37) ФуНКЦИОНаЛ ji(l,UL) ИМЄЄТ единственную ТОЧКУ МИНИМума (XjiW , U.uW) » которая определяется как решение уравнений (1.60) и т iRitt+vu u-w-fjMi. + ZA,t) + +е1ь х\шх«-хилк (г.38) - \t,XMBU)u.U)eL4+YU0, --eiUaW-p)+-l-u.W-p)+l , где KtR,R(i0/), 2ц(у)ДН0, определены в (1.62) -(1.65)-, (1.58) соответственно. Лемма 2.3, Если система (2.32) вполне управляема ( см. /56 /) ,то из неравенства - 78 t ( Л0 - множество меры 0 ) следует неравенство Доказательство. Для вполне управляемых систем равенство Ь Ш (и )А-0, eIU (2.39) эквивалентно d=0 . На самом деле, имея (2.39), запишем откуда . { X(U)bt«Btt)X(M)olW,oL)lll-o. По необходимому и достаточному условию управляемости системы ( см. / 5Х /) получаем oUO. Далее-, аналогично доказательству леммы 2.2, получаем доказательство этой леммы.
Теорема 2.6. Пусть система (2.32 ) вполне управляема и существует хотя бы одна допустимая пара (хМДШ) задачи (2.32) - (2.35). Тогда для последовательности вектор-функций LUlU , удовлетворяющих уравнениям (2.38)} имеет место сходимость где u(i] - оптимальное управление. Доказательство проводится по аналогии с доказательством теоремы 2.2. Функционалы J вида (2.34 ,ФцІЯ.,и)вида (2.36) удовлетворяют условиям леммы 1.3«, поэтому получаем сходимость li lt) в пространстве Ц Ііо.іЛ к единственному оптималь ному управлению alt) . Используя лемму 2. вместо леммы 2.2г получим равномерную ограниченность и равностепенную непрерывность Uit(t) . Отсюда следует сходимость LL lt) в пространстве Ст[і0іЛ к единственному оптимальному управлению a(i). Пусть u. - некоторая вектор функция. Введем обозначения для множеств -П.;. , Jl , Jl-L и функций 6 i.(-fc) ( i-= ,2., ..., m. ) как в 3 для теоремы І.І2
Оптимальность систем с закрепленным правым концом при двух ограничениях на управление
Итак-, во всех случаях доказали ограниченность llUulttlL тілпечальнейшее доказательство проводится по аналогии с доказательством теоремы 1.5. Для последовательности MuW » UuW 11 4 , где UnW определяются по формулам (1.38)-, имеем оценку (1.39). Используя выпуклость функционалов 3 вида (3.13) Фй( чи,) вида (3.15), слабую полунепрерывность снизу функцио нала J , получим сходимость в \.г 1Ло,"М последовательно сти lU W, йц( Ь)) Hs4 К единственной оптимальной паре (%Ш, IX1У) задачи (3.II) - (3.14) . Теорема доказана.
Итак, в главе 3 обоснован метод штрафов для задач с двумя ограничениями на управление. Получены уравнения для приближенных решений uRtt), доказана сходимость последовательности {u.RU)]R в пространстве С ІЛоЛЛ к оптимальному управлению иДі) . Получены интегральные уравнения, зависящие от параметра, для нахождения оптимального управления. В теоремах 3,5, 3,10 доказана сходимость приближенных ( в смысле малости невязок) решений ІЦІ-U к оптимальному управлению. Эти результаты позволяют использовать всевозможные итерационнве процессы для нахождения U.RW , удовлетворяющих, например, неравенству типа (1.40). Такие приближенные решения U-цДі) , согласно соответствующим теоремам, сходятся к оптимальному управлению.
Другие случаи взаиморасположения множеств 11,.11 ,-0.-не будем рассматривать. Они не представляют принципиальных трудностей по сравнению с I) - 3) а содержат только конкретные вычисления соответствующих коэффициентов и параметров.
Итак, оптимальное управление ІДлУ задачи (4.II) -(4,14) определяется, например, по формуле (4.17) при выполнении условия (4.28); или-, например, по формуле (4.29) при выполнении условий (4.30)-, (4.31); или, например, по формуле (4.32) при выполнении условий (4.33) - (4.35) и т.д.
Данный пример показывает, что в ряде случаев целесообразно использовать сочетание численных и аналитических методов нахождения оптимального управления. Решение задачи (4.II) - (4.14) -оптимальное управление можно искать, например, в аналитическом виде типа (4.17), где коэффициенты J[- Uo) и параметры - точки переключения - можно находить, используя численные методы решения соответствующих уравнений.\
Найдем численное решение этой задачи. Будем искать последовательность приближенных решений CljiU) удовлетворяющих уравнениям (1.48) и сходящихся к оптимальному управлению. Находить uRU) можно различными способами: например, решая, численно уравнения (1.48) или же, например, при использввннии градиентных методов минимизации функционалов J lx.u.) вида (I.46)1, (1.45), (I.4I). Очевидно, что погрешности, возникающие при вычислениях, не позволяют найти точные значения функций UK.I U Будем искать приближенные значения этих функций aRU) такие, что для невязки Аціі.йц) уравнения (1.48) выполняется, например, оценка U uK)llul0oQ a , a o Используя теорему 1.10« получим, что последовательность I й.ц№Й{г4 сходится к оптимальному управлению задачи (4.36) - (4.39).
При помощи расчетов, проведенных на ЭВМ, получено численное решение ( см. / 45/). Значение оптимального управления приведено Рассмотренные примеры иллюстрируют, какой конкретный вид имеют интегральные уравнения типа Фредгольма и соответствующие им неравенства-, как они решаются в нескольких конкретных задачах.
Эти примеры иллюстрируют практическое приложение основных результатов работы. На примере Ш видно, что уже для системы второго порядка требуется провести довольно громоздкие вычисления для нахождения лптимального управления в аналитическом виде. Этот пример показывает, что в ряде случаев целесообразно использовать сочетание аналитических методов нахождения решения (цД1) ищем в виде (4.17))с численными методами отыскания некоторых параметров ( коэффициентов типа (4.18) - (4.27)-, значений точек переключения). Погрешности, возникающие при вычислениях, позволя-ют найти приближенные значения UfcU) -, которые, согласно основным теоремам, сходятся к оптимальному управлению соответствующей задачи.