Введение к работе
Актуальность темы. В диссертационной работе рассматриваются теоретические и вычислительные аспекты теории управляемых систем с неопределенностью. Такие системы возникают в разных задачах механики, физики, в математических моделях экономики, биологии и других областях науки. Потребность изучать управляемые системы с неопределенностью возникает в связи с тем что, при моделировании динамических систем некоторые ее параметры измеряются неточно или же вообще не учитываются. Источником неопределенности могут'быть также воздействия на динамическую систему некоторых помех, у которых известна лишь область изменения.
В становлении теории управляемых процессов в условиях неопределенности важное место занимает теория позиционных дифференциальных игр, созданная Н.Н.Красовским и его сотрудниками (см., например1-4 и библиографию в них). В теории позиционных дифференциальных игр концепция управления основывается на принципе обратной связи, где требуется построить позиционную стратегию, гарантирующую определенное качество управляемого процесса при любых заранее неизвестных воздействиях на систему, у которых известна лишь область изменения. К настоящему времени развиты различные методы получения оптимальных стратегий игроков, гарантирующих требуемое качество управляемого процесса. В частности, в рамках теории позиционных дифференциальных игр удалось формализовать многие прикладные задачи: задачу преследования одного объекта другим; задачу сближения - уклонения с целевым множеством; задачу удержания параметров управляемого процесса в заданных пределах и другие.
Одним из основных элементов конструкции теории позиционных дифференциальных игр является функция гарантированного результата, которая как правило является недифференцируемой функцией. В точках дифференцируемости эта функция удовлетворяет уравнению Беллмана -Айзекса. Функция гарантированного результата обладает свойствами и и v - стабильности, позволяющими определить оптимальную гарантированную стратегию. Свойство и - стабильности (и - стабильности) означает слабую инвариантность надграфика (подграфика) функции относительно некоторого семейства дифференциальных включений. Эти свойства мож-
1Красовский H.H.t Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 'Krasovskii N.N., Subbotin A.I. Game - theoretical control problems. Springer. New York. 1988. 3Krasovskii A.N.t Kraaovskii N.N. Control under Lack of Information. Birkhauset. 1995, ^Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.
но выразить в-форме дифференциальных неравенств, в основе которых лежат производные по направлениям. Тахие неравенства были введены в работах5,6 А.И.Субботиным для определения обобщенных (минимаксных) решений уравнения Беллмана - Айзекса. Они были, по - видимому, первыми среди различных по форме определений (включая определение вязкого решения) негладких решений''уравнения Гамильтона - Якоба. 'В основе определения минимаксного решения лежит подходов котором уравнение' Гамильтона - Якоби заменяется нарой дифференциальных неравенств. В дальнейшем теория минимаксных решений была распространена на" исследование краевых задач для различных типов уравнений в частных производных первого порядка7 .
Отметим, что в работе8 М.Дж.Крэндаллом и П.Л.Лионсом было предложено определение вязких решений уравнения Гамильтона - Якоби. Определение вязкого решения по форме отличается от определения минимаксных решений. Однако, впоследствии в работе9 была доказана эквивалентность определения вязких и минимаксных решений. Доказательство эквивалентности этих определений опирается на возможность овыпукления контингентных конусов и производных по направлениям6,10, используемых в определениях минимаксных решений. Возможность овыпукления контингентных конусов'в определениях минимаксных решений явилась источником ' исследований в негладком анализе по применению конструкций проксимальных градиентов11 .
Дифференциальные уравнения в частных производных первого порядка методами идемпотентного анализа исследовались в работах В.П.Маслова'
И ЄГО СОТРУДНИКОВ. * ' ': '''< ':
Фундаментальные результаты в математической теории управляемых-процессов получены в работах Л.СПонтрягина и его сотрудников.
Широкий круг задач математической теории управляемых процессов в условиях неопределенности был исследован А'.Б.Куржанским и его сотрудниками в рамках теории гарантированного оценивания состояний системы:
'Субботин А.И. Обобщение освоввого уравнения теории дифференциальных игр. 'Докл. АЇҐСССР. 1980. Т. 254. N 2. С.293-297.' '.' '"' "':"'.;' ';':. ..' .л:.;-, ;. :., ::;;.'.-.'. ::;;,]: . [-..
вСубботин.А-И. Минимаксные неравенства и уравнения Гамильтона- Якоби. М.: Наука. 1991. -
7Subbotin АЛ. Generalized solutions of lust order partial differential equations. The dynamical-optimization
perspective. Birkhauser,- 1995. l ' ' ^ ;Гі .'-"-. ' .''! — - ^:^-..
Crandall M.G., lions P.L. Viscosity solutions of Hamilton - Jacobi equations. Trans. Arncr. Math. Soc/1983.
V.2T7. P.l-22. ''.- '-*' ;' ": - -; "
*Subbotin A.I., Tarasyev A.M. Stability properties of the value function of a differential game and viscosity solutions of Hamilton - Jacobi equations. Problems Contr. Inform. Theory. 1985. Vol.14, no.l.-'P.451 -;463.
10Guseinov Kh.G., Subbotin A.I., Ushakov V.N. Derivatives for multivalued mappings with applications'to game theoretical problems of control. Probl. Control Inform. Theory. 1985. Vol. 14. P.155-167.
"Clarke T!H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Qualitative properties of differetial inclusions: a survey. J. of Dynamical and Control Systems. 1995, vol.1, p. 1-48.
по результатам наблюдений (см., например12,13 и библиографию в них).
В диссертации рассматриваются динамические системы, математическая модель которых задается дифференциальным уравнением с многозначной правой частью, т.е. дифференциальным включением (ДВ). ДВ можно рассматривать,как обобщение управляемой системы. Они возника- , ют также при исследовании задач, математические модели которых задаются дифференциальным уравнением в неявном виде или же в виде дифференциального неравенства.
По видимому, ДВ впервые рассматривались в работах14,15 как дифференциальные уравнения с многозначной правой частью. Широкое развитие теория ДВ получила в начале 60-ых годов. В этот период установлены важные результаты, относящиеся к качественной теории ДВ, в том числе теоремы существования решений задачи Коши, изучены разные топологические свойства множеств достижимости и интегральных воронок, зависимость пучка траекторий от параметров. Заметим, что в этот же период ДВ применялись для исследования дифференциальных уравнений с разрывной правой частью18 .
Как правило при математическом моделировании управляемых процессов требуется учитывать различного рода сингулярности. Например, оптимальный результат как функция начального положения (функция Беллма-на) может быть недифференцируемой, а границы множеств достижимости управляемых систем не обладают свойствами гладкости. Поэтому в исследованиях математических моделей таких задач методы классического анализа дополняются конструкциями негладкого анализа, который опирается на такие понятия, как субдифференциал, конус касательных или возможных направлений, производная многозначных отображений и т.д. Как известно, в классическом анализе график дифференцируемой функции аппроксимируется гиперплоскостью, в негладком анализе для аппроксимация используются конусы. Этот подход, по видимому, впервые был предложен в работе11 и, дальше, в работах14,15 был применен для определения/траекторий ДВ. Отметим, что обобщение принципа максимума Л.С.Понтрягина для ДВ, которое было получено Кларком, опирается на,
"Курмясгяй А.Б. Управление в наблюдение в условии неопределенности. М.: Наук». 1977.
"KunhansVi А.В., Valyi L. Ellipsoidal Calculus for Esimation and Control. Birlch'aiisef, 1996.
14Marchaud A. Sur les champs dea demi-cones et lea equations dinerentiellea du premier ordre. Bull. Soc. Math. France. 1934. Vol.62. no.l. P.l-38.
"Zaremba S.C. Sur lei equations au paratingent. Bull, des Scienc. Math. 1936. 2 Ser., 60, N 5. P.139-160.
1вФилнппов А.Ф. Дифференциальные уравнения с разрывной правой частью. Матем. сборник. 1960. Т51. N 1. С.99-128.
введенное им понятие касательного конуса . -
Понятие производной многозначного отображения базируется на по
нятии множества касательных направлений и, определяется как много
значное отображение, графиком которого являются касательный конус к
графику исходного многозначного отображения. В зависимости от спе-.
цифики задачи, в негладком анализе рассматриваются различные. ти
пы касательных конусов и производных многозначных отображений (см.,.
например1"'19'20). ... i;;,LJ _ ; '',"' '.',' ....... „.., ',. :>'"
Начиная с.работы21, касательные конусы и производные многозначных отображений находят широкое применение в теории ДВ, , Новый импульс развитию теории ДВ придала теория оптимального управления.. Были изучены управляемые процессы, математическая модель которых задается ДВ и получены необходимые условия для оптимальности траекторий ДВ в виде принципа максимума Л.С.Понтрягина (см., например16,'18^2,23 и библиографию в них).
Большое место в исследовании динамических систем с неопределенно
стью занимает задача удержания траекторий на заданном замкнутом мно
жестве. Рассматриваются два типа задач удержания: задача слабого удер
жания траекторий (ее синоним - задача существования выживающих тра
екторий ) и задача сильнрго удержания траекторий. -..,..
Суть задачи слабого удержания траекторий состоит в том, что существует хотя бы одна траектория управляемой системы, которая, остается на заданном множестве. В,задаче сильного удержания требуется, чтобы все траектории, выходящие из заданной начальной позиции оставались на заданном множестве,
Задачи слабого и сильного удержания, исследовались многими авторами (см,,7,10'11,13'20,21,24 и,библиографию в них). В,работах8,11;24 изучены свойства слабой и сильной инвариантности замкнутого множества относительно систем, математическая модель которых задается ДВ. В случае, когда множество является слабо (сильно) инвариантным относительно заданной системы, то задача слабого (сильного) удержания траекторий этой
17BouIigand G. Sur Pexistence dee dimi - tangents a une combe de Jordan. Fund. Math. 1930. Vol.15..P.215-
218.- . ...---; ,. ,--
"ClarVe F\H. Generalized gradients and applications. Trans. Amer. Math. Soc. 1975.' Vol.205: P.247 -262.
19Половинкнн E.C Теория многозначных отображений. M.: Иэд-во МФТИ. 1983. ;. и
2QAubin J.P., Cellina A. Differential inclusions. Set valued maps and viability theory. Berlin. Springer-Verlag. 1984.
"Nagumo M. Uber die Lage der Integralkurven gewonlicher Difterentialgleichungen. Proc. Phy's. Math. Soc.
Japan. 1942.: Vol.24. P.551 - 559. '''
г2Барбашин E.A., Алимов Ю.И. К теории релейных дифференциальных уравнений. Изв. вузов. Матема
тика. 1962. N 1; С.З - 13. ;.' : .
23Благодатских В.И. Некоторые результаты по теории дифференциальных включений. Summer school on
ordinary differential equations. - Brno, 1975. --
системы на заданном множестве разрешима.
По видимому, первой работой, посвященной изучению свойства слабой инвариантности, следует считать работу21 . Критерий слабой инвариантности, полученный в работе18, сформулирован с помощью касательного конуса Кларка. Отметим, что эта тематика получила новый размах в начале 80- ых годов в связи с дальнейшим развитием теории ДВ и негладкого анализа (см.,7,10,13' 18_го>23 и и библиографию в них).
В работе25 приведен критерий слабой инвариантности множеств, который имеет инфинитезимальную форму и связьгаает правую часть системы с касательным конусом Булигана, который содержит касательный конус Кларка. В работе20 этот результат сформулирован в терминах производных многозначного отображения.
В работе10 на базе конструкций теории позиционных дифференциальных игр, получен критерий и - стабильности множеств относительно конфликтно - управляемых систем, в котором применяется локальное овыпу-кление производной многозначного отображения. Понятие и - стабильности множеств1 близко к понятию слабой инвариантности множеств относительно дифференциального включения. Оно означает слабую инвариантность множества относительно некоторого семейства ДВ, которые определяются правой частью конфликтно - управляемой системы. В работе24 аналогичные критерии получены для слабой и сильной инвариантности множеств относительно ДВ.
Сильно инвариантные множества относительно ДВ рассмотрены в работах (см.,18'20,24 и библиографию в них).
При исследовании управляемых систем, часто оказывается достаточным знать не полную траекторию систему, а только положение системы в определенный момент времени. Совокупность всевозможных векторов состояния системы в этот момент времени называется областью или множеством достижимости системы в заданный момент времени. В теории управляемых систем большое количество работ посвящено теорейческим исследованиям и численным методам построения множеств достижимости (см., например13,28,27 и библиографию в них).
В диссертационной работе, наряду с теоретическими разработками задач удержания траекторий управляемых систем, левосторонних решений
Гусейнов X.Г., Ушаков В.Н. Сильвой слабо инвариантные множества относительно дифференциального включении. Докл. АН СССР. 1988. Т.ЗОЗ. N 4. С.794 - 7Э7.
"Haddad G. Monotone trajectories of differential inclusions and functional differential inclusion with memory. Israeli, of Math. 1981. Vol.39, no.l. P.83- 100. щ "Черноусько Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М.: Наука. 1988.
"Пакасюк А.И., Панасюк В.И. Об одном уравнении, порождаемом дифференциальным включением. Матем. заметки. 1980. Т.27. N З, С.429 - 437.
уравнения Гамильтона - Якоби, предлагаются вычислительные процедуры построения множеств достижимости управляемых систем с геометрическими, а также с квадратичными интегральными ограничениями на управления.
Цель работы состоит в изучении задач удержания траекторий управляемых систем с неопределенностью на замкнутом множество с помощью аппарата производных многозначного отображения, в разработке аппрок-симационных схем и алгоритмов для вычисления множеств достижимости управляемых систем с геометрическими и интегральными ограничениями на управления, в исследовании левосторонних решений уравнения Гамильтона - Якоби.
Методы исследования. В основе разрабатываемых в диссертации методов лежат концепции теории позиционных дифференциальных игр, теории минимаксных решений уравнения Гамильтона - Якоби и теории дифференциальных включений. Активно используются понятия и результаты негладкого анализа, функционального анализа и дифференциальных уравнений.
Научная новизна. 1. Получены критерии для задач слабого и сильного удержания на заданном замкнутом множестве траекторий управляемой системы с неопределенностью, задаваемой дифференциальным уравнением с многозначной правой частью, т.е. ДВ. Другими словами, получены критерии слабой и сильной инвариантности замкнутых множеств относительно ДВ в терминах производных многозначного отображения.
2. С применением этих критериев исследованы некоторые задачи упра
вления: сформулированы необходимые и достаточные условия для функ
ции оптимального результата в задаче управления, в которой динамика
задается ДВ; даны дифференциальные соотношения, характеризующие ин
тегральную воронку ДВ; для заданного множества определено ДВ, инте
гральная воронка которого совпадает с этим множеством; доказаны теоре
мы существования периодических решений ДВ с фазовым ограничением,
зависящим от времени; приведено достаточное условие устойчивости (отно
сительно неточных измерений фазового состояния) позиционной стратегии,
разрешающей задачу сближения для конфликтно - управляемых систем;
найден критерий стабильности множества программного поглощения в ли
нейной задаче сближения.
3. Разработана вычислительная процедура приближенного построения
множеств достижимости нелинейных управляемых систем с геометриче-
скими ограничениями на управления. Дано теоретическое обоснование приближенного построения множеств достижимости и получена оценка точности. Вычислены множества достижимости конкретно заданных систем на плоскости.
4. Дана аппроксимационпая схема для построения множеств достижи
мости управляемых систем с квадратичными интегральными ограничения
ми на управления. Доказана сходимость аппроксимирующей системы мно
жеств к множеству достижимости и найдена оценка точности приближен
ных вычислений множеств достижимости. Приведено описание алгоритма
для приближенного вычисления множеств достижимости. Проведено вы
числение множеств достижимости конкретно заданной системы на плоско
сти.
-
Введено понятие левостороннего решения (ЛР) уравнения Гамильтона - Якобй и на примерах показано его качественное отличие от минимаксного решения. Приведено достаточное условие существования ЛР и изучены некоторые его свойства. Дано описание левосторонних решений в терминах производных по направлениям. Предложена аппроксимационная схема для построения множеств уровня ЛР.
-
Изучена задача удержания траекторий управляемых систем при наличии помех, задаваемых ДВ с управляющим вектором. Введено понятие позиционно слабо инвариантного множества относительно таких управляемых систем. Получены достаточные условия для позиционно слабой инвариантности. На основе этих условий установлена процедура определения стратегий, удерживающих движения системы на заданном множестве. Приведены процедуры определения стратегий, разрешающих задачу сближения и уклонения для конфликтно - управляемых систем, математическая модель которых задается ДВ.
-
Получены необходимые, а также близкие к ним достаточные условия разрешимости задач слабого и сильного удержания траекторий обобщенных динамических систем на заданном замкнутом множестве. Рассмотрен вопрос существования ДВ, интегральная воронка которого совпадает с графиком многозначного отображения, определяющего эволюцию обобщенной динамической системы. Найдены достаточные условия, гарантирующие удержание траекторий обобщенных динамических систем с управляющим вектором на заданном замкнутом множестве и определены стратегии, удерживающие движения системы на этом множестве.
Теоретическая и практическая ценность диссертации заключается в том, что изложенные в ней методы являются конструктивными. Они создают теоретическую основу для разработки алгоритмов и программ ре-
шеняя прикладных задач управляемых процессов в условиях неопределенности. Предложенные в работе численные методы могут быть применены при построении множеств достижимости управляемых систем с геометрическими и интегральными ограничениями на управления. Аппарат производных многозначных отображений является удобным средством для анализа задач слабого и сильного удержания траекторий управляемых процессов в условиях неопределенности.
Апробация работы. Результаты диссертации докладывались на 5-ой и 7-ой Всесоюзных конференциях по управлению в механических системах (Казань, 1985; Свердловск, І990), 2-ой Всесоюзной конференции по функционально - дифференциальным уравнениям и их приложениям (Челябинск, 1987), мини - семестре по дифференциальным включениям и их приложениям в Международном Математическом центре им. С.Банаха (Варшава, 1989), І1-ом Всемирном конгрессе Международной Федерации по Автоматическими Управлению (Таллинн, 1990), Всесоюзной конференции по негладкому анализу и его приложениям в экономических системах (Баку, Д991), семинарах отдела динамических систем ИММ УрОРАН, кафедры оптимального управления факультета вычислительной математики и кибернетики МГУ, кафедры теории управления и оптимизации ЧелГУ, кафедры высшей математики МФТИ.
Публикации. По теме диссертации опубликовано 19 работ, список ко
торых приводится в конце автореферата. Результаты, вошедшие в диссер
тации получены автором. ,-.'. , Г;,' , ; ; ' I:'":'
Структура и объем работы. Диссертация сострит из введения,
пяти глав, разбитых на 24 параграфов. Объем диссертации составляет. 354
страниц," набранных на текстовом редакторе &TgX. Библиография; состоит
из 267 наименований." '" . * .,., ..,. ,