Введение к работе
Актуальность теин. Основане вопросы, которыми занимается математическая теория оптимального управления, были сформулированы в пятидесятые годы. В 1961 году вышла в свет монография Л.С.Понтрягина, В.Г.Болтянского, Р.В.Гаикрелидзе и Е.Ф.Мищенко1), в которой была впервые систематически изложена теория оптимальных процессов. Основное содержание этой книги, составляют необходимые условия оптимальности в форме принципа максимума. Группа утверждений, дающих необходимые условия оптимальности в задачах оптимального управления, получила широкое признание во всем мире и при ссылках обозначается как принцип максимума Понтрягина.
С начала шестидесятых годов в нашей стране и за рубежом было выпущено большое количество монографий по математической теории оптимальных процессов. Основная часть этих книг посвящена получению новых доказательств принципа максимума Понтрягина, достаточных условий оптимальности, ослаблению условий применимости принципа максимума, исследованию конкретных классов задач, разработке прямых методов приближенного решения задач оптимального управления.
Так или иначе почти во всех упомянутых книгах ставился Еопрсс о выборе подходящего класса допустимых управлений, в котором можно было бы гарантированть существование оптимального решения. Уже в упомянутой книге , четырех авторов на простых примерах было показано, что, например, класс непрерывных допустимых управлений является слишком узким с этой точки зрения. Доказательство принципа максимума в этой книге было дано для класса измеримых по Лебегу управлений, удовлетворяющих геометрическим ограничениям. В этом же классе доказана теорема существования оптимального управления для линейных задач быстродействия. Для нелинейных систем общая теорема существования была получена в еще более широком классе обобщенных управлений"), причем минимальность ктого класса
допустимых управлений продемонстрирована на примерах. В то же время минимальность класса измеримых по Лебегу допустимых управлений для.задач более или менее простой структуры до_конца исследована не была. В рассматриваемых в литературе примерах оптимальное управление, как правило, оказывается кусочно-постоянной функцией.
В связи с изложенным естественно возникает вопрос: нельзя ли утверждать, что в задачах оптимального управления простой структуры оптимальное управление в действительности существует в более узком классе допустимых управлений, чем класс измеримых по Лебегу функций?
Цель работы. В настоящей работе исследуется, какие крайние нерегулярные свойства оптимальных управлений могут появиться в простейших (с точки зрения получения необходимых условий оптимальности) задачах: линейной задаче оптимального быстродействия и линейной терминальной задаче с постоянными коэффициентами. Кроме того, исследован первый прямой метод преследования Понтрягина. Для него рассмотрен аналогичный вопрос: какие крайние нерегулярные свойства может иметь стратегия преследования, если убегащий объект применяет достаточно гладкие управления. Оказываэтся, и оптимальные управления, и стратегии преследования обладают схокими свойствами.
Помимо названных вопросов существенная часть работы посвящена разработке аппарата - изучению теории многозначных отображений и теории выпуклых множеств. Многие полученные в этом направлении результаты с точки зрения основных целей диссертации являются вспомогательными, однако их формулировки носят законченный характер.
Основные результаты диссертации заключаются в следующем:
1. Для полунепрерывных сверху многозначных отображений получено, что множество точек разрыва как самого отображения, так и всех его ветвей может быть произвольным множеством типа Р0 первой категории Бэра. В частности, множество точек разрыва может иметь полную меру Лебега. Найдены достаточные условия существования непрерывных и даже гладких однозначных ветвей
полунепрерывных сверху отображений.
-
Построены линейные задачи быстродействия и терминальные задачи с постоянными коэффициентами, в которых произвольное оптимальное управление разрывно почти всюду. Получено, что множество начальных и конечных состояний,' для котороых оптимальное управление почта всюду разрывно, могут образовывать весьма богатое множество в фазовом пространстве. Показано, что семейство задач указанного типа с почти всюду разрывными оптимальными управлениями образуют плотное семейство в пространстве всевозможных линейных задач.
-
Исследованы свойства типичных (с точки зрения категорий Бэра) выпуклых компактных множеств. На основе этих результатов получено, что если в линейной терминальной задаче возмущениям подвергается функционал, то типичным в смысле меры Лебега оптимальным управлением является интегрируемая по Риману функция. Если же возмущениям подвергается множество, задащее ограничения, то типичным, но теперь ухе с точки зрения категорий Бэра, является непрерывное управление, имеющее бесконечное изменение.
-
Рассмотрена линейная дифференциальная игра преследования и стратегии поимки, конструируемые по первому прямому методу Понгрягша. Динамика рассматриваемых процессов описывается системой линейных обыкновенных дифференциальных уравнений с постоянными коэффициентами. Показано, что стратегии преследования могут оказаться почти всюду разрывными функциями, даже если убегающий объект использует гладкие управления. Для цвумеринх дифференциальных игр преследования получено, что если задача преследования разрешима первым прямым методом Понтрягина, го она разрешима в классе управлений преследования конечной зариации.
Научнвя новизна. Фактически одним из первых результатов, сасащихся регулярности оптимальных управлений, можно считать теорему Фельдбаума о числе переключений, согласно которой в пгаейной задаче оптимального быстродействия с постоянными коэффициентами и с множеством ограничений на значения допустимых оправлений в виде многогранника при выполнении условия общности
положения оптимальное управление единственно и представляет собой функцию с конечным числом точек разрыва. Аналогичный результат был получен болгарским математиком В.Вельовым для инерционных допустимых управлений: б линейной задаче быстродействия с постоянными коэффициентами и многогранными множествами ограничений на значения допустимых управлений и их производных при выполнении условия общности положения любое оптимальное управление кусочно-линейно и имеет конечное число изломов. Оба эти результата в свое время были обобщены автором на случай, когда условие общности положения не выполнено3). Было доказано, что в этой ситуации среди оптимальных управлений существует кусочно-постоянноь управление с конечным числом переключений (для инерционных допустимых управлений было показано существование среда оптимальных управлений кусочно-линейного). На основе оценок числа переключений для линейных задач с измеримыми и инерционными допустимыми управлениями Е.Н.Хайловым и Б.Г.Стуруа были разработаны численные алгоритмы приближенного вычисления моментов Переключения оптимального управления.
В целом вопрос о разрешимости как линейных, так и нелинейных задач оптимального управления в классе релейных управлений с ограниченным числом переключений или управлений с другими свойствами регулярности рассматривался многими авторами. В работах Б.Ш.Мордуховича, К.Малановского и У.Хагера было показано, что в задаче минимизации коэрцитивного интегрального функционала можно оценить модуль непрерывности оптимального управления, а в задачах с линейной, динамикой доказать, что оптимальное управление удовлетворяет условию Липшица. Ф.Кларк и Р.Винтер исследовали задачу оптимального управления траекториями линейной системы дифференциальных уравнений с постоянными коэффициентами. Минимизируемый функционал является интегральным и нелинейно зависит от управления и фазовой переменной: ограничений на значения допустимых управлений нет. Найдены ослабленные условия коэрцитивности, при которых оптимальное управление в том или ином смысле регулярно, например, существенно ограничено или непрерывно. Г.Суссман показал, что в
линейной по управлению задаче оптимального быстродействия с ограниченными по модулю скалярными управлениями и аналитической по фазовым перемежим правой частью дифференциальной системой из существования релейного оптимального управления вытекает существование релейного оптимального управления с множеством точек разрыва меры ноль, то есть, оптимального управления, интегрируемого по Риману.
В отличие от исследований упомянутых авторов в настоящей работе регулярность оптимального управления изучена в связи с ограничениями на допустимые управления. При этом рассмотрены процессы, динамика которых описывается простейшими . линейными уравнениями. Оказывается, даже в этом, почти тривиальном с точки зрения необходимых условий оптимальности случае, структура оптимальных управлений может оказаться весьма нерегулярной. В качестве вспомогательного аппарата в диссертации развиты некоторые разделы теории многозначных отображений. Изучена регулярность полунепрерывных отображений, а также регулярность их однозначных ветвей. Найдены условия существования непрерывных и даже гладких однозначных ветвей полунепрерывных сверху отображений. Кроме того, исследованы вопросы о структуре типичных с точки зрения категорий' Бэра оптимальных управлений. В работе также изучена регулярность стратегий поимки первого метода Л.С.Поятрягина, установлена связь между их гладкостью и размерностью фазового пространства задачи.
Все полученные в диссертации результата являются новыми.
Общая ыетодика исследования. При обосновании содержащихся в дассертаїдаи утверждений использовались метода математической теории управления, теории дифференциальных игр, метода теории дифференциальных уравнений и геометрии, метода теории функций и выпуклого анализа.
Практическая ценность работы. Полученные результаты носят в основном качественный характер. Однако содержащиеся в диссертации выводы имеют большое практическое значение. В частности, при построении численных алгоритмов важно знать, какому классу принадлежит отыскиваемый оптимальный режим. Полученные в диссертации утверждения говорят о том, что если на
исходные данные задачи не накладывать дополнительных ограничений, то даже в простейших случаях оптимальное управление может оказаться весьма нерегулярным, что, естественно, отрицательно сказывается на характере сходимости алгоритмов. Кроме того, для линейных дифференциальных игр на плоскости в работе предложена новая процедура реализации стратегии преследования первого прямого метода Лонтрягина. позволяющая строить регулярные управления при условии регулярности управления убегающего.
Апробация работы. По полученным в диссертации результатам делались сообщения на Международном Конгрессе математиков в Варшаве в 1983 году; на IX и X Всесоюзных совещаниях , по проблемам управления в Ереване и в Алма-Ате, соответственно, в 1983 и.198В годах; на Региональных Уральских конференциях по функциональным и дифференциальным уравнениям в Перми в 1985 году, в Уфе в 1986 году, в Челябинске в 1987 году; на международном семинаре по теории систем в Международном институте прикладного системного анализа в Лаксенбурге в 1988 году; на VII Всесоюзной конференции по управлению в механических системах в Свердловске в 1990 году; на Международной конференции по управлению и моделированию детерминированных и стохастических систем в Шопроне в 1S90 году; на Всесоюзной школе по теории операторов и оптимальному управлению в Никнем Новгороде в 1991 году. Помимо этого результаты . обсуждались на научно-исследовательском семинаре кафедры оптимального управления факультета ВМиК МТУ; на семинаре кафедры математической физики того же факультета под руководством профессора Ф.П.Васильева; на семинаре под руководством профессора А.МЛер-Крикорова на Вычислительном Центре АН СССР; на семинаре под руководством профессоров В.И.Благодатских и К.И.Осколкова в Математическом Интституте АН км.Стеклова; на семинаре под руководством профессора ' А.Адамова на кафедре дифференциальных уравнений Ташкентского государственного университета; на семинаре под руководством профессора В.И.Коробова на кафедре дифференциальных уравнений и теории управления Харьковского государственного университета.
- б -
Публикации. Результаты диссертации опубликованы в работах [1 } - [15].
Структура и объеи работы. Диссертация содержит введение, четыре главы и короткое заключение. В каждой из глав имеется по нескольку параграфов. Некоторые параграфы разбиты на подпункты. Ойций объем диссертации равен 185 страницам, в работе имеется 7 иллюстраций. В списке литературы содержится 128 названий.