Введение к работе
Диссертация посвящена построению корректных расширений игровых задач с ограничениями асимптотического характера. В частности, рассматриваются игровые задачи программного управления линейной системой с возможной разрывностью в коэффициентах при управляющем воздействии. В качестве обобщенных элементов используются конечно-аддитивные меры ограниченной вариации; соответствующие компакты упомянутых мер определяются в виде подпространств пространства, сопряженного пространству ярусных функций (определяемых как равномерные пределы ступенчатых функций), в оснащении *-слабой топологией. Конструируемые обобщенные игровые задачи (на макси- мин) определяют асимптотику реализуемых значений максимина при ослаблении стандартных ограничений. Исследуется постановка, в которой ограничения на выбор управления изначально имеют асимптотический характер.
Актуальность темы. В современном мире теория управления играет важную роль. Одна из проблем теории управления состоит в определении оптимального управления в условиях действия помехи, что типично для задач управления техническими системами. Наиболее плодотворным в решении такой проблемы является игровой подход, в котором выбор помехи осуществляет второй (зачастую фиктивный) игрок. Развитие математической теории задач конфликтного управления прежде всего связано с работами Н.Н. Красовского, Л.С. Понтрягина, Б.Н. Пшеничного, А.И. Субботина. Первые постановки дифференциальных игр были рассмотрены Р. Айзексом.
Существенное влияние на теорию управления и теорию дифференциальных игр оказали работы Р.В. Гамкрелидзе, А.В. Кряжимского, А.Б. Куржан- ского, Е.Ф. Мищенко, Ю.С. Осипова, Ф.Л. Черноусько, J.P. Aubin, T. Basar, P. Bernhard, J.V. Breakwell, L. Berkovitz, M.G. Crandall, R.J. Elliot, A. Friedman N.J. Kalton, G. Leitmann, P.L. Lions, C. Ryll-Nardzewski, P. Varaiya, J. Warga.
Большой вклад в теорию управления и теорию дифференциальных игр внесли Э.Г.Альбрехт, В.Д. Батухтин, С.А. Брыкалов, Н.Л. Григоренко, П.Б. Гусятников, М.И. Зеликин, А.Ф. Клейменов, Н.Ю. Лукоянов, А.А. Меликян, М.С. Никольский, В.В. Остапенко, В.С. Пацко, Н.Н. Петров, Л.А. Петросян, Е.С. Половинкин, Н.Н. Субботина, А.М. Тарасьев, А.А. Толстоногов, В.Е. Третьяков, В.И. Ухоботов, В.Н. Ушаков, А.Г. Ченцов, А.А. Чикрий, С.В. Чистяков, M. Bardi, E.N. Barron, A. Blaquiere, I. Capuzzo Dolcetta, M. Falcone, L.C. Evans, R. Jensen, M. Ishii, J. Lewin, P. Soravia, P.E. Souganidis и многие другие ученые.
Задачам импульсного управления посвящены работы Н.Н. Красовского, А.Б. Куржанского, Р. Винтера, В.И. Гурмана, М.И. Гусева, В.А. Дыхты и О.Н. Самсонюк, С.Т. Завалищина и А.Н. Сесекина, А.М. Самойленко, Б.М. Миллера, В.М. Тихомирова, Т.Ф. Филипповой, А.Г. Ченцова, J. Warga, A. Halanay, D. Wexler и многих других ученых.
Конструкции расширений задач оптимального управления с геометрическими ограничениями рассматривались многими авторами, отметим здесь исследования Р.В. Гамкрелидзе, L.C. Yong, J. Warga. Конструкции расширений играют важную роль в игровых задачах управления (см., например, [6, 9]). Отметим, что для построения методов решения позиционных дифференциальных игр использовались результаты, полученные для игровых задач программного управления. В упомянутых игровых задачах программного управления применялись конструкции расширений на базе управлений-мер, что сыграло важную роль при построении вспомогательных программных конструкций для решения нелинейных дифференциальных игр и при исследовании условий регулярности, которые позволяют осуществлять прямой переход от (более простых) игровых задач программного управления к построению процедур управления по принципу обратной связи. Заметим, что в регулярных дифференциальных играх программный максимин определяет цену игры (см. [5]). Данное направление получило развитие в работах Н.Н. Красовского и его учеников. Важным этапом в исследованиях являлось построение обобщенных игровых задач программного управления, в том числе и при фазовых ограничениях. В последнем случае часто возникает скользящий режим управления, при котором фазовые ограничения соблюдаются «на грани фола». Напомним здесь же, что в определении фундаментального свойства стабильности Н.Н. Красовским было предложено использовать обобщенные реакции на обычные и, более того, постоянные управления одного из игроков; наряду с правилом экстремального сдвига это сыграло важную роль в доказательстве фундаментальной теоремы Н.Н. Красовского и А.И. Субботина об альтернативе в нелинейной дифференциальной игре. Заметим, что расширение «совокупной» игровой задачи может не сводиться к сочетанию индивидуальных расширений игроков; соответствующие примеры, касающиеся вспомогательных программных конструкций для позиционных дифференциальных игр, приведены в [10, 11].
Идеи, связанные по существу с конструкциями расширений, использовались и в других разделах математики (см., например, [1-3] в связи с задачами математического программирования). В качестве одного из самых известных вариантов конструкций расширений следует отметить использование смешанных стратегий в антагонистических играх, благодаря чему в широком классе игровых задач удается решить проблему существования седловой точки (см. [7]).
В настоящей работе целенаправленно исследуются вопросы построения корректных расширений абстрактных игровых задач программного управления с ограничениями асимптотического характера, которые, в частности, могут возникать при ослаблении стандартных ограничений или быть заданными изначально. Данные построения связаны с постановками, в которых истинное качество процесса реализуется при соблюдении ограничений «на грани фола» (с высокой, но все же конечной степенью точности).
Конструкции расширения в классе конечно-аддитивных мер использовались в работах Е.Г. Белова, А.И. Жданка, А.И. Короткого, В.П. Серова, С.И. Тарасовой, А.Г. Ченцова, Ю.В. Шапарь. В связи с расширением задач с ограничениями асимптотического характера отметим работы [12, 13].
Большой вклад в развитие конечно-аддитивной теории меры внесли работы: Г. Гильдебрандта, Н. Данфорда и Дж.Т. Шварца, Л.В. Канторовича, Г.М. Фихтенгольца, Е. Хьюитта и К. Иосиды, Б. Рао К. и Б. Рао М.
Цель работы. Построение расширений абстрактных задач программного управления на максимин, реализуемых в соответствующих классах конечно- аддитивных мер. Построение асимптотики значений программного максимина в классе обычных управлений при ослаблении стандартных ограничений. Исследование задачи на программный максимин в классе импульсов управления с «исчезающе малой» продолжительностью.
Методы исследования. Используются методы теории управления, математического программирования, функционального анализа, общей топологии, теории игр, теории меры.
Научная новизна. Для абстрактных игровых задач с различными ограничениями импульсного характера и режимами управления построены расширения в подходящих классах конечно-аддитивных мер. Данный подход позволяет решить проблему компактификации пучка траекторий и области достижимости. Другим важным следствием данного подхода является возможность исследовать асимптотику значений (реализуемого) максимина в случаях, когда каждое упомянутое значение соответствует множеству-элементу некоторой базы фильтра (в терминах упомянутых баз фильтров задаются ограничения асимптотического характера). Ограничения асимптотического характера в виде баз фильтров могут, в принципе, возникать по разным причинам. Например, это может происходить при ослаблении стандартных ограничений, задаваемых требованием принадлежности множеству некоторой «оценки» возможного решения. При этом реализуется семейство множеств допустимых обычных решений, отвечающих каждое соответствующей «степени» ослабления стандартного ограничения. В других случаях «асимптотические ограничения» задаются изначально, а их соблюдение приводит к реализации предельных значений функции стоимости. В рамках предполагаемого подхода, связанного с расширением исходной задачи, удается исследовать асимптотику реализуемых значений максимина в случае, когда игровая задача не обладает устойчивостью при ослаблении исходной системы стандартных ограничений.
Для одного конкретного варианта измеримого пространства с полуалгеброй множеств (а именно для пространства-стрелки) дано конкретное описание конечно-аддитивных мер, реализующих вспомогательное множество притяжения в пространстве обобщенных элементов, что позволяет находить асимптотику реализуемых значений максимина (асимптотический максимин).
Теоретическая и практическая значимость. Для игровых задач на максимин (с различными типами ограничений на выбор программного управления игроками) были реализованы конструкции расширения в классе конечно- аддитивных мер, что позволяет в упомянутых задачах корректно описать эффекты, возникающие при условиях разрывности в коэффициентах при управлении и имеющие смысл произведения разрывной функции на обобщенную. Результаты работы представляются полезными для исследования конкретных постановок игровых задач управления линейными системами с импульсными ограничениями и разрывностью в коэффициентах при управляющих воздействиях. Соответствующие примеры таких постановок доставляют инженерные задачи, связанные с управлением техническими системами при наличии ресурсных ограничений. Ограничения такого типа возникают в задачах космической навигации. При этом вышеупомянутая разрывность может, в некотором естественном смысле, отражать процесс резкого изменения массы управляемого объекта. В работе построены корректные расширения абстрактных задач управления на максимин, в которых присутствуют ограничения асимптотического характера, которые могут быть порождены ослаблением традиционных ограничений либо возникать изначально (пример такого рода задач рассмотрен в четвертой главе).
Структура и объем работы. Диссертация состоит из введения, 4 глав и списка литературы. Главы разбиты на параграфы. Нумерация глав, параграфов и утверждений сквозная. Нумерация формул тройная. Объем работы 168 страниц и включает 5 рисунков, 1 таблицу. Библиография содержит 81 наименование.