Введение к работе
Предмет исследования. Диссертационная работа связана с изучением и с разработкой методов п алгоритмов моделирования гарантированного управления в динамических системах при наличии воздействия со стороны помехи, а также неточности или нечеткости в замере фазового состояния. Подход, положенный в диссертации в основу построения моделей таких задач управления, базируется на принципе гарантированного результата. При таком подходе помехам приписывается поведение, ухудшающее показатель качества, в соответствии с которым строится управление. Моделирование неточности или нечеткости получаемой информации о фазовом состоянии системы приводит к конструированию нового фазового пространства, которое в отличие от исходного обладает неполной линейной структурой. Выбранный подход приводит к рассмотрению задачи моделирования управлення в рамках теоргш дифференциальных игр.
Актуальность темы. Такие задачи имеют своим источником многочисленные задачи из механики и других областей знаний. Они находят все большее применение при решении различных проблем. Актуальность этих задач, их большой теоретический интерес и прикладное значение обеспечили интенсивное развитие теории дифференциальных игр, составляющей основу алгоритмов синтеза гарантированного управления. Установлены прочные связи этой теории с другими разделами математики: теорией обыкновенных дифференциальных уравнений, включений и уравнений в частных производных; недифференцируемой оптимизацией и выпуклым анализом; вычислительной математикой. Интенсивно разрабатываются вычислительные методы решения задач гарантированного управления.
Становление теории дифференциальных игр относится к началу 60-х годов п связано с именами советских и зарубежных математиков Н.Н.Красовского, Л. С. Понтряпша, Р. Анзекса, У. Флеминга. Крупный вклад в развитие теории дифференциальных игр внесли Э. Г. Альбрехт, М. Барди, В. Д. Батухтин, Е. Н. Баррон, Т. Башар, Р. Беллман. А. Брай-
сон, Н. Л. Грпгоренко, Р. В. Гамкрелидзе, В. И. Жуковский, М. И. Зеликин, Н. Калтон, А. Ф. Клейменов, А. Н. Красовский, А. В. Крхжимский, А. Б. Куржанскнй. Дж. Лейтыан, П. Л. Лпонс, А. А. Мелпкян, Е. Ф. Мищенко. М. С. Никольский, Г. Ольсдер, Ю. С. Осипов, А. Г. Пашков, В. С. Пацко; Н. Н. Петров, Л.А. Петросян, Г. К. Пожарищшй, Б. II. Пшеничный, А. И. Субботин, Н. Н. Субботина, В. Е. Третьяков, В. Н. Ушаков, А. Фридман, Хо-Ю-Ши, А.Г.Чендов, Ф.Л.Черноусько, А.А.Чикрий, Р.Эллиот и многие другие.
Предметом исследования теории дифференциальных игр являются задачи управления в условиях конфликта и неопределенности. На практике при решении различных механических и других задач возникает потребность построить позиционную стратегию, гарантирующую определенное качество управляемого процесса при любом допустимом и неизвестном заранее воздействии со стороны помехи.
Н.Н.Красовским и представителями его научной школы развита концепция позиционных игр, в основе которой лежит понятие стабильного моста п правило экстремального прицеливания на него1,2,3. Для широкого круга дифференциальных игр доказана теорема об альтернативе2. Обоснованы методы детерминированных и стохастических программных конструкций3. В работах А.И.Субботина условия стабильности сформулированы с помощью производных по направлению. В результате получены дифференциальные неравенства, которые обобщают основное уравнение дифференциальных игр, записанное Р.Айзексом4.Этот подход применен к построению
1 Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука. 1970.
420 с.
2 Красовский Н.Н., Субботин А.И. Позиционные дифференциальные
игры. М.: Наука. 1974. 456 с.
3 Красовский Н.Н. Управление динамической системой. М.: Наука. 1985.
518 с.
4 Айзеке Р. Дифференциальные игры. М.: Мир. 1967.479 с.
теории обобщенных решений уравнения Гамильтона - Якоби.
В работах Л.С.Понтрягина5 разработана аналитическая схема нахождения решения линейной дифференциальной игры преследования на основе альтернированного интегрирования выпуклых множеств. Эти два прямых метода получили названия первого п второго прямых методов Л.С.Понтрягина. Во втором методе используется идея попятного движения от терминального множества. В работах Л.С.Понтрягина и А.С.Мищенко на основе альтернированного интегрирования разработаны алгоритмы моделирования управления преследователя без дискриминации убегающего объекта. Конструкции первого и второго методов Л.С.Понтрягина активно развивались в работах М.С.Никольского. Были разработаны вычислительные процедуры п доказана сходимость для альтернированных сумм.
Идея второго метода Л.С.Понтрягина была обобщена Б.Н.Пшеничным на нелинейные дифференциальные игры. Им разработана операторная конструкция решения игровых задач.
Наряду с наличием воздействия со стороны помех, поступающая информация о реализовавшемся фазовом состоянии может носить неполный и неточный характер. Известна только область, где находится фазовая точка. В этом случае приходится строить управление в зависимости от этих информационных множеств. Исходная управляемая система индуцирует движение множеств. В такой постановке задачи управлепия рассматривались в работах А.Б.Куржанского, В.Е.Третьякова, В.С.Пацко и С.И.Кумкова и других. Операции сложения двух множеств и умноження множества на число удовлетворяют не всем свойствам линейного пространства. Не выполняется дистрибутивный закон умножения на множество относительно сложения двз'х чисел п не существует противоположный элемент.
ДрЗ'гим примером является совокупность нечетких по Заде множеств
0 Понтрягин Л.С. О линейных дифференциальных играх. 1.2.// Докл. АН СССР. 19G7. Т.174. N б. С. 1278 - 1280. Докл. АН СССР. 1967. Т.175. N 4. С. 764 - 766.
универсальным множеством которых является линейное вещественное пространство. К постановке задач управления нечеткими множествами приходим, например, в том случае, когда для оценки начального состояния системы, а также для оценки помех привлекается группа экспертов, после опроса которых строятся функции принадлежности нечеткого начального состояния и нечеткой помехи. Отметим, что обычное подмножество универсального множества можно рассматривать как нечеткое множество, функция принадлежности которого совпадает с ее характеристической функцией. При таком отождествлении операции сложевмя и умножения яа числа в пространстве нечетких множеств переходят в обычные операции сложения множеств и умножения их на числа. В этом смысле задача синтеза гарантированного управления в пространстве нечетких множеств содержит в себе задачу синтеза с неполной и неточной информацией.
Вопросам принятия решений в рамках теории нечетких множеств посвящена обширная литература. Дифференциальные игры с нечетким целевым множеством и нечеткими начальными условиями рассматривались в работах В.А.Байдосова и В.Н.Ушакова. Ими была принята такая формализация исходной задачи, что она сводится к задаче о вычислении цены игры в классе обычных позиционных стратегий с платой, равной функции принадлежности нечеткой цели.
Задачи управления с помехами при наличии неполной и неточной или нечеткой, расплывчатой информации о фазовом состоянии рассматриваются в диссертации с единых позиций, а именно как задача синтеза гарантированного результата в фазовых пространствах с неполной линейной структурой. Под такими пространствами в диссертации понимаются множества, наделенные линейной структурой, в которой может не выполняться дистрибутивный заков умножения числа на вектор относительно сложения двух чисел и не существовать противоположный элемент.
6 Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений // М.: Мир. 1976. 161 с.
В диссертации исследуются теоретические аспекты моделирования гарантированного результата в таких задачах управления. Отсутствие топологии в фазовом пространстве требует формализации понятий движения, условия окончания. Зависимость уравнений движения от фазового состояния и от времени (в линейных нормированных пространствах - это непрерывность, условие Липшица и т.п.), при выполнении которых можно строить гарантированное управление, требует разработки. Вносит специфику и отсутствие некоторых свойств линейного пространства.
В диссертации предложен и обоснован алгоритм синтеза гарантированного управления с учетом специфики рассматриваемой проблемы. Синтезируемое управление рассматривается как обычное, "четкое", но определенное на всем фазовом пространстве. Это формализуется следующим образом: вектограммы синтезируемого управления лежат в подмножестве, которое относительно операций в фазовом пространстве является линейным подпространством.
В теории позиционных игр управление является функцией времени и положения2. Н.Н.Красовский ввел3 более сложную формализацию, в которой управление является функцией времени, положения и положительного параметра точности. Она обеспечивает существованпе универсальной оптимальной стратегии. В диссертации применяются оба этих подхода прп синтезе гарантированного управления в фазовых пространствах с неполной линейной структурой и при отсутствии топологии.
В основе алгоритмов синтеза гарантированного позиционного управления лежит2 понятие стабильного моста, ведущего на заданную цель. В монографии2 обозначен подход к построению стабильного моста на основе аппроксимации исходного дифференциального уравнения. Этот подход активно развивался В.С.Падко, В.Н.Ушаковым и их сотрудниками при разработке численных методов построения стабильных мостов, в основе которых лежит аппроксимация сечений моста и вектограмм'многогранниками. В линейных задачах управления при наличии малой нелинейности в качестве аппроксимационой модели можно использовать уравнения, которые
получаются из исходного при значении малого параметра, равного нулю. Задачи с малой нелинейностью рассматривались М.С.Никольским, а зависимость функций цены от параметра исследовалась Э.Г.Альбрехтом.
Этот подход развивается в диссертации применительно к рассматриваемым проблемам. Проводится обоснование применения разработанного алгоритма синтеза управления с помощью стабильного моста, построенного на основе аппроксимационных вектограмм. Обосновывается применение такого подхода к синтезу гарантированного управления с помехами при малых нелинейностях.
Наряду с численными методами активно разрабатывались методы, дающие аналитические схемы конструирования стабильных мостов, функций цены, гарантированных стратегий для конкретных классов задач. Это направление развивается и в диссертации. Разрабатывается метод построения стабильного моста, когда оператор программного поглощения имеет инвариантное параметрическое семейство множеств.
Задачам управления простым движением в условиях воздействия помех посвящена обширная литература. Такие задачи рассматривались в монографиях2'3,4, в работах П.Б.Гусятникова и Е.С.Половинкина, М.СНикольского, Л.А.Петросяна и Г.В.Томского, Б.Н.Пшеничного и других. Этот класс игр может служить для приближенного получения решения в более сложных системах. Так, например, А.И.Субботин с помощью функции цены дифференциальной игры с простым движением провел локальную аппроксимацию функции пены достаточно общей дифференциальной игры. В работах Б.Н.Пшеничного, П.Б.Гусятникова и Е.С.Половинкина доказано свойство стабильности операторов программного поглощения, построенных для задач с простым движением, на выпуклых множествах. Это может служить основой синтеза управления в задачах с простым движением при наличии малой нелинейности. Однако в основе метода доказательства этого факта лежит теорема отделимости выпуклых множеств и доказательство проведено для линейных пространств. В диссертации разрабатывается алгебраический метод доказательства стабильности таких операторов в
простраяствах с неполной линейной структурой, и он основан на их связи с операциями инфимальной конволюции и правого произведения на число многозначных функций. Получены достаточные условия стабильности операторов программного поглощения и для более широкого класса задач.
Для построения стабильного моста и функции цены развивались разные итерационные методы. Существенный вклад в развитие методов программных итераций внес А.Г.Чевцов.В диссертации разрабатывается и применяется метод итераций, основанный на пересечении по времени образов оператора программного поглощения.
Наряду с подходом в рамках позиционных стратегий, в диссертации использован подход, основанный на коррекции программных управлений. Такой подход развивался в работах А.Г.Ченцова, Ф.Л.Черноусько и А.А.Меликяна и других. В этой постановке в диссертации рассматривается задача удержати.
Уравнения движения в задаче "изотропные ракеты"4 и в ее варианте при отсутствии трения2,7 "мальчик и крокодил", а также в контрольном примере Л.С. Понтрягина7 после замены переменных2 сводятся к виду, когда вектограммы в каждый момент времени гомеоморфны одному и тому же выпуклому компакту. Такие задачи названы в диссертации однотипными, п полученные для них решения положены в основу разработанного в диссертации метода одномерного проектирования для решения линейных задач управления с интегральными ограничениями общего вида в условиях воздействия помех.
При управлении механическими системами переменного состава условие неперерасхода начального запаса топлива приводит к интегральным ограничениям на выбор управления. Так, в случае двигателя малой тяги8 получаем интегральное ограничение на квадрат нормы управления. В случае, если величина относительной скорости выброса частиц реактивной
_ - _ . _ . __
7 Понтрягин Л.С. Линейные дифференциальные игры преследования // Матем. сб. Новая серия. 1980. Т. 112. Вып. 3. С. 307 - 330.
массы постоянна, а в отдельные моменты времени может "мгновенно" выбрасываться конечное количество реактивной массы, то9 формализация такого процесса, приводит к задачам импульсного управления.
Задачи оптимального импульсного управления рассматривались в работах Н.Н.Красовского, А.Б.Куржанского, С.Т.Завалишина и других.
В 1963 г. Н.Н.Красовский предложил10 метод, решения задач преследования, основанный на принципе поглощения областей достижимости. В этой работе рассматривались геометрические, интегральные и импульсные ограничения на выбор управления. Введено понятие первого момента поглощения и предложено правило экстремального прицеливания для синтеза позиционного управления. Были установлены условия регулярности1, при выполнении которых предложенный алгоритм синтеза управления гарантировал окончание игры за первый момент поглощения. Условия регулярности и возможность окончания игры за первый момент поглощения рассматривались в работах Э.Г.Альбрехта, В.Д.Батухтина, Ю.М.Репина, В.Е.Третьякова, А.Й.Субботина, В.Н.Ушакова и других авторов. М.С.Никояьскпипо^о1)щйл~гфШХ5Й^етод~Л::Понтрягина на линейные дифференциальные игры с общими интегральными ограничениями^ Регулярные дифференциальные игры со смешанными ограничениями на управления рассматривались Ю.С.Ледяевым.
Применение метода, основанного на принципе поглощения областей достижимости, для.дифференциальных игр с импульсным управлением усложняется тем, что области достижимости, зависящие от оставшихся запасов ресурсов, могут меняться скачкообразно.
8 Белецкий В.В. Очерки о движении космических тел. М.: Наука. 1972.
360 с.
9 Красовский Н.Н. Теория управления движением. М.: Наука.1968. 475
с.
10 Красовский Н.Н. Об одной задаче преследования // Прикл. матем. и
мех. 1963. Т. 27. Вып.2. С. 244 - 254. ^
Неоднотипная линейная игра импульсной встречи рассмотрена в работе Н.Н.Красовского и В.Е.Третьякова11 . Приводится пример об импульсной "мягкой" встрече двух точек, когда первый игрок не сможет поддерживать требуемого включения областей достижимости. Обсуждается вопрос о возможности применения метода динамического программирования к задачам импульсной встречи. .
Применение метода динамического программирования для решения механических задач импульсной встречи получило развитие в работах Г.К.Пожарицкого. В работе С.М.Кумкова и В.С.Пацко решается одна модельная задала импульсной встречи с неполной информацией о позиции. Н.Н.Субботиной и А.И.Субботиным доказана теорема об альтернативе для дифференциальных игр с импульсными управлениями в предположении, что целевые координаты вектора состояния меняются непрерывно.
Разработанный в диссертации метод одномерного проектирования применяется для решения линейных задач импульсной встречи в условиях действия помех. Решается пример Н.Н.Красовского и В.Е.Третьякова. На базе этого метода введено понятие регулярности. Разработан алгоритм сіштеза управления без использования информации об оставшихся запасах ресурсов помехи.
Цель работы.Цель работы состоит в разработке теоретических основ проблемы сшітеза гарантированного управления в задачах управления с помехой в фазовых пространствах с неполной линейной структурой; в разработке алгоритмов и методов получения аналитического и приближенного вида гарантированного результата и выделения классов задач, для которых это можно сделать; в разработке метода одномерного проектирования для линейных задач управления с интегральными ограничениями общего вида в условиях воздействия помех и применение его к исследованию
Красовский Н.Н., Третьяков В.Е. К задаче о преследовании в случае ограничений на импульсы управляющих сил // Дифференц. уравнения. 1966. Т. 2. N 5. С. 587 - 599.
задач импульсной встречи.
Методы исследования. В основе разрабатываемых в диссертации методов лежит концепция теории оптимального гарантированного управления. Активно используются понятия и результаты теории дифференциальных уравнений и включений, теории многозначных функций, линейного и выпуклого анализа, функционального анализа, теории нечетких множеств.
Научная новизна. Полученные в диссертации результаты являются новыми. Среди них отметим следующие.
1.Заложены основы теории гарантированного результата в фазовых пространствах с неполной линейной структурой. Разработан алгоритм синтеза гарантированного управления и найдена оценка параметра точности. Обосновано применение этого алгоритма синтеза управления с помощью аппроксимационных мостов.
2.Разработаны методы, дающие аналитические схемы построения стабильных мостов и фукпдй цены, в том числе, с векторной платой.
З.Для решения линейных задач управления с интегральными ограничениями общего вида в условиях воздействия помех разработан метод одномерного проектирования, который применен к задачам импульсной встречи. Разработан алгоритм синтеза импульсного управления без использования информации об оставшихся запасах ресурсов помехи.
Теоретическая и практическая значимость диссертации заключается в том, что изложенные в ней методы и алгоритмы являются конструктивными. Полученные теоретические результаты для задачи гарантированного управления в пространствах с неполной линейной структурой составляют содержание нового направления в исследовании управляемых динамических систем с помехами. Разработанный в диссертации метод одномерного проектирования и примененный к задачам импульсной встречи допускает распространение на другие типы интегральных ограничений..
Результаты диссертации легли в основу трех специальных курсов по нечетким множествам и их применениям, по дифференциальным играм, которые были прочитаны автором на математическом факультете Челя-
бинского государственного университета. По одному из них автор издал учебное пособие.
Апробация работы.
Основные результаты представлялись на Всесоюзной конференции "Динамическое управление" (Свердловск, 1979), на 5 - ом Всесоюзном съезде по теоретической и прикладной механике (Алма-Ата , 1981), на Международном Конгрессе математиков (Варшава , 1983), на 7,8,9 Всесоюзных конференциях ''Проблемы теоретической кибернетики" (Ир-кутск,1985), (Горький,1988), (Волгоград,1990), на 3,4 Уральских конференциях " Функционально-дифференциальные уравнения и их приложения" (Пермь,1986), (Уфа,1989), на конференциях "Моделирование и исследование устойчивости процессов" (Киев, 1990 ИІ992), на 4 -ой конференции по дифференциальным уравнениям и их применениям (Руссе, Болгария,1989), на 2 и 3 Международном семинаре по негладким и разрывным задачам управления и оптимизации (Челябинск,1993), (Санкт-Петербург,1995), на конференции "Дифференциальные уравнения в математическом моделировании "(Воронеж,1993), на 3-м Международном семинаре "Устойчивость и колебания нелинейных систем управления" (Самара,1994), на 5 и б Пон-трягинскнх чтениях (Воронеж, 1994 и 1996), на 3 и 4 Международных конференциях "Многокритериальные и игровые задачи при неопределенности" (Орехово-Зуево, 1994 и 199G), на Международной конференции "Дифференциальные уравнения и их приложения" (Саранск, 1994 ), докладывались на семинарах отдела динамических систем ИММ УрО РАН, кафедры опти--мального управления ВМК МГУ , кафедры теории управления и оптимизации ЧелГУ, кафедры математического анализа ЧелГУ.
Публикации,Основные результаты диссертации представлены в работах [1] -[30].
Структура и объем работы. Диссертация изложена на 320 страницах машинописного текста, набранного на ЭВМ. Состоит из введения, трех глав, заключения и списка цитируемой литературы, который содержит 213 наименований. Сравнительный анализ новизны полученных результатов