Введение к работе
Актуальность темы. Диссертационная работа связана с изучением свойств функций оптимального гарантированного результата (функций цены), позиционных стратегий и разработкой вычислительных методов их построения в задачах управления и дифференциальных играх. Теория оптимального гарантированного управления (.дифференциальных игр) является активно исследуеным направлением прикладной математики. Создание этой теории было вызвано потребностями практики при изучении задач управления в механике, экононике и других областях. Быстрому ее развитию способствовали достижения теории оптинального управления, математического программирования, негладкого и выпуклого анализа. В настоящее время теория дифференциальных игр - самостоятельная математическая дисциплина, инешая прочные связи со многими разделами математики: теорией обыкновенных дифференциальных уравнений (дифференциальных включений) и уравнений в частных производных, недифференцируеной оптимизацией и вычислительной математикой. Интенсивно разрабатываются вычислительные методы решения задач оптимального гарантированного управления.
Становление теории дифференциальных игр относится к началу 60-х годов и связано с именами советских и зарубежных математиков Н.Н. Красовского, Л. С. Понтрягина, Р. Айзекса, У. Флеминга. Крупный вклад в развитие теории оптимального гарантированного управления внесли Э.Г. Альбрехт, Н. Барди, В.Д. Батухтин, Т. Башар, Е.Н. Баррон, Р. Беллман, А. Брэйсон, Р.В. Гамкрелидзе, В. И. Жуковский, Н.И. Зеликин, Н. Калтон. А.Ф. Клейменов, А.Н. Красовский, М.Дж. Крэндалл, А.В. Кряжимский,
А.Б. Куржанский, Дж. Лейтман, П.-Л. Лионе, А.А. Меликян, Е.Ф.
Мищенко, М.С. Никольский, Ж.-П. Обэн, Г. Ольсдер, Ю.С. Осипов, А. Г. Пашков, B.C. Пацко, Н.Н. Петров, Л.А. Петросян, Г.К. Пожарицкий, Б.Н. Пшеничный, А.И. Субботин, Н.Н. Субботина, В.Е. Третьяков, В.Н. Ушаков, А. Фридман, Хо Ю-ши, А. Г. Ченцов, Ф.Л. Черноусько, А.А. Чикрий, Р. Эллиотт и многие другие.
Преднетом исследования теории дифференциальных игр являются задачи управления в условиях конфликта и неопределенности. Задачи такого типа часто возникают на практике при решении различных технических проблем и анализе экономических моделей, где требуется построить позиционную стратегию (управление по принципу обратной связи), гарантирующую определенное качество управляемого процесса при любых неизвестных заранее возмущениях системы. Основным элементом решения этой задачи является функция цены, которая обладает свойствами стабильности, позволяющими строить оптинальнуга гарантированную обратную связь ме-
1 тодом экстремального сдвига на сопутствующие точки локальных
экстремумов функции цены. Диссертация посвящена изучению свойств стабильности функции цены, разработке конечно-разностных операторов и сеточных аппроксимационных схем для построения функции цены и оптимальных процедур управления. Исследования проводятся в рамках теории позиционных дифференциальных
1 ? игр ' , которая разрабатывается в научной школе Н.Н. Красов-
ского по оптимальному управлению.
Красовский Н.Н. Управление динамической системой. М.: Наука, 1985. 518 с.
Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
Н.Н. Красовским и его сотрудниками развита концепция позиционных дифференциальных игр, основу которой составляет принцип экстремального прицеливания на стабильные носты. Для
широкого круга дифференциальных игр доказана теорема об аль-
тернативе . Обоснованы методы детерминированных и стохастических программных конструкций . Разработаны алгоритмы построения стабильных множеств.
В основе многих конструкций лежат свойства стабильности. Свойства стэбильности обеспечивают существование направлений скоростей динамической системы, вдоль которых функция цены не убывает или не возрастает. В работе А. И. Субботина эти свойства были сформулированы с использованием инфинитезиналь-ных конструкций - производных по направлению. Полученные дифференциальные неравенства, обобщающие основное уравнение теории управления и дифференциальных игр, дали возможность , для использования конструкций негладкого анализа в задачах опти-
мального гарантированного управления .
Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970. 420 с.
Субботин А. И. Обобщение основного уравнения теории дифференциальных игр // Докл. АН СССР. 1Э80. Т. 254. № 2. С. 293-297.
Guseinov Н. G. , Subbotin A. I. , Ushakov V. N. Derivatives for multivalued mappings with applications to game-theoretical problems of control // Probl. Control and Information Theory. 1983. Vol.14. No. 3. P. 155-167.
Получило развитие также применение этого подхода к построению теории обобщенных решений для уравнений в частных производных первого порядка - уравнений Гамильтона-Якоби . Эти обобщенные решения были названы минимаксными, т.к. операции нинимума и максимума являются характерными в определении решений и представлены, например, в функциях программного ма-ксимина, формулах Хопфа, конструкциях идемпотентного анализа.
В главе 1 диссертации представлены результаты, полученные автором в 80-х годах и.гз как развитие исследований "5 свойств функций цены и стабильных мостов в рамках негладкого анализа. Сформулированы условия, определящие свойства стабильности в терминах сопряженных производных.
В рамках теории позиционных дифференциальных игр развивались вычислительные нетоды построения функций цены и стабильных мостов. Существенный вклад в разработку алгоритмов внесли B.C. Пацко, В.Н. Ушаков и их сотрудники. В основе этих алгоритмов лежит принцип динамического программирования, который реализуется в операциях алгебраических сумм и геометрических разностей - объединений и пересечений многогранников. В операторах попятной процедуры применялись также унифика-ционные схены стабильности, которые приводили к конструкциям локальных выпуклых оболочек.
Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. Н.: Наука, 1991. 215 с.
Развивались конструкции первого и второго методов Л. С.
Понтрягина . Для линейных дифференциальных игр были разработаны вычислительные процедуры и доказана сходимость альтернированных сумм.
В главе 2 диссертации предлагаются вычислительные нетоды построения функции цены и оптимальных стратегий, которые представляют собой сеточные аппроксинэционные схемы для соответствующих уравнений Гамильтона-Якоби. Эти схемы являются продолжением совместных исследований автора с В.Н. Ушаковым и ого сотрудниками по разработке алгоритмов построения стабильных мостов t5.7,9,i03. в аппроксимационных схемах используются конечно-разностные операторы, основанные на конструкциях негладкого и выпуклого анализа - обобщенных градиентах различных типов.
Теория уравнений Гамильтона-Якоби в 50-70-е годы привлекала внимание многих авторов в связи с интенсивными исследованиями в области математической физики. Проблене определения неклассических (недифференцируемых) решений и вопросу численного их построения для некоторых классов уравнений Ганильтона-Якоби посвящены работы С.К. Годунова, С.Н. Кружкова, О.А. Ладыженской, О.А. Олейник, А.А. Самарского, А.Н. Тихонова. П. Лаксэ, Е. Хопфа, У. Флеминга и других.
Методами идемпотентного анализа уравнения в частных производных первого порядка исследовались в работах В. П. Мас-лова и его сотрудников.
Понтрягин Л.С. О линейных дифференциальных играх. 1; 2 ss
Докл. АН СССР. 1967. Т. 174. № 6. С. 1278-1280;
Т. 175. № 4. С. 764-766.
В начале 80-х годов были опубликованы работы Н.Дж. Крэн-
q q
далла и П.-Л. Лионса , в которых был предложен подход к определению решений краевых задач для уравнений Гамильтона-Якоби общего вида. Понятие решения было введено путем замены уравнения парой дифференциальных неравенств для субградиентов и суперградиентов Лини. Для доказательства теорем существования был использован метод исчезающей вязкости. Поэтому эти решения получили название вязкостных.
Основа вязкостных решений находится, по-видимому, в теоремах сравнения математической физики. Прототипом минимаксных решений являются функции цены в задачах оптимального гарантированного управления. Дифференциальные неравенства в определении нинимаксных решений имеют своей основой свойства стабильности функции цены. Определения минимаксных и вязкостных решений по форме отличаются друг от друга. Их эквивалентность была неочевидна. Сначала она была установлена через совпадение нинимаксного и вязкостного решения с функцией цены соответствующей задачи оптимального гарантированного управления си. Представляло интерес прямое доказательство эквивалентности определений минимаксных и вязкостных решений. Этому вопросу посвящена работа сгз.
Crandall М. G. , Lions P.-L. Viscosity solutions of Hamil-ton-Jacobi equations // Trans. Amer. Math. Soc. 1983. Vol. 277. No. Г. P. 1-4Э.
Crandall M. G. , Lions P.-L. Two approximations of solutions of Hamil ton-Jacobi equations // Math. Comput. 1984.
Vol. 43. No. 167. P. 1-19.
Свойства субдифференциалов полунепрерывных функций, полученные А.И. Субботиным при решении задачи об эквивалентности, явились источником исследований Ф. Кларка и Ю.С. Ледяева в негладком анализе по применению конструкций проксимальных градиентов в формулах конечных прирзщений.
Построение теории вязкостных решений стимулировало развитие вычислительных нетодов. В работах М.Дж. Крэндэлла,
q -і л
П.-Л. Лионса и П.Е. Соуганидиса были рассмотрены явные и
неявные эппроксинационные схемы с конечно-разностными операторами Лэкса-Фридрихса, предложен общий метод обоснования сходимости и указаны оценки сходимости. Аппроксимации высоких порядков в "по существу неосциллируших" схемах рассматривались11 С. Ошером и Ц.-У. Шу.
В диссертационной работе предлагаются конечно-разностные операторы специального типа для аппроксимации "несуществующих" градиентов в уравнении Гамильтона-Якоби. Лля этого применяются конструкции негладкого анализа: суб и супердифференциалы различных типов, обобщенные градиенты локальных линейных оболочек. Проводится сравнение предлагаемых конструкций с классическими операторами Годунова и Лакса-Фрндрихса, известными в
Souganidis P.Е. Approximation schemes for viscosity solutions of Hamil ton-Jacobi equations// J. Different. Equat. 198S. Vol. 59. No. 1. P. 1-43.
Osher S. , Shu C.-W. High-order essentially nonosci 11 atory schemes for Hami 1 ton-Jacobi equations // SI AM J. Numer.
Anal. 1991. Vol. 28. No. 4. P. 907-922.
теории уравнений в частных производных. Доказательство сходимости аппроксимационных схем с конечно-разностными операторами, основанными на обобщенных градиентах, проводится с по-
Ч 1 о мощью достаточных условий сходимости из работ * .
Рассматриваются приложения конструкций сопряженных производных и аппроксимационных схем с обобщенными градиентами для анализа и решения задач оптимального гарантированного управления. Эти методы обобщаются в задачах управления с векторным критерием, в дифференциальных играх на бесконечном горизонте при наличии дисконтирующих факторов, в эволюционных играх с ненулевой суммой.
Цель работы состоит в изучении свойств стабильности функции цены с помощью аппарата сопряженных производных, разработке сеточных аппроксимационных схем с конечно-разностными обобщенными градиентами для построения функции цены и оптимальных стратегий, в приложении этих вычислительных методов к исследованию задач оптимального гарантированного управления, в том числе, задач с векторным критерием, дифференциальных игр с дисконтированием, некоторых моделей математической экономики и экологии в ранках теории эволюционных игр.
Методы исследования. В основе разрабатываемых в диссертации методов лежат концепции теории оптимального гарантированного управления. Активно используются понятия и результаты выпуклого и негладкого анализа, теории оптимизации, дифференциальных уравнений, функционального анализа и классической теории игр.
Научная новизна. Полученные в диссертации результаты являются новыми. Среди них отметим следующие.
1. Предложены дифференциальные неравенства в терминах
сопряженных производных для описания свойств стабильности функций иены. Рассмотрены приложения этих конструкций к исследованию условий регулярности функции программного наксиминэ и сингулярных поверхностей кусочно-гладких решений.
-
Разработаны конечно-разностные операторы с обобщенными градиентами различных типов для сеточных эппроксимационных схем построения функций цены и оптимальных позиционных стратегий.
-
Конструкции сопряженных производных и сеточные аппро-ксимационные схемы применены для исследования и решения задач оптимального гарантированного управления, в том числе, задач с векторным критерием, дифференциальных игр с дисконтированием, эволюционных игр.
Теоретическая и практическая ценность диссертации заключается в том, что изложенные в ней методы являются конструктивными. Предложенные конечно-разностные операторы могут быть применены для построения негладких функций цены (обобщенных решений уравнений Гамильтона-Якоби) и обратных связей во многих прикладных задачах оптимального гарантированного управления. Аппарат сопряженных производных является удобный средством для анализа свойств стабильности при построении аналитических решений, например, с помощью метода характеристик или программных конструкций.
Апробация работы. Результаты диссертации представлялись
на 6-7-ом съездах по механике (Ташкент, 1986), (Москва, 1991),
5-7-ой Всесоюзных конференциях по управлению в механических
системах (Казань, 1987), (Львов, 1988), (Свердловск, 1990),
Гагэринских научных чтениях по космонавтике и авиации (Москва,
1986, 1988, 1991), Международных конференциях и семинарах по
дифференциальным уравнениям (Руссе, Болгария, 1985), математическим нетодам оптимального управления (Минск, 1989), методу функций Ляпунова (imacs, Иркутск, 1990), негладким и разрывным задачам управления и оптимизации (1-2-ой семинары ifac -Владивосток, 1991, Челябинск, 1993), оптинальнону управлению в механических системах (Москва, 1992), нелинейному теоретико-игровому и управляемому синтезу (Санкт-Петербург, 1995), динамике и управлению (Шопрон, Венгрия, 1995). Основные результаты докладывались на семинарах отдела динамических систем ИММ УрО РАН, кафедры прикладной математики УрГУ, кафедры оптимального управления ВМК МГУ, в Университете Вюрцбурга (ФРГ, 1992), в Институте прикладного и системного анализа (iiasa. Лаксенбург, Австрия, 1994, 1995).
Публикации. По теме диссертации опубликовано более 20 работ. Список основных публикаций приводится в конце автореферата. Результаты, вошедшие в диссертацию, получены автором. В работах сі.гз А.И. Субботину принадлежит постановка задач. Результаты работ С5.ю.із,і8з получены совместно с В.Н. Ушаковым и А.А. Успенскин. В совместной с Р.А. Адиатулиной статье с 8] автору принадлежит постановка задачи и методы решения. Работы із,7,9.іе] не вошли в диссертацию, но имеют к ней непосредственное отношение. Особенно близкими являются результаты совместных с В.Н. Ушаковым и А.П. Хрипуновым исследований по численный методам построения стабильных мостов. Работы и9,го} инициированы исследованиями А. В. Кряжимского, проводимыми в Международном Институте прикладного и системного анализа (iiasa. Лаксенбург, Австрия).
Решения примеров, включенных во вторую и пятую главы, получены с понощыо програнм, разработанных А.А. Успенским и Н.В.
Мельниковой.
Структура и обьеи. Диссертация состоит из пяти глав и семнадцати параграфов, которые разделяются на пункты. Объен диссертации составляет 350 страниц. Библиография состоит из 195 наименований.