Введение к работе
Актуальность темы. Большинство задач оптимального управления можно условно разделить на следующие классы: задачи, в которых состояние оптимизируемой системы описывается обыкновенными дифференциальными уравнениями и задачи, в которых состояние описывается уравнениями в частных производных, а также вариационными неравенствами.
Разработка численных методов для задач оптимального управления, в которых состояние описывается уравнениями в частных производных продолжает оставаться актуальной задачей на протяжении многих десятилетий. Особый интерес представляют задачи с ограничениями на состояние системы (фазовыми ограничениями). Практическим примером такой задачи является задача выплавки стали, в которой требуется определить параметры печи для поддержания заданной температуры с наименьшими затратами энергии. При этом накладываются ограничения на состояние (в данном случае это температура расплава), чтобы исключить фазовые переходы вещества и ограничения на управление - мощность источников тепла.
Существуют два главных подхода к решению задачи с ограничениями на состояние и управление, которые могут быть определены следующим образом. Первый подход - это построение итерационных методов в функциональных пространствах для дифференциальных задач с последующей конечномерной аппроксимацией, который условно можно назвать "сначала оптимизация, затем аппроксимация". Второй подход - это построение итерационных методов для дискретных задач ("сначала аппроксимация, затем оптимизация").
Первый подход является предметом обширных исследований в течении двух последних десятилетий. Главную трудность при использовании данного подхода представляет то, что при наличии ограничений на состояние системы, множители Лагранжа в соответствующей дифференциальной задаче, дающей условия оптимальности первого порядка, не обладают достаточной гладкостью. Более того, они могут являться даже не функциями, а только мерами. Для преодоления данной сложности были предложены методы регуляризации. В большинстве случаев используются два типа регуляризации. Первый - это регуляризация Моро-Иосиды - регуляризация индикаторной функции множества ограничений. Второй вариант - регуляризация Лаврентьева - применяется для задач с поточечными ограничениями на состояние. Этот метод регуляризации заменяет ограничения на состояние смешанными ограничениями на управление и состояние с малым параметром. Также мож-
но отметить метод проке-регуляризации Лаврентьева, который заключается в регуляризации ограничений и целевого функционала.
При использовании второго подхода для решения задач оптимального управления вначале дифференциальную задачу аппроксимируют конечномерной задачей с использованием методов конечных элементов или конечных разностей, а затем применяют итерационные методы решения полученной конечномерной задачи - сеточной задачи оптимального управления.
В работах Deckelnick К., Hinze М., Hintermuller М., Arada N., Casas Е., Troltzsch F. [8], [13], [1] исследованы сеточные схемы для эллиптических задач оптимального управления с ограничениями на состояние. Используя результат работы Deckelnick К. и Hinze М. [8], можно установить сходимость сеточных решений к решениям дифференциальных задач для всех рассмотренных в диссертации задач оптимального управления. Мы не приводим соответствующие результаты, так как основной целью диссертационной работы является построение и исследование итерационных методов для сеточных задач, аппроксимирующих задачи оптимального управления в правой части линейного эллиптического уравнения или граничного условия.
Сеточные задачи оптимального управления в правой части линейного эллиптического уравнения или граничного условия при наличии простых ограничений лишь на вектор управления могут быть эффективно решены градиентным методом с проекцией. При наличии ограничений на вектор состояния этот метод непосредственно уже применить нельзя. В этом случае можно использовать различные методы регуляризации, в том числе и перечисленные выше. Другой подход к построению итерационных методов для сеточных задач оптимального управления основан на методе множителей Лагранжа. Он сводит исходную задачу к так называемой седловой задаче с ограничениями. Решение этих задач можно осуществлять обобщенными (предобусловленными) методами Узавы без предварительной регуляризации индикаторных функций множеств ограничений. Такой подход к построению итерационных методов является основным в диссертации. Он позволяет избежать проблемы выбора параметра регуляризации (штрафа). Кроме того, при решении задачи обобщенным методом Узавы мы с высокой точностью определяем "свободную границу"задачи (множества активных и пассивных ограничений на вектор узловых значений сеточной функции состояния).
Метод решения задач оптимального управления с ограничениями на управление с применением стратегии активного множества прямых и двойственных переменных был рассмотрен в работе М. Bergoimioux, К. Kunish, К.
Ito [6]. Итерационные методы для решения седловых задач большой размер-
ности с ограничениями предложены в работе С. Gracer, R. Kornhuber [18], в которой приведены численные результаты для задачи оптимального управления с ограничениями только на управление.
Также можно отметить подходы, связанные с использованием методов типа Ньютона для решения задачи оптимального управления с ограничениями на состояние и управление, только в этом случае необходимо на каждой итерации метода решать систему линейных уравнений с седловой матрицей. В работе Herzog R., Sachs Е. [12] для этой цели был предложен вариант предобусловленного метода сопряженных градиентов. Седловые задачи возникают и при применении метода Ньютона и использовании регуляризации Моро-Иосиды для задачи оптимального управления с ограничениями на состояние. Выбор прсдобусловливатсля для итерационного метода решения был рассмотрен в работе Stoll М., Pearson J., Wathen А [22]. Сравнение методов регуляризации Моро-Иосиды и Лаврентьева с методами решения сеточных аппроксимаций задач оптимального управления, например, методами внутренней точки и активных множеств, приведено в работе Hintermuller М., Kunisch К. [15]. Численные эксперименты, приведенные в этой работе показали, что методы Ньютона, примененные для задач регуляризации Моро-Иосиды, оказались менее эффективными, чем методы активных множеств. Что касается метода внутренней точки, то по количеству итераций наблюдалось его эквивалентность указанному методу регуляризации.
В работе M.Bergounioux, К. Kunish [7] использован метод расширенного лагранжиана для рсгуляризованой задачи оптимального управления с ограничениями как на состояние, так и на управление.
Для решения линейных уравнений эффективным инструментом являются многосеточные методы. Эти методы были обобщены и для задач оптимального управления с ограничениями на состояние. Существуют два варианта многоссточных методов для решения задач оптимального управления: MGOPT и CSMG [23]. Первый вариант подразумевает применение многосеточной техники решения задач оптимального управления непосредственно для решения системы оптимальности.Необходимо упомянуть, что эти два подхода многосеточной техники основаны на регуляризации Лаврентьева основной задачи. В работах Nash S. [20], Lewis R.M. [19] рассмотрено применение многосеточных методов для решения задач оптимизации без ограничений.
Как уже было сказано выше, конечно-разностные или конечно- элементные аппроксимации рассматриваемых задач оптимального управления в настоящей диссертационной работе являются по существу стандартными задачами квадратичного программирования с ограничениями равенств и нера-
венств. Для решения таких задач можно эффективно использовать различные методы внутренней точки для задач большой размерности, и также метод активных множеств для задач небольшой размерности.
Суть метода активных множеств заключается в поиске области, где ограничения на переменные активны. На каждой итерации данного метода происходит решение задачи квадратичного программирования с ограничениями-равенств. Как отмечено в работе Wong Е. [24], данный метод эффективен при известном начальном приближении к решению. Поэтому его часто используют при решении задач нелинейного программирования методом последовательного квадратичного программирования, на каждом шаге которого необходимо решить задачу квадратичного программирования. В качестве начального приближения берется решение из предыдущего шага.
Метод внутренней точки реализован в пакетах Matlab, OOQP, Finmath. Основная сложность данного метода - это необходимость решения большой разреженной системы линейных алгебраических уравнений. Способ использования наименьшего объема памяти для этой цели был предложен в работе Gondzio J. [10]. Анализ сходимости методов внутренней точки для задач оптимального управления был проведен в работе Prufer U., Trolzchy F. и Weiserz М. [21].
Целью данной диссертационной работы является построение, исследование и сравнительный анализ эффективности итерационных методов решения сеточных аппроксимации задач оптимального управления с распределенным или граничным управлением и наблюдением при наличие ограничений на управление и состояние.
Научная новизна исследования заключается в том, что
для седловой задачи, определяющей седловую точку функции Лагранжа дискретной задачи оптимального управления, построены и исследованы эквивалентные преобразования;
получены оценки близости решений исходной дискретной задачи оптимального управления и ее регуляризованного варианта;
для построенных седловых задач предложены и исследованы различные варианты предобусловл енного метода У завы;
предложен и изучен двухступенчатый метод для решения задачи оптимального управления с ограничениями только на состояние;
проведен сравнительный численный анализ предложенных и известных методов решения дискретных задачи оптимального управления.
Апробация работы. Основные положения диссертации обсуждались на Всероссийских школах-конференциах "Лобачевские чтения", г. Казань, 2009г. и 2011г., Всероссийской конференции "Туполевские чтения", г. Казань, 2011г., Всероссийской конференции "КВМ - 2011", г. Новосибирск, академгородок, 2011г., Межвузовской конференции "Математика и физика в системе инженерного образовани", 2011г., г. Нижнекамск, Всероссийской конференции "Сеточные методы для краевых задач и приложения", 2012г., г. Казань.
Практическая значимость Построенные и исследованные предобу-словленные методы Узавы могут быть применены для решения задач оптимального управления.
Достоверностьполученных теоретических результатов обеспечивается строгими доказательствами сформулированных утверждений. Достоверность численных расчетов подтверждается хорошим совпадением результатов вычислений с известными решениями тестовых задач.
Личный вклад. Автор принимал непосредственное участие в разработке второго и третьего вариантов метода Узавы, а так же доказательств их сходимости. Все программы для проведения вычислительного эксперимента и сами численные эксперименты были проведены автором.