Введение к работе
Актуальность теми. Теория оптимального управления разработана в 1956-1960 годах в работах Л.С.Понтрягина и его сотрудников в форме принципа максимума. Общие методы современной теории управления позволяют получить решение задач в замкнутой форме только в достаточно простых ситуациях, главным образом, когда динамика процесса описывается линейными уравнениями. Основная трудность состоит в решении краевой задачи принципа максимума, которая, как правило, оказывается нелинейной и не имеет общего аффективного метода решения.
Во многих практических задачах динамику управлямого процесса можно описать системой обыкновенных дифференциальных ураи-
I нений, нелинейные члены в которых зависят от некоторых параметров и малы при малых значениях этих параметров. Игнорирование нелинейных членов с целью упрощения предварительного анализа таких процессов и упрощения и удешевления систем управления может привести в некоторых случаях к неприемлемому качеству управляемого процесса. Теория приближенных методов решения линейных и квазилинейных задач оптимального управления развита в работах Л.Д.Акуленко, Э.Г.Альбрехта, Р.Беллмана, В.Г.Болтянского, Р.Габасова, Р.В.Гамкрелидзе, В.Ф.Демьянова, Р.Калмана, Ф.М.Кирилловой, Н.Н.Красовского, А.Б.Куржанского, Э.Б.Ли, Л.Маркуса, Ю.С.Осипова, В.А.Троицкого, Ф.Л.Черноусько и многих других авторов.
Многие задачи управления идеализируются как линейно-квадратичная задача оптимального управления, т.е. как задача с линейной динамикой и показателем качества, содержащим интегральное квадратичное по управляющим воздействиям и по фазовым переменным слагаемое и терминальное слагаемое в виде квадратичной формы от
фазовых переменных в конечный момент времени. Это связано с гем, что такая задача имеет простое решение в замкнутой форме, а показатель качества — достаточно определенный содержательный смысл.
В диссертации за основу решения некоторых задач оптимального управления квазилинейными системами также берется линейно-квадратичная задача с произвольным параметром в показателе качества и исследуется ее связь с другими задачами. Второй вариант данного подхода связан с задачей оптимального управления, отличающейся от линейно-квадратичной задачи тем, что в показателе качества терминальное слагаемое представлено нормой вектора конечного состояния системы. В решение всех этих задач составной частью входит решение одной и той же краевой задачи принципа максимума.
В настоящее время возрастает актуальность разработки не только численных, но и аналитических методов в связи с быстрым развитием вычислительной техники и программного обеспечения, в частности, систем аналитических вычислений (CAB), или систем компьютерной алгебры. Представляется разумным развивать методы, сочетающие в себе аналитические и численные вычисления. Особенно важно увеличить долю аналитических вычислений при конструировании систем управления по принципу обратной «вязи в режиме реального времени, с тем чтобы в процессе управления формировать управляющие воздействия на основе готовых формул, в которых лишь некоторые коэффициенты надлежит вычислить по информации о текущем состоянии системы с помощью несложных, быстрых численных методов.
Обоснование синтеза управления в непрерывной схеме при условии его устойчивости дает возможность его аппаратной реализации, ориентированной на аналоговые системы управления, или использования этого же закона управления в дискретной схеме с достаточно мелким разбиением, ориентированной на цифровые системы упрапле-
ния'. Диссертация следует этому направлению. В ней обосновывается конструктивный способ синтеза оптимального позиционного управления в непрерывной схеме для квазилинейных систем.
Большая часть задач управления в условиях конфликта и неполных данных о динамических или информационных помехах, воздействующих на управляемый объект, формализуется в рамках теории дифференциальных игр, получившей в нашей стране становление и развитие в исследованиях научных школ Л.С.Понтрягина и Н.Н.Красовского. Замкнутый вид здесь также имеют решения дифферепциальнцх игр, в основном, с линейной динамикой и с показателем качества либо квадратичным, либо отличающимся от квадратичного видом терминального слагаемого, когда терминальное слагаемое равно норме вектора конечного цостояния, и их обобщения. В частности, для линейных задач эффективны методы стохастического программного синтеза вычисления цены игры и экстремального сдвига для построения седло-вой точки, разработанные Н.Н.Красовским и его учениками1'2'. Лиф-ференциальнап игра рассматривается в классе аппроксимациоггаых стратегий, зависящих от некоторого параметра точности, введенного через условие экстремального сдвига. В диссертации предлагается способ введения параметра точности через параметризацию показателя качества.
Цель работы. Разработка и теоретическое обоснование конструктивного, удобного дли реализации в компьютерных CAB приближенного метода решения некоторых задач оптимального управления линейными и квазилинейными системами по прішципу обратной связи d рамках единого подхода, основанного на вычислении оптимальных
ЧКрасовский А.Н., Красовский Н.Н., Третьяков D.E.. Стохастический программный синтез для детерминированной позиционной дифференциальной игры // Прикл. математика и механика. - 1981. - Т.45, вып.4. - С.579-586.
'ІКрасовімііі И.И. Управление динамической системой. - М.: Наука, 1085. -
520 с.
программных управлений для некоторого параметрического семейства задач оптимального управления и па регулярном выборе значений параметров, выделяющих решения исходных задач из этого семейства.
Методика исследования. Диссертация выполнена в рамках исследований по теории оптимальных управляемых процессов, дифференциальных игр и метода малого параметра, ведущихся в г. Екатеринбурге. Используются традиционные постановки задач и устоявшиеся понятия и методы: принцип макимума Л.С.Понтрягина, метод динамического программирования Р.Веллмана, вспомогательные программные конструкции3', результаты, полученные методом стохастического программного синтеза''', и итерационные процедуры решения квазилинейных задач оптимального управления, аналогичные разработанным Э.Г.Альбрехтом" на основе метода последовательных приближений Ляпунова-Пуанкаре.
Научная новизна. Изучена связь между некоторыми задачами оптимального управления без ограничений и с ограничениями, указаны достаточные условия, при которых итерационный метод решения задач управления квазилинейными системами даст решение этих задач для всех позиций из заданного множества, обоснован синтез оптимального управления по принципу обратной гвязи и изучена его устойчивость по отношении) к помехам в каналах обратной связи; получена гладкая аппроксимация функции цены для одной'дифференциальной игры г негладким показателем качества,-и на ее основе построена оптимальная аппроксимацшшная стратегия первого игрока.
'Красовскии Н.Н.. СуІЇПотин А.И. Позиционные дифференципльные игры. - М. : Наука, 1974. - 45С с.
*>Альбрехт Э.Г. Of) оптимальном управлении движением квазилинейных систем // Дифференц. уравнения. - 190Г>. ТА'. N3. - С.430 442.
Теоретическая и практическая ценность. Результаты диссертации имеют теоретическое и практическое значение, носят конструктивный характер, применимы к достаточно широкому кругу задач и могут быть положены в основу исследования квазилинейных управляемых объектов с использованием компьютерных систем численных и аналитических вычислений. Единство подхода к решению различных задач упрощает процесс создания соответствующего программного обеспечения. Некоторые результаты можно интерпретировать в терминах теории уравнений Гамильтона-Якоби5'.
Апробация работы. Основные результаты работы докладывались па следующих научных конференциях:
VII Всесоюзной конференции "Управление в механических системах" (Свердловск, 1090);
III Всесоюзной школе "Понтрягинские чтения" (Кемерово, 1990);
Международной математической конференции "Ляпуновские чтения" (Харьков, 1992);
Конференции математиков Беларуси (Гродно, 1992);
II Международном семинаре "Негладкие и разрывные задачи управления и оптимизации" (Челябинск, 1993);
Математической школе. "Понтрягинские чтения" (Воронеж, 1994);
- III Международном съезде по прикладной математике 1С1АМ'95
(Гамбург, 1995).
Результаты работы обсуждались на научных семинарах отдела математического моделирования и оптимального управления НИИ ФПМ при УрГУ, отдела динамических систем ИММ УрО РАН, кафедры математического анализа РГПУ им. А.И.Герцена.
Публикации. По теме диссертации опубликовано 4 статьи и 8 тезисов докладов на всесоюзных и международных конференциях. Из
''Субботин А.И. Минимаксны» неравенства и уравнения Гамильтоиа-Якоби. -М. : Наука, 1991. 210 с.
совместных с Э.Г.Альбрехтом работ в диссертацию включены результаты, полученные автором.
Структура и объем работы. Диссертация состоит из введения и трех глав. Список литературы включает 50 наименований. Объем работы составляет 118 страниц машинописного текста.