Введение к работе
В диссертационной работе развиваются методы управления дпнами-іесктш объектами в условиях неполной информации, основанные на применении теорпп дифференциальных игр и обратных минимаксных за-іачах. а также синтезируется адаптивное локально-оптимальное упра-щенпе. Разработан общий подход к синтезу робастных, абсолютно ста-щлпзнрующпх п Ноа субоптпмальных регуляторов для классов неопределенных аффинных по входам нелинейных систем, нелинейных систем Турье и линейных систем в непрерывном и дискретном времени. Решен зяд новых обратных вариационных задач минимаксного и оптимального правлений. Проведено исследование идентификации методом напмень-дих квадратов при невыполнении условий теоремы Гаусса-Маркова о состоятельном оцениваншг п на его оснопе для линейных стохастических збъектов синтезировано адаптивное управление, не требующее идентифицируемости неизвестных параметров.
Актуальность темы. В своем развитии теория управления прохо-іпла несколько этапов, среди которых можно условно выделить следующие: классическая теория устойчивости и автоматического регулпро-зання, теория оптимальных систем управления, теория стохастических :истем управления и современный этап - теория адаптивного и робаст-аого управлений. Возникновение последнего связано с необходимостью травления сложными техническими объектами, меняющимися в процессе функционирования в изменяющейся со временем среде, получение точных математических моделей которых представляется весьма проблематичным. Отсутствие точной математической модели объекта препят-:твует нахождению закона управления, обеспечивающего устойчивость и эптимальность. В этих условиях естественно желание преодолеть "узкую :пепиализащда'? стратегии управления и сделать ее более универсальной но отношению к объектам п возмущениям, что п привело к появлению теорий адаптивного и робастного управлений.
Исходным в теории робастного управления является стремление к обеспечению устойчивости не только заданной (номинальной) системы управления, но п всех не очень отличных от нее в определенном смысле систем. В отличие от классической теории автоматического регулирования, в теорпп робастного управления цель должна достигаться не только для данного объекта, а для целого класса объектов и возмуще-
нпп. выделяемых на основе априорной информации. Теория адаптивного управления - это теория систем управления, которые благодаря самонастройке п обучению меняют свою стратегию, стремясь приблизить ее к оптимальной, причем делают они это асимптотически точно, если объект перестает меняться, и, следовательно, достаточно точно, если объект меняется медленно.
Работы Лурье. Апзермана. Попова. Якубовича. Калмана, Лефшеца. Ла-Салля стимулировали большой интерес к теории устойчивости, вообще, и к методам Ляпунова п проблеме абсолютной устойчивости, в частности. Проблема робастной устойчивости получала, развитие в работах Харитонова. Цыпкпна, Поляка, Barmish, Hollot. Jury и многих других; Неймарком на основе D-разбиения было введено понятие меры робастной устопчпвостп. Синтез робастного управления для различных классов неопределенных объектов во многом опирается на метод функций Ляпунова. Так. в работах Меплахса, Barmish, Барабанова Н., Hollot, Petersen, Bernstein. Haddad для неопределенных линейных систем с ограниченными по норме неизвестными нестационарными параметрами были введены понятия квадратичной устойчивости и квадратичной стабплн-зпруемостп, в соответствии с которыми осуществляется поиск линейного стационарного закона управления и квадратичной функции, являющейся при' этом управлении функцией Ляпунова для произвольной системы рассматриваемого класса, а также понятие оптимального гарантированного управления, обеспечивающего определенный уровень показателя качества при любой допустимой неопределенности. В работах Khargonekar, Zhou, Xie, de Souza установлена связь между теорией #<» оптимального управления и робастной стабилизацией неопределенных лпнеиных систем. Применение этих методов, как правило, предполагает нахождение положительно определенного решения матричного уравнения Лурье-Риккати, по которому и определяются параметры обратной связи.
В последнее время для систем Лурье, которые наряду с линейными блоками содержат неизвестные нелинейные характеристики, активно разрабатывается проблема абсолютной стабшпппруемостп, т.е. существования регуляторов, обеспечивающих абсолютную устойчивость замкнутой системы. В работах Брусина, Савкина, Petersen условия абсолютной стабилизпруемости выражаются в виде частотного неравенства, включающего решение матричного уравнения для задачи Нх опти-
ального управлення, нлп в терминах решений пары матричных уравне-нп, характерных для задачи Ях -оптимального управления. Мсгрецкпп Ranrzcr показали, как сложная система может быть описана, пспользуя ак называемые пнтегрально-квадратпческпе ограничения для ее компо-ентов. и получили условия устойчивости такпх систем.
Отметим также, что в работах Boyd. Ghaoni, Fcron, Balakrislman. слегег, Weiland условия абсолютной устойчпвостп для систем Лурье п словдя робастной устойчивости для некоторых классов неопределенных пстем выражены на языке так называемых линейных матричных не-авенств (LMI). В 60-е годы Якубовпч, Попов. Калман. Цыпкпн и дру-пе получили различные частотные условия разрешимости соответствующих LMI, которые свели решение проблемы Лурье к проверке простых рафпческпх критериев. Далее Пятницкий и Скородпнский показалп. что адача Лурье для систем со згногпми нелинешзостямп может быть све-іена к задаче выпуклой оптпмпзашш, включающей LMI. п применили іля ее решения метод эллипсоидов. Немпровскип и Нестеров на основе пвестных алгоритмов выпуклой оптимизации разработали так называние алгоритмы внутренней точки, позволяющие в среде MATLAB вы-існять разрешимость данного LMI плп находить экстремум лпнейной функции при ограничениях, задаваемых LMI.
Что касается робастного управления нелинейными неопределенными эбъектами, то первые результаты в этом направленпп были получены Zanies на основе так называемой теоремы о малом коэффициенте роста. В последнее десятилетие был сделан значительный прогресс в развитии геометрической теории нелинейных спстем управления. Вместе с теорией устойчивости Ляпунова она составляет основу для синтеза робастного управления. В частности, достаточные условия существования функции Ляпунова при соответствующем законе управления для различных классов нелинейных систем управления даны в работах Artstein.Tsinias, Sontag, Isidori, Khali], Corless. Corou, Praly, Teel, В работах Freeman, Kokotovic, Sussman изучаются итеративные процедуры построения функции Ляпунова, а в работах van der Schaft, Doyle, Lu для некоторых классов спстем со структурированной неопределенностью результаты получены на основе теории Нх оптимального управления для нелинейных систем.
Следует отметить, что в большинстве работ этого направления
результаты формулируются в терминах существования положительно определенного решения уравнений/неравенств Гампльтона-Якоби. что создает проблему при реализации предлагаемых законов управления. Таким образом, при синтезе робастного управления различными классами неопределенных динамических объектов остается актуальной разработка регулярных методов, по возможности не требующих решения нелинейных дифференциальных уравнений/неравенств Гамильтона-Якобп пли нелинейных матричных уравнений/неравенств Лурье-Рпккатп.
В последние десятплетпя произошел значительный прогресс в теории адаптивного управления. Вместе с тем. пз-за существенной нелинейности и многомерности уравнений адаптивных систем управления многие фундаментальные теоретические проблемы остаются еще нерешенными. Одной из наиболее значимых из них является сходимость самонастраивающихся регуляторов, основанных на рекуррентом оценивании методом наименьших квадратов (МНК). Сложность этой задачи заключается в следующем. Если старший коэффициент числителя передаточной функции объекта является неизвестным, тогда текущее управление должно входить в регрессионный вектор в качестве одной из его компонент. Однако, выбор закона управления в виде линейной обратной связи от остальных регрессоров приводит в таком случае к нарушению так называемого условия неисчезаюгдего возбуждения, обеспечивающего в соответствии с классической теоремой Гаусса-Маркова невырожденность информационной матрицы и сходимость оценок к их истинным значениям.
Для преодоления этой трудности обычно применяют внешние сигналы или модифицируют алгоритм МНК так, чтобы, дополнительно возбуждая систему, обеспечить состоятельное оценивание. Вместе с тем, как отмечалось многими авторами, указанные меры значительно усложняют синтез и анализ адаптивной системы и, что, наверное, самое суще-ственное, могут приходить в противоречие с целями управления. Таким образом, при изучении адаптивного управления, основанного на идентификации, важно выяснить, что происходит с оценками при невыполнении условий неисчезаюгдего возбуждения.
Цель диссертационной работы состоит в синтезе законов управления динамическими объектами при отсутствии полной информации о математических моделях системы и действующих возмущений на основе минимаксного подхода; в решении обратных вариационных задач мини-
максного управления для нелинейных п линейных, непрерывных п дискретных систем и обратной задачи оптимального управления для линейных дискретных систем; в выяснении возможности адаптивного управления, основанного на рекуррентной идентификации методом наименьших квадратов, в отсутствие идентифицируемости неизвестных параметров объекта.
Методы исследования. В диссертации используются методы теории управления, теорпп устойчивости, теории оптимального управления п дифференциальных игр. теорпп матриц, а также компьютерное моделирование.
Достоверность полученных результатов основана на строгом п обоснованном прцмененпп математических методов, на сравнении результатов компьютерного моделирования с теоретическими выводами.
Научная новизна. На основе минимаксного подхода разработан метод синтеза регуляторов, обеспечивающих асимптотическую устойчивость пли равномерное гашение возігущенип для классов неопределенных аффинных по входам нелинейных непрерывных систем, непрерывных и дискретных систем Лурье, а также непрерывных и дискретных линейных систем с неизвестными нестационарными параметрами, принимающими значения в эллипсоидальной области. Показано, что для указанных классов неопределенных объектов задача робастного управления представпма как обратная вариационная задача минимаксного управления и получено ее решение непосредственно в терминах обратной связи, исключая при этом необходимость в решении нелинейных уравнений/неравенств Гамильтона-Якоби пли Лурье-Риккати. Решены обратные вариационные задачи минимаксного управления для нелинейных и линейных, непрерывных п дискретных систем и обратная задача оптимального управления для линейных дискретных систем. Выяснены особенности идентификации методом наименьших квадратов при невыполнении условий теоремы Гаусса-Маркова о состоятельном оценивании и синтезировано адаптивное ^управление, не требующее идентифицируемости объекта.
Основные результаты диссертации
Доказано, что робастньши, абсолютно стабилизирующими и Д» субоптимальнымп законами управления для рассматриваемых классов неопределенных объектов являются минимаксные законы упра-
вленпя в дифференциальной игре против искусственного возмущения для полностью определенной вспомогательной системы и целевого функционала некоторого вида, а функцией Ляпунова для исходной неопределенной системы является функция Беллмана этой игры. Для нелинейных систем эти законы управления выражены в терминах решений нелинейных уравнений пли неравенств Гампль-тона-Якоби, а для линейных систем - в терминах решений матричных уравнении плп неравенств Лурье-Рпккатп. а также в виде линейных матричных неравенств.
Показано, что задача синтеза робастных, абсолютно стабилизирующих и Я-* субоптимальных регуляторов может быть рассмотрена как обратная задача минимаксного управления. Получены проверяемые условия для данной обратной связи, при выполнении которых она соответствует требуемому закону управления, что исключает необходимость решения нелинейных неравенств пли уравнений. Для нелинейных аффинных по входам неопределенных систем эти условия выражаются в виде интегральных неравенств, а для систем Лурье и линейных систем - в виде линейных матричных неравенств или частотных условий.
Решены обратные вариационные задачи наихудшего возмущения, дифференциальной игры и минимаксного управления для нелинейных аффинных по входам динамических систем и для линейных непрерывных п дискретных систем, а также обратная задача оптимального управления для линейных дискретных систем.
Установлено, что при идентификации методом наименьших квадратов в общей задаче линейной регрессии, когда не выполнены условия теоремы Гаусса-Маркова о состоятельном оценивании, имеет место сходимость оценок к многообразию, на котором дисперсия ошибки прогноза принимает минимальное значение. Показано, что при идентификации в замкнутых системах управления, когда параметры регулятора являются функциями оценок неизвестных параметров объекта, существуют локально-оптимальные законы управления, инвариантные на этом многообразии.
Для линейных стохастических объектов синтезировано адаптивное
локально-оптимальное управление, основанное на пдентпфпкаппп рекуррентным методом наименьших квадратов п не требующее для своей реализации идентифицируемости параметров объекта. Получены дифференциальные уравнения, описывающие динамику оценок в этой адаптивной системе, и доказано существование глобально притягивающего предельного многообразия, на котором реализуется локально-оптимальный закон управления неизвестным объектом.
Практическая ценность работы. Теоретические результаты диссертации могут быть использованы для расчета конкретных робастных и адаптивных регуляторов. Результаты работы использованы при разработке спецкурсов, прочитанных автором диссертации в 1987-1998 гг. студентам и бакалаврам факультета Вычислительной математики и кибернетики Нижегородского государственного университета, а также в курсовых п дипломных работах.
Апробация работы. Результаты диссертации докладывались и обсуждались на 12 Всемирном Конгрессе Международной федерации по автоматическому управлению (IFAC) (Спдней, 1993), на 3 и 4 Европейских конференциях по управлению (Рим. 1995 и Брюссель, 1997). на,33-й Конференции по принятию решении и управлению (CDC) (Орландо, 1994), на 10 Симпозиуме IFAC по идентификации (Копенгаген. 1994), на 2-м Симпозиуме IFAC по стохастическому управлению (Вильнюс, 1986), на Симпозиуме IFAC по адаптивному управлению (Тбилиси, 1989), на 2-й Российско-Шведской конференции по управлению (Санкт-Петербург, 1995), на 1-й Международной конференции по управлению колебаниями и хаосом (Санкт-Петербург. 1997). на 7, 9,10,11 Всесоюзных совещаниях по проблемам управления (Минск, 1977; Ереван. 1983; Алма-Ата, 1986; Ташкент, 1989) и на Всероссийской конференции "Новые направлення в теории систем с обратной связью" (Уфа, 1993), на Всесоюзных конференциях "Теория адаптивных систем и ее применение"1 (Ленинград, 1983 и 1991), на 5 Всесоюзном совещании по статистическим методам в процессах управления (Алма-Ата, 1981), на 12 Всесоюзной школе-семинаре по адаптивным системам (Могилев. 1984), на Всесоюзном семинаре "Динамика нелинейных систем управления" (Таллин, 1987) и на 4 и 5 Международных семинарах "Устойчивость и колебания нелинейных систем управления'1 (Москва, ИПУ РАН, 1996 и 1998), на 6 и 7 Всесоюзных
совещаниях по непараметрпческпм и робастньш методам статистики в кибернетске (Томск, 1987 и 1990). на 8 Всесоюзной конференции "Проблемы теоретической кибернетики" (Горький, 1988), на 4-й конференции по нелинейным колебаниям механических систем (Нижний Новгород. 1996). на Итоговых научных конференциях Горьковского госунпверспте-га (1981-1989), на семинаре в 1985 году в Институте проблем управления под руководством академика РАН Я.З.Цыпкина. на семинаре "Нелинейные динамические системы" на факультете ВМпК в МГУ под руководством академика РАН С.В.Емельянова и члена-корреспондента РАН С.К.Коровпна (1992 и 1996).
Публикации. Основные результаты диссертации опубликованы в 28 работах, среди которых 15 статей в центральных научных журналах РАН, 1 статья в Вестнике Нижегородского университета. 3 статьи в международных журналах и 9 работ - в трудах международных конференции. Результаты по адаптивном}' локально-оптимальному управлению, опубликованные в совместных с Ю.И.Неймарком статьях, вошли в главу 7 п являются неразделимыми.
Структура и.объем работы. Диссертация состоит из введения, 7 глав, заключения и списка литературы. Содержание изложено на 223 страницах, включая список литературы из 185 наименований.