Введение к работе
Актуальность темы. Задачей теории адаптивного управления, зародившейся в середине 50-х, является управление системами в условиях параметрической Неопределенности. До конца 70-х в основном рассматривались адаптивные системы без возмущений или со стохастическими аддитивными Возмущениями. Для систем без возмущений были получены многочисленные результаты по устойчивости адаптивных систем, а для объектов со стохастическими возмущениями были построены системы оптимального адаптивного управления. Однако стохастические модели возмущений не являются универсальными и не могут использоваться в задачах управления, в которых возмущения не имеют стохастической природы или информация о стохастических свойствах возмущений недоступна.
В конце 70-х были построены примеры объектов управления с малыми и даже исчезающими возмущениями, для которых разработанные к тому времени законы адаптивного управления приводили к неустойчивости замкнутых систем. Эти примеры явились толчком к активному развитию в 80-х теории адаптивного робастного управления, предметом исследования которой стали задачи обеспечения устойчивости систем в условиях Детерминированных возмущений и параметрической неопределенности.
Исторически первой моделью детерминированных возмущений явились аддитивные возмущения, принимающие значения в некотором известном ограниченном множестве. Различные оптимальные задачи оценивания состояния и управления на конечном промежутке времени для объектов с такими возмущениями рассматривались в работах Н.Н. Красовского, А.Б. Куржанского, А.И. Субботина, Ф.Л. Черноусько и других авторов и получили наименование задач управления с гарантированным результатом. Задачи управления с ограниченными аддитивными возмущениями на бесконечном промежутке времени отличаются наличием дополнительного требования устойчивости системы. Решение задачи синтеза оптимального минимаксного регулятора для линейного дискретного скалярного объекта с ограниченной помехой было получено А.Е. Барабановым и О.Н. Граничиным в 1984 г. Впоследствии М. Dahleh и J.B. Pearson получили близкий результат в 1986 г. и его многомерное обощение в 1987 г. Эти работы послужили толчком к развитию нового направления - теории /і оптимального управления.
Модель аддитивных возмущений с известной верхней границей ис-
пользовалась в теории адаптивного управления в рамках метода рекуррентных целевых неравенств, предложенного В.А. Якубовичем во второй половине 60-х. Согласно этому методу задача адаптивного управления сводится к асимптотическому решению последовательности неравенств, определяемых данными измерений и известной верхней границей возмущений. Для решения задачи были разработаны различные варианты алгоритмов оценивания неизвестных параметров, обеспечивающих сходимость оценок за конечное время благодаря введению зоны нечувствительности.
Модель возмущений с известной верхней границей широко используется с начала 80-х и в теории идентификации и оценивания параметров. Основной задачей этого направления теории, имеющей несколько наименований в англоязычной литературе и получивший на русском языке название теории гарантированного оценивания, является построение внешних и внутренних аппроксимаций множества оценок, согласованных с наблюдениями и априорной информацией о системе. Необходимость построения аппроксимаций связана со сложностью полного и точного описания множества согласованных оценок, а аппроксимации выбираются в классе эллипсоидов, параллелотопов и т. п. Об интенсивности потока публикаций по этому направлению свидельствуют, в частности, специальные выпуски журналов International Journal of Adaptive Control and Signal Processing (1994 и 1995) и Mathematics and Computers in Simulations (1990). Несмотря на большое число публикаций, задачи теории гарантированного оценивания рассматриваются в основном вне контекста задач управления.
Предметом теории робастного управления являются системы, в которых присутствуют возмущения самого оператора системы. Бурное развитие теории робастного управления началось, по видимому, после того, как J.C Doyle, G. Stein и М. Safonov (1981) исследовали устойчивость линейных стационарных систем, возмущенных диагональными линейными стационарными операторами с известной верхней оценкой их нормы. Именно системы со стационарными возмущениями были и остаются основным объектом исследований как за рубежом, так и в России (Ю.И. Неймарк, А.А. Первозванский, Б.Т. Поляк, Я.З. Цып-кин и другие). Более широкий класс возмущений в виде ограниченных линейных нестационарных или нелинейных операторов из Іао в /то рассматривается в /j теории робастного управления. Основы этой теории заложили М. Dahleh (1988), М. Khammash и J.B. Pearson (1991, 1993), получившие необходимые и достаточные условия робастной устойчиво-
сти и достижения робастного качества систем со структурированными возмущениями. Впоследствии М. Khammash (1995) получил результаты, позволяющие вычислять асимптотическое качество робастных систем в классах возмущений с конечной памятью и с затухающей памятью.
Задачи робастного управления сделали актуальной разработку методов идентификации и оценивания параметров, адекватных этим задачам. Проблемы "робастной идентификации", или "идентификации для робастного управления", обсуждались в специальных выпусках ведущих журналов по теории управления - IEEE Transactions on Automatic Control (1992) и Automatica (1995) - и находятся в фокусе внимания на крупнейших научных конференциях по управлению. Однако два основных направления робастной идентификации - задачи верификации модели (model validation) и /j теория оценивания - развиваются, как и теория гарантированного оценивания, вне контекста задач управления. В свою очередь, полученные к настоящему времени условия робастной устойчивости и оценки робастного качества адаптивных систем являются, по существу, качественными в силу своей консервативности.
Работа над диссертацией велась по планам научно-исследовательской работы кафедры геометрии, математической статистики и теории управления Сыктывкарского государственного университета в рамках темы "Аналитические и геометрические вопросы теории динамических систем" №ГР 01.940000331 и была поддержана грантами Госкомвуза РФ (1993-1995), Российского фонда фундаментальных исследований (1996-1998), Министерства общего и профессионального образования РФ -(1998 - ), а также Шведским Институтом (1997).
Цель работы. Основные цели настоящей работы: развитие результатов 1\ теории робастного управления в направлении, позволяющем оценивать робастное качество систем и решать различные задачи синтеза адаптивного робастного управления; синтез /j субоптимальных робастных регуляторов для скалярных объектов управления; решение задач адаптивной стабилизации и синтеза неконсервативного адаптивного управления скалярными объектами с использованием адекватных /і теории робастного управления алгоритмов оценивания градиентного типа и множественного оценивания.
Научная новизна її практическая ценность.
- Получены явные формулы для наихудшего значения верхнего предела супргг;ум нормы выхода многомерной линейной дискретной ста-
ционарной системы в классах ограниченных аддитивных возмущений и структурированных неопределенностей с конечной памятью и с затухающей памятью в задачах регулирования и слежения (при наличии дополнительного фиксированного входного сигнала).
Поскольку модели неопределенностей с конечной памятью и с затухающей памятью неверифицируемы на основе конечного набора измерений, рассмотрены подклассы неопределенностей с ограниченной памятью и с экспоненциально убывающими импульсными характеристиками, допускающие такую верификацию. Показано, что условия робастной устойчивости и формулы для асимптотических показателей в задаче регулирования в классе неопределенностей с конечной памятью являются неконсервативными для класса неопределенностей с ограниченной, но большой памятью. Аналогичное свойство Неконсервативности показателей качества в задаче слежения выполняется при некотором дополнительном свойстве фиксированного входного сигнала, справедливом, в частности, для периодических сигналов.
Поставлены и решены задачи синтеза 1\ субоптимальных робаст-ных регуляторов для конечномерных скалярных объектов управления в условиях структурированной неопределенности (независимые ограниченные операторные возмущения в каналах выхода и управления) и неструктурированной неопределенности (смешанные ограничения на операторные возмущения в каналах выхода и управления). Рассмотренные задачи синтеза являются обобщением задачи синтеза /і оптимального регулятора для скалярного объекта.
Рассмотрена нетрадиционная задача оценивания по результатам наблюдений неизвестного вектора номинальных параметров дискретного скалярного объекта. Нетрадиционность задачи заключается во включении в список оцениваемых параметров неизвестных норм каждого из возмущений и в предположении о неизвестной верхней границе нормы аддитивного возмущения. На основе понятия вектора оценок, согласованных с наблюдениями и априорной информацией, формализована неидентифицируемость вектора номинальных параметров управляемого объекта.
На основе метода рекуррентных целевых неравенств решены задачи адаптивной стабилизации скалярного объекта в условиях неопределенности и аддитивных возмущений с неизвестной верхней границей.
Поставлены и решены не рассматривавшиеся в литературе задачи синтеза неконсервативного адаптивного управления скалярным объектом в условиях неопределенности и аддитивных возмущений с иеиз-
вестной верхней границей: задачи регулирования и слежения, задача управления объектом с неизвестной структурой. Под неконсервативным понимается адаптивное управление, гарантирующее ту же оценку асимптотического робастного показателя качества, что и для объекта с полностью известными параметрами и нормами возмущений. Решение задач основано на использовании множественных оценок неизвестных параметров и выборе в качестве идентификационного критерия робастного показателя качества в задаче управления.
- Естественным следствием сложности задачи синтеза неконсервативного адаптивного управления является сложность используемых для ее решения алгоритмов. Рассмотрены проблемы реализации алгоритмов неконсервативного адаптивного управления, возможные модификации и эвристические аппроксимации, позволяющие решать более слабые задачи адаптивного робастного управления. Приведены результаты моделирования, подтверждающие работоспособность предложенных алгоритмов.
Апробация полученных результатов. Основные результаты диссертации докладывались на международных семинарах "Устойчивость и колебания нелинейных систем управления" (Москва, 1998, 1996), международных конференциях "Дифференциальные уравнения и применения" (С.-Петербург, 1998, 1996), Европейской конференции по управлению (Брюссель, 1997), симпозиумах IFAC/IFORS по идентификации систем (Фукуока, 1997; Копенгаген, 1994), Американской конференции по управлению (Альбукерке, 1997), симпозиуме IFAC по адаптивным системам в управлении и обработке сигналов (Будапешт, 1995), Всероссийском семинаре "Проблемы нелинейной динамики" (Горький, 1993), С. Петербургском семинаре "Теория управления" (1992), Ленинградском семинаре "Адаптивные и экспертные си-темы управления" (1991), на научных семинарах в С.-Петербургском университете (1989,1994,1998), С.-Петербургском техническом университете (1994,1998), Институте математики и механики УрО РАН (1994), в Королевском технологическом институте, г. Стокгольм (1997), в университетах гг. Ґетеборг (1997), Лулео (1997), Бирмингем (1996), Оксфорд (1996).
Публикации. По теме диссертации опубликовано 28 работ в журналах Автоматика и телемеханика, Известия РАН Сер. Техническая кибернентика, Вестник Сыктывкарского университета, Automatica, Systems and Control Letters, в трудах Коми научного центра УрО РАН, в трудах международных конференций. Основные результаты днссерта-
ции изложены в работах [3,4,8-10,21,23-25,27].
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы, насчитывающего 143 наименования, изложена на 290 страницах текста, включающего 27 иллюстраций и подготовленного в издательской системе Ш{гХ.