Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Юрченков Александр Викторович

Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления
<
Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Юрченков Александр Викторович. Робастный анализ и элементы синтеза для линейных систем с неопределенностью в анизотропийного управления: диссертация ... кандидата Физико-математических наук: 05.13.01 / Юрченков Александр Викторович;[Место защиты: Институт проблем управления им.В. А.Трапезникова Российской академии наук].- Москва, 2016.- 100 с.

Содержание к диссертации

Введение

1 Базовые понятия анизотропийной теории управления 10

1.1 Анизотропия случайного вектора 10

1.2 Вычисление средней анизотропии последовательности в пространстве состояний 12

1.3 Вычисление средней анизотропии в пространстве состояний 16

1.4 Анизотропийная норма системы 19

1.5 Выводы к главе 1 21

2 Условия ограниченности анизотропийной нормы для системы с мультипликативными глумами 23

2.1 Постановка задачи 25

2.2 Основной результат 26

2.3 Пример 31

2.4 Выводы к главе 2 34

3 Робастная устойчивость при нецентрированном возмущении 36

3.1 Постановка задачи анализа робастной устойчивости 37

3.2 Достаточное условие робастной устойчивости 38

3.3 Критерий робастной устойчивости 44

3.4 Выводы к главе 3 45

4 Синтез анизотропийного робастного регулятора при структурированной неопределенности объекта управления 47

4.1 Постановка задачи 48

4.2 Погружение в более общую задачу стохастической Тіоо оптимизации 50

4.3 Связь между задачей 2 и смешанной задачей оптимизации 51

4.4 «Наихудший» вход с ограниченной энергией для системы, замкнутой произвольным регулятором 57

4.5 «Наихудший» вход с ограниченным спектром для системы, замкнутой допустимым регулятором при «наихудшем» дополнительном входе с ограниченной энергией 60

4.6 Нг регулятор в форме наблюдателя 4.6.1 Оцениватель состояния 65

4.6.2 Оптимальный регулятор 4.7 Окончательный алгоритм синтеза регулятора 68

4.8 Пример синтеза анизотропийного регулятора 4.8.1 Метод гомотопии с ньютоновскими итерациями 72

4.8.2 Вычислительный алгоритм 76

4.8.3 Явные выражения матричных производных при численном построении анизотропийного регулятора 78

4.9 Выводы к главе 4 89

Заключение 90

Литература

Введение к работе

Актуальность темы. Существующие динамические системы вынуждены функционировать в присутствии различных видов неопределенности, характер которых может быть самым различным: от незначительного сдвига параметров математической модели объекта управления до представления ее в виде «черного ящика». Кроме того, знание стохастических характеристик действующих на динамическую систему возмущений также играет роль при выборе оптимальных законов управления для достижения лучшего качества замкнутой системы. Исследование устойчивости систем с неопределенностью и построение стабилизирующих регуляторов, замыкание которыми объекта управления гарантирует внутреннюю устойчивость, были одними из первых задач, получившими развитие в теории робастной устойчивости и управления.

В первой половине XX века работы Г. Найквиста, А.В. Михайлова, В.Л. Харитонова положили начало развитию частотных методов в области изучения устойчивости непрерывных динамических систем, которые позже распространились на дискретные и импульсные системы в работах Я.З. Цыпкина, Е.И. Джури. Но помимо исследования самой устойчивости необходимо было обеспечивать и качество замкнутой регулятором системы, выраженное с помощью некоторого функционала. Большой вклад в теорию оптимального управления внесла разработка принципа максимума Понт-рягина, который является необходимым условием оптимальности управляемой системы. Задача минимизации квадратичного критерия качества от переменных состояния линейной системы и регулятора получила название линейно-квадратичной задачи, в ходе решения которой синтезируется оптимальный регулятор, имеющий аббревиатуру LQR (для невозмущенной системы) или LQG (при наличии возмущения в виде гауссовского «белого шума»).

Первые работы по Т^^теории управления (теории управления с квадратичным критерием качества) были написаны в середине XX века. Задача поиска оптимального управления в виде LQR-регулятора, была рассмотрена A.M. Летовым. Оптимальная задача с квадратичным критерием качества для возмущенной гауссовским «белым шумом» системы была поставлена и решена Р. Калманом. Минусом теории построения LQG регуляторов является чувствительность замкнутой системы к изменению параметров объекта, что может привести к потере свойства устойчивости замкнутой таким регулятором системы.

Преодолеть этот недостаток Т^^теории управления могла новая теория, названная 'Н00-теорией управления и появившаяся в начале восьмидесятых годов XX века, основоположником которой был Дж. Зеймс.

Методы 'Н00-оптимизации позволили рассматривать вопросы устойчивости и синтеза регуляторов для систем с неопределенностью.

С одной стороны, синтез управления на базеТ^^теории может быть привлекателен в плане простоты построенного закона управления, но с другой стороны, 'Н00-теория обеспечивает лучшую робастность. Было замечено, что решение Т/оо субоптимальной задачи оказывается схожим с решением оптимальной LQG задачи, что навело на мысль о существовании общей теории, частные случаи которой и описывали бы обе упомянутые задачи. Важно также учитывать характер внешнего возмущения. Для гауссовского «белого шума», затраты на синтез 'Н.оо закона управления будут чрезмерными, поскольку сам закон строится для случая «наихудшего» входного воздействия, в общих случаях сильно отличающегося от реально действующего на систему возмущения. Аналогично, если стохастические характеристики внешнего возмущения отличаются от характеристик «белого шума», то построенный закон %2 управления будет крайне неэффективен с точки зрения значения выбранного функционала качества. Помогает ослабить требование о входном воздействии теория, названная авторами теорией анизотропийного управления. Первые работы по этой области управления принадлежат И.Г. Владимирову, А.В. Семенову, А.П. Курдюкову.

При решении задачи обеспечения робастного качества для линейной дискретной системы в рамках этой теории вводится понятие анизотро-пийной нормы, передаточной функции замкнутой системы ||^|а, которая

является частным случаем стохастической нормы. Это направление развивается в ряде работ И.Г. Владимирова, А.П. Курдюкова и их учеников. Поскольку значение анизотропийной нормы принадлежит интервалу, левым концом которого является масштабированная Т^-норма системы

Ці^Цо, а правым — Т/оо-норма Н^Н, то при предельных значениях

л/т

уровня средней анизотропии а входного сигнала, стремящимся к нулю или бесконечности, величина а-анизотропийной нормы l\F\\a будет совпадать с

одним из значений —== \\F\\0 или Ili^H^, соответственно.

у/т

Именно развитию теории анизотропийного робастного управления и посвящены исследования диссертационной работы.

Цели исследования. Целями диссертационной работы являются: решение задач анализа анизотропийной робастной устойчивости для дискретных систем с мультипликативными шумами при внешнем возмущении с ограниченной средней анизотропией; решение задачи робастной устойчивости для линейных дискретных стационарных систем с неструктурированной неопределенностью в случае нецентрированной входной последовательности с ограниченной средней анизотропией; разработка метода синтеза оптимальных регуляторов для систем со структурированной неопределенностью.

Методы исследования. В работе применяются методы теории управления, линейной алгебры, функционального анализа, теории случайных процессов, теории функций комплексного переменного и методы компьютерного моделирования.

Научная новизна. Получены достаточные условия робастной устойчивости для системы с неструктурированной неопределенностью при ненулевом среднем входной последовательности с ограниченной средней анизотропией. Разработан алгоритм синтеза синтеза линейного робастного регулятора, минимизирующего максимальное значение анизотропийной нормы замкнутой этим регулятором системы, для системы со структурированной неопределенностью. Впервые в анизотропийной теории рассмотрен новый класс систем — с мультипликативными шумами — для

которых выведены достаточное условие ограниченности анизотропийной нормы. Все результаты являются новыми и получены в соответствующих работах впервые.

Достоверность результатов. Результаты, представленные в работе, получены путем строгих математических выкладок и доказательств и проиллюстрированы на численных примерах.

Практическая и теоретическая ценность. Диссертационная работа развивает методы анизотропийного робастного анализа и синтеза для линейных систем, предлагая новые подходы исследования устойчивости и построения управления для систем с различными видами неопределенности. Результаты, полученные в работе, являются развитием математической теории управления линейными объектами, расширяя класс систем до систем, содержащих мультипликативные шумы, на вход которых поступает внешнее возмущение в виде последовательности гауссовских случайных векторов и позволяют ставить и решать задачу синтеза линейных регуляторов с меньшей степенью консервативности, чем широко используемые 'Н00-регуляторы. Также получен критерий анализа робастной устойчивости для системы с неструктурированной неопределенностью при нецентрированной входной последовательности и предложен новый метод построения оптимальных регуляторов для систем со структурированной неопределенностью, к которой можно привести практически любой вид неопределенности.

На защиту выносятся следующие положения:

  1. Критерий ограниченности анизотропийной нормы некоторым числом для дискретной системы с мультипликативными шумами при ограниченной средней анизотропии входной последовательности.

  2. Решение задачи минимизации верхней границы анизотропийной нормы для дискретной системы с мультипликативными шумами.

  3. Критерий робастной устойчивости дискретной линейной системы с неструктурированной неопределенностью при нецентрированной

входной последовательности с ограниченным уровнем средней анизотропии.

4. Метод синтеза анизотропийного робастного регулятора для линейной стационарной системы со структурированной неопределенностью.

Апробация результатов работы. Результаты диссертационной работы докладывались на семинарах Лаборатории №7 ИПУ РАН под руководством доктора технических наук Поляка Б.Т., на семинаре кафедры математического моделирования процессов управления техническими системами МГТУ им. Н.Э. Баумана по руководством член-корреспондента академии наук Крищенко А.П., на семинаре лаборатории механики ИПМех РАН под руководством академика Черноусько Ф.Л., на семинаре кафедры теории вероятностей МАИ под руководством доктора технических наук Кибзуна А.И., на IV Всероссийской традиционной молодежной летней школе «Управление, информация и оптимизация» (ТМШ'2012), на Всероссийской школе-конференции молодых ученых «Управление большими системами» (УБС'2014, Арзамас), на зарубежной конференции «The 21st International Symposium on Mathematical Theory of Networks and Systems» (MTNS'2014, Гронинген, Нидерланды). Кроме того, тезисы доклада по результатам диссертационной работы поданы на XIII Международную конференцию «Устойчивость и колебания нелинейных систем управления» (конференция Пятницкого), а также подана работа на европейскую конференцию «12th IFAC International Workshop on Adaptation and Learning in Control and Signal Processing» (ALCOSP'2016, Эйндховен, Нидерланды).

Публикации. Основные результаты диссертационной работы опубликованы в одной монографии, трех статьях в российских журналах из перечня ВАК, трудах двух между народных конференций и одной Всероссийской конференции, тезисах докладов на международной конференции.

Личный вклад соискателя. Все исследования, изложенные в диссертационной работе, проведены лично соискателем в процессе научной деятельности. Из совместных публикаций в диссертацию включен лишь тот материал, который непосредственно принадлежит соискателю.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы. Работа изложена на 101 странице, содержит 13 иллюстраций. Список литературы включает 81 источник.

Работа выполнена при поддержке фундаментальной темы № 31.3 (313-14/01,08,42) «Методы и алгоритмы анизотропийной фильтрации и оценивания состояния объекта и их применение к задачам управления движением и навигации атмосферного летательного аппарата», гранта 14—08— 00069 и гранта 15-07-05489 Российского фонда фундаментальных исследований.

Анизотропийная норма системы

Поскольку для дискретных систем в теории автоматического управления внешнее возмущение, действующее на систему, является последовательностью случайных векторов, использовать в качестве определения анизотропии последовательности формулу (1.1) не представляется возможным из-за постоянно увеличивающегося числа элементов последовательности, что приводит к стремлению анизотропии к бесконечности. Поэтому используют удельную усредненную по времени анизотропию, названную средней анизотропией последовательности.

Рассмотрим бесконечную строго стационарную эргодическую последовательность {wk\ke состоящую из гауссовских векторв Wk Є L. Введем обозначение для вектора, полученного объединением элементов последовательности {wk}k Є Z

Тогда анизотропию А(И/о:дг_і) можно вычислять, пользуясь следующим утверждением: Лемма 2 Анизотропия A(WO:N-\) представима в виде N-l N-1 A(WW-i) = A(LW-I) + J2 A(wk) + J2 7(адо, W.k-.-i), k=0 k=l где I(wo,W-k:-i) — взаимная информация случайных векторов WQ и а вектор UO:N-I Є UN имеет нормальное распределение UO:N-I QmN (E) с блочно-диагоналъной ковариационной матрицей L Е = blockdiag ( —Е Wk т І і где \-\ — евклидова норма вектора. Аналог леммы можно найти в [7], а ее доказательство — в [64]. Средняя анизотропия A(W) стационарной эргодической последовательности W = {wk} определяется как (1.4) Пусть V = {vk}kez — последовательность m-мерных гауссовских векторов с нулевым средним Е[г &] = 0 и единичной ковариационной матрицей 1т. Если предположить, что случайная последовательность W получена из V с помощью формирующего фильтра [64] и принадлежит пространству Харди Ті ш комплекснозначных матричных функций, аналитических внутри открытого единичного диска {zeC: \z\ 1}.

В работе [58] показано, что средняя анизотропия последовательности (1.5) может быть вычислена следующим образом: f. . mS(uj) — спектральная плотность W, G(uS) = lim G(relU}) — значение переда точной функции G{z) на границе единичного круга, G {UJ) — комплексно-сопряженная транспонированная матрица. Стоит отметить, что функционал (1.6) всегда неотрицателен и принимает конечное значение, если формирующий фильтр G имеет полный ранг, т.е. rankG(uj) = т при

Для вычисления средней анизотропии кроме формулы (1.6), использующей функцию спектральной плотности S(UJ), можно применять формулу типа Колмогорова-Сегё, выражающую среднюю анизотропию в терминах вторых стохастических моментов (т.е. ковариационных матриц). Сначала нужно ввести некоторые обозначения.

Пусть W = GV — случайная последовательность, сформированная фильтром G из гауссовской последовательности V. Введем последовательность прогнозов \wk\k_\}h 7 элементов последовательности {wk} и их ошибок {гЬк}кеЪ: Wk\{Wj}J k\ Wk\k-l =0, значит, {wk} — последовательность гауссовских векторов с нулевым средним и некоторой ковариационной матрицей. Тогда справедлива следующая формула: которая называется формулой Колмогорова-Сегё. Также среднюю анизотропию A(W) случайной последовательности можно разделить на сумму пространственной и временной составляющей:

Пространственная составляющая AS(W) получила свое название вследствие независимости функционала AS(W) от предыстории {wk}k 0, а временная Af(W) — зависит от предыстории. Временное слагаемое Af(W) средней анизотропии совпадает с количеством информации о векторе if о, содержащейся в части предыстории {wk}k 0, т.е. измеряет «предсказуемость» последовательности. Функционал Af(W) является инвариантным относительно взаимно-однозначного преобразования координат вМт: At(W) = At(MW) для любой невырожденной матрицы М Є Пространственная составляющая AS(W), совпадающая со значением анизотропии A (if о) вектора и о, не обладает инвариантностью к однозначному преобразованию координат и характеризует неравномерность распределения случайного вектора по компонентам в сечении случайной стационарной последовательности W. Для скалярных сигналов величина AS(W) равна нулю и представляет интерес только для случая т 2.

Свойства анизотропии, ее пространственной и временной составляющей описаны в [64]. Окрашенную последовательность {wk\, генерируемых согласно (1-5), можно получить с помощью стационарного динамического объекта, называемого формирующим фильтром. Представление такого фильтра в пространстве состояний в простейшем случае имеет вид хк+1 = Ахк + Bvk, А (л 0, хо = О, (1.8) wk = Схк + Dvk, где хк — вектор состояния, внешнее возмущение {i } — гауссовский «белый шум». Обозначим S ковариационную матрицу вектора и І , т.е. S = cov(wk\k 00). Несложно показать, что эта матрица связана с решением Р О уравнения Ляпунова

Приведенные выше формулы позволяют вычислять среднюю анизотропию случайной последовательности W, сгенерированной с помощью формирующего фильтра (1.8) в терминах вторых моментов W с помощью соответствующих уравнений Ляпунова и Риккати. Детали могут быть уточнены в [64].

В случае когда случайный вектор W нецентрирован, формула (1.10) требует уточнения. Пусть гауссовский случайный вектор W с ненулевым средним /І имеет ковариационную матрицу S. Следовательно, его функция плотности распределения может быть записана в виде

Основной результат

Будем рассматривать номинальный объект М, представленный в виде соотношений вход-выход: (з.і; Ми М12 м21 м22 где q Є и z Є W Є входные сигналы, р Є выходные, соответственно. Матрица М состоит из передаточных функций М от г-го входа к j -му выходу. На рис.3.1 представлена схема такой системы с номинальным объектом М и неопределенностью А. Неопределенность представлена посредством своей передаточной функции. Такая специально введенная конструкция помогает представить неточность в модели объекта с помощью дополнительного зашумления q, которое зависит в свою очередь от р. Если матрица А будет иметь блочно-диагональный вид, то в таком случае говорят о структурированной неопределенности. В зависимости от природы представленной неопределенности, блоки А будут виде скалярных диагональных матриц, действительных или комплексных матриц [76]. Задача заключается в поиске интервала изменения значения анизотро-пийной нормы оператора неопределенности А, для которого, при фиксированном М, система с неопределенностью оставалась бы внутренне устойчивой, что в свою очередь гарантирует робастную устойчивость объекта М с неопределенностью А.

В этом параграфе будет описано достаточное условие робастной устойчивости для системы с параметрической неопределенностью. При этом модель неопределенности А, указанная на рис.3.1, будет называться допустимой для некоторого М, если А Є 7?/Hxm и передаточная функция J-U(M, А) внутренне устойчива. Напомним, что обозначение J-u{ -, ) закреплено за верхним дробно-линейным преобразованием.

Теорема 5 Пусть система с передаточной функцией Ти{М, А), изображенная на рис.3.1, описывается вход-выходными соотношениями 3.1, причем М, А являются причинными. Тогда, если неопределенность А Є 7?/Hxm содержится в классе Da(e, р) = \ А : I Д є, essinf a(A(ju)) р \, для некоторых є 0 и р 0, а сг(А) = л/\т{п(А А) — минимальное сингулярное значение А, уровень средней анизотропии а определяется выражением тогда система Ти{М, А) будет внутренне устойчивой при всех значениях неопределенности А Є Da(e,p). Доказательство: Введем обозначение ДЫ = lim А (ге) , ш Є [—7г; 7г]. Уравнения замкнутой системы в частотной области имеют вид

Значение интеграла в последней строчке не изменится при унитарном преобразовании аргумента [64]. Пусть U — такая унитарная матрица, что U AU = А будет иметь диагональный вид, причем на диагонали стоят собственные числа матрицы А. Тогда

Последнее неравенство верно в силу того, что А Є Da(e,p). Поскольку Мііс Aa 1, А Є WHxm и Aa є, можно заключить, что что противоречит (3.4), следовательно, (/ — МцА) обратима. Покажем, что существует такое значение а, удовлетворяющее (3.5). По определению анизотропиинои нормы

Замечание 1 В случае отсутствия неопределенности (А = 0) условие (3.4) преобразуется к виду Мііа оо для некоторого а 0 при дополнительном требовании In - = In 1 = 0. Это условие вытекает из устойчивости Мц. Замечание 2 Если essinf а(А(о;)) = 0, А ф 0; то условие Міі6 Аа 1 изменится и примет вид ЦМцЦооЦДЦоо 1. Этот результат хорошо известен в 1-1 -теории управления как теорема о малом коэффициенте усиления [52]. Замечание 3 Если для неопределенности будет выполнено ЦЛІ2 МДІоо тогда для любого положительного значения а будет справедливо неравенство Аа ЦЛЦоо- Используя тот факт (см. [76]), что esssupor(A(J6 j) 1), essinf а(А(со) -7T w 7r условие b = a + mln(e/p) можно привести к виду b = а + mln ЦДЦооЦД Цоо = а + m In ess sup cond (A(jo;)), где cond (A) — число обусловленности матрицы А. Существование A-1 гарантировано тем, что матрица А устойчива. Хотя это будет неверно для с = оо. ДАЯ того, чтобы определить является ли система Ти{М, А) устойчивой, достаточно знать сингулярный спектр матрицы А, причем сама матрица А может быть неизвестной.

Замечание 4 Равенство с = а будет выполнено только в том случае, если верхняя и нижняя грань сингулярного спектра линейного оператора А совпадают. В таком случае неопределенность должна иметь вид Теорема 5 дает только достаточное условие внутренней устойчивости для системы с ограниченной по анизотропийной норме неопределенностью и известной степенью отделимости неопределенности от нуля. Эта теорема позволяет ослабить консерватизм условия ЦМпЦоо І/є теоремы о малом коэффициенте усиления и заменить его на (3.4). В таком случае уровень средней анизотропии с показывает насколько можно ослабить требование теоремы о малом коэффициенте усиления, не потеряв при этом свойства робастной устойчивости. Известно, чтоТ -норма обладает круговым свойством, поэтому не представляется возможным получить условие для проверки робастной устойчивости, аналогичное (3.4). Хотя из свойства анизотропийной нормы АІ2 = \/тпІіт А следует, что объекты с неопределенностью вида (3.7) будут робастно устойчивы при выполнении неравенства МцІ2ІАІ2 1- Это условие влечет за собой внутреннюю устойчивость Ти{М, А).

Покажем как найти уровень средней анизотропии а, при котором будет гарантирована внутренняя устойчивость и выполнено условие (3.4). Рассмотрим реализацию объекта М в пространстве состояний

Критерий робастной устойчивости

Решение уравнения (4.41)-(4.43) называется стабилизирующим, если матрица R симметрическая, матрица T,w положительно определена, а матрица Aw + BWLW асимптотически устойчива. Заметим, что для любого q Є 0, Halloo ) уравнение Риккати имеет единственное стабилизирующее решение, которое положительно полуопределено. Следующая теорема дает явные выражения для вычисления матриц Lw и Sw, то есть реализацию фильтра (4.40).

Теорема 11 Пусть система (4-36) асимптотически устойчива, q Є 0, Ці уЦто ) и матрицы Lw и T,w соответствуют стабилизирующему решению R уравнения Риккати (4-41) (4-43)- Тогда 1. формирующий фильтр (4-40) удовлетворяет (4-38); 2. а-анизотропийная норма системы Fw задается выражением IF II =-(l J- in ,-. — I -1 la q\ tr {LwPLl + Sw) где P — это решение уравнения Ляпунова P={AW + BWLW)P(AW + BWLW)T + BwZwBl (4.44) и параметр q Є 0, FW J удовлетворяет уравнению a = -- In det ( , mi w 7 I . (4.45) Из теоремы 5 следует, что 1 / mi Х 1/2 J 7 = q\ tr (LWPLJ + Sw) Представление элементов входной последовательности й; в виде (4.39) позволяет преобразовать выражение (4.32) для функционала J(K} 7); явно выражая ковариации Rww(0) и Rw( (0): Rww{v) = LWPLW + 2JW, где P — это решение уравнения Ляпунова (4.44). Лемма может быть прямым следствием теоремы 3, если справедливы следующие равенства RWW(Q) = L PL +Sy, и Rw (0) = LWP. Докажем сначала первое Лемма 4 Для заданной системы (4-4) с входными сигналами щ и Wk, формирующимися согласно (4-26) и (4-39), значение критерия качества (4-5) будет равно J (К, 7) = tr { (BTYB + BTYFZFTYB) (LwPLl + w) + + 2(ATYFJ:FTYB + ATYB)LWP\, (4.46) где матрицы входящие в правую часть вычисляются согласно выражению (4-27), решениям уравнений Риккати (4-29)-(4-31) и (4-41) (4-43) Доказательство.: Поскольку E [CoCo ] — эт0 решение уравнения Ляпунова вида (4.44), критерий качества (4.5) может вычисляться согласно (4.46). После синтеза обоих формирующих фильтров Go и G\ замкнутая система имеет вид, представленный рис.4.4. представленную на рис.4.4, где фильтры построены в соответствие с процедурами, описанными в предыдущем разделе, для некоторого регулятора К. Замкнутая система имеет реализацию в пространстве состояний

Это задача оптимизации в условиях неполной информации о векторе состояния для системы (4.47), на вход которой поступает «белый шум» с единичной ковариационной матрицей. Решение такой задачи хорошо известно [12]. В соответствии с принципом разделения, решение указанной задачи разбивается на два этапа. На первом этапе строится оцениватель состояния (оценивающий фильтр Калмана). На втором этапе строится статический регулятор, обеспечивающий заданное качество, а именно минимум Нг-нормы передаточной функции замкнутой системы. Полученный таким образом регулятор является оценивающим, т.е. его состояние является оптимальной в среднеквадратичном смысле оценкой состояния системы по выходу. уравнения (4.48)-(4.50) называется стабилизирую щим, если матрица S является положительно полуопределенной и матрица Ац — ЛС21 асимптотически устойчива. Заметим, что в силу предположения (D) уравнение (4.48)-(4.50) имеет не более одного стабилизирующего решения.

Теорема 12 Пусть система (4-4) удовлетворяет предположениям (А), (В) и (D) и пусть матрицы реализации в пространстве состояний допустимого регулятора (4-25) удовлетворяют соотношениям где матрица Л выражается через стабилизирующее уравнение Риккати (4-48)-(4-50). Тогда регулятор (4-25) является оценивающим.

Поскольку доказательство теоремы 6 принципиально не отличается от доказательства теоремы 2, приведенной в [50], оно здесь пропущено. Пожалуй стоит отметить, что доказательство теоремы — суть хорошо известная процедура построения фильтра Калмана для замкнутой системы (4.47), на вход которой поступает «белый шум». Подробности такого синтеза могут быть найдены в [25,60]. Поскольку размерность системы (4.47) равна 2п, указанная процедура приводит к получению оценивателя состояния такой же размерности. Однако учитывая тот факт, что состояние замкнутой системы (4.47) имеет вид (xj} J) , где & — состояние искомого оценивающего регулятора, то возможно понизить размерность вектора пространства состояний регулятора до п. 4.6.2 Оптимальный регулятор

Заключительный этап в решении задачи 2 заключается в построении статического регулятора для разомкнутой системы уравнения (4.52)-(4.54) будем называть стабилизирующим, если матрица Т положительно определена, а матрица AU + BUN асимптотически устойчива. Из-за предположения, что матрица Dyz в (4.1) имеет полный столбцовый ранг, уравнение (4.52)-(4.54) имеет не более одного решения.

«Наихудший» вход с ограниченной энергией для системы, замкнутой произвольным регулятором

«Наихудший» вход с ограниченным спектром для системы, замкнутой допустимым регулятором при «наихудшем» дополнительном входе с ограниченной энергией Рассмотрим систему (4.4), на вход которой подается последовательность (4.26). На языке передаточных функций вход-выходное соотношение имеет вид Z = FWW, где Fw имеет следующую структуру: Fw Fi{M,K) I = Aw Bw = Gx _ Gw 0 " A + BZLX В їС + B L i Bi + B3S1/2 ВСг A ВДз Сі Dl2C 1\С\2 0 0 iC i i 0 0 7iL i,22(7 0 l iB i;nC (4.36) где матрицы L = [L\, L2} и S1 2 определяются согласно (4.29)-(4.3Г Структурная схема системы представлена на рис.4.3. Zk м — (Л Ук ик Vk wk — К Рис. 4.3. Замкнутая система с дополнительным входом На данном этапе необходимо подать на вход системы наихудшую входную последовательность W Є Wa, доставляющую максимум функционалу І І;І2- ПОД поиском наихудшей входной последовательности W подразумевается синтез фильтра Go из (4.23), который сводится к следующей задаче оптимизации: mi

Задача (4.37) может быть решена с помощью анизотропийной теории. Частотное описание наихудшего фильтра Go можно получить согласно следующему утверждению. Теорема 10 Владимиров Пусть система Fw є пП{гі+2то)хті удовле F творяет условию \F \\ Iі w\\2 «ЧІоо т Если спектральная плотность фильтра Go Є 7 HmiXmi имеет вид до(ш)д 0(ш) = (jmi - qF Fw l , -7Г ш тг (4.38) -і для q = A (Go), то Go принадлежит множеству наихудших формирующих фильтров (4-23). Чтобы описать наихудший формирующий фильтр Go в пространстве состояний, будем искать входной сигнал Wk в виде wk L k + Y Vk, (4.39) где Lw Є Rmix2n такая, что Aw + BWLW асимптотически устойчива, а T,w Є RmiXmi положительно определенная симметрическая матрица. Соответствующий формирующий фильтр Go со входом V Є Wo и выходом W Є Wa имеет следующую реализацию в пространстве состояний:

Решение уравнения (4.41)-(4.43) называется стабилизирующим, если матрица R симметрическая, матрица T,w положительно определена, а матрица Aw + BWLW асимптотически устойчива. Заметим, что для любого q Є 0, Halloo ) уравнение Риккати имеет единственное стабилизирующее решение, которое положительно полуопределено. Следующая теорема дает явные выражения для вычисления матриц Lw и Sw, то есть реализацию фильтра (4.40).

Это задача оптимизации в условиях неполной информации о векторе состояния для системы (4.47), на вход которой поступает «белый шум» с единичной ковариационной матрицей. Решение такой задачи хорошо известно [12]. В соответствии с принципом разделения, решение указанной задачи разбивается на два этапа. На первом этапе строится оцениватель состояния (оценивающий фильтр Калмана). На втором этапе строится статический регулятор, обеспечивающий заданное качество, а именно минимум Нг-нормы передаточной функции замкнутой системы. Полученный таким образом регулятор является оценивающим, т.е. его состояние является оптимальной в среднеквадратичном смысле оценкой состояния системы по выходу. уравнения (4.48)-(4.50) называется стабилизирую щим, если матрица S является положительно полуопределенной и матрица Ац — ЛС21 асимптотически устойчива. Заметим, что в силу предположения (D) уравнение (4.48)-(4.50) имеет не более одного стабилизирующего решения.

Теорема 12 Пусть система (4-4) удовлетворяет предположениям (А), (В) и (D) и пусть матрицы реализации в пространстве состояний допустимого регулятора (4-25) удовлетворяют соотношениям где матрица Л выражается через стабилизирующее уравнение Риккати (4-48)-(4-50). Тогда регулятор (4-25) является оценивающим.

Поскольку доказательство теоремы 6 принципиально не отличается от доказательства теоремы 2, приведенной в [50], оно здесь пропущено. Пожалуй стоит отметить, что доказательство теоремы — суть хорошо известная процедура построения фильтра Калмана для замкнутой системы (4.47), на вход которой поступает «белый шум». Подробности такого синтеза могут быть найдены в [25,60]. Поскольку размерность системы (4.47) равна 2п, указанная процедура приводит к получению оценивателя состояния такой же размерности. Однако учитывая тот факт, что состояние замкнутой системы (4.47) имеет вид (xj} J) , где & — состояние искомого оценивающего регулятора, то возможно понизить размерность вектора пространства состояний регулятора до п. 4.6.2 Оптимальный регулятор

Заключительный этап в решении задачи 2 заключается в построении статического регулятора для разомкнутой системы уравнения (4.52)-(4.54) будем называть стабилизирующим, если матрица Т положительно определена, а матрица AU + BUN асимптотически устойчива. Из-за предположения, что матрица Dyz в (4.1) имеет полный столбцовый ранг, уравнение (4.52)-(4.54) имеет не более одного решения.

Теорема 13 Пусть система (4-1) удовлетворяет предположениям (А), (В), (Е) и пусть матрицы реализации в пространстве состояний оценивающего регулятора (4-25) вычисляются согласно соотношениям (4-51) и уравнению C = N! + N2, (4.56) где матрицы N\ и Л выражаются через стабилизирующее решение уравнения Риккати (4-52)-(4-54)- Тогда регулятор (4-25) является решением задачи 2. Доказательство теоремы представляет собой синтез оптимального LQG-регулятоа с критерием минимизации %2_нормы передаточной матрицы замкнутой системы. Подробное изложение которого можно найти в [25].