Содержание к диссертации
Введение
1 Линейные матричные неравенства в задачах управления 10
1.1 LMI и их применение в управлении 12
1.2 S-процедура и ее формулировки 14
1.3 Концепция инвариантных множеств 16
1.4 Следящее управление: различные подходы к синтезу 17
1.5 Задачи слежения и их различные свойства 20
1.6 Некоторые определения и технические средства 22
2 Управление системой с возмущением во входе и выходе системы 30
2.1 Задача анализа 30
2.1.1 Непрерывное время 30
2.1.2 Дискретное время 35
2.1.3 Пример: AC5 из библиотеки COMPleib 37
2.2 Задача синтеза 39
2.2.1 Непрерывное время 39
2.2.2 Дискретное время 43
2.2.3 Пример: задача AC5 из библиотеки COMPleib 46
2.3 Робастная постановка 47
2.3.1 Непрерывное время 47
2.3.2 Дискретное время 52
2.3.3 Пример: модель летательного аппарата 55
2.4 Выводы 63
3 Задача слежения по состоянию системы 64
3.1 Задача синтеза 64
3.1.1 Непрерывное время 64
3.1.2 Дискретное время 68
3.2 Робастная постановка 70
3.2.1 Непрерывное время 70
3.2.2 Дискретное время 74
3.3 Выводы 80
4 Задача слежения по выходу системы 82
4.1 Задача анализа 82
4.1.1 Непрерывное время 82
4.1.2 Дискретное время 85
4.2 Задача синтеза 89
4.2.1 Непрерывное время 89
4.2.2 Дискретное время 92
4.2.3 Пример: двухмассовая система 95
4.3 Робастная постановка 99
4.3.1 Непрерывное время 99
4.3.2 Дискретное время 104
4.4 Выводы 107
Заключение 109
Список литературы
Введение к работе
Актуальность темы исследования. Задача управления динамической системой при воздействии внешних возмущений является одной из наиболее важных в теории автоматического управления вплоть до настоящего времени. Соответствующими задачами начали заниматься более семидесяти лет назад. Так, задачей анализа при подавлении при воздействии внешних возмущений занимался Б. В. Булгаков еще в 40-х годах прошлого века. Впервые задача об оптимальном подавлении внешних возмущений была значительно позднее сформулирована Е. Д. Якубович.
В диссертационной работе возмущения предполагаются неизвестными и ограниченными (англ. unknown-but-bounded model). Такая модель широко применяется в разнообразных приложениях, а также накладывает «мягкие» ограничения на возмущения (минимальное количество известной априорной информации о возмущении). Возмущение предлагается произвольным, известным предполагаются только допустимые границы его изменений. Кроме того, рассматривается модель постоянно действующих возмущений (англ. persistence disturbances).
Первым подходом, который позволяет подавлять влияние внешних возмущений в указанных предположениях, является метод динамического программирования (англ. dynamic programming technique) (Ф. Швеппе (F. Schweppe) и Дж. Гловер (J. Glover), Н. Элиа (N. Elia) и М. Далех (M. Dahleh)). Другим популярным в настоящее время подходом является 1-оптимизация (А. Е. Барабанов, О. Н. Граничин, Дж. Пирсон (J. Pearson), М. Далех). Однако часто полученные с использованием указанных подходов регуляторы имеют очень высокий порядок; в случае непрерывного времени применение 1-оптимизации значительно осложнено. Точное описание множеств достижимости в таком случае получается крайне громоздким. Кроме того, случай ненулевых начальных условий может существенно затруднять применение таких подходов.
Другим применяемым подходом (помимо динамического программирования и 1-оптимизации) является подход, основанный на использовании верхних границ 1-нормы, так называемой *-нормы (англ. star norm, *-norm) (Дж. Абедор (J. Abedor), К. Нагпал (K. Nagpal) и К. Пула (K. Poolla)). Использование этого подхода позволяет получать регуляторы заданного порядка, подавляющие воздействие внешних возмущений. Тем не менее, такая аппроксимация может быть слишком «грубой».
Указанные сложности можно преодолеть при использовании так называемой концепции инвариантных множеств. Этот подход возник в 1960-1970х годах в работах Х. Витценгаузена (H. Witsenhausen), Д. Бертсекаса (D. Bertsekas) и И. Родеса (I. Rhodes), Ф. Швеппе. Независимо сходный подход был разработан
в нашей стране в работах А. Б. Куржанского, А. И. Субботина и Ю. С. Осипова. Эта концепция основана на анализе допустимых множеств динамических систем, а также на аппроксимации множеств достижимости простыми выпуклыми множествами, такими как многогранники или эллипсоиды. Особенное внимание привлекают множества, обладающие свойством инвариантности (англ. positive invariance). Множество в пространстве состояний называется инвариантным для некоторой динамической системы, если траектория, начинающаяся в таком множестве, остается внутри его во все последующие моменты времени.
В диссертационной работе применяется подход, основанный на одном из типов инвариантных множеств — эллипсоидах. К основным преимуществам такого семейства инвариантных множеств относятся простота их матричного описания, которая позволяет сводить рассматриваемые задачи к задачам полуопределенного программирования (англ. SemiDefinite Programming, SDP). Развиваемый подход основан на технике линейных матричных неравенств (англ. linear matrix inequalities, LMI). Основы использования LMI в рамках теории управления были заложены в работах А. М. Ляпунова, А. И. Лурье; более широкое распространение эта техника получила благодаря работам Р. Калмана (R. Kalman), В. А. Якубовича, Я. Виллемса (J. Willems), Е. С. Пятницкого, С. Бойда (S. Boyd). Особенно стоит отметить разработанный А.C. Немировским и Ю.В. Нестеровым метод внутренней точки, позволяющий эффективно численно решать задачи, представленые в форме линейных матричных неравенств. Отличительной особенностью техники инвариантных эллипсоидов является возможность обобщения на робастные постановки задач, которые традиционно вызывают большой интерес ввиду высокой сложности. К преимуществам указанного метода относятся простота (с технической точки зрения) учета ненулевых начальных условий, а также возможность адаптации для случаев и непрерывного, и дискретного времени.
Таким образом, исследование применимости метода инвариантных эллипсоидов к задачам анализа и синтеза линейных динамических систем (в том числе в робастных постановках) является актуальным.
Диссертационная работа изложена в соответствии со следующей структурой. Во введении обоснована актуальность темы исследования, дан краткий обзор результатов по тематике исследования, сформулированы цели и задачи диссертационной работы, указан перечень положений, выносимых на защиту, а также приведены сведения о структуре и объеме диссертационной работы.
В главе 1 представлен обзор подходов к решению некоторых задач теории управления, отдельный акцент сделан на использовании метода линейных матричных неравенств. Следующие три главы посвящены непосредственно исследованию применимости метода инвариантных эллипсоидов к некоторым за-4
дачам теории управления. Так, в главе 2 дается решение задачи управления линейной системой с возмущением во входе и выходе. В главе 3 дается решение линейной задачи слежения по состоянию системы. В главе 4 дается решение линейной задачи слежения по выходу системы. Все предлагаемые подходы к решению основаны на методе инвариантных эллипсоидов. Все предлагаемые подходы обобщены на соответствующие робастные постановки. Эффективность и работоспособность предлагаемых подходов продемонстрирована численным моделированием на разнообразных примерах: задачах AC5 и AC11 из стандартной библиотеки COMPleib, а также задачах управления двухмассовой системой и летательным аппаратом.
Цели и задачи. Цель диссертационной работы состоит в исследовании применимости метода инвариантных эллипсоидов к задачам анализа и синтеза линейных динамических систем, заключающемся в его распространении на различные постановки задач, в том числе на робастные постановки задач синтеза управления, а также на некоторые постановки задачи слежения. В соответствии с поставленной целью диссертационная работа направлена на решение следующих задач:
-
задачи анализа и синтеза для управления линейной системой с возмущением во входах и выходах для случаев непрерывного и дискретного времени, в том числе в робастных постановках;
-
задачи слежения по состоянию системы для случаев непрерывного и дискретного времени, в том числе в робастных постановках;
-
распространение полученных результатов из предыдущего пункта на задачу слежения по выходу системы;
-
численное исследование работоспособности и эффективности предлагаемых подходов на различных примерах.
Научная новизна. В диссертационной работе исследована применимость и получены модификации метода инвариантных эллипсоидов для решения:
-
задач анализа и синтеза для управления линейной динамической системой с неизвестным, но ограниченным возмущением во входе и выходе, в том числе в робастных постановках;
-
линейной задачи слежения по состоянию линейной динамической системы управления, в том числе в робастных постановках;
-
распространение полученных в предыдущем пункте результатов на задачу
слежения по выходу линейной динамической системы;
4. распространение результатов из пунктов 1-3 для случая дискретного времени.
Работоспособность и эффективность применения предложенных подходов продемонстрирована посредством проведения ряда численных экспериментов.
Соответствие шифру специальности. Работа соответствует шифру специальности 05.13.01 и охватывает следующие области исследования, входящие в специальность: п. 2. Формализация и постановка задач системного анализа, оптимизации, управления, принятия решений и обработки информации; п. 4. Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации.
Теоретическая и практическая значимость. Теоретическую значимость имеют результаты, связанные с распространением метода инвариантных эллипсоидов на задачи управления линейной системой с возмущением во входах и выходах, а также на некоторые постановки задачи слежения. Практическая ценность заключается в разработке методов и алгоритмов, позволяющих применять предложенные подходы; при этом все предложенные подходы легко реализуются с технической точки зрения.
Методология и методы исследования. В работе применяются методы математической теории управления, выпуклой оптимизации, линейной алгебры и компьютерного моделирования. Ключевое место в работе отводится технике линейных матричных неравенств, которая позволяет формулировать получающиеся задачи теории управления в форме задач полуопределенного программирования.
На защиту выносятся следующие положения:
-
предложен подход к решению задач анализа и синтеза для управления линейной динамической системой с неизвестным, но ограниченным возмущением во входе и выходе, в том числе в робастных постановках;
-
получено решение линейной задачи слежения по состоянию линейной динамической системы, в том числе в робастных постановках;
-
результаты предыдущего пункта распространены на линейную задачу слежения по выходу линейной динамической системы;
-
полученные результаты в пунктах 1-3 полностью перенесены на случай дискретного времени.
Проведено масштабное численное исследование эффективности предложенных методов на примерах тестовых задач, подтверждающих их реализуемость и работоспособность.
Степень достоверности и апробация результатов. Результаты диссертационной работы докладывались и обсуждались на семинарах лаборатории №7 ИПУ РАН, 55-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук» (г. Долгопрудный, 2012 г.), Четвертой Традиционной Всероссийской молодежной летней Школе (4-я ТМШ) «Управление, информация и оптимизация» (г. Солнечногорск, Московская область, 2012 г.), XVI конференции молодых ученых «Навигация и управление движением» (г. Санкт-Петербург, 2014 г.), Шестой Традиционной Всероссийской молодежной летней Школе (6-я ТМШ) «Управление, информация и оптимизация» (дер. Григорчико-во, Московская область, 2014 г.), XVIII конференции молодых ученых «Навигация и управление движением» (г. Санкт-Петербург, 2016 г.), 20th International Conference on System Theory, Control And Computing (ICSTCC-2016) (г. Синая, Румыния, 2016 г.), 8th International Conference on Physics and Control (PhysCon-2017) (г. Флоренция, Италия, 2017 г.), 21th International Conference on System Theory, Control And Computing (ICSTCC-2017) (г. Синая, Румыния, 2017 г.).
Достоверность теоретических результатов обеспечивается строгостью доказательств, а работоспособность предлагаемых методов подтверждается результатами численного моделирования.
Публикации. Основные результаты опубликованы в 7 научных работах, в том числе 3 статьи – в рецензируемых изданиях из списка, рекомендованного ВАК.
Личный вклад соискателя. Все исследования, представленные в диссертационной работе, проведены лично соискателем в процессе научной деятельности. Из совместных публикаций в диссертацию включен лишь тот материал, который непосредственно принадлежит соискателю.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы. Работа изложена на 122 страницах, содержит 23 иллюстрации. Библиография включает в себя 117 наименований.
Концепция инвариантных множеств
Как отмечалось выше, все предлагаемые в диссертационной работе подходы основаны на методе инвариантных множеств, или точнее, на методе инвариантных эллипсоидов [50]. Под инвариантностью обычно понимается следующее свойство (см. [10]; точное определение понятия «инвариантного эллипсоида», которое будет использоваться в диссертационной работе, будет введено далее в соответствующем разделе).
Инвариантные множества широко используются в различных задачах теории управления, начиная с 1960-х годов. Двумя самыми распространенными семействами инвариантных множеств являются многогранные множества и эллипсоиды. Эллипсоиды достаточно просты в описании, но при этом позволяют получать оценки достаточно высокой точности. Одной из первых работ, в которой рассматривается применение такого подхода к задачам управления с неопре деленностью, была [11]. Алгоритм, позволяющий построить эллипсоидальную аппроксимацию был несколько позже предложен Ф. Швеппе в работе [51]. В предложенном алгоритме наблюдения используются для рекуррентного расчета ограничивающего эллипсоида для множества состояний системы (в предположении, что начальное состояние содержится в эллипсоиде, а внешнее возмущение можно аппроксимировать эллипсоидами). Кроме того отмечается, что скорость сходимости данного алгоритма неизвестна, хотя сам подход применим к широкому кругу приложений. В [12, 52] предложен метод построения инвариантных эллипсоидов на основе уравнения Риккати. Среди первых работ, посвященных построению квадратичных функций Ляпунова для задачи робастной стабилизации, можно отметить [53–55]. Основная идея этих работ состоит в построении квадратичной функции Ляпунова для замкнутой системы, на основе чего синтезируется управление, которое оптимально подавляет влияние внешних возмущений. В более поздних работах был предложен подход, основанный на уравнениях Риккати (см. [56,57]). Метод построения квадратичных функций Ляпунова на основе выпуклой оптимизации был рассмотрен еще позднее (см. [58,59]).
В итоге были опубликованы несколько монографий, охватывающих основные результаты указанного подхода [14, 60]. В частности, монография [60] посвящена в основном именно методу эллипсоидов, при помощи которого получаются двухсторонние оценки достижимости. В работе рассмотрены методы построения и аппроксимации множеств динамических систем, а также применению этих методов для решения задач теории управления и оценивания.
Концепция инвариантности находит применение и во многих других областях (для подробностей см. [10]).
За рубежом активное изучение систем слежения (или сервомеханизмов) происходило в 40-50-е года XX века, что связано с востребованностью их практического применения для задач оборонно-промышленного комплекса. Сам термин «сервомеханизм» постепенно приобретал все более широкий смысл и стал применяться к очень широкому классу физических систем, что затрудняет формулировку универсального определения данного термина, подходящего под все случаи его употребления. Тем не менее, обычно сервомеханизмом называют устройство, содержащее усилители, преобразователи, исполнительный двигатель (сервомотор), цепь обратной связи и другие корректирующие цепи. Такое устройство совершает некоторую работу в соответствии с поступающим входным сигналом и тем самым влияет на выход системы. Среди ключевых работ по теории сервомеханизмов можно выделить [61–63]. В работе [64] (вероятно, впервые) употребляется термин «сервослежение» (в оригинале «servo tracking») впоследствии получивший широкое распространение. Изучение различных практических проблем, связанных с сервомеханизмами, продолжается и сейчас (см., например, [65,66]).
В теории управления подробно рассматриваются и изучаются различные свойства системы (устойчивость, управляемость, наблюдаемость). Было бы полезно и логично установить некоторый аналог таких понятий для задач слежения, позволяющий установить допускает ли система существование управления, которое может гарантировать слежение для любых начальных условий (или начальных условий, принадлежащих некоторому множеству) и под воздействием ограниченных внешних возмущений. Данное свойство получило название «отслеживаемость» системы («трассировка»,«trackability»). Оно исследуется, например, в [67]. Для синтеза следящего управления наиболее важным из различных свойств о возможности слежения системы является так называемая «естественная отслеживаемость» («natural trackability»). Оно устанавливает существование, возможность синтеза и описание следящего управления при отсутствии информации о векторе внешних возмущений (а значит, о самой математической модели).
Среди основных подходов к синтезу следящего управления можно выделить четыре - линейное следящее управление (Linear Tracking Control, LITC), следящее управление по Ляпунову (Lyapunov Tracking Control) и естественное следящее управление (Natural Tracking Control, NTC) и метод линейных матричных неравенств (который будет рассмотрен выше).
Основные особенности LITC рассматриваются в [67]. Основным недостатком данного подхода является то, что хотя возможность слежения гарантирована, не гарантируется достижение желаемого поведения системы за конечное время. Подход, основанный на применении векторных функции Ляпунова (англ. vector Lyapunov functions, VFL), был предложен независимо и практически одновременно В. М. Матросовым [68] и Р. Беллманом [69]. Прикладная ценность метода ВФЛ показана в работе Ф. Н. Бейли [70], в которой предложена идея исследования устойчивости сложных нелинейных систем на основе их декомпозиции и последующего оценочного агрегирования с применением ВФЛ. Векторные функции Ляпунова эффективно применялись для широкого класса задач (cм. например, [71, 72]). В работе [73] с использованием таких функций получены необходимые и достаточные условия устойчивости двумерной линейной динамической системы. Благодаря многочисленным исследованиям, это направление развилось в теорию устойчивости и управления для сложных (крупномасштабных) динамических систем, в том числе с распределенными параметрами, при структурных и сингулярных возмущениях. Основные аспекты указанной теории изложены в монографиях [74, 75], но данный подход не теряет актуальности и сейчас (см., например [76,77]).
Основным преимуществом другого подхода — естественного следящего управления (см., например, [78]) является отсутствие необходимости в информации о внутренней динамике системы, поскольку для синтеза управления используется лишь информация о векторе ошибки и реализовавшееся управление в предыдущий момент времени. Однако, данный подход применим не ко всем системам управления, не учитывает ограниченность управления и не гарантирует достижения желаемого поведения за конечное время.
Стоит отметить, что большинство результатов в различных разделах теории управления относятся к задачам регулирования. Задачи слежения представляют значительно более высокую сложность. Даже начальная задача точной оценки качества слежения робастной системы управления в условиях полной априорной информации о номинальной модели и верхних границах возмущений остается нерешенной во всех разделах за исключением 1-теории робастного управления. В работе [79] была получена точная оценка качества слежения для систем без внешних возмущений (при этом рассматривались неопределенности с конечной или затухающей памятью). В работе [80] было получено обобщение результатов на системы с ограниченными внешними возмущениями. Задача субоптимального робастного слежения в /і-постановке с априори известным задающим сигналом решена в [81], а с неполной априорной информацией в [82].
Непрерывное время
Подход на основе суммирования эллипсоидов В подходе, описанном в предыдущем разделе, не используется предположение, что слагаемые выхода — вектора и — являются независимыми. Рассмотренная постановка задачи и предлагаемый подход носят более общий характер и включают в себя указанный случай как частный.
Для демонстрации эффективности предлагаемого подхода рассмотрим стандартный подход к решению задачи (см., например, [112]), который состоит в следующем. Будем строить грубую оценку, получая искомый эллипсоид как сумму эллипсоидов для векторов и . Тогда, найдя ограничивающий эллипсоид для каждого из слагаемых, можно получить минимальный ограничивающий эллипсоид (в смысле который будет указан ниже) для выхода
Теперь определим минимальную матрицу эллипсоида , в котором содержится возмущение . Лемма 2.2. Возмущение , удовлетворяющее (2.2) содержится в эллипсоиде с матрицей Доказательство. Применяя лемму 2.1 при А = —6I,D = I, получим, что матрица инвариантного эллипсоида V удовлетворяет неравенству —2дV + av -\—I 0. а Откуда получаем V І. а(2д — а) Исследуя функцию 1\а) =ё а(2о — а) на минимум, находим, что минимальное значение достигается при а = 6. Лемма доказана.
Теперь сформулируем теорему, которая позволяет решить поставленную задачу посредством суммирования эллипсоидов.
Теорема 2.2. Решение задачи минимизации 1 Т 1 т tr —Е Е -\ С ЬС — min so1 1-е при ограничениях AS + SA + (5S + TED 0, S У 0, (2.8) где минимизация проводится по матричной переменной S = ST Є Wnxn и скалярным параметрам є Є (0,1) и /5 0 определяет матрицу ограничивающего эллипсоида R = Е Е Н С ЬС. для выхода системы (2.1). Доказательство. Применяя леммы 2.1 и 1.1 к системе (2.1) получаем, что ограничивающий эллипсоид для компоненты выхода Сх дается матрицей CTSC. При этом матрица инвариантного эллипсоида S удовлетворяет ограничениям (2.8). Тогда, применяя лемму 2.2 и суммируя полученные эллипсоиды при помощи утверждения 1.1, приходим к утверждению теоремы. Доказательство теоремы завершено. 2.1.2 Дискретное время
Рассмотрим линейную дискретную систему управления Xk+i = Axk + Dvk-, Zk = Cxk + Evk-, с начальным состоянием xo, где А є Шпхп, С Є Imxn, D є Шпхр,Е є Штхт,Хк Є W1 — фазовое состояние системы, Vk Є W1 — внешнее возмущение, удовлетворяющее Vk+i = Gvk + AWfc, ЦД ІІ 1? (2.10) где G — устойчивая по Шуру матрица, которая определяется условиями задачи, а AVk ЕШР — неизвестная ограниченная аддитивная компонента. Целью является поиск минимального ограничивающего эллипсоида (по одному из критериев из раздела 1.6), содержащий выход z системы (2.9). Вводя в рассмотрение вектор дк= Є М(п+р), Vk V к представим систему (2.9) в виде 0 9к + A D 0 0 О 9к+1 О G О У (2.11) Zk = (G EjQk = Сд Для доказательства основного результата нам понадобится следующая лемма. Лемма 2.3. Эллипсоид х = {xk Є Мп: х\Р 1х 1} является инвариантным для динамической системы Xk+i = Axk + Dwk-, \\wk\\ 1 тогда и только тогда, когда его матрица удовлетворяет ограничениям в виде линейных матричных неравенств
Применяя лемму 2.3 к (2.11), получим, что матрица инвариантного эллипсоида должна удовлетворять Так как инвариантный эллипсоид для системы (2.11) дается матрицей , то ограничивающий эллипсоид для выхода дается матрицей Доказательство теоремы завершено. Замечание 2.4. В данном разделе на матрицу квадратичной функции Ляпунова не накладываются дополнительные ограничения, т.е. матрица снова ищется в общем виде.
Продемонстрируем предложенный подход на примере видоизмененной задачи AC5 из стандартной библиотеки COMPleib, где
Замечание 2.5. Видоизменение задачи AC5 требуется, поскольку в исходной постановке матрица является неустойчивой. Легко видеть, что в случае неустойчивой матрицы инвариантным эллипсоидом для системы (2.1) будет все пространство. 0.8045 -0.8452 0.8452 37.64 При использовании стандартного подхода при = 0.2 следующую матрицу эллипса след которого равен 36.9390. При использовании предлагаемого подхода при G = -0.21 получим следующую матрицу Результирующие эллипсы изображены на рис. 2.1. Синим цветом изображен эллипс, полученный при решении задачи стандартным подходом, а красный цветом — эллипс, полученный при использовании предлагаемого подхода.
Рассмотрим линейную непрерывную систему управления х = Ах + Ви + Dv, х(0) = хо, (2.13) z = Сх + Ev где А є Жахп1В є Жпх\С Є Mmxn,D є Шпхр,Е Є МпХ:Р,ж( ) G Ки- фазовое состояние системы, it() Є М! — управление, v Є Шр — внешнее возмущение, такое что v = Gv + A, Д() 1, (2.14) где G Є Wxp — гурвицева матрица, которая определяется условиями задачи, а Aeff- неизвестная ограниченная аддитивная компонента. Целью является поиск минимального (по одному из критериев из раздела 1.6) ограничивающего эллипсоида, содержащего выход z.
Дискретное время
В настоящей главе исследуется задача слежения по состоянию линейной динамической системы управления. На задающий сигнал накладываются довольно «мягкие» ограничения, т.е. предполагается только ограниченность задающего сигнала и его производной, что позволяет рассматривать достаточно широкий класс задающих сигналов.
Некоторые результаты настоящей главы докладывались и обсуждались на Шестой Традиционной Всероссийской молодежной летней Школе (6-я ТМШ) «Управление, информация и оптимизация» (дер. Григорчиково, Московская область, 2014 г.).
Рассмотрим линейную непрерывную систему управления x = Ax + Bu + Df, ж(0) = жо, (3.1) где А є Mnxn,B є M.nxp,D є M.nxn,x(t) Є Шп — фазовое состояние системы, и ЕШР — управление, f(t) ЕШп — задающий сигнал, удовлетворяющий ограничениям / 1, Vt 0. (3.2) / Введем в рассмотрение составной вектор /) f 9 g = Є Ш . (3.3) Целью является поиск регулятора в форме так называемой комбинированной обратной связи (по рассогласованию и по задающему сигналу) в виде и = K\z + i 25S (3.4) где К\ є Шрхп, К2 Є Шрх2п, минимизирующего (по одному из критериев раздела 1.6) рассогласование z = х — f Є Шп. (3.5) Концепция комбинированной обратной связи восходит к работам [113, 114] и более подробно рассматривается в [115]. Используя (3.5), получим х = f + і = A(f + z) + w + D/, откуда і = Az + Ви + {А + D)f — f. (3.6) Система (3.6) представима относительно нового вектора состояния z в матричной форме і = Az + Ви + (Л + D, —/) g (3.7) Система (3.7),0 замкнутая регулятором (3.4), имеет вид і = [ВК\ + Л) z + (D + ВК2) д (3 8) относительно нового вектора фазового состояния z с возмущением д, которое по построению (в силу (3.2)) удовлетворяет условию ?() 1, \/t 0. (3.9) Основной результат Теперь сформулируем и докажем основной результат настоящего раздела. где минимизация проводится по матричным переменным Р = РТ Є Шпхп, Y є М.рхп, К2 Є Шпхп и числовому параметру а 0 , определяет матрицу Р инвариантного эллипсоида для системы (3.1) и матрицу расширенного регулятора по рассогласованию и по задающему сигналу который стабилизирует систему (3.8) и подавляет влияние всех допустимых возмущений д. Доказательство. Применяя лемму 2.1 для системы (3.8), получим, что матрица инвариантного эллипсоида Р должна удовлетворять (А + В КАР + Р(А + ВКА + аР -\—(D\ + BK2){D\ + ВК2) - 0, (3.12) а или, применяя лемму Шура, ( ( 4 + ВК\)Р + Р{А + ВК\)Т + аР Di + BK2\ - {D\ + ВК2) —OLI Вводя матричную переменную Y = К\Р приходим к утверждению теоремы. Доказательство теоремы завершено. Замечание 3.1. Решение задачи минимизации (3.10) при ограничениях (3.11) представляет собой задачу полуопределенного программирования (SDP) с одномерной оптимизацией по скалярному параметру а.
Замечание 3.2. Границы интервала варьирования параметра а заранее неизвестны. Отчасти это компенсируется тем, что целевая функция на тестовых примерах всегда оказывается выпуклой.
Как и в предыдущей главе, из инженерных соображений будем требовать выполнения ограничения на управляющее воздействие вида it() /i Vt 0. (3.13) Лемма 3.1. Выполнение ограничения (3.13) для системы (3.1) и регулятора (3.4) гарантируется выполнением условия p2I У К2 Ут єР К\ 0 (1 — е)І 0, (3.14) где Р = Рт Є Шпхп, У Є Шрхп, К2 Є Шпхп, при некотором 0 є 1. Доказательство. Заметим, что если вектор х содержится в эллипсоиде с матрицей Р, то согласно лемме 1.1 его линейный образ Кх содержится в эллипсоиде с матрицей КРКТ. Тогда, поскольку в силу (3.9) g Є Si, то K2g Є SK кт. Далее, в силу теоремы 3.1 z Є Ер, поэтому K1z Є ЕКІРКТ или K1z Є Еур- ут, так как Y = К1Р. В силу утверждения 1.1 вектор и = K1Z + K2g содержится в инвариантном эллипсоиде с матрицей 1 1 т 1 Т -УР У н к2к2. є 1 — є Соответственно, условие (3.13) представимо в виде 1 1 г 1 Т 2 -YP У -\ К2К2 р I є 1 — є Применяя лемму Шура дважды, приходим к утверждению (3.14). Доказательство леммы завершено. 3.1.2 Дискретное время Рассмотрим линейную дискретную систему управления k+i = k + k + k, (3.15) где є Шпхп, є M.nxp, є M.nxn,k Є Шп — фазовое состояние системы, k Є W — управление, k Є Шп — задающий сигнал, удовлетворяющий ограничению k ., 1, V = 0,1,2,... АЧ-1 Введем в рассмотрение составной вектор / k \ k-\-\ k о к = . k+1 Целью является поиск расширенного регулятора в форме обратной связи по рассогласованию и по задающему сигналу в виде = \k + 2к, (3.16) где \ є Wxn, 2 Є Шрх2п, минимизирующего (по одному из критериев раздела 1.6) рассогласование k-\-\ k+l k-\-\ t ІК. . Тогда k+l = k+1 + k+1 = {k + k) + k + k, откуда k+i = k + /; + ( + )/; — AH-I. (3.17) Представим систему (3.17) относительно нового вектора состояния zu в следующей матричной форме Zk+i = Azk + Buk + (А + D, —/) gk (3.18) 4 s/ Система (3.18), замкнутая регулятором (3.16), имеет вид zk+i = [ВК\ + A) Zk + (-Di + ВК2) gk (3.19) A D относительно нового вектора фазового состояния Zk с возмущением gk, которое удовлетворяет условию Цй Ц 1, V& = 0,1,2,... (3.20) Основной результат Теперь сформулируем и докажем основной результат этого раздела. Теорема 3.2. Решение Р, У, К2 задачи минимизации tr Р — min (3.21) при ограничениях BYAT + АРАТ + AYT Вт BY 0, Р У- 0, BY —Р a{D\ + ВК2 a{D\ + ВК2)Т —а(1 — а)1 (3.22) где минимизация проводится по матричным переменным Р = РТ Є Шпхп, Y є М.рхп, К2 Є Шпхп и числовому параметру 0 а 1, определяет матрицу Р инвариантного эллипсоида для системы (3.19) и расширенный регулятор в форме обратной связи по рассогласованию и по задающему сигналу (ур-1 2 ) стабилизирующий систему (3.19) и подавляющий влияние допустимых возмущений .
Дискретное время
Рассмотрим линейную непрерывную систему управления х = (А + АА)х + Ви + Df(t), х(0) = хо, z = f(t) — Сх, где А є Rnxn, В є Rnxp, С є Rlxn, D є Rnxl, x{t) є Rn - фазовое состояние системы, u(t) Є Rp — управление, z(t) Є Rl — выход системы. Пусть сигнал f(t) Є Rl удовлетворяет условиям (4.1), (4.2), а неопределенность АА имеет Ограничивающий эллипс и траектория системы (4.18). Начальная точка внутри инвариантного эллипсоида структуру АА = MA7V, (4.34) где М Є Mnxd, N є Wdxn — известные матрицы; неопределенность А є Wdxd удовлетворяет ограничению
Целью является построение расширенного регулятора К = (К\ К2 ) в форме обратной связи по состоянию и по задающему сигналу и = К\х + K2f\ (4.36) где Кі Є Rpxn, К2 Є Rpxl, который стабилизирует замкнутую систему и минимизирует (по одному из критериев из раздела 1.6) ограничивающий эллипсоид для выхода z.
Будем предполагать, что текущее значение сигнала f(t) известно, и поэтому можно его использовать для построения обратной связи. Рассмотрим расширенную систему х = (А + АА)х + Ви + Df, f = Aof + DQV z = f — Cx, (4.37) или, в виде, замкнутом регулятором (4.36), x = (A + AA + BK\)x + (BK2 + D)f, f = Aof + DQV z = f — Cx. (4.38) 102 Введя в рассмотрение составной вектор ( x\ f g = X G Rn+l, f представим систему (4.38) относительно вектора в следующем матричном виде / о \ Q + A + AA + BK\ D + _Bi 2 0 0 Ло 4 A D (4.39) z = f —С /] g Основной результат В следующей теореме устанавливается способ нахождения искомого регулятора для рассматриваемой системы, а также соответствующего ограничивающего эллипсоида. Теорема 4.5. Решение Р, Y задачи минимизации tr С PC — min при ограничениях ЛР + РА + аР Н—DD + із г + г В + рММ PN \ а I 0, Р - 0, -(31J (4.40) где (A D\ (В\ / 0 \ Ло 0 м / \ д , iV = (TV 0) , = 0 а минимизация проводится по матричным переменным Р = РТ Є к(«+0х(«+0, у Є К(рх(«+0, скалярному параметру а Ои скалярной переменной (3, опреде 103 ляет расширенный регулятор по состоянию и по задающему сигналу который стабилизирует систему и подавляет влияние допустимых помех измерений v(t) и матрицу СРСТ соответствующего ограничивающего эллипсоида для выхода системы (4.37). Доказательство. Применяя теорему 4.1 к замкнутой системе (4.39), приходим к задаче минимизации tr С PC — min при ограничении [А + А А + ВК\ D + ВК2\ (А + ДА + ВК\ D + ВК2\ Р + Р + AQ 0 AQ 1 / 0 \ / 0 \ + аР Н— 0. (4.41) а Do Do Представим (4.41) в следующем виде л г, г, лт г, 1 9=; f r АР + РА + аР Н—DD + + ВКР + РКВ + MANP + P7V AM 0, (4.42) где - /Л Р\ /Р\ / о \ _Д = .D == -LJ == AQ О О -—- /М \ / \ / А \ Af = , ./V = (TV 0 ) , Д = . 104 По лемме Питерсена матричное неравенство (4.42) выполняется, если существует число /3 такое, что АР + РА + аР Н—DD + ВКР + Piv із + рММ PN а 0. — [51 Вводя вспомогательную переменную Y = КР, приходим к ограничению (4.40). Доказательство теоремы завершено. 4.3.2 Дискретное время Xk+i = (А + AA)xk + Buk + Dfk, zk+i = fk — Cxk-, где А є Mnxn, В Є Rnxp, С є M/xn, L Є Rnxl, xk Є W1 - фазовое состояние системы, Zk Є Ш1 — выход системы, с начальным условием хо, щ Є W -управление. Пусть сигнал fk Є М! удовлетворяет условиям (4.7) и (4.8), а неопределенность АА имеет структуру АА = MAkN (4.44) где М є Wlxd1N є Wdxn — известные матрицы; неизвестная ограниченная аддитивная компонента Ak Є Wdxd удовлетворяет ограничению \\Ak\\ 1 V& = 0,1,2,... (4.45) Целью является построение регулятора К = К\ К2 в форме расширенной обратной связи по состоянию и по задающему сигналу Uk = K\Xk + Kzfk, (4.46) где Кг є Wxn, К2 Є Wxl, который стабилизирует систему (4.43) и минимизирует (по одному из критериев из раздела 1.6) ограничивающий эллипсоид для выхода Zk. 105 Введя в рассмотрение составной вектор k = Є М.п+ У к = 0,1,2,..., представим систему (4.43) в следующей матричной форме Л / о \ Do A + AA + BK\ D + BK i 0 9k+i = n . 9k + vk 0 AQ DQ A D (4.47) %k+\ —C I) 9k С Основной результат В следующей теореме устанавливается способ нахождения искомого регулятора для рассматриваемой системы, а также соответствующего ограничивающего эллипсоида. Теорема 4.6. Решение Р, Y задачи минимизации tr С PC min при ограничении I—аР + /ЗММТ РА + РКТВТ 0 -Р D PNT —(1 — а)1 0, Р У- 0, (4.48) PI где А A D AQ Б в о М = , 7V = f 7V 0 ) А /А\ 106 а минимизация проводится по матричным переменным Р = РТ Є R(n+lMn+l), у є Wx(n+l\ скалярному параметру а 0и скалярной переменной [5, определяет статический регулятор по состоянию К (К\ K Yp который стабизирует систему (4.47) и подавляет влияние всех допустимых помех измерений , и матрицу ограничивающего эллипсоида СРСТ для выхода системы (4.47). Доказательство. Воспользовавшись теоремой 4.2, приходим к задаче минимизации tr С PC min при ограничениях аР Р{А + АА + ВК\)Т т (А + - + BKi)P -Р D D - (1 - а)І 0. (4.49) Представим неравенство (4.49) в следующем виде - аР РА + РКТВт + PMAN -Р D -(1 - OL)I 0, (4.50) где А A D AQ В в о 0 М = , 7V = ( N 0 ) О А (А\ 107 Неравенство (4.50) равносильно —аР РА + РКТВТ -Р D —(1 — а) + + о А о NP О + 0 PNT А (Мт 0 0 ) 0. (4.51) Согласно лемме Питерсена, неравенство (4.51) выполняется, если существует такое, что —аР + /ЗММТ РА + РКТВТ 0 -Р D PNT —(1 — а)1 О — /31 0. Вводя вспомогательную переменную Y = КР, приходим к ограничениям (4.48). Доказательство теоремы завершено. 4.4 Выводы В предыдущей главе рассмотрены ряд постановок задач слежения по состоянию линейной динамической системы управления и предложены подходы к их решению. В настоящей главе рассматривалась более сложная задача — задача слежения по выходу линейной динамической системы. По сравнению с предыдущей главной изменились ограничения на задающий сигнал — теперь предполагается, что задающий сигнал удовлетворяет дифференциальному уравнению, в котором присутствует неизвестная, но ограниченная помеха измерений. Развитые методы (как и во второй и третьей главах) основаны на методе инвариантных эллипсоидов и технике линейных матричных неравенств. Были предложены методы решения: 108 1. задачи анализа для задачи слежения по выходу системы для непрерывного времени; 2. задачи слежения по выходу системы для непрерывного времени; 3. робастной задаче слежения (в системе присутствует структурная неопределенность специального вида) по выходу системы для непрерывного времени; 4. аналог задач из пунктов 1-3 в случае дискретного времени. Реализуемость, работоспособность и эффективность предлагаемых подходов продемонстрирована проведением численных экспериментов на примере управления двухмассовой системой.
В диссертационной работе исследуются задачи синтеза управления при воздействии неизвестных, но ограниченных внешних возмущений, а также слежения по состоянию и по выходу линейной динамической системы управления и предлагаются методы их решения, основанные на технике линейных матричных неравенств и концепции инвариантных множеств. Использование указанного подхода позволяет сводить поиск регулятора к задаче полуопределенного программирования с ограничениями в форме линейных матричных неравенств и одномерной оптимизации, которые эффективно решаются численно.
В первой главе приводится исторический обзор возникновения техники линейных матричных неравенств и ее применения к различным задачам теории управления, а также рассмотрены ключевые особенности метода инвариантных эллипсоидов. Во второй, третьей и четвертых главах предложены методы решения: