Содержание к диссертации
Введение
1 Предварительные сведения
1.1 Анализ существующих работ по управлению сетевыми динамическими системами 9
1.2 Вспомогательные результаты 16
1.2.1 Сведения из теории графов 16
1.2.2 Свойства кронекерового произведения матриц 18
1.2.3 Лемма Якубовича-Калмана 19
1.2.4 Метод пассификации 20
1.2.5 Метод скоростного градиента в задачах децентрализованного управления 21
2 Децентрализованное управление взаимосвязанными объектами
2.1 Постановка задачи управления идентичными объектами . 24
2.2 Синтез управления 25
2.3 Условия достижения цели управления 27
2.3.1 Случай липшицевых нелинейностей 27
2.3.2 Случай (р0(х{) = Вф0(у{) 32
2.3.3 Синхронизация при условиях согласованности 35
2.4 Постановка задачи управления неидентичными объектами . 38
2.5 Структура адаптивного регулятора 39
2.6 Условия достижения цели управления 39
2.7 Пример. Сеть цепей Чуа 42
2.7.1 Описание и анализ системы 42
2.7.2 Результаты численного моделирования 46
3 Сетевое управление по измерениям выходов систем
3.1 Постановка задачи 48
3.2 Условия достижения цели управления в случае сбалансированного информационого графа 49
3.3 Условия достижения цели управления в случае несбалансированного информационного графа 53
3.4 Условия достижения цели управления в случае неориентированного информационого графа 54
3.5 Пример. Сеть двойных интеграторов 54
3.5.1 Результаты численного моделирования 55
Заключение 58
Список иллюстраций 60
Список литературы 61
- Свойства кронекерового произведения матриц
- Условия достижения цели управления
- Структура адаптивного регулятора
- Условия достижения цели управления в случае несбалансированного информационного графа
Введение к работе
Актуальность темы. Математические задачи управления в сетях динамических систем активно исследуются в последнее десятилетие. Это связано с наличием широкого класса приложений, в числе которых задачи управления движением групп мобильных роботов, синхронизации в энергосистемах, управления беспилотными летательными аппаратами, управления флотилиями автономных судов и т.п. Задачи управления в сетях характеризуются требованиями полной или частичной децентрализованности регуляторов, естественно следующими из описания реальных сетевых объектов, а также ограничениями на возможности измерения и управления при построении регуляторов. Синтез регуляторов, обеспечивающих желаемое поведение объектов в направленных сетях (т.е. описывающихся с помощью ориентированных графов), является более сложной задачей по сравнению с такой же задачей в ненаправленных сетях, ввиду уменьшения информационного трафика.
Задачи управления сетями исследовались в работах А.А. Воронова, Б.М. Миркина, А.Л. Фрадкова, Д.Д. Сильяка, P.M. Мюррея и многих других авторов. Несмотря на большое количество публикаций по этой тематике, пока решен лишь ограниченный класс таких задач, поскольку они затруднены сложностью и пространственной распределенностью объектов сетей, а также ограничениями на обмен информацией между ними.
В некоторых работах предполагается доступность для измерения всего состояния отдельного объекта сети, а также вхождение управления во все уравнения подсистем, либо предлагается использование наблюдателей. Подобные предположения являются ограничительными при практической реализации систем регулирования, особенно при большой размерности пространства состояний объектов и (или) большом количестве этих объектов в сети.
Целью работы является синтез регуляторов, обеспечивающих сходимость между собой решений динамических систем, образующих сети, при неполных измерениях и управлениях для различных случаев.
Методы исследований включают методы пассификации и скоростно-
4 го градиента в задачах децентрализованного управления, предложенные А.Л. Фрадковым, а также частотную теорему (лемма Якубовича-Калмана). Научную новизну работы составляют следующие результаты.
Синтезированы децентрализованные адаптивные регуляторы для сетей, состоящих из взаимосвязанных объектов в форме Лурье. Получены условия достижения цели управления, заданной как сходимость решений всех подсистем и решения ведущей подсистемы в следующих случаях: случай глобально липшицевых нелинейностей, случай обобщенно монотонных нели-нейностей, случай согласованности структуры структуры подсистем сети со структурой лидирующей подсистемы.
Синтезирован децентрализованный адаптивный регулятор для сетей, состоящих из неидентичных взаимосвязанных объектов в форме Лурье. Получены условия достижения цели управления, заданной как сходимость решений всех подсистем и решения ведущей подсистемы для случая согласованности структуры подсистем сети с лидирующей подсистемой.
При помощи метода пассификации найдены условия достижения синхронизации по выходу в сетях линейных объектов при неполных измерениях и управлениях с помощью статических регуляторов без построения наблюдателей.
Теоретическая и практическая ценность. Для сетей идентичных и неидентичных систем Лурье с помощью метода скоростного градиента синтезированы адаптивные регуляторы при неполных измерениях и управлениях, не использующие информации о параметрах объектов сети и применимые в условиях неопределенности. Для различных случаев получены условия достижения цели управления в замкнутой системе, отличающиеся от известных использованием леммы Якубовича-Калмана и теоремы о пассификации. Условия достижения цели управления могут быть сформулированы в терминах входящих степеней вершин графа связей сети. На основе метода пассификации найдены достаточные условия достижения цели управления в сетях линейных объектов, отличающиеся от известных использованием статических регулято-
5 ров при неполных измерениях и управлениях, а также без построения наблюдателей. Полученные результаты могут быть использованы на практике: для расчета и построения систем управления группами мобильных роботов.
Апробация работы. Полученные результаты докладывались и обсуждались на семинарах кафедры теоретической кибернетики, V Всероссийской межвузовской конференции молодых ученых в СПбГУ ИТМО (диплом за лучший доклад аспиранта на секции) в 2008 г., Балтийской олимпиаде по автоматическому управлению в 2008 г., 3rd IEEE Multi-conference on Systems and Control (2009), 4th International Conference on Physics and Control (PhysCon 2009), международной научно-технической конференции " Многопроцессорные вычислительные и управляющие системы" (МВУС 2009) и на XII конференции молодых ученых "Навигация и управление движением С.-Петербург, 2010 г.
Публикации. Основные результаты работы опубликованы в работах [1—5]. Работа [1] является публикацией в издании из перечня ВАК.
Работы [1,3,4,5] написаны в соавторстве. В этих работах Джунусову ПА. принадлежит формулировка и доказательство теорем о достижении цели управления, имитационное моделирование, Фрадкову А.Л. общая постановка задачи, синтез структур децентрализованных регуляторов. В работе [3] Р. Ортеге принадлежит замечание о замене условий монотонности нелинейности на условие локальной ограниченности при введении внеинтегрального члена в адаптивный регулятор.
Структура и объем работы. Диссертация объемом 68 страниц состоит из введения, трех глав, заключения и списка литературы (59 наименований).
Свойства кронекерового произведения матриц
В данном разделе приводятся условия строгой пассивности линейных систем. Рассмотрим линейную стационарную систему: где х Є Ш.п:у Є М!,и Є Шт. Сформулируем лемму Якубовича-Калмана (частотная теорема) [16] в следующей форме. Лемма 1. Пусть и Є Mm,x(s) = CT(sIn — A) lВ, rank В = т. Тогда следующие два условия эквивалентны: 1) существует положительно определенная матрица Н = НТ 0 та кая, что 2) полином det(sln — А) гурвицев и выполняются частотные неравен ства для всех ш Є R\ и Є Rm, и ф 0. В данном разделе приводится метод пассификации линейных систем [13]. Даны комплексные матрицы А, В, С, G, R порядков nxn,nxm,nxl,lx 7тг, п х п соответственно (т п,1 п), причем R = R 0. Под "звездочкой "понимается знак эрмитова сопряжения матриц. Требуется найти условия существования эрмитовой п х п матрицы Н = Н 0 и комплексной I х т-матрицы в таких, что причем Случай, когда все матрицы A,B,C,G,R вещественны называется вещественным случаем. Обозначим1: Определение 1. Пусть W(s) - тхт-матрица правильных рациональных функций, S(s) - наименьшее общее кратное знаменателей элементов W(s). Пусть s— oo Матрица называется минимально-фазовой, если (p{s) - гурвицев многочлен. Матрица W(s) называется строго минимально-фазовой, если она минимально-фазовая, а матрица Г неособая: detr ф 0. Матрица называется гипер-минимально-фазовой, если она минимально-фазовая, а матрица Г - эрмитова и положительно определенная.
В следующей лемме дается решение поставленной задачи. Лемма 2. Для существования матриц Н = Н 0 и 9, удовлетворяющих (1.8)-(1.10) и вещественных в вещественном случае, достаточно, а если ранг В равен га, то и необходимо, чтобы матрица G x(s) была гипер-минималъно-фазовой. В дальнейшем понадобится определение гипер-минимально-фазовой функции. Определение 2. Пусть W(s) — (3(s)/a(s),z Є С правильная рациональная функция, (3(s), a(s) - вещественные полиномы. W(s) называется минимально-фазовой, если ее числитель f3(s) является гурвице-вым многочленом. W(s) называется гипер-минимальпо-фазовой, если она минимально-фазовая, а число lims__ +00 sW(s) положительно. Замечание 1. В качестве 9 в (1.10) мосисно брать 9 = — c-G, где число х 0 достаточно велико [15, 31]. В данном разделе приводится постановка задачи децентрализованного управления и теорема, устанавливающая свойства алгоритма скоростного градиента в задачах децентрализованного управления, см. [15]. Рассмотрим систему S, состоящую из / взаимодействующих подсистем Si, динамика каждой из которых описывается уравнением где ХІ Є Ш.Пі - вектор состояния, 9І Є Шті - вектор входов (настраиваемых параметров) подсистемы, х = col(xi,... ,х{) Є K.n, 9 = col(0i,... ,9{) Є Шт - совокупные векторы состояния и входов системы, п — Х)пг т = Y mi-Вектор-функция Fi(-) характеризует собственную динамику подсистемы Si, а вектор hi(-) описывает связи (взаимодействия) между подсистемами. Пусть для Si задана целевая функция Qi(xi, t) и цель управления состоит в выполнении соотношений: считаем Qi(Xi(t),t) = 0, где х\ = argmin . Qi(xi,t). Децентрализованный алгоритм скоростного градиента имеет вид где ТІ = Tj О, ті х ті - матрица. Сформулируем условия достижения цели (1.12) в системе (1.11), (1.13). Лемма 3. Пусть выполнены следующие группы условий. 1. Функции Fi(-) непрерывны по Xi,t, непрерывно дифференцируемы по 9і и локально ограничены по t 0; функции ШІ(ХІ, 6 г-, t) выпуклы по 9f, су ществуют векторы 9 Є Жті и скалярные непрерывные возрастающие функции Kj(Q), pi(Q) такие, что (0) = рДО) — 0, Ki(Q) — +оо при Qi — -boo
Условия достижения цели управления
Рассмотрим вещественные матрицы Н — Нт 0уд,9 порядков п х n,l х 1,1 х 1 соответственно и число р 0 такие, что: НА, + А1Н -рН, НВ = Сд, A» = (A + LJn) + Б СТ. (2.8) Обозначим через Amin(iJ) и Amax(il) минимальное и максимальное собственные числа матрицы Н, через A = Amax(iJ)/Amin(iJ) - число обусловленности матрицы Н. Сделаем следующее предположение, основываясь на котором будем исследовать синхронизируемость. А1) Функции (ро(-) и (fij(-),i = 1,..., d, j = 1,... ,d, глобально липшице-вы: В случае, если числитель функции gTx(s L) гурвицев, будем обозначать через р его степень устойчивости. В следующей теореме формулируются достаточные условия синхронизации. Теорема 1 [6, 36]. Пусть для каждого Є Н выполнено предположение А1, и для некоторого g М.1 функция grx(s — L) гипер-минимально-фазовая, где передаточная функция x(s) = CT(sIn—А) 1В. Тогда существуют такие Н = НТ 0, # порядков п х п,1 х 1 и положительное р, что выполнены (2.8). Пусть при этом для каждого і = 1,... ,d выполнено неравенство где 7 = /э /(4(2А ). Тогда для каоїсдого ЄЗ иг = 1,... ,d адаптивное управление (2.6); (2.7) обеспечивает достижение цели при этом вектор настраиваемых параметров 9{ остается ограниченным на [0,оо) для всех решений замкнутой системы (2.1), (2.2), (2.7), (2.6). Замечание 2. Будем понимать под графом связей сети S ориентированный граф, состоящий из множества вершин и множества дуг; эти множества определим следующим образом. Множество вершин имеет мощность d, где г-я вершина означает г-ю подсистему S{.
Дуга из г-й вершины к j-й вершине принадлежит множеству дуг, если ipji 0. Для каэюдого г, j = 1,... ,d дуге из j-й вершины к г-й вершине присвоим вес \aijLij\. При таком определении весов условие (2.9) означает, что для каждой вершины ее входящая степень меньше числа 7 Доказательство теоремы 1. Для доказательства понадобятся два вспомогательных результата: лемма о пассификации (лемма 2 из раздела 1.2.4) и лемма о свойствах алгоритма скоростного градиента в задачах децентрализованного управления (лемма 3 из раздела 1.2.5). Рассмотрим первую группу условий леммы 3. Условие локальной ограниченности по t 0 выполняется, так как для каждого і = 1,... ,d правая часть системы (2.4) и функция Q(zi) есть гладкие функции, независящие от t. Условие выпуклости обеспечивается линейностью по в І правой части выражения (2.5). В качестве функций рі(-),і — 1,... ,d, фигурирующих в лемме 3, будем брать одну и ту же линейную функцию Q — р Q. Покажем, что условие существования 9 Є Iі и р таких, что 0 ( ,0 ) —pQ(zi), обеспечивается гипер-минимально-фазовостью функции gTx(s)- Действительно, согласно лемме 2 гипер-минимально-фазовость функции gTx{s) обеспечивает существование Н — Нт 0и таких, что НА + А1Н О, НВ = Сд, где A = (A + L/n) + 0JCT. Тогда Wi( , # ) zJH[(A + L/n) + В0 СГ\ъ = і ггт[ЯЛ, + ІОД , г = 1,..., d. Поскольку НА + А+Н отрицательно определена, то существует положительное число р такое, что НА + А$Н — рН, что и обеспечивает условие (1.14) uji{zi,e ) -pQ(zi), і = 1,..., d. Перейдем к условиям на взаимосвязи подсистем (вторая группа условий леммы 3). В рассматриваемом случае они выглядят следующим образом: d d I VZiQ(zi)T 2 ai№j(zi - Zj)\ 2 &зР Q(ZJ)I г = 1,..., d, (2.11) где матрица M — I гурвицева, M = {faj}, fiij 0, I - единичная матрица. При d = 1 можно взять /ЛЦ = 1/2 и неравенство (2.11) будет выполнено. Рассмотрим случай d 1.
Перепишем (2.11): d d \Z1H otijifijizi - Zj) І /іу Я -, г = 1,..., d. (2.12) і Оценим величину, стоящую в левой части (2.12): d 52 \zIH Xi№j(zi - zo)\ = 3=1 d d = 52 IQ«I \г1Н(р г - ZJ)\ 52 KI \\zJH\\ \\Lij(zi - ZJ)\\ = 3=1 i=i d d = Y\aijLij\ Ікт#ц 11-ZJ\\ 2\aijLij\ \Ы\ \\HW \\zi -гз\\ d 52 K- l \\н\\ (Ы12 + INI \\Zj\\) 3=1 d X]lai yl Атах(я)" (INI2 + INI ll-zyll), і = 1,...,d. 3=1 Теперь оценим снизу правую часть (2.12): d d d 2 52 3zlHz3 \ - HijZjHZj - 52 3 тіп(Я) 2, І = 1, . . . ,d. 3=1 3=1 Таким образом, для каждого і — 1,..., d достаточно потребовать выполнения неравенства d d 52 laVLvl Лтах(#) (кг2 + \\zt\\ Zj) Лшп(Я)1Ы2, 3=1 3=1 или для каждого і = 1,..., d неравенства E l r І ЛІ Il2 , И \ - P Xmin{H) -v .. 2 , ч 1] (INI + INI 1Ы) Т 777r2 INI 13) Обозначим С = р/{атах 2А ), где d тах — Шах jQIjo i/jjl . i:l i d —» І=1 Замечая, что р в (2.8) может быть выбрано сколь угодно близким к р , и принимая во внимание (2.9), можно заключить, что ( 2d. Левая часть неравенства (2.13): d Jij Y1 \аізь d ZiW1 + \\zi\\ \\zA\) o"=i ij\ (INI2 + NI-№ maJ3rf 2 + ; 2j, і = 1, .d. Таким образом, если для каждого г = 1,..., d выполнено следующее неравенство, то выполнено и (1.15) из формулировки леммы 3: d d 3=1 3=1 Введем d x d матрицу M = {/%} следующим образом (2.14) / \ /ІЦ Ml2 Mid i=3\ №d M21 / 22 M Hij +1), 2C \ Mdl Md2 № у Такой выбор матрицы М обеспечивает выполнение (2.14). Заметим, что матрица М симметрическая. Если матрица М — I положительно определена, то матрица 1-М гурвицева. Диагональные элементы 1-М положительны, поскольку d 1 и С 2d. Принимая во внимание следующее неравенство
Структура адаптивного регулятора
Рассмотрим вещественные матрицы Н = Нт 0,д размеров п х n, I х 1 соответственно и число р 0 такие, что: Обозначим через Л = \max(H)/\min{H), как и ранее, число обусловленности матрицы Н, где Хтах(Н), Хт{п(Н) - максимальное и минимальное собственные значения матрицы Н. Сделаем следующие предположения. А1) Функции (fij(-),i = 1,..., d, j — 1,..., d глобально липшицевы: а функция фо(-) такова, что обеспечены существование и единственность решений (2.27). А2)(Условия согласованности) Для каждого Є и. і = 1,... ,d существуют векторы Vi — щ() Єі и числа в І — #г(0 0 такие, что выполнены следующие равенства Обозначим x(s) = CT{sln — AL) 1 BL. Если матрица AL гурвицева, введем обозначение р для степени устойчивости знаменателя gTx(s)i т-е где Xk(Ai) - собственные числа AL. В следующей теореме приводятся достаточные условия синхронизируемо-сти.
Определение -монотонно убывающей функции, фигурирующей в формулировке, введено в разделе 2.3.2. Теорема 4 [7, 29, 30]. Пусть матрица AL гурвицева и для некоторого g Є Ш1 выполняются следующие частотные неравенства: для всех о; Є К.1. Тогда существуют такие Н — НТ 0 и р 0, что выполнены соотношения (2.32). Пусть для каждого Є S выполнены предположения Al, А2, функция фо(-) является g-монотонно убывающей, и выполнены следующие неравенства где 7 = P /(,4d\ ), а А - число обусловленности матрицы Н. Тогда для каждого Є Hui = 1,..., d адаптивное управление (2.30), (2.31) обеспечивает достижение цели управления (2.29) и ограниченность вектора подстраиваемых параметров Ti(t) па [0, оо) для всех решений замкнутой системы (2.27), (2.28), (2.30), (2.31). Доказательство теоремы 4. Для доказательства понадобится лемма Якубовича-Калмана (частотная теорема) [16] в той форме, которая приведена в разделе 1.2.3 (лемма 1). Заметим, что в рассматриваемом случае m = 1, т. е. и скалярно, и в (1.7) вместо С возьмем С д. Тогда условия леммы 1 и теоремы 3 обеспечат существование матрицы Н = Нт 0 и числа р 0 таких, что Обозначив Zi = ХІ — х, введем вспомогательные подсистемы (ошибок): здесь управление щ{Ь) то же самое, что и в (2.30). Выберем следующие целевые функции Qi(zi) = TjzJHzi, и применим теорему 3 из раздела 1.2.5.
Вычислим производные функций Qi(zi) вдоль реше ний изолированных (т.е. без взаимосвязей) вспомогательных систем (2.37): иг(хих,тг) = zj #[Д- +В;тДг) (г)+,ВДо W-ALx-Вь(й+ф0(у))}. (2.38) Обозначим т — СОІ(І І, 6{), г = 1,..., d. Беря т\ — т , і = 1,..., с?, получаем ШІ(ХІ,Х, ц) = zjH[AiXi + ВІ{ЩСТХІ + 0iu)+ + Вьфоіуі) - ALx - BLu - Вьф0(у)} = = zjH[ALXi + BLu + Вь(ф0{уі) - MV)) - АЬХІ - BLu] = = 2?#[AL + Вь(ф0(уі) - МУ))]-Далее, для і — 1,..., (і г?НВЬ(фо(Уг) - MV)) = ТС (-0о(Уг) «)) = (Ї/І - у)тд(ФоШ - ФоШ о. Последнее неравенство выполнено поскольку функция Ы") является ?-монотонно убывающей. Таким образом, aji(xhx,T ) -zJ(HAL + AlH)zi. Принимая во внимание (2.36), заключаем, что Ші(хих,Ті) 5 -pQi(zi). Повторив далее доказательство теоремы 1, получим требуемое. Цепь Чуа является хорошо известным примером простой нелинейной системы, имеющей сложное поведение [54], при этом система имеет форму Лурье. При некоторых параметрах траектории системы Чуа неустойчивы, хотя и ограничены. Применим теорему 2 к синхронизации в сети взаимосвязанных систем Чуа. Будем моделировать цепь Чуа в безразмерной форме с внешним входом й следующим образом:
Условия достижения цели управления в случае несбалансированного информационного графа
Пусть выполнено предположение А1, тогда нулевое собственное число ла-пласовской матрицы L имеет единичную кратность. Приведем лапласовскую матрицу L к жордановой форме считая, что первый столбец неособой матрицы Р равен drl/2X. Обозначим через її левый собственный вектор соответствующий нулевому собственному числу лапласовской матрицы L, такой, что l\d ll2l — 1. Вектор-строку коэффициентов усиления К закона управления (3.2) будем брать в таком виде: Теорема 6. Пусть выполнены предположения Al, А2 и Ае + Л 0. Тогда для к таких, что управление (3.2) с вектором коэффициентов усиления (3.12) обеспечивает выполнение цели (3.3) с вектором c(t) = d 1l2eAt{li 8 1п)х(0). Доказательство аналогично доказательству теоремы 5. Сформулируем условия достижения цели управления в случае, когда информационный граф Q неориентирован и выполнено следующее предположение. A3) У неориентированного графа Q есть остовное дерево. Как известно, это предположение эквивалентно связности графа Q. Таким образом, при выполнении этого предположения кратность нулевого собственного числа лапласовской матрицы L = L(Q) будет равна единице. Обозначим собственные числа матрицы L так: 0 = Х\(Ь) \2(L) ... Ad(L). В следующей теореме приводятся условия достижения цели управления в случае неориентированного информационого графа. Теорема 7.
Пусть выполнены предположения А2, A3. Тогда для к таких, что управление (3.2) с вектором коэффициентов усиления (3.6) обеспечивает выполнение цели (3.3) с вектором c(t) = d 1l2eAt(Xrd g Іп)х(0). Доказательство аналогично доказательству теоремы 5. Рассмотрим сеть S, состоящую из четырех подсистем Si,г = 1,... ,4. Пусть для каждого г = 1,...,4 подсистема Si описывается следующим уравнением: Предположим, что орграф Q, описывающий информационные связи в сети, сбалансирован и имеет вид, приведенный на рис. 3.1. Лапласовская мат-рица графа Q имеет следующие собственные числа: 0,2,2,4. Применим теорему 5. Передаточная функция является гипер-минимально-фазовой при д = 1. Нетрудно показать, что число УС из (3.5) можно брать так: ус 1. Таким образом, по теореме 5, при k 1 регулятор (3.2) с вектором-строкой коэффициентов усиления (3.6) обеспечивает достижение цели (3.3). Пусть подсистемы имеют следующие начальные данные 1. Синтезированы децентрализованные адаптивные регуляторы для сетей, состоящих из взаимосвязанных объектов в форме Лурье, и получены условия достижения цели управления в виде стремления траекторий всех подсистем к траектории ведущей подсистемы в в следующих случаях: случай глобально липшицевых нелинейностей, случай с обобщенно монотонными нелинейностями, случай согласованности структуры структуры подсистем сети с лидирующей подсистемой. 2. Синтезирован децентрализованный адаптивный регулятор для сетей, состоящих из неидентичных взаимосвязанных объектов в форме Лурье, и получены условия достижения цели управления в виде стремления траекторий всех подсистем к траектории ведущей подсистемы для случая согласованности структуры подсистем сети с лидирующей подсистемой. 3.
При помощи метода пассификации найдены условия достижения синхронизации по выходу в сетях линейных объектов при неполных измерениях и управлениях с помощью статических регуляторов без построения наблюдателей. , подтверждающие теоретические результаты.