Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Задачи достижимости и синтеза управлений для гибридных систем Точилин Павел Александрович

Задачи достижимости и синтеза управлений для гибридных систем
<
Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем Задачи достижимости и синтеза управлений для гибридных систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Точилин Павел Александрович. Задачи достижимости и синтеза управлений для гибридных систем : диссертация ... кандидата физико-математических наук : 01.01.02 / Точилин Павел Александрович; [Место защиты: Моск. гос. ун-т им. М.В. Ломоносова].- Москва, 2008.- 110 с.: ил. РГБ ОД, 61 09-1/475

Содержание к диссертации

Введение

1 Достижимость и верификация в гибридных системах . 18

1.1 Гибридная система 18

1.1.1 Описание модели 18

1.1.2 Классы допустимых управлений 20

1.1.3 Траектория гибридной системы 21

1.1.4 Дополнительные ограничения на параметры системы 22

1.1.5 Кусочно-линейная система с переключениями 23

1.2 Множество достижимости и задача верификации 24

1.2.1 Постановка задачи 24

1.2.2 Дискретная история траектории гибридной системы 25

1.2.3 Свойства множества достижимости 28

1.2.4 Решение задачи верификации 30

1.2.5 Метод динамического программирования. Функции цены 31

1.2.6 Решение задачи верификации с помощью функций цены 38

1.2.7 Об эллипсоидальной аппроксимации множества достижимости 39

1.2.8 Примеры построения аппроксимации множества достижимости 46

2 Задача синтеза управлений для гибридной системы. 50

2.1 Слабо инвариантное множество 50

2.1.1 Дискретная история траектории гибридной системы. Представление слабо инвариантного множества в виде композиции одношаговых операторов 51

2.1.2 Функции цены для слабо инвариантного множества 53

2.2 Решение задачи синтеза управлений при помощи функции цены 57

2.3 Об эллипсоидальной аппроксимации слабо инвариантного множества 70

3 Примеры. 75

3.1 Пример в К2. Моделирование движения бильярдного шара 75

3.1.1 Описание математической модели 75

3.1.2 Эффект Зенона 80

3.1.3 Квазипериодические траектории 81

3.2 Пример в R3. Задача управления шариком, скачущим на вращающейся плоскости 85

3.2.1 Описание математической модели

3.2.2 Задача управления траекторией гибридной системы 90

3.2.3 Функции цены и уравнения Гамильтона-Якоби-Беллмана 91

3.2.4 Оптимальное управление 97

3.2.5 Примеры 98

Заключение. 103

Библиография 104

Введение к работе

Данная работа посвящена анализу математических моделей сложных процессов, относящихся к числу так называемых гибридных. Они представляют собой математические модели систем управления, в которых непрерывная динамика, порождаемая в каждый момент времени одной из априорно заданного набора непрерывных систем, перемежается с дискретными операциями, подающими команды либо на мгновенное переключение с одной системы на другую, либо на мгновенную перестройку с заданных текущих координат на другие координаты, либо на то и другое одновременно. Таким образом, гибридная динамика системы заключается в альтернированной комбинации непрерывной динамики с дискретной, скачкообразной. Непрерывная и дискретная составляющие системы могут включать некоторые параметры, влияющие на поведение системы. Значениями части таких параметров - управлений можно распоряжаться, значения же других параметров -помех или неопределенностей формируются в результате функционирования сложных, плохо формализованных механизмов, либо являются результатом погрешностей, допущенных при математическом моделировании.

Гибридные системы часто встречаются в различных прикладных задачах из таких областей знания, как автомобилестроение [65], авиастроение [4], робототехника [33], электроэнергетика [69], обеспечение безопасного движения в пространстве [37], [66], [70] на суше [56], [75], на воде и др. Математическая модель гибридной системы возникает каждый раз, когда необходимо исследовать взаимодействие среды, непрерывно изменяющейся в соответствии с некоторыми физическими законами, и управляющих элементов, срабатывающих в дискретные моменты времени. Примерами таких комплексов могут служить электронные системы автоматического управления самолетом, либо автомобилем, системы автоматического регулирования температуры, влажности в помещении и др. Возможности подобных систем проявляются шире, чем обычных.

Гибридная система может быть получена также при кусочно-линейной аппроксимации сложной нелинейной системы дифференциальных уравнений. Решение различных задач

управления для нелинейной системы, таким образом, может быть аппроксимировано решениями аналогичных задач для гибридной системы.

По-видимому, в силу чрезмерной широты охвата, не следует концентрироваться на поисках удовлетворительной универсальной модели гибридной системы и устоявшейся системы обозначений, используемых при её описании. Тем более, что каждый класс моделей гибридной системы был, как правило, мотивирован конкретными видами прикладных задач. Различные представления для моделей гибридных систем приведены, например, в [10], [25], [32], [41], [42], [54], [59], [60], [74].

Исследование гибридных систем и решение для них различных задач управления расширяет область применения соответствующей математической теории. Для гибридных систем могут быть сформулированы различные известные задачи оптимального управления, достижимости и верификации, темы исследования на устойчивость, новые задачи стабилизации, идентификации и др. В связи с гибридными системами возникает также множество новых постановок, требующих оригиншіьноп модификации известных ранее методов, в которых могут соединяться элементы разных математических дисциплин (в частности, теории дифференциальных уравнений, математической логики, теории конечных детерминированных автоматов), равно как и вновь придуманных математических средств.

Среди классических задач теории управления, поставленных для гибридных систем, значительные результаты были получены в решении задач стабилизации [34], [42], [64], [68], а также в ряде задач оптимального управления. Данным вопросам посвящены работы M.S. Branicky, М. Johansson, S. Sastry. Стоит отметить работу [32], в которой для решения задачи оптимального управления гибридной системой были выведены квазивариационные неравенства для специально сконструированной функции цены. В работах J. Lygeros [36], [37] рассматриваются задачи управления для стохастических гибридных систем.

В данной работе рассматриваются задачи достижимости, верификации и синтеза управлений для гибридной системы.

Задача достижимости состоит в построении множества достижимости гибридной системы, состоящем из всевозможных состояний системы, в которые можно перейти при помощи соответствующего допустимого управляющего воздействия из фиксированного в заданный начальный момент времени состояния (или множества таковых). Эволюцию множеств достижимости описывает трубка достижимости.

К задачам достижимости примыкают задачи верификации, в которых необходимо узнать, может ли анализируемая система попасть (или, наоборот, не попасть) в одно из

"предписанных" состояний ("желательных" или "нежелательных"). Такая постановка задачи может быть обусловлена, например, проблемами обеспечения безопасности движения в пространстве.

Задачи достижимости и верификации для гибридной системы рассматривались, в частности, в работах Е. Асарина, J. Lygeros, С. Tomlin и др.: [10], [55], [57], [65], [72]. В работах [27], [29] для их решения были применены геометрические методы. В работе [10] предложены схемы, основанные на разработанном ранее эллипсоидальном исчислении [45], [47[. Применение данной техники позволит построить для гибридных систем конструктивную теорию, направленную на решение задач достижимости и верификации "до конца", т.е. до практически реализуемого алгоритма.

Центральной в теории управления является, как известно, задача синтеза управлений, которая состоит в построении входного воздействия, переводящего систему в предписанное конечное состояние из фиксированного множества начальных состояний. При этом управление в задаче синтеза является позиционным, то есть зависит как от времени, так и от позиции системы, включающей, в частности, фазовые переменные и номер действующей системы дифференциальных уравнений. Использование таких управлений обусловлено решением практических задач в условиях неполной или неточной информации при наличии возмущений.

Один из методов решения задач програмлтого управления для обычных, негибридных систем опирается на принцип максимума Л.С. Понтрягина [15], при помощи которого могут быть получены необходимые условия оптимальности. Принцип максимума может быть применен в обобщенной формулировке и для гибридных систем [77]. В отсутствии возмущений значение критерия оптимальности при позиционных стратегиях совпадает со значением, полученным при программных управлениях. Однако, при наличии возмущений одних программных управлений уже недостаточно. В таком случае нужны позиционные управления, найденные, например, путем использования методов динамического программирования [1], а также теория, разработанная для негибридных систем Н.Н. Красовским [б], [7], [8]. Задача синтеза может быть также сформулирована как задача, поиска такого позиционного управления, которое удерживает траекторию внутри системы слабо инвариантных лтоо/сеств (попятных лтожеств достижимости, множеств разрешимости), образующих трубку разрешимости [45] (стабильный мост [8]) и т.п. По найденным слабо инвариантным множествам можно построить синтез с требуемыми свойствами, опираясь на метод экстремального прицеливания, [7].

Применению методов динамического программирования для решения задач управления гибридными системами посвящены работы [28], [32], [33], [43] [57], [67], [71] и другие.

Основная цель данной работы состоит в исследовании структуры множеств достижимости для гибридной системы без неопределенности, в решении задач верификации, численного построения множеств достижимости или разрешимости, а также в решении задачи синтеза управлений.

В первой главе диссертации рассматривается задача построения множества достижимости для гибридной системы, а также задачи верификации. В разделе 1.1 описывается математическая модель гибридной системы, используемая в следующих разделах и главах. Эта модель включает в себя непрерывную и дискретную составляющие. Непрерывная составляющая системы представлена совокупностью N систем обыкновенных дифференциальных уравнений:

*» = /*(*,*« ^),/ = 1,...,^, (1)

где в каждый момент времени активной является одна из указанных систем. Здесь т^ Є fix С Ш.Пх - вектор фазовых координат, tic Є М.Пис - управление. На управление Uc наложены геометрические ограничения: щ = її с(t) Є Vi(t).

Дискретная составляющая модели гибридной системы содержит правила мгновенного перехода от одной системы дифференциальных уравнений (1) к другой - переключения системы. Переключение с г-ой системы (1) на другую может произойти лишь при определенных условиях, а именно, при x^l\t) Є <5(г), где S{) С ШПх - пространственная область переключеная. В данной работе всюду считается, что множества S(i) представляют собой конечные объединения гиперплоскостей и полос в пространстве ШПх.

Кроме правил перехода от одной системы дифференциальных уравнений (1) к другой дискретная составляющая гибридной системы содержит соотношения, описывающие так называемые перестройки состояния - мгновенные изменения вектора фазовых переменных. Перестройки состояния могут происходить только в так называемых областях перестроек, которые в рассматриваемой модели приняты совпадающими с областями переключений S (і).

Функционирование дискретной составляющей гибридной системы при переключении и/или перестройке может быть описано уравнением:

{i+,^+)( + 0)} = R(t,xГ,иа), (2)

где і~,і+ Є {1,..., N} - номера систем дифференциальных уравнений (1) до и после переключения, t Є [ioj^i], x^~\t 0),ж(г+)(+0) Є fl.x -векторы фазовых переменных непосредственно до и сразу после перестройки, и^ Є МПц<* - управляющий параметр, на значения

которого наложено ограничение: u) EVd{i ), где Va{i ) - некоторое множество в пространстве Rn"d.

Управления ис могут быть взяты либо из класса программных управлений U0(tQ,ti) (тогда ис = Uc (t) - функция времени, зависящая также от номера активной системы (1)), либо из класса позиционных управлений Ucj. В последнем случае ис является многозначным отображением lie = гіс (t,x) С Vi{t), зависящим от времени, вектора фазовых пере-лієнньіх и номера активной системы (1). При использовании многозначных позиционных управлений необходимо убедиться, что после их подстановки в уравнения системы будут получены дифференциальные включения, имеющие решения (в смысле, определенном в монографии [22]) Использование известной теоремы о существовании решения у полунепрерывного сверху, выпуклозначного, компактыозначпого дифференциального включения, в данной работе невозможно. Вместо указанной теоремы из [22] в работе использован результат, приведенный в [76] и позволяющий работать с управлениями, приводящими к невыпуклозначным дифференциальным включениям.

При решении различных задач управления для гибридных систем ключевым является определение понятия позиции системы. В данной работе под позицией системы понимается четверка {t,x,i,6}, в которой t Є [ісь^і] текущий момент времени, х Є fix ~~ вектор фазовых переменных, / Є {1,..., N} - номер активной системы дифференциальных уравнений, в [to,t] - момент последнего произошедшего переключения или перестройки. Компонента в позволяет различать позиции системы непосредственно перед переключением и/или перестройкой и сразу после таковой. Определенная таким образом позиция системы позволяет формулировать принцип оптимальности в форме полугруппового свойства для функций цены, используемых для решения задач управления методами динамического программирования.

Частным случаем рассматриваемой модели гибридной системы является кусочно-линейная система с переключениями ([74], [42], [10]), в которой область фазового пространства 0,х разбита гиперплоскостями на части Q^\ ...,Q(N\ каждой из которых поставлена в соответствие некоторая система линейных дифференциальных уравнений с управляющими параметрами. Уравнения из описания модели гибридной системы при этом являются линейными по вектору фазовых переменных и управлению:

/*(*,*« tlW) = ^(^(О + Bi(t)u? + d(t)v?. (3)

Здесь Vc = Vc (t) : [to,ti] —> Rn"c - фиксированная непрерывная функция,

Mt) Є C(fo,*i],M"*xn*),Bi(f) Є C([*o,ii],Mn*xn"c),a() Є C([t0,U],RnM<),

Ri(t,x, I, Ud) = j, Vud, если x Є fi'-",

, . _ J Xy(t)x + Mij{t)ud + %(*H , если ж Є П(і) П
^ х , иначе

Здесь vd — Vd(t,i) - фиксированное отображение, Кц(і) Є Rn*Xn*? ^hj{t) Є Rn*xn«d, iVy(t) Є Rn*xn«d, det iiTij(t) 7^ 0, ud Є Pd - выпуклое, компактное множество. Часть результатов в данной работе получена при предположении, что исследуемая гибридная система является кусочно-линейной системой с переключениями. Используется также более слабое предположение о линейной структуре гибридной системы, когда уравнения из описания модели являются линейными, но нет никаких ограничений, связанных с разбиением фазового пространства на области Q^k\

Описание модели

Рассматриваемая в данной работе гибридная система представляет собой математическую модель системы управления, в которой непрерывная динамика, порождаемая в каждый момент времени одной из априорно заданного конечного семейства непрерывных систем, перемежается с дискретными операциями, подающими команды либо на мгновенное переключение с одной системы на другую, либо на мгновенную перестройку с заданных текущих координат на другие координаты, либо на то и другое одновременно. Таким образом, гибридная динамика системы заключается в альтернированной комбинации непрерывной динамики с дискретной, скачкообразной.

Модель непрерывной динамики представлена совокупностью N систем обыкновенных дифференциальных уравнений: x = Mt,x ,u ),i = l,...,N (1.1) где в каждый момент времени активной является одна из указанных систем. Здесь х Є МПх - вектор фазовых координат, иі Є Ш.Пис - управление, правая часть fi(t,x,u) : [t0,ti] х ШПх х Wluc — ШПх. Функция fi(t,x,u) является непрерывной по совокупности переменных и удовлетворяет условию Липшица по переменной х. На управление и наложены геометрические ограничения: щ = Щ {і) Є Vi(t), где Vr(t) С М""с - многозначное отображение, непрерывное по Хаусдорфу, принимающее выпуклые, компактные значения. Системы дифференциальных уравнений (1.1) рассматриваются в некоторой открытой ограниченной области фазового пространства: ж Є Qx = {, Є W1 : Cx}, где Cx 0 -константа. Кроме того, t Є [io i]j где значения t0 ti - фиксированы.

Дискретная динамика отражает правила мгновенного перехода от одной системы дифференциальных уравнений (1.1) к другой - переключения системны. При этом предполагается, что переключение с г-ой системы (1.1) на другую может произойти лишь при определенных условиях, а именно, при x (t) Є S(i), где S(i) С ШПх - пространстве}тая область переключения. Заметим, что момент переключения может также определяться на основании значения вектора фазовых переменных вместе с текущим значением параметра t. В частности, момент переключения может быть задан априорно, в явном виде. Для этого достаточно добавить к системе (1.1) еще одно уравнение XQ — 1 и включить во множество S(i) подпространство пространства М.Пх вида {х = (XQ, х±,..., хПх) Є КПх+1 : х0 = г}, где г - фиксированный момент переключения.

В области переключения S(i) могут быть выделены ([32]) две части Qs(i) и Ss(г), такие, что Qs{i) USs(i) = S(i). Qs(i) - это область обязатааъпых переключений, где при первом же попадании в это множество в системе должно произойти переключение. s(i) - это область возможных переключений, в которой смена системы дифференциальных уравнений может произойти, но она, вообще говоря, не является обязательной.

Кроме правил перехода от одной системы дифференциальных уравнений (1.1) к другой дискретная составляющая гибридной системы содержит соотношения, описывающие так называемые перестройки состояния - мгновенные изменения вектора фазовых переменных. Перестройки состояния могут происходить только в так называемых областях перестроек, которые в рассматриваемой модели приняты совпадающими с областями переключений S(i). В каждой из областей S(i) могут быть выделены две части Qr{i) и r(i) -области обязательных и необязательных перестроек соответственно. Справедливо соотношение: S{i) = Qr{i) U r(i).

Функционирование дискретной составляющей гибридной системы при переключении и/или перестройке может быть описано уравнением: {i+, x«+\t + 0)} = R{t, x \t - 0), Г, ud) (1.2) или эквивалентной системой уравнений: г+ = (, -)(_о),Г, ) (1 3) x(i+)(t + 0) = Rx(t, x (t - 0),r,ud) Здесь і ,г+ Є {1,...,iV},- номера систем дифференциальных уравнений (1.1) до и после переключения, t Є [о і], x \t — 0),a;(i+)(i + 0) Є ПГ- векторы фазовых переменных непосредственно до и сразу после перестройки, Ud Є R""d - управляющий параметр, на значения которого наложено ограничение: щ = Ud(t,i ) Є Vd{i ), где Vd(i ) - некоторое множество в пространстве ЕПи . Отображение R(t, x \t—0),i", iij) может быть задано явным образом. Оно также может являться, например, оператором, описывающим действие некоторого детерминированного дискретного конечного автомата [2], [23] с состояниями {г : і Є {І,...,N}}. При этом Ri(t,x l \t — 0),i ,Ud) является функцией переходов, а Rx{t, х г (i — 0), г , Ud) - функцией выхода данного автомата.

В зависимости от постановки задачи управления для гибридной системы можно вводить различные понятия позиции системы. Однако, для решения задач оптимального управления методами динамического программирования позиция системы должна быть подобрана таким образом, чтобы для соответствующей функции цены выполнялся принцип оптимальности в форме полу группового свойства. В данной работе позицией гибридной системы назовем четверку {, х, г, 9}, где t Є [іоі і] - текущий момент времени, х Є fiT -текущее значение вектора фазовых переменных, г Є {1, ...,N} - номер активной системы (1.1), в Є (—оо,і] - момент последнего переключения, произошедшего на траектории гибридной системы. Компонента в дает возможность различать позиции системы непосредственно перед переключением (в t) и сразу после переключения (0 = t).

Для компоненты управления ис будем далее использовать класс программных управлений U0(tQ,ti) - множество измеримых функций Uc = Uc (t) (і Є {1,..., iV}), заданных при t Є [о,і], удовлетворяющих почти всюду ограничениям: ис (t) Є Vi(t). Через По (tQ, t\) будем обозначать множество измеримых функций иІ — Щ (t) при фиксированном г {1,..., N}, заданных при t Є [t0, ti], удовлетворяющих почти всюду ограничениям:

Далее для целей синтеза используется класс допустимых позиционных управлений Ucj, содержащий многозначные отображения щ = ис (t,x) С Vi(t). При подстановке таких многозначных отображений в системы (1.1) должны быть получены дифференциальные включения, имеющие решения при любой начальной позиции (t,x) Є [сь і] х &х- Условие существования решений, например, будет выполнено [22], если потребовать, чтобы многозначные отображения Uc(t,x) Є Ucj были измеримыми по t, полунепрерывными сверху по х и принимали выпуклые, компактные значения. Однако, при решении задач управления для гибридной системы целесообразно использовать более широкий класс допустимых управлений, включающий многозначные отображения с невыпуклыми значениями. Для компоненты управления ud будем использовать класс программных управлений Ud,0(tQ,ti), представляющий собой множество отображений vd = ud(t, і) : [t0, i] х {1,..., N} - Pd(i). При синтезе управлений будем использовать класс позиционных управлений Udj, включающий все отображения вида: Ud = ud(t,x,i) : [ o, i] xfijX {1,...,N} -+Vd{i) 1.1.3 Траектория гибридной системы. Зафиксируем начальную позицию {О #О»Ї О)0О} реализации компонент управления ис — uc(t) Є U0(tQ,ti) (ис = uc(t,x) Є Ucj), Ud = ud(t,i) Є Ud,o{f 0 i)- Траекторией гибридной системы называется четверка {t,x(t),i(t),e(t)}, t Є [to,ii], в которой x(t) Є Q,x - кусочно-непрерывная справа вектор-функция, i(t), 9(t) - кусочно-постоянные, непрерывные справа функции. Функции x(t), i(t), 6(t) определены следующим образом:

Метод динамического программирования. Функции цены

Для решения поставленной выше задачи построения множества/ трубки достижимости, как и в случае с обыкновенными, негибридными системами ([49]), можно использовать функции цены для специальной вспомогательной задачи оптимального управления. Значения этих функций цены могут быть найдены методами выпуклого анализа, либо в результате решения уравнений в частных производных типа Гамильтона-Якоби-Беллмана. При этом множество достижимости может быть выражено через множества уроішей для найденных функций цены. В данном разделе будем считать выполненными следующие предположения: Предположение 4. Дифференциальные уравнения (1.1) линейны и имеют вид (1.4). Управление ud состоит из трех компонент: ud = (wd, zd, ud) , причем wd Є {j Є {1,..., N} : x Є S(i,j)} zd Є {0,1}, щ Є Vd(i), где Vd(j) - выпуклый компакт. Оператор Rx из (1.3) имеет вид: п ,, , f Kij(t)x +Mijfyud + Nij Udfai) , еслих eS(i,j),Zd = l, либо х &gr(i) Rx(t,x,i,ud) = a: , иначе Опєратюр Ri имеет следующий вид: Ri(t,x,i,ud) = г(2"(г,аф1 )), где г - отображение, переводящее подмножество множества {1,...,N} в какой-то из его элементов, и Г wd , если wd є Х(г, х) l(i,x\wd) = { Х{г,х) , иначе x{i х) = { Ь Є {1,..., Щ : j ф і, х Є S(i,j)} , если хе Qs{i) 1 {J Є {I,-, N} :j i,xG S(i,j)} U {і} , если x Q{i) Предположение 5. VI, j {1,...,N} множество S(i,j) является выпуклым. Предположение 6. V? Є {1,...,N} 3Q, (i) С Qx,- выпуклое, компактное множество, такое, что Х0 С Q (i), (іпШ (г)) П (г(г) U Qs(i)) = 0, 8Sl (i) С (ЭПХ U dGr(i) U дб8(і)). Кроме того, Ух Є dQ (i),Vte [to,h] $A 0,uc(-) ег/„(М+А):а;(т;{,а; , -)k e 9Q (z),

Предположение 6 требует, чтобы A o лежало в некотором множестве 2 (г), внутри которого переключения и перестройки не являются обязательными. Граница ЪТ (г) содержит только те точки, в которых переключения или перестройки являются обязательными, а также точки границы области Qx, причем движение вдоль dQ (i) невозможно (т.е. имеет место односторонняя проницаемость границы множества Q (i)).

Пусть множества XQ, Vi(t), Vd{i) являются эллипсоидами: Х0 = ( Zo,Qo)) Vi(t) = {Pi(t)- Pi{t)) "Pdify = (Pd,i, Pd,i)- При каждом т Є [to, t] семейство эллипсоидов Н(г) может содержать эллипсоиды, каждому из которых будем сопоставлять дополнительные величины: текущий момент времени т, момент времени первого появления данного эллипсоида в семействе (т), вектор І Є ШПх и набор ф Є Ф. Каждый вектор I задает так называемое "хорошее" направление для данного эллипсоида, и используется для построения "тугих" ([47]) эллипсоидальных аппроксимаций для множеств достижимости систем дифференциальных уравнений (1.1). То есть опорные функции к эллипсоиду и аппроксимируемому множеству в направлении, задаваемом вектором I, совпадают. Набор ф, сопоставленный каждому эллипсоиду, содержит "дискретную историю" его построения.

Пусть 2() - следующее семейство эллипсоидов: ЭД = {(q,Q,to,t0,l,Q) = Ха = S(q0,Q0),lG К» , 2 = 1}. (1.36) Семейства E(t) при t tQ будем строить по мере увеличения значения t. Для любого t [to, ti] семейство эллипсоидов Е() должно удовлетворять следующим правилам: — Непрерывная динамика. Пусть (q(t),Q(t),t,t ,l,ift(to,t,io)) Є Н(), і = / () - номер системы дифференциальных уравнений (1.1), действующей в мо мент времени , в соответствии с информацией из набора il (to,t,io), сопостав ленного данному эллипсоиду (если t - момент переключения, то г - номер системы дифференциальных уравнений после переключения). При отсутствии переключений и перестроек матрица Q(t) и вектор q(t) данного эллипсоида удо влетворяют следующим соотношениям (см. [47]): Q{t) = Ai {t)Q(t) + Q(i)4.(;fc) +ir(t)Q(t) + 7r-l(t)Bi t)Pi.(t)BUt), (1-37) (t) = V M№ q(t) = Ai.(t)q(t) + Д.(І)РІ.( ) + Ci.(t)vP(t). (1.38) Для получения из (1.37),(1.38) задач Копій для систем обыкновенных дифференциальных уравнений необходимо добавить краевые значения для Q, q, которые определяются в тот момент времени , в который рассматриваемый эллипсоид впервые добавляется в семейство 5( ). Так, например, для эллипсоидов, входящих в состав ЕЕ(0), = to, и краевыми значениями будут: Q(to) = Qe,q{to) = qo- Каждый из эллипсоидов из семейства Н() может быть в некоторый момент изъят оттуда, а значит соотношения (1.37),(1.38) верны лишь при t Є [ , ] С [t0, t\], где t - момент изъятия эллипсоида из семейства 5( ), либо Г = ti.

Заметим, что в соответствии с [47] формулы (1.37), (1.38) определяют "тугие" эллипсоидальные аппроксимации множества достижимости для системы дифференциальных уравнений (1.1) с номером г , касающиеся его в направлениях, задаваемых векторами Х[ ( ,)/.

Функции цены для слабо инвариантного множества

Как и в случае со слабо инвариантными множествами для систем дифференциальных уравнений (т.е. для "обыкновенных", негибридных систем) ([49]) множество W(to,ti,Xi) может быть представлено в виде множества уровня ("множества Лебега") специальной функции цены, которая может быть найдена либо при помощи методов выпуклого анализа, либо в результате решения уравнений в частных производных типа Гамильтона-Якоби-Беллмана. В данном разделе будем считать выполненными предположения 4 и 5. Зафиксируем некоторое число j 0. Рассмотрим следующую функцию цены: У( ,я;го,0) = min (ж(іг; , ж, г0,-00) /.),. )+ + / 7rf2(«(T;t,a:,2 o,-cx3)„c(.),n (?o))rfr. (2.3) Данная функция цены связана со множеством W(o, t\, Аіг о, 0) следующим соотношением: Щo, і,#іго,0) = {я Є Пх : V(t,x\io,V) 0}ПіііШ (?о). Применяя методы выпуклого анализа (т.е. представив функцию сР(-,А) через сопряженную к ней, и применив затем теорему о минимаксе) ([14], [17]), можно получить следующее выражение для функции цены V(t,x\io,$): V(t,x\i0, 0) = max snp\8io(tut)x - p(ZAi) - И - 7 Г fp(p(r)fi («o)) + ) dr - р(-В;0(г)4( ,г) Vio(r j dr + jf"1 3io(tbr)Ci0(r)QJQ(r)dr\. (2.4) Здесь внутренняя максимизация производится по всевозможным вектор-функциям р(-) Є C([t,іі],ЖП:г). Сопряженная переменная sio(tx,t) (вектор-строка) определяется из следую-щей задачи Коши: sio(tx,t) = - „( !, і)Д-0(t) -тр( У Si0(h,h) = I Из (2.4) следует, что функция У(,ж/о, 0) является выпуклой по переменной X. Функцию V(t,x\iQ,$) можно также искать как решение уравнения Гамильтона-Якоби-Беллмана. А именно справедлива следующая теорема: Теорема 7. Функция цены V(t, х\г0,0) является решением уравнения Гамильтона-Якоби-Беллмана1: min DV(t, x\i0, 0)(1, Aio(t)x + Bio{t)uc + Cio(t)v \t)) + jcf(x, Sl (i0)) = 0, ucEVl0(t) te[t0,ti],xeQx (2.5) с краевым условием V(tx,x\i0,0) = jd2(x,Хг),Ух Є О Справедливость теоремы можно проверить, используя соотношение (2.4), аналогично тому, как это было сделано при доказательстве теоремы 2 из главы 1.

Для каждого ip(t,ti,io) будем определять функцию цены V(t,x\io,ip(t,ti,io)) по мере увеличения количества элементов в наборе ip(t,ti,i0). При этом в качестве самой первой функции цены (без переключений) используется рассмотренная выше V(t,x\io,0).

Предположим известными функции цены V(t,х\г0,$) и V(t,x\i0)ip(t,ti,iQ)) для любого ip(t,ti,io) Є Ф(і,іі,г о). В силу теоремы о дифференцировании функции максимума (см. [3]), данные функции дифференцируемы по t, х по любому фиксированному направлению у = (f, х) . Используя соотношения (2.5), (2.11), определим управление в форме синтеза, -решающее задачу о переводе траектории гибридной системы в малую окрестность целевого множества в заданный момент времени.

Лемма 3. Для любого фиксированного номера і Є {1, ...,iV} многозначное отображение u (t,x,i), определенное соотношением (2.15) при t Є [Cm Cm+i)j является допустимым управлением, т.е. если подставить данное многозначное отображение в дифференциальное уравнение (1.1), то будет получено дифференциальное включение, у которого имеется хотя бы одно решение на отрезке времени [t,Cm+i]; при произвольной фиксированной начальной позиции {t,x,i} (t Є [(mXm+l)) Доказательство. Для доказательства данного утверждения воспользуемся теоремой о существовании решения дифференциального включения, доказанной в [76]: Пусть F(x) -выпуклозначное, полунепрерывное сверху многозначное отобраоїсение, определенное при х Є S, где S - некоторое компактное множество в М". Зафиксируем некоторый отрезок времени [to,t\] и XQ Є S такое, что ни одна из траекторий дифференциального включения х Є F(x), выпущенная из x(t0) = х$, не может выйти из множества S при t Є [to, t\]. Рассмотрим вспомогательные функции ф(х) и р(х), первая из которых является локально липгшщевой, а вторая - полунепрерывной сверху. Определим многозначное отобраоїсение G(x) = {?/ Є F(x) : 0 ф(х)(т]) p(x)}. Предположим, что G(x) ф 0 при любом х Є S. Тогда дифференциальное включение х Є G(x) имеет хотя бы одно решение, для которого x(to) = XQ, и которое продолжаемо на отрезок [to,ti].

Оценим теперь максимальное количество таких отрезков [CmiCm+i]» на которых может выполняться неравенство V( m,x((m)\i) У т+и(і](Ст,х((т)\і). Из данного неравенства следует, что на отрезке [т, Cm+i] можно перевести траекторию системы в точку х , для которой будет справедливо соотношение: d(x ,S(i)) J iai; ХК Тогда для части построенной траектории на отрезке [m, Cm+i] возможны три ситуации: 1) траектория приближается ко множеству S(i) со скоростью, не меньшей vmin (при этом считается, что х(т) ( ))" 2) траектория удаляется от множества S{i) (при этом считается, что х(Сгп) (г)); 3) х(Ст) - S(i).

Дискретная составляющая системы включает одну прямую для переключений Ни = {xi = 2}, переключения на которой не являются обязательными и не сопровождаются перестройками. Пусть t Є [t0 = 0.5, t\ = 1], и целевое множество Л4 = Во.б(0,3). Используя приведенные выше формулы (2.4), (2.9), (2.10), можно численно построить функции цены, а затем и синтез управлений, в соответствии с формулами, приведенными выше. На рис. приведен синтез, построенный численно в различные моменты времени. Для каждого момента времени приведены две составляющие синтеза: для первой системы дифференциальных уравнений, и для второй.

Пример в R3. Задача управления шариком, скачущим на вращающейся плоскости

Рассмотрим математическую модель шарика, движущегося в пространстве под действием силы тяжести, и отскакивающего от некоторой горизонтальной плоскости. Данная модель является частным случаем модели гибридной системы, описанной выше, в первой части работы. Здесь N = 1, пх = 6. Состояние шарика в каждый момент времени описывается вектором х = (хі,Х2,хз,х :х5,Хб) Є Ш.6, где (хі,Х2,х3) - координаты центра шарика в пространстве (координата ж3 - вертикальное положение), a (x±,Xs, XQ) - вектор скорости поступательного движения шарика. Считается, что его радиус мал, и можно не учитывать эффекты, связанные с вращательным движением, рассматривая лишь поступательное движение центра шарика.

Плоскость ТС может вращаться относительно осей /х и /2, проведенных из любой ее точки, с направляющими векторами е\ и е2 соответственно. В каждый момент времени плоскость может быть повернута лишь относительно одной из таких осей. Относительно горизонтального положения и оси h плоскость Ті может повернуться на любой угол Ud,\ Є [—а:і,а!і] («і Є (0,7г/2) - константа), а относительно оси 12 - на любой угол Ud,2 Є [-( «г] (а2 Є (0,7г/2) - константа).

Когда шарик достигает Ті, он отскакивает от данной плоскости - происходит обязательная перестройка траектории гибридной системы. В момент переключения плоскость Ті может быть повернута относительно одной из осей h и 12, проходящих через точку соприкосновения плоскости с шариком. Далее будем использовать в данном разделе класс допустимых позиционных управлений Udj. Поскольку функция j\(t, х, ис, vc) и отображение Rx(t, х, i, ud, Vd) не зависят от t, и Ri(t,x,i,Ud) = 1, то можно ограничиться рассмотрением функций Ud(t,x,i), не зависящих явно от t, і. Функции щ(х) имеют следующую структуру: ud{x) = (иа,і(х),иа,2(х)У Ох -» Vd = {{(«,0) а Є [-ai,ai]} U {(0,a) : а Є [-a2, a2]}J. Значением отображения Ud является пара углов поворота плоскости Ті относительно осей U и 12 при текущем векторе фазовых переменных х. Для адекватного поведения рассматриваемой модели необходимо запретить такие повороты плоскости вокруг одной из осей 1-і или 12, при которых траектория системы оказывается после переключения ниже Н (x3(t + 0) 0). То есть класс допустимых управлений необходимо ограничить так, чтобы для любой заданной позиции х (х3 = 0, xG 0), при

Зафиксируем также вектор фазовых переменных XQ = (жоъЖог оз, 0,0,0) , г,п е ж3 Требуется решить задачу управления траекторией гибридной системы (т.е. определить управление d(-) Є Udj) с целью приведения ее в целевое множество Лч. На компоненты скорости в момент попадания на целевое множество никаких ограничений не налагается. Поскольку системы дифференциальных уравнений (1.1) являются стационарными, и матрица С не зависит от t, то начальный момент времени to для искомой траектории может быть выбран произвольным образом. Рассматриваются следующие подзадачи: Задача 1. Для заданной начальной позиции (toj o) необходимо определить, существует ли такое управление Ud(-) Є-lAaj и t\ со, что x{t\;to,xo)\Ud Є Лі х М3.

Задача 2. Для заданной начальной позиции (to,xo) необходимо определить наименьшее значение ti t0) Для которого существует такое управление Ud(-) Є Udj, при котором x(ti]tQ,Xo)\Vd Лі х R3. Необходимо также построить соответствующий синтез управлений. Задача 3. Для заданной начальной позиции (о,Жо) необходимо определить наименьшее количество перестроек к Є Z+, для которого существует такое управление " () Є Udj и такое t\ to, при которых x(ti;to, Xo)\Ud Є Лі х М3 и при т Є [to, і] на траектории системы происходит не более к перестроек. Необходимо также построить соответствующий синтез управлений. 3.2.3 Функции цены и уравнения Гамильтона-Якоби-Беллмана.

Для заданного начального состояния XQ существует такая реализация управления ud(-) Є Udj и такое t\ со, что x(ti;to,Xo)\Ud Є М х М3, тогда, и только тогда, когда V (x0) 0. Множество {х Є Пх : V (x) 0} совпадает со слабо инвари антным множеством гибридной системы, выпущенным из целевого множества Л4, и построенном на полупрямой [0,+оо]. здесь и далее 2о(х) - функция, равная 0, если х = 0, и +со - в противном случае. Для заданного начального состояния х0 наименьшее значение ti t0, для которого существует такая реализация управления г (-) Є Uaj, при которой x(ti;t0,x0)\Ud Є М. х М3, равно наименьшему значению U t0, для которого V (x0,t-i) 0.

Для заданного начального состояния XQ наименьшее количество перестроек к Є Z+, для которого существует такая реализация управления м (-) Є Udj и такое t\ to, при которых x(ti;to, Xo)\Ud Є MxM? и при т Є [to, і] на траектории системы происходит не более к перестроек, равно наименьшему к Є Z+, для которого V(3\XQ, к) 0.

Используя соотношения (3.24),(3.25),(3.26), можно выписать более простые формулы для функций цены, которые затем можно использовать для построения численных методов. Рассмотрим функцию цены V 3\x,k). Будем далее обозначать через V (x,k) функцию цены, аналогичную V (x,k), но отличающуюся тем, что при ее подсчете учитываются лишь траектории, на которых происходит ровно к перестроек. Очевидно, справедливо соотношение V (x, к) = min{Vr(3) (a;, s)\s = 0,1,..., к}.

Численный метод для расчета функции цены V (x, к) можно получить, заменив в соотношении (3.26) отрезки [—ai,ai], [-0:2,0:2] некоторыми равномерными сетками. Используем получившееся соотношение для расчета аппроксимации (сверху) для функции цены V (x, к). В результате, на каждом шаге расчета аппроксимаций V (x,k) по мере увеличения к для аппроксимирующей функции будет справедливо соотношение (3.27), в котором Vk — конечное множество. Для пересчетов семейств Vk на каждой итерации используются приведенные выше простые формулы. Представление (3.27) позволяет при численных расчетах оперировать матрицами небольших размерностей, а не сеточными функциями в R5. Однако, количество таких матриц растет экспоненциально по мере увеличения к. Пусть Ат - количество элементов в каждой из сеток по отрезкам [—oi,a:i], [— 0:2,0] Тогда при к — О аппроксимация функции цены задается при помощи щ = 1 набора из трех матриц; при к = 1 - при помощи щ — 2N + 1 наборов; при к — 2 - при помощи П2 = 2N(2N + 1) + 1 наборов, и т.д. Для применения данного метода при больших значениях к необходимо добавить в него процедуру удаления "лишних"пар матриц из семейств Vk (например, аналогично алгоритму, приведенному в [53]).

Похожие диссертации на Задачи достижимости и синтеза управлений для гибридных систем