Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Гомоюнов Михаил Игоревич

Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении
<
Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гомоюнов Михаил Игоревич. Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении: диссертация ... кандидата физико-математических наук: 01.01.02 / Гомоюнов Михаил Игоревич;[Место защиты: Институт математики и механики УрО РАН].- Екатеринбург, 2015.- 110 с.

Содержание к диссертации

Введение

I Вспомогательные сведения из теории позиционных дифференциальных игр 13

1. Дифференциальная игра 13

2. Метод выпуклых сверху оболочек 17

II Оптимизации гарантии при запаздывании в управлении 22

3. Постановка задачи 22

4. Вспомогательная дифференциальная игра 28

5. Приближенное решение задачи 34

6. Пример 36

III Случай позиционного показателя качества 41

7. Позиционный показатель качества 41

8. Каскад вспомогательных дифференциальных игр 42

9. Разрешающая процедура 51

10. Примеры 63

IV Редукция разрешающей процедуры 68

11. Предварительные построения 68

12. Редуцированная процедура 73

13. Связь между процедурами 76

14. Вспомогательные утверждения 81

15. Доказательство теоремы 12.2 86

16. Примеры 91

Заключение 95

Литература

Метод выпуклых сверху оболочек

В настоящей главе рассматривается линейная динамическая система, подверженная наряду с полезным управлением воздействиям неконтролируемых помех и содержащая запаздывание в управлении. Оптимизируемый показатель качества процесса управления является нетерминальным и представляет собой сумму нормы совокупности отклонений движения системы в заданные моменты времени от заданных целевых точек и интегральной оценки реализаций управления и помехи. В рамках теоретико-игрового подхода ставится задача об оптимизации гарантированного результата. На базе подходящей функциональной трактовки процесса управления задача сводится к вспомогательной дифференциальной игре без запаздывания и с терминальной платой, но в пространстве большой (пропорциональной количеству моментов времени оценки качества движения) размерности. На основе применения метода выпуклых сверху оболочек во вспомогательной игре для приближенного решения задачи предлагается многоразмерная рекуррентная процедура попятного построения выпуклых сверху оболочек вспомогательных функций. Описывается один нетривиальный класс задач, в которых требуемые выпуклые сверху оболочки удается выписать в явном виде, и предложенные конструкции приводят к эффективному решению. Рассматривается модельный пример, приводятся результаты численного моделирования.

Здесь x — фазовый вектор, t — текущий момент времени, и — вектор управления, v — вектор помехи; т — постоянная величина запаздывания; t0 и і} — начальный и терминальный моменты времени соответственно; Р и Q — заданные компактные множества; A(t), B(t), BT(t) и C(t) — непрерывные на [ 0,tf] матрицы-функции.

Обозначим через V множество измеримых по Борелю функций р(0 Є Р, І Є [-г,0). Позицией системы (3.1) назовем тройку ( ,ж,р(-)) Є [t0, і?]хГх Р, где функция р(.) играет роль истории управления длины запаздывания г, сформировавшейся к моменту времени t. Введем множество К = [to,tf\ хШп xV позиций системы (3.1).

Из позиции ( ,ж ,р (-)) Є К допустимые (измеримые по Борелю) реализации управления u[t [-]t ) = {u(t) Є Р, t t } и помехи v[ [-]r) = {v( ) eQ,Ui t }} t Є [ „#], единственным образом порождают движение системы (3.1) — абсолютно непрерывную функцию x[U[]t ] = {x(t) Є Rn, U }, которая удовлетворяет условию #( ) = ж и почти всюду на [ , ] вместе с ІІ() и г () удовлетворяет уравнению (3.1). При этом в согласии с заданной историей р (-) доопределяем реализацию управления при t Є [t — т, ,=) из условия u(t) = p (t — ,=). Всюду далее для обозначения истории управления длины т, сложившейся к моменту времени t, будем использовать следующее обозначение:

Предположим, что из начальной позиции (t0,x0,po{-)) Є К при действии допустимых реализаций управления и[г0[-Щ и помехи v[t0[-p) сформировалось движение ж[о[-]#] системы (3.1). Качество процесса управления будем оценивать показателем

Здесь і}г Є (o,tf], і = 1, АГ, - заданные моменты времени, &i+u і = 1,7V — 1, и &N = &; D{ - (di x п)-матрица, 1 d{ n, і = T V; с Є Rn, і = T V; /i(/b...,/w) Є R, (/i,...,W Є Kdl x ... x Rd", -норма; a{t,u) Є R, ( ,u) Є [t0 ] x P, и /3(M) Є R, {t,v) Є [ 0,tf] x Q, -непрерывные функции. Цель управления — доставить показателю качества 7 (3.2) как можно меньшее значение. При этом действия помехи неизвестны и, в частности, могут быть нацелены на максимизацию 7 Перейдем к формализации задачи управления. Стратегией управления U(-) назовем функцию где функция ж[о[-]] играет роль истории движения системы (3.1), сложившейся к моменту времени t, є — параметр точности, C[to,t] — множество непрерывных функций ж() Є Rn, С Є М] Стратегия U(-) действует на систему (3.1) в дискретной по времени схеме на базе разбиения Ак = Ак{т3} = {т3 : n = t0, т3 т-,+1, j = TJc, тк+1 = її} (3.3) отрезка времени [to,її]. Тройка {ІІ(-),є,Ак} определяет закон управления, который по шагам разбиения Ак в цепи обратной связи формирует кусочно-постоянную реализацию управления гфо[-]#) согласно правилу u(t) = ит3,х[і0[-]т3],иТз(-),є, t Є [TJ,TJ+1), j = l,к, (3.4) где x[t0[-]Tj] история движения системы (3.1), сформировавшаяся к моменту времени TJ. Таким образом, из начальной позиции (t0, х0,Ро(-)) Є К закон управления {U(-),e,Ak} в паре со случившейся допустимой реализацией помехи г [о[-]$) единственным образом определяет движение xltol-Щ и реализацию управления u[t0[-]&). Соответствующее значение показателя (3.2) обозначим через j( U(-),e,Ak; v[to[-]&); о,жо,Ро(-) ) Гарантированный результат для закона управления {[/"(),, А } и позиции (to,Xo,Po(-)) определяем равенством где точная верхняя грань вычисляется по всем допустимым реализациям помехи v [о []$) Гарантированным результатом для стратегии управления U(-) и позиции (to,Xo,Po(-)) называем величину ru\U(-y,to,xo,Po(-)} =\hnlimsupru\U(-),e,Ak;to,xo,Po(-)}, 40 sio Ак где точная верхняя грань берется по всем разбиениям Ак вида (3.3) с диаметром 6к = maxJ=V:(TJ+1 - т3) 5. Непосредственно из данного определения следует справедливость следующего утверждения.

Утверждение 3.1 Для любых начальной позиции (t0,x0,po{-)) Є К и числа С 0 найдутся такие число є, 0 и функция 6 {є) 0, є Є (0, є,}, что, каковы бы ни были значение параметра точности є Є (0, є ] и разбиение Ак вида (3.3) с диаметром 5к Цє), при любой допустимой реализации помехи v[t0[-]&) закон управления {U(-),e, Ak} будет обеспечивать неравенство

Приближенное решение задачи

Для приближенного вычисления величины оптимального гарантированного результата и построения оптимального закона управления в задаче (3.1), (7.4) для каждого і = 1,7V применим в г-ой вспомогательной дифференциальной игре (8.3), (8.5) метод выпуклых сверху оболочек. Пусть і = TJJ иАк = Ак{т3} разбиение вида (3.3), (5.1). В согласии с попятной рекуррентной процедурой (2.2)-(2.5) для г-ой вспомогательной дифференциальной игры (8.3), (8.5) определим множество и функции (pf(№) Є К, lW є GW, j = l,fc + l. Для удобства дальнейших рассуждений приведем здесь соответствующие формулы.

Отметим, что вспомогательная дифференциальная игра (4.10), (4.11) для рассматриваемой задачи (3.1), (7.4) совпадает с первой (при г = 1) вспомогательной дифференциальной игрой (4.3), (8.5) каскада. Поэтому в качестве непосредственного следствия из теоремы 5.1, если учесть справедливое в силу соотношений (4.9) и (8.2) равенство wfaxoM )) = wW( 0,a:o,Po(-)), ( о,я0,ро(-)) Є К, получаем следующий результат. Теорема 9.1 Для любого числа 0 можно указать такое число 5 О, что, каковы бы ни были начальная позиция (г0,Жо,Ро(-)) є К и разбиение Ак вида (3.3), (5.1) с диаметром 6к , будет справедливо неравенство e[1] ( w[1](0,Zo, #)()) ) 0u(to,Xo,po(-))\ , где Г (-) — величина оптимального гарантированного результата (3.5), wW(-) - информационный образ (8.2).

В согласии с соотношениями (8.15) рассмотрим следующие стратегии управления и формирования помехи

Теорема 9.2 Для любого числа ( 0 найдутся такие число є, 0 и функция 6 (є) 0, є Є (0,ej, что, каковы бы ни были начальная позиция (toiXoiPo(-)) Є ІІГ, значение параметра точности є Є (0,є ] и разбиение Ak вида (3.3), (5.1) с диаметром 6k Цє), законы управ-ления {С/Дк(-),є, A } и формирования помехи {VAk(-), є, Ak} будут (-оптимальными.

Доказательство. По числу ( 0 определим число (о в согласии с соотношением (8.17). Для каждого і = 1,7V по этому числу Со, применяя к г-ой вспомогательной дифференциальной игре теорему 2.2, выберем число єї] 0 и функцию rf](e), є Є (0, є!?]. Положим

Пусть афо[-]#] — движение системы (3.1), порожденное из позиции (t0,x0,po(-)) при действии закона управления {ЇЇАк(-),є, Ак} на базе стратегии ЇЇАк(-) (9.7) в паре с некоторой допустимой реализацией помехи г [о[]#), и гфоН ) — соответствующая реализация управления.

Дальнейшие рассуждения проводятся по аналогии с доказательством теоремы 8.1. Сначала устанавливается справедливость неравенств (8.21). При этом для каждого і = 1,N рассматривается движение системы (8.3), порожденное из позиции ( _i,wW( _i,a;( _i), _1(-) )) законом управления {її! (),, Д -} на базе стратегии и! () (9.6) и реали-зацией помехи г [#і_і[]#). Здесь учтено, что моменты времени т щ (8.19) специально вводить не нужно, так как в силу включений (5.1) имеют место равенства т3щ = #г_ь і = 1, TV + 1. После этого с опорой на полученные неравенства выводится оценка из которой с учетом соотношения (8.14) следует (-оптимальность закона управления {ЇЇАк(-),є, Ак}.

Аналогичным образом с понятными изменениями устанавливается (-оптимальность закона формирования помехи {Уд (-), Ак}. В согласии с соотношениями (9.7) для построения искомых стратегий ДАХ ) и Afc( ) для каждого і = 1,7V необходимо знать значения стратегий и! () и VA () (9.6) при t Є [Л_і, #Д В соответствии с соотношениями (2.9) и (2.10) для определения этих значений требуется найти функции где индексы jW и jW (8.19) определяются из условий Tj[i\ = &І-І и Tjn+i] = &І. В согласии с попятной рекуррентной процедурой (9.3), (9.4) для нахождения указанных функций нужно сначала построить функции iff(-) при всех j = +Ц,к + 1. Следующее утверждение позволяет в предположении о том, что на предыдущем шаге (для і + 1) уже была найдена функция (p[fi+l(-), избежать этих дополнительных построений и определить функцию ср [ +!]() непосредственно. Искомые же функции (pf(-), j = jH,j[ +i] -1, можно после этого построить по формулам (9.4) уже на базе функции (pfi+1](-).

Разрешающая процедура

Аналогичным образом с понятными изменениями устанавливается (-оптимальность закона формирования помехи {VAk(-),e, Ак} на основе стратегии 1/дй(-) (12.13), при этом вместо лемм 14.1 и 14.3 используются, соответственно, леммы 14.2 и 14.4. Теорема 12.2 доказана.

Таким образом, в согласии с теоремами 12.1 и 12.2 решение задачи оптимизации гарантии при запаздывании в управлении и позиционном показателе качества (3.1), (7.4) сводится к определению в соответствии с редуцированной процедурой (12.1)–(12.9) множеств Gf и выпуклых сверху оболочек (pf(-) вспомогательных функций ф3{-). Редуцированная размерность d (11.6) множеств Gf позволяет использовать полученные разрешающие конструкции и при численном построении требуемых выпуклых оболочек. Отметим, что в случае, когда моменты времени из показателя качества (7.4) связаны с величиной запаздывания т соотношениями и для каждого і = 1,N матрица D{ имеет размеры (п х п), упомянутая размерность постоянна и равна 2п.

По аналогии с [19] был разработан численный метод реализации процедуры (12.1)–(12.9), основанный на «пиксельной» аппроксимации областей определения овыпукляемых функций и приближенном построении выпуклой сверху оболочки функции как нижней огибающей конечного набора опорных гиперплоскостей к ее подграфику. По схеме из [128,134] может быть обоснована сходимость и устойчивость этого метода.

В этом разделе приведены два примера, при решении которых используется редуцированная процедура (12.1)–(12.9). В качестве первого примера рассмотрим динамическую систему, движение которой описывается уравнением dx(t)/dt = sin (тг( + l))x(t) + (1 - 0.1 t)u(t) + 0.ltu(t - 1) + 0.8v(t), 0 = 0 10, іЕІ, иєР=[-1,1], veQ=[-l,l]. (16.1) Заданы начальная позиция

Задача оптимизации гарантированного результата (16.1)–(16.3) решалась на основе описанных в разделе 12 конструкций. В данном примере выполняется соотношение (15.9), и размерность областей определения овыпукляемых функций равна 2. Отметим, что при использовании для решения задачи (16.1)–(16.3) разрешающей процедуры (9.34)-(9.38), соответствующая размерность менялась бы от 1 до 10. Приведем результаты численного моделирования. При вычислениях было выбрано равномерное разбиение Ак отрезка времени [0,10] с шагом 5к = 0.005 и значение параметра точности є = 0.05. Априорно посчитанная величина оптимального гарантированного результата:

Результат симулирования процесса управления в задаче (16.1)–(16.3) при действии оптимального закона управления {U&k(-),e, Ак} и трех вариантах помех. На рисунке 16.1 изображены движения ЖЮ[о[.]10], г = ЇД системы (16.1), порожденные из начальной позиции (16.2) законом управления {UAk(-),e,Ak} на базе стратегии UAk(-) (12.13) при следующих вариантах помех:

1. Рассмотрена линейно-выпуклая задача оптимизации гарантии для динамической системы с запаздыванием в управлении при нетерминальном показателе качества, оценивающем движение системы по совокупности отклонений в заданные моменты времени от заданных целевых точек. При помощи функциональной трактовки процесса управления, опирающейся на своеобразный прогноз движений, задача сведена к вспомогательной дифференциальной игре без запаздывания и с терминальной платой, но в пространстве большой (пропорциональной количеству моментов времени оценки качества движения) размерности. При этом доказано существование в исходной задаче оптимальной стратегии управления, использующей информацию о текущем моменте времени, истории управления длины запаздывания и истории движения системы, сформировавшихся к этому моменту. На основе применения метода выпуклых сверху оболочек во вспомогательной игре предложена разрешающая задачу многоразмерная процедура, базирующаяся на попятном рекуррентном построении выпуклых сверху оболочек вспомогательных функций.

2. В случае, когда показатель качества процесса управления обладает определенной позиционной структурой, задача сведена к каскаду вспомогательных дифференциальных игр в пространствах уменьшающейся размерности. При этом доказано существование оптимальной стратегии управления, которая из всей истории движения системы использует информацию только о текущем значении фазового вектора. На основе применения метода выпуклых сверху оболочек в каждой из игр каскада для решения задачи в рассматриваемом случае предложена более экономная по размерности процедура попятного построения выпуклых сверху оболочек вспомогательных функций. 3. Дана редукция разработанной для случая показателей качества позиционной структуры разрешающей процедуры. Редукция основана на оригинальных овыпукляющих свертках и существенно понижает размерность переменных, по которым в действительности требуется проводить овыпукление. Выделен случай, в котором эта размерность не зависит от числа оценочных моментов времени в показателе качества.

Вспомогательные утверждения

Кроме того, утверждение 9.1 с учетом теорем 9.1 и 9.2 позволяет объединить процедуры (9.1)–(9.4) для каждого і = 1, N в единую разрешающую задачу (3.1), (7.4) процедуру попятного построения выпуклых сверху оболочек подходящих вспомогательных функций.

Рассмотрим функцию h1(t) = min{i = l,N:t # }, t Є [ 0,tf], (9.32) где #j, і = 1,N, — оценочные моменты времени из показателя качества (3.2). Через h t-О) (соответственно, /ц( + 0)), обозначим предел функции hx(t) в точке t Є [t0,&] слева (соответственно, справа), полагая при этом hih - 0) = hih) = 1 и /ц(0 + 0) = /ii(tf) = TV.

В итоге, в соответствии с теоремами 9.1 и 9.2, следствием 9.1 и соотношениями (9.41) в случае позиционного показателя качества (7.4) вычисление величины оптимального гарантированного результата (3.5) и построение оптимального закона управления сводится к определению в согласии с попятной рекуррентной процедурой (9.34)-(9.38) множеств Lf и выпуклых сверху оболочек Фf( ) вспомогательных функций Ф (-). Уменьшающаяся с ростом индекса і размерность d (8.1) вспомогательных дифференциальных игр (8.3), (8.5) влечет уменьшающуюся с ростом индекса j размерность множеств L , что повышает эффективность процедуры по сравнению с разрешающими конструкциями из главы II. Более того, как будет показано в главе IV, процедура (9.34)-(9.38) допускает дальнейшую редукцию, еще сильнее понижающую размерность переменных, по которым требуется проводить овыпукление. 10. Примеры

В настоящем разделе приведены два примера, в которых использование разрешающей процедуры (9.34)-(9.38) приводит к эффективному решению. В первом примере все параметры задачи подобраны таким образом, чтобы функции Ф (-) можно было выписать в явном виде. Во втором примере предполагается, что в системе (3.1) отсутствуют помехи (C(t) = 0), что заранее гарантирует вогнутость вспомогательных функций ФД-), поэтому их выпуклые сверху оболочки Ф+(-) строить не требуется.

Задача оптимизации гарантированного результата (10.1)-(10.3) решалась на основе описанных в разделе 10 конструкций. Пусть выбрано разбиение Ak = Ak{rj} вида (3.3) отрезка времени управления [0,2], содержащее моменты 0.5, 1 и 1.5. В данном примере функции Ф-1(-) и Ф+(-), j = l, к, определяемые согласно процедуре (9.34)-(9.38) и требуемые для построения величины Е{(-) (9.39) и стратегий UAk{-) и VAk{-) (9.41), имеют следующий вид:

Приведем результаты численного моделирования. При вычислениях было выбрано равномерное разбиение Ак отрезка времени [0,2] с шагом 6к = 0.002 и значение параметра точности є = 0.02. Априорно посчитанная величина оптимального гарантированного результата:

Результат симулирования процесса управления в задаче (10.1)-(10.3) при действии оптимального закона управления {[Уй(-),е, Дд.} и трех вариантах помех.

Перейдем ко второму примеру. Пусть движение динамической системы описывается дифференциальным уравнением

Результат симулирования процесса управления в задаче (10.4)–(10.6) при действии оптимального закона управления {[/д .(),, Afc}. На рисунке 10.2 изображены компоненты движения ж[0[-]4] системы (10.1), порожденного из начальной позиции (10.5) при действии закона управления {UAk(-),e,k} на базе стратегии UAk(-) (9.41). При этом черными квадратами обозначены целевые точки. Реализовавшееся значение показателя качества (10.6):

В предыдущей главе для решения задачи оптимизации гарантии при запаздывании в управлении и позиционном показателе качества (3.1), (7.4) была предложена рекуррентная процедура попятного построения выпуклых сверху оболочек вспомогательных функций (9.34)-(9.38). В настоящей главе для повышения работоспособности процедуры дается ее редукция, основанная на оригинальных овыпукляющих свертках и существенно понижающая размерность переменных, по которым требуется проводить овыпукление. Выделяется случай, когда эта размерность не зависит от числа N оценочных моментов времени #j в показателе качества (7.4) и совпадает с удвоенной размерностью 2п фазового вектора системы (3.1). Рассматриваются два примера.

Лемма 11.1 Пусть U Є [t ti), х Є Жп и р (-) Є V. Пусть t Є („,#] и движение x[U[-]t ] системы (3.1) порождено из позиции ( ,ж ,р (-)) под действием допустимых реализаций управления u[t [-]t ) и помехи v[U[-]t ). Пусть zo[U[-]t ] = {zo(t) GlB,UU t } - движение z0-системы (11.4), порожденное из позиции ( ,w0( ,z ,p (-))) теми же реализациями управления и помехи. Тогда имеет место равенство

Для каждого j = 1, fc положим Ьл = Ьл{т3 + 0) (9.32) и /г2 = /I2(TJ + 0) (11.1) и рассмотрим следующую вспомогательную Zj-систему. Фазовый вектор Zj = {г , , Zh2-\i Zo} Є M.dj этой системы составляется из векторов Zi Є Kdi, і = h\, Ь/i — 1, каждый из которых имеет динамику соответствующей -системы (4.3) и вектора ZQ Є Мп, имеющего динамику zo-системы (11.4). Таким образом, движение Zj-системы описывается

Похожие диссертации на Линейно-выпуклые задачи оптимизации гарантии при запаздывании в управлении