Задача конфликтного управления с наследственной информацией Лукоянов, Николай Юрьевич

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Лукоянов, Николай Юрьевич. Задача конфликтного управления с наследственной информацией : автореферат дис. ... кандидата физико-математических наук : 01.02.01 / Урал. гос. ун-т им. А. М. Горького.- Екатеринбург, 1996.- 22 с.: ил. РГБ ОД, 9 96-2/2949-1

Введение к работе

Актуальность темы. Реальные процессы управления протекают

шо в условиях неконтролируемых помех со стороны окружающей
№ или же под влиянием сознательного противодействия
зторого лица (противника). Целью, как правило, язляется
:ижение некоторого качества процесса управления, которое во
гих случаях удойно описывать с помощья подходящего показателя,
шкаюг задачи конфликтного управления, т.е. задачи об
авлении по принципу обратной связи, которое гарантирует
шально значение заданного показателя качества. Эти задачи
мализуются в рамках теории дифференциальных игр. Становление
\ теории относится к началу 1960-х годов. Оно было определено
витием математической теории оптимального управления и
эебностями практики. В настоящее время теория дифференциальных
сложилась в самостоятельную дисциплину, имеющую прочные связи
многими разделами механики и математики. В то же время для
гих задач конфликтного управления, в том числе для задач с
эрминальным показателем качества процесса, когда следует
тывать информацию об истории этого процесса, остаются не
сненными вопросы, прежде всего сзязанные с построением
ективных, реализуемых на ЭВМ, процедур для вычисления
имального гарантированного результата Сцены игры) и

мирования оптимальных стратегий управления.

Существенный вклад в развитие теории дифференциальных игр
ели работы Р.Айзекса, Э.Г.Альбрехта, В.Д.Батухтина, Т.Еашара,
эллмана, В.Г.Болтянского, А.Браисона, Р.Ф.Габасова,

Тамкрелидзе, В.И.Жуковского, М.И.Зеликина, Н-Калтона,

.Кирилловой, А.Ф.Клейменова, А.Н.Красовского, Н.Н.Красозского,

.Крендала, А.В.Кряжимского, А.Б.Куржанского, ДжЛейтмана,

Лина, П.Л.Лионса, М.Д.Локшина, А.А.Меликяна, Е.Ф.Мнщенко,
.Никольского, ЖЛОбена, Г.Ольсдера, Ю.С.Осипова, А.Г.Пашкова,
.Пацко, ЕНЛетрова, Л.А.Петросяна, Г.КЛожарицкого,

Лоловинкина, Л.С.Понтрягина, Б.НЛ1шеничного, Н.Ю.Сатимова,

.Субботина, ЕКСубботиной, А.М.Тарасьева, В.Е.Третьякова,

.Ушакова, У.Флеминга, А.Фридмана, Хо Ю-ши, А.Г.Ченцова, .Черноусько, А.А.Чикрия, Р.Эллиотта и многих других ученых.

В диссертации рассматривается задача конфликтного упразления
і динамической системы, описываемой обыкновенными

]ференциальными уравнениями, при показателе качества, заданном

как функционал от реализации движения. Исследуется случай, ког для формирования искомого управления надлежит использовать существу информацию об истории движения.

Цель работы. Разработка и обоснование конструкций д

эффективного вычисления цены игры и формирования оптимальн стратегий управления.

Методика исследований. Методы исследования опираются

достижения теории дифференциальных уравнений, теории устойчивое
движения, теории оптимального управления, выпуклого аналиг
теории случайных процессов, диссертация выполнена в рамк<
исследований по теории дифференциальных игр, ведущихся
Екатеринбурге. Используются идеи метода стохастическо

программного синтеза '^ и связанного с ним метода выпуклых свер: оболочек '' для вычисления цены игры; метод экстремального сдви; на сопутствующие движения * для построения оптимальных стратегий Научная новизна. Дана функциональная интерпретация процес»

управления, которая сводит исходную задачу конфликтного управлені Сс показателем качества, вообще говоря, нетерминальным) дифференциальной игре с терминальной платой, но уже в многомернс пространстве. Тем самым устанавливается естественная связь общ* теоретических положений в играх с терминальной платой и в играх нетерминальной платой. Это позволяет трансформировать должнь образом терминальные конструкции ⁾³ в конструкции (праві многомерные) для исходной задачи и свести ее к построению выпукль сверху оболочек для вспомогательных функций в многомернь пространствах. С другой стороны, предложен метод редукции этих г сути многомерных построений к построениям в пространства значительно меньшей размерности. Это повышает эффективное! решения исходной задачи и соответствующих вычислений на практике. Теоретическая и практическая ценность. Основные общи

^Красовский А.Е, Красовский Н.Н., Третьяков BJ2.. Стохастически программный синтез для детерминированной позиционной дифференциаль ной игры// Прикл. матем. и мех.. 1981. Т.4-5, вып.4. 0.579-586.

^Красовский ЕН. Управление динамической системой. М.Шаука, 19

³³Krasovskil N.N., Reshetova T.N. On the program synthesis of guarandeed control// Problem of Control and Information Theorj , no.6. P.333-343.

^Krasovskli A.N., Krasovskii N.N. Control under Lack о Information. 1995. Birkhauaer, USA.

верждения о цене игры и оптимальных стратегиях обоснованы по андартам математики. Результаты диссертации носят конструктивный .рактер и применимы к достаточно широкому кругу задач, іедлагаемьіе конструкции и процедуры могут быть положены в основу :я разработки эффективных алгоритмов и программ, реализуемых на М, для решения типичных конкретных задач управления.

Аппробация работы. Материал по теме диссертации докладывался

: следующих научных конференциях: Математическая школа

онтрягинские чтения - V" (Воронеж, 1994); III Международный минар "Многокритериальные задачи при неопределенности" рехово-Зуево, 1994); Международная конференция "Нелинейный и оретико-игровой синтез управления" (Международный математический статут Эйлера, Санкт-Петербург , 1995); III Международный минар "Негладкие и разрывные задачи управления и оптимизации" анкт-Петербург, 1995); Восьмой международный семинар "Динамика и равление" (Венгрия,Сопрон,1995).

Работа подробно обсуждалась на научных семинарах кафедры оретической механики Уральского госуниверситета, отдела намических систем Института математики и механики УрО РАН, федры системного анализа Московского государственного иверситета. Публикации. По теме диссертации опубликовано 3 статьи и 5

зисов докладов на научных конференциях.

Структура и об'єм работы. Диссертация состоит из введения и

ух глав. Нумерация параграфов сквозная. Список литературы лючает 72 наименования. Объем работы составляет 92 страницы шинописного текста.

Первая глава состоит из пяти параграфов. В первых трех даются
гтановка рассматриваемой задачи конфликтного управления и
нкциональная трактовка процесса управления, на основе которой
цача сводится к построению выпуклых сверху оболочек для
помогательных функций в многомерных пространствах. В

эдующих двух развиваемый подход иллюстрируется на материале ления конкретной задачи управления. Приводятся результаты иулирования процесса управления на ЭВМ.

1. Постановка задачи. Пусть система описывается уравнением

dx/dt = A(t)x + f(t,u.v), О < t < t ^ -в (1.1)

x Rⁿ, u « R^r, v e R

Здесь x - фазовый вектор, u - вектор управления, v - векто] помехи; t, і) - заданные моменты времени; п, г и s - данные натуральные числа; ACt) и f(t,u,v) - кусочно-непрерывные по 1 матрица-функция и вектор-функция соответственно, f(t,u,v) н; интервалах непрерывности по t непрерывна по совокупності аргументов Сточки разрьва по t функции f(t,u,v) не зависят от и і v), в точках разрыва ode функции непрерывны справа; и и v стеснені ограничениями

где символ <-,-> означает скалярное произведение.

Допустимы измеримые по Борелю реализации uIt[-H0 = (иШ«Р t «S t < » и v[t[-]-6) = MX,] e Q, t ^ t < ». Эти реализаци] порождают согласно (1.1) абсолютно непрерывные движения xCtC - Д-б =' (xCt], t ^ t < $} (начальное состояние x[t] задано).

Показатель 7 качества процесса управления возьмем в виді функционала 7^^-3-61), который имеет следующее строение

Выбраны натуральное число N, моменты времени t « tt,*S3, t

> t , (=1,...,N-1, t = , постоянные матрицы D размерності

p^Ct]xn, К p^Ct]< n, і = 1.....N. Набор ( D^C13x[t^C1]],...J)^[N]x[t^tNl] }

образует р-мерный вектор, p = р^С1]+...+р^[га. Выбрана некотора норма цСО в пространстве вР таких наборов. Полагаем

7 = 7(хС1;[-Ш = ц( {D^c1]x[t^[1]],...,D^CN]x[t^CN]]} ) С1.4

Такой показатель качества может быть задан изначально, или такої функционал вводится как аппроксимирующий для исходного показател. 7*Сх[Ъ[-]'в]), который учитывает континуум значений хШ.

Задача требует найти управление (или помеху), нацеленно минимизировать (нацеленную максимизировать) показатель 7 (1.4).

Эти задачи объединяются в антагонистическую дифференциальнуї игру двух лиц (и - действие первого игрока, v - действи второго) . Для всякой исходной истории xtt^-lt^l (Ъ ^ t,, < *6 эта игра имеет цену p(x[t[-]tJ). Игра имеет седловую точкі

оторая складывается из оптимальных стратегий {u(xCtC-]t],e), Cxtt[-]t],e)}. Здесь x[tMt) = Шт], t< х < t) - история вижения, реализовавшаяся к текущему моменту времени t; є > О екоторый параметр точности . Движения формируются в дискретной о времени схеме . Оптимальные стратегии иС-) и v(-) строятся ак экстремальные ' к функционалу рСО.

Таким образом, для формирования оптимального управления и онтроптимальной помехи достаточно уметь эффективно вычислять цену гры для каждой текущей истории x[tC-]t], как исходной.

Во многих случаях для построения оптимальных воздействий не бязательно учитьгаать всю историю движения к текущему моменту ремени t, достаточно лишь учитьгаать какую-то ее часть. Например, ели функционал 7 П-40 позиционный , то достаточно опираться олько на текущую позицию Л,хСШ.

В рассматриваемой дифференциальной игре при условии С 1.3)
едловая точка достигается на чистых стратегиях. Если условие
1.33 не выполняется, то решение переносится в класс смешанных
тратегий . При этом вспомогательные построения, которые

оставляют главное в этой работе, по существу не меняются.

2. Функциональная трактовка. Пусть к моменту t « ^,-б) еализовалась история x[tCOt]. Назовем функциональной позицией,

оторая соответствует этой истории, набор ft, z[t]}, где

zEtl = (xCtUCtD, хШ = С х^тШ x[tl } С2.1)

_J[fl[ rD"W]. t^Ctl«t

"I D^tt]XCt^[t],tMt], tCt]

Здесь XCx.t] - фундаментальная матрица решений для уравнения x/dx = АСх)х.

Теперь показатель у С 1.43 можно записать в виде 7=ц(хГіЯ).

Эволюция функциональной позиции ft, z[t)} = ft. СхШ,хШ)> писывается уравнениями C1.1D и

dxEtJ/dt = iCt,u.v), t? $ t «J tf (2.2)

*Ct,u,v) = t f^C1lCt,u.v) f^CMCt,u,v) } (2.3)

[lb*,,,,-, - fD^Ct]X[t^Cf3,t]Kt,u,vD, tC]

^l]Ct,u,vD = f ^DC

lo,

r ^, = , -_tI(1

Красовский A.H. 0 позиционном минимаксном управлении// Прикл. іатем. и мех., 1980. Т.44, Вып.4. 0.602-610.

Условие седловой точки в маленькой игре для f(t,u,v) буде'

выполняться в силу (1.3). Начальное состояние zCt]=CxCtl,xtt]) для системы С1.1 ),(2.2) однозначно определяется начальным состоянием

о ^л

x[t,] системы С1.1). Введем показатель качества 7 Д^ля движениі

z[tC-H] = tettl, t ^ t ** -Ф системы (1.D.C2.2)

7 = 7CzC«) = цСхГ-еі) C2.4

где ц(-) - норма из (1.4). Значение показателя 7 (2.4) совпадает со значением 7 С1.4).

Рассмотрим дифференциальную игру (1.1),(2.2)-(2.4) :

пространстве функциональных позиций Ct.zCtl} уже с терминально]

А А- А

платой 7 (2.4). Эта игра имеет цену p^u(t_i((,z[t_](t]) и седловуи точк; {u(t,zCt],eD, v(t,zCt],e)} . Здесь zCtj,,] - исходное состояние

системы (1.1),(2.2), z[t] - ее текущее состояние. Оптимальны'

А- А А^. А р

стратегии u (t,zCt],e) и V4t,zCt],e) строятся как экстремальные^

к функции цены р Ct.zCU).

Из (1.1)-(1.4) и C2.D-C2.4) следует, что цена pCt,zCtl игры CI. 1),(2.2)-(2.4) совпадает с ценой p(xtt[-]t]) игрі (1.1)-(1.4), а стратегии, оптимальные для игры (1.1),(2.2)-(2.4) при условии С2.1) будут определять воздействия и и v такие же, ка и оптимальные стратегии для игры (1.1 )-(1.4). Это означает, что п сути дела игры (1.1)-(1.4) и (1.1),(2.2)-(2.4) эквивалентнь

Поэтому терминальные конструкции ^ трансформируйте,

естественным образом в конструкции для исходной игры (1.1)-(1.4] При этом следует только учесть, что в отличие от стандартно: дифференциальной системы, в случае (1.1),(2.2),(2.3) в качеств

возможных состояний z[t] выступают векторы не с любым наборої

компонент { xCti, х 4t3, t=1 N }, но лишь такие векторь

компоненты которых связаны соотношениями С2.1). .

3. Вычисление цены игры. Пусть реализовалась история

x[tC-)1^, t«S t_#< -й движения системы С1.1), которая согласи

С2.1) однозначно определяет функциональную позицию t_{,zCt_)fc}>}

{tt.CxCtjJ.xftgl)}. Следуя методу стохастического программног

синтеза ^, введем программный экстремум. Для этого назначи; разбиение

\=\^{т/ = ^{V W ^Tj+i>V tj+rtj < ^ak« ^¹ ^k- ^Tk₊i=* ^(3J)

отрезка времени ft^/fl], в которое включим все моменты времени t « [t^/ffl, ( = 1.....N из С 1.4) и все точки разрыва функций ACt) и fCt.u.v). С разбиением Дь C3.D свяжем независимые в совокупности случайные величины {<,...,^}, распределенные равномерно на отрезке 0 < і, ^ 1, J=1,...,k. Набор {^,...,^} трактуется как элементарное событие со из вероятностного пространства СП.В^.Р}, где П = Ссо) есть единичный куб в k-мерном пространстве, В^ -борелевская о-алгебра для этого куба, Р = РСВ) - лебегова мера на

этом кубе, В е В^. Пусть 1Ссо) = { 1^С]Ссо) « R? , (=1 N }, со

есть векторная р-мерная случайная величина, определенная на {ft.Bj.PL Программный экстремум еСО определяется равенством

~~eCxtt^tOt^.^) = eCt^ztt,],^) =~~

~~_т С3.2)~~

= sup Г< 1„ , x[tJ > + МС Е Г max mln < 1*Ст„оЯ , 1Ct,u,v) МтЛ
IUC-ЖН * * JHTjVeQueP ^J -I

~~IIICOI = vralmax іі*С1Ссо)), l„=MQCco)}, 1*Ст,,со)=МС КшЩ, , }, J=1 ,...Jc~~

~~со « CI ^J "j~~

Здесь ц*СО - норма, сопряженная к норме цСО из С 1.4). Символ МСО означает математическое ожидание, символ МС-|0 - условное математическое ожидание.

~~При учете эквивалентности игр C1.D-C1.4) и С1.1),С2.2)-С2.4) справедливо равенство '~~

lira eCxtt[-]tJ,u_k)= Ito eCt^.zttJ^j.) = pCt_)(t.ztt_Jk])=p⁰Cx[tCOt_]((])
k-»oo,6j.-»0 k-»to,6^-»0

~~Программный экстремум еСО C3.2) может быть вычислен следующим образом . Определим область~~

~~Ъ = С 1: \1*<.Ї) < 1 } СЗ.З)~~

~~где 1 = С 1 е w , (=1 N } - уже детерминированная~~

~~векторная р-мерная переменная. Обозначим~~

~~^TJ+1~~

~~AiKCt₄,l) = Г max mln < 1 , 1Ct,u,v) > dx, 1 e L, j=\ k C3.4).~~

J * 1j VeQ u«P

~~Построим рекуррентную последовательность функций~~

~~Ф^СЦД) = 0, ф/t^.l) = {$jCV» C3.5)~~

~~$,а_ж,і) = дф/цд) + ф/₊₁а_ж,і), і е l, /=к 1~~

Здесь символ фСІЗ = -Сі|>(-)} означает выпуклую сверху оболочку функции ф(-) в области L, т.е. минимальную вогнутую функцию, мажорирующую i|>CD, 1

~~Справедливо равенство~~

~~eCxCt^C-tt^U^ = eCt^.tft.JA.) = max f< 1 , ittj > + ф^Д)]~~

~~Таким образом, задача свелась к построению последовательности функций Ф/СО C3.5D.~~

4. Одна задача конфликтного управления с интегральными оценками управляющих воздействий. Проиллюстрируем подход, предлагаемый в п.п. 2 и 3, на примере следующей задачи. Пусть система теперь описывается уравнением

~~dx/dt = ACttx + BCttu + CCttv, t«* t^ -ft C4.1)~~

~~где ACtD, BCt) и CCt) - непрерывные матрицы-функции. Пусть как и~~

выше заданы чивсло N, моменты времени t и матрицы D , І=1,...Л. Требуется найти управление СШ и помеху (v), ' которые нацелены соответственно на минимизацию и максимизацию показателя качества

~~_7ж = | і D^c1W^1]],....D^[%t^[N]] } | +~~

~~в + ₀J К иІтЗ , ttCOulTl >_t - < vtTl , ffiCOvW >Ит: (4.2)~~

"^t*

~~где | I - евклидова норма; ФСК и ЯШ - симметричные непрерывные~~

~~матрицы-функции. Квадратичные формы < и , ФСШ > и < v , !Kt)v >~~

~~- определенно-положительные для любого t « It^,*].~~

~~В данной задаче мгновенные значения воздействий и и v априори~~

~~не стеснены ни какими ограничениями, но в показателе 7* C4-2D~~

~~имеются интегральные добавки, которые играют роль штрафа,~~

~~накладываемого на реализации управления и помехи. Эти штрафующие~~

~~оценки обеспечивают ^ ограниченность оптимальных воздействий и⁰ и v.~~

~~-Наряду с фазовым вектором х удобно ввести дополнительную скалярную~~

~~переменную у, динамика которой описывается уравнением~~

~~dy/dt = < и , ФСШ > - < v , Kttv >, ytt] - ft t < t < « (4.3)~~

~~Далее, в соответствии с материалом из п.2, введем вектор~~

функционального состояния xCtl, который связан с историей xtt[-]tJ движения системы (4.1) соотношением (2.1), и рассмотрим

~~тройку (t.xCtl.y). Получаем вспомогательную дифференциальную игру с системой~~

~~dxttl/dt = B(t)u + C(t)v (4.4)~~

~~dy/dt = < u , tttDu > - < v , tDCttv >, t < t < «~~

~~которая описьшает эволюцию тройки Ct.xCtl.y}, и с показателем качества~~

~~7* = \іШ\ + уШ (4.5)~~

~~который оценивает движения { X[t(-]15], ytt^M-ffl } системы (4.4).~~

~~Л А~~

~~В (4.4) матрицы-функции B(t) и C(t) определяются через B(t) и C(t)~~

~~подобно тому как в (2.3) вектор-функция I(t,u,v) определялась через f(t,u,v).~~

~~В игре (4.5),(4.6) существуют цена p(t,x[t],y) и~~

~~оптимальные стратегии { u(t,x(t],s), v(t,x[t],E) }. Следуя~~

~~конструкциям из п.З вычислим функцию p,Ct,x(t],y). Пусть~~

~~АЛ -.~~

~~реализовалась позиция tt^x^y,,} = {t^xItJ.ylt^X t* $ t* < * Назначим разбиение~~

W^T/ = ^{TJ^: ^T1 = V ^TJ₊1 > ^zr Vl - ^TJ ^ ^ak' ^J^-"^x ^Tkfl = *

~~отрезка It^/fll, в которое включим все точки t « Ct^.^l из (4.2).~~

~~Область L и функции Дф/(Ъ_$Д), 1 « Ь, ,/=1,....к. здесь определяются следующим образом~~

*М

~~Ь - { 1: |1| «J Г}, 1 = С 1^Ш т RP , =1 N } « RP~~

~~(4.6)~~

~~Лф/VD = _х Г < 1 , NOtfl >dx N03 = -4- t С(Т)Ш~¹ (т)С^ТОг) - В(т)Ф"¹(т)В^Т(т) ]~~

Здесь верхний индекс "Т" означает транспонирование; Ф (т) и Ф (т) - обратные матрицы для ФОЗ и Ф(т) соответственно. Опираясь на

~~Л А~~

~~функции Дф/СЬ^Д) (4.6) построим функции фД,,Б (3.5). Поскольку~~

~~здесь область L - евклидов шар, а функции AtKd^.l) (4.6) суть квадратичные формы, то проведя построения получаем, что~~

~~^(t*,l) = < 1 , ?(.tj)l > - Я}|1|² + \J. «М....Л~~

FCO = Г ЖОсП:, X*. = max шах х
х ^J d=/,...,k+1 q=1 р ^q

~~Здесь действительные числа \ , q = 1,...,р суть собственны~~

~~числа матрицы Кх, d=1,...,k+1.~~

~~Величина программного экстремума для игры (4.4),(4.5 определяется равенством~~

~~e_ta^,y_r\) = max [< 1 . х„ > + ^Ctj.D] + у* =~~

~~= max F< 1 , х\ > + < 1 , FCtJl > - kUl\²] + A.f + у.~~

~~Откуда, осуществляя предельный переход при шаге б^ разбиений \ стремящемся к нулю (к-»ю), выводим~~

~~р^А-у*³ -,5 [< і . і, > + < і . P^V¹ > - ^tj¹'²] ⁺ Ч» ⁺ ^у-~~

^г*^е -, *

~~(4.7:~~

~~Х = тах^ ХПЭ, t_#~~

~~Здесь Мт] - максимальное собственное число матрицы F(x).~~

~~Равенство (4.7) определяет функцию цены игры (4.4),С4.5)~~

~~Оптимальные стратегии u(t,xtt],s) и v^(t,x[tJ,E) строятся~~

~~эффективно как экстремальные^ к функции pj;(t,xtt],yCt]) С4.7),~~

~~При условии (2.1), С4.3), величина р(0 С4.7) дает цену рС-), г~~

~~стратегии и(-) и v^(-) - оптимальные стратегии и(0 и v(0, для исходной игры (4.1),(4.2).~~

Первую главу завершают результаты симулирования на ЭВМ процесса управления для модельной задачи типа (4.1),(4.2).

Итак, в первой главе рассматриваемая задача конфликтного управления (1.1 )-(1.4) сведена к построению выпуклых сверху

~~оболочек Ф»(1) функций ф,(1) (3.5) в области L (3.3) многомерного~~

пространства ВР, р = р +...+р . Интерес представляют задачи, в которых число N, следовательно, число р большие. Поэтому, если не удается, как например в задаче из п.4, найти какой-либо эффективный способ конструирования указанных оболочек, то вычисления становятся трудно реализуемыми, даже в случае небольшой размерности п фазового вектора х.

~~Валено, что вычисление е(-) (3.2) через построения (3.3)-(3.5)~~

в многомерном пространстве можно свертывать к подобным построениям в пространствах значительно меньших размерностей. Это показывается во второй главе. Вторая глава состоит из четырех параграфов. В первом параграфе дается общая схема упомянутой редукции. В последующих трех эта схема проясняется на материале задач с типичными оценивающими показателями.

~~5. Свертка процедуры вычисления цены игры. Равенство (3.2) можно трансформировать к равенству~~

~~eGrttA-ltJAJ = sup Г Е * < її¹¹ . D^[l]xCt^[l]] > + ^к llCOK1^L t=1~~

~~k Vh t~~

+ < m„ , XC-O.tJxCtJ > + MC E Г max mln < m(x„ca) , XC-O/dfOr.u.v) хіт}
* * * J=Hj v^q u^P ^J J

~~где C5.1)~~

~~h(t) = max (, t^[1 «? t. t=1 N~~

~~(если нет ни одного I С t=1 N ) такого, что t Ч t, то h(t) = 0)~~

~~l[^u = M{l^t1Cufl}, t=1 httJ, m₄ = M{ E Х^т[ї^[і]ДО^І11т1^шСсц> }~~

* * * t=h(t_#)+1

~~_N C5.2)~~

~~т(т„ой = Ж E X^Ttt^I1.«tf^0Tl^[t3Gifl К......Є» ). J=1,...,k~~

~~^J l«hOij)+1 ^} ^J~~

~~В C5.1) учтено (2.1) и (2.3). Это позволяет вместо работы с функциями ф/(13 и <р»(1) от многомерного вектора 1 = { 1,...,1 }~~

~~работать с подходящими функциями от вектора m = Е X It vfilD 1 ,~~

~~(=h(T,)+1~~

~~m « Rⁿ и векторов 1 , t=1,...,h(T,), которые составляют лишь~~

~~часть компонент вектора 1. Именно, обозначим~~

AiJ>/(t₄,nO = Г шах mln < m , XC^,*,t]1Ct_>u,v) хіт, m « к, J=1,...,k (5.3)
J т, VeQ u«P

~~Определим области~~

GfXj = {Cl(j). m) = ({ I^е ^t], t=1 h(.%j) У , m):

~~m = E^N X^T[t^[tW^flTl^[a. 1 = < 1^C1] 1 ) « L), /=1 k₊1~~

(=h(T^)+l ^J

Здесь суммирование по убывающему индексу полагается равным нулю. Множество L определено в (3.3). Построим последовательность

~~функций cpjCt^.l^.m), С1(п.пО « ^G№J> /=k+1 ,...,1. При /=k+1 полагаем~~

^₊l"*.l(k₊1D.ra3 = 0. ^Q(k+1V^m) ^е ^Gk+1^Ct*^} Далее по индукции. Пусть для 1 < J+1 ^ к+1 уже построена функция +iCt*il(f₊i)i4>)f Cl(j₊₁),m) є Gr₊₁(t.p. Заметим, чтс

поскольку все моменты t « It^/ffl, t=1,...,N из (1.4) включены і разбиение Aj. С3.1), то при переходе от J4-1 к J возможен лишь один из двух вариантов: 1) Ь(т,₊₁)=Мт,), т.е. момент т,₊₁ не совпадаем

~~НИ С ОДНИМ ИЗ МОМеНГОВ t , 2) h(Tj₊^)=h(Tj) + 1, Т.Є. Т/^ = t ,~~

~~h=hCT/₊₁). Для текущего J определяем где в случае h(T,₊j)=h(T,) полагаем~~

~~а в случае hCTj₊0=hCT»)+1 определяем~~

~~t|>jCt^,l₍₍p,m) = Atfytt^m) + max ф^а^а^Д},!^), h=hCTj₊₁)~~

~~1^ш.т„ где максимум берется при условии~~

m, + X^T[t^[h],i3]D^Ch]Tl^[h] - т, С(1_(>р,1^ЕЫ},тр «е G_J+]ttJ

~~Продолжая индукцию до /=1 построим функцию 9^Ct_#,l^j,m), (1^-,^0 « G^Ct,p. Можно проверить, что справедливо равенство~~

~~eCxttU-ttJAJ = max Г Е * < l^[t3 , D^ct3xCt^Cl]] > +~~

* * ^к Cl_c1),m)«G₁Ct^)L t=l

[11 ^thCV³ і
+ < m , XC-e.tJxItJ > + ф^г^Л¹^,...,1 },m)|

Таким образом дело сводится к построению оболочек ф/t ,,,,1(/) ,т), которые конструируются овыпуклением функции ф/Ct^.l,- rj,m) в областях GjCt_t) по составному аргументу С1(л,т), размерность которого убывает вместе с индексом / и становится значительно меньше чем размерность р вектора 1 « L.

Более того, во многих типичных случаях, когда известна структура нормы из (1.4), дело сводится к работе лишь с функциями от вектора т. Правда при этом, подчас возникает потребность в некоторых дополнительных параметрах. Это, кратко сформулированное

~~здесь общее утверждение, поясняется в следующих параграфах на конкретном материале.~~

~~6. Позиционные функционалы. Рассмотрим дифференциальные игры (1.1)-(1.4) со следующими показателями качества (1.4):~~

~~Г_СП- H(i)«D^t1]xt^m] D^C№xtt^CN]]» = Е v!^UCD^[iW^UD (6.1)~~

~~7_C2_D=^2)№^C1]x[t^[1]],...,D^tN]x[t^CN1]}) =max {^^](D^ct]xtt^tt]])} (6.2)~~

~~7_C3)= |i₍₃₎(ffi^I11xtt"¹]_D^[Mx[t^[HI]}) =( E (p.^Ct](D^Ct]X[t^tt]]))²)^1/2 (6.3)~~

~~Здесь \x "() - некоторые нормы в ЛУ ,( = 1,...Л~~

Функционалы 7(1). 7(2)' 7(3) являются позиционными , поэтому достаточным информационным образом ^ для оптимальных стратегий в играх (1.1)-(1.3) для (6.1), (6.2), (6.3) служит текущая позиция йдСШ.

Редуцированные процедуры построения функций »() и .их выпуклых оболочек от 7(1) ^и 7(2)» ^а ^с другой - сохраняет общие черты соответствующих построений.

~~Итак, рассмотрим игру (1.1)-(1.4) с показателем 7(3) (6.3). Норма Ц*з)(*Э» сопряженная к норме Ц(з)^* ^имеет ^вид~~

~~р*3)(1) =( Е (ц^и]*а^СЬ)²] , 1 = { l^Ctl « RP , t=1 N }~~

где р. СО, 1=1,...Л - нормы, сопряженные к нормам ц СО. Поэтому при вьийслении верхней грани (5.1) случайные векторы т(тг,/1Й (5.2) стеснены ограничениями, которые зависят от скалярных

величин іАт,,сц) =1 - Е ^Сц^І0*С1^І0СйіШ². Оказывается, что здесь, как и для 7(1) и 7(2)' лалее можно перейти от случайных величин г "((їй, ш(т,,сіі) и v(-r,,bO к детерминированным I^е ^н, m и V. Опираясь на функции Дф/СЪ^^п) (5.3) построим последовательность областей gV³4t_#) в пространстве Р/¹"¹"¹ пар (m,v), и

~~последовательность функций (Pj^Ct^m.iO, (m.v) « Gj^Ctp, J~~

~~k+1,k 1. Строить будем рекуррентно по шагам разбиения Д^т,} (3.1).~~

~~При J=k+1 полагаем~~

GJ^Ctp = [ Cm,v): 0«jv<1,m = o}-, ф³}а_#,т,г0 = 0, Ст.гО є GJ^Ct Пусть для J+1 уже построены область GYj^Ct^) и функция ^cP7+r^t*^,m,v^ ^^m,v^ ^е ^GJ+1^*P" Построим сначала область Gj(XJ и вспомогательную функцию ф^³] *(Ц.т,и), (m.v) е Gj tt_#). При переходе от Т/₊^ к т, возможны два случая. В первом случае имеем hCT/)=h(Tj₊p. Тогда определяем

~~G$³⁾CV = G$CV. Ф$*СЬ,,пи» = +1)-1, тогда определяем G^Ct*) = { Cm,v): 0T[t^Ch],«]D^Ch]Tl, 1 « R.P ,~~

~~(ц^Ш*Ш)² < t^-v², v^Z v, Cm,,!»,) « Gjjjctp, h=hCTj)+1 } (6.4)~~

~~^c$H*^(t*'^m,v:) ⁼ ^max ^<Pj+i^ct*-^m*»¹'*⁾' ^Ctn«^v:) ^e ^Gj^3)cV~~

~~(3)* где максимум, определяющий вспомогательную функцию ф)₊| (-),~~

вычисляется по всем возможным парам (m^/i^), которые согласно C6.4-D отвечают заданной паре Cm.v) « Gj (t_#). Далее полагаем

~~^(ЦжіО = AfyCt^m) + ф^*(%,тлО, (m,v) « Gj^3DCt_#)~~

~~Ф^СЦДМ) = { 4>$%„„-,i;D }q, G=Gj³Jtt,p. O^HI~~

~~где Gj yCtp - сечение области Gj (t_#) гиперплоскостью v = const.~~

Здесь символ tilKt^.-.v)}^ означает выпуклую сверху оболочку функции фСЦломО, конструируемую овьшуклением по . m в области G, при фиксированных значениях остальных аргументов. Продолжая индукцию до /=1 построим область G^ Ct^D и функцию ф' (t^m.v), Cm.v) « GJ^Ctp. Тогда величина

~~1/2~~

~~e₍₃₎Cx[t^-]t_#]^_kD = max [[1-²) Е *(n^Ct]CD^Ci]xCt^CC]]))²] +~~

будет обладать надлежащими свойствами u-стабильности и v-стабильности . Из этих свойств выводится , что величина Є(з)С') аппроксимирует цену p^Cxtt^t-Jt^}) игры (1.1)-(1.3),

~~(6.3). Таким образом, дело сводится к построению выпуклых оболочек~~

~~9^(1^,-.10 функций ^^3}tt^,-,u)-'B областях Gy^Ctp. О ^ v sj 1,~~

~~размерность которых совпадает с размерностью фазового вектора х~~

~~системы (1.1) и не зависит от количества N точек t . Подчеркнем,~~

что здесь, как и во многих других случаях, в том числе в играх с
показателями 7м) и їг?)' ^вь,пуклые сверху оболочки конструируются

~~только по переменной m при фиксированных v«C0,11. Это объясняется~~

тем, что области gS 4tp, J=k+1,...,1 обладают свойством
однородности по (m,v), т.е.

~~если (m.v) «s G^.^3DCt^3» то (.щщЛ « G^ap, t) ^ 0, tjv ^ 1 (6.5)~~

~~Отсюда выводится, что функции ф^ (tj.m.v), /=k+1 1 будут~~

однородными со степенью единица по совокупности (m,v). Поэтому конструирование выпуклых сверху оболочек функций tyj (t„,,n)A0 в областях Gj (tp по паре (т,т>), приводит к тем же самым функциям

(V) '

~~Ф*> (t_#tm,v), которые строились выше овыпуклением только по m в сечениях Gj y(tp при фиксированных v « [0,1].~~

~~' (31~~

Итак, дано построение функции ф^ С-), которая согласно предыдущему определяет цену игры (1.1)41.4) и оптимальные стратегии для типичного показателя (6.3).

Далее на конкретном материале показывается, что, вообще говоря, при построении функций ф^С-) надлежит применять операцию овыпукления уже по всем аргументам из пространства, которое пополняет пространство Rⁿ векторов m добавлением вспомогательных параметров (таких как параметр v). Этот важный факт является одним из главных результатов в настоящей работе.

7. Непозиционный функционал. Рассмотрим дифференциальную игру (1.1)41.4) со следующим типичным показателем качества типа (1.4). Заданы два разбиения отрезка времени ttj/ffl:

CtJ [(J _М1 [t+1] EtJ
\% *> - < *q *: V^і > t?. t_q 4 >_tq 4". _{q= 1 Ng-t }

~~(7.1) q = 1, 2~~

~~tl_t] [t₂]~~

~~max -1 t₁ ' , t₂ j = в~~

~~Показатель качества имеет вид~~

~~N₁ I LI [,] ttJ 7(4) = 7_M)CxltH«) = Г U, '(D, ' xtt, ¹ ] ) +~~

~~, tlo) tt_P] [U ,~~

~~+ max j ^2 ^c ^D2 ^xtt2 ⁿ } ^c7'²⁾~~

~~где D_a ^ч - известные постоянные матрицы размерности p_Q ^ч х п, 1 <~~

~~р_ ^ч < п; (і ^ч СО - некоторые нормы, - = 1,...,Ng, q = 1,2.~~

Функционал 7(4) ^-²^ ^есть аддитивная комбинация функционалов 7₍₁₃ (6.1) и 7(2} ^С6-^2:)' ^но ^Б отличии от 7(]). 7(2) ^и 7(3) ^С6-^з:) уже не является позиционным. Для формирования оптимальных стратегий в игре с показателем 7(4) нужно уже существенно учитьвать информацию не только о текущей позиции {t,x[tJ}, но и об истории движения xttC-]t]. Случай игры (1.1)-(1.4) с показателем (7.2) и доставляет тот конкретный материал, на котором удобно показать, что в общем случае при вычислении программного экстремума е(-) (3.2),(5.1) надлежит при построении функций Ф/О) овыпуклять по совокупности всех аргументов, которая складьшается из m и дополнительных параметров, и которая определяет соответствующие области G, Св данном случае - по парам (m,v)).

~~Возникающие здесь области G, (tp уже не обладают свойством однородности (6.5).~~

Процедура вычисления величины еО) (3.2), С5.1) в данном случае такова. Пусть реализовалась история xCtC-3t_#] движения системы (1.1), t < Ъ_ш < А и выбрано разбиение

~~Д_к=Д_к{т^} = { ху. T_f= t_#, ty₊₁>tj, J=1,...,k, f_k+1= -ft > C7.3)~~

~~отрезка ["t^.-ffl, в которое включены все точки разрыва функций Щ) .~~

~~и f(t,u,v) из С1.1) и все точки tg Ч «- tt^.-ei, t_g=1,...,N_, q=1,2 из '(7.1). Определим функции Дф,(1„,т) согласно (5.3). Построим~~

функции (р^О^дпО, Cm.v) « G^tt,,), m е R?¹, v « R, J
k+1 Де 1. При J=k+1 полагаем

~~GJ$(V = { (m,v): m = 0, 0 «J v < 1 }. ^ja^rn.v) = 0, (m,iD « GJ$(tp~~

~~Пусть для 1 < /+1 < к+1 уже построены область G^*](t,J и функция (pj^Ct^m.v). Обозначим~~

~~h Стг) = max (_q, t_q ^ч < т, і = 1 N_~~

~~^СУ Сесли нет ни одного i_ такого, что t_Q ^ч ^ т, то h_a(x) = О, q = 1,2)~~

~~Разбиение Д^ (7.3) выбрано так, что для любого J=1,...,k может случиться лишь один из трех вариантов:~~

1) hj(T#₊₁)=hjOc;), ^СТ/цЭ^Ст,), ^т-^е- момент времени т#₊^
не совпадает ни с одной из точек разбиений Ajj {t_a ^У (7.1), q=1,2;

~~^(h1^CTf+1^)]~~

~~2) h^Mi^HI. ^Cc^ )=1^), т.е. т_/+1 = t₁ J⁺¹ ;~~

~~[hpCT_f+1)l~~

~~3) h^^Cc,). ^1^)=^)+1. т.е. т_/+1 = t₂ J⁺¹ ;~~

~~Построим сначала область Gj (tp и вспомогательную функцию (pJ⁴}*(Vm,v), Cm.v) « Gj⁴⁾Ctp. В случае 1) полагаем~~

~~Gj⁴⁾(tp = G$⁴jCt,J, #,m,v) = Ct**^m»^v:)- ^(m'^vD ^e ^^ V~~

~~В случае 2) определяем~~

~~pth]~~

~~Gj⁴⁾(t_t) = { CM): ra = m_t + X^TCt5^W,«D5^WTl, 1 « R ¹ ,~~

~~ц5^М*(1) ^ 1, h = h^TjJ+l, Cm„,v) m GJJjctp } (7.5)~~

[J* CtJ
Здесь ц_ ^ч (О - нормы, сопряженные к р~ ^ч СО из С7.2), t_=1 IL,

~~q = 1,2. Функцию (р^* СО в этом случае строим следующим образом:~~

~~#,ni,v) = max g>$J}ct„.m„,iO. ОмО « oJ⁴⁾(t^ (7.6)~~

~~В (7.6) максимум вычисляется по всем векторам т_ж, которые в~~

~~согласии с (7.5) отвечают заданной паре Cm,v) « Gj (t.0.~~

~~В случае 3) определяем~~

~~pth]~~

~~0$⁴⁾Ct») = [ (m,v): 0ти₂^ы,Ф]0₂^ыт1, 1 « R ² ,~~

~~^2^M*(1) < v-v„, v^ v, h = h₂(Ty)+1, (m_#,vp « oJJJft») } (7.7)~~

~~⁽<'j+i*^ct*^,m'^v:) ⁼ ^max 4»j+i^ct*'^m*'V' ^Cm,v) ^e ^Gj^4)(t*³ ^c7>8)~~

~~В C7.8) максимум вычисляется по всем парам (m^.f^), которые~~

~~согласно С7.7) отвечают заданной паре ОтідО є Gj 4t_#). Теперь полагаем~~

~~cp^Ct^m.v) = { ф^а,.-.-) >q. G^J^Ct*) С7.Ш~~

~~3Ct,,m,v) = AipjCt^.nD + (pjjj Ht^m.v), Cm.iO « G^Ctp~~

' В C7.9) символ Щ1 ^,-,-^ означает выпуклую сверху оболочку функции tyCt^m.v), которая конструируется овыпуклением уже по совокупному аргументу (т,гО в области G. Продолжая индукцихз до J=1,

~~получим область G}⁴⁾(t.J и функцию (f^(.t_M,m,V), (m,v) « G!j⁴⁾Ct J.~~

~~Обозначим~~

_n ^h1^Ct*^} \ІЛ ИЛ [ІА

~~otxttj-lt,]) = E |J.₁ С D_t ¹ xtt, ¹ ] ) t₁₌1~~

~~_n , [lp] Ct₉] [Ы -~~

~~aeCxIt[-]tJ) = max I (x, ^d С D₉ ^ax[t_? ^z] ) }~~

* * l₂»1....Ji₂Ct_#)¹^ 2 2 J

~~Введем величину~~

~~е_С4)СхиЫЦ],Д_к) = aOrft[-]ig3 + max [ aeCxi:tC-3t^3C1-vD +~~

~~Cm.iOeG^Ct,)~~

~~+ < m , XW.t^xCt^l > + ф^сг^дмо] С7.1Ш~~

Устанавливается, что величина е^СО С7.1Ш обладает нужными свойствами и-стабильности и v-стабильности. Так как справедливо равенство

~~e₍₄₃(xCt[-]«,u_k) = 7_C4)Cxtt[-3«D~~

~~то из этих свойств следует, что величина e^jCxlt^Htj,,],^}~~

~~аппроксимирует цену p^-jCxCtC-3t^3) игры (1.D-C1.3), С7.2).~~

~~Итак, описанная процедура вычисления величины е^-^СО на базе~~

~~функций cpS Ч-), которые получаются овыпуклением функций щСО в~~

~~областях Gj по паре аргументов Cm,v), приводит к цене Р4)('Э~~

~~игры (1.1)-(1.4) с показателем 7(4) (7.2).~~

Вторую главу завершает пример, который показывает, что овыпукление именно по паре Cm,v) существенно. В этом примере

овыпукление только по m при каждом фиксированном v не дает цену игры. Приводятся результаты симулирования процесса управления на ЭВМ, подтверждающие теоретические выводы.