Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Метод программных итераций в задачах управления с информационной памятью Кулиев Рафик Мейхош оглы

Метод программных итераций в задачах управления с информационной памятью
<
Метод программных итераций в задачах управления с информационной памятью Метод программных итераций в задачах управления с информационной памятью Метод программных итераций в задачах управления с информационной памятью Метод программных итераций в задачах управления с информационной памятью Метод программных итераций в задачах управления с информационной памятью Метод программных итераций в задачах управления с информационной памятью Метод программных итераций в задачах управления с информационной памятью
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Кулиев Рафик Мейхош оглы. Метод программных итераций в задачах управления с информационной памятью : ил РГБ ОД 61:85-1/2834

Содержание к диссертации

Введение

Глава I. Метод программных итераций для дифференциальных игр с информационной памятью 18

I. Определения и обозначения 18

2. Задача наведения на функциональную цель 26

3. Итерационная процедура построения системы стабильных функциональных множеств 33

4. Пример 46

5. Задача управления с информационной памятью и ограниченным числом переключений 50

б. Допустимые процедуры управления 60

7. Множество успешной разрешимости в задаче уклонения с функциональным целевым множеством при ограничении на число переключений 65

Глава 2. Управление селектором многозначного отображения, удовлетворяющего условием физической осуществимости 68

8. Формализация процедуры последовательного выбора программ 68

9. Существование абстрактных пошаговых движений 77

10. Необходимое условие осуществимости последовательного выбора в терминах двойственности 82

II. Соотношение конструкций пошагового управления 90

12. Достаточные условия осуществимости последовательного выбора 96

13. Пример 118

14. 0 дискретной постановке задачи управления селектором многозначного отображения 122

Литература

Введение к работе

Актуальность проблемы. Диссертация посвящена некоторым вопросам теории дифференциальных игр, а также теории многозначных отображений, представляющей собой сравнительно новую область математики, лежащую на стыке топологии, нелинейного функционального анализа и теории функции действительного переменного. Исследование рассмотренных в данной работе задач основывается на концепции, развиваемой Свердловской школой теории дифференциальных игр под руководством академика Н.Н.Красовского. Начиная с шестидесятых годов актуальность рассматриваемых задач и их большой теоретический интерес вызвали интенсивное развитие теории дифференциальных игр, теории дифференциальных включений и теории оптимального управления. Существенный вклад в постановку задач этих теорий и их разработку внесли советские и зарубежные авторы: Л.С.ПонтрягинС^-^/У» Н.Н.Красовский5"-//J , А.В.Куржан-ский {.If- 1в] , Е.Ф.Мищенко], М.С.Никольский[3.J-JL9] , Ю.С.Осипов [30-ЗЛ] , А.И.Субботин [4?-So] , Л.А.Петросянз/-35/, Б.Н.Пшеничный^-^,^, А.А.Чикрий [60-6 f] , Ф.М.ЧерноуськоШ-^, Р.Айзексі7 , В.Флеминг[63-64]* А.Фридман [6^-66], Е.Роксин ЕМ.

В этих работах большинство результатов относится к случаю, когда управляемые динамические системы описываются системами дифференциальных уравнений.

В данной работе в избранных классах процедур управления с информационной памятью исследуется задача о реализации траекторий системы из заданного функционального множества. Метод вспомогательных программных конструкций /T<3,?J развивается для исследования задачи управления в общем случае. Рассматривается итера- - 5 -ционная процедура построения стабильных функциональных множеств. Для решения задачи предлагается пошаговый процесс, каждый шаг которого представляет собой решение некоторой программной задачи.

Основным содержанием настоящей работы является изучение некоторой абстрактной процедуры, включающей класс задач позиционного управления эволюционными системами

Цель работы: I) Исследование задачи наведения на функциональную цель при ограничениях на отрезках траекторий к заданному моменту. 2) Исследование задачи управления с ограничением на число переключений. 3) Применение теории многозначных отображений к абстрактным задачам управления.

Метод решения. В основе исследования лежит подход, основанный на методе вспомогательных программных конструкций сформулированный для дифференциальных игр Н.Н.Красовским, В.Д.Батухтиным [3] , а также метод программных итераций, развитый в работах А.Г.Ченцова^ЗХ-^7 Принцип физической осуществимости предложенный в работах [6д, ?oJ используется в качестве основного в настоящей работе.

Практическая ценность: Результаты данной работы имеют практический интерес в многочисленных прикладных задачах теории оптимального управления. Задачи такого типа, в частности, возникают в системах, складывающихся из двух управляемых объектов, когда у игрока-противника имеются устройства, с помощью которых осуществляется процедура последовательного выбора отрезков реакций - б - на подаваемое воздействие игрока-союзника. Представляют интерес задачи управления селектором многозначного отображения, рассматриваемые в классе процедур, не использующих информацию о будущем поведении формируемого селектора. Последнее состоит в том, что реакция на подаваемое воздействие не зависит от будущего. Оказывается, что при этом условии выбор селектора можно трактовать как некоторую общую динамическую процедуру.

Апробация работы; Основные результаты диссертационной работы докладывались на конференциях молодых ученых Института математики и механики УНЦ АН СССР (февраль 1981г., июнь 1983г., январь 1984г.) на Всесоюзной конференции молодых математиков в г.Миасс (июнь 1982г.), на семинарах Отдела динамических систем и Отдела управляемых систем ИММ УНЦ АН СССР и на международной конференции ШИП по стохастическим-дифференциальным системам в г.Баку (сентябрь 1984 г.).

Публикация: По теме диссертации опубликовано 4 работыУЗ-//.

Структура и объем работы: Диссертация состоит из введения и двух глав, разделенных на 14 параграфов. Объем ее составляет 138 страниц машинописного текста. Список литературы содержит 71 названий.

Содержание работы: Изучаемые в диссертации вопросы в основном относятся к общей теории динамических систем. По идейному содержанию данная работа примыкает к методам программных итераций.

В работе принята сквозная нумерация параграфов. Формулы и утверждения имеют двойную нумерацию: первая цифра - номер параграфа, вторая - номер по порядку.

В первой главе рассматриваются конфликтные ситуации в управляемых системах, которые не обладают, вообще говоря, решениями в классах позиционных процедур управления, однако обладают решениями в классах процедур управления, использующих информацию об истории управляемого процесса. Именно при использовании игроками такой информации, рассматриваемые в работе задачи можно объединить в игру, обладающую ситуациями равновесия в рационально подобранных классах допустимых процедур управления с упомянутой информационной памятью. Предлагается итерационный метод для построения стабильных множеств, где в отличие от позиционного подхода стабильные множества строятся в соответствующих функциональных пространствах историй игры.

В I приведены основные определения и обозначения используе мые в работе. Здесь же приведены основные элементы программной конструкции: классы ІЯ^І-bfc}} ({6Л ,*,%,}}) допустимых программных управлений первого (второго) игрока соответственно.

В 2 приведена математическая постановка задачи наведения с функциональными ограничениями на функциональную цель.

Рассматривается конфликтно-управляемая система -Ь^Т - время, х *=*» иєр . if Q. Здесь 71

Е±оЛ3 с±о<^о) , ФФР&:согрев?) и фФа^ -

Сот-р ( $*) _ множества, задающие геометрические ограничения на выбор текущих управлений U.(-fc) и аГС-fc) игроков I и П соответственно. Полагается, что -f : x^xpxQ.-^Q*' непрерывная функция и выполняются условия единственности и равномерной ограниченности программных движений. Далее, наряду с исходной управляемой системой рассматривается семейство так называемых

If (lf:&.) -СИСТЄМ Х = ? С-Ь,осчи) (иєр) ( ^ruJ - суть IT - сечение функции 4- )

Для заданной пары множеств сМ. С С^Т) {сМ. - замкнуто в смысле нормы ||-\\, ) и /V <=. П С (C-fc0,-tJ) ( /V имеет io . -єт Лзамкнутые в смысле нормы J[.Jr ^. - сечения) ставится зада ло ча наведения траекторий гг - системы в <М. внутри функциональ ных ограничений (АІ ).7, С этой целью определяется оператор А : П &с±*&> ^ j-i ^ C^c-t^-ti) _ оператор программного поглощения следующим условием: для всякой системы (Е,\ ^ П Л к в% множеств Е^ с С^СС-Ь^-tl) , система AaL(±)^T] =fe-b\T множеств GtCC([:t0,-tl) такова, что для всякого Т.Т множество Q совпадает с множеством всех функций (историй) g Є , для каждой из которых при любом выборе пГ: Q. существует такое программное управление ja. ^. {.& t:,9-3 J , что решение соответствующей оЛ - системы принадлежит М внутри ограничений Е^ («увСтЭ--]) Далее определяется соответствующая степень оператора А^ , т.е,

Аа= I и для всякого k^M А — А А > гДе І(є) = Е и (V< )(є) =AaC^(E)J для всякого ^ П ^cn.cc-b0,-fcj) . Определяется также опе ратор /J00 : П л с,<с-ь.;ьэ) ^ П 9 + позиционного пог- лощения: для всякого Е^Пл ^Re*

В 3 с помощью оператора fi строится система функцио-. нальных множеств ("W«. <-^, С/14), > ) для всякого Т Т множество всех начальных историй gfe. А/' , для каждой из которых игрок I в состоянии парировать (^ (у \ \ наведением в классе обобщенных управлений у^=#д ГтгДз} любое управление-константу тге Q. уклониста. Далее, пусть ^^4r>={(Et)T:(Et)^n^^Qr(E,)T]=(Et) } _ л CQ.1

Доказывается, что система функциональных множеств (~W <ис ^ ^-tGT ^ 'т^т является наибольшим элементом частично упорядоченного множества (^ y(r/t) > , С. ) ; и СЕД.^ Ог[у^ <^,Cf/*)T>J для всякого (ЕЛ ^

ТєГу і . Далее устанавливается, что система множеств (^ЛЗГ С <иі, (л4) >) удовлетворяет операторному уравнению и в классе обобщенных управлений )) {.8 -Хтг^і} второго игрока. Тем самым устанавливается, что при построении Ц стабильных множеств можно ограничиваться просто управлением -константой тГ^. Q (считая, что роль игрока П исчерпывается

ВЫборОМ ЛГ : Q. ) .

В 4 рассматривается решение одного модельного примера на минимакс-максимин непрерывного функционала, в котором отсутствует (несмотря на то, что выполняется условие седловой точки в - 10 -маленькой игре) седловая точка в позиционных стратегиях, поэтому по существу требуется использование процедур управления с информационной памятью.

В 5 задача ставится с точки зрения игрока П. Предполагает ся, что при осуществлении (UC, (Mt) ) - уклонения "С tc / игрок П формирующий 1/C-fc) : О. , обладает возможностями формирования лишь кусочно-постоянных управлений, имеющих притом не более -${%- заданное натуральное число) моментов переключений, т.е. іГС-t) всегда кусочно-постоянная функция, число переключений которой не превосходит -8 . Задача второго игрока состоит в следующем. Найти такое правило формирования текущих управлений ^/ctj.): Q. и самих моментов Hi , чтобы при ограничении на число г^ исключалась встреча ОСсУЄ^с . Исследуется задача строгого уклонения (т.е. уклонение от окрестностей (ы^7 (^ье.гр) у 6>о) Далее определяется допустимая процедура уклоняющегося игрока, состоящая из тройки (W./J\3) > где V - стратегия игрока П (отображение, сопоставляющее каждой позиции (^,^^: Т х C^CC-fc^xl) непустое подмножество векторов из О. ), qf - стратегия коррекции игрока П (отображение, ставящее в соответствие позиции системы (T^)G Тх L-K(-E~k0^tl) некоторое физическое реализуемое пра- вило коррекции (многозначный функционал) 0 , которое по будущей траектории системы определяет новый момент переключения.управления игрока П, ^^У - ограничение на число переключений. Далее определяется допустимая процедура управления игрока I, с дискриминацией уклоняющегося игрока на один шаг вперед, причем длина этого шага выбирается игроком П. Чтобы получить альтернативное разбиение пространства начальных историй рассматривается контрзадача (задача наведения). - II -

В б строятся допустимые процедуры U ((U ) игрока I, для которых справедлива теорема о сближении ( 6 - сближении при всяком противодействии игрока П.

В 7 строятся допустимые процедуры управления(J^ or ^) игрока П, для которых гарантируется при всяком противодействии U-C-t) G. Н 6 - уклонение.

В современной теории управления часто возникают проблемы, требующие постановок и исследований новых математических задач в области функционального анализа, теории меры и т.д. В диссертации подобная ситуация сложилась во второй главе, где исходная проблема теории управления потребовала разработки новых вопросов теории многозначных отображений.

Во второй главе в 8 дается математическая формализация процедуры последовательного выбора ветвей (селекторов) многозначного отображения, действующего в фзшкциональных пространствах.

Пусть (0,&0)^ R * R - заданная пара вещественных чисел, для которой -fc0<% r^C*eAJ, Г0=Г40,%Г, Т=Л0%]. Предположим, что ~У1Фф ,\/Фф некоторые множества произвольной природы. Полагаем, что Vg^?') Я=ХТ

Определим множество ^Р - многозначных отображений Ф ^ {ff

Далее в этом же параграфе дается определение многозначного отображения jb G. <ф> , удовлетворяющего условию физической осуществимости: fcCv) Ф ф (yv^ у) и для всяких(Vcy^)

Далее, пусть

2 ^ = {C0>|C-fce,-t0 ^2}.

Определение I. V-fc^T "t - стратегией пошагового управ- ления называем всякую функцию (многозначный функционал) \У : ffi|*xirf—«-А^

Пусть ~W± ("t^T) - множество всех -t - стратегией.

Пусть, кроме того "№ = П "\#. , -teT ' - ІЗ -Определение 2. V-t^Jt ,9^L правилом коррекции на отрезке C"b $- ] называем всякую функцию (многозначный функционал) для которой справедливо: для любых (cot:,,va,x) S? xtTx"]-b$l

Пусть Gr CxGj-toi9;L) - множество всех правил коррек-ции на отрезке C-t^l

Определение 3. V-beT -t - стратегией коррекции пошагового управления называем всякую функцию

Обозначим через ГС~0 C-t^T ) - множество всех ~Ь -стратегией коррекции. Пусть, кроме того Г = П ГС-fc).

Определение 4. Допустимой процедурой пошагового управления называем всякую тройку (У,ff ь) .^* FхЛҐ » гДе Яє-Уі/* ограничение на число коррекции управления.

Содержательно правила формирования пошагового управления при ограничении на число коррекций "программ" (управления) состоит в следующем. Пусть /Ze:cA/" ограничение на число -8 : -И^к/г. допус тимых коррекций управления. Далее, пошаговый процесс будет обладать возможностями формирования лишь таких управлений, что число коррекций программных "кусков" этих управлений не должно превосходить /г . Кроме этого, предполагается, что пошаговый процесс вправе использовать правила коррекции (см.Определение 2) для нахождения моментов переключения управления. Отметим, что случай, когда ограничение на число переключений S отсутствует, можно трактовать как ситуацию &=оо

В этом же параграфе совместное действие тройки (W^^Wx^y/' трактуется как некоторая динамическая процедура, не использующая информацию о будущем формируемого селектора, определяющая в конечном счете некий результат - множество $(^ff &) - пучок пошаговых траекторий сд Є. S2

В 9 исследуется вопрос о непустоте таких множеств, т.е. существование абстрактных пошаговых движений.

В 10 в классе таких процедур управления селектором предло жена конструкция двойственности, реализуемая в виде некоторой итерационной последовательности на пространстве операторов, не обладающих, вообще говоря, свойством физической осуществимости или причинности. По условиям задачи предполагается заданным не которое множество іЖ в функциональном пространстве S2 Про цесс выбора селекторов требуется организовать так, чтобы полу чившаяся в результате функция времени принадлежала дополнению этого множества. Точнее говоря, задача состоит в следующем: най ти тройку СУ,ТУ)є~№*ГхУ » для К0Т0Р - 15 -При решении этой задачи привлекается к рассмотрению двойственная задача. Пусть

Смысл двойственной задачи состоит в следующем: найти ^^1 и Т.*іГ такие, что

Далее доказывается необходимое условие разрешимости исходной задачи в терминах двойственной: для разрешимости исходной задачи необходимо, чтобы существовала такая пара СіГИ^)є^/хл * ч^то

В II для удобства используемого аппарата (для желаемого результата) доказывается существование биективных связей (отображений) между динамической процедурой (V9f)& W* Г и процедурой, использующей "полную" память селектора и управления.

Б 12 устанавливается достаточное условие разрешимости исходной задачи: для разрешимости исходной задачи достаточно, чтобы существовала такая пара ^je^r^i что

Далее описывается явный вид разрешающих процедур управления

В II полученный результат иллюстрируется следующим простым примером. Рассматривается скалярная (п = 1) система [,SO] X = /--) и -h IT множество кусочно-постоянных функций времени, класс измеримых по Борелю функций времени со значениями в [-2,2] Далее определяется многозначное отображение A^iJil^ } следующим образом: Пусть Jb(ir) = і / ^-"^Ч-^т +^ее>с{т:) u..fi\ (VirelT )

Легко проверяется, что определенное таким образом многозначное отображение р удовлетворяет условию физической осуществимости. Далее, пусть

Ми полагаем, что Так как їгьаос упік \a-x)ULX)^z+ [ігс-сЬеСт - о іГ я- v о Jo / '

Из последнего следует, ЧТО \/1Г^^Р" , С0^С*О - 17 -справедливо: со 1 <^

Доказывается, что -3 v"L у1(Іг)= ф » т-е-

Для нахождения решения примера при описанном подходе здесь требуется лишь одна итерация выбора селектора.

В заключительном 14 определяются основные элементы дискретной процедуры последовательного выбора ветвей многозначного отображения на бесконечном промежутке времени d3<=x>^JV^

Задача наведения на функциональную цель

Отметим сразу, что v -системы наследуют от исходной системы (2.1) свойства существования и единственности решений соответствующего дифференциального уравнения. Эти V - системы, вообще говоря, мы будем рассматривать при воздействии обобщенных управлений -мер первого игрока, которые являются аналогами его обычных управлений, что является существенным моментом при анализе конфликтно-управляемых систем.

Пусть для любого функция, отображающая Т в jftK » Для которой d.ef

Тогда, как легко видеть,

Пусть - заданное подмножество С СТ) ; для всяких ієТ система /// - замкнутых множеств /Yt С С. , являющаяся элементом тихоновского произведения П , = С . Отметим, что элементы UI и 4) 71 будут параметрами рассматриваемой в первой главе задачи. Итак, рассмотрим задачу приведения траекторий системы (2.2) в # внутри функциональных ограничений (Ai) .erp . С этой целью, определим оператор программного поглощения (О.П.П.). Для любых ireQ , тбТ СЕ+) О.П.П.

Но мы введем некий результат /j. (f=L 77) совокупного действия семейства ІСА ) : О. } всех этих операторов.

Имея перед собой такую цель, пусть Т Т7 фиксировано.

Определим оператор /) — С следующим образом: для любого С ±) == С и наконец, оператор /} (L — С определим формулой: для любого .

С учетом (2.3) мы заключаем, что для всякой системы (Е.)Є ( множеств Е. С йЬ -Ы) система А С(ВЬ) 1 = (G .") множеств такова, что для всякого.

Итерационная процедура построения системы стабильных функциональных множеств

Поскольку т e {-г,# D произвольное число, то лемма 3.1 доказана.

Отметим, что справедлива следующая теорема

Теорема 3.1. Система функциональных множеств \JWC { Wt\r J является наибольшим элементом частично упорядоченного множества т.е. (wCQ (Mt) ) $? м, Сл/4) , и для всякого (К,) Sf , С л4)т» следует, что

Доказательство: Пусть feT - любое число. Из вложения мы имеем, что Далее, пусть h.e.j/"0 такое, что для всякого Z & о ч. Тогда для любого AMW из (КЛ 5? лс,(лС.) Так как то D3J К С Ж лсгмъ)

В силу произвольности fGT » из последнего вложения получаем утверждение теоремы 3.1.

Теперь предположим, что нам заранее известна какая-нибудь оценка сверху для системы множеств ( » ( ьїгр )

Точнее говоря, пусть система множеств (Н ) G- ote-fi (C v9 (юглт і

Тогда итерационную процедуру для получения наибольшего элемента частично-упорядоченного множества (j , (л$.)гг = ) можно начать с (Ц.) вместо (.) При.этом оказывается, что справедлива

Формализация процедуры последовательного выбора программ

По существу определения 8.1, 8.Iх и 8.3, 8.3х представляются собой лишь разные формы записи одного и того же понятия управляющих процедур, удовлетворяющих принципу физической осуществимости.

Определение 8.4. Допустимой процедурой пошагового управления называем всякую тройку ( Г, фч й.) G. Wx Г У" , где KG V ограничение на число коррекции управления.

Поясним содержательно правила формирования пошагового управления при ограничении на число коррекций "программ" (управления).

Пусть ft . л/\ ограничение на число S S H (S j[/ ) допустимых коррекций управления. Точнее говоря, пошаговый процесс будет обладать возможностями формирования лишь таких управлений, что число коррекций программных "кусков" этих управлений не должно превосходить #. . Кроме этого, предполагается, что процесс вправе использовать правила коррекции (см.Определение 8.2, для нахождения моментов переключения управления. Отметим сразу, что случай, когда ограничение & на число переключений $ отсутствует, можно трактовать как ситуацию & = = = . Имея перед собой такую цель, введем сначала для удобства: ф - множество всех многозначных отображений с/ : V — л Итак, пусть

Далее V с/ G ф do т. (оО = jlT- іГ іГ оСсіг)Фф } "эффективная" область отображения оС . С учетом этого обстоятельства всюду в дальнейшем.

Похожие диссертации на Метод программных итераций в задачах управления с информационной памятью