Содержание к диссертации
Введение
Глава I. Постановка задачи 25
1. Уравнения движения х-объекта и z-модели 25
2. Уравнение движения для рассогласования 29
Глава II. Второй метод Ляпунова для задач устойчивости наследственных систем 33
3. Функционалы Ляпунова для задач устойчивости систем с последействием 33
4. К методу функций Ляпунова для задач устойчивости в системах с последействием 39
5. Комментарий к параграфам 3,4 47
6. Комментарий к параграфам 3, 4 для одного нестационарного случая 60
7, Квадратичные функционалы Ляпунова 1 74
8. Квадратичные функционалы Ляпунова II 81
9. Квадратичные функционалы Ляпунова III. Стационарный случай 83
10. Квадратичные функционалы Ляпунова III. Нестационарный случай 96
11. Один частный тип функционала Ляпунова в нелинейном случае 113
12. Функционалы Ляпунова на каскаде линеаризованных уравнений 118
Глава III. Стабилизация отслеживания и лидирования движения х-объекта движением z-модели 125
13. Формирование процесса в детерминированном варианте 125
14. Устойчивая близость между х-движением и z-движением; детерминированный вариант 130
15. Функционалы Ляпунова на движениях в наследственных стохастических системах 133
16. Устойчивая близость между х-движением и z-движением; стохастический вариант 1 143
17. Устойчивая близость между х-движением и z-движением; стохастический вариант II 154
18. Устойчивая близость между х-движением и z-движением; стохастический вариант III 161
19. Отслеживание и лидирование х-движения z-движением, детерминированный вариант, смешанные воздействия, неограниченное время 166
20. Вычислительная схема формирования процесса 174
21. Одна модельная задача 178
Литература 191
- Квадратичные функционалы Ляпунова 1
- Один частный тип функционала Ляпунова в нелинейном случае
- Устойчивая близость между х-движением и z-движением; детерминированный вариант
- Устойчивая близость между х-движением и z-движением; стохастический вариант III
Введение к работе
"~^Ц5о^
Предыстория и актуальность темы. Во многих моделях реальных эволюционных систем их будущие состояния определяются не только текущим состоянием, но также и историей процесса. К тому же реальные процессы часто оказываются вероятностными. Это характерно для моделей, имеющих приложения в физике, технике, биологии, медицине, экономике, автоматическом регулировании. Для систем, стохастических и с последействием, важна проблема устойчивости. Влияние прошлого и стохастические обстоятельства часто способствуют разбалансировке эволюции.
Первые примеры дифференциальных уравнений с последействием были уже у Бернулли, Эйлера, Лапласа. Новым шагом явились работы Вольтерра по исследованию модели «хищник и жертва»1 и по вязкоупругости. Надлежит также указать работу Минорского по стабилизации курса корабля2. Однако, исследование дифференциальных уравнений с последействием как раздела математики и ее специфического аппарата относится к началу 50-х годов. В книге Дж.Хейла3, где трактуется теория дифференциальных уравнений с последействием, построенная ко времени первого издания этой монографии (1971г.), автор выделяет исходные работы4,5'6'7'8'9'ї0. Теория вероятностных процессов и в том числе -стохастических дифференциальных уравнений, развитая на базе классических исследований Ферма, Паскаля, Лапласа, Гаусса, Чебышева, Ляпунова, Маркова в работах А.Н.Колмогорова, Дж.Дуба, В.Феллера, Н.Винера, К.Ито, Е.Б.Дынкина, И.В.Гирсанова, И.И.Гихмана, А.М.Ильина, О.А.Олейник, А.В.Скорохода, А.Н.Ширяева, Р.Ш.Липцера, определила возможность построения стохастической теории устойчивости и управления. Одна из ветвей такой теории, определившая в значительной степени направление диссертации, связана с методом функций Ляпунова. В книге Г.Дж.Кушнера11 выделяются исходные работы12'13'14'15'16. В связи с тематикой
' Volterra V. Sur За theorie mathematique des phenomenes hereditaires. J. Math, Pures Appl. 7(1928), 249-198.
2 Minorsky N. Self-excited oscillations in dynamical systems possessing retarded actions. J. Appl. Mech. 9(1942),
65-71.
3 Дж.Хейл Теория функционально-дафференциальных уравнений: Пер. с англ. - М,: Мир, 1984. - 421с.
4 Мышкис А.Д. Общая теория дифференциальных уравнений с запаздывающим аргументом. - УМН 4
(1949), вып.5, 99-141.
Bellman, R. and J.M.Danskin A survey of the mathematical theory of time lag, retarded control, and hereditary processes. The Rand Corporation, R-256,1954. Bellman, R. and K.Cooke Differential Difference Equations, Academic Press, 1963.
7 Разумихин Б.С. Об устойчивости систем с запаздыванием. - ПММ, 20 (1956), 500-512.
8 Красовский Н.Н. Некоторые задачи теории устойчивости движения -М.: Физматгиз, 1959.
9 Шиманов С.Н. К теории линейных дифференциальных уравнений с последействием. - Дифференц.
уравнения 1(1), 1965, 102-116.
Yoshizawa Т. Stability theory by Liapunov's Second Method. Math.Soc. Japan, 1966. 1' Harold J. Kushner Stochastic Stability and Control. New York-London, Academic Press, 1967.
12 Bertram J.E., Saracmk P.E. On the Stability of Systems with Random Parameters, Trans. IRE-PGCT, 5(1959).
13 Кац И.Я., Красовский Н.Н. Об устойчивости систем со случайными параметрами, ПММ, 24 (1960), вып.5.
l4BucyR.S. Stability and Positive Supeirnartmgales, J. Differential Eq., 1 (1965), №2, 151-155.
Хасьминский Р.З. Устойчивость систем дифференциальных уравнений при, случайных возмущениях их
араметров. -Москва, Главная редакция фшико-матема*г^^рщае^і^ь^й^Д^&* ' Kushner H.J. On the Stability of Stochastic Dynamical Syl e^"W^^|S?||{-v"^6
параметров. "' " ' "
3 I C.ietepfcpr
. ___ .._„_„„-_.„„_l6jt)j8_12_
диссертации надлежит выделить работу17, где исследуются системы, в которых объединяются наследственные и случайные свойства.
Исследования в диссертации существенно определены работами, выполненными в Свердловске - Екатеринбурге. Фундамент был заложен Е.А.Барбашиным и И.Г.Малкиным. Методы конструирования алгоритмов в
г- 918 19 20,2122,23,24
диссертации во многом восходят к работам >>>>>'.
Существенный вклад в теорию дифференциальных уравнений с приложением к проблемам устойчивости и управления, в том числе - для систем с последействием и стохастических, внесли многие исследователи: Н.В.Азбелев, Э.Г.Альбрехт, А.А.Андронов, А.В.Арутюнов, ВЛ.Афанасьев, С.Н.Бернштейн, В.Г.Болтянский, Ю.ГБорисович, С.А.Брыкалов, А.А.Витт, Р.Габасов, Р.В.Гамкрелидзе, И.И.Гихман, Ю.Ф.Долгий, Е.Б.Дынкин, Н.П.Ерутин, А.М.Зверкин, А.М.Ильин, Г.А.Каменский, И.Я.Кац, Квон О Бок, АВ.Ким, Ф.М.Кириллова, А.Ф.Клейменов, В.Б.Колмановский, А.Н.Колмогоров, Н.Н.Красовский, А.В.Кряжимский, А.Б.Куржанский, А.АЛеваков, Р.Ш.Липцер, Н.Ю.Лукоянов, В.И.Максимов, В.ПМаксимов, М.Д.Марданов, А.А.Мартынюк, Г.И.Марчук, Г.Н.Мильштейн, Е.Ф.Мищенко, А.Д.Мышкис, М.Б.Невельсон, С.Б.Норкин, В.Р.Носов, Ю.С.Осипов, П.ВЛакшин, Н.АЛакшина, В.СЛацко, Л.АЛетросян, ВГЛименов, Л.СЛонтрягин, ВЛЛрокопьев, Н.Е.Ратанов, Ю.М.Репин, Т.Н.Решетова, Н.Х-Розов, Л.Б.Ряшко, А.В.Скороход, АЛ.Скубачевский, Р.Л.Стратонович, А.И.Субботин, Н.Н.Субботина, Т.А.Тадумадзе, Г.А.Тимофеева, В.Е.Третьяков, ВЛ.Ушаков, ГЛ.Харатишвили, В.Л.Харитонов, Р.З.Хасьминский, А.Г.Ченцов, ФЛ.Черноусько, Чой Ен Сан, С.Н.Шиманов, А.Н.Ширяев, Л.Э.Эльсгольц, LArnold, C.H.T.Baker, H.T.Banks, R.H.Battin, T.Basar, R. Bellman, P.Bernhard, R.S.Bucy, J.A.Bums, T.A.Burton, J.Chen, K.L.Cooke, C.Corduneanu, J.M.Danskin, J.Doob, R.D.Driver, W.Fleming, K.Gu, A.Halanay, J.K.Hale, K.Ito, R.E.Kalman, P.V.Kokotovic, H.Kushner, Y.Lakshmikantham, J.H.Laning, Z.Mikolajska, N.Minorsky, C.Olech, H.M.Soner, V.Volterra, D.Williams, N.Wiener, T.Yoshizawa.
В диссертации рассматриваются задачи о стабилизации и лидировании объекта с последействием, детерминированного и стохастического. Управление осуществляется по обратной связи в дискретной по времени схеме на основе искаженного помехами информационного образа.
"Колмановский В.Б., Носов В.Р. Устойчивость и периодические режимы регулируемых систем с последействием. - М.: Наука. Главная редакция физико-математической литературы, 1981. - 448с.
18 Куржанский А.Б. Управление и наблюдение в условиях неопределенности. Наука, Москва, 1977.
19 Osipov Yu.S., Kryazhimskii A.V. Inverse problem of ordinary differential equations. Dynamical solutions.
Gordon and Beach, 1995.
20 Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. Наука, Москва, 1981
21 Третьяков В.Е. К теории стохастических дифференциальных игр// Доклады АН СССР, 1983. Т.269. №3.
с.1049-1053.
22 Альбрехт Э.Г, Построение приближенных решений некоторых квазилинейных дифференциальных игр //
Труды Института математики и механики УрО РАН, 2000. Т.б. №1. с.27-38. Екатеринбург: Изд-вр УрО
РАН.
23 Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Наука, Уральское
отделение, Екатеринбург, 1993.
24 Красовский Н.Н., Субботин А:И. Позиционные дифференциальные игры. М.: Наука, 1974. 456с.
Управляющие воздействия являются, вообще говоря, стохастическими и определяются вероятностными испытаниями.
Цель работы. Изучение управляемых процессов в комбинированной системе, складывающейся из основного объекта с последействием и его модели - наблюдателя и поводыря. Выяснение влияния того или иного характера управляющих воздействий и помех. Развитие и обоснование аналитических и вычислительных методов решения.
Методы исследования опираются на теорию дифференциальных уравнений - обыкновенных, с последействием и стохастических. Важное место занимает модернизированная теория устойчивости, особенно - с опорой на функционалы Ляпунова. Используются элементы теории игр.
Научная новизна.
Дана формализация проблемы, отвечающая условиям неопределенности или конфликта.
Решение дано в аналитической форме с указанием допустимых оценок для параметрических, динамических и информационных помех.
Специальное внимание уделено объединению формируемых в дискретной вероятностной схеме управляющих воздействий со стохастическими помехами, развивающимися в непрерывном времени.
» Даны достаточные для устойчивости, убывающие со временем или с
нормой фазовой истории, ограничения на помехи. « Особенностью является изучение проявляющегося в текущий момент
времени воздействия на объект, которое порождается
непредсказуемым влиянием истории. А также - изучение стабилизации
подобным, но уже управляемым воздействием. » Развито подходящее обоснование решения. Введена специальная
производная для условного математического ожидания
направляющего функционала Ляпунова.
Описаны алгоритмы управления с выходом к компьютерно-
реализуемым схемам.
Теоретическая и практическая ценность работы. Работа носит теоретический характер. Ее результаты предлагаются для включения в теорию стабилизации стохастических систем с последействием. Результаты могут быть использованы при моделировании динамических систем с привлечением для формирования управляющих воздействий вероятностных испытаний по ходу процесса. В условиях неопределенности и конфликта применение результатов работы может способствовать стабилизации неустойчивой системы стохастическими контрдействиями.
Апробация работы. Основные положения диссертации докладывались и обсуждались на научных семинарах: отдела динамических систем Института математики и механики (ИММ) УрО РАН; кафедры теоретической механики УрГУ им. А.М.Горького. Результаты диссертации докладывались на конференции «Алгоритмический анализ неустойчивых задач» (Екатеринбург, 2004г.), на конференции «Математические модели и
недифференцируемая оптимизация» (Челябинск, 2003г.), на Международном семинаре ИФАК «Обобщенные решения в задачах управления» (г.Переславль-Залесский, 2004г.), на совместном семинаре ИММ УрО РАН и УГТУ-УПИ по устойчивости и управлению в наследственных системах (Екатеринбург, 2005 г.), на Международном семинаре «Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби» (CGS'2005), посвященном 60-летию академика А.И.Субботина (Екатеринбург, 2005г.).
Публикации. Основные результаты диссертации опубликованы в работах [1-7].
Структура и объем диссертации. Диссертационная работа состоит из введения, трех глав, объединяющих 21 параграф, списка литературы. Общий объем диссертации составляет 199 страниц.
Квадратичные функционалы Ляпунова 1
А это и означает, что найдется такая непрерывная монотонно возрастающая функция p(r)t при которой для рассматриваемой функции Ляпунова v(/,y) будет выполнено условие ( -определенной отрицательности при всех значениях {/,ЯПЬ Для которых в соответствующем слое осуществляется случай (2.). Объединяя этот факт с тем обстоятельством, что для всякой пары значений &у[ф, для которой в соответствующем слое осуществляется случай (1.), тоже найдется подходящая функция /?(г), которая будет удовлетворять условию -определенной отрицательности, приходим к выводу, что действительно будет существовать функция /э(г), которая обеспечивает выполнение условия -определенной отрицательности для производной v+(/,j/( ,»)) в области ]у( )[с #.. А стало быть, такая функция v(t,y), производной которой 1 +( , ( ,)), удовлетворяет предложенному обобщенному условию определенной отрицательности, обеспечивает асимптотическую устойчивость невозмущенного движения tf/] = 0.A Теоремы 4.1 и 4.2 естественно переформулируются в терминах функционалов Ляпунова. Известно, что при условиях теоремы 4.1 функционал удовлетворяет всем нужным условиям для устойчивости решения у[(] = 0 в силу (3.1). При условиях теоремы 4.2 для функционала V(t,y(?)) (6.79) производная V+(t,y(t, )) не может быть нулем при всех t u +Т при V(t,y(t, )) 0, каким бы ни было число Г 0. Для каждой возможной пары (г.,S,), для любого TJ 0 найдется T(St,7j), для которого Проверка этого утверждения получается подходящей переформулировкой рассуждения из доказательства теоремы 4.1. Из (6.79) и следует равномерную асимптотическую устойчивость решения ЛО-0 в силу (3.1). Существенной для предлагаемого в работе способа формирования воздействий в органе U является возможность построения подходящего функционала Ляпунова [150,43,105,126,36,32,91] V(tty( )) для стабилизированного уравнения (2.21). В (7.2)-(73) w,(r), w (r) - непрерывные функции, іу+(? у(т))\22і) " правая верхняя производная [150,43,105,126] функционала V(t,(yiS)t -h ,& 0)) вдоль движения Я1 (2.21). Универсальное аналитическое построение функционала V(t,y( )) при каждом фиксированном значении г =/ /, определяется следующей известной общей формулой [66,150,43,105]: с учетом формулы Коши [105,126,32] для решения y[t] уравнения (2.21) при исходной истории ЯЛ ] = () При этом при r = f в (2.21) Я ] - правая производная. Опишем кратко построение функционала V(t,y{ )) согласно равенству (7.5) сначала в стационарном случае, когда в уравнении (2.21) матрица-функция G\s\t,&) не зависит явно от t, так, что это уравнение имеет вид: В таком случае в левой части равенства (7.5) V(t ,y(»)) = V() ()), а в правой части этого равенства / = 0. Таким образом, имеем формулу: где y[t] - решение уравнения (7.6) при исходной истории у[0,»] = у( ). Тогда в (7.6) у[0] - правая производная. Пусть U(t) - фундаментальная матрица решений [105,126,32] для уравнения (7.6). Она есть решение уравнения (7.6), порожденное исходной историей: рассматриваемой матрицы-функции U{t) непрерывны справа при t = t =0, а при о 0 они непрерывны и при этом удовлетворяют условиям Липшица. Вектор-функции являются решениями уравнения (7.6).
При этом для них в этом уравнении величины й1Л[0] - правые производные. Эти решения uU][t] порождаются кусочно-непрерывными исходными историями: Известно [118,117,111,43,105,126], что в случае асимптотической устойчивости невозмущенного движения y[t] = 0 в силу возмущенного движения y[t] (7.6), фундаментальная матрица /(/) удовлетворяет условию: \Щ)\\Е . Кт - ехр(-л /), 0 t оо, а 0, Кт - const. (7-14) В согласии с (2.21) ограничимся случаем, когда уравнение (7.6) имеет вид Я ] = Е ф)-М + ]+ fG( f + «4- = j-o -н (7.15) = G( S)-ylt} + Y G(a)yy[t+&J}+ JG.(S)-y[t + S]-dS, -9,,=0, 8M 3jyJ = 0 N-l,-h $K, f0 r co. Переобозначим параметры в уравнении (7.15) так, что оно примет вид Предполагаем, что матрица-функция G(r) = G,(-r) непрерывна при Известно [105,32], что решение y[t]: u t уравнения (7.16), порожденное при С = О непрерывной исходной историей y[Q, ] = j (#) = (у($), -h $ 0) выражается равенством: Функционал V(y(»y), удовлетворяющий условию (7.4), вычисляется по формуле (7.7). Это корректно, так как интеграл в правой части (7.7) сходится вследствие неравенства (7.14). Подставляя в (7.7) выражение для y[t] (7.17), получаем: Здесь и ниже символ [0] обозначает матрицу, все элементы которой нули. С учетом свойств матрицы U(t) выражение (7.18) принимает вид: зависят от / вследствие стационарности уравнения (7.6). С учетом этой стационарности выражения (7.20) и (7.1) совпадают. Правая верхняя производная для функционала (7.1) и (7.7), где t=t\ имеет вид: Стало быть, при \у(0)\ 0 производная (7.21) отрицательна. Более того, функционал (7.7), (7.20) удовлетворяет условиям (7.2), (7.3). Обратимся к нестационарному случаю, предполагая, что решение y[t]=0 уравнения (2.21) асимптотически устойчиво равномерно по исходному моменту и и переменной у. Тогда все решения y[t] уравнения (2.21) удовлетворяют неравенству: Пусть /[/,/ ], t t t. tB - фундаментальная матрица-функция решений [105,32] для уравнения (2.21). Она есть решение уравнения (2.21), порожденное исходной историей: где матрица U(3) удовлетворяет условиям (7.9), (7.10). То есть, история ЛЛ#] (7.23) удовлетворяет равенствам: Вследствие равномерной асимптотической устойчивости невозмущенного движения y[t]s0 в силу возмущенного движения y[t] (2.21) и вытекающего отсюда неравенства (7.22), матрица-функция U[t,t ], t t и f0 удовлетворяет условию: Переобозначая в уравнении (2.21) параметры подобно тому, как это сделано выше при переходе от (7.15) к (7.16), офаничимся случаем, когда уравнение (2.21) принимает вид: Известно, что решение y[t] уравнения (7.26), порожденное исходной историей: выражается при t t по формуле Коши равенством:
Один частный тип функционала Ляпунова в нелинейном случае
Примечание. Однако надлежит заметить, что при приведенных выше условиях асимптотической устойчивости на базе функций Ляпунова v(t,y) можно построить функционал V(t,y(»)), который будет обеспечивать асимптотическую устойчивость при тех же самых достаточных условиях. Для этого достаточно снова взять функционал V(t, ( )) в виде (6.49), то есть - функционал: который удовлетворяет тем же условиям, что и в параграфе 6. К сожалению, в отличие от квадратичных функционалов, которые строятся в параграфах 9, 10, при условиях (9.17)-(9.19) или (10.12)-(10.14) или (10.19)-(10.20) соответственно, вообще говоря, более жестких, чем достаточные условия (9.11), (9.16), (10.8)-(10.11) для асимптотической устойчивости на базе функции Ляпунова v(t,y), использоваться функционал V(t,y( )) (10.76) при исследовании устойчивости движений наталкивается, вообще говоря, на существенные трудности. Вернемся к нестационарному случаю. И здесь, как и в параграфе 9, теперь уже в нестационарном случае уравнения (2.16) возможно построение соответствующего стабилизированного уравнения с дополнительной коррекцией на базе уравнения с дополнительной стабилизирующей добавкой: Повторяя с понятными изменениями выкладки, приведенные выше в 9 и 10, можно получить условия стабилизируемости уравнения (2.16) и условия построения подходящего функционала Ляпунова V(t,у(ф))» более широкие, чем условия из 10, приведенные в этом параграфе выше. Обратимся наконец в данном примере для уравнения (10.63) к оценкам, о которых идет речь в примечании в конце 9. Такие оценки приводят, например, к требованию, чтобы для матрицы квадратичной формы от уф), yi-fy), (-/), которая определяет производную К(У( У) Для конструируемого функционала V(y( )). То есть параметры а и Ь должны удовлетворять условиям: которое является более широким, чем условия (10.68) и (10.72). И тогда получается, что на самом деле достаточным условиям удовлетворяет функционал В предыдущих параграфах рассматривались уравнения движения, линейные по у.
В этом параграфе рассмотрим построение функционала Ляпунова для уравнений движения, нелинейных по у, но стесненных условиями, при которых оказывается возможным перенесение на обсуждаемый здесь случай некоторых конструкций, рассмотренных выше для линейных уравнений. Это построение переносит на системы с последействием известный, восходящий к работам [43,20,143], метод конструирования функции Ляпунова в виде квадратичной формы от правых частей уравнений. Рассмотрим уравнение возмущенного движения: где х - и-мерный фазовый вектор. Вектор-функции Х(»), Хт(»), X\h]( ) определены при / / « , [дг оо и -h $j Q, -h S 0t непрерывны в этой области по совокупности их аргументов и удовлетворяют условиям: 114 Кроме того, компоненты Xt(x) вектор-функций Х(х) = {Х,(х), i = \ и} имеют непрерывные частные производные: Рассмотрим матрицу Якоби функций Х((х) по Xj: Рассмотрим укороченное уравнение: преобразуется к виду: Предположим для функции Ляпунова что ее производная в силу (11.6), которая имеет вид: Вычислим производную функции v(JQ (11.7) в силу полного уравнения (11.1) с последействием с учетом (11.5), (11.6). Получаем равенство: Предположим, что при одинаковых значениях аргументов 9/у 4 + ]» $ и x[t + &] справедливы при всех возможных значениях t. t x неравенства: х[Л]( Л. [ + &,Ц Lj -\X(x{t + ,9]). (11Л2 \x\k\t,9j,x[t + $\)\ L(ff)-\X(x[t + S])\. (11.13) Тогда из (11.10) следует неравенство: №М))(„.„ -cl0] №])Г C J-LJ -\ХШ)\ № + Щ)\ + + J с\8)-ЦЗ)-\Х№Ц-\Х№ + ЗЦ- 1& (11 14) -А Предположим, что справедливо неравенство: Построим функционал Ляпунова аналогично тому, как это сделано выше в случае переменной у в ттараграфе 9 с естественной заменой у на переменную X: -
A Согласно (11.10)-(11.16) для правой производной F+(X{x(t, ))\iiA) этого функционала в силу (11.1), получим следующую оценку: -А где а 0 - некоторая постоянная. А сам функционал удовлетворяет условиям: Таким образом, построенный функционал V(X(x(»))) является определенно-положительным и допускает бесконечно малый высший предел в и-мерном векторном пространстве {X} = {Xt, і = 1,.., и}. Однако, для суждения об устойчивости рассматриваемой системы с последействием, описываемой дифференциальным уравнением (11.1), требуется, чтобы функционал (11.16) удовлетворял аналогичным условиям в исходном «-мерном векторном пространстве {х} = {хІУ і = 1,...,и}. Чтобы достичь этой цели наложим дополнительные ограничения на правую часть укороченного уравнения (11,5). Именно, предположим, что частные производные — dXj ограничены при всех возможных значениях х, то есть выполнены неравенства: El dXj йМ, i = 1,...,и; ./ = 1,...,л. 01-20) И, кроме того, примем, что выполнено неравенство: \Х\ 4х\), (11.21) где непрерывная, монотонно-возрастающая функция w.(x) определенно-положительна. Тогда функционал V(x( )) будет уже удовлетворять условиям, аналогичным условиям (11.18)-(11.19), но уже и в исходном «-мерном векторном пространстве {х} = {х,, і = 1,.., и}. Таким образом, приходим к следующему выводу. Если выполнены перечисленные выше условия на правую часть уравнения (11.1) и на правую производную функции v(y) (10.3)-(9.5) в силу укороченного и полного уравнений (11.8), (11.10), а также выполняются предположения об оценках этой производной (11.11)-(11.15), то можно построить функционал Ляпунова У(Х(х(?)У) (11.16), который удовлетворяет условиям (11.17)-(11.19). Отсюда вытекает справедливость следующего утверждения. При выполнении всех высказанных выше условий не возмущенное движение x[t] = Q, t.t асимптотически устойчиво равномерно по исходному моменту t, f„ + А и исходной истории переменной (/ ,). Предположим, что функция w.(j J) удовлетворяет условию:
Устойчивая близость между х-движением и z-движением; детерминированный вариант
Обратимся к выбранному функционалу Ляпунова V(t,ye)) = V(t,(y(ffi)t-h 3 0y) (8.1) или (9.23), (10.25), (13,2), удовлетворяющему условиям (7.3) или (8.2), (9.26), (10.28). Предполагаем в соответствии со сказанным выше в параграфе 13, что можно выбором управлений и1г"][ ] = и[0г %], h lt]- " ,] удержать движение z[t] в подходящей области zj #JrI. Согласно неравенству (13.22) и предельному соотношению (13.23) для любого значения д 0 можно подобрать столь малые оценки Sw 0, что будет выполнено неравенство: Справедливо следующее утверждение. Теорема J4.1. Пусть для укороченного уравнения возмущенного движения (13.1) существует функционал K(f,(y(.9), -А .9 0)) (8.1) или (9.23), 131 (10.25), (13.2), удовлетворяющий условиям (7.3) или (8.2), (9.26), (10.28). Тогда для любого числа є 0 можно указать столь малые положительные величины S[],dll,]felI\Sl&],S{R],S{M,S{t\elFl и число Л 0, что при ограничении на исходные истории: будет выполнено неравенство; Достаточно доказать это утверждение лишь для случая, когда условие определенной положительности функционала К(/, ( )) имеет вид (7.2), так как при выполнении условий определенной положительности вида (9.25), (10.27) условие (7.2) выполняется тем более. Утверждение доказывается стандартным для теории устойчивости систем с последействием способом. Приведем такое доказательство. Доказательство. Д Пусть выбрано число є 0. Подберем к этому значению є 0 число у 0 так, чтобы выполнялось неравенство:
Будут справедливы неравенства: Выберем такие оценки для различия в параметрах уравнений возмущенного движения, для различия между динамической и информационной помехами и такую оценку для интервала времени (/,,//+]), чтобы для величины S из неравенства (14.1) следовало неравенство: где а[г] - некоторое малое число. Выберем число 5. согласно равенству: 132 Для непрерывных функций (у{9\ hu3 Qi) известно следующее соотношение между нормами \у( )\с и ІИ ), : Поэтому по выбору числа 8, (14.8) исходная история ( ,)» удовлетворяющая неравенству (14.2), удовлетворяет условию: Кроме того» из условия (14.2) следует, что для начальной истории y(t„») выполняется неравенство То есть, тем более выполняется неравенство: А вследствие (14.6) -выполняются и неравенства: Пусть в течение некоторого времени движение y[t] все время удовлетворяет условию которому оно удовлетворяет в исходный момент времени t = и. Тогда в течение всего этого времени будет выполняться неравенство: Однако, выйти из области (14.14) рассматриваемое возмущенное движение y[t] не может, так как на границе этой области производная функционала Г+( , Д 1) 2 2) по условиям (14.4), (14.7) отрицательна. Стало В предыдущих параграфах рассматривается формирование управляющих воздействий, которые обеспечивают близость -движения к z-движению в детерминированном варианте. Этот вариант возможен в рассматриваемых там случаях благодаря тому, что решения маленьких игр (13.7), (13.8), используемые при формировании управляющих воздействий, удовлетворяют условию (13.11). В частности, это условие может быть выполнено, когда задачи (13.7), (13.8) имеют седловые точки в чистых стратегиях, то есть - в классах детерминированных воздействий {ul M], v[IV, иьм ffi if hl2,v\ А "1}, {v[Jt- 3, A[l,v1}.
Тогда и получается, что эти воздействия, формируемые по принципу обратной связи детерминироеанно на базе реализации Y[t] информационного образа К(»), осуществляются в процессе управления как детерминированные функции от времени t. Теперь, однако, рассмотрим такой случай, когда условие (13.11) не выполняется, и хотя бы одна из вспомогательных маленьких игр (13.7), (13.8) не имеет седлоеой точки. Стало быть, такая игра не имеет цены в классе чистых стратегий - детерминированных воздействий {«M,MM,VM,/IM, hu-v]t hlzui}, {v[x-vlthlx-v]}. Тогда переходом к аналогичным задачам уже в смешанных стратегиях можно улучшить соответствующие значения и l l или в сторону убывания или — в сторону возрастания { }, или - в желаемую сторону для обеих величин и }. В таком случае процесс отслеживания л-движения z-движением формируется как вероятностный процесс на базе стохастических дифференциальных уравнений [59,132,104,93,94,38,22,16,63]. При этом управляющие воздействия формируются в дискретной по времени / схеме на базе соответствующих вероятностных испытаний. Здесь снова важную роль играют подходящие функционалы Ляпунова. При этом правая производная этих функционалов приобретает характер бесконечно малого производящего оператора для функционала V(t,yjt, \) на формируемом вероятностном процессе. Содержательно этот оператор имеет смысл усредненной правой верхней производной рассматриваемого функционала на стохатических возмущенных движениях. В связи с этим в данном параграфе приведем в удобной форме материал из теории устойчивости движения по Ляпунову в стохастических наследственных системах. Возмущенное движение х-объекта определяется теперь стохастическим дифференциальным уравнением (1.3). А движение z-модели определяется дифференциальным уравнением (1.4). В отличие от детерминированного варианта в стохастическом варианте различаем две задачи: сохранение близости между л;-движением и z-движением на конечном отрезке времени t. t T и сохранение близости между #-движением и z-движением на бесконечном отрезке времени Примем, что шаг дискретной по времени t схемы формирования воздействий в органе U удовлетворяет условию: где в случае конечного или бесконечного интервалов времени: u t ,T или /, t да предполагаем соответственно:
Устойчивая близость между х-движением и z-движением; стохастический вариант III
Стало быть, вероятность нарушения неравенства в течение времени 0.2 будет не меньше, чем [ -1 . Пусть для рассматриваемого движения уш[г] при некотором сколь угодно большом / выполняется неравенство: Аналогично предыдущему заключаем, что из каждой точки у„[1(.] при Лр[ ]] выходит по крайней мере одна реализация y„[t], которая не остается в области л,1/] є в течение п шагов и вероятность этой реализации Отсюда по формуле полной вероятности [17,39,60,59] заключаем, что начиная с момента f. неравенство \уф[ї є нарушится в течение п шагов с вероятностью не меньшей, чем р- — . Поэтому можно построить последовательность / m,Jfc = 1,2,..., l lk+l]-l lk] п таких, что по индукции для этой последовательности / [ Д = 1,2,... при fc-»oo условие (17.23) при Г =1 ш сохраняться не может каким бы сколь угодно малым фиксированным ни было SUi 0. А это и означает, что при неизменном сколь угодно малом шаге в дискретной схеме устойчивости невозмущенного движения уш[і] по вероятности в рассматриваемом примере нет. стохастический вариант 111 В этом параграфе рассматривается такое х-движение, когда присоединяется помеха BiuyJt z ty-dW iO, где Wa(t) - стандартный п мерный винеровский процесс. Тогда (1.3) трансформируется в уравнение Ито (1.25) и получается такое уравнение для уш\і\: Предполагаем, что параметры в (18.1), управляющие воздействия и помехи стеснены условиями, аналогичными оговоренным выше. Но некоторые условия ужесточаются. Так, (2.11) требуется для любой непрерывной функции yjt ! ИЗ области (2.8). Полагаем (йи, [/,]) = x[t-hl ][t]]. Шаг (tntM) удовлетворяет условиям (15.1), (15.2), 2 причем в (15.2) полагается у. \\ Д М удовлетворяет условиям (15.4), (15.5). Матрица B(t,yjt],zjt\) удовлетворяет условию: где для конечного или бесконечного интервалов [tt,T] или [t.to) полагаем удовлетворяющего условиям (7.2), (7.3), (8.2). При этом существенно используется липшицевость A[0](t) и Aw(t,3), / = 1,2,3 по t и S. В согласии с (3.7) [44,78] полагаем, что оператор в (2.17) имеет вид: где матрицы /! () - липшицевы. Новым для величины E{{p+(t,yjt,»]))iltn\tl!lyjtj, ]}t отвечающей в этом случае величине E{Pt(t,yJt,»\)\ttiyJtlt \} из (15.22), (15.23), будут теперь такие обстоятельств трансформируется в уравнение Ито (1.25) и получается такое уравнение для уш\і\: Предполагаем, что параметры в (18.1), управляющие воздействия и помехи стеснены условиями, аналогичными оговоренным выше. Но некоторые условия ужесточаются.
Так, (2.11) требуется для любой непрерывной функции yjt ! ИЗ области (2.8). Полагаем (йи, [/,]) = x[t-hl ][t]]. Шаг (tntM) удовлетворяет условиям (15.1), (15.2), 2 причем в (15.2) полагается у. \\ Д М удовлетворяет условиям (15.4), (15.5). Матрица B(t,yjt],zjt\) удовлетворяет условию: где для конечного или бесконечного интервалов [tt,T] или [t.to) полагаем удовлетворяющего условиям (7.2), (7.3), (8.2). При этом существенно используется липшицевость A[0](t) и Aw(t,3), / = 1,2,3 по t и S. В согласии с (3.7) [44,78] полагаем, что оператор в (2.17) имеет вид: где матрицы /! () - липшицевы. Новым для величины E{{p+(t,yjt,»]))iltn\tl!lyjtj, ]}t отвечающей в этом случае величине E{Pt(t,yJt,»\)\ttiyJtlt \} из (15.22), (15.23), будут теперь такие обстоятельства. Реализации yjt] не будут теперь Липшицевыми по t. В усредненной производной для функционала Ляпунова появятся дополнительные члены, определенные формулой Ито [16,22,30,38, 59,104,137]. Однако, учитывая соотношения [59,104] {Wm(r) Wm{t)} = Qt Epr tt(j)-Wa{tf} = ri r t и вытекающее отсюда неравенство: можно для оценки математического ожидания E Jt t yJt,, ]} повторить с понятными изменениями выкладки, подобные приведенным в параграфе 15 для E{P,+ (t,ya[t,» ])\tltyllt[tls»]}. Получается неравенство: Лемма 18.1. Предполагаем, что процесс формируется на базе уравнения (18.1) для yjt] и - уравнения (1,4) для zjt]. Пусть к моменту t = t, реализовались истории движений гш[/,,»] и yjt,,»], удовлетворяющие условиям (15.24), (15.25). Обратимся к реализациям гш[/;«] и „,[/,], продолжающим эти реализации гш[(,,] и у п ] при /, ttM, Полагаем, что управляющие воздействия надг-объект ы ,,][г;][ 1, f Ml[t, 0] и воздействия наг-модель T}[z ]{dv{t tdhu \tt,s a [ ,], [//,]) формируются оптимально на базе решений маленьких игр (15.6), (15.7). Пусть управляющее воздействие а. Реализации yjt] не будут теперь Липшицевыми по t. В усредненной производной для функционала Ляпунова появятся дополнительные члены, определенные формулой Ито [16,22,30,38, 59,104,137]. Однако, учитывая соотношения [59,104] {Wm(r) Wm{t)} = Qt Epr tt(j)-Wa{tf} = ri r t и вытекающее отсюда неравенство: можно для оценки математического ожидания E Jt t yJt,, ]} повторить с понятными изменениями выкладки, подобные приведенным в параграфе 15 для E{P,+ (t,ya[t,» ])\tltyllt[tls»]}. Получается неравенство: Лемма 18.1. Предполагаем, что процесс формируется на базе уравнения (18.1) для yjt] и - уравнения (1,4) для zjt]. Пусть к моменту t = t, реализовались истории движений гш[/,,»] и yjt,,»], удовлетворяющие условиям (15.24), (15.25). Обратимся к реализациям гш[/;«] и „,[/,], продолжающим эти реализации гш[(,,] и у п ] при /, ttM, Полагаем, что управляющие воздействия надг-объект ы ,,][г;][ 1, f Ml[t, 0] и воздействия наг-модель T}[z ]{dv{t tdhu \tt,s a [ ,], [//,]) формируются оптимально на базе решений маленьких игр (15.6), (15.7). Пусть управляющее воздействие на z-модель //((/к1 -"1, -"1;/). ttut tl+i может быть сформировано так, что будет гарантировано условие [ ,] є Я. И пусть при этом каким бы ни было tt, / = 1,2,..., для функционала V(t,y(»)) (8.1) на совокупности реализаций zjt,m] и уа\і, \ выполняется неравенство (18.6). Тогда для любых 0 Г оо, є 0, є Н1.уі, J3 1 существуют такие & 0, [,] 0 и м 0, ёт 0, что всякое решение ym[f] (18.1), формирующееся по дискретной по времени t схеме с шагом (15.1), (15.2) и порожденное исходной историей ya{t.,»), удовлетворяющей неравенству: будет для [t.,T] или [/,,« ) удовлетворять условиям: Доказательство строится подобно доказательству леммы 16.1. Однако, теперь реализации yjt], продолжающие историю уа[ ,ш], jjyjf,, ] ., не будут липшицевыми и даже равномерно непрерывными при и t оо. Поэтому уже не все такие реализации при условии й[ е. остаются в области \уаЩ є при фиксированной разности є - є, 0 при всех /: t, t , tM , каким бы малым ни был отрезок [/,,/,+,]. Каждая порожденная историей У.ігі ш] {Уш&і Іс -є РешшзаДия Л,М которая в некоторый момент rffl впервые удовлетворяет равенству определяет замораживание ya[t] и V(t,yjt,»]) при t r№ подобно тому, как об этом говорится в примечании к лемме 16.1. Рассмотрим сначала случай В(! УЛГЪ2АФ Bl vl(t). Тогда для корректности выкладок замораживаются здесь при t та не только реализация yjt] (18.10), но и сопутствующие ей реализации, которые определяются так. Пусть реализация [rJ(UU0) определяется аргументами yjt,, ], 1 [ „]. Л / вЬ { W, V][ L Д„М» «Iі "1 [t], Ai W» ИЦО. 4 /+! Тогда сопутствующими будут реализации, которые порождаются совокупностями аргументов, каждая из которых отличается от названной совокупности аргументов лишь элементами W ][t] hlJ ][t], tt t tM}. При этом такая совокупность T"0 JrJ(]fU())) реализаций порождается всеми оптимальными решениями {"«"" И. "" М» t{ t tM) маленьких игр (15.6), (15.7). И все сопутствующие реализации будут удовлетворять условию: если б1 ] в (15.1) и усиленном (15.2) будет достаточно малым. Таким образом, Vfayjt,»]) замораживается с момента та только для реализаций yjt], которые удовлетворяют (18.11). Стало быть, оценка (18.6) для {( [ 1))(,8,, W/.yJ ; el} не ухудшается. И можно оценить {( .Л.[ .ш]Дш)І /. Л і.в]}. / м подобно тому, как это описано в примечании к лемме 16.1 и получить неравенство: