Содержание к диссертации
Введение
1 Однотипная задача управления при наличии помехи и с терминальным множеством в форме кольца 28
1.1 Примеры рассматриваемых задач 28
1.2 Постановка задачи 34
1.3 Задача преследования 35
1.4 Задача уклонения 39
1.5 Решение задачи преследования для примера 1.1.3 43
1.6 Задача преследования маломаневренных объектов при наличии сопротивления среды 48
2 Однотипная задача импульсной встречи в заданный момент времени при наличии помехи и с терминальным множеством в форме кольца 52
2.1 Примеры рассматриваемых задач 52
2.2 Постановка задачи 56
2.3 Определение максимального стабильного моста 58
2.4 Вычисление значения оператора программного поглощения на кольце 61
2.5 Построение максимального стабильного моста при q t р 63
2.6 Построение максимального стабильного моста при q\ t q 69
2.7 Построение максимального стабильного моста при t q\ 74
2.8 Задача преследования в случае q to р 77
2.9 Задача преследования в случае 0 83
2.10 Задача уклонения 89
2.11 Решение примера 2.1.2 96
2.12 Компьютерное моделирование импульсной модификации игры «изотропные ракеты» с терминальным множеством в форме кольца103
3 Задача импульсного управления при наличии помехи с декомпозиционной динамикой 107
3.1 Примеры рассматриваемых задач 107
3.2 Постановка задачи 110
3.3 Область достижимости управления 113
3.4 Задача уклонения 114
3.5 Задача преследования 117
3.6 Одномерный случай 121
3.7 Построение –стратегии, гарантирующей встречу, в примере 3.1.1 122
Заключение 129
Основные обозначения 130
Список литературы
- Задача преследования
- Вычисление значения оператора программного поглощения на кольце
- Задача преследования в случае q to р
- Область достижимости управления
Введение к работе
Актуальность темы исследования и степень ее разработанности. Многочисленные задачи из области экономики, экологии, управления механическими системами и других областей знаний сводятся к задачам управления при наличии неконтролируемых помех, о которых известны лишь области их возможных значений. Математическое моделирование управления в таких системах основывается на подходе, который предписывает помехам реализацию, ухудшающую показатель качества, в соответствии с которым моделируется управление. Такой подход приводит к рассмотрению задачи построения управления в рамках теории дифференциальных игр.
Становление теории дифференциальных игр связано с работами зарубежных ученых Р. Айзекса, А. Брайсона, У. Флеминга. Современный облик теории дифференциальных игр сформировался в значительной степени под влиянием работ академиков Н.Н. Красовского и Л.С. Понтрягина и представителей их научных школ: Э.Г. Альбрехта, А.В. Кряжимского, А.Б. Куржанского, Ю.С. Осипова, А.И. Субботина, Н.Н. Субботиной, В.Е. Третьякова, В.Н. Ушакова, А.Г. Ченцова, Р.В. Гамкрелидзе, М.И. Зеликина, Е.Ф. Мищенко, Н.Х. Розова и других.
В трудах Н.Н. Красовского и представителей его научной школы разработана теория позиционных дифференциальных игр. Управления в позиционных дифференциальных играх строятся как функции от времени и фазового вектора системы. Под движением, порожденным этими управлениями, понимается пучок функций, каждая из которых является равномерным пределом некоторой последовательности ломаных при диаметре разбиения, стремящемся к нулю. В рамках исследования таких задач доказана теорема об альтернативе, согласно которой существует решение дифференциальной игры в классе позиционных стратегий. В основе теории позиционных дифференциальных игр лежит понятие стабильного моста и правило экстремального прицеливания на него.
В работах Л.С. Понтрягина и представителей его научной школы разработаны аналитические методы решения линейных дифференциальных игр преследования. Эти методы решения получили название первого и второго прямых методов Л.С. Понтрягина. Они базируются на операциях Минковского с множествами и процедуре альтернированного интегрирования.
Актуальными являются задачи импульсного управления, к которым сводятся задачи управления механическими системами переменного состава, когда в отдельные моменты времени может отделяться конечное количество реактивной
1Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский, А.И. Субботин. — М.: Наука, 1974. — 456 с.
2Понтрягин, Л.С. О линейных дифференциальных играх / Л.С. Понтрягин // Докл. АН СССР.— 1967. — Т. 175, № 4. — С. 764–766.
массы. Если на механическую систему воздействуют неконтролируемые силы (помехи), о которых известны только области их возможных значений, то задача управления может быть рассмотрена в рамках теории управления гарантированным результатом. Анализ задач импульсного управления усложняется тем, что траектории управляемой системы могут быть разрывными.
Задачи импульсного управления рассматривались в работах Н.Н. Красов-ского, Ю.М. Репина, В.Е. Третьякова, Г.К. Пожарицкого, Н.Н. Субботиной, А.И. Субботина, Н.Н. Петрова, Ю.И. Бердышева, Т.Ф. Филипповой, С.И. Кумко-ва, В.С. Пацко, А.Н. Сесекина, С.Т. Завалищина, В.А. Дыхты, В.И. Ухоботова, Ф.Л. Черноусько, А.А. Чикрия и других.
Важным классом дифференциальных игр являются такие задачи, когда в правой части уравнений стоит только сумма управлений первого и второго игроков, значения которых принадлежат шарам с радиусами, зависящими от времени. Для таких игр в случае, если терминальное множество является шаром заданного радиуса, Л.С. Понтрягиным построен альтернированный интеграл.
В.И. Ухоботовым построен альтернированный интеграл для однотипных игр с произвольным выпуклым замкнутым терминальным множеством и построены оптимальные позиционные управления игроков. В этой статье термин «однотипная игра» применяется к играм, в которых области достижимости игроков гомео-морфны одному и тому же выпуклому компакту.
Актуальными также являются задачи преследования, когда преследователь стремится сделать в заданный момент времени относительное расстояние не больше одного заданного числа, но не меньше другого заданного числа. В работе множество векторов, определяемое таким условием, названо кольцом.
Цель и задачи исследования. Цель данной работы состоит в получении условий разрешимости и построении соответствующих управлений для новых классов задач управления при наличии помехи. В диссертации исследуются следующие задачи: однотипная задача управления при наличии помехи с геометрическим ограничением на управление и с терминальным множеством в форме кольца; однотипная задача импульсной встречи в заданный момент времени при наличии помехи и с терминальным множеством в форме кольца; задача импульсного управления при наличии помехи с декомпозиционной динамикой.
3Красовский, Н.Н. Теория управления движением / Н.Н. Красовский. — М.: Наука, 1974. — 456 с.
4Понтрягин, Л.С. Линейные дифференциальные игры преследования / Л.С. Понтрягин // Мат. сб. Новая серия. — 1980.— Т. 112, № 3. — C. 307–330.
5Ухоботов, В.И. Однотипные дифференциальные игры с выпуклой целью / В.И. Ухоботов // Тр. Института математики и механики УрО РАН. — 2010. — Т. 16, № 5. — С. 196–204.
6Ухоботов, В.И. Однотипная дифференциальная игра с терминальным множеством в форме кольца / В.И. Ухоботов// Некоторые задачи динамики и управления: сб. научных трудов. Челябинск: Челяб. гос. ун–т, 2005. С. 108–123.
Научная новизна. Результаты диссертационной работы являются новыми.
Теоретическая и практическая ценность работы. Работа носит теоретический характер. Полученные результаты могут быть использованы для дальнейшего исследования задач импульсного управления динамическими системами при наличии помехи, в частности для разработки численных методов решения таких задач, а также в учебном процессе при чтении курсов по теории управления и дифференциальным играм.
Методология и методы исследования. В работе применяются методы теории дифференциальных уравнений, теории дифференциальных игр, теории оптимального управления, выпуклого анализа и функционального анализа.
Положения, выносимые на защиту. В работе получены:
-
Оптимальное управление и оптимальная реализация помехи в однотипной задаче управления при наличии помехи с геометрическим ограничением на управление и с терминальным множеством в форме кольца;
-
Необходимые и достаточные условия встречи в заданный момент времени с терминальным множеством в форме кольца в однотипной задаче импульсной встречи при наличии помехи и соответствующие оптимальное управление и оптимальная реализация помехи;
-
Достаточное условие встречи в заданный момент времени с началом координат в задаче импульсного управления при наличии помехи с декомпозиционной динамикой и соответствующее гарантирующее управление, достаточное условие невозможности встречи в заданный момент времени с началом координат в этой задаче и соответствующая реализация помехи.
Степень достоверности и апробация результатов. Результаты диссертации приведены в виде математических утверждений, которые строго доказаны. Достоверность и обоснованность полученных результатов определяется математической строгостью методов исследования, корректным использованием математического аппарата, публикацией работ по теме диссертации в открытой печати в ведущих рецензируемых изданиях и апробацией результатов диссертации.
Основные результаты работы докладывались на:
-
Международной конференции «Динамика систем и процессы управления», посвященной 90-летию со дня рождения академика Н.Н.Красовского (ИММ УрО РАН, УРФУ, Екатеринбург, 15–20 сентября 2014 г.);
-
Всероссийской конференции с международным участием «Алгоритмический анализ неустойчивых задач», посвященной памяти В.К. Иванова (ЮУрГУ, Челябинск, 10–14 ноября 2014 г.);
-
II Международном семинаре «Теория управления и теория обобщенных решений уравнений Гамильтона–Якоби», посвященном 70–летию со дня рожде-5
ния академика А.И.Субботина (ИММ УрО РАН, УРФУ, Екатеринбург, 1—3 апреля 2015 г.);
-
Всероссийской конференции с международным участием «Теория управления и математическое моделирование», посвященной памяти профессора Н.В. Азбелева и профессора Е.Л. Тонкова (УдГУ, Ижевск, 8–12 июня 2015 г.);
-
XIII Международной конференции «Устойчивость и колебания нелинейных систем управления» (конференция Пятницкого) (ИПУ им. В.А. Трапезникова РАН, Москва, 1–3 июня 2016 г.);
-
Международной конференции «Геометрические методы в теории управления и математической физике: дифференциальные уравнения, интегрируемость, качественная теория» (РГУ им. С.А. Есенина, Рязань, 15–18 сентября 2016 г.).
Тезисы докладов опубликованы в [–,,].
Результаты работы обсуждались также на семинаре отдела динамических систем Института математики и механики им. Н.Н. Красовского УрО РАН (руководители — член–корреспондент РАН В.Н. Ушаков, профессор А.М. Тарасьев; 2017 г.) и на научных семинарах кафедры теории управления и оптимизации Челябинского государственного университета (Челябинск, 2013–2017 гг.).
Основные результаты по теме диссертации изложены в 14 работах. Работы [–, ] опубликованы в журналах из Перечня ВАК. Работа [] включена в международную реферативную базу данных Scopus. Получено свидетельство о государственной регистрации программы для ЭВМ []. Все основные результаты диссертации автор получил лично. В совместных статьях с научным руководителем В.И. Ухоботову принадлежат постановки задач и общее руководство проводимыми исследованиями.
Работа выполнена при финансовой поддержке Минобрнауки РФ в рамках базовой части (проект №4047) (2016 г.), грантов Фонда перспективных научных исследований Челябинского государственного университета (2015 г., 2017 г.) и Фонда поддержки молодых ученых Челябинского государственного университета (2016 г.).
Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения, списка обозначений, списка литературы и приложения. В приложении представлен скан свидетельства о государственной регистрации программы для ЭВМ. Полный объем диссертации составляет 140 страниц. Список литературы содержит 82 наименования.
Задача преследования
Здесь to p — начальный момент времени, /І(to) 0 начальный запас ресурсов, который может быть использован при формировании управления.
Допустимыми программными реализациями помехи на отрезке [t,r] являются измеримые функции v : [t, т] — V, где множество V С М.т является связным компактом.
Заданы вектор ф Є Шп и числа а Є К, 0 є\ еч. Целью выбора управления является осуществление неравенств (0.0.1). Другим примером является импульсная модификация игры «изотропные ракеты» [1, С. 139], [48, С. 44, 85] с терминальным множеством в форме кольца. В параграфе 2.2 дана общая постановка задачи. Рассматривается процесс управления при наличии помехи в фазовом пространстве Шп dz = —a(t) du + b(t)v dt, t p.
Здесь p — заданный момент времени; a(t) и b(t) - неотрицательные скалярные функции, причем функция a(t) является непрерывной на полуоси (—оо,р], а функция b(t) суммируема на каждом отрезке [ті,Т2] С (—оо,р].
На выбор управления и накладывается импульсное ограничение (0.0.6). Цель управления заключается в том, чтобы в момент времени р осуществить неравенства (0.0.3). Функция v является реализацией помехи.
Управлением является пара функций [48] ф{р) Є Ш+ и u(t, z) Є М.п. При выборе этих функций в отдельные моменты времени осуществляется их коррекция [51,72], которая производится следующим образом. Выбирается конечный набор моментов коррекции to = То Т\ ... ті = р. В момент времени Т;, і = 0, /, зная реализовавшееся состояние Z(TJ), /І(Т ), выбирается произвольная функция Ui : [ТІ,ТІ+І) х Шп — Мп, удовлетворяющую равенству iij(,z) = 1, абсолютно-непрерывная, неубывающая функция фі : [T TJ+I] — Ш+ и число Aj 0 такие, что /i(t) = /І(ТІ) — Aj — / 0І(Г) ir 0, ТІ t Т{+\. (0.0.7) Реализацией помехи является любая функция v : (—оо,р] х Жп — Мп, удовлетворяющая ограничению t (,z) 1. Такую реализацию помехи назовем допустимой. Движение, порожденное выбранным на отрезке [T TJ+I] управлением и реализовавшейся помехой, определим с помощью ломаных. Для этого зафиксируем разбиение и : тг = t{0) t{l) ... t{k+l) = n+1, d(u) = max (t{j+1) - t{j)) и построим ломаные [48, С. 75] Zuj{t ) = z(Ti) Aja(rj)it(rj, z(ri)) = z{ji + 0), O t \ а(г)фі(г) dr ) u{pi\ zU}{t ))+ fU) Ot \ b(r) dr J v{t \ гш(№)), при Под движением z(t) на отрезке [T TJ+I] будем понимать равномерный предел последовательности ломаных Wfc(), у которых диаметр разбиения d(ujk) — 0. Изменение запаса ресурсов fi(t) определяется формулой (0.0.7).
Наличие импульсного управления требует дальнейшей формализации условий окончания (0.0.3). Следуя [28,45], распишем условия окончания в следующем виде: Єї \\z(p + 0)11 = \\z{p) Аа(р)м Є2 при некоторых числе А Є [0,/i(p)j и векторе и Є Шп с it = 1.
В параграфе 2.3 дано определение максимального стабильного моста для задачи, поставленной в параграфе 2.2. Согласно [35], в процедуре построения максимального стабильного моста используются программные управления и программные реализация помехи. На каждом отрезке [,] С (—оо,] допустимым программным управлением является функция : [,] — Шп с ограниченной вариацией. На выбор управления накладывается импульсное ограничение (0.0.6).
Допустимой программной реализацией помехи является измеримая функция : [,] — , где = { Є Шп : 1}.
Позицией управляемой системы является точка (,), где Є Шп и Є Ш+. Число характеризует количество запасов ресурсов, которое можно использовать на формирование допустимого программного управления : [,] — Кп.
При выбранных на отрезке [,] допустимом программном управлении и допустимой программной реализации помехи правило перехода позиции задается формулами Т Т Т () = () — (), () = () — () () + ()() . (0.0.8) t t t Первый интеграл во второй формуле (0.0.8) понимается в смысле Римана Стилтьеса. Условие не перерасхода имеющегося запаса ресурсов записывается в виде неравенства () 0. Для чисел І Є К, = 1, 2 обозначим (i,2) = { Є Шп : 2} (0.0.9) Очевидно, что множество (0.0.9) непусто тогда и только тогда, когда 2 max(i; 0). При 2 i 0 оно является кольцом. Заданы числа 0 \ 2, с помощью которых в пространстве Жп х Ш+ определено терминальное множество = {(,) Є Шп х Ш+ : Є (i,2), 0}. (0.0.10) Цель управления заключается в том, чтобы вывести позицию (,) в момент времени на терминальное множество (0.0.10). Учитывая наличие импульсного управления, условие попадания позиции в момент времени на терминальное множество запишем в следующем виде [28, 43]: z(p) Є S(ei,2) + fJ,(p)a(p)S, fi(p) 0. Для построения максимального стабильного моста [16] W(t) С Шп х Ш+ при t р, ведущего в момент времени р на множество (0.0.10), введем оператор программного поглощения [35,43].
Пусть X С Шп х Ш+, t т р. Тогда TtT(X) — множество точек (z,/i) Є Mn хМ+, для каждой из которых по любой допустимой программной реализации помехи v : [t,r] — 5 можно указать допустимое программное управление и : [,т] —Мп такое, чтобы точка (z(r),/i(r)), определяемая формулами (0.0.8) при fi(t) = /І и z() = z, принадлежала множеству X. Полагаем, что TtT(0) = 0.
Вычисление значения оператора программного поглощения на кольце
Случай 2.1. Пусть ifj(t) 0 при t Є (0,Т). В этом случае g(t) 0 при t Т. Из (1.3.2) следует, что (єі) = —оо. Поэтому, согласно первой формуле из (1.3.3), f\{t) = Єї — git) 0 при t Є [0,Т]. Предположим, что Єї — g(0) (0) Є2 + ?(0). (1.5.2) Тогда Єї — g(0) Є2 + ?(0). Отсюда и с учетом того, что функция g{t) в рассматриваемом случае является неубывающей при t Т, следует выполнение неравенства є і — git) 2 + #() при всех Є [0,Т]. Согласно (1.3.3) и (1.3.4) это означает, что (і,2) 0.
Отсюда и из теоремы 1.3.1 получим, что при выполнении неравенств (1.5.2) управление преследователя (1.5.1) при любом допустимом управлении убегающего обеспечивает для любого реализовавшегося движения выполнение условия поимки (1.1.11).
Случай 2.2. Пусть ф{Ь) 0 при t Є (0,Т). В этом случае git) 0 при t Т. (1.5.3) Предположим, что (єі) 0, тогда, согласно (1.3.2) и первой формуле в (1.3.3), fiit) = Єї —git) при t Є [0,Т]. Учитывая (1.3.3) и (1.5.3), получим следующие неравенства: fiit) = Єї — git) Єї Є2 /2(0 = Є2 + git) при є [0,Т]. (1.5.4) Отсюда, согласно (1.3.4), (і,2) 0. Предположим, что 0 t(si). Учитывая (1.3.3) и (1.5.3), получим следующее неравенство fi(t) = о f2{t) = 2 + g{t) при t є [о,t(si)]. При t(si) t выполнено неравенство (1.5.4), поэтому, согласно (1.3.4), t(ei, є2) О Из формулы (1.3.2) следует равенство е\ = g{t{e\)). Поэтому, учитывая, что функция g(t) в рассматриваемом случае является невозрастающей при t Т, получим неравенство Єї — g{t) 0 при t Є [0,(єі)].
Отсюда и из теоремы 1.3.1 следует, что при выполнении неравенств (1.5.2) управление преследователя (1.5.1) при любом допустимом управлении убегающего обеспечивает для любого реализовавшегося движения выполнение условия поимки (1.1.11). Случай 2.3. Пусть существует точка t Є (0,Т) такая, что ifj(t) 0 при t Є (0, ) (1.5.5) и ifj(t) 0 при t Є (t ,T). (1.5.6) Из (1.5.6) получим, что g(t) 0 при t Є [t ,T). Тогда из (1.3.2) следует, что t{e\) t . Поэтому, согласно первой формуле из (1.3.3), /і( ) = Є\ — g(t ) 0. Предположим, что єі 9it ) е2 + 9{t )- (1.5.7)
Отсюда и с учетом того, что функция g(t), согласно (1.5.5), является неубывающей при t Є [ ,Т], следует выполнение неравенства е\ — g(t) 2 + g{t) при всех t Є [t , Т].
Далее, обозначив е\ = е\ — ?( ), е\ = є 2 + g{t ) и приняв t за момент окон 47 чания процесса преследования, воспользуемся (1.5.5), чтобы попасть в условие случая 2.2. Таким образом, отсюда и из теоремы 1.3.1 получим, что при выполнении неравенств (1.5.2), (1.5.7) управление преследователя (1.5.1) при любом допустимом управлении убегающего обеспечивает для любого реализовавшегося движения выполнение условия поимки (1.1.11). Случай 2.4. Пусть существует точка t Є (О, Т) такая, что ifj(t) 0 при t Є (0, ) (1.5.8) и ifj(t) 0 при t Є (t ,T). (1.5.9) Приняв t за начальный момент времени, воспользуемся (1.5.9), чтобы попасть в условие случая 2.2. Откуда следует, что fi(t) f2ip) при t Є [ ,Т]. Пусть /і( ) = 0. Это означает, что е\ — g(t ) 0. Тогда верны неравенства 0 t t(si). Следовательно, /i(0) = 0. Пусть /і( ) = Є\ — g{t ) 0. Тогда учитывая (1.3.1) и (1.5.8), получим /i(0) = е\ — д(0) = е\ — g(t ) — / ifj(r)dr є\ — g(t ) 0. о Таким образом, получили формулу І 0, при е\ ?( ), /і(0) = (1.5.10) І єі—д(0), при е\ g{t ). Предположим, что /і(0) (0) Є2 + ?(0). (1.5.11) тогда /і(0) Є2 + д(0). Учтем, кроме того, что функция g(t), согласно (1.5.8), является неубывающей при t Є [0, ]. Пусть /і(0) = 0, тогда, согласно (1.5.10), выполнено неравенство fi(t) = 0 Є2 + g(t) при всех t Є [0, ]. Пусть /і(0) = Єї — ?(0), тогда выполнено неравенство е\ — g(t) Є2 + g(t) при всех t Є [0, ]. Согласно (1.3.2) и (1.3.4) это означает, что (єі,Є2) 0.
Таким образом, отсюда и из теоремы 1.3.1 получим, что при выполнении неравенств (1.5.11), где /і(0) определяется по формуле (1.5.10), управление преследователя (1.5.1) при любом допустимом управлении убегающего обеспечивает для любого реализовавшегося движения выполнение условия поимки (1.1.11).
В данном параграфе рассмотрен модифицированный вариант задачи преследования маломаневренных объектов из примера 1.1.3, где дополнительно на каждый объект действует сила сопротивления среды Fi (і = Р,Е), которая по величине пропорциональна квадрату скорости объекта и направлена в сторону, противоположную его скорости.
Целью преследователя является осуществление захвата цели. В данном параграфе это означает, что расстояние до цели не должно превосходить заданного числа є 0. Запишем уравнения движения для объекта і (і = Р,Е). Имеем Xi = Vi cos фі, у І = Vi sin фі, ГПІХІ = rrii(Vi cos фі — фіУі sin фі) = —СІ sin фі — kiVi cos фі, (1.6.1) ГПІУІ = rrii(Vi sin фі + j iVi cos фі) = СІ cos фі — kiVi sin фі. (1.6.2) Здесь кі 0 — коэффициент сопротивления среды, піі— масса материального объекта. Считаем, что законы изменения величин управляемых сил описываются контроллерами первого порядка (1.1.8) и (1.1.9).
Задача преследования в случае q to р
Управление строится по правилу, приведенному при доказательстве лемм 2.8.4 и 2.8.5. Пусть g(to,n{to)) lk( o) i + B(to,p)- (2.8.18) Пусть /i(to) v{to). Тогда, как следует из формулы (2.5.4), неравенства (2.8.18) принимают вид (2.8.15) при ТІ = TQ = to. Управление строится по правилу, описанному при доказательстве леммы 2.8.6. Пусть /i(to) v{to). Тогда неравенства (2.8.18) принимают вид О z(to) i + B(to,p)- (2.8.19) Применяя лемму 2.8.1, найдем число to t р такое, что a(t ) 0 и Єї — /i(to)a(t ) + B(t ,p) 0. (2.8.20) Отсюда и из неравенств (2.8.19) получим, что, если t = to, то выполнено неравенство (2.8.15) при ТІ = то = р. Управление строится, как и в лемме 2.8.6. Пусть t = р. Берутся моменты коррекции то = to, ті = р, функции Uo(t, z) = w(z) и 4 o{t) = 0. Тогда fi(p) = /І(to) и, согласно (2.8.20), є\— ц{р)а{р) 0. Далее, из неравенств (2.8.7) и (2.8.19) получим, что (р) Є\ + 2B(to,p) 2. Стало быть, неравенства (2.2.5) выполнены. Пусть to t р. Берутся моменты коррекции То = to, ті = t , Т2 = р, функции ito(t, z) = w(z) и фо(t) = 0 и число Ао = 0. Тогда /І(ТІ) = /i(to) и, как следует из (2.8.6) и (2.8.19), Z(TI) Єї + B{toiP) + В (to, ті) = Єї + 2B(to,p) — В(т\,р) Є2 — В(т\,р).
Поэтому, если Єї + В(т\,р) Z(TI), то применяется лемма 2.8.5 с ТІ = т\. Если же Єї + В(т\,р) Z(TI), то, с учетом неравенства (2.8.20), получим неравенства (2.8.15) при ТІ = т\. Далее применяется лемма 2.8.6.
Случай 3. Пусть m(to) = a(t ) при некотором q t р. Тогда a(t ) = m(t ) 0. Если fi(to) v{to), т0 неравенства (2.8.8) принимают вид Єї — fj,(to)a{t ) + B(to,p) z(to) Є2 + fj,(to)a{t ) — B(to,p)- (2.8.21) Берутся моменты коррекции го = to, ті = , Т2 = р: функции uo(t,z) = w(z), 4 o{t) = 0 и число Ao = 0. Тогда /І(ТІ) = /І(О). ИЗ неравенств (2.8.6) и (2.8.21) получим, что в момент времени ТІ = т\ выполнены неравенства (2.8.11). Далее применяем леммы 2.8.4, 2.8.5, 2.8.6.
Пусть fi(to) v{to). Тогда неравенства (2.8.8) принимают вид 0 z(o) 2 + n{to)a{t ) — B(to,p)- (2.8.22) Поскольку m(to) = m(t ): то из леммы 2.8.2 получим неравенство fi(to) v{t ). Для числа t найдем число t t р, для которого выполнено неравенство (2.8.1). Берутся моменты коррекции TQ = to, т\ = , Т2 = t : Ts = р, функции Uo(t, z) = w(z), фо{р) = 0 и число До = 0. Тогда fi(to) = д(ті) V{T\) И, согласно (2.8.6) и (2.8.22), 0 Z(TI) z(to) + В (to, ті) Є2 + /і(ті)а(ті) — В(ті,р). Если Є2 — В(ті,р) z(ri), ТО берутся функции Uj(t,z) = w(z), 4 j(t) = 0 при j = 1,2, число Ai, определяемое формулой (2.8.13) при Tj = ті, и число А2 = 0. Тогда из леммы 2.8.4 получим неравенства (1.2.2). Если Єї + В(ті,р) Z(TI) Є2 — В(ті,р), то берутся Uj(t,z) = w(z), 4 j(t) = 0, Aj = 0 при j = 1,2. Тогда из леммы 2.8.5 получим неравенства (1.2.2). Пусть Z(TI) Єї + В(ті,р). Поскольку /І(ТІ) V{T\), ТО ИЗ неравенства (2.8.1) получим, что е\ — ц{т\)а{т2) + В(т2,р) 0. Управление строится так же, как и для случая (2.8.19), (2.8.20). 2.9. Задача преследования в случае to q Рассмотрим вначале случай, когда q\ to q- Исходя из предположения 2.8.1, построим моменты коррекции to = то ті ... ті Т/-І-1 = q. Из формул (2.6.3) и (2.6.6) следует, что включение (z(rj),/i(rj)) Є \(ТІ) выполнено тогда и только тогда, когда Є\ + Є2 „, гл/ д{Ті, ціті)) ЫЛ \ ітї{ті)ш(ті) — D(Ti)), /4T«) D[Ti). (2.9.1) Отметим, что, если Єї + 2 7-w z( «) = 5 M7 ) D\Ti)} (2.9.2) то неравенства (2.9.1) выполнены. В самом деле, неравенство / Єї + Є2 д{Ті,ціті)) при qi ТІ q непосредственно следует из формулы (2.6.4). При і = 0 неравенства (2.9.1) выполнены. Пусть они выполнены при некотором і = 0,1. Построим на отрезке [TJ,TJ-_I] управление, обеспечивающее выполнение неравенств (2.9.1) при і + 1.
Случай 1. Пусть m(t) = т(ті) при всех ТІ t Tj+i. Берутся функции фі{Ь) = 0, Ui(t,z) = w(z) и число Aj = 0. Тогда /І(Г +І) = /І(Т ). Поэтому из формулы (2.8.3) следует, что /І(Г +І) D(ri+i). Из формул (2.8.3) и (2.8.6) следует, что при і + 1 выполнена правая часть первого неравенства в (2.9.1).
Покажем, что выполнена и левая часть первого неравенства в (2.9.1). Пусть ІІ(ТІ) viji). Поскольку /І(ТІ--І) = /І(ТІ) и, согласно второму равенству в (2.8.2), viji) = P"(TJ-_I), то из формулы (2.6.4) получим, что #(Tj,/i(Tj)) = (ТІ+І,/І(ТІ+І)) + 5(rj,Tj-_i). Здесь также использовано равенство (2.8.3). Отсюда, используя левое неравенство в (2.8.6), получим, что левая часть первого неравенства в (2.9.1) выполнена при і + 1. Пусть ІІ(ТІ) v{ji). Тогда /І(Г +І) Z/(TJ__I). Из формулы (2.6.4) следует, что д(ті+і,/і(ті+і)) = 0. Значит требуемое неравенство выполнено.
Область достижимости управления
Подставив последнее равенство в (3.7.4), получим тождество. Следовательно, выполнено равенство (3.7.3).
Далее, при любой допустимой реализации помехи для реализовавшегося значения 9{ті) верна оценка #(ті) 0(т"о) + (ri то)с. Отсюда и из свойств 3.7.1, 3.7.2 следует неравенство F (6(TI)) F {\6{TQ)\ + (ті — то)с). Учитывая это неравенство и равенство (3.7.3) получим требуемое неравенство (3.7.2). Случай 2.1. Пусть начальное состояние to, #о таково, что г: Wo) С- 3.7.5 Утверждение 3.7.1. Пусть начальное состояние to р, z(to) Є Жп, во Ж. u /i(to) 0 удовлетворяет условию (3.7.5) и для некоторого є 0 выполнено неравенство \z (И) С + є + (Р — Н) )U (И)) — г І wo ) (3.7.6) Тогда для любого разбиения ио (3.2.3) существует и-стратегия, обеспечивающая выполнение неравенства \z {p)\ ( + є при любой допустимой реализации помехи.
Доказательство. Возьмем произвольное разбиение си (3.2.3) и построим ломаную (3.2.4)-(3.2.6). при любой допустимой реализации помехи. Таким образом, в момент времени р для любого разбиения си и для любой допустимой реализации помехи будет выполнено неравенство (р)! ( + є. которое влечет to q(2). В дальнейшем будем отождествлять q с решением q ). Рассмотрим задачу с моментом окончания q, где цель построения ад-стратегии заключается в выводе вектора z в момент времени q в начало координат. Согласно определению 3.2.2, условие попадания в начало координат для рассматриваемого примера значит, что для любого числа є 0 существует число 5 0 и u-стратегия такие, что для любого разбиения си (3.2.3) с диаметром d(uj) 5 и для любой допустимой реализации помехи выполнено неравенство 1 ( )1 (P Q)IIUJ{Q) + є Вычислим B(to, $o), определяемую формулами (3.6.1) и (3.6.2), для рассматриваемого случая ( PI I ft(ir\ І "ї В (to, во) = sup / rfr : в = cv, \v\ 1, #(o) = o = tn P — r /9 l ol + (T — to)c f4f\@o\-lr(p — to)c \ dr = c dr. Г) (Y T) T r u a \a і + M Po , В (to, Uo) = ( t/o + (P — to )c) In (q — to)c. p — q Пусть начальное состояние to q, z(to) Є Ж, д(о) 0 и #(о) Є К. таково, что выполнено неравенство ( Ґ\ПҐ Р — to \ U(to) (р — to) fJ-Uo) — (\0(to)\ + (Р — to)c) In Ь ш — о)с . (3.7.11) Р Q Построим м-стратегию, гарантирующую попадание в начало координат в момент времени q при любой допустимой реализации помехи.
Как следует из результатов параграфов 3.5 и 3.6, неравенство (3.7.11) определяет условие принадлежности стабильному мосту (3.5.1) для данного примера. Тогда начальное состояние to, z(to), д(о), $( о) удовлетворяет условиям теоремы 3.5.1, а, следовательно, существует м-стратегия, гарантирующая попадание в начало координат в момент времени q при любой допустимой реализации помехи.
Для построения этой гарантирующей м-стратегии необходимо решить проблему моментов (3.5.8), которая для рассматриваемого примера примет вид
Далее, для любой функции и : [t,q] - i?с ограниченной вариацией и удовлетворяющей равенству (3.7.12) выполнено неравенство Откуда следует, что функция и {т) является решением задачи (3.7.12). Берем эту функцию щ{т) в качестве м–стратегии для позиции (t,z,fj,,0). Для всех остальных позиций полагаем и (т) = 0 при t г q.
Следствие 3.7.1. Пусть для некоторого числа є 0 и разбиения иі\ (3.2.3) отрезка [to,q] реализовалось неравенство \z UJl (q)\ Ц {q){p q) + є. Тогда для любого разбиения х 2 отрезка [q,p] при выполнении условия z UJl (q) = z 2\q), (q) = /i 2\q), 9 1\q) = 9 2\q) существует и-стратегия, гарантирующая неравенство \z 2\p)\ ( + є при любой допустимой реализации помехи.
Доказательство. Отметим, что для реализовавшегося значения 9 2 {q) верна оценка \9 2 {q)\ #о + (q to)с. Отсюда, из (3.7.9) и свойств 3.7.1, 3.7.2 следует, что ( = FJ!(\Qo\ + (q — to)с) F (9 2 (q)), (3.7.13) поэтому выполнены следующие неравенства \z 2\q)\ li \q){p - q) + є UJ2\q){p q) + є + С — F {9 2\q)). Отсюда и из (3.7.13) получим, что состояние z 2\q), 9 2 {q), 2\q) удовле творяет условию утверждения 3.7.1, а, следовательно, для любого разбиения х 2 отрезка [q,p] существует w–стратегия, обеспечивающая выполнение неравенства \z 2 {p)\ ( + є при любой допустимой реализации помехи.