Содержание к диссертации
Введение
Глава I. Оценка траекторий интервальных управляемых систем 19
1. Описание интервальных управляемых систем 19
1.1. Основные определения 19
1.2. Пучок траекторий интервальной системы 22
1.3. Внешнее оценивание пучка траекторий 26
2. Гарантированная управляемость 33
3. Управляемость и интервальная алгебраическая система 37
3.1. Классический критерий управляемости 37
3.2. Управляемость и интервальная алгебраическая система .38
3.3. Субуниверсальное решение .42
3.4. Свойства субуниверсального решения .45
4. Иные подходы к решению задачи ;... 46
4.1. Управление с минимальной нормой 47
4.2. Стационарные границы интервалов и неполная управляемость центральной системы 49
Глава II. Стабилизация интервальных управляемых систем 50
1. Стабилизирующие управления и их основные свойства 50
1.1. Построение управлений 50
1.2. Свойства стабилизирующих управлений 52
2. "Оператор сжатия" фазового пространства 55
3. Асимптотическая стабилизация однородной интервальной управляемой системы 57
4. Стабилизация неоднородной интервальной управляемой системы 60
4.1. Терминальный критерий и построение интервальной алгебраической системы 60
4.2. Структура и свойства стабилизирующих управлений 62
4.3. Достаточные условия устойчивости 64
5. Результаты стабилизации для стационарных границ интервалов 67
Глава III. Стабилизация линейной интервальной наблюдаемой системы 72
1. Параллелепипед начальных состояний 72
1.1. Анализ интервальной системы 72
1.2. Поэтапная стабилизация 75
2. Задача интервального наблюдения 80
3. Стабилизация однородной интервально наблюдаемой системы 84
4. Двухфазная процедура стабилизации 88
5. Неоднородное интервальное наблюдение 93
Глава IV. Локальная стабилизация нелинейных систем с неопределенными параметрами 97
1. Постановка задачи 97
2. Линеаризация системы 98
3. Синтез управления на основе линеаризованной системы 100
4. Применение управления к нелинейной системе 103
Заключение 113
Литература 115
- Описание интервальных управляемых систем
- Стабилизирующие управления и их основные свойства
- Параллелепипед начальных состояний
- Постановка задачи
Введение к работе
Предварительные сведения
Задачи управления, как в естественных науках, так и в науках общественных, являются популярным предметом исследования на протяжении веков. Они остаются актуальными и на сегодняшний день, — меняются лишь объекты исследования, для которых необходимо найти требуемое управляющее воздействие.
Классическая теория управления многомерными системами [2, 29, 32, 35], получившая активное развитие в 40-х — 60-х годах 20-го века, сегодня модифицируется и усиливается в новых, расширенных постановках задач. Одним из актуальных направлений является построение моделей управляемых систем с априорным учетом неопределенностей, возникающих во входных данных и параметрах.
Данная диссертационная работа также посвящена изучению одной из классических задач оптимального управления — задачи стабилизации управляемых систем [2] — на основе активно развивающихся со второй половины 20-го века идей интервального анализа [1, 30, 75].
Прежде чем приступить к изложению идей и методов, составляющих суть данной работы, представляется необходимым сказать несколько слов о современных направлениях в выбранной области исследований.
Сложность структуры реальных объектов часто не позволяет дать модельное описание объекта в виде "точной копии". В этом смысле неопределенность изначально заложена в исследуемую модель. Если говорить об идеологии управляемых систем, то управляющие воздействия ("рули") в таких системах используются для удовлетворения некоторого, часто экс тремального, критерия, задающего желательные для пользователя характеристики (свойства) системы. При этом неопределенность, заложенная в управляемой системе, характеризует экзогенное влияние на ее динамику. Такое влияние во многих случаях противоречит сформулированному критерию, мешает его достижению. Построение управлений, скорректированных на априорный учет неопределенностей, является актуальным, активно развивающимся направлением исследований (см., например, [7, 10, 21, 33, 59, 77] и др.).
Вообще говоря, выбор исследователем метода решения поставленной перед ним задачи зависит от полноты и структуры знаний об изучаемом объекте. Историческое развитие подходов в математическом моделировании определило путь от детерминизма (ситуации "полное знание - точный результат") к индетерминизму, учитывающему неполноту знаний об объекте исследования.
Применение тех или иных методов при решении задач всегда определяется соотношением между степенью точности, с которой мы хотим изучать интересующий нас объект, и сведениями о его природе, которыми мы располагаем. Степень неполноты знаний об объекте может быть различной, что также определяет соответствующие направления исследований.
В частности, модели со структурной неопределенностью отражают слабую изученность реальных процессов и связей, имеющихся в объекте исследования. Примером таких моделей могут служить системы случайной структуры [28].
В отдельных случаях перед исследователем встают задачи с неопределенными (недоопределенными) целями. В такой ситуации не имеет смысла говорить о некотором детерминированном решении задачи, можно лишь указать "класс подходящих решений" [38].
Недоопределенность цели может, в частности, выражаться множественностью критериев. При решении таких задач наиболее популярным является класс Парето-оптимальных решений [46].
Если же структура объекта ясна, а цель моделирования детерминирована, возникают неопределенности другого характера. Это погрешности в измерении, потери точности при построении модели (сознательное упрощение структуры, например, процедура линеаризации), возможные вариации параметров в процессе управления объектом, влияние "шумов". В таком случае говорят о параметрической неопределенности объекта.
При решении задач управления объектами с неопределенными параметрами также используется большое количество методов, различающихся, в основном, подходами к описанию. С точки зрения "количества" используемой информации об объекте наиболее полными (после детерминистских) являются стохастические методы, описывающие неопределенности как некоторые случайные процессы, характеристики которых заданы априорно. Примером может служить хорошо известная теория линейной фильтрации [29]. Непараметрические ("качественные") методы описания (в частности, теория нечетких множеств [23, 44] и ее применение в теории управления [7]), напротив, не используют информацию о предполагаемых количественных значениях параметров, характеризуя параметры системы лишь с помощью функций принадлежности.
Промежуточное положение занимают популярные в последнее время интервальные методы анализа, полагающие известными границы отрезков (интервалов) изменения параметров. Потенциальный континуум реализаций неопределенных коэффициентов в заданных интервалах составляет основное отличие интервальной задачи от детерминированной. Вместе с тем, полное отсутствие информации о реализациях коэффициентов не позволяет трактовать задачу как стохастическую и использовать упомянутую выше теорию фильтрации [29].
ЗАМЕЧАНИЕ. В интервальном анализе под "интервалами" обычно понимаются замкнутые интервалы, то есть отрезки.
Следует отметить естественный и интуитивно ясный факт охвата детерминированных моделей интервальными: если нижняя и верхняя границы интервалов для каждого параметра совпадают, модель становится классической (детерминистской). В этом смысле интервальность есть признак неполного знания о мире.
Интервальные методы в задачах управления
Согласно работе [37], интервальные методы в теории управления можно разделить на следующие группы:
1. Методы, основанные на применении аппарата функций чувствительности, частотном представлении объекта [21, 59, 71].
2. Методы с бесконечными коэфициентами усиления [55].
3. Адаптивные методы [49].
4. Методы модального управления [22, 24, 37, 52, 57, 58].
5. Оптимальное управление [54, 64, 77, 78].
Если же говорить о задачах стабилизации, то во всех перечисленных группах можно выделить два основных подхода.
Первый подход связан с применением методов интервальной математики [1, 30, 61], хорошо разработанных для решения интервальных систем линейных алгебраических уравнений. Здесь используется аппарат интер вальной арифметики [75], а все результаты (равно как и входные данные и параметры) имеют интервальную структуру.
Основой данного подхода являются результаты [31, 40, 66, 72, 79], а также работа [70] и ее опровержения [69, 73], в которых формулируются различные достаточные условия и критерии устойчивости [18] линейных систем обыкновенных дифференциальных уравнений с интервальной матрицей состояния (см. определение интервальной матрицы в главе I). Условие интервальной матричной устойчивости применяется при анализе дискретных [50, 74] и непрерывных [26, 39, 42, 43, 47, 51, 60, 63] интервальных управляемых систем. Вопросы робастной устойчивости также рассматриваются с использованием интервальных функций Ляпунова [65] и интервального уравнения Сильвестра [62].
Среди методов исследования интервальной матричной устойчивости следует выделить анализ интервального характеристического полинома, основанный на теореме Харитонова [56]. В частности, в работе [57] сформулированы основные принципы аналитического синтеза регулятора для линейной стационарной интервальной динамической системы с одним входом, получены необходимые и достаточные условия разрешимости. В дальнейшем, в работах [19, 20, 52] эти принципы распространены на системы с многомерным входом. В работах [8, 25, 27, 37, 45, 53] изучены способы построения интервального характеристического полинома интервальной матрицы, на основе которого оценивается распределение спектра собственных значений интервальной матрицы замкнутой управляемой системы, а следовательно, и устойчивость "пучка" [33] траекторий замкнутой системы.
Плюс такого подхода — возможность работать с "большими" интервалами неопределенности параметров: при определенной структуре системы величина неопределенности может быть значительной.
Один из минусов данного подхода: операция интервального умножения имеет "расширяющее действие" [53, 75], что завышает степень неопределенности исходных данных в процессе вычислений при решении задачи.
Второй существенный минус — для построения стабилизирующего управления в многих случаях требуется условие полной управляемости [32] для всех независимых реализаций интервальных параметров системы.
Второй (вариационный) подход связан с анализом детерминированной системы из интервального множества систем. Анализируется поведение системы, построенной на нижних границах интервалов неопределенностей [42, 43], либо "центральной" [3, 4, 5, 6, 12] ("средней" [37], "серединной" [61]) системы, построенной из исходной системы заменой интервальных параметров на значения их середин (полусуммы границ). Построенное для детерминированной системы управление применяется к интервальной системе. На основе анализа пучка [33] траекторий замкнутой системы строятся оценки величины интервалов, сохраняющих требуемые свойства построенного управления в целом для интервальной системы.
Плюсы вариационного подхода. Во-первых, используются обычные детерминистские методы решения, не привлекающие аппарат интервальной арифметики, что приводит к более простым с вычислительной точки зрения алгоритмам. Во-вторых, требования управляемости обычно выдвигаются только относительно выбранной детерминированной системы, что является значительно более мягким условием по сравнению с требованием управляемости для всех систем из допустимых интервалов.
Минус данного подхода: завышение оценок при построении внешней аппроксимации пучка траекторий интервальной системы, и, как следствие, сужение гарантий выполнения критерия. Такой подход годен только для достаточно малых исходных интервалов неопределенности.
Цель, идеи, методы решения
Диссертационная работа посвящена проблемам стабилизации управляемых систем с интервальными параметрами.
Основная цель работы: стабилизация интервальных управляемых динамических систем непрерывного типа, построение процедуры стабилизации.
С точки зрения определенных выше классификационных критериев работа характеризуется следующими посылками:
1. Основное внимание в работе уделяется линейным интервальным динамическим управляемым системам.
2. Выбирается детерминированная цель: формулируется задача стабилизации траекторий интервальных систем в фиксированную точку фазового пространства.
3. При исследовании задач стабилизации используются управления без амплитудных ограничений. В некоторых случаях в описании используются ограниченные единичным кубом управления: г(01 1? 2 = 1, 4. Используется метод поэтапной стабилизации: стабилизирующее управление строится последовательно на отрезках времени [0,Т], [Т, 2Г],... с фиксированным периодом стабилизации Т 0. Результат стабилизации на отрезке [(к — 1)Т, кТ] учитывается при построении управления на [kT,(k + l)T\, feeN.
5. Закон управления полагается детерминированным, программно - позиционного типа: строящееся программное управление учитывает текущее фазовое состояние системы на каждом этапе стабилизации, что приближа ет данное управление к синтезированному типу при малой длительности периода стабилизации Т.
6. Неопределенность параметров системы вводится для
а) текущего состояния системы. Применяется два альтернативных способа описания. В первом случае фазовое состояние полагается принадлежащим известному параллелепипеду соответствующей размерности. Во втором случае вводится и исследуется интервальное уравнение наблюдения;
б) неоднородной составляющей системы (аддитивная неопределенность);
в) матриц состояния и управления системы (мультипликативная неопределенность).
7. В пространстве параметров системы интервальная неопределенность характеризуется параллелепипедом соответствующей размерности. Каждая точка параллелепипеда отвечает конкретной реализации параметров. В этом смысле сложность исследуемой системы может быть сопоставлена размерности параллелепипеда, что эквивалентно количеству всех интервальных параметров в системе.
8. Основные результаты касаются достаточных условий гарантированной стабилизации системы.
9. Технология решения: вариационный метод, основанный на исследовании и стабилизации центральной системы, с последующим применением построенного управления к интервальной системе.
10. Используются методы робастного управления [41], подразумевающие устойчивое движение замкнутой системы при вариациях параметров в заданных границах интервалов, а также строятся оценки, характеризующие допустимые вариации параметров.
11. В отличие от рассматриваемых обычно постоянных по времени гра ниц интервалов анализируются задачи стабилизации систем с динамическими границами интервалов неопределенности.
12. Не рассматриваются вопросы, связанные с "временем счета" стабилизирующего управления: предполагается, что расчет управляющих параметров производится "мгновенно".
13. Работа отвечает концепции упреждающего управления [76], суть которой в том, что робастность управления повышается, если при его построении учитываются цель и будущее поведение системы.
Рассматриваемые в данной работе задачи можно разделить по четырем основным признакам:
A) исследуются стационарные (постоянные по времени) либо нестационарные (переменные) интервальные коэффициенты со стационарными либо нестационарными интервальными границами;
Б) рассматриваемая система содержит либо не содержит неуправляемые неоднородности аддитивного типа;
B) точка стабилизации совпадает либо не совпадает с точкой покоя системы;
Г) используются точные либо интервальные измерения фазовых состояний системы.
То или иное сочетание признаков в исследуемой системе характеризует асимптотическую устойчивость либо просто устойчивость замкнутой системы. В связи с тем, что факт асимптотической стабилизации заслуживает отдельного внимания, структура изложения работы позволяет выделить частные случаи общей задачи, в которых с помощью выбранных методов решения удается добиться асимптотической стабилизации. Охарактеризуем сформулированные признаки более подробно.
А) Стационарная интервальная система определяется постоянными по времени коэффициентами. Исследуя такую систему, мы знаем не только интервалы изменения коэффициентов, но и то, что любая заданная реализация допустимых коэффициентов останется неизменной на всем временно м интервале анализа системы.
Многие работы (см., например, [19, 25, 27, 37, 53, 77, 78]) посвящены анализу стационарных интервальных систем либо нестационарных систем со стационарными границами интервалов.
Более широким классом интервальных систем являются нестационарные системы с нестационарными границами. В данной работе одним из направлений исследования является изучение нестационарных интервальных динамических систем с переменными границами интервалов, что при некоторых условиях позволяет обобщить результаты [3, 4, 12], полученные для стационарных границ. Ясно, что переменные границы интервалов можно оценить сверху постоянными границами, однако данный переход "загрубляет" анализ исходной системы.
Б, В) Если правая часть системы содержит неуправляемую неоднородность, то точки покоя неоднородной и соответствующей ей однородной систем, вообще говоря, не совпадают. В некоторых случаях возникает необходимость разделять точки покоя и точки стабилизации системы, например, стабилизировать неоднородную систему к точке покоя соответствующей однородной системы. Это приводит к перманентному смещению системы из точки стабилизации, что не позволяет осуществить процедуру асимптотической стабилизации, а лишь гарантирует устойчивость замкнутой системы в окрестности точки стабилизации. Г) Если структура системы позволяет точно измерять значения фазового состояния в наперед заданные моменты времени, то стабилизирующее управление активно использует данную информацию о системе. В противном случае предлагается использовать два типа интервальных оценок фазового состояния - в виде параллелепипеда либо с использованием интервального уравнения наблюдения. При этом интервальное наблюдение позволяет добиться асимптотической стабилизации с помощью введения "фазы пассивного наблюдения": для формирования однородного уравнения наблюдения управляющие координаты периодически полагаются равными нулю (управление временно отключается).
Сформулируем теперь основные требования к строящемуся детерминированному стабилизирующему управлению. Во-перых, это точный аналитический критерий применимости управления к системе, выраженный через интервальные параметры системы. Такой критерий позволяет сделать вывод о гарантиях стабилизации до начала процедуры стабилизации. Второе требование —это невысокая вычислительная сложность при построении стабилизирующего управления.
Порядок изложения материала
Исследование рассмотренных в данной работе задач, отвечающих различным сочетаниям признаков А) — Г), проводилось по принципу "от простого к сложному". Данный факт отражен в порядке изложения материала. Начиная с пассивных оценок траекторий линейных интервальных неуправляемых систем, мы переходим к поиску активного управления, затем вводим и анализируем неоднородность аддитивного типа, далее добавляем в систему интервальные оценки фазовых состояний, и, наконец, анализируем нелинейные системы с неопределенными параметрами.
В первой главе формулируется общая постановка задачи, определяется методика исследования, строятся оценки пучка траекторий неуправляемой и управляемой систем при наличии и отсутствии ограничений на управление, обосновывается сведение задачи стабилизации к решению интервальных систем линейных алгебраических уравнений, вводятся определения универсального и субуниверсального решений таких систем, доказываются вспомогательные утверждения.
Вторая глава посвящена исследованию систем с детерминированными (точными) наблюдениями при отсутствии или наличии аддитивной неопределенности. Вводится определение слабой устойчивости, строятся стабилизирующие управления, а также формулируются и доказываются теоремы о слабой либо асимптотической устойчивости замкнутых систем.
В третьей главе обсуждается проблема оценки фазового состояния системы. Вводится и исследуется интервальное уравнение наблюдения. Изучаются свойства управляемости и наблюдаемости для интервальных матриц состояния, управления и наблюдения. Обосновывается введение "фазы пассивного наблюдения", позволяющей добиться асимптотической устойчивости траектории замкнутой системы.
Четвертая глава посвящена анализу нелинейных систем с ограниченными неопределенностями произвольной природы (неинтервального типа). Методом линеаризации исходная нелинейная система при разных предположениях сводится к решению задач, описанных в главах I—III. Исследуются стабилизирующие свойства управлений, построенных на основе линеаризованных систем, применительно к нелинейной системе. Доказывается факт локальной асимптотической стабилизации нелинейной системы. Основные результаты работы
1) Разработана процедура поэтапной стабилизации линейных интервальных управляемых систем на основе принципа "сжатия" фазового пространства.
2) Введена и исследована процедура оценки фазового состояния по результатам интервального наблюдения.
3) Установлены достаточные условия гарантированной стабилизации для разных классов линейных интервальных управляемых систем, включая однородные и неоднородные системы, стационарные и нестационарные системы, системы с "точным" (детерминированным) либо интервально наблюдаемым фазовым состоянием.
4) Доказаны достаточные условия локальной стабилизации нелинейных управляемых систем с ограниченными неопределенными параметрами.
5) Все результаты получены и обоснованы для интервальных систем с нестационарными интервальными границами. Проведен сравнительный анализ результатов для стационарных аналогов.
Основные результаты работы отражены в публикациях [3, 4, 11, 12, 13, 14,15,16,17,67].
Описание интервальных управляемых систем
Основным объектом исследования в работе служит линейная интервальная управляемая система (ЛИУС) Она рассматривается при следующих предположениях. Начальный момент времени в системе (1.1) полагается равным нулю: to = 0, изучается поведение системы на полуотрезке t Є [0,+оо). Интервальные параметры системы. Непрерывные элементы ciij(i),bik(t) интервальных матриц A(t),B(t) принадлежат соответствующим интервалам границы интервалов заданы известными непрерывными функциями переменной t, t 0. Условия (1.2) будем записывать в эквивалентной векторно-матричной форме где модуль матрицы и матричные неравенства понимаются поэлементно. Здесь матрицы Ao{t),Bo{t) и AA{t),AB{t) составлены из середин и полудлин интервалов (1.2): Пару матриц А(і),Б(), удовлетворяющих при t 0 условиям (1.3), будем называть допустимыми. Состояние и управление системы. Векторы а; (2), it (і) состояния и управления системы (1.1) размерностей пжг соответственно предполагаются детерминированными при каждой фиксированной реализации A(t),B(t) из (1.3). Управления u(t) будем считать кусочно-непрерывными при t О функциями со значениями в пространстве Rr. Состояние х = 0 будем называть точкой покоя ЛИУС (1.1), подразумевая, что процесс x(t) = 0,u(t) = 0 удовлетворяет системе (1.1) при любых допустимых A(t),B(t). Множество начальных состояний системы (1.1) есть гг-мерный параллелепипед заданный своим центром х и вектором Ах полудлин сторон. Наряду с однородной ЛИУС (1.1) будем также рассматривать неоднородную ЛИУС с вектором hit) из интервала Система (1.5) как обобщение ЛИУС (1.1) наследует все сделанные выше предположения. (Достаточно в (1.5) положить ho(t) = Ah(t) = 0). Интервальный вектор h(t) вносит в систему (1.5) неопределенность аддитивного типа, которую можно интерпретировать как неустранимую интервальную помеху. С другой стороны, неопределенность (1.3) матриц состояния и управления можно считать мультипликативной по отношению к любому допустимому процессу (x(t),u(t)). определение. Детерминированную систему вида определенную на серединах интервалов (1.3), назовем центральной однородной системой. определение. Центральной неоднородной системой будем называть детерминированную систему Помимо нестационарных систем (1.1), (1.5) будем использовать их стационарные аналоги, в которых границы интервалов не зависят от времени: где AQ, BQ, ho, АА, AB, Ah — постоянные матрицы и векторы. Соответственно будем говорить о "стационарной однородной" и "стационарной неоднородной" ЛИУС, а также о стационарных центральных системах сформированных на основе середин интервалов (1.9). В силу неопределенности коэффициентов (1.3), (1.6) и начальных условий (1.4) система (1.5) каждому выбранному управлению и (і) ставит в соответствие семейство ("пучок" [33]) траекторий, отвечающих всем допустимым A(t),B(t), h(t),x. Поэтому задача стабилизации системы (1.5) по сути состоит в поиске детерминированного управления, годного для пучка траекторий в целом.
Стабилизирующие управления и их основные свойства
Продолжим изучение однородной управляемой системы с интервальными коэффициентами Согласно результатам главы I, управление построенное на отрезке времени t Є [0,7і], ориентировано на центральную систему с известными матрицами Д)(), Bo(t). Таким образом, формула (2.3) позволяет восстановить управляющее воздействие на однородную систему (2.1) для каждого v. Неизвестный вектор v выбирается в соответствии с указанными в главе I решениями ИСЛАУ (1.35), (1.39). В частности, универсальное решение v , полученное из ЗЛП (1.44), и субуниверсальное решение v = -C Vo позволяют на основе (2.3) построить управления которые назовем универсальным управлением и субуниверсальным управлением соответственно. Дальнейшее изложение построим по следующей схеме. Укажем основные свойства универсального и субуниверсального управлений (2.5), (2.6). Для этого проанализируем их воздействие на интервальную систему (2.1), (2.2) на отрезке времени t Є [0, Т]. Затем опишем условия, при которых данные управления обладают стабилизирующим свойством, а именно "сжимают" срез пучка траекторий системы (2.1), (2.2) при t = Т : Здесь х(Т) — правый конец траектории системы (2.1), построенный на универсальном либо на субуниверсальном управлении для любой допустимой пары A(t),B(t). Индуктивное продолжение управлений вида (2.5), (2.6) на полуось t Є [О, +оо) позволит в дальнейшем сформулировать и доказать достаточные условия стабилизации интервальной системы (2.1), (2.2). В данном пункте сосредоточим внимание на основных свойствах предложенных управлений (2.5), (2.6). Чтобы различать фазовые траектории системы (2.1), отвечающие универсальному и субуниверсальному управлениям, наряду с обозначениями x(t),u(t),u (t) будем использовать подробные обозначения: u(t, х), u (t, х) — подчеркивающие программно-позиционный тип управлений (2.5), (2.6), то есть их зависимость от начального состояния х; x(t,u ,x), х й х0) — указывающие на траектории замкнутой системы (2.1) для произвольных фиксированных A(t), B(t) из (2.2). Кроме того, введем "тривиальное" управление u(t, х) = 0, означающее "выключение" управляющих воздействий всюду на t Є [0,Т]. Соответствующие универсальному, субуниверсальному и тривиальному управлениям невязки ИСЛАУ (1.35), (1.39) будем обозначать через є ,є,є. Перейдем к формулировкам. СВОЙСТВО 2.1. Субуниверсальное управление (2.6) переводит центральную однородную систему (2.4) в точку покоя х = 0 за время Т. Л Доказательство сводится к непосредственной подстановке управления в систему и использованию формулы Коши. СВОЙСТВО 2.2. Субуниверсальное управление (2.6) для центральной однородной системы (2.4) обладает минимальной энергетической нормой в пространстве L\. Д Доказательство следует из классической теории линейных управляемых систем [32]. СВОЙСТВО 2.3. Субуниверсальное управление u(t) = u(t,x) линейно по начальному состоянию х. Л Доказательство. Достаточно выписать управление в явном виде: u(t) = u(t, х) = К 0(Т, t)v = К 0(Т, t)D f0 = -К0(Т, t) D FQ{T, 0)х. О Свойства 2.4 — 2.6 определяют соотношения универсального, субуниверсального и тривиального управлений с точки зрения порождаемых ими пучков траекторий для всех допустимых A(t), B(t). Если принять норму фазового пространства равной \\х\\ = 1 \х\, то нормы невязок є , \\є\\, \\є\\ ИСЛАУ (1.35), (1.39) определят внешние оценки среза пучков траекторий на соответствующих управлениях. СВОЙСТВО 2.4. Внешняя оценка среза пучка траекторий на субуниверсальном управлении при t = Т содержит внешнюю оценку среза пучка траекторий на универсальном управлении. Л Доказательство следует из допустимости субуниверсального решения и оптимальности универсального решения в ЗЛП (1.44): є є, а также равенства норм невязок \\є , є соответствующим внешним оценкам среза пучка траекторий ЛИУС на универсальном и субуниверсальном управлениях, ф СВОЙСТВО 2.5. (Ограниченная применимость субуниверсального управления). Если ЛИУС (2.1), (2.2) обладает высоким уровнем неопределенности: /S.D\DQ1 JQ\ /о, то внешняя оценка среза пучка траекторий на тривиальном управлении w(t,a:0) содержится во внешней оценке среза пучка на субуниверсальном управлении.
Параллелепипед начальных состояний
В данной главе развиваются результаты главы П. Исследуется поведение линейных интервальных систем с учетом неопределенностей в оценке фазового состояния. Рассматривается два типа неопределенностей. В первом случае оценками фазового состояния в периодические моменты времени 0, Т, 2Г,... служат параллелепипеды Х, Хт, Х2Т, Процедура получе ния оценок такого вида не обсуждается. В качестве альтернативного подхода при описании интервальных управляемых систем с неточными начальными данными предлагается интервальное уравнение наблюдения. На основе интервальных наблюдений находится оценка фазового состояния, которая используется при построении программно-позиционного стабилизирующего управления. В данной главе основное внимание сосредоточено на построении субуниверсальных управлений. О применимости соответствующих универсальных управлений см. главу II. 1. Параллелепипед начальных состояний Сосредоточим внимание на основном отрезке времени [О, Т] и зададимся терминальным критерием стабилизации х(Т) = 0. На основе интегрального представления (1.23) траекторий системы (1.3) - (1.6) сформируем интегральную систему относительно управления u(t) : Здесь и далее индекс init (initial state intervals) определяет интервальные управляемые системы с неопределенностью начального состояния типа "параллелепипед". Матрица Dinit и вектор finit, равные т имеют интервальные оценки Неравенства (3.5), (3.6) определены матрицами Do, AD из (1.38), (1.40), a также векторами с величиной Zh из (2.32 В условиях полной управляемости центральной неоднородной системы 1.8) субуниверсальное решение ИСЛАУ (3.2) - (3.6), выраженное в виде отвечает начальному условию х(0) = х$ — центру параллелепипеда Х начальных состояний, поэтому субуниверсальное управление является аффинной функцией XQ : Из (1.24) оценка среза пучка траекторий ХІПЦ(Т) под воздействием управления (3.10) описывается правой частью неравенства Дальнейшее изучение неравенства (3.11) можно проводить в трех направлениях.
Постановка задачи
Более широким классом систем вида (4.1) являются системы, для которых вектор неопределенных параметров есть (априорно неизвестная) функция времени v(t) Є V, где множество V стационарно во времени. Наконец, можно полагать, что множество V значений неопределенных параметров также подвержено динамическим изменениям: V = V(t). В последнем случае стандартным "огрубляющим" переходом V = Uie[o)+00)V(2) можно перейти к стационарному множеству неопределенных параметров.
Изменение множества V(t) во времени вызывает динамику в интервальных оценках (4.8). При этом "разрывность" в поведении границы множества V(t) можно сглаживать при построении внешних оценок вида (4.8) так, что оценочные функции будут непрерывными.
Анализ стабилизации системы (4.1) для переменного множества значений параметров V(t) в целом повторяет ход рассуждений, описанный выше для стационарного случая. Уравнение интервального наблюдения в этом случае также можно полагать нестационарным. Соответствующая линеаризованная система с переменными интервальными коэффициентами в условиях теоремы 2.7 обладает свойством асимптотической устойчивости. Это позволяет (чередой громоздких преобразований) прийти к аналогичному теореме 4.1 результату, а именно, продемонстрировать факт локальной асимптотической устойчивости нелинейной системы (4.1) под воздействием субуниверсального управления.
Вторым направлением возможных обобщений поставленной в данной главе задачи может быть использование более мягкого предположения о связи множества неопределенных параметров V{t) с точками покоя системы (4.1).
Одним из вариантов является предположение о существовании различных "процессов покоя" вида (х(у),й(у)) для разных v Є V(t). Такое общее предположение имеет очевидный недостаток в том, что стационарные состояния х{у) (как и поддерживающие их управления й(г )) могут существенно различаться для разных v. Тогда говорить о выборе управления, годного в целом для семейства точек покоя не представляется возможным.
С другой стороны, можно ввести преположение, согласно которому исходная система (4.1) имеет одну (априорно известную) точку покоя (х,й) определенную хотя бы для одного v Є V(t) : f(x,u,v) = 0. Тогда при каждом t Є [0,+оо) можно построить нижнюю hbot(t) и верхнюю hhi(t) оценки значений f(x,u,v) по всем v V(t). Полученные таким образом (при необходимости "сглаженные" до непрерывных) функции hbotip), hhi(t) задают аддитивную неоднородность в линеаризованной системе (4.9), которая по своим свойствам соответствует неоднородной системе (1.5) из главы I.
В частности, субуниверсальное управление, построенное для неоднородной системы, аффинно относительно оценки начального состояния х :
Это, в свою очередь, "утяжеляет" остаточный член в разложении (4.39):
С учетом связи (4.35) квадратичный порядок малости для Ri(t) можно получить, например, потребовав равномерную ограниченность аддитивной неопределенности h(t) по х (или, эквивалентно, по х).
Действительно, если неопределенность h(t), в некотором роде задающая положение точки покоя, превышает величину начального отклонения х, можно говорить о стабилизации системы (4.1) лишь в окрестности порядка /i(t). Однако и предположение