Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методы продолжения решений в прикладных задачах оптимального управления Фигура Адам

Методы продолжения решений в прикладных задачах оптимального управления
<
Методы продолжения решений в прикладных задачах оптимального управления Методы продолжения решений в прикладных задачах оптимального управления Методы продолжения решений в прикладных задачах оптимального управления Методы продолжения решений в прикладных задачах оптимального управления Методы продолжения решений в прикладных задачах оптимального управления
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Фигура Адам. Методы продолжения решений в прикладных задачах оптимального управления : диссертация ... доктора физико-математических наук : 05.13.01.- Москва, 2001.- 158 с.: ил. РГБ ОД, 71 02-1/123-0

Содержание к диссертации

Введение

1 Задачи оптимального управления при наличии ограни чений общего вида 29

1.1 Задача Понтрягина 29

1.2 Задач а Блисса-Больца (Лагранжа, Майера) 30

1.3. Каноническая задача Дубовицкого-Милютина 31

1.3.1 Каноническая задача оптимального управления с гладкой зависимостью от времени 31

1.3.2 Локально-выпуклые функции конечномерного пространства z,y по у 32

1.3.3 Предположения, при выполнении которых проводится вариационное исследование Задачи А 33

1.3.4 v-стационарность 33

1.3.5 Структура смешанных ограничений 34

1.3.6 Интегральный принцип максимума в регулярном случае 35

1.3.7 Замыкание по мере 35

1.3.8 Интегральный принцип максимума в нерегулярном случае (принцип максимума По) 37

1.3.9 Каноническая задача с непрерывной зависимостью от времени при фиксированном tt 40

1.4Класс задач оптимального управления, сводящихся к каноническим Задачам А и В 40

1.50 возможном характере меры для смешанных ограничений 41

1.6 Фазовые ограничения 43

1.6.1 Фазовые ограничения типа равенств

1.6.2 Фазовые ограничения типа неравенств 44

1.7Теорема существования для задачи оптимального управления 45

2 Задача оптимального управления внешним долгом 47

2.1Постановка задачи 47

2.2Первое приближение 48

2. 3Принцип максимума без учета фазовых ограничений 49

2.43адача со свободным правым концом 50

2.5Решение основной системы в задаче со свободным правым концом 53

2.бНулевое приближение 55

2.7Продолжение решений по параметру t 56

2.8Краевая задача с концевыми условиями для фазовых переменных 58

2.9Метод введения параметра в дифференциальные уравнения 59

2.10 Замена переменных 60

3 Численные методы решения систем линейных уравнений 61

3.1.Введение 61

3.2 Метод введения параметра 64

З.З Вычитание близких величин 65

3.4 Метод регуляризации 65

З.б Принцип продолжения 66

З.б Метод продолжения для решения линейных систем 67

3.7 0 выборе числа итераций 70

3.8 Расширения метода продолжения 70

З.Э Процедура проверки метода 71

3.10 Результаты тестирования метода 3.11 Интегральный метод проверки вычислительного метода 76

3.12 Выводы по результатам вычислений 77

4 Методы продолжения решений по параметру 80

4.1 Постановка задачи 80

4.2 Наилучший параметр продолжения решения 82

4.3 Непрерывный аналог метода Ньютона 83

4.4 Жесткие системы обыкновенных дифференциальных уравнений 84

4.5 0бобщенный метод Ньютона 86

4.6 Полиномы Чебышева и Лагранжа 88

4.6.1 Метод ортогональных функций 90

4.6.2 Полиномы П.Л. Чебышева 91

4.7 Полярное разложение матрицы Якоби 92

4.8 0бобщенное продолжение решений по параметру 95

4.9 Метод численного интегрирования сингулярно возмущенных уравнений 97

5 Результаты численных расчетов (задача о внешнем долге) 100

5.1 3адача Понтрягина 100

5.2 Пример аналитического исследования необходимых условий в задаче с фазовыми ограничениями 105

6 Задачи оптимального управления со смешанными огра ничениями в процессах полимеризации 109

б.І Введение 109

6.2Каноническая задача Дубовицкого-Милютина 109

б.З Интегральный принцип максимума в нерегулярном случае (принцип максимума П0) 110

6.4 Математическая модель суспензионной полимеризации винилхлори да в периодическом реакторе 112

6.5 Задачи на быстродействие. Задача А2 113

6.6 Оптимальные траектории. 114

6.7 Приближенное решение краевой задачи 116

6.8 3адача о минимуме x2(t) 117

б.Э Класс регулярных задач со смешанными ограничениями 117

7 Задача оптимального управления при входе аппарата в атмосферу 119

7.1 Оптимизация дальности при входе аппарата в атмосферу (плоский

случай) 119

7.2 Принцип максимума (регулярный случай) 119

7.3 Продолжение решений по параметру 121

7.4 0граничение на перегрузку 123

7.5 Необходимые условия экстремума в нерегулярном случае 126

7.б Структура множества нерегулярных точек 127

7.7 Непрерывность \СУ\ в точке 128

7.8 Нерегулярная оптимальная траектория 128

7.9 Регуляризация вырожденного принципа максимума 129

7.10 Оптимальные боковые маневры аппарата в атмосфере 131

8 Приложения

Каноническая задача оптимального управления с гладкой зависимостью от времени

Поскольку в данной точке x0(t),t может быть много фазовых ситуаций, соответствующих различным u(t), то, образно говоря, одна задача со смешанными ограничениями состоит из континуума задач с фазовыми ограничениями. Естественно ожидать, что ответ будет не один. Таким-образом, в общем случае Задачи А v-стационарность траектории эквивалентна выполнению целого набора, вообще говоря, независимых между собой интегральных принципов максимума. Аналитически число фазовых ситуаций определяется линейной относительно а, (3 и нелинейной по ж, и, t системой (1.3.8). В [4] приведена формулировка принципа макисимума с помощью индекса траектории, т.е. иерархия ответов задается индексами. (Дубовицкий и Милютин) При условии О Є T(x0(t,),u0(t )1t ) хотя бы для одного f Є [to,ti] каждая допустимая траектория x0(t), u0(t) Задачи A v-стационарна, причем в точке : dfi = S(t — t )dr; 7(i ) = 0, 7(i) — любая при t ф t ; остальные компоненты принципа максимума равны нулю.

Применительно к классической задаче оптимального управления принцип максимума По переходит в принцип максимума Л.С. Понтрягина. Замыкание по мере связано с пространством «,, «( ) Loo, и с рассмотрением смешанных ограничений. Это самая простая операция в анализе (проще, чем рассмотрение обобщенных последовательностей). Например, для обобщенных последовательностей совсем не просто исследовать предельные точки для функции sin -, t Є [0,1].

Принцип максимума По — самый узкий из всех принципов максимума, который можно сформулировать для задач с нерегулярными смешанными ограничениями. Как следует из определения (1.3.8), общий запас фазовых точек не связан с исследуемой экстремалью. Однако если рассматривать управления, которые по фазовым скачкам подчинены оптимальной траектории (т.е. учесть специфику экстремали и дифференциальной связи), то приходим к принципу максимума По- При этом в сопряженной системе присутствуют только те скачки (1.3.20), которые связаны с оптимальной траекторией. Таким образом, М )Є і( о( М),

Форма записи сопряженной системы (1.3.21) связана со спецификой управления u(t) Є Loo и дает возможность изучения сопряженных функций и мер в каждой точке t разрыва меры /І на базе связи (1.3.22). При этом сопряженные функции и меры рассматриваются справа и слева от точки t и в самой точке t. Кроме того, такая форма в зависимости от свойств меры /х позволяет проводить расшифровку членов с мерой в зависимости от специфики задачи как для фазовых, так и для смешанных ограничений.

Поскольку в данной фазовой точке при фиксированных ж и t может быть много фазовых скачков при различных u(t), то ответ для нерегулярной задачи целесообразно записывать через выпуклые комбинации скачков.

Теорема 1.3.2 означает возможность описания одних скачков через другие. Это возможно в том случае, если фазовые скачки однотипны. В случае овыпукления одни выпуклые комбинации скачков описываются через другие выпуклые комбинации.

Приведем упрощенный вариант формулировки Теоремы 1.3.3. Первое требование состоит в совпадении uQ(t) = Vi(x0(t),t). Второе требование связано с необходимостью однотипности фазовых скачков справа и слева от нерегулярной точки. Таким образом, запрещается ситуация, когда, например, слева есть фазовая точка, а справа ее нет. Можно усилить первое требование, положив u0(t) = Vi(xo(t),t). Тогда в первом и во втором случае будет справедлив принцип максимума По Теорема 1.3.4 описывает ситуацию, когда градиенты, описывающие скачки справа и слева от нерегулярной точки, направлены в противоположные стороны. Тогда суммарный скачок в точке t дает нулевую комбинацию. По существу такой случай означает отказ от исследования в первом порядке, поскольку принцип максимума выполняется тривиально. 1.3.9 Каноническая задача с непрерывной зависимостью от времени при фиксированном t\

Предположения. Размерности вектор-функций (р, Ф — любые; функции J, (р, Ф — локально-выпуклые по х, г і, р; 1С, f, д — непрерывные относительно ж, г , і, р вместе со своими производными по х, г і, р в некоторой окрестности поверхности 7 = О, /С = 0, ранг д = dim у; для каждого открытого множества Q пространства щ, t семейство Q U U(t) обладает измеримой выборкой, определенной почти всюду на множестве тех t, для которых Q U U(t) ф 0. Ответ для Задачи В приведен в работе [4].

Замечание 1.3.2 Методы, развитые в работах А.Я. Дубовицкого и А.А. Милютина для решения канонической Задачи А, позволяют распространить теорию принципа максимума на задачи более общие, чем Задача В. Моэюно отказаться от условия непрерывности всех функций по и2, t и выбрать произвольное семейство U(t). Однако отказ от непрерывности по и2, t приводит к изменению понятия фазовой точки и фазового скачка, а также к изменению формы записи сопряженных уравнений, что в свою очередь не позволяет использовать понятия, введенные в Задаче А. С другой стороны, произвольность семейства U(t) приведет к обеднению принципа максимума — он станет распространенным лишь на измеримые управления u(t) такие, что u2(t) Є U(t). Таким образом, постановка Задачи В является достаточно общей.

Класс задач оптимального управления, сводящихся к каноническим Задачам А и В Рассмотрим конечномерное пространство Е = {p,a,(3,x,u,t}; а = (аі,а2) Р = (/?1,/?2,/?3), P = {x(to),x(ti),t0,tx) и рассмотрим классы Mi и М2 функций пространства Е. Функция pi, определенная на некотором открытом множестве пространства І5, принадлежит классу Mi,-если она локально-выпуклая по ж, «і, р, а, /3, t и монотонная по/3. Функция (р2, заданная на открытом множестве пространства Е и не зависящая от /?, принадлежит классу М2, если (р2 и ее частные производные по х, щ, р, a, t непрерывны по всем своим аргументам на этом множестве. Если частные производные по ж, til, р, а непрерывны, то функцию р2 отнесем к классу

Здесь /, 5, /С, 7/i, г/г — функции класса M2, определенные на G; G — область пространства Е; J,hi, h2, h$, Ф, р — функции класса Mi; на поверхности д = О, К = 0 ранг з = г, ранг /С = га; вектор-функции Г71, т/2, Лі, h2, hs имеют ту же размерность, что и «і, а2, /Зх, /32, /33; запись /?3 = vraimax Дз(Ж) Щ t) означает, что компоненты вектора /?з суть vraimax от компонент h3% вектора h3; U — произвольное множество пространства и2. Минимум функционала ищется среди всех ограниченных измеримых функций x(t), u(t), а, /3, t0, t\, удовлетворяющих условиям Задачи Ах.

Процесс введения параметров можно, в свою очередь, итерировать. Функции 771, 772 могут содержать конечное число параметров типа a; hi, h2, h$ могут зависеть от конечного числа параметров типа a, /3. Параметры типа /3 можно заменять локально-выпуклыми функциями от р, интегралами или vraimax от функций класса Mi, а параметры типа а можно заменять на непрерывно дифференцируемые функции от р или на интегралы от функций класса М2.

3Принцип максимума без учета фазовых ограничений

При решении задачи Понтрягина прямыми методами исходную постановку редуцируют к задаче нелинейного программирования большой размерности [18], [49]. Дискретизация задач с фазовыми и смешанными ограничениями позволяет получить оценку геометрии оптимальной траектории для решения задачи принципом максимума [4]. Здесь также возникают задачи большой размерности. Основным элементом при решении таких задач выступает система линейных алгебраических уравнений. Как правило, с ростом размерности системы ухудшается ее обусловленность.

Наряду с методами декомпозиции линейных систем большой интерес представляет разработка универсальных методов получения решений для задач большой размерности с плохо обусловленными матрицами. В общем случае рассматривается система линейных алгебраических уравнений АХ = В, ЛєКтХп, ХєШп, ВєШ. (3.1.1) Вообще говоря, система (3.1.1) несовместна. Умножив правую и левую ее части на транспонированную матрицу А , получаем нормальное уравнение первого типа А АХ = А В. (3.1.2) Система (3.1.2) всегда совместна. Заметим, что матрица А А симметрична и неотрицательно определена. Решение (3.1.2) единственно тогда и только тогда, когда ранг матрицы А равен п (это возможно при п т). В противном случае система (3.1.2) имеет бесконечно много решений. Метод регуляризации Тихонова [28] сводится к поиску квазирешения из уравнения (А А + 5E)XS = А В, 8 0, (3.1.3) где Е — единичная матрица, S — параметр регуляризации.

В тех случаях, когда матрица А А плохо обусловлена, может возникнуть необходимость в использовании двойной точности для получения системы (3.1.2) с целью сохранения значимой информации. Другая проблема использования метода нормальных уравнений связана с квадратичным ростом числа обусловленности исходной системы f.(A A) = (A). (3.1.4) Некоторые пути увеличения точности метода нормальных уравнений рассмотрены в работе [27].

Одним из эффективных инструментов решения плохо обусловленных и вырожденных систем является метод продолжения решений по параметру. Здесь используются градиентные схемы и различные их модификации [72].

Непосредственное решение системы (3.1.3) наталкивается на ряд принципиальных трудностей в задачах большой размерности. Более целесообразным считается приведение симметричной матрицы (3.1.3) к трехдиагональному виду методами ортогональных преобразований [33]. После такого преобразования система может быть решена методами введения параметра. Наиболее трудными для решения в случае больших размерностей являются система Годунова [36] и системы с матрицей Гильберта [37]. Методы введения параметра могут применяться для произвольных матриц. С этой целью исходную матрицу приводят к форме Хессенберга [33] с помощью ортогональных преобразований. Затем система уравнений решается методом обратной двухлараметрической прогонки. Если обратная прогонка неустойчива, то исходную матрицу приводят к верхней хессенберговой форме и применяют прямую прогонку. Таким образом, применение комбинированных алгоритмов расширяет границы применимости существующих методов линейной алгебры. Пусть задана точная система (1.1) и ее возмущенная система A1Y=B1. (3.1.5)

Точная система может быть как совместной, в частности с невырожденной матрицей, так и несовместной. По этой причине речь идет о нормальном псевдорешении системы (1.1) и о его возмущении при возмущении системы. В общем случае даже при малых возмущениях системы возможны большие возмущения в нормальном псевдорешении. Возникает вопрос о нахождении приближенного устойчивого нормального псевдорешения и получения оценки погрешности такого приближения при возмущении системы. Этот вопрос можно решить положительно, если в качестве приближения к нормальному псевдорешению брать определенную проекцию псевдорешения возмущенной системы на подпространства правых сингулярных векторов или брать решение при определенным образом выбранном параметре S (1.3). Такой подход обоснован в работе [22].

Детерминированным методам решения некорректно поставленных задач посвящены многие монографии и большое число статей. Строгое теоретическое обоснование этих методов изложено в монографиях Тихонова А.Н., Арсенина В.Я., Лаврентьева М.М., Иванова В.К., Бакушинского А.Б., Морозова В.А. и других. Применение этих методов при решении различных научно-технических задач рассмотрено в монографиях О.М. Алифанова, Н.Г. Преображенского, А.В. Мултановского и других работах. Подробные ссылки на указанные работы можно найти в [38].

Существуют два основных вариационных метода, которые позволяют эффективно решать некорректные задачи. Первый метод связан с понятием квазирешения. Он был разработан В.К. Ивановым и его сотрудниками [38]. Метод регуляризации Тихонова, изложенный в работе [28], получил очень широкое распространение при решении некорректно поставленных задач. Этот метод, как и метод квазирешений, относится к числу вариационных, т.е. построение приближенного решения связано с решением экстремальной задачи. Детерминизм методов проявляется в постановке задачи, в алгоритме построения или отбора устойчивых решений и обусловлен способом задания априорной информации, а также выбором метрик пространств правой части и решения операторного уравнения.

В статистических методах регуляризации построение устойчивых решений осуществляется на основе методов теории вероятностей и математической статистики.

Авторами работы [54] предложен термин "дескриптивная регуляризация". Она объединяет методы решения некорректно поставленных задач, в которых современные принципы регуляризации сочетаются с нетривиальной качественной информацией о решении (знакоположительность, монотонность, выпуклость, наличие экстремумов и т.д.). В дескриптивных методах регуляризации эффективно использовался метод сопряженных градиентов и его различные модификации (В.А. Морозов, А.Г. Ягола [28] и др.). В процессе аппробации указанных алгоритмов выяснилось, что они являются весьма эффективными для вырожденных линейных систем. Однако, они теряют свое преимущество при решении плохо обусловленных систем с матрицами типа Гильберта и Годунова.

Следует отметить, что методы сопряженных направлений применяются и в задачах оптимизации [72]. Однако область их применения ограничена выпуклостью соответствующих функционалов. Применение непрерывных аналогов градиентных схем расширяет их область применимости. Тем не менее здесь прослеживается связь методов оптимизации и методов решения жестких систем обыкновенных дифференциальных уравнений. Хорошего понимания таких методов можно добиться лишь с привлечением теории оптимального управления [4], ибо решение линейной алгебраической системы здесь подменяется решением эквивалентной экстремальной задачи.

В рамках теории оптимального управления [4] задача изучения возмущенной системы (1.5) сводится к общей задаче Дубовицкого-Милютина зависящей от параметров. Существуют простые способы сведения указанной задачи к канонической, которая уже не зависит от параметров. В этом случае вопрос влияния априорных ошибок данных, а также ошибок округления сводится к изучению схемы дискретизации канонической задачи оптимального управления.

Таким образом, существует очевидная связь между методами теории оптимального управления и методами решения линейных систем в рамках таких фундаментальных понятий как некорректные задачи, методы регуляризации, жесткие системы и плохо обусловленные системы. С одной стороны мы хотим получить классическое решение для плохо обусловленной системы, не имея даже точного определения этого понятия для произвольной линейной системы. С другой стороны расширение понятия решения приводит нас к рассмотрению множества классических решений, зависящих от параметров. Однако получение таких решений на базе нестационарных методов (методы продолжения решений по параметру) наталкивается на ряд принципиальных трудностей при интегрировании жестких систем обыкновенных дифференциальных уравнений. Заметим, что до сих пор в литературе нет общепринятого определения жесткости. Тем не менее существует ряд явных и неявных методов, позволяющих численно решать жесткие системы определенных классов.

Принцип продолжения

Основной заслугой Лаэя является построение шагового процесса по параметру, в котором реализуется главный для метода продолжения принцип: использовать на каждом шаге информацию о решении, полученную на предыдущих шагах. По этой причине снимается вопрос о выборе хорошего начального приближения при итерационном уточнении решения методом Ньютона-Рафсона. Возможна также реализация пошаговых процессов по параметру с использованием других итерационных методов. Например, можно матрицу J 1(xi(m— l), fc) заменить на матрицу J-1(a:,(0), #). Это будет соответствовать переходу к модифицированному методу Ньютона.

Шаговые процессы по параметру с последующим итерационным уточнением решения на каждом шаге в [14] названы дискретным продолжением решения.

Наилучший параметр продолжения решения В ряде случаев выбор параметра q может оказаться неудачным. Продолжение может не существовать, либо появляются особые точки, в которых J(x) = 0 (4.1.3). Возникает вопрос о методе выбора параметра продолжения. Ответ на него сформулирован в работе [14].

С точки зрения продолжения решений нет принципиальной разницы между компонентами вектора х Є Еп и параметром задачи q. Учитывая это обстоятельство, уравнение (4.1.2) можно записать в форме

В этом случае параметр продолжения выбирается из условий наилучшей обусловленности системы (4.2.5).

Основной результат формулируется в виде теоремы. Теорема 4.2.1 Для того, чтобы система линеаризованных уравнений (4-2.5) была наилучшим образом обусловленной, необходимо и достаточно в качестве параметра продолжения решения системы (4-2.1) принять длину дуги кривой множества решений этой системы.

Другую формулировку метода продолжения по параметру указал Д.Ф. Давиденко [67, 68]. Продифференцируем систему (4.1.2) как сложную функцию по параметру q

Для этой системы уравнения (4.1.2) являются полным интегралом, удовлетворяющим условию f(x0, qo) = 0. Система уравнений (4.3.1) линейна относительно произ дх водных —. При условии ненулевого детерминанта Якобиана J приходим к системе

Указанный подход позволяет использовать для построения решения х = x(q) задачи Коши (4.3.2), (4.3.3) различные численные методы интегрирования обыкновенных дифференциальных уравнений (ОДУ). Продолжение решений при помощи интегрирования задачи Коши обычно называют непрерывным аналогом Ньютона.

Ответить на вопрос о том, какой из двух подходов — непрерывное или дискретное продолжение — лучше, довольно сложно. По-видимому, ответ зависит от специфики задачи. Это отмечено в работе [69], где предлагалось комбинировать оба подхода. Однако в основе обоих подходов, лежит использование матрицы Якоби. По этой причине эффективность вычислительных процессов будет определяться обусловленностью этой матрицы.

Отметим теперь одну интересную возможность использования метода продолжения решения, установленную М.К. Гавуриным [61]. Для решения нелинейного уравнения Н(х) = 0 построим уравнение с параметром следующим образом

Жесткие системы обыкновенных дифференциальных уравнений Опыт численного решения задач Коши для ОДУ показывает, что среди них следует выделять так называемые жесткие уравнения, которые требуют специальных численных методов. Несмотря на большое число публикаций по данной проблеме, до сих пор не существует общепринятой концепции жестких систем. Более того, нет даже общепринятого определения жесткости [61, 14, 70, 71, 72].

С содержательной точки зрения под жесткими системами понимают разнотемпо-вые процессы. Отметим, что жесткость задачи — это свойство математической модели, и она не связана с используемым математическим методом. Жесткость задачи является математическим отражением того факта, что в соответствующем физическом объекте протекают процессы с существенно различными скоростями.

В данной работе жесткость связана с численным решением краевой задачи при плохо обусловленной матрице Якоби. Заметим, что при итеративном поиске нулей трансцендентных функций возможно вырождение матрицы Якоби.

Необходимость выделения жестких уравнений в отдельный класс вызвана трудностями их численного интегрирования классическими явными методами. Например, в жестких системах существует два участка: маленький участок, где процесс быстро затухает, причем этот участок называют пограничным слоем; большой участок, где решение меняется медленно. Оказывается, что малый шаг интегрирования, используемый для воспроизведения быстролротекающих процессов в пограничном слое, не может быть увеличен вне пограничного слоя, хотя производные становятся существенно меньше. Даже незначительное превышение некоторой величины шага, определяемой данным методом и решаемым уравнением, приводит к резкому возрастанию погрешности. Необходимость интегрировать систему с мелким шагом снижает эффективность классических методов и приводит к росту ошибок округления, а в целом — суммарной ошибки интегрирования.

Для устранения указанного ограничения были предложены различные численные методы, (см., например, [72, 73, 74, 75, 76]), допускающие значительное увеличение шага интегрирования вне пограничного слоя. Однако и в настоящее время проблема численного решения жестких уравнений является актуальной [77, 78, 79, 80].

При использовании численных методов дифференциальное уравнение обычно преобразуется в разностное. Разностное уравнение асимптотически устойчиво, если все корни его характеристического уравнения по модулю меньше единицы, и устойчиво, если есть некратные корни, по модулю равные единице, а остальные меньше единицы. Во всех остальных случаях уравнение неустойчиво. Отсюда можно заключить, что методы следует использовать при таком шаге интегрирования h в зависимости от А, когда наблюдается соответствие по всем видам устойчивости тестового дифференциального и соответствующего разностного уравнения.

Множество значений h\, удовлетворяющих условию асимптотической устойчивости решения разностного уравнения при интегрировании (4.4.3) называется областью устойчивости метода (абсолютной устойчивости) в комплексной плоскости h А [14]. Анализ области устойчивости явных традиционных методов Рунге-Кутта и Адам-са показывает, что они не годятся для решения жестких систем, так как использование малых значений h требует больших затрат на вычисления и приводит к накоплению ошибок округления [14]. Поэтому подавляющее число алгоритмов, успешно решающих жесткие системы, относится к категории неявных. Однако их практическое применение наталкивается на трудности, связанные с решением нелинейной алгебраической системы с плохо обусловленной матрицей Якоби.

Указанные трудности можно преодолеть за счет методов регуляризации [29, 84], либо за счет конструирования специальных схем. Так, в [79] показано, как можно решать жесткие системы при помощи явного метода Эйлера. Упомянутый подход основан на достижениях в теории численной устойчивости разностных схем и итерационных процессов чебышевского типа.

В работе [76] на основе методов введения управляющих параметров предлагаются экономичные явные схемы численного решения ОДУ с жесткой структурой. Указанные методы используются в качестве первого приближения при применении неявных схем. Приводится также постановка задачи оптимального управления с различными модулями локальных ошибок. Идею метода проиллюстрируем

Пример аналитического исследования необходимых условий в задаче с фазовыми ограничениями

Особую роль играет геометрия оптимальной траектории. В регулярном случае под геометрией оптимальной траектории для смешанных ограничений типа неравенств понимается определение множества активных индексов j(ж, и, і) в каждый момент t [to, t\]. Сюда входит: определение типа контакта смешанного ограничения и его формы с оптимальной траекторией (контакт может быть точечным или протяженным, а точечный контакт может быть касательным или в виде конуса); определение момента входа на ограничение; определение момента схода.

В нерегулярном случае кроме множества активных индексов необходимо определить множество нерегулярных точек с учетом структуры задачи и расшифровать принцип максимума в нерегулярной точке. Совокупность указанных условий определяет геометрию оптимальной траектории в нерегулярном случае.

Математическая модель суспензионной полимеризации винилхлорида в периодическом реакторе Описанная ниже модель полимеризации состоит из трех стадий. Для первой стадии (ж3 ж3і), где ж31 — 0.03 -г 0.05, выпишем сначала уравнение для мольной доли радикалов [101] Пусть на оптимальной траектории x0(t), u0(t), t выполнено ограничение типа равенства Фі(ж, и) = О в некоторых точках t Є [0, t{\. Тогда из условий Н и = 0 (6.6.2), ірі 0, р2 0 (6.4.4) получаем В этом случае траектория является регулярной, а оптимальное управление Uo{t) выбирается из условия связи Ф(ж,«) = 0: Заметим, что в регулярном случае производные (6.5.2) терпят разрыв первого рода при входе на ограничение Фі(х,и) = 0, а сами сопряженные функции являются непрерывными на всей оптимальной траектории.

Доказательство. Действительно, в силу структуры уравнений (6.4.1)-(6.4.2) и Леммы 6.6.2 Ф(» + 0) 0. Таким образом, условия (6.6.7) и (6.6.8) выполняются автоматически.

При движении по ограничению Фх(ж,и) = 0 оптимальное управление u0(t) является убывающей функцией. Тогда в какой-то момент времени t = , u0(t ) = щ. Этим моментом и определяется сход с ограничения Фі(ж,«) = 0.

Из вышеприведенных рассуждений получаем геометрию регулярной и нерегулярной траектории. Время схода определяется нерегулярной точкой , причем на всей оптимальной траектории сопряженные переменные являются непрерывными функциями.

Решение краевой Задачи A2i существенно упрощается, если мы рассмотрим в качестве первого приближения Задачу А4. Для данной задачи сравнительно просто определяется структура оптимального управления.

Доказательство. Из уравнений (6.4.2), (6.4.7) следует uo(t) = щ при Фз(ж, и) О (6.4.10). При движении по ограничению их\ — а2 = 0 получаем причем оптимальная траектория содержит целый отрезок [ ,i] с нерегулярным смешанным ограничением; — точка входа на ограничение ж2 = 0 (6.4.10). Таким образом, оптимальная траектория содержит два куска. На первом куске при t Є [іо ), x2(t) 0. На втором имеем і2() = 0, t Є [ , і].

Покажем, что построенная таким образом траектория удовлетворяет принципу максимума П0. Действительно, справа от нерегулярной точки смешанное ограничение Ф3(х,и) = 0 удовлетворяется автоматически, поскольку ж2 = 0 и ж2 является постоянной величиной. Следовательно, никаких дополнительных условий в нерегулярных точках не возникает. Тогда в уравнениях (6.6.3) можно положить /x(t), t [t , i] = 0. Краевые условия для сопряженных переменных (6.6.4) по-прежнему можно выполнить за счет начальных значений (6.6.6). Таким образом, для траектории с управлением uQ(t) = щ выполнены необходимые условия оптимальности в форме принципа максимума Щ. Следует отметить, что эти условия являются и достаточными в силу линейности управления и строгой монотонности функционала [10, с.136-138].

Краевая задача (6.6.3), (6.6.4), (6.6.6) легко решается методом продолжения решений по параметру [4]. В качестве параметра продолжения выбираем время t. Для этой цели разбиваем отрезок [io i] на ряд частей точками ioi ii i2» in, oi = о tin = t\. В результате получаем систему вложенных отрезков [оі п] Є [ оі, іг] Є ...Є [ оь іп]- Сначала на отрезке [ оі п] рассматриваем краевую задачу (6.6.3) с граничными условиями

В математической модели полимеризации кроме смешанных ограничений система (6.4.1)-(6.4.2) содержит фазовые ограничения. В рамках данной работы не представляется возможным рассмотрение методов решения подобного рода задач. Однако используя задачи со смешанными ограничениями, мы можем оценить верхние и нижние решения соответствующих фазовых переменных.

Для Задачи А4 положим з( ) = 0. В результате стационарность оптимальной траектории в указанной задаче будет определяться не функционалом хз(і), а ограничением (6.4.10). В этом случае u0(t) = и2 на всей оптимальной траектории. Полученное решение определяет минимальное значение x2(t) на всей траектории. При uo(t) = Ui определяется максимальное значение x2{t). В данной ситуации краевая задача определяется двумя начальными параметрами (6.6.6).

Аналогичным образом определяются нижнее и верхнее решения для Задачи А 41- При Фі(х,и) 0 имеем u0(t) = и2. Для верхнего решения u0(t) = «і, Фі(ж,м) 0.

В данной работе исследовалась не только задача полимеризации, но и сам принцип максимума. Недостатком многих работ по оптимальному управлению являлось получение необходимых условий, а не их исследование. Задачи с регулярными смешанными ограничениями — весьма важный и широкий класс задач, который до сих пор полностью не указан. Единственное условие экстремума для данного класса и есть приведенный принцип максимума (6.3.1)—(6-3.8). В классе нерегулярных смешанных ограничений фазовые ограничения являются частным случаем смешанных. Однако в регулярной ситуации чисто фазовые ограничения уже не включаются в смешанные ограничения. В работах [102, 6] рассмотрен регулярный принцип максимума для линейных задач со смешанными ограничениями.

Основные направления при исследовании нерегулярного принципа максимума связаны с анализом условий (6.2.2) в фазовой точке и с требованием интегрируемости множителей Лагранжа (6.3.5). Если система (6.2.2) имеет неединственное решение относительно множителей Лагранжа и управления при фиксированных x(t) на множестве полной меры, то необходимы дальнейшие исследования по принципу максимума. Такой анализ называется расшифровкой. Решение уравнения (6.2.2) совместно с (6.3.5) приводит к дополнительным условиям в нерегулярной точке, которые можно выполнить за счет скачка сопряженной переменной. Мера ц характеризует величину скачка.

Похожие диссертации на Методы продолжения решений в прикладных задачах оптимального управления