Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Булдаев Александр Сергеевич

Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления
<
Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Булдаев Александр Сергеевич. Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления : диссертация ... доктора физико-математических наук : 01.01.09.- Улан-Удэ, 2005.- 260 с.: ил. РГБ ОД, 71 06-1/37

Содержание к диссертации

Введение

Глава 1. Методы нелокального улучшения управлений в полиномиальных по состоянию системах 25

1.1. Полиномиальная по состоянию задача оптимального управления 25

1.2. Формулы приращения функционала 28

1.3. Методы нелокального улучшения управлений на основе векторных сопряженных переменных 32

1.4. Модифицированные методы нелокального улучшения управлений 37

1.5. Квадратичная по состоянию задача оптимального управления 43

1.6. Методы нелокального улучшения управлений на основе матричных сопряженных переменных 50

1.7. Проекционные методы нелокального улучшения управлений 53

1.8. Квадратичная по состоянию задача оптимального управления с запаздыванием 59

1.9. Примеры 68

Глава 2. Методы возмущений в полиномиальных по состоянию задачах оптимального управления 72

2.1. Метод возмущений для краевой задачи улучшения 72

2.2. Метод преобразования возмущенных краевых задач улучшения 82

2.3. Полиномиальная по состоянию задача оптимального управления с запаздыванием 88

2.4. Метод возмущений для условия улучшения в пространстве управлений 91

2.5. Метод проекционных возмущений для условия улучшения 103

Глава 3. Методы возмущений в основной задаче оптимального управления 107

3.1. Основная задача оптимального управления 107

3.2. Метод возмущений принципа максимума 109

3.3. Метод проекционных возмущений для условия оптимальности 117

3.4. Численное решение тестового примера 122

Глава 4. Методы нелокального улучшения управляющих параметров полиномиальных по состоянию систем 126

4.1. Полиномиальная по состоянию задача оптимизации управляющих параметров 126

4.2. Методы нелокального улучшения управляющих параметров 129

4.3. Модифицированные методы нелокального улучшения 132

4.4. Схема поиска неподвижных точек в методах нелокального улучшения 137

4.5. Проекционные методы нелокального улучшения 141

4.6. Квадратичная по состоянию задача оптимального дискретного управления 144

4.7. Примеры 148

Глава 5. Методы возмущений в задачах оптимизации управляющих параметров 153

5.1. Метод возмущений для задачи о неподвижной точке 153

5.2. Метод проекционных возмущений для задачи о неподвижной точке 162

5.3. Метод нелокальных возмущений для оценивания коэффициентов квадратичных по состоянию систем 164

5.4. Основная задача оптимизации управляющих параметров... 172

5.5. Метод возмущений дифференциального принципа максимума 174

5.6. Метод проекционных возмущений для условия оптимальности 177

Глава 6. Математические модели и задачи оптимального управления иммунным процессом 181

6.1. Базовые модели иммунного процесса 181

6.2. Постановка класса задач управления иммунным процессом 184

6.3. Нестандартные задачи управления иммунным процессом.. 188

6.4. Примеры 192

Глава 7. Методы возмущений в задачах оптимального управления иммунным процессом 195

7.1. Задача управления с терминальными ограничениями 195

7.2. Задача достижения заданного множества состояний системы 201

7.3. Задача достижения и удержания системы в заданном множестве состояний 205

7.4. Задача управления колебаниями системы 208

7.5. Численное решение задачи введения иммуноглобулинов при заболевании 211

7.6. Численное решение задачи стимулирования отека при вирусном гепатите 219

Заключение 232

Список литературы 236

Введение к работе

Актуальность разработки новых методов оптимального управления обуславливается непрерывно возникающими прикладными задачами в различных областях науки, техники и экономики, для эффективного решения которых существующих методов оказывалось недостаточно. Исторически развитие методов связано с теорией необходимых и достаточных условий оптимальности в задачах управления, а также с получением различных конструкций и аппроксимаций целевых функционалов.

К настоящему времени определились разнообразные подходы к численному решению задач оптимального управления в системах обыкновенных дифференциальных уравнений. По структуре соответствующие методы являются итерационными, причем на каждой итерации рассматривается вспомогательная задача, решение которой в определенном смысле лучше, чем на предыдущей итерации. Объектом для разработки численных методов традиционно выбирается задача оптимального управления со свободным правым концом, которая по ряду причин называется основной [80,81,225].

В первую очередь можно выделить методы улучшения в пространстве управлений, характеризующиеся операцией слабого или игольчатого варьирования управления.

Представителями соответствующего класса методов являются градиентные процедуры [39, 80, 90, 120, 131, 145, 181, 190, 192, 201, 202, 209, 251, 265, 268, 272, 274, 282 - 284, 286, 290, 295, 297, 300]. Обстоятельный численный анализ методов градиентного типа в процессе решения прикладных задач проведен Федоренко Р.П. [251]. Вопросы обоснования градиентных методов в задачах оптимального управления (сходимость, регуляризация) рассмотрены в монографии Васильева Ф.П. [90].

К этому же классу относятся методы принципа максимума, начало развития которых заложил метод последовательных приближений Крылова И.А., Черноусыю Ф.Л. [152, 153]. Дальнейшие исследования в этом направлении позволили обеспечить свойство релаксации по функционалу и сходимость по невязке принципа максимума (Милютин А.А., Илютович А.Е., Дикусар В.В. [122, 184], Лгобушин А.А., Черноусько Ф.Л. [163-165, 264], Кирин Н.Е. [146, 147], Васильев О.В., Аргучинцев А.В., Тятюшкин А.И., Терлецкий В.А., Бельтюков Н.Б. [6 - 8, 28, 80 - 87, 124, 181, 308], Mayne D.Q., Polak Е. [294], Тео K.L., Yeo L.T. [305] и др.). Определенный итог этому направлению исследований подведен в работах Срочко В.А. [224, 225], в которых обоснован оптимальный способ игольчатого варьирования управлений в методах, основанных на принципе максимума.

Градиентные процедуры и методы принципа максимума связаны с необходимыми условиями оптимальности. Достаточные условия оптимальности в форме Кротова В.Ф. [149, 150] послужили источником для построения группы методов принципа расширения (Гурман В.И., Москаленко А.И., Батурин В.А., Урбанович Д.Е., Фельдман И.Н. [21,117, 118, 150, 151, 194, 200] и др.).

Нестандартные необходимые и достаточные условия в невыпуклых задачах специальной структуры являются конструктивной основой для построения методов глобальной оптимизации в работах Стрекаловского А.С.[237 - 239, 301-303].

Следующее направление основано на применении методов нелинейного программирования к конечномерным аналогам задач оптимального управления, полученным с помощью частичной или полной дискретизации задачи по управлению и состоянию. Подход на основе полной дискретизации [127, 129, 209, 213] обстоятельно реализован в монографии Евтушенко Ю.Г. [127].

Предлагаемый в [250, 251] метод линеаризации также использует процедуру дискретизации на уровне линейной модели, что приводит к задаче линейного программирования на каждом шаге итерационного процесса.

Методы, построенные в [110-112], используют частичную дискретизацию задачи по управлению с подсчетом производных функционала по точкам дискретизации.

Методы вариации в фазовом пространстве [154, 189, 191, 192, 264] основаны на сочетании операции дискретизации фазового пространства и методов улучшения в пространстве управлений.

Среди отдельных направлений следует выделить группу неклассических методов поиска программных и позиционных оптимальных управлений для линейных и других классов систем, развиваемых в работах Габасова Р., Кирилловой Ф.М.[99 -105]. Направление, связанное с построением методов для решения задач с импульсными управлениями и разрывными траекториями инициируется задачами моделирования процессов, состояние которых может меняться скачкообразно (Гурман В.И.[117, 118], Дыхта В.А., Самсонюк ОЛ-Ц4, 125, 126], Завалищин СТ., Сесекин А.Щ130], Миллер Б.М[183] и др.).

Научная школа Зубова В.И. [132, 133] известна фундаментальными и прикладными исследованиями в области теории дифференциальных уравнений, теории устойчивости, теории управления, теории колебаний, моделирования и оптимизации динамики пучков заряженных частиц (Демьянов В.Ф., Рубинов A.M. [120], Кирин Н.Е [146,147], Овсянников Д.А. [201, 202], Петров Ю.П. [204] и др.).

Алгоритмическое и программное обеспечение методов оптимального управления вместе с численным решением тестовых и модельных задач рассмотрены в работах Федоренко Р.П. [251], Евтушенко Ю.Г. [127], Грачева Н.И. [П5],ТятюшкинаА.И. [246 - 248], Горнова А.Ю. [113] и др.[26, 27, 182].

Другое направление развития методов оптимального управления связано с варьированием управляемого процесса в пространстве переменных состояния и управления.

К данному классу молено отнести методы решения краевой задачи принципа максимума, которая трактуется как задача решения нелинейных уравнений относительно краевых условий [32, 90, 91, 192, 251]. Альтернативный подход к решению краевой задачи принципа максимума основывается на переносе граничных условий [1, 192, 251].

Последние годы в работах Срочко В.А. и его учеников [5, 225 - 236] активно развиваются методы, использующие нестандартные фазовые аппроксимации функционала управления вместе с техникой одновременного варьирования переменных состояния и управления в пространстве управляемых процессов. Более высокое качество аппроксимаций функционала по сравнению со стандартными обуславливает повышенную эффективность разрабатываемых методов. В частности в линейных по состоянию, билинейных и квадратичных задачах оптимального управления эти методы обладают свойством нелокальиости улучшения, что является существенным фактором в плане снижения вычислительных затрат на каждое улучшение. В данной диссертационной работе проводится дальнейшее развитие указанного направления по пути построения методов нелокального улучшения в полиномиальном по состоянию классе задач оптимального управления. Предпринимавшиеся ранее попытки построения методов нелокального улучшения в квадратичных по состоянию задачах на основе решения задач Коши аналогично линейному случаю в общем случае не увенчались успехом. В диссертации впервые разработаны методы, в которых нелокальность улучшения обеспечивается в квадратичной задаче и достигается ценой решения специальной краевой задачи для системы обыкновенных дифференциальных уравнений. Полученная краевая задача улучшения значительно проще классической краевой задачи принципа максимума и сводится к двум задачам Коши в линейном случае. Предложенный подход к нелокальному улучшению на основе решения краевой задачи был обобщен на полиномиальный по состоянию класс задач оптимального управления, в том числе с запаздыванием.

Структура предложенной краевой задачи нелокального улучшения допускает очевидное выделение линейной по состоянию части, которая решается с помощью двух задач Коши и совпадает с краевой задачей в линейном случае. Это свойство позволило применить и обосновать в диссертационной работе известный метод возмущений для ее эффективного решения. Предлагаемый подход обеспечивает свойство нелокальности улучшения, не содержит операцию параметрического поиска последовательных приближений на каждой итерации и в целом формирует новые методы возмущений для нелокального улучшения в задачах оптимального управления.

Основы теории возмущений для решения задач математической физики были сформулированы в трудах Пуанкаре А. и Ляпунова A.M. Дальнейшее развитие математическая теория возмущений получила в работах Фридрихса К. [257], Като Т. [143], Боголюбова Н.Н. и Митропольского Ю.А. [31], Васильевой А.Б. и БутузоваВ.Ф. [92], Вишика М.И. и Люстерника Л.А. [96], ЛионсаЖ.-Л. [158, 159], Ломова С.А. [160], Моисеева Н.Н. [187, 188], Маслова В.П. [179], Треногина В.А. [243 - 245], Беллмана Р. [22], Найфе А. [195], Van Dyke M.D. [307], Murdock J.A. [296] и многих других. Целью исследования в этих работах, как правило, являлась возможность разложения решения по малому параметру и обоснование сходимости полученного ряда к точному решению задачи.

Новые подходы в теории возмущений связаны с построением сопряженных операторов в нелинейных задачах, где требуется найти не само решение, а некоторый функционал от него, оценить вариации функционала в зависимости от вариаций входных параметров. Эти методы плодотворно развиваются Марчуком Г.И. и его научной школой в различных областях математики и ее приложениях к проблемам диффузии, моделям охраны окружающей среды, теории климата и его изменений и др. [2, 12, 33, 34, 135, 169 - 171, 173 - 175]. В работах Марчука Г.И, Агошкова В.И., Шутяева В.П. [174, 175, 269] соответствующие методы возмущений разработаны в нелинейных задачах усвоения данных, представляемых как задачи оптимального управления начально-краевыми условиями в системах дифференциальных операторных уравнений.

Применительно к задачам оптимального управления в системах обыкновенных дифференциальных уравнений методы возмущений рассматривались для анализа асимптотики решений задач в работах Васильевой А.Б. и Дмитриева М.Г. [93, 123], Ильина A.M. и Данилина А.Р. [119, 137, 138] и других исследователей [9, 10, 23, 139, 148, 155, 223, 253, 291, 296]. Для численного решения задач оптимального управления разрабатывались модификации метода последовательных приближений Черноусыга Ф.Л. с помощью малого параметра [263].

В задачах математического программирования методы возмущений с целью анализа свойств решений при малых возмущениях систематически изложены в монографии Левитина Е.С. [157]. Вопросы зависимости оптимального решения от малого возмущения задачи исследовались в разных направлениях: теория устойчивости [18, 91, 141, 241, 242,], асимптотические методы в оптимизации [156, 187, 188], параметрическое программирование [18, 109, 203, 212, 252, 285, 287] и Др. 

В теории и практике оптимизации можно выделить различные методы продолжения по параметру [14, 15, 136, 266], которые применяются на этапе перехода от решения возмущенной по параметру задачи к решению исходной задачи. Возмущению (параметризации) подвергают либо исходную оптимизационную задачу, либо условия оптимальности. В частности, для решения краевых задач принципа максимума в качестве параметров продолжения могут использоваться время и граничные условия [121, 193, 298, 299].

В диссертации впервые построены методы возмущений для нелокального улучшения управления в классе полиномиальных задач оптимального управления. Предложенный принцип возмущений краевых задач улучшения и эквивалентных условий улучшения в пространстве управлений далее распространяется на краевую задачу принципа максимума и необходимые условия оптимальности в общей нелинейной задаче оптимального управления. На этой основе в диссертационной работе впервые разработаны методы возмущений для поиска экстремальных управлений (удовлетворяющих необходимым условиям оптимальности).

Суть предлагаемых методов возмущений состоит во введении параметра возмущения в исследуемую задачу так, чтобы при некотором значении параметра задача, называемая иевозмущеиной, имела простое или очевидное решение. Как правило, невозмущенная задача соответствует нулевому значению параметра возмущения. Для решения возмущенных задач при фиксированном ненулевом значении параметра возмущения строятся итерационные алгоритмы их решения, где на каждой итерации решается задача, аналогичная по сложности невозмущенной задаче. При этом в качестве начального приближения итерационного процесса используется решение возмущенной задачи, полученное при меньшем значении параметра возмущения.

Построенные методы возмущений не гарантируют релаксацию по целевому функционалу на каждой итерации, но компенсируют это свойство отсутствием операции параметрического поиска улучшающего управления, получением реализуемых на практике решений, простотой реализации и настройки метода на конкретную задачу. Эти свойства являются существенными факторами повышения эффективности решения нелинейных задач оптимального управления.

Методы теории управления находят широкое применение при анализе технических, биологических, медицинских, экономических и других систем. Каждая из этих областей применения имеет свои специфические особенности. Например, многие технические системы имеют относительно небольшое число переменных и параметров, а связи между ними почти всегда можно определить в ходе экспериментального исследования системы, или в ходе ее конструирования и разработки. В биологических и медицинских задачах число существенных переменных, как правило, очень велико, а связи между ними, характер влияния одной переменной на другую часто неясны. Аппарат теории управления возник, развивался и непрерывно совершенствовался параллельно с развитием технических систем. Вместе с тем новые области применения задач управления постоянно стимулировали интенсивное развитие идей и методов этой теории, разработку специфических приемов анализа новых систем.

Полиномиальными по состоянию системами обыкновенных дифференциальных уравнений традиционно описывают модели эколого-экономических [185, 186, 196], биологических [166, 199, 205 - 208, 219, 221], химических [271] процессов, в том числе с запаздываниями - модели иммунологических процессов [167, 168, 293], модели динамики ядерных реакторов [114]. Следует отметить, что в целом вопросы об адекватности введения управлений и выборе критериев оптимизации при постановке задач оптимального управления медико-биологическими и экологическими процессами еще нуждаются в дальнейших исследованиях. Состояние дел здесь таково, что аппарат методов оптимального управления на настоящем этапе выступает как средство исследования моделей, показа их непротиворечивости и адекватности реальным процессам, проверки гипотез, решения проблем управляемости, т. е. перевода процесса из одного состояния в другое. В связи с этим представляется актуальным разработка специализированного алгоритмического и программного обеспечения для эффективного решения класса задач оптимального управления, обладающего характерными особенностями. Данное обеспечение может являться инструментом автоматизации исследований и основой мобильных экспертных автоматизированных систем принятия решений с интеллектуальной поддержкой, не требующих трудоемкой экспериментальной настройки оптимизационных методов на конкретную задачу. В настоящее время автоматизация интеллектуального обеспечения методов решения задач оптимального управления является новым научным направлением развития теории управления [26, 27, 88, 89, 248]. С 1975 года и по настоящее время под руководством Г.И. Марчука активно развиваются работы по анализу и применению математических моделей инфекционных заболеваний в иммунологии и медицине [13, 24, 25, 35, 140, 167, 168, 176 - 178, 180, 197, 205 - 208, 214 - 218, 275, 276, 293]. Построение моделей стимулировало развитие эффективных методов численного анализа жестких систем дифференциальных уравнений с запаздываниями [24, 36 - 38, 168, 275], методов согласования моделей и реальных данных [97, 134, 135, 168, 214 - 216, 306], анализа чувствительности решений и функционалов от решений к вариациям параметров [12, 33, 34, 97, 168]. В рамках моделей было смоделировано и проанализировано влияние температуры [13], биостимуляции [25], отека [176] и других воздействий на иммунный процесс. Математический анализ хронических бессимптомных форм инфекционных заболеваний позволил обосновать адекватные критерии оптимальности противоинфекционной защиты организма в норме [207, 217-218].

Результаты выполненных исследований показали пригодность используемых модельных принципов для адекватного описания динамики иммунного ответа при инфекционных заболеваниях. Эти результаты являются основой для перехода к следующему этапу моделирования - построению моделей конкретных заболеваний с целью их практического применения для решения задач прогноза и оптимального управления иммунным процессом в ходе заболевания. Накопленный опыт построения количественных моделей позволил обоснованно подойти к исследованию модельных задач оптимального лечения неблагоприятных форм заболеваний на основе модуляции иммунной реакции с помощью физиологических и лекарственных препаратов [40 - 45, 49, 50, 54, 56].

Характерными особенностями рассматриваемого класса задач управления иммунным процессом являются:

- полиномиалы-юсть (2-5 порядка) управляемой системы и функционалов по вектору состояния;

- простая структура функциональной зависимости управляемой системы и функционалов по вектору управления и управляющим параметрам (как правило, линейность по управлению); - относительно большая размерность управляемой системы по вектору состояния (4-15 переменных) и малая размерность по вектору управления (как правило, скалярные функции времени);

- простая структура множества значений управления и управляющих параметров системы (как правило, параллелепипедные ограничения);

- жесткость управляемой системы, обусловленная различием на несколько (2 - 3) порядков характерных времен изменения переменных состояния;

- наличие постоянных запаздываний (от 1 до 5) в управляемой системе по вектору состояния;

- нефиксированный момент окончания процесса управления, наличие функциональных ограничений (как правило, от 1 до 2).

Для задач оптимального управления иммунным процессом характерна значительная количественная трудоемкость численного решения итерационными методами локального улучшения, где на каждой итерации производится параметрический поиск улучшающего управления и возможная настройка вычислительных параметров метода для учета функциональных ограничений задачи. При этом операция параметрического варьирования управления может приводить к труднореализуемым на практике расчетным управлениям, а локальность улучшения - к неудовлетворительным результатам по критерию качества и ограничениям. Специфика рассматриваемых задач управления иммунным процессом обуславливает возможные подходы к их решению.

Методы конечно-разностной аппроксимации с редукцией к специальной задаче математического программирования ввиду большой размерности вектора состояния требуют значительных вычислительных ресурсов и затрат. Методы стрельбы и методы линеаризации для решения краевой задачи принципа максимума в пространстве состояний приводят к вычислительной неустойчивости расчета, обусловленной жесткостью системы, наличием положительных вещественных частей собственных чисел матрицы Якоби системы, ВОЗМОЇКНОИ разрывностью правых частей системы по вектору состояния.

В работах [40 - 53, 55, 57] для решения поставленных задач оптимального управления иммунным процессом применялся и модифицировался известный аппарат численных методов и теории оптимального управления [3, И, 16, 17, 29, ЗО, 91, 94, 95, 106 - 108, 116, 128, 131, 141, 142, 144, 162, 181, 198, 210, 220, 222, 226, 236, 240, 255, 256, 258 - 262, 267, 270, 273, 289].

В задачах рассматриваемого класса, где правые части системы линейны по управлению, оптимальное неособое управление будет принимать граничные значения из множества допустимых. В этом случае методы принципа максимума, основанные на игольчатых вариациях управления [181, 226, 236], дают возможность приближения к оптимальному управлению в классе граничных управлений, что представляется удобным. При этом простая структура множества значений управления U и малая размерность вектора управления позволяют эффективно организовать решение вспомогательных задач оптимизации на каждой итерации методов, учитывающих прямые и терминальные ограничения на управление. Именно такой подход был выбран за основу в работах [40 - 53, 55, 57] при решении задач оптимального управления. Рассматривались различные модификации методов принципа максимума, разработанные и адаптированные для систем с запаздыванием.

Достоинством предлагаемых в указанных работах методов являлась вычислительная устойчивость расчета, обусловленная поочередным численным интегрированием фазовой («слева - направо») и сопряженной («справа - налево») жестких задач Коши на каждой итерации методов. Наиболее трудоемкой частью указанных методов являлся параметрический поиск улучшающей вариации управления в локальной окрестности улучшаемого управления. Трудоемкость численного интегрирования задач Коши, связанная со специфическими особенностями рассматриваемых задач (большая размерность по вектору состояния, жесткость системы, наличие запаздываний), приводила к тому, что процедура параметрического поиска улучшающего управления фактически определяла трудоемкость всего итерационного процесса. При этом локальность улучшения обуславливала быструю потерю практической сходимости к оптимальному управлению при неудачном выборе начального приближения, а процедура слабого или игольчатого варьирования управления приводила к получению труднореализуемых на практике расчетных управлений. Отметим таїоке, что сходимость указанных методов по невязке принципа максимума делала невозможным улучшение экстремальных управлений. В диссертации впервые разработаны методы нелокального улучшения и методы возмущений, учитывающие прикладную специфику задач оптимального управления иммунным процессом, в том числе запаздывание, нефиксированное условие окончания процесса управления, функциональные ограничения. Проведены апробация и сравнительный анализ эффективности предложенных методов на модельных задачах управления иммунным процессом при заболеваниях. 

Основными целями диссертационной работы являются:

- конструирование специализированных методов для численного решения полиномиальных по состоянию задач оптимального управления;

- модификация и применение разработанных методов в модельных задачах управления иммунным процессом с учетом их специфических особенностей;

- создание алгоритмического и программного обеспечения для решения рассматриваемого класса задач оптимального управления.

Диссертационная работа состоит из двух частей. В первой части (главы 1-5) специальные методы разрабатываются и обосновываются в классе полиномиальных по состоянию задач оптимального управления без функциональных ограничений на фиксированном интервале времени. Эти задачи являются определяющими для проблем управления экологическими, медико-биологическими процессами, химическими и ядерными реакциями и обычно рассматриваются в качестве типовых вспомогательных задач. Разработанный подход распространяется на общий класс нелинейных задач оптимального управления без функциональных ограничений с фиксированным временем (основные задачи).

Во второй части (главы 6, 7) проводится адаптация разработанных методов к специфике задач оптимального управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления и с функциональными ограничениями.

Численные эксперименты, проведенные в работе, в целом продемонстрировали лучшие количественные (число решенных задач Коши, значение целевого функционала) и качественные (реализуемость управления, аппроксимация оптимального управления) показатели расчетов тестовых и модельных задач построенными методами возмущений по сравнению со стандартными методами локального улучшения.

Выделим основные задачи диссертационного исследования.

1. Разработка и обоснование:

- методов нелокального улучшения и методов возмущений без параметрического варьирования последовательных приближений в полиномиальных по состоянию задачах оптимального управления и оптимизации управляющих параметров;

- методов возмущений для решения основных задач оптимального управления и оптимизации управляющих параметров.

2. Постановка и классификация задач оптимального управления иммунным процессом при инфекционных заболеваниях на основе математических моделей.

3. Адаптация и применение методов нелокального улучшения и методов возмущений в задачах оптимального управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления и с функциональными ограничениями -неравенствами.

4. Создание алгоритмического и программного обеспечения разработанных методов.

Структура работы соответствует поставленным целям. Диссертация состоит из введения, семи глав, заключения и списка литературы. Каждая глава разбита на разделы, нумерация разделов двойная и производится по главам. В номере формулы первая цифра указывает на главу, вторая - на раздел.

Первая глава посвящена разработке и обоснованию методов нелокального улучшения в полиномиальных по состоянию задачах оптимального управления без функциональных ограничений. Методы характеризуются отсутствием операции параметрического поиска улучшающего управления. Нелокальность улучшения управления обеспечивается решением краевой задачи для системы обыкновенных дифференциальных уравнений с возможной разрывной по состоянию правой частью, которая значительно проще по свойствам гладкости, чем краевая задача принципа максимума. В разделе 1.1 рассматривается полиномиальная по состоянию задача оптимального управления без запаздывания. Сформулированы известные необходимые условия оптимальности на основе оператора на максимум функции Понтрягина и оператора проектирования на множество допустимых значений управления.

В разделе 1.2 с помощью введенной модификации векторной сопряженной системы получены новые нестандартные формулы приращения функционала в полиномиальной по состоянию задаче оптимального управления, не содержащие остаточных членов разложений (точные формулы приращения функционала). С помощью точных формул обоснованы новые достаточные условия оптимальности управления в рассматриваемом классе задач.

В разделе 1.3 на основе полученных формул приращения функционала построены и проанализированы методы нелокального улучшения в полиномиальной по состоянию задаче оптимального управления с помощью векторных сопряженных переменных. Построенные методы имеют возможность строго улучшать управления, удовлетворяющие принципу максимума. Методы обобщают известные процедуры [225] нелокального улучшения в линейных по состоянию задачах оптимального управления.

В разделе 1.4 методы нелокального улучшения в полиномиальной по состоянию задаче оптимального управления рассмотрены с учетом фазовой модификации функционала. Модифицированные методы приобретают свойство строго улучшать любые управления, не удовлетворяющие принципу максимума. На основе модифицированных процедур получены усиленные по сравнению с принципом максимума необходимые условия оптимальности в рассматриваемом классе задач.

В разделе 1.5 в качестве характерной полиномиальной задачи рассматривается квадратичная по состоянию задача оптимального управления. В этой задаче с помощью модифицированной системы матричных сопряженных переменных построены новые формулы приращения целевого функционала, не содержащие остаточных членов разложений. В результате сформулированы новые достаточные условия оптимальности управления. В разделе 1.6 в рамках квадратичной по состоянию задачи оптимального управления с помощью полученных формул приращения функционала обосновываются и анализируются альтернативные методы нелокального улучшения управления на основе матричных сопряженных переменных. Построенные методы обобщают известные процедуры [225] нелокального улучшения в линейных по состоянию системах управления с квадратичным по состоянию целевым функционалом.

В разделе 1.7 построены и проанализированы методы нелокального улучшения управления на основе операции проектирования, ориентированные на линейную по управлению задачу. С помощью предложенных проекционных методов получены усиленные по сравнению со стандартными необходимые условия оптимальности в рассматриваемом классе задач,

В разделе 1.8 рассмотрена квадратичная по состоянию задача оптимального управления с запаздыванием, С помощью модификации векторной сопряженной системы построены точные формулы приращения функционала. На основе этих формул разработаны методы нелокального улучшения управления, позволяющие улучшать экстремальные управления. Получены новые усиленные по сравнению с принципом максимума необходимые условия оптимальности в задачах с запаздыванием.

В разделе 1.9 приводятся примеры, иллюстрирующие характерные свойства предлагаемых методов нелокального улучшения.

Во второй главе конструируются методы возмущений для решения краевой задачи нелокального улучшения и эквивалентного условия улучшения в пространстве управлений в рамках квадратичной по состоянию задачи оптимального управления. Достоинствами предлагаемых методов являются: нелокальность улучшения, обусловлеииая фиксированностью параметра возмущения; отсутствие трудоемкой операции игольчатого или слабого варьирования при поиске улучшающего управления; возможность улучшения экстремальных управлений, связанная с неединственностью решения краевой задачи и условия улучшения. Построенные методы возмущений без принципиальных изменений обобщаются на полиномиальные по состоянию задачи, в том числе с запаздыванием. В разделе 2.1 вводятся возмущенные и невозмущениые краевые задачи улучшения, основанные на операции на максимум и на операции проектирования. Трудоемкость решения невозмущенной краевой задачи определяется двумя задачами Коши. Для решения возмущенной краевой задачи улучшения сконструированы итерационные методы. Сформулированы и доказаны теоремы о разрешимости возмущенных задач и сходимости итерационных процессов.

В разделе 2.2 предлагается метод последовательного преобразования возмущенных краевых задач улучшения, позволяющий при определенных условиях обеспечивать сходимость возмущенных решений к решению исходной краевой задачи.

В разделе 2.3 построенные методы возмущений распространяются и обобщаются на полиномиальную по состоянию задачу оптимального управления, в том числе с запаздыванием.

В разделе 2.4 предлагаются методы возмущений для реализации условий нелокального улучшения в пространстве управлений, эквивалентных краевым задачам улучшения в пространстве состояний. Методы основываются на выделении линейной по состоянию части из исходной задачи оптимального управления и параметризации нелинейной части с помощью параметра возмущения. Возмущенные условия улучшения определяются соответствующей возмущенной задачей оптимального управления. Решение невозмущениых условий сводится к решению двух задач Коши. Сконструированы итерационные методы решения возмущенных условий и получены условия их сходимости.

В разделе 2.5 разработан метод проекционных возмущений условия нелокального улучшения, когда в качестве параметра возмущения выбирается параметр проектирования. Доказана теорема о разрешимости возмущенного условия и сходимости итерационного процесса для ее решения. Возмущенное решение для любого значения параметра возмущения обеспечивает нелокальное улучшение управления.

В третьей главе методы возмущений конструируются для решения краевой задачи принципа максимума и условий оптимальности в основной задаче оптимального управления. Обосновываются условия сходимости предлагаемых методов. Процедуры решения не гарантируют релаксацию по целевому функционалу задачи на каждой итерации, но компенсируют это свойство отсутствием операции параметрического поиска последовательных приближений и получением реализуемых на практике управлений, подтвержденных расчетами тестовых примеров.

Возмущенные условия оптимальности соответствуют возмущенной задаче оптимального управления, которая строится на основе выделения специальной линейной по состоянию части с разделенными переменными по состоянию и управлению в основной задаче. Трудоемкость решения нсвозмущенных условий определяется решением двух задач Коши. 

В разделе 3.3 разработан метод проекционных возмущений для условия оптимальности управления. Решение возмущенного условия для любого значения параметра возмущения удовлетворяет принципу максимума.

В четвертой главе разработаны методы нелокального улучшения управляющих параметров (управлений) в полиномиальных по состоянию задачах оптимизации управляющих параметров без функциональных ограничений. Нелокальность улучшения достигается ценой решения задачи о неподвижной точке вспомогательной веісгор-функции в пространстве управлений. В общем случае эта функция может быть разрывной и многозначной. Компенсацией за поиск неподвижных точек служит свойство нелокалы-юсти улучшения и возможность улучшения управлений, удовлетворяющих дифференциальному принципу максимума.

В разделах 4.1, 4.2 рассмотрена полиномиальная по состоянию задача оптимизации управляющих параметров, приведены известные необходимые условия оптимальности управления (дифференциальный принцип максимума). Построены формулы приращения целевой функции задачи, не содержащие остаточных членов разложений. На основе формул построены методы нелокального улучшения управляющих параметров. Получены новые достаточные условия оптимальности управления в рассматриваемом классе задач.

В разделе 4.3 применяется фазовая модификация целевой функции задачи для повышения качества методов нелокального улучшения. Модифицированные методы приобретают свойство улучшения любых управлений, не удовлетворяющих дифференциальному принципу максимума. Модификация позволяет получить новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемом классе задач.

В следующих разделах рассматривается квадратичная по состоянию задача в качестве характерной модели для разработки методов. Применяемые в квадратичной по состоянию задаче методы без принципиальных изменений переносятся и обобщаются на полиномиальные по состоянию задачи, в том числе с запаздыванием.

В разделе 4.4 рассматривается линейная по управлению задача оптимизации управляющих параметров с линейными ограничениями на множество допустимых значений. Обосновывается метод сведения задачи о неподвижной точке в процедурах нелокального улучшения управляющих параметров к последовательности задач линейного программирования.

В разделе 4.5 в линейной по управлению задаче оптимизации управляющих параметров построены методы нелокального улучшения на основе операции проектирования. Разработанные проекционные методы позволяют улучшать экстремальные управления и получить усиленные по сравнению с принципом максимума необходимые условия оптимальности в рассматриваемом классе задач. Нелокальность улучшения достигается ценой решения задачи о неподвижной точке непрерывной вспомогательной вектор-функции.

В разделе 4,6 построены методы нелокального улучшения в задаче с кусочно-постоянными на заданных интервалах времени управляющими функциями (дискретными управлениями). Данная задача сводится к специальной задаче оптимизации по управляющим параметрам, что позволяет модифицировать и применить предложенные в предыдущих разделах методы.

В разделе 4.7 приведены иллюстрирующие примеры.

В пятой главе для решения задачи о неподвижной точке процедур нелокального улучшения обосновываются методы возмущений. Предложенный подход распространяется для решения необходимых условий оптимальности в основной задаче оптимизации управляющих параметров. Построенные методы возмущений характеризуются нелокальностью приближений, отсутствием вариационного поиска улучшающих параметров и возможностью улучшения управлений, удовлетворяющих дифференциальному принципу максимума. Обосновываются условия разрешимости возмущенных задач и сходимости методов их решения.

В разделе 5.1 конструируются итерационные процессы для решения возмущенных задач о неподвижной точке, основанных на операции на максимум интеграла от функции Понтрягина и на операции проектирования. Невозмущенные задачи соответствуют специальной линейной по состоянию части с разделенными переменными по состоянию и управлению, выделяемой из исходной задачи оптимизации управляющих параметров.

В разделе 5.2 предлагается метод проекционных возмущений для решения задачи о неподвижной точке в линейной по управлению задаче оптимизации управляющих параметров.

В разделе 5.3 рассматривается задача оценивания коэффициентов квадратичной по состоянию динамической системы по данным измерений состояния системы. Эта задача при условии устранения статистических погрешностей измерения моделируется как задача нелокального возмущения состояния динамической системы. При этом невозмущенное состояние системы определяется данными измерений. Решение возмущенной задачи сводится к решению системы алгебраических уравнений относительно параметров.

В разделах 5.4, 5.5 рассматривается основная задача оптимизации управляющих параметров. Формулируются необходимые условия оптимальности управления на основе операции на максимум (дифференциальный принцип максимума) и на основе операции проектирования. Определяются возмущенная и невозмущенная задачи дифференциального принципа максимума. Невозмущенная задача соответствует линейной и разделенной по состоянию и управлению задаче оптимизации управляющих параметров.

В разделе 5.6 определяется метод возмущений с помощью параметра проектирования для решения необходимого условия оптимальности.

В шестой главе формализуется класс задач управления иммунным процессом при инфекционных заболеваниях на основе математических моделей.

Рассматриваются базовые математические модели иммунного процесса, разработанные под руководством Г.И, Марчука. Приводятся известные результаты качественного и численного анализа моделей, являющиеся основой для постановок задач управления иммунным процессом.

Определяются классы содержательных задач поиска допустимого и оптимального управления иммунным процессом, интерпретируемых как задачи лечения. Выделяются специфические особенности задач управления, вводится классификация задач по содержательным особенностям и ограничениям. Приводятся примеры содержательных задач управления иммунным процессом.

Седьмая глава посвящена адаптации и применению разработанных в предыдущих главах методов нелокального улучшения и методов возмущений к специфике задач управления иммунным процессом, включающих задачи с запаздыванием, с нефиксированным моментом окончания процесса управления, с функциональными ограничениями. Модифицированные методы обладают преемственностью свойства нелокальности, отсутствием параметрического поиска приближений и возможностью улучшения экстремальных управлений.

В разделе 7.1 обосновываются методы нелокального улучшения и метод возмущений для необходимого условия оптимальности в полиномиальной задаче оптимального управления с терминальными ограничениями.

В разделе 7.2 рассматривается метод возмущений для соотношения принципа максимума в задаче с условием окончания процесса управления, интерпретирующимся как достижение заданного множества состояний управляемой системы.

В разделе 7.3 метод возмущений модифицируется для принципа максимума в задаче со специальным условием окончания процесса управления, интерпретирующимся как достижение и удержание управляемой системы в заданном множестве состояний в течение определенного времени.

В разделе 7.4 построен метод возмущений для специальной задачи оптимального управления колебаниями системы с целью увеличения фазы колебаний.

В разделе 7.5 численно исследуется задача оптимального введения иммуноглобулинов при вирусном заболевании вначале без функциональных ограничений, затем с терминальным ограничением. Проводится анализ эффективности разработанных методов возмущений в сравнении с известными стандартными методами условного градиента и проекции градиента, методом игольчатой линеаризации.

В разделе 7.6 численно анализируется модельная задача оптимального стимулирования отека при вирусном гепатите с различными условиями на управляющее воздействие. Для решения задачи применяется метод проекционных возмущений условия оптимальности. Проводится сравнение с результатами численного расчета методами локального улучшения управления.

В заключении сформулированы основные результаты работы, ее новизна, теоретическое и практическое значение.

Список печатных работ по теме диссертации насчитывает более 50 наименований, включающих работы [40 - 79, 277 -281].

Автор выражает глубокую благодарность профессору В.А. Срочко за постоянное внимание и содержательные консультации, чл.-корр. РАН С.Н. Васильеву и профессору А.Д. Мижидону за поддержісу и высказанные замечания к работе.  

Методы нелокального улучшения управлений на основе векторных сопряженных переменных

Структура работы соответствует поставленным целям. Диссертация состоит из введения, семи глав, заключения и списка литературы. Каждая глава разбита на разделы, нумерация разделов двойная и производится по главам. В номере формулы первая цифра указывает на главу, вторая - на раздел.

Первая глава посвящена разработке и обоснованию методов нелокального улучшения в полиномиальных по состоянию задачах оптимального управления без функциональных ограничений. Методы характеризуются отсутствием операции параметрического поиска улучшающего управления. Нелокальность улучшения управления обеспечивается решением краевой задачи для системы обыкновенных дифференциальных уравнений с возможной разрывной по состоянию правой частью, которая значительно проще по свойствам гладкости, чем краевая задача принципа максимума. В разделе 1.1 рассматривается полиномиальная по состоянию задача оптимального управления без запаздывания. Сформулированы известные необходимые условия оптимальности на основе оператора на максимум функции Понтрягина и оператора проектирования на множество допустимых значений управления. В разделе 1.2 с помощью введенной модификации векторной сопряженной системы получены новые нестандартные формулы приращения функционала в полиномиальной по состоянию задаче оптимального управления, не содержащие остаточных членов разложений (точные формулы приращения функционала). С помощью точных формул обоснованы новые достаточные условия оптимальности управления в рассматриваемом классе задач. В разделе 1.3 на основе полученных формул приращения функционала построены и проанализированы методы нелокального улучшения в полиномиальной по состоянию задаче оптимального управления с помощью векторных сопряженных переменных. Построенные методы имеют возможность строго улучшать управления, удовлетворяющие принципу максимума. Методы обобщают известные процедуры [225] нелокального улучшения в линейных по состоянию задачах оптимального управления. В разделе 1.4 методы нелокального улучшения в полиномиальной по состоянию задаче оптимального управления рассмотрены с учетом фазовой модификации функционала. Модифицированные методы приобретают свойство строго улучшать любые управления, не удовлетворяющие принципу максимума. На основе модифицированных процедур получены усиленные по сравнению с принципом максимума необходимые условия оптимальности в рассматриваемом классе задач. В разделе 1.5 в качестве характерной полиномиальной задачи рассматривается квадратичная по состоянию задача оптимального управления. В этой задаче с помощью модифицированной системы матричных сопряженных переменных построены новые формулы приращения целевого функционала, не содержащие остаточных членов разложений. В результате сформулированы новые достаточные условия оптимальности управления. В разделе 1.6 в рамках квадратичной по состоянию задачи оптимального управления с помощью полученных формул приращения функционала обосновываются и анализируются альтернативные методы нелокального улучшения управления на основе матричных сопряженных переменных. Построенные методы обобщают известные процедуры [225] нелокального улучшения в линейных по состоянию системах управления с квадратичным по состоянию целевым функционалом. В разделе 1.7 построены и проанализированы методы нелокального улучшения управления на основе операции проектирования, ориентированные на линейную по управлению задачу. С помощью предложенных проекционных методов получены усиленные по сравнению со стандартными необходимые условия оптимальности в рассматриваемом классе задач, В разделе 1.8 рассмотрена квадратичная по состоянию задача оптимального управления с запаздыванием, С помощью модификации векторной сопряженной системы построены точные формулы приращения функционала. На основе этих формул разработаны методы нелокального улучшения управления, позволяющие улучшать экстремальные управления. Получены новые усиленные по сравнению с принципом максимума необходимые условия оптимальности в задачах с запаздыванием. В разделе 1.9 приводятся примеры, иллюстрирующие характерные свойства предлагаемых методов нелокального улучшения. Во второй главе конструируются методы возмущений для решения краевой задачи нелокального улучшения и эквивалентного условия улучшения в пространстве управлений в рамках квадратичной по состоянию задачи оптимального управления. Достоинствами предлагаемых методов являются: нелокальность улучшения, обусловлеииая фиксированностью параметра возмущения; отсутствие трудоемкой операции игольчатого или слабого варьирования при поиске улучшающего управления; возможность улучшения экстремальных управлений, связанная с неединственностью решения краевой задачи и условия улучшения. Построенные методы возмущений без принципиальных изменений обобщаются на полиномиальные по состоянию задачи, в том числе с запаздыванием. В разделе 2.1 вводятся возмущенные и невозмущениые краевые задачи улучшения, основанные на операции на максимум и на операции проектирования. Трудоемкость решения невозмущенной краевой задачи определяется двумя задачами Коши. Для решения возмущенной краевой задачи улучшения сконструированы итерационные методы. Сформулированы и доказаны теоремы о разрешимости возмущенных задач и сходимости итерационных процессов.

В разделе 2.2 предлагается метод последовательного преобразования возмущенных краевых задач улучшения, позволяющий при определенных условиях обеспечивать сходимость возмущенных решений к решению исходной краевой задачи.

Полиномиальная по состоянию задача оптимального управления с запаздыванием

Трудоемкость построения улучшающего управления определяется трудоемкостью решения непрерывной краевой задачи (1.7.5), (1.7.6), которая в общем случае существенно проще для решения, чем разрывные по состоянию краевые задачи улучшения, построенные с помощью операции на максимум (1.1.4).

В линейной по состоянию задаче (1.7.1), (1.7.2) (функции A{x,i), b(x,t), a(x,t), р(х), b(x,t) линейны по х) краевая задача (1.7.5), (1.7.6) сводится к двум непрерывным задачам Коїли для фазовой и сопряженной систем переменных. В этом случае процедуры становятся эквивалентными проекционным методам [225]. При этом фазовая и сопряженная задачи Коши имеют единственные решения ха (ґ), paif)i t еТ , которые однозначно определяют выходное управление va (t), для любого заданного а 0. Потеря свойства неединственности решения краевой задачи (1.7.5), (1.7.6) в линейной по состоянию задаче (1.7.1), (1.7.2) означает, что управления, удовлетворяющие принципу максимума, строго не улучшаются первой проеісциошіой процедурой. Таким образом, в данном линейном случае условие В{ и принцип максимума равнозначны.

Отметим, что краевая задача (1.7.5), (1.7.6) в линейной по состоянию задаче (1.7.1), (1.7.2) приобретает свойство существования решения. Это свойство и оценка (1.7.8) гарантируют строгое улучшение первым проекционным методом любого управления, не удовлетворяющего принципу максимума. В нелинейной по состоянию задаче (1.7.1), (1.7.2) возможен случай, когда краевая задача (1.7.5), (1.7.6) не имеет решения. Это означает, что управление и0 є V не удовлетворяет принципу максимума. В этом случае рассматриваемая процедура не действует и нужно перейти к другим методам улучшения. Опишем альтернативную процедуру улучшения, основанную на формуле (1.7.4) приращения функционала. Второй проекционный метод нелокального улучшения. 1. Для заданных и0 є У и а 0 определим соответствующее отображение и" и сформируем функцию После интегрирования по teT с учетом формулы (1.7.4) получаем оценку (1.7.8) уменьшения целевого функционала вместе с аналогичными первому проекционному методу утверждениями по свойствам улучшения, принципу максимума и усиленному необходимому условию оптимальности. Выделим связь предлагаемых проекционных методов улучшения с методами нелокального улучшения, основанными на операции на максимум (1.1.4). В соответствии со свойством (1.1.11) функции иа, проещиоиные методы в задаче (1.7.1), (1.7.2) становятся адекватными соответствующим методам нелокального улучшения из раздела 1.3 после модификации функционала задачи по управлению Оптимальное значение а в проекционных процедурах улучшения соответствует минимуму оценки (1.7.8) по а 0. Поскольку соответствующая задача в общем случае аналитически неразрешима, то можно использовать следующие эвристические рекомендации, аналогичные линейным по состоянию системам [225, 231J. В задачах с оптимальным управлением разрывного типа целесообразно использовать достаточно большие а 0. В задачах с непрерывным решением оправдана стратегия выбора достаточно малых а О. По аналогичной схеме на основе операции проектирования (1.1.9) строятся проекционные методы нелокального улучшения на основе матричных сопряженных переменных в задаче (1.7.1), (1.7.2) (проекционные аналоги третьего и четвертого методов нелокального улучшения из раздела 1.6). При этом в линейно - квадратичной задаче (1.7.1), (1.7.2) (функции A(x,t), b(x,t) линейны по х) соответствующие векторно-матричные краевые задачи в проекционных процедурах расщепляются на две независимые задачи Коши и методы становятся эквивалентными соответствующим методам проекций [225, 231]. Отметим, что в этом случае указанные третий и четвертый проекционные методы теряют свойство строгого улучшения управлений, удовлетворяющих принципу максимума, и приобретают свойство строгого улучшения любого управления, не удовлетворяющего принципу максимума. Рассматриваемые проекционные методы нелокального улучшения легко обобщаются с помощью модификации сопряженных систем переменных на произвольную полиномиальную по состоянию и линейную по управлению задачу оптимального управления (1.1.6), (1.1.7). В заключение раздела выделим основные особенности, характеризующие проекционные методы нелокального улучшения. 1. Нелокальность улучшения управлений без процедуры параметрического варьирования. 2. Возможность строгого улучшения управлений, удовлетворяющих принципу максимума (в том числе, особых управлений). Такая возможность реализуется через неединственность решения краевой задачи улучшения. 3. Процедуры позволяют сформулировать новые необходимые условия оптимальности управления, усиливающие принцип максимума в рассматриваемом классе задач. 4. Трудоемкость улучшения определяется трудоемкостью решения непрерывной краевой задачи, которая в общем случае существенно проще разрывной по состоянию краевой задачи в методах нелокального улучшения, основанных на операции на максимум. 5. Проекционные методы не требуют ограниченности множества U. В частности, при U = Rn получаем методы нелокального улучшения для линейной по управлению задачи без ограничений на управление. 6. В линейной по состоянию задаче (1.7.1), (1.7.2) (функции A(x,t), b(x,t), a(x,t), р(х), d(x,t) линейны по х) краевая задача улучшения в проекционных процедурах распадается на две задачи Копій для фазовых и сопряженных систем переменных. В этом случае процедуры становятся эквивалентными соответствующим проекционным методам [225, 231], 7. В линейно-квадратичных задачах (1.7.1), (1.7.2) (функции A(xJ), b(xst)-линейны по х) первый и второй проекционные методы могут улучшать управления, удовлетворяющие принципу максимума. Проекционные методы [225,231] таким свойством не обладают.

Метод проекционных возмущений для условия оптимальности

Таким образом, оператор Ух удовлетворяет условию Липшица с константой, пропорциональной параметру а 0. Из условий (2.5.6) - (2.5.8) следует, что оператор Ga удовлетворяет условию Липшица с константой, пропорциональной а О

В итоге, согласно теореме 2.4.1, итерационный процесс (2.5.5) при малых а 0 скодится к единственному решению возмущенной задачи (2.5.4) для любого начального приближения v є V. Таким образом, доказана следующая теорема о сходимости. Теорема 2.5.1. Пусть семейство фазовых траекторий в линейной по управлению и квадратичной по состоянию задаче (1.7.1), (1.7.2) с выпуклым компактным множеством U с R"1 ограничено: x(t,u) є X, ієТ, иєУ, где X с R" - выпуклое компактное множество. Тогда для достаточно малого параметра проектирования а О 1)задача (2.5.1) имеет единственное решение Vа &V; 2) итерационный процесс (2.5.2) сходится в норме Ц-jj к решению Vа для любого начального приближения v є У. Отметим в качестве следствия, что в условиях теоремы 2.5.1 решение возмущенной задачи (2.5.1) для управления w eV, удовлетворяющего принципу максимума, совпадает в силу единственности с н. Начальным приближением итерационных процессов (2.5.2), (2.5.3) при решении возмущенной задачи (2.5.1) для управления и0 є V, не удовлетворяющего принципу максимума, можно выбрать начальное приближение v =и. При этом для достаточно малых а 0, согласно теореме 2.5.1, следствию 2.4.1 и оценке улучшения (1.7.8), гарантируется строгое улучшение управления и0 итерационными процессами. Метод возмущений проекционнного условия улучшения в пространстве управлений без принципиальных изменений обобщается на полиномиальные по состоянию задачи оптимального управления, в том числе с запаздыванием. Отметим, что метод проекционных возмущений выгодно отличается от методов возмущений с искусственным параметром возмущения [0,1] тем, что управление м є К улучшается решением возмущенной задачи (2,5.1) для любого проекционного параметра а 0. Решение возмущенных задач с параметром 0 є 1 в общем случае не гарантирует улучшения управления и0. В залючение главы выделим основные свойства разработанных методов возмущений. 1. Отсутствие операции параметрического поиска улучшающего управления. 2. Нелокальность улучшения, обусловленная фиксированностью параметра возмущения. 3. Возможность улучшения управлений, удовлетворяющих принципу максимума. Известным подходом к решению задачи оптимального управления является сведение к двухточечной краевой задаче для обыкновенных дифференциальных уравнений на основе необходимого условия оптимальности с последующим решением полученной краевой задачи численным методом. Трудности решения краевой задачи в пространстве состояний в общем случае связаны с наличием положительных вещественных частей собственных чисел матрицы Якоби, а также с возможной разрывностью правой части краевой задачи по фазовым переменным. Методы принципа максимума обеспечивают сходимость к нулю невязки краевой задачи принципа максимума на улучшающих приближениях управления, и, таким образом, позволяют решать краевую задачу в пространстве управлений. Достоинствами этих методов являются вычислительная устойчивость расчета фазовой и сопряженной подсистем краевой задачи, а также релаксация по целевому функционалу на каждой итерации методов. Релаксация обеспечивается по малому параметру, регулирующему область слабого или игольчатого варьирования управления. Этот параметрический поиск является наиболее трудоемкой частью итерационного процесса. Кроме того, операция варьирования управления может формировать практически труднореализуемое расчетное управление, малое отклонение от которого приводит к недопустимому изменению целевого функционала по сравнению с расчетным значением. В главе разрабатываются итерационные методы расчета экстремальных управлений (удовлетворяющих принципу максимума), не содержащие операцию параметрического поиска улучшающего управления. Предлагаемые методы применяются для решения необходимых условий оптимальности в основной задаче оптимального управления. По конструкции методы аналогичны методам возмущений, разработанным в предыдущей главе для решения условий улучшения в полиномиальных задачах оптимального управления, Рассматривается основная задача оптимального управления в которой x(t) = (xl(t),...tx„(t)) - вектор состояния, и(ґ) = (щ(і:),...,ит(їУ) - вектор управления. В качестве допустимых управлений рассматривается множество V кусочно-непрерывных на Т функций со значениями в выпуклом компактном множестве U a R" . Начальное состояние х и промежуток управления Т заданы. Введем следующий набор предположений для задачи (3.1.1), (3.1.2) (ДИМ-условия):

Схема поиска неподвижных точек в методах нелокального улучшения

Таким образом, в сделанных предположениях при достаточно малых а 0 операторы Ua, Ga удовлетворяют условию Липшица с константой меньше единицы. Отметим, что при а = 0 операторы Ua, G0 невозмущенных задач удовлетворяют условию Липшица с константой, равной единице, что согласуется с полученными оценками.

В результате на основе теоремы 2.4.1 получаем следующее утверждение о сходимости процессов (3.3.4), (3.3.5). Теорема 3.3.1. Пусть 1) семейство фазовых траекторий в основной задаче (3.4.1), (3.4.2) ограничено: x(t,u)eX, teT, иєУ,гдє XdR" - выпуклое компактное множество; 2) вектор-функция f{x,u,t), функции F(x,u,t), р(х) дважды непрерывно дифференцируемы по совокупности переменных х, и, t на множестве R"xUxT; 3) для вектор-функции Hu(y/,x,u,t) выполняется условие где К - const 0, Р a R" - выпуклое компактное множество, ограничивающее семейство сопряженных траекторий: i//(t, и)єР, t еТ, ueV. Тогда для достаточно малого параметра проектирования а О 1) соотношение (3.3.1) имеет единственное решение Vа є V; 2) итерационные процессы (3.3.2), (3.3.3) сходятся в норме ]- к решению Vа для любого начального приближения v є У. Отметим, что метод проекционных возмущений характеризуется тем, что экстремальное управление определяется условием (3.3.1) при любом значении параметра возмущения а О. Метод проекционных возмущений легко обобщается на системы с запаздыванием. Для сравнения разработанного метода проекционных возмущений представим в используемых обозначениях стандартный метод проекции градиента [81] Модификация стандартрюго метода проекции градиента СЙ 0 описывается соотношениями Основное отличие построенного метода проекционных возмущений условия оптимальности от стандартных проекционных методов и его модификаций [225] состоит в том, что параметр проектирования а 0 фиксируется в итерационном процессе последовательных приближений. В методах проекции градиента этот параметр варьируется на каждой итерации для обеспечения улучшения управлений. В целом разработанные методы возмущений не гарантируют релаксацию по целевому функционалу в отличие от методов условного градиента, проекции градиента и их модификаций, но компенсируют это свойство отсутствием операции параметрического поиска улучшающих приближений и получением реализуемых на практике управлений. Указанные свойства являются существенными факторами повышения вычислительной эффективности решения задач оптимального управления. Численные расчеты тестовых задач предложенными методами возмущений продемонстрировали значительное снижение трудоемкости и повышение качества реализуемости решения по сравнению со стандартными методами (условного градиента, проекции градиента, игольчатой линеаризации) Для примера приведем сравнительные результаты решения известной задачи оптимального управления шаговым электродвигателем [5] и, = и,(Оє[0Д6], і = 1,2,3, ґ є Г = [0,0.05]. Здесь х, - положение вала двигателя, х2 - его скорость, компоненты управления щ, щ, щ соответствуют квадратам токов в обмотках. Критерий качества (3.4.1) определяется требованием приведения положения вала к нулю при минимальных энергозатратах. Значения параметров .=0.001, і = 1,2,3, а = 50, Ь = 1000. В [5] задача (3.4,1), (3.4.2) решалась методом условного градиента (МУГ), первым и вторым методами условного квазиградиента (МУК-1 и МУК-2) [225, 228]. В диссертационной работе эта задача решалась методом (3.3.2) проекционных возмущений условия оптимальности (МПВУО).

Расчет задачи производился на ПК Celeron 700. Численное решение фазовых и сопряженных задач Коши осуществлялось методом Рунге - Кутта - Фельберга переменного (5 - 6) порядка и шага [198], реализованным на языке Фортран PowerStation 4.0. Относительная погрешность расчета фазовых и сопряженных задач Коши задавалась равной 10"ш. Значения вычисленных управляемых, фазовых и сопряженных переменных в процессе расчета запоминались в узлах равномерной сетки Q. с шагом дискретизации 0.00025 иа интервале Т. В промежутках между соседними узлами сетки значение управления принималось постоянным и равным значению управления в левом узле.

В качестве начального приближения итерационного процесса (3.3.2) выбиралось управление, тождественно равное нулю. Условием остановки расчета выбиралось неравенство

Похожие диссертации на Нелокальные улучшения и методы возмущений в полиномиальных и других нелинейных задачах оптимального управления