Содержание к диссертации
Введение
ГЛАВА 1. Постановка задачи управления для вращающихся твердых тел с полостью, полностью заполненной жидкостью 11
1.1 Обзор методов и подходов в изучении динамических систем с жидким наполнением 11
1.2 Исходные уравнения движения твердого тела с полостью, полностью заполненной идеальной несжимаемой жидкостью 24
1.3 Задача о вращающемся теле с полостью, полностью заполненной вязкой несжимаемой жидкостью 29
1.4 Исследование устойчивости свободного вращения тела с жидким наполнением. Случаи идеальной и вязкой жидкости 34
1.4.1 Необходимое условие устойчивости для идеальной жидкости 34
1.4.2 Асимптотическая устойчивость для вязкой жидкости 37
1.5 Зависимость угловой скорости возмущенного движения от момента внешних сил 38
1.5.1 Вывод уравнения для случая идеальной жидкости 38
1.5.2 Учет поправок, связанных с вязкостью 41
ГЛАВА 2. Модели оптимального управления с использованием формализма гамильтона-понтрягина 44
2.1 Сведение к системе уравнений 44
2.1.1 Сведение в системе шестого порядка для случая идеальной жидкости 44
2.1.2 Сведение к системе десятого порядка для случая вязкой жидкости. 45
2.1.3 Универсальное сведение к системе четвертого порядка 48
2.2 Задача безусловной минимизации с терминальным функционалом .. 50
2.2.1 Аналитическое решение задачи для системы шестого порядка 50
2.2.2 Аналитическое решение задачи для системы десятого порядка 52
2.3 Задачи с ограничениями на управление 55
2.3.1 Пример задачи с разрывным управлением 55
2 3.2 Задача с интегральными ограничениями типа неравенств 57
2.4 Регуляризованный метод проекции градиента для задачи с интегральными ограничениями типа неравенств 58
2.4.1 Описание численного метода и условия окончания итераций 58
2.4.2 Численные тесты для случая идеальной жидкости 64
2.4.3 Расчеты для случая вязкой жидкости 67
2.5 Управление в условиях неопределенности 69
2.5.1 Задача о переводе системы в заданное состояние, когда начальное положение точно не определено 69
2 5.2 Результаты вычислений 73
2.6 Иерархические задачи распределения ресурсов 75
2 6.1 Одномерные по управлению и фазовым переменным системы 75
2.6.2 Многомерный случай 82
ГЛАВА 3. Модели оптимального управления с использованием метода динамического программирования беллмана 89
3.1 Исследование множества достижимости 89
3.1.1 Постановка задачи для случая линейных систем 89
3.1.2 Построение выпуклой оболочки множества достижимости 90
3.2 Использование рекуррентных соотношений беллмана в задаче с ограничениями на управление 94
3.2.1 Постановка задачи оптимального управления с терминальным функционалом 95
3.2.2 Результаты численных тестов 97
Заключение 103
Список использованных источников
- Исходные уравнения движения твердого тела с полостью, полностью заполненной идеальной несжимаемой жидкостью
- Сведение к системе десятого порядка для случая вязкой жидкости.
- Аналитическое решение задачи для системы десятого порядка
- Задача о переводе системы в заданное состояние, когда начальное положение точно не определено
Введение к работе
Общая характеристика работы
Возможность управления вращающимися твердыми телами с жидким наполнением еще в недавнем прошлом была практически не реализуема. С развитием современной вычислительной техники, у исследователей появились возможности моделирования такого рода систем, разработки эффективных численных методов решения задач.
Одними из важных задач в этой связи являются построение математической модели, выбор вида и характера управляющего воздействия, изучение поведения системы, получение зависимостей и выражений для параметров системы от управляющего воздействия.
В данной работе найдена аналитическая зависимость угловой скорости возмущенного движения от момента внешних сил для вращающегося твердого тела с полостью, целиком заполненной как идеальной, так и вязкой жидкостью. Внешний момент рассматривается как управляющее воздействие. Таким образом, появляется возможность анализа различных постановок задач оптимального управления. Для таких задач применяется аппарат оптимального управления и удается либо получить аналитические решения, либо предложить эффективный численный метод и продемонстрировать результаты соответствующими вычислениями.
Актуальность темы
Задачи стабилизации и управления движением ротора с полостью, содержащей жидкость, являются привлекательными как с теоретической точки зрения, так и в силу многочисленных технических приложений. Они возникают и в теории движения самолетов, и кораблей, и спутников, где запас жидкого
топлива, имеющийся на борту, оказывает существенное влияние на движение этих аппаратов.
Рассматриваемые вопросы находят свое применение при изучении динамики космических аппаратов с запасами топлива. Они равномерно закручиваются на орбите вокруг некоторой оси для стабилизации, равномерного нагрева солнечными лучами, создания искусственной силы тяжести и других целей.
Эти задачи актуальны также при проектировании быстровращающихся роторов, гироскопов, имеющих внутри себя полости, заполненные жидкостью.
Не безынтересным является возможное использование в баллистике, где применяются снаряды, торпеды, ракеты с жидким наполнением, для которых актуальны задачи наведения, попадания и стабилизации.
С теоретической точки зрения данные задачи интересны прежде всего тем, что они относятся к сложным задачам механики, и всякий раз требуют для своего решения новые подходы и методы. Исследователи всячески пытаются приблизить соответствующую математическую модель к реальности, порой сталкиваясь с непреодолимыми вычислительными трудностями при решении точных уравнений, прибегая к различным предположениям и упрощениям, рассматривая только конкретные режимы или частные случаи.
В данной работе продемонстрирована методика для задач оптимального управления в применении к вращающимся телам, наполненным жидкостью.
Цель и задачи исследования
Первой основной целью данной работы является построение математической модели для изучения динамики вращающихся твердых тел с жидким наполнением, совершающих возмущенное относительно равномерного вращения движение под действием моментов внешних сил. При этом предполагается полное заполнение полости, без свободной поверхности,
идеальной или вязкой несжимаемой жидкостью. Компоненты момента внешних сил, действующих на систему, перпендикулярные оси стационарного вращения, предполагается рассматривать как управляющие воздействия.
На пути к поставленной цели основной задачей исследования на первом этапе было получение зависимости характеристик поведения системы от момента внешних сил. Следующей задачей было выяснение устойчивости невозмущенного, стационарного движения рассматриваемой системы и получение зависимостей и ограничений на параметры системы для обеспечения ее устойчивости.
Второй основной целью исследования была постановка задач управления и применение различных методов и подходов теории оптимального управления для рассматриваемых динамических систем, где в качестве неизвестной функции управления выступает момент внешних сил.
В ходе исследований удалось применить аппарат оптимального управления, основанный на принципе максимума, и теорию динамического программирования Беллмана. Для этого потребовалось осуществить преобразование исходных соотношений и, в частности, получить сведение к эквивалентным системам дифференциальных уравнений. В другом случае удалось использовать найденную зависимость напрямую.
Научная новизна
С одной стороны, существует множество работ, посвященных исследованию поведения твердых тел с жидким наполнением, однако, практически отсутствуют результаты и публикации, о постановке задач оптимального управления для таких систем. В данной работе делается попытка заполнить эту нишу. Дается постановка задач оптимального управления с различными функционалами и представлен математический аппарат для их эффективного решения.
Рассматриваются известные в теории управления модели: построения множеств достижимости, управления в условиях неопределенности, распределение ресурсов в иерархической системе и другие, где в качестве связей фигурируют найденные соотношения, описывающие динамику тел с жидким наполнением.
Методы исследования
В ходе исследования применяются следующие математические методы. Рассматривается задача Коши для линеаризованного уравнения Навье-Стокса для возмущенного относительно равномерного вращения движения тела с полостью, содержащей жидкость. Методом Галеркина отделяется временная составляющая решения от пространственных координат. Для случая вязкого заполнения учет вязкости производится методом пограничного слоя, а выражения для обобщенных диссипативных сил получаем, следуя процедуре Л.Д. Ландау. Для разрешения системы интегро-дифференциальных уравнений используется прямое и обратное преобразование Лапласа.
В задаче исследования устойчивости применяется критерий A.M. Ляпунова устойчивости линейных систем для характеристического уравнения невозмущенного движения. Методом возмущений получены поправки для случая вязкого заполнения.
При исследовании моделей задач оптимального управления широко используется принцип максимума Л.Д. Понтрягина и используется метод динамического программирования Р. Беллмана. Применены необходимые условия оптимальности А.Б. Куржанского для задач управления в условиях неопределенности. Для иерархических систем большой размерности используются аналитические методы понижения размерности и метод декомпозиции на основе агрегирования переменных. Для построения численных решений задач оптимального управления с интегральными
ограничениями используется регуляризованныи метод проекции градиента с выбором шага согласно процедуре Армийо. Задача отыскания проекции точки на множество решается с использованием двойственного метода. Для некоторых постановок численно реализован метод Беллмана. В программной реализации численных экспериментов используется ряд алгоритмов, которые реализованы на языке C++, текст наиболее важных из них вынесен в приложения и является значимой частью диссертации. Вычисления проводились в среде программирования MS Visual Studio, построение графиков многомерных функций в ряде задач осуществлялось с помощью среды Mathcad.
Практическая ценность
Полученные в работе теоретические результаты могут послужить отправной точкой дальнейших исследований по данной проблематике, расширив тем самым область применения описанных подходов. Например, можно рассмотреть задачи управления для тел с частичным заполнением полости, когда у жидкости есть свободная поверхность, исследовать упругие стенки полости, рассмотреть производимый вдув или отсос жидкости, изучить задачи с учетом нагрева или охлаждения стенок полости.
Использованные методы теории оптимального управления могут быть применены в различных областях техники для задач, перевода системы в требуемое состояние, для реального управления вращающимися роторами с жидким наполнением. Программно реализованные алгоритмы и разработанный комплекс программ может быть использован как основа для программного обеспечения таких систем.
Апробация
Результаты, представленные в работе, методы и алгоритмы докладывались, обсуждались и получили одобрение специалистов на следующих конференциях и семинарах:
XL VI научная конференция МФТИ «Современные проблемы фундаментальных и прикладных наук» (28-29 ноября 2003 г., Москва -Долгопрудный).
Российский симпозиум с международным участием «Управление упругими колебаниями». (31 января - 2 февраля 2006 г. Переславль-Залесский).
Научные семинары отдела сложных систем ВЦ РАН (2002-2006 г.г.).
Научные семинары кафедр «Интеллектуальных систем», «Управления и вычислительных систем» МФТИ (ГУ) (2002-2006 г.г.).
Публикации основных результатов
Основные результаты диссертации опубликованы в 5 работах [10,20,21,25,26].
Структура и объем диссертации
Диссертация состоит из введения, трех глав, заключения, списка использованных источников и трех приложений.
Исходные уравнения движения твердого тела с полостью, полностью заполненной идеальной несжимаемой жидкостью
Рассмотрим возмущенное относительно стационарного вращения движение твердого тела с полостью Q, целиком заполненной идеальной несжимаемой жидкостью плотности р, в поле массовых сил с потенциалом U. Уравнения движения жидкости записываются во вращающейся системе координат Oxyz, жестко связанной с твердым телом ґ Й1/ 1 W0 + 3x(o)xr) + (exr) + 2(exV) + — + {Pv)v = --VP-VU, (. .. divV = 0eQ, V-n = 0HaS, V = V0 (r) при t = 0, где t - время, г радиус-вектор, отсчитанный отточки О, V = V{f) - скорость жидкости в системе координат Oxyz, Р = Р{7) - давление в жидкости, W0 -абсолютное ускорение точки О, У = У(/) - абсолютная угловая скорость вращения твердого тела, а - его угловое ускорение, S - граница области Q, п -орт внешней нормали к S.
В системе координат, связанной с телом, уравнение моментов относительно центра инерции О, всей системы имеет вид + 3xK = Ml, K = Ja + p\rxVdQ (1.2) at Q где J - тензор инерции системы тело-жидкость, относительно точки Ох, Мх -главный момент всех внешних сил, действующих на тело, относительно центра инерции, К - кинетический момент.
Пусть невозмущенное движение тела с жидкостью относительно центра инерции представляет собой равномерное вращение всей системы как твердого тела относительно оси, параллельной Oz с постоянной угловой скоростью 30.
В невозмущенном движении имеем: а = со0 = сойег, V = 0, Л/, = У0 х ./ У0 . Пусть «(/) = ый(/) + Q(/), Л/, = ё0хJcb0 + М _ f .. „7 - 1,- -ч2 (1-3)
Считается, что в возмущенном движении величины Q(/), V, р, М малые первого порядка. Подставляя соотношения (1.3) в уравнения (1.1) и (1.2), отбрасывая малые высших порядков, уравнения движения жидкости приводятся к виду —+2(d0xV)+nxr=-Vp, (1.4) divV = 0eQ, V-n = 0naS, V = V0(r) при / = 0 Уравнения движения тела с жидкостью примут вид JQ + Q х J30 + ё0 х JQ. + р \rxVdQ + p\a0x(rxV)dQ = M, (1.5) Q Q здесь и в (1.4) точкой обозначена производная в системе Oxyz. Уравнения (1.4) и (1.5) вместе с обычными уравнениями движения центра инерции, кинематическими соотношениями и начальными условиями полностью описывают динамику тела с жидкостью. Рассмотрим гидродинамическую задачу (1.4). Вводится линейное преобразование L(a) [24] Lb = b + (т2ё(ё,Ь) + crib х є) и скалярные функции p{x,y,z), удовлетворяющие следующей краевой задаче на собственные значения А Р+ dz = eQ (LV(p)n = 0HaS. гдУ_ 8z2 "" (1.6) Задача (1.6), согласно [76], имеет счетное число собственных функций рп и собственных значений ап, заполняющих всюду плотно область Recrn=0, crn l. Вводятся комплексные вектор-функции Vn(x,y,z), определяемые как М1+7«) а" В силу (1.6) и (1.7) Vn удовлетворяют уравнениям divVn = 0eQ, V-n = 0naS. Кроме того, функции Vn - ортогональны в Q [24].
Решение уравнений (1.4) ищутся методом Галеркина в виде рядов с неизвестными коэффициентами S„ и Un (1.8) со p(x,y,z,t) = U„ (t)pn(x,y,z). л-1 Выражение Qxr из (1.4), связанное с движением тела, представляется в виде ММк . . a -r= —j—,an = \rxVndQ, (1.9) здесь N2n = \(v„-V )dQ при п = т, звездочка означает комплексное сопряжение. Q
Подстановка (1.8) и (1.9) в (1.4) и замена в полученном равенстве 2ё0хУ по формуле 2ё0хУ= -hnVn-4 p„, приводит с помощью процедуры Галеркина к уравнению для коэффициентов разложения скорости в ряд Фурье 5л-ад+ = 0,5„= ПрИ / = о, (я = 1,2,3...). (1.10) "я Используя разложения (1.8) и второе равенство (1.9), кинетический момент представляется в виде K = M0+JQ + pY,Sn{l)an. (1.11) n=I После подстановки (1.11) в (1.5), уравнения движения тела с жидкостью приводятся к виду JQ + QxJa0+30xJQ + p [anS„+(30xan)Sn \ = M. 0-12) л-1
Уравнения (1.10) и (1.12), а также присоединенные к ним начальные условия для Q(/) описывают динамику тела с идеальной жидкостью.
Таким образом, задача динамики вращающегося тела с полостью, содержащей жидкость, разбивается на две задачи, которые могут выполняться независимо. Первая, гидродинамическая задача, сводится к решению краевой задачи (1.6) и зависит только от геометрии полости и не зависит от движения тела. Вторая, динамическая часть задачи, сводится к решению задачи Коши для системы обыкновенных линейных дифференциальных уравнений (1.10) и (1.12), и может быть выполнена известными методами аналитически и численно.
Если ось вращения системы в невозмущенном движении является одновременно и осью массовой и геометрической симметрии тела и полости, то уравнения могут быть значительно упрощены. Для динамически симметричного тела скалярное уравнение движения вокруг оси Oz отделяется от остальных, а уравнения движения относительно осей Ох и Оу идентичны. В цилиндрической системе координат уравнения (1.10) и (1.12) примут вид А + і(А-С)а)0 + 2р ахп(5п + ісо08п) = М{і), л=і (1.13) Cr = Mz, N2n(Sn-anS„) + axng = 0,(n = l,2,3...), где А, С - главные моменты инерции системы относительно осей Ох и Оу соответственно, р, q, г - проекции угловой скорости Q на оси системы Oxyz, g = p + iq, M = Mx+iMy.
Сведение к системе десятого порядка для случая вязкой жидкости.
Определим сильно выпуклый функционал как: /(М) = Л/(/)2 , М є U с Н, где U определяется через (2.41). / - дифференцируемый по Фреше функционал, причем Г(М), МeU удовлетворяют условию Липшица.
Обозначим /, = inf /(М), а М" eU - /-нормальное решение І(М") = Г= inf I(M). Тогда для исходной задачи регуляризованные задачи будут иметь вид TN(M) = J(M) + aNI(M) mf, MeU, N = 1,2,.-, (2.44) где aN О, iV = 1,2,..., aN - О, N - оо. Обозначим их точные решения M NeU:T,(M N) = T; = MTN(M), # = 1,2,..., А/єС/ а так же приближенные решения MNEU,T; TN{MN) TN + sN,N = \,2,.., (2.45) где eN 0, N = 1,2,..., - 0, N- oo. Для решений регуляризованных задач существуют утверждения о сходимости по функционалу: TN(MN)- J , #- « ; слабой сходимости по управлению: Мы -»/ , N - оо и сильной сходимости по аргументу: \MN-M" -»0, #- » (СМ. например [77]).
В (2.45) неизвестными являются значения величин Т , N- « . Поэтому для решения этих задач более предпочтительным являются приближенные методы (см. [32,77]), где не надо знать точного решения задачи (2.44). Рассмотрим условия приближения в виде MNzU: MN-wN 8l,wl=Pv{MN N{MN)), (2.46) 0N 0, # = 1,2,..., - 0 при N- oo. Здесь вводится Ри - оператор проектирования на множество U. Для приближенных решений, определенных таким образом, справедливы утверждения о сходимости, сформулированные в [32].
Опишем алгоритм для нахождения решения задач (2.44), где приближенное решение понимается в смысле (2.46). Сформулируем правила остановки для внутренних алгоритмов. Для нахождения МzU построим следующую итерационную схему Мш = Мк+РкРк, к = 0,\,..., VM0eU. (2.47)
Определим входящие в (2.47) величины: ркеЯ, \\рк\\ = \ - вектор направления спуска, удовлетворяющий условию (т (Мк),рк) 0 и шаг спуска Рк, который выбирается из условия минимума ЦМк + Д А) = min Т(Мк + РкРк). (2.48) Процедура нахождения рк реализована с помощью, так называемого, алгоритма Армийо [32] следующим образом Mk+pPkeU (2.49) Т{Мк+рРк)-ЦМк) рв(ТХМк),рк), (2.50) где 0є(О,1) - параметр метода. Для некоторого начального /? 0 в случае выполнения (2.49) и (2.50) делим его на є(0,1) - выбранный параметр (в реализованных численно алгоритмах = 0.5) до тех пор, пока для некоторого /? = рк условия (2.49) и (2.50) выполняются, а для /? +1 = д - не выполняются. Если же для р 0 условия (2.49) и (2.50) не выполняются, умножаем его на выбранный параметр є(0,1) до тех пор, пока условия (2.49) и (2.50) не выполнятся. Тогда шаг Рк 0 можно выбрать любым значением, удовлетворяющим (2.49) и условию Т(Мк+ркРк) т(мк+ркРк) (2.51) В нашем случае, при непосредственной реализации метода, берется в качестве шага сразу найденный шаг рк. Пусть рк - вектора направления спуска, а именно A-i , (2.52) где wk є Н выбирается как щ- ,wk=Pa(Mk (Mk)). (2.53)
Если положить є = 0 тогда wk=wk, и получаем метод проекции градиента, при условии, что мы имеем возможность отыскивать точку проекции на множество U. Введя еще условия для wk Mk+/3{wk-Mk)eU (2.54) при некотором Д є (0,1), и условие {Tk{Mk\wk-Mk) -\\Mk-wkf, (2.55) тогла согласно [32] можно сделать следующее утверждение: для бесконечного процесса (2.47) с описанным алгоритмом выбора шага (2.49) и (2.50), и выбором направления спуска (2.52) и (2.53) при выполнении условий (2.54) и (2.55) существует такой номер кр, что выполняются условия Мк -wk\\ - (2.56) и тогда определим элемент последовательности М для (2.44) и (2.46) в виде: М = Мк eU. (2.57)
Согласно [32], сформулируем следующее утверждение о сходимости: для итерационного процесса (2.47), при выборе шага по правилу (2.49), (2.50) и с учетом выбора элемента М по правилу (2.57), справедливо м-Мм- 0. (2.58) Другими словами, полученные описанным выше образом решения сходятся к /-нормальным решениям регуляризованной задачи (2.44) за конечное число шагов. Далее остается лишь описать правило нахождения элементов wk, входящих в (2.53), для вычисления проекции точки на множество. Для этого применим двойственный метод.
Аналитическое решение задачи для системы десятого порядка
Сведение к системе линейных уравнений, описанное в пункте 2.1, позволяет рассмотреть различные классы задач оптимального управления, для которых сформулированы необходимые условия по типу принципа максимума Понтрягина. Одним из таких интересных случаев являются постановки в условиях неопределенности, включающие развитый математический аппарат на основе сопряженных переменных [39]. Далее будет продемонстрировано, как ставятся и анализируются задачи оптимального управления для вращающихся твердых тел с жидким наполнением в случае, когда некоторые параметры точно не определены. Конкретно, будем считать, что начальное положение системы точно не известно, а задано лишь множество возможных состояний. Задача состоит в том, чтобы перевести систему в положение минимально близкое к наперед заданной точке.
Пусть движение и-мерной системы подчиняется линейному уравнению, аналогичному (2.10) x(t) = Ax(t) + BM(t), (2.71) а начальное состояние системы неизвестно заранее, и подчиняется условию х0 є л , где Х - заданное выпуклое компактное множество в I" - множество возможных начальных состояний системы. Тогда в каждый момент времени известно множество Х{г,М), te[0,T\, объединяющее все траектории, полученные при одном и том же управлении, при всевозможных векторах д:0.
Будем называть его ансамблем траекторий. Выбирая всевозможные допустимые М (/) можно управлять положением ансамбля. Пусть R- известная матрица кхп, назовем ее матрицей наблюдения (например, если к = п, R = E-может быть единичной матрицей), z(t;M,x) = Rx(t;M,xy Пусть (p[z) выпуклая, всюду конечная функция заданная на Шк, а Ф() = max{ p(z)\zeZ}.
Мы хотим привести ансамбль траекторий как можно ближе к заданному состоянию в момент времени Т. Задача формулируется следующим образом: среди допустимых управлений Л/(/)ЄС/ = Л/:Л/(/) І найти оптимальное M(t), удовлетворяющее условию минимума 0(RX(T;M))=mm{0(RX(T-,M))}, (2.72) где $?(z) - функция расстояния вида p(z) = z-j , где у - терминальная точка в которую мы стремимся перевести нашу систему. Запишем сопряженную однородную задачу к (2.71) с некоторым краевым условием 7. смысл которого будет ясен ниже s(t) = -S(t)A,s{T) = q\ (2.73) Для подынтегрального выражения из (2.76), с учетом ограничений на управление получим , (\(X + Y)s.+X4, + Ys.\)
Найдем выражение для /"(/). Согласно [39], если (z) - функция расстояния до множества, то (p(z) определяется как (p,(l) = (y,l) + S l\al[0]), где j(/cr,[0]) - индикаторная функция, определяемая как V \+оэ,1еХ; а ст,[0] - единичный шар с центром в точке 0. Пусть Х - множество следующего вида їх є Х о лг, а,,а, =0,і = 3..п) - параллелепипед, где а12 заданные заранее числа. Тогда по определению p(s(0;q)\X0) = sup{(s(0,q),x)} = Y, SUP {( .(Ы .)} = 1М и)Ы хеХ , -а, .х а І /(/) = (/)- (0 )1 ) = ( /) + (/10-,(01)-2 (0 1. Поскольку - , (0;#)а, " выпуклая функция, и сумма выпуклых функций выпуклая функция, тогда и /(/) - выпуклая, а значит /(/) = /" (/). Найдем максимум (2.75). С учетом вида /" (/) перепишем его как F{l) = -\p(-S{t;q)B(t)\U)dt-{y,l)-S(l\a +Y.\ 4H (2.78) О -12
Из определения индикаторной функции следует, что максимум (2.78) будет достигаться на множестве / 1. Аналитическое отыскание значения /, дающего максимум (2.78) весьма затруднительно, поскольку все входящие в это выражение величины зависят от параметров модели и для каждого конкретного случая получается своя функция для нахождения максимума. Численно же данная задача отыскания максимума двумерной функции решается известными оптимизационными методами [33]. Далее предлагаются варианты численно найденных значений /, при различных значениях параметров исходной системы управления (2.71), а так же параметров а, и а2, задающих неопределенность в начальном состоянии системы.
Задача о переводе системы в заданное состояние, когда начальное положение точно не определено
Решим задачу (3.8) при ограничениях на управление вида A/,(/) /?2, 1 = х,у. Будем рассматривать дискретные значения компонент управления с некоторым шагом разбиения для компонент управления Ам на всей области определения для каждой компоненты (порядка NM =2R2/AM +1 значений). Тогда получаем Л всевозможных значений вектора управлений в каждой точке /, сетки по времени t, = /Д, /,+1 = /, +/Д на отрезке [0,Т]. Введем сетку в пространстве траекторий с шагом Д,. Поскольку никаких ограничений на фазовые переменные не накладывается, можно построить множество достижимости Jfmax системы, описываемой соотношением (2.15) для каждого момента времени tt, используемого в итерационном процессе, тем самым ограничить всевозможные допустимые значения фазовых переменных. Исходя из (1.52), можно получить аппроксимацию для Хтм х1 = T JMJ(t)KIJ(tyit YJ]Klj{t)\dt = xmM О J Jo
Таким образом, для t,=T получаем Nx=2xmM/Ax+l всевозможных значений фазовой переменной.
В каждой точке сетки по фазовой переменной для каждого t, рассчитаем функцию Беллмана (3.11), начиная счет с граничного условия (3.12) (t,=T, tt=T-A, t,=T-2A,..., /,=0). Для оптимизации итерационного процесса и исключения перебора всевозможных значений фазовой переменной будем рассматривать только значения, удовлетворяющие аппроксимациям множества достижимости системы. Помимо значения функции Беллмана будем хранить еще и значения «оптимального» управления в каждой точке, удовлетворяющего (3.11). При расчете компонент оптимального управления для / шага осуществляем контроль принадлежности полученной точки Зс + (/,)М(/,)д для / +1 шага множеству достижимости, а полученное значение рассчитанной точки интерполируется ближайшим значением сетки.
В результате полного расчета (/, =0) у нас будет набор таблиц значений оптимального управления для каждой точки фазового пространства и значения функции Беллмана для каждого /,. Среди всех значений фазовой переменной при / = 0, нас буду г удовлетворять только значения лг О) = 0, соответствующие начальному условию (3.13) для нашей задачи. Обратным пересчетом по набору таблиц восстановим оптимальную траекторию в каждый момент времени, после чего получим оптимальное значение функционала исходной задачи.
Отметим, что значения функции Беллмана достаточно сохранять только для предыдущего шага по времени для расчета (3.11). Решения получаются в виде импульсной кривой с постоянными значениями на отрезке от / до / + А.
Приведем ниже найденные так решения некоторых задач оптимального управления системой с жидким наполнением методом Беллмана для случаев идеальной и вязкой жидкости. В приведенных примерах функции g и F брались следующего вида g(i)=Z( -fli)2=(a-of)2+(n,-n!)2 /=12 F{M(t)) = \\M(t%=M](t) + Ml{t).
На рис.13 и рис.14 приведено решение задачи для вязкой жидкости для случая, когда коэффициент у мал, что соответствует малой «плате» за управление в исходном функционале. Ограничения на управление R, = 1, терминальная точка 2 = Q = 1.
1. Предложена математическая модель для вращающегося твердого тела с жидким наполнением и найдена аналитическая зависимость угловой скорости возмущенного относительно стационарного вращения движения твердого тела с осесимметричной полостью, полностью заполненной идеальной или вязкой несжимаемой жидкостью, от внешнего момента.
2. Найдены эквивалентные системы дифференциальных уравнений для случаев идеальной и вязкой жидкости, которые позволяют применить аппарат Гамильтона-Понтрягина для постановки, анализа, аналитического и численного решения широкого класса задач оптимального управления твердыми телами с жидким наполнением.
3. Рассматриваются различные модели задач оптимального управления: с переключениями управлений, в условиях неопределенности, иерархические задачи распределения ресурсов, задача с интегральными ограничениями на управление и демонстрируются аналитические и численные методы их решений.
4. Для задач с терминальными функционалами был применен метод Беллмана, который использует полученную зависимость угловой скорости возмущенного движения от внешнего момента напрямую, не прибегая к сведению к системам дифференциальных уравнений. Таким же образом получены аналитические выражения для внешней аппроксимации множества достижимости системы, а также приведены примеры построения множеств достижимости.
5. Набор предложенных в диссертации алгоритмов представлен в виде комплекса программ для численного решения рассматриваемых задач.
Следующим теоретическим шагом могло бы быть усложнение самой модели. Это - рассмотрение жидкости со свободной поверхностью, равномерный нагрев жидкости, случай переменной плотности, изменение ее объема в полости и т.д. С практической точки зрения интересно было бы рассмотреть реальные динамические системы с жидким наполнением, для которых использовать разработанные подходы управления.