Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Приближенная оптимизация управления на основе магистральных решений Гусева Ирина Сергеевна

Приближенная оптимизация управления на основе магистральных решений
<
Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений Приближенная оптимизация управления на основе магистральных решений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гусева Ирина Сергеевна. Приближенная оптимизация управления на основе магистральных решений: диссертация ... кандидата физико-математических наук: 05.13.01 / Гусева Ирина Сергеевна;[Место защиты: Институт системного анализа РАН].- Москва, 2015.- 104 с.

Содержание к диссертации

Введение

ГЛАВА 1. Основные преобразования и общая схема приближенного исследования на их основе 16

1.1. Преобразование дифференциальной системы общего вида к системам с линейными управлениями 16

1.2. Преобразование систем с линейными управлениями к производным системам. Поиск магистральных решений 22

1.3. Общая схема приближенного исследования исходной задачи 28

ГЛАВА 2. Реализация этапов общей схемы 30

2.1. Построение оценок границ допустимой области 30

2.2. Алгоритмы представления аффинной оболочки 32

2.3. Поиск идеального магистрального решения и его аппроксимация допустимыми 34

2.4. Исследование задачи Фуллера третьего порядка 39

2.5. Итерационное улучшение приближенного магистрального решения

2.5.1. Метод глобального улучшения Кротова 42

2.5.2. Вычислительные эксперименты 44

2.5.3. Модификация метода глобального улучшения с применением-ослабленной системы 50

ГЛАВА 3. Прикладные задачи 52

3.1. Оптимизация процесса передачи возбуждения в спиновой цепочке 52

3.1.1. Постановка задачи 52

3.1.2. Метод решения 53

3.1.3. Вычислительные эксперименты

3.2. Эколого-экономические задачи 63

3.2.1. Модель региона 64

3.2.2. Оптимизация экономического роста 65

3.2.3. Алгоритмы аппроксимации 68

3.2.4. Нормативный подход к оценке инновационных затрат 72

3.2.5. Оптимизация стратегии устойчивого развития региона 78

Заключение 84

Список литературы

Преобразование систем с линейными управлениями к производным системам. Поиск магистральных решений

Если исключить уравнение (1.12), получим непосредственно производную систему. Очевидно, множество решений производной системы получается шире, чем исходной, т.е. любое решение исходной системы (кусочно-гладкое) x{t) удовлетворяет производной, но не наоборот, причем производная система допускает разрывы траектории, как на границах временного интервала, так и внутри него, реализуемые скачком во времени.

Однако, в случае неограниченного управления w исходная и производная системы эквивалентны, в том смысле, что любая траектория производной системы в пространстве (t, х) может быть аппроксимирована последовательностью траекторий xs(t) исходной системы с любой степенью точности при достаточно большом управлении w [32,41]. В представлении (1.11) разрывным оказывается только функция z(t), которая играет роль управления. Эта функция аппроксимируется последовательностью кусочно-гладких функций zs(t) с растущими производными zs в окрестностях точек разрыва. В окрестностях точек разрыва управление w находится из условия выполнения исходной дифференциальной связи: Как видно, эта задача имеет порядок (п — к) ив этом смысле проще исходной. В ряде задач инвариант предельной системы удобно задавать в параметрическом виде [59]. Формально такое представление получается, если присоединить к системе (1.6) уравнения dz/dr = w. Такое представление симметрично, однако оно не дает эффекта понижения порядка, хотя и приводит к регуляризации вырожденных задач.

Траектория решения производной задачи, называемого идеальным магистральным, кусочно-непрерывна в пространстве (t,x) [26]. В [41] показано, что если множество W не ограничено и предельная система вполне управляема на инварианте, то она может быть аппроксимирована траекториями исходной системы (1.6) с любой точностью при достаточно большом управлении w. В работе [32] доказана соответствующая теорема.

Как видно, производная задача аналогична исходной и может быть преобразована также к производной задаче следующей ступени и т.д., т.е. такое преобразование рекурсивно, что позволяет многократно понижать порядок производной системы.

Поскольку в этом представлении дискретная система верхнего уровня не содержит линейных управлений, то производная система для нее не записывается, а на каждом интервале постоянства q Є \tq tq+\) производная система на нижнем уровне имеет свое магистральное решение, которое может быть аппроксимировано траекториями исходной системы по схеме, предложенной в теореме 1.1. Такая дискретно-непрерывная модель аппроксимирует с любой точностью непрерывную дифференциальную систему, называемую сопровождающей [31], которая также ведет к идеальному решению:

При ограниченных управлениях магистральные решения аппроксимируются решениями исходной задачи (рассматривается в Главе 2), как и в предыдущем случае, но не с любой точностью (эта точность может быть ограничена). Для улучшения построенного приближенного магистрального решения строится внешняя оценка допустимой области достижимости [19,41]. Это позволяет косвенно учесть отброшенные ограничения на линейные управления при поиске идеального магистрального решения путем их замены подходящими фазовыми ограничениями.

Для заданного отрезка времени эта задача невырожденная, т.е. имеет допустимое решение, хотя найти его непросто, поскольку оно содержится, как нетрудно проверить, в континуальном множестве экстремалей Понтрягина, в связи с тем, что эта задача в целом не выпукла и содержит линейное управление w . Действительно, выпишем условия принципа максимума Понтрягина: при указанных выше граничных условиях. Снимем ограничения на управления wl} w2. Множество скоростей расширяется до всей плоскости. Ему соответствует также вся плоскость (ж1, х2) в качестве интегрального многообразия. Т.е. производная задача — это задача о минимуме / = х1{2ті) без дифференциальных связей. При построенных границах множества достижимости решением служит, например, (x2)u(t), wl{t) = 1, w2 = ±1, которая при

Граница для ж2() строится аналогично предыдущему примеру, а решением служит пара xf(t)} w (t) = 0, которая, в отличие от примера 1.2, исходным связям не удовлетворяет. В качестве начального приближения управления в исходной задаче можно взять u(t) = 0, либо и = xf(t). При u(t) = 0 значение / меньше, так что целесообразно выбрать u{t) = 0, что в данном случае

Общая схема приближенного исследования исходной задачи

В результате получается парат11 (t) = (х11 (t), и11 (t) = u(t,xll(t))), такая что I{mll{t)) I{ml{t)). Эта процедура генерирует итерационный процесс и соответствующую улучшающую последовательность элементов {ms} Є D, сходящуюся по функционалу, если он ограничен снизу.

Для линейных относительно переменных состояния задач коэффициенты которых получаются подстановкой этого выражения в (2.13). В общем случае нелинейных систем операторы улучшения могут строиться путем задания функции р в форме многомерных степенных полиномов и такой же полиномиальной аппроксимации в заданной области соотношений (2.13) на некоторой сетке узлов в окрестности текущего приближения. Размеры окрестности могут регулироваться по принципу локализации во взаимосвязи с порядком аппроксимирующих полиномов. Это дает возможность строить разнообразные итерационные процедуры различных порядков, в том числе — многометодные [15,107], с учетом специфики конкретных задач и с ориентацией на параллельные вычисления.

Была проведена серия вычислительных экспериментов с алгоритмами первого и второго порядка без локализации, реализующими метод глобального улучшения с целью изучения возможности улучшения неподвижных эле 45 ментов, каковыми являются процессы, удовлетворяющие уравнениям принципа максимума Понтрягина (ПМП). В качестве тестов рассматривались следующие 4 задачи. При ф = О управление, максимизирующее Н, неединственно (особый режим). При этом из условия ф2 = 0 получаем sin ж2 = 0. Эта задача — простая модификация задачи, рассмотренной в примере 1.2 и, как нетрудно видеть, условиям ПМП удовлетворяет континуальное семейство решений, в частности решений типа 3 на рисунке 3.10 соответственно точкам схода с особого режима х = 7Г в диапазоне [0,7г], и такое же множество симметричных им решений соответственно точкам схода с особого режима х2 = —тт.

Два симметричных решения типа 2 — оптимальные. Это выясняется непосредственно из решения производной задачи, которая в данном случае получается исключением уравнения х2 = и. В этой задаче х2 играет роль управления, при дополнительных ограничениях ж2 Є [—,], которые представляют собой границы решений уравнения х2 = и при и Є [—1, 1]. Рассматривались по 2-3 варианта, один из которых оптимальный (обозначим его номером 1, другие (с номерами 2, 3) — не оптимальные). Соответственно этим вариантам проводилась серия экспериментов.

Все варианты — неподвижные элементы для алгоритма 1-го порядка и непосредственно им не улучшаются. Однако представляет интерес возможность улучшения небольших возмущений неподвижных элементов, на что и нацелена вся серия. Поскольку оптимальные элементы заведомо неулуч-шаемы, эксперименты с ними проводились лишь для проверки алгоритмов, и их результаты не приводятся. Каждому эксперименту был присвоен свой шифр: [номер задачи][номер варианта][номер алгоритма]. В ячейках таблицы 2.2 указано число итераций в каждом из экспериментов.

Приведенные результаты показывают, что рассматриваемые алгоритмы улучшают возмущенный оптимальный режим до ближайшего оптимального, обеспечивают улучшение возмущенных неоптимальных неподвижных элементов. В ВЭ 1.1.1 управление, по крайней мере, на конечных итерациях получалось в виде скользящего режима, интегрально эквивалентного исход 2 w «чш т 1 \ 1 8\ 10 l2

Для рассматриваемого алгоритма глобального улучшения и его модификаций любая экстремаль Понтрягина (решение уравнений ПМП) является неподвижным элементом соответствующего оператора улучшения. Однако неподвижность элемента не означает, что он не улучшаем тем же самым итерационным алгоритмом. Как показывает обширная вычислительная практи 50 ка и наглядно демонстрируют проведенные вычислительные эксперименты, малое возмущение не оптимального (хотя бы локально) неподвижного элемента активизирует итерационный процесс улучшения вплоть до достижения глобального оптимума. С другой стороны, попытка улучшить оптимальный элемент за счет его малого возмущения возвращает к исходному. Иными словами, оптимальность в терминах алгоритмов улучшения непосредственно связана с устойчивостью итерационного процесса. Это относится и к таким специфическим неподвижным элементам как особые режимы экстремалей Понтрягина, где соответствующее управление в результате операции улучшения определяется неоднозначно.

Модификация метода глобального улучшения с применением ослабленной системы

Как отмечалось в [29], для нелинейных относительно управлений моделей применение операции овыпукления множества скоростей позволяет расширить — подчас весьма существенно — область поиска улучшенных режимов управления и направлений улучшения и в приложении к тому или иному методу улучшения создает потенциальную возможность повысить его эффективность. Это обстоятельство мотивирует следующую модификацию представленного выше метода глобального, вполне естественную в контексте данной работы, где с самого начала рассматривается система (1.6) с овыпук-ленным множеством скоростей, эквивалентная исходной. Укажем изменения в описанном выше алгоритме, связанные с этой модификацией:

Рассматривается задача оптимизации процессов в спиновой цепочке, описываемых уравнением Шредингера, гамильтониан которого содержит два управления и линейно зависят от одного из них. Квантовые системы такого рода [76, 78] в случае одного управления успешно исследовались с помощью нелокального итерационного метода В.Ф. Кротова [6,77]. Применяется описанный в предыдущих главах подход и в случае двух управлений [128]. Процедура преобразования при этом усложняется, однако, остается аналитической и приводит к регулярной для рассматриваемого метода Кротова задаче, линейной относительно состояния с управляемыми коэффициентами. Постановка задачи и последующее преобразование к производной задаче выполняется в комплексных переменных, в которых традиционно записывается уравнение Шредингера, что делает его компактным и наглядным и в целом отвечает традициям математической физики квантовых систем. Переход к действительным переменным производится на этапе реализации итерационных процедур в вычислительных экспериментах.

Исследование задачи Фуллера третьего порядка

Далее за счет введения упрощающих, но достаточно естественных допущений, находится магистральное решение. Задача решается в два этапа: 1) фиксируется 9{tp) = 9р и находится решение при этом условии; 2) 9р варьируется и получается окончательное решение. Для решения задачи на первом этапе ищется магистраль (магистральное решение), при этом предполагается неограниченность управлений и им", а имеющиеся ограничения учитываются косвенно путем построения верхней {)и и нижней ()/ границ для к и 9, как решений уравнений относительно этих переменных из (3.13) при и = 0ии" = 0с соответствующими граничными условиями (рис. 3.6).

Полученная магистраль, очевидно, разрывна в граничных точках и может быть реализована практически при достаточно больших управляющих воздействиях. Для реализации данной магистрали второго порядка в исходной задаче (3.13) предлагается следующая процедура аппроксимации.

Подставляя найденные значения управления-и в систему (3.14) находим одноиндексную последовательность Tg{t) = {vg(t), 9g{t), Zg(t)} и соответствующее значение функционала Ig = —Zs{tp) Расчеты проводились для условного региона (таблица 3.2), прототипом которого служит Байкальский регион по состоянию на 2010 год. На рисунках 3.8-3.9 представлен один из членов последовательности для каждого из алгоритмов. В таблице 3.3 приведены значения функционала благосостояния для каждого алгоритма (q(s) — максимальное значение управления, необходимое для выхода на магистраль при заданном s). Значение функционала благосостояния при магистральном решении — 570.5 (млдр.руб.). При одном и том же времени выхода на магистраль первый алгоритм дает более точную аппроксимацию, но с большим числом переключений управления. б)

Инновационная деятельность является важнейшим фактором развития, который должен находить отражение во всех расчетах, связанных со стратегическим планированием. Однако по имеющейся официальной статистике практически невозможно оценивать инновационные процессы в регионе в терминах «затраты-результаты», что необходимо для подобных расчетов. Отсутствие в типичных официальных документах, отражающих инновационную деятельность в том или ином регионе РФ отчетов предприятий о проведенных инновационных мероприятиях затрудняет стратегическое планирование развития даже в чисто экономическом плане, не говоря уже об устойчивом развитии с обоснованным учетом экологических и социальных факторов. В данном разделе описан нормативный подход к этой проблеме с использованием концептуальной модели региона [28, 96]. Он состоит в том, что по имеющимся надежным эмпирическим оценкам одних параметров и балансовым и оптимизационным соотношениям модели получить оценки предельных значений других параметров.

Здесь смысл коэффициента Н, отражающего влияние инвестиций, связанных с расширением производства, легко выясняется, если положить v = 0. Это процентное изменение в среднем рассматриваемой группы параметров при изменении основных фондов на 1%. Аналогично выясняется смысл величины v как скорости процентного изменения рассматриваемой группы параметров при отсутствии инвестиций и затем — параметра А как затрат на 1% инновационных изменений, приходящихся на единицу основных фондов. Предполагается, что g(k,L ) — классическая вогнутая производственная функция, где L — население (трудовые ресурсы, от которых фактически зависит мощность, пропорциональны населению), а коэффициент прямых затрат А может быть снижен за счет инноваций (роста 9) вместе с другим важным параметром — коэффициентом С, т.е. будем эти коэффициенты рассматривать как функции А(9) и С(9) с указанными свойствами. Учитывается удорожание инвестиций с ростом их «инновационности» посредством возрастающей зависимости В(Н). Остальные коэффициенты для простоты принимаются константами.

Предполагается также, что природо-восстановительная и текущая инновационная деятельность ведется на существующих мощностях и требует лишь дополнительных текущих затрат. При этом переменные у, и, z и v рассматриваются как управления, подчиненные ограничениям ; О, г О, 0 у д(к, L ), v 0. (3.16) В качестве критерия оптимальности рассматривается функционал (3.12) при равенстве нулю коэффициента дисконтирования р = 0. Величина штрафа характеризует предпочтения в критерии благосостояния.

Магистральное решение находится, как простое, идеализированное при указанных предположениях, а затем исследуется в вычислительных экспериментах. Приведем кратко процедуру его нахождения.

Для удобства в заменяется новой переменной 7 = Н\пк + \п\6 — 6\, что позволяет упростить связь (3.15): с теорией вырожденных задач [19] управления и, z принимаются неограниченными и производится двукратный переход к эквивалентной производной задаче первого порядка о максимуме функционала П с использованием преобразований х = П + p(Azr + Вк), = х — pAvko f. Функционал максимизируется вначале при любых фиксированных граничных значениях кр, Тр, и jp, а затем дополнительно максимизируется по этим значениям.

Эколого-экономические задачи

Более детально рассматривается модель (3.11) на одном из допустимых вариантов решений задачи пункта 3.2.4. с учетом реалистических ограничений модели. Из методических соображений предполагаем, что инновационным изменениям подвергаются лишь элементы матриц А и С (которые и по содержанию — наиболее существенные параметры). Они рассматриваются как функции в (см. (3.18)). Остальные параметры считаются константами. Восстановительный и инновационный секторы работают с полным использованием мощностей, которые принимаются линейно зависящими от основных фондов: Tz = zkz, Tv = къ . Мощности производственных отраслей (производственные функции) Тг{кг) считаются вогнутыми функциями. Темп дисконтирования р полагается нулевым. Ограничения наг учитываются косвенно посредством штрафов. Население и трудовые ресурсы по отраслям принимаются постоянными. Выпуски и основные фонды отраслей ограничены снизу из условий минимальной занятости населения. Матрицы D, Dz принимаются нулевыми.

Аналогично разделу 3.2.2., задача решается в два этапа. На первом этапе применяется метод кратных максимумов, при котором управления u, uz и ии предполагаются неограниченными, для компонентов к, kz, kv имеются нижние границы ()/, а верхнюю (-)м и нижнюю ()/ границы Q3 строятся как решения уравнений относительно этих переменных из (3.11) приг»-7 = 3Щ3 с условиями на левом и правом концах. где Q(9i(t)) — значение интеграла в выражении при найденных оптимальных значениях переменных. Значения kF, kF, и kF принимаются равными значениям на последней магистрали. Результат минимизируется по 9F, что даст окончательное магистральное решение. Данная конструкция функции Кротова соответствует двукратному пере 80 ходу от исходной задачи к производной: вначале получается первая производная задача, где роль управлений наряду с исходными играют к, kz и kv, затем делается переход к следующей производной задаче, путем перехода к единственной фазовой переменной С = П +р{Вк + Bzkz + Bvkv) - // \nf{9 -0) + if г, где // = p(AV/yv + 5VBV). Это задача первого порядка для уравнения ( = г/(б , г) = к{6)у - рВбк - S{r) + f (f + N{r - г) + imr - exr) (3.20) с функционалом I = —((tp) — inf при начальном условии С(0) = Со = Р(В0 + Bzkz0 + Bvkv0) - fiv \п (Оо -в)+ r]zr0 и при указанных выше ограничениях на остальные переменные.

Минимизация этого функционала сводится к максимизации правой части уравнения (3.20), которая совпадает с выражением функции R и дает уже най-денное разрывное магистральное решение (второй ступени). Его траектория, как видно, разрывна в начальный момент и в точках переключения компонент к, внутри промежутка (0,р), т.е. представляет собой чередование нескольких непрерывных магистралей.

Для аппроксимации магистрального решения в исходном классе допустимых процессов применяется алгоритм с минимальным числом переключений исходных управлений раздела 3.2.3. Расчеты проводились для условного региона (таблица 3.2), причем штрафной коэффициент s принимался равным 10000, коэффициенты функции Кобба-Дугласа а и (3 равными 0.5 и 10 соответственно, параметры Av = 200 и Н = 0.01. Параметр В принимается постоянным и равным Во. На рисунках 3.13-3.15 представлены магистральное решение и один из членов аппроксимирующей последовательности. При магистральном решении получено значение функционала благосостояния Ир = 7485, а при аппроксимации — Пр = 7154 (млрд.руб.). Видно, что управление, реализующее это решение, носит сложный переключательный характер даже при минимально возможном для данной реализации числе точек переключения. Это обусловлено, во-первых, наличием двух магистральных участков (соответствующих нижней границы к и его стационарному оптимуму), а во-вторых, более сложной реализацией магистрали второй ступени по сравнению с [111].

Решение в целом с учетом граничных условий оказывается разрывным: переходы между граничными точками и магистралью и между магистралями происходят «скачком». Каждый скачок реализуется последовательностью кусочно-гладких траекторий при неограниченно возрастающих управлениях в окрестностях точек разрыва, а практически — при достаточно больших управляющих воздействиях. Магистральное решение задачи устойчивого социо-эколого-экономического развития региона находится из достаточно простых соотношений и позволяет получить практически значимые выводы, поскольку исходные идеализирующие допущения достаточно хорошо отражает реальную ситуацию. В частности ему соответствует важный критерий устой 160 140 чивости развития региональной системы, который включает не только экономические, но и экологические и социальные параметры. В отличие от критерия, полученного в [111], где восстановительные и инновационные мощности принимались неограниченными, а учитывались только затраты на текущее функционирование соответствующих секторов, здесь, как видно, он включает и инвестиционные параметры, а именно, коэффициенты фондообразующих затрат Bz и Bv.

При ограниченных инвестициях как управляющих воздействиях магистральный характер решения сохраняется, но оно становится приближенным и в дальнейшем может быть использовано в качестве эффективного началь 83 ного приближения в итерационной процедуре улучшения [43] для полной модели. Однако при этом переключения компонент не будут синхронизированы, и число точек переключения (в общем случае 2п, где п — размерность вектора к) может быть достаточно большим. В таком случае для повышения эффективности итераций улучшаемый процесс целесообразно рассматривать как дискретно-непрерывный, где дискретными шагами служат моменты переключений, и применять соответствующие алгоритмы улучшения аналогично тому, как это делалось при практической реализации скользящих режимов [45].

Эти аппроксимации далее улучшались в универсальной итерационной процедуре, реализованной в СН—Ь со специальным пользовательским интерфейсом для социо-эколого-экономической модели [42]. Программный комплекс, разработанные в MAPLE, обеспечивает информационный обмен с с комплексом [42]. Результатами служат улучшенные режимы для более полной многокомпонентной модели, которая здесь не приводится из-за громоздкости, использованы в заключительной части итогового отчета по проекту РГНФ № 11-02-00-171-а «Системный анализ устойчивого развития регионов на примере Бурятской части Байкальского региона».

Похожие диссертации на Приближенная оптимизация управления на основе магистральных решений