Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Исмагилов Нияз Салаватович

Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем
<
Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Исмагилов Нияз Салаватович. Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем: диссертация ... кандидата физико-математических наук: 05.13.18 / Исмагилов Нияз Салаватович;[Место защиты: Уфимский государственный авиационный технический университет].- Уфа, 2014.- 135 с.

Содержание к диссертации

Введение

1 Постановка задачи 26

1.1 Общая постановка задачи 26

1.2 Модель управления намоткой провода при случайных возмущениях коэффициента трения 29

1.3 Оптимизация расходов при планировании производства 31

1.4 Модель оптимизации инвестирования и потребления на рынке с одним рискованным активом 34

2 Разработка аналитических методов исследования 37

2.1 Необходимые сведения 37

2.1.1 Некоторые сведения из стохастического анализа 37

2.1.2 Симметричный интеграл и дифференциальные уравнения с симметричным интегралом 41

2.1.3 О детерминированной задаче оптимального управления 42

2.1.4 О детерминированной задаче оптимального импульсного управления 49

2.2 Потраекторно-детерминированный подход к исследованию сто хастических моделей управляемых систем с управляемым сносом 52

2.2.1 Сведение стохастической задачи к классической детерминированной задаче оптимального управления 53

2.2.2 Модификация детерминированной задачи и неупрежда-емость решений 58

2.2.3 Некоторые обобщения 60

2.2.4 О стохастическом подходе к задачам с потраекторным дифференциальным ограничением 68

2.3 Потраекторно-детерминированный подход к исследованию сто хастических моделей с управляемой диффузией 73

2.3.1 Сведение стохастической задачи к потраекторно-детерминированной задаче оптимального импульсного управления 75

2.3.2 Модификация детерминированной задачи и неупрежда-емость решений 80

2.3.3 Обобщение результатов 86

3 Численно-аналитическое решение и моделирование тестовых примеров 95

3.1 Моделирование траекторий винеровского процесса 95

3.2 Численно-аналитическое решение задачи моделирования управления намоткой провода 96

3.3 Численно-аналитическое решение задачи моделирования планирования производства 104

3.4 Численно-аналитическое решение задачи моделирования оптимального инвестирования и потребления 109

Заключение 114

Список литературы 117

Приложение. Листинги программ 127

Введение к работе

Актуальность темы исследования

В различных сферах человеческой деятельности встречаются физические, химические, биологические, экономические и иные системы, состояние которых изменяется со временем. При моделировании таких систем, для описания динамики изменения состояния применяют дифференциальные уравнения. Существует класс систем, которые могут быть подвержены управляемому внешнему воздействию, изменяющему состояние системы и характер ее эволюции. Наличие возможности воздействия порождает естественную задачу выбора такого воздействия, которое бы давало наилучший в каком-либо смысле результат. Иными словами, возникает задача оптимального управления.

Обычно в роли уравнений, задающих динамику изменения состояния системы, выступают обыкновенные дифференциальные уравнения, которые могут описать гладкое, либо кусочно-гладкое движение. В реальности, однако, часто встречаются системы, динамика эволюции которых зависит от случайных факторов и носит негладкий характер, поэтому плохо поддается описанию обыкновенными дифференциальными уравнениями, либо не поддается таковому вообще. В большинстве случаев зависимость от случайных факторов носит характер «шума» и такие системы могут быть описаны стохастическими дифференциальными уравнениями.

Для исследования стохастических моделей оптимально управляемых систем наиболее широко используют стохастические версии принципа максимума Понтрягина и метода динамического программирования Беллмана. Стохастический метод динамического программирования появился несколько раньше и был развит в работах Беллмана, Крылова, H.J. Kushner, W.H. Fleming и R.W. Rishel. К ранним результатам по переносу принципа максимума на стохастические задачи относятся работы В.И. Аркина и И.В. Евстигнеева, В.И. Аркина и М.Т. Сак-сонова, H.J. Kushner, A. Bensoussan, U.G. Haussmann, которые были развиты в работах S. Peng, X. Y. Zhou, A. Cadenillas и I. Karatzas и других исследователей. Оба упомянутых метода, обладая рядом достоинств, имеют свои недостатки и зачастую оказываются намного сложнее в применении по сравнению со своими детерминированными аналогами.

Однако, существует еще один, к настоящему моменту мало изученный подход к исследованию стохастических моделей управляемых систем. Основной идеей этого подхода является сведение стохастической моделей к потраекторно-детерминированным моделям управляемых систем. По всей видимости впервые данный подход был представлен в работе R. J. B. Wets, в которой исследовалась взаимосвязь между детерминированной и стохастической задачами оптимизации. В дальнейшем этот подход был развит работе R. T. Rockafellar и R. J. B. Wets

и несколько позже в работах M. H. A. Davis, M. H. A. Davis и G. Burstein. Несмотря на все достоинства метода, изложенного в работе M. H. A. Davis и G. Burstein, применение этого метода вызывает некоторые сложности. Связано это в основном с тем, что при переходе к детерминированным моделям обыкновенное дифференциальное уравнение, описывающее динамику системы, имеет сложную структуру, что приводят к довольно трудоемким вычислениям и сильным ограничениям.

В настоящее время существуют формулы для явного представления решения стохастических дифференциальных уравнений. Одна из таких формул, разработанная Ф.С. Насыровым, предоставляет структуру решения и позволяет провести простое разложение решения на суперпозицию двух функций. Такое разложение дает возможность свести стохастические модели к детерминированным, которые имеют намного более простую структуру, чем предложенные ранее.

Другим преимуществом разложения решения является относительная простота моделирования решений стохастических дифференциальных уравнений, которая обусловлена отсутствием необходимости численного решения стохастических дифференциальных уравнений.

Проблемам численного интегрирования стохастических дифференциальных уравнений и задачам моделирования решений стохастических дифференциальных уравнений посвящены работы Д.Ф. Кузнецова, Г.Н. Мильштейна, P.E. Kloeden, E. Platen и других исследователей. Однако, многие вопросы численного моделирования таких уравнений до сих пор остаются открытыми.

Таким образом, приведенные выше доводы позволяют судить о необходимости и возможности разработки новых методов исследования и моделирования оптимальных траекторий стохастических моделей управляемых систем, а также методов численно-аналитического построения решений управляемых стохастических дифференциальных уравнений.

Степень ее разработанности

Потраекторно-детерминированный подход к исследованию моделей стохастических управляемых систем был проработан в некоторой степени только для моделей с управляемым сносом. Применение разработанных ранее методов на практике вызывало определенные сложности. В данной работе рассмотрены потраекторно-детерминированные методы исследования моделей, которые имеют управляемый снос и управляемую диффузию.

Цель работы

Целью настоящей работы является разработка методов моделирования и исследования оптимальных траекторий стохастических управляемых систем,

динамика которых описываются одномерными стохастическими дифференциальными уравнениями.

Поставленная цель достигается в результате решения следующих задач:

1. Выявление структуры решения для одномерных стохастических
дифференциальных уравнений с управлением, воздействующим только на
коэффициент сноса, и разработка нового аналитического потраекторно-
детерминированного метода исследования стохастических моделей управления
динамическими системами, основанного на этом разложении.

  1. Разработка метода, позволяющего свести нелинейные стохастические модели к линейным и выявление класса управляемых моделей, для которых такое сведение осуществимо.

  2. Выявление структуры решения для одномерных стохастических дифференциальных уравнений с управлением, которое, кроме коэффициента сноса, также оказывает линейное воздействие на диффузию. Разработка нового аналитического потраекторно-детерминированного метода исследования стохастических моделей управления динамическими системами, основанного на этом разложении.

  3. Разработка численно-аналитического способа построения оптимальных траекторий и моделирования в стохастических моделях управления системами, которые описываются одномерными стохастическими дифференциальными уравнениями.

Научная новизна

  1. Разработан новый аналитический метод исследования одномерных стохастических моделей с управляемым коэффициентом сноса, основанный на построении эквивалентной потраекторно-детерминированной модели. Представлен метод модификации потраекторно-детерминированной модели, который гарантирует неупреждаемость оптимальных траекторий.

  2. Представлен новый аналитический метод, позволяющий свести нелинейные стохастические модели к линейным моделям в некотором классе одномерных стохастических управляемых систем.

  3. Разработан новый аналитический метод исследования одномерных стохастических моделей систем с управляемым сносом и диффузией, основанный на построении эквивалентной потраекторно-детерминированной модели импульсной системы. Предложен метод модификации потраекторно-детерминированной модели, который гарантирует неупреждаемость оптимальных траекторий.

  4. Представлен новый численно-аналитический способ построения решений и моделирования процессов оптимального управления, в которых динамика процесса описывается одномерным стохастическим дифференциальным уравнением.

Теоретическая и практическая значимость

Представленная в работе структура решений фазовых траекторий стохастических моделей управляемых систем позволяет избавиться от необходимости вычислять стохастические интегралы и строить численные решения стохастических дифференциальных уравнений, тем самым упростить моделирование.

Возможность исследования детерминированных моделей управляемых систем вместо стохастических моделей существенно упрощает задачу оптимизации в моделируемых системах, так как детерминированные модели имеют более развитый набор методов построения оптимальных траекторий.

Возможность сведения нелинейных стохастических моделей к линейным или, как частный случай, к линейно-квадратичным, а также выделение класса управляемых моделей, для которых это осуществимо, позволяет упростить исследование таких моделей.

Методология и методы исследования

Аналитические исследования проводились с использованием методов теории случайных процессов, обыкновенных дифференциальных уравнений, теорий стохастического и детерминированного оптимального управления, теории функций действительной переменной, функционального анализа и вычислительной математики. Для реализации программного комплекса, производящего численный расчет траекторий моделируемых процессов, использовался пакет Matlab.

Положения, выносимые на защиту

  1. Новый аналитический потраекторно-детерминированный метод исследования стохастических моделей одномерных динамических управляемых систем, основанный на выявленной структуре решения стохастических дифференциальных уравнений, в которых управление воздействует только на коэффициент сноса.

  2. Новый аналитический метод, позволяющий свести нелинейные модели к линейным в некотором классе стохастических моделей управляемых систем.

  3. Новый аналитический потраекторно-детерминированный метод исследования стохастических моделей одномерных динамических управляемых систем, основанный на выявленной структуре решения стохастических дифференциальных уравнений с управлением, которое, кроме коэффициента сноса, также оказывает линейное воздействие на коэффициент диффузии.

  4. Численно-аналитический способ моделирования и построения оптимальных траекторий в стохастических моделях, которые описываются одномерными стохастическими дифференциальными уравнениями с управляемым сносом и линейно управляемой диффузией.

Степень достоверности и апробация результатов

Основные результаты диссертации были представлены и обсуждались на научных семинарах и конференциях, соответствующих профилю диссертации. В частности, были сделаны доклады:

  1. на международных конференциях студентов, аспирантов и молодых ученых «Ломоносов» (г. Москва, 2008, 2010, 2011, 2013 гг.);

  2. на Большом семинаре кафедры теории вероятностей МГУ, руководитель — академик РАН, профессор Ширяев А. Н. (г. Москва, 2012, 2014 гг.);

  3. на III Международной конференции «Оптимизация и приложения» (ОПТИМА-2012) (Кошта-да-Капарика, Португалия, 2012 г.);

  4. на семинаре в Институте математики с ВЦ УНЦ РАН, руководитель — профессор Жибер А. В. (г. Уфа, 2014 г.);

  5. на семинарах по теории вероятностей и случайным процессам кафедры математики УГАТУ, руководитель — профессор Насыров Ф.С. (г. Уфа, 2008–2014 гг.).

Публикации

Основные результаты диссертации опубликованы в работах [1]–[12], в том числе 2 публикации в изданиях, рекомендованных ВАК, и 10 публикаций в других изданиях.

Структура и объем работы

Диссертация состоит из введения, 3 глав, разбитых на параграфы, 12 рисунков, заключения, библиографического списка литературы, включающего 78 работ отечественных и зарубежных авторов, 1 приложения. Общий объем работы составляет 135 страницы.

Модель управления намоткой провода при случайных возмущениях коэффициента трения

Рассматривается механизм намотки провода на катушку [4, 20], изображенный на рисунке 1. Электродвигатель вращает катушку, на которую наматывается провод. Во избежание обрывов провода

Механизм для намотки провода вую скорость uj{t) так, чтобы или его провисания скорость намотки должна поддерживаться постоянной. Во время намотки диаметр катушки увеличивается, что приводит к увеличению момента инерции катушки g{t). Для поддержания постоянной линейной скорости намотки v{t) = Vo необходимо во время намотки уменьшать угло r{t)uj{t) = v(t) = VQ.

В уравнении (19) использованы обозначения: U(t) — напряжение на входе электродвигателя; к — коэффициент пропорциональности между вращающим моментом двигателя и его входным напряжением; ф — коэффициент трения вращения. Управлением в данном случае является U(t), а регулируемой величиной — oj(t), которую необходимо менять так, чтобы выполнялось условие (18).

Найдем зависимость r{t) и g(t) от времени при постоянной скорости намотки VQ. За время t\, необходимое для намотки одного ряда провода, радиус изменится от Го до r{t\) так, что где к — некоторый коэффициент, характеризующий привод. Из равенства (20) при t\ « 1 получаем

Так как для круга радиуса R момент инерции пропорционален Л4, то

Номинальное значение uon{t) для угловой скорости определяется выражением un(t) = Vor l(t), а номинальное управляющее напряжение Un(t) есть

Величины ujn{t) и Un{t) принято называть невозмущенным решением. Для возмущенных значений соответствующих переменных получаем уравнение

В реальных ситуациях ряд величин, входящих в постановку задачи, изменяются случайным образом. Рассмотрим ситуацию, когда случайным флукту-ациям подвержен коэффициент трения вращения ф. При этом предполагается, что коэффициент трения имеет вид ф — aWf. Здесь о" — заданная константа, a Wt — белый шум, формальная производная стандартного винеровского процесса. Тогда получаем стохастическую задачу управления процессом

Критерий качества, подлежащий минимизации, имеет вид где p — положительная константа. Первое слагаемое в интеграле (24) пропорционально кинетической энергии вращающейся катушки, а второе — электрической энергии, расходуемой электродвигателем.

Многие предприятия используют системы производство-хранение для управления колебанием потребительского спроса. Такая система состоит из завода изготовителя и склада для хранения произведенной продукции, которая не была немедленно реализована. Как только продукция попадает на склад, она накладывает на производителя два вида потерь: во-первых, это стоимость физического хранения продукции, во-вторых, это издержки, связанные с невозможностью инвестировать деньги, хранящиеся на складе в виде продукции. С другой стороны, хранящийся на складе запас позволяет немедленно реализовать продукцию при повышении спроса. Кроме того, накопление продукции на складе позволяет иметь менее крупное производство, накапливая продукцию во время спада спроса для возможности реализации продукции в момент повышения спроса. Задача оптимизации состоит в том, чтобы найти баланс между стоимостью хранения и стоимостью производства. Впервые детерминированная задача управления производством была сформулирована в работах [60] в 1955 г. и [48] в 1960 г. для задач с дискретным и непрерывным временем соответственно. В дальнейшем были исследованы различные стохастические и детерминированные модели с дискретным и непрерывным временем. Среди них отметим работу [74], в которой исследуется задача с квадратичным функционалом качества, характеризующим потери, вызванные отклонением уровня производства и хранимой продукции от оптимального значения. Задача решена для конечного и бесконечного промежутков времени. Стохастическая модель рассмотрена в работах [71, 70], в которых получены решения для задач на конечном и бесконечном промежутках времени без ограничения на управление и фазовую координату. В работе [34] решена задача на бесконечном промежутке времени с ограничениями на фазовую координату. В работах [44, 29] были исследованы также стохастические модели, содержащие в себе различные дискретные события, такие как, например, поломка станков, резкое изменение уровня спроса.

В настоящей работе исследуется модель, представленная в [70]. Рассматривается предприятие, производящее большие объемы одного вида продукции, которая может накапливаться на складе. Определим величины:

В приведенных выше обозначениях модель строится следующим образом. Уравнение изменения уровня запасов задается посредством стохастического дифференциального уравнения Ито где X0 — начальный уровень запасов. В уравнении (25) наличие стохастического интеграла Ито может быть интерпретировано как, например, порча продукции либо возврат товара. Целевой функционал имеет вид

Смысл целевого функционала заключается в том, что мы стремимся удержать уровень запасов как можно ближе к желаемому значению ж и темп производства возможно ближе к значению й. Квадратичные члены h(Xt — х)2 и c(U — и) задают потери, возникающие при отклонении от целевых значений. Следует отметить, что модель не подразумевает наличие ограничения на неотрицательность функции Ut, другими словами, допускается распродажа либо утилизация продукции (т. е. Ut 0). Кроме того, модель допускает отрицательные значения для уровня запасов, что соответствует продаже с накоплением задолженности.

Потраекторно-детерминированный подход к исследованию сто хастических моделей управляемых систем с управляемым сносом

В данном параграфе представлен новый детерминированный подход к исследованию стохастических моделей управляемых систем, в которых динамика системы описывается одномерным стохастическим дифференциальным уравнением, содержащим управляющее воздействие только в коэффициенте сноса. Ниже будет приведена постановка задачи, которая является частным случаем общей постановки, приведенной в предыдущем параграфе. В пункте 2.2.1, применяя формулу для явного решения СДУ, мы покажем, что исследуемая стохастическая задача может быть сведена к потраекторной задаче и рассмотрена с детерминированной точки зрения. В пункте 2.2.2 мы покажем, что детерминированная задача может быть модифицирована таким образом, что решение модифицированной задачи будет неупреждающим и будет потраекторно совпадать с решением стохастической задачи.Функция ограниченной вариации ж() на интервале [т о, т] называется решением дифференциального уравнения (52), соответствующим управлению (и,$) и начальному условию Жо, если x(to) = XQ И для каждого t Є (to,tt\ выполняется следующее равенство

(53) Здесь ficc есть непрерывная компонента меры /І. Заметим, что сумма в (53) корректно определена, так как существует не более чем счетное число точек т, в которых vT не равен нулю.

Обозначим через Н функцию Понтрягина и через Q векторную функцию Q(x,u,ifj,t) := дт(х,и,і)ф.

В формулировке теоремы используется следующее обозначение: «крышка» над функцией от переменных (x,u,t) означает, что вместо пропущенных переменных подставляются оптимальные значения (х,и), например f(t) = f(x(t),u(t),t) или f(u,t) = f(x(t),u,t). Аналогичное обозначение используется для крышки и нижнего индекса т, означающее, что вместо пропущенных переменных подставляются оптимальные значения в моменты скачков, например /T(s) = /(XT(S),UT(S),T). Кроме того, через NK(X) обозначим нормальный конус Мордуховича в х Є К (см. [30, 61]).

В данном параграфе представлен новый детерминированный подход к исследованию стохастических моделей управляемых систем, в которых динамика системы описывается одномерным стохастическим дифференциальным уравнением, содержащим управляющее воздействие только в коэффициенте сноса. Ниже будет приведена постановка задачи, которая является частным случаем общей постановки, приведенной в предыдущем параграфе. В пункте 2.2.1, применяя формулу для явного решения СДУ, мы покажем, что исследуемая стохастическая задача может быть сведена к потраекторной задаче и рассмотрена с детерминированной точки зрения. В пункте 2.2.2 мы покажем, что детерминированная задача может быть модифицирована таким образом, что решение модифицированной задачи будет неупреждающим и будет потраекторно совпадать с решением стохастической задачи. 2.2.1 Сведение стохастической задачи к классической детерминированной задаче оптимального управления

Пусть (Г2, #", (J t)o t T, Р) — полное вероятностное пространство, наделенное естественной фильтрацией одномерного стандартного винеровского процесса, Wt, t Є [0,Т], Т 0. Рассмотрим задачу управления одномерным процессом, заданным стохастическим дифференциальным уравнением

Сведение стохастической задачи к потраекторно-детерминированной задаче оптимального импульсного управления

Приведем постановку рассматриваемой стохастической задачи оптимального управления. Пусть (Г2, #", (i t)o t T5 Р) — полное вероятностное пространство, наделенное естественной фильтрацией одномерного стандартного винеровского процесса, Wt, t Є [0,Т], Т 0. Пусть на этом вероятностном пространстве задан одномерный управляемый процесс где Xf — фазовая координата управляемого процесса; щ — управляющая функция из класса ЛГ согласованных процессов с траекториями ограниченной вариации на отрезке [0,Т], которая принимает значения в замкнутом выпуклом множестве U С R; Ъ : [0, Т] х R х R — R, а : [0, Т] х R — R — измеримые функции; Хо Є R — начальное значение Xt] дифференциал винеровского процесса odWt понимается в смысле Стратоновича.

Качество управления оценивается функционалом потерь

Требуется найти управляющую функцию щ Є Л/", доставляющую минимум функционалу EJ. Стохастическую задачу (108), (109) будем кратко обозначать («S).

Наш подход к задаче ( S) заключается в следующем. Сначала мы докажем теорему о представлении решения СДУ, которая позволяет в задаче ( S) заменить дифференциальное ограничение (108), задаваемое СДУ, на эквивалентное ограничение, которое можно рассматривать как потраекторное детерминированное дифференциальное уравнение. Далее мы покажем, что в критерии качества (109) усредненный функционал EJ можно заменить на потраекторный и сформулируем детерминированную задачу, неупреждающие решения которой совпадают с решениями ( S). После этого докажем, что детерминированная задача может быть модифицирована таким образом, чтобы оптимум достигался на неупреждающей функции.

Будем говорить, что функция f(t,x,u) : [0, Т] xRx[/ — R удовлетворяет условию Липшица по переменной ж, если существует константа L такая, что для всех t Є [0,Т] и всех и Є U выполнено неравенство

Следующая теорема является обобщением теоремы о явном представлении решений СДУ, приведенной в монографии [25], для управляемых процессов, а также, теоремы 8, на процессы с управляемой диффузионной составляющей.

Теорема 12. Пусть в уравнении (108) функция o (t,x) дважды непрерывно дифференцируема, ее частная производная o x(t, х) ограничена, а сама функция отделена от нуля, то есть существует 5, такая что \o (t,x)\ 5 0. Предположим далее, что функция b (t,x,u) = b(t,x,u) + a x(t,x)a(t,x)u2 удовлетворяет условиям Липшица и линейного роста по х на R.

Пусть Ф(,г ) — произвольное решение параметризованного обыкновенного дифференциального уравнения

Доказательство. Из липшицевости В следует (см. [23]), что для любого начального условия уравнение (113) имеет единственное решение, которое является функцией ограниченной вариации. Следовательно согласованный процесс yt — семимартингал, и, так как Ф(,г ) дважды непрерывно дифференцируемая функция, то к г = &{t,UtWt + yt) можно применить формулу Ито (теорема 3):

Здесь для функции Ф и ее частных производные Ф и Ф использовано сокращенное обозначение аргументов (s) вместо (s,usWs + ys), Аит = ит — ит- и Аут = ут — ут-. В силу ограниченности вариаций функций щ и yt стохастические интегралы Стратоновича по этим функциям потраекторно совпадают с интегралами Лебега-Стилтьеса, а сами функции могут быть представлены как суммы непрерывных и дискретных компонент. Поэтому равенство (114)

Численно-аналитическое решение задачи моделирования планирования производства

Параграф посвящен численно-аналитическому решению задачи оптимального управления производством, который описан в главе 1. Задача оптимизации заключается в минимизации функционала потерь (26) при выполнении дифференциального ограничения (25). Для простоты мы будем считать константы й их равными нулю, а константы h и с равными единице. Общий случай может быть получен соответствующими заменами. В упрощенном виде задача формулируется следующим образом: необходимо минимизировать функционал

Применим к задаче (164)—(165) теоретический аппарат, развитый в параграфе 2.2. Уравнением на функция Ф(,г ) из теоремы 8 является

1. С помощью метода, представленного в параграфе 2.2, стохастическую задачу сводим к детерминированной задаче и строим модифицированную задачу.

2. Моделируем траекторию винеровского процесса Wf.

3. Решается задача Копій (167) и вычисляется оптимальная траектория по формуле (166).

4. Решается задача Коши (169) и вычисляется функция X(t) по формуле (168).

5. Вычисляется оптимальное управление по формуле (170).

Для решения задач Коши (167) и (169) используется метод Рунге-Кутта второго порядка. Обозначим через Т интервал времени, на котором строится решение. Зададим разбиение отрезка [0,Т] на N равных шагов. Обозначим через ti, і = 0, N точки разбиения, тогда г = ti+\ — t{ = 1/N — длина одного шага. Численно найденные значения функции yt в точках t{ будем обозначать

У г Сначала сгенерируем винеровский процесс. Так как метод Рунге-Кута является двухэтапным методом, то при вычислениях, кроме значений винеровского процесса на точках , понадобятся значения в точках + 0, 5т. Поэтому сгенерируем значения Wj винеровского процесса на разбиении tj, j = 0, 2N. При этом, очевидно, что Wti = Wf2. = W ii Далее, согласно методу Рунге-Кутта, для построения численного решении задачи Коши (167), если известно значение функции , сначала необходимо вычислить промежуточное значение УІ+І/2 исходя из схемы Эйлера из которого явным образом можно найти искомое УІ+\. Так как значение для і = 0 известно, уо = —, то приведенный итерационный процесс позволяет построить численное решение задачи (167). Для построения траектории процесса X(t) достаточно воспользоваться формулой (166).

Так как значения X(t) известны только на точках t{, то для вычисления значений () воспользуемся методом Рунге-Кутта по точкам t i (для вычисления на всех точках t{ не хватает промежуточных значений Х .+о,5т) Кроме того, в задаче Копій (169) условия заданы на правом конце, поэтому итерационный процесс необходимо начинать с і = N/2 и двигаться в обратном направлении. При известном ( 2«) промежуточные значения ( 2«-і) вычисляются по схеме

Из найденных значений ( і) по формуле (168) легко получить значения для множителя X(t).

Таким образом, применяя предложенный метод и используя предложен-ные выше численные схемы, построены решения задачи оптимального управления производством. Реализация численных схем осуществлена на пакете Matlab.

Предложенная схема Рунге-Кутта имеет второй порядок аппроксимации и второй порядок точности. Для оценки погрешности воспользуемся правилом Рунга. Для этого строится два решения с у\ и yfT с шагами г и 2т соответственно. Тогда погрешность решения на разбиении с шагом т составляет/ = уТ-у2т

Численное построение проводилось при (7 = 1 и (7 = 0.1. Погрешности в первом случае составили

На рисунках 7 и 8 приведены траектории смоделированных процессов для двух различных значений константы а. Видна корреляция между траекторией винеровского процесса и траекториями остальных процессов, которая уменьшается при малом значении а. Из рисунков также видно, что уровень запасов и темп производства за относительно небольшой начальный промежуток времени достигают оптимального уровня и продолжают находиться на нем, отвечая лишь флуктуациям винеровского процесса.

Похожие диссертации на Потраекторно-детерминированный подход к исследованию стохастических моделей управляемых систем