Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Задача оптимального управления в модели эпидемии Овсянникова Наталья Игоревна

Задача оптимального управления в модели эпидемии
<
Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии Задача оптимального управления в модели эпидемии
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Овсянникова Наталья Игоревна. Задача оптимального управления в модели эпидемии : диссертация ... кандидата физико-математических наук : 01.01.09 / Овсянникова Наталья Игоревна; [Место защиты: Вычислительный центр РАН].- Москва, 2010.- 140 с.: ил.

Содержание к диссертации

Введение

ГЛАВА 1. Оптимальное управление эпидемией путём вакцинации в неоднородном сообществе .

1 Дискретная неуправляемая модель эпидемии 18

2 Расчёт параметров модели с группой риска 20

3 Дискретная управляемая модель эпидемии 29

1.3.1 Обоснование необходимости вакцинации 29

1.3.2 Управляемая модель эпидемии 33

1.3.3 Необходимые условия оптимальности 35

4 Решение ДЗОУ с помощью вакцинации методом градиентного спуска 36

5 Синтез управлений 37

6 Сравнительный анализ решений ДЗОУ 44

1.6.1 Сравнение решений, полученных различными методами 44

1.6.2 Сравнение решений, полученных при различных параметрах 47

1.6.3 Сравнение решений, полученных при различных At 52

7 Переход от дискретной неуправляемой модели к непрерывной 52

8 Устойчивость неуправляемой системы 53

9 Стохастическая модель эпидемии 59

1.9.1 Общий вид непрерывных стохастических моделей динамики 59

1.9.2 Сильная сходимость унифицированного разложения Тейлора-Ито 62

1.9.3 Модель эпидемии с возмущённым коэффициентом роста заболеваемости 63

ГЛАВА 2. Дискретная задача оптимального управления эпидемией путём изоляции

1 Постановка задачи 78

2 Алгоритм численного решения ДЗОУ методом проекций градиента 80

3 Анализ численного решения при различных параметрах 81

4 Синтез управлений 84

5 Сравнение решений, полученных различными методами 91

ГЛАВА 3. Дискретная задача оптимального управления эпидемией путём изоляции и вакцинации с учётом латентного периода

1 Постановка задачи 93

2 Алгоритм численного решения 94

3 Результаты численной оптимизации 95

ГЛАВА 4. Комплексное управление эпидемией путём вакцинации, изоляции и информационно-образовательной программы .

1 Постановка задачи 98

2 Алгоритм численного решения задачи методом проекции градиента 100

3 Анализ влияния параметров на оптимальное решение 101

4 Синтез управлений 102

5 Выбор ОУ с целью минимизации затрат и времени погашения эпидемии 121

Заключение 123

Список литературы 125

Приложение 132

Введение к работе

Понятие «эпидемия» происходит от двух понятий: демос - народ, эпи -внутри. В обиходе под эпидемией понимают быстроразвивающиеся процессы, стихийно охватывающие большие массы людей и развивающиеся в силу передачи друг другу заражающего «агента».

В настоящее время, так же как и во все предыдущие времена, огромной угрозой человечеству являются эпидемии инфекционных заболеваний. Так, мощные природные катаклизмы (наводнения, землетрясения) могут сопровождаться резким ухудшением санитарно-гигиенических и социально-экономических условий жизни пострадавшего от них населения [4]. При этом наиболее вероятно появление кишечных инфекций (холера, дизентерия, инфекционный гепатит и др.), в том числе в виде вспышек сыпного тифа, туляремии, чумы и других инфекций. Вместе с тем, сценарии неожиданного появления особо опасных инфекций на территории крупных городов России сегодня вполне возможны в результате актов биологического терроризма [8, 11, 12] с возбудителями натуральной оспы, сибирской язвы, геморрагических лихорадок или других опасных патогенов.

Возбудители, приведенные в таблице 1, отличаются высокой вирулентностью и контагиозностью, устойчивостью существования во внешней среде, множественностью путей передачи, длительной выживаемостью в основных факторах передачи (воздухе, воде, пище, на предметах обихода и др.) и которые могут передаваться различными путями. Как правило, инфекционные заболевания, которые вызываются возбудителями ООИ, протекают в тяжелой форме и сопровождаются высокой летальностью пораженных лиц. Согласно данным из таблицы 1, к таким патогенам следует отнести оспу, чуму (легочную форму), сибирскую язву (генерализованную форму), туляремию, геморрагические лихорадки, грипп, сыпной тиф, холеру и др. [13].

При неожиданном возникновении эпидемий (вспышек) чрезвычайная ситуация на пораженных территориях будет резко изменяться и формироваться сложная обстановка с быстро изменяющейся динамикой. Эти обстоятельства станут определяющими, особенно на фоне дефицита времени и ресурсов, которые необходимы для противодействия эпидемиям (вспышкам). В таких условиях поспешные или хаотичные действия специалистов органов здравоохранения могут негативным образом повлиять на организацию и реализацию мер борьбы с патогенами, снизить эффективность мер «скорой помощи» пострадавшему населению [12].

Основными факторами, которые предопределяют сложность решения задач оперативного анализа и прогноза развития эпидемий (вспышек), а также задач противодействия являются следующие:

1) массовость и высокая скорость распространения патогенов, когда в короткий период времени, возможно, появление большого числа больных людей (животных);

2) «сбои» в работе медицинских учреждений и органов здравоохранения, когда число пораженных людей или животных становится чрезвычайно большим, а возможности имеющихся сил и средств по противодействию ООИ ограничены («выходят на насыщение»);

3) острота или даже кризис в развитии санитарно-эпидемиологической обстановки в очагах поражения из-за начального несоответствия располагаемых возможностей и реальных потребностей в силах и средствах противодействия ООИ;

4) необходимость быстрого (оперативного) анализа и прогноза обстановки с выработкой адекватного решения по организации, реализации и управлению силами и средствами противодействия из единого центра с целью выявления, локализации и ликвидации эпидемий (эпизоотии) при минимальных социальных и иных последствиях.

В этих условиях особое значение приобретают опережающие научные исследования по анализу и прогнозу вероятных сценариев развития эпидемий опасных инфекционных заболеваний, которые могут появиться в результате чрезвычайных ситуаций природного и техногенного характера. По данным Всемирной Организации Здравоохранения (ВОЗ) при ООН, в ближайшие годы ожидается рост инфекционной патологии, что обусловлено известными экологическими и социально-экономическими проблемами -низким уровнем жизни и почти полным отсутствием у большинства населения планеты адекватной медицинской помощи. Согласно прогнозам, в первой половине текущего века в любой географической точке планеты следует ожидать эпидемии или вспышки как «новых», так и «старых» инфекционных заболеваний.

В начале 1997 года в Гонконге была зарегистрирована смерть трехлетнего ребенка. С помощью лабораторной диагностики было установлено, что ребенок инфицирован вирусом типа А птичий грипп (ПГ). В ноябре вспышка гриппа в Гонконге повторилась, на этот раз от инфекции пострадало 18 человек, 6 из которых умерли (летальность - 30%!). Одновременно здесь отмечались вспышки заболевания, вызванного этим же типом вируса у множества домашних птиц. Учеными было сделано предположение, что больные ПГ птицы явились первоисточником заражения ПГ людей, хотя достоверных случаев передачи вируса от птиц к человеку отмечено не было. В целях защиты своего населения от «новой» инфекции Правительство Гонконга решило провести акцию по уничтожению всех домашних птиц (более миллиона особей птицы было забито), после чего случаи заболевания ПГ не отмечались.

Однако в 1999 году здесь опять были зарегистрированы 2 случая «нового» гриппа, вызванного подтипом A(H9N1). Специалисты ВОЗ считают, что пандемия «нового» гриппа сегодня практически неизбежна, однако никто не знает, когда появится эпидемический подтип вируса гриппа, который будет эффективно передаваться от человека к человеку. В прошлом частота появления нового эпидемического подтипа вируса гриппа в среднем составляла от 30 до 40 лет. Так как в настоящее время вирус гриппа A(H3N2) циркулирует на планете уже более 30 лет, эксперты ВОЗ считают, что эпидемия «нового» подтипа вируса гриппа может начаться практически в любой момент. Высокая вероятность появления «нового» вируса гриппа привела к тому, что в феврале 2003 года эксперты ВОЗ объявили об угрозе пандемии гриппа, при этом эксперты прогнозируют 2 сценария возможного развития событий. Первый сценарий - возвращение к людям эпидемического подтипа A(H2N1), с которым человечество не сталкивалось уже в течение 35 лет. В этом случае высокий риск заражения гриппом будут иметь в основном молодые люди, число которых сегодня составляет около 50% населения. Второй сценарий - появление «нового» эпидемического подтипа гриппа A(H5N1), с которым человечество не сталкивалось вообще. Все население планеты сегодня имеет высокий риск заражения новым патогеном. Ожидается, что воздействие нового подтипа гриппа на жизнь и здоровье миллионов людей будет весьма существенным (летальность больных до 30% и более). Естественно, что наибольшему риску заразиться и заболеть «новым» подтипом гриппа будут подвержены медицинские работники (врачи и медсестры), так как они будут находиться в постоянном контакте с инфекционными больными. В настоящее время в России существуют технологии по математическому и компьютерному моделированию эпидемий (адекватный научный инструментарий), которые позволяют заблаговременно оценивать масштабы и последствия эпидемий «старых» и «новых» инфекционных заболеваний, в том числе и птичьего гриппа.

Современная наука неотделима от математического моделирования, сущность которого состоит в замене исходного объекта его "образом" — математической моделью — и дальнейшем изучении модели с помощью реализуемых на компьютере вычислительно-логических алгоритмов. Этот метод конструирования сочетает в себе многие достоинства, как теории, так и эксперимента. Работа не с самим объектом (явлением, процессом), а с его моделью даёт возможность безболезненно, относительно быстро и без существенных затрат исследовать его свойства и поведение в любых мыслимых ситуациях. В то же время вычислительные (компьютерные) эксперименты с моделями объектов позволяют, опираясь на мощь современных вычислительных методов и технических инструментов информатики, подробно и глубоко изучать объекты в достаточной полноте, недоступной чисто теоретическим подходам.

Модель - один из важнейших инструментов научного познания, условный образ объекта исследования или управления, который отображает основные характеристики объекта (свойства, взаимосвязи, структурные и функциональные параметры), существенные для цели исследования. В настоящее время математическое моделирование вступает в важный этап своего развития, "встраиваясь" в структуры так называемого информационного общества. Прогресс средств переработки, передачи и хранения информации способствует усложнению и взаимному проникновению различных сфер человеческой деятельности. Без владения информационными "ресурсами" нельзя и думать о решении проблем, стоящих перед мировым сообществом. Однако "информация", как таковая, мало что даёт для анализа и прогноза, для принятия решения и контроля за их исполнением. Нужны надёжные способы переработки информационного "сырья" в готовый "продукт", т.е. в точное знание.

Технические, экологические, экономические и иные системы, изучаемые современной наукой, не всегда поддаются исследованию (в нужной полноте и точности) обычными теоретическими методами. Прямой натурный эксперимент над ними долг, дорог, часто либо опасен, либо просто невозможен, так как многие из этих систем существуют в "единственном экземпляре". Цена ошибок и просчётов в обращении с ними недопустимо высока.

Модель создаётся на основе предварительного изучения явления и выделения его существенных характеристик. Теоретический и экспериментальный анализ модели позволяет сделать качественные выводы о поведении объекта. Математические модели - это упрощенные версии реального мира, которые сокращают в той или иной степени основные черты реальности. Это позволяет использовать абстрактную математическую модель для анализа, предсказания или прогноза тех или иных явлений, выявления общих закономерностей. Однако следует учитывать то, что любая математическая модель отражает лишь основные стороны реальности. Результаты необходимо проверять опытом. Всегда необходимо сравнивать, анализировать и синтезировать результаты качественного анализа, численного эксперимента с реальными явлениями и процессами. Классификация видов моделирования систем 

В основе моделирования лежит теория подобия, которая утверждает, что абсолютное подобие может иметь место лишь при замене одного объекта другим точно таким же. При моделировании математическая модель должно достаточно хорошо отображать исследуемую сторону функционирования объекта. Поэтому в качестве одного из первых признаков классификации видов моделирования можно выбрать степень полноты модели и разделить модели в соответствии с этим признаком на полные, неполные и приближенные. В основе полного моделирования лежит полное подобие, которое проявляется как во времени, так и в пространстве. Для неполного моделирования характерно неполное подобие модели изучаемому объекту. В основе приближенного моделирования лежит приближенное подобие, при котором некоторые стороны функционирования реального объекта не моделируются совсем.

В зависимости от характера изучаемых процессов все виды моделирования могут быть разделены на детерминированные и стохастические, статические и динамические, дискретные, непрерывные и дискретно-непрерывные. Детерминированное моделирование отображает детерминированные процессы, т.е. процессы, в которых предполагается отсутствие всяких неопределённых случайных воздействий; стохастическое моделирование отображает вероятностные процессы и события. В этом случае анализируется ряд реализаций случайного процесса и оцениваются средние характеристики, т. е. набор однородных реализаций. Статическое моделирование служит для описания поведения объекта в какой-либо момент времени, а динамическое моделирование отражает поведение объекта во времени. Дискретное моделирование служит для описания процессов, которые предполагаются дискретными, соответственно непрерывное моделирование позволяет отразить непрерывные процессы в системах, а дискретно-непрерывное моделирование используется для случаев, когда хотят выделить наличие как дискретных, так и непрерывных процессов. В зависимости от формы представления объекта можно выделить мысленное и реальное моделирование.

Под математическим моделированием будем понимать процесс установления соответствия данному реальному объекту некоторого математического объекта, называемого математической моделью, и исследование этой модели, позволяющее получать характеристики рассматриваемого реального объекта. Вид математической модели зависит как от природы реального объекта, так и от задач исследования объекта и требуемой достоверности и точности решения этой задачи. Любая математическая модель, как и всякая другая, описывает реальный объект лишь с некоторой степенью приближения к действительности. Математическое моделирование для исследования характеристик процесса функционирования систем можно разделить на аналитическое, имитационное и комбинированное.

Для аналитического моделирования характерно то, что процессы функционирования элементов системы записываются в виде некоторых функциональных соотношений (алгебраических, интегро дифференциальных, конечно-разностных и т. п.) или логических условий. При имитационном моделировании реализующий модель алгоритм воспроизводит процесс функционирования системы S во времени, причем имитируются элементарные явления, составляющие процесс, с сохранением их логической структуры и последовательности протекания во времени, что позволяет по исходным данным получить сведения о состояниях процесса в определенные моменты времени, дающие возможность оценить характеристики системы S.

Основным преимуществом имитационного моделирования по сравнению с аналитическим является возможность решения более сложных задач. Имитационные модели позволяют достаточно просто учитывать такие факторы, как наличие дискретных и непрерывных элементов, нелинейные характеристики элементов системы, многочисленные случайные воздействия и др., которые часто создают трудности при аналитических исследованиях. В настоящее время имитационное моделирование — наиболее эффективный метод исследования больших систем, а часто и единственный практически доступный метод получения информации о поведении системы, особенно на этапе ее проектирования.

Когда результаты, полученные при воспроизведении на имитационной модели процесса функционирования системы S, являются реализациями случайных величин и функций, тогда для нахождения характеристик процесса требуется его многократное воспроизведение с последующей статистической обработкой информации и целесообразно в качестве метода машинной реализации имитационной модели использовать метод статистического моделирования. Первоначально был разработан метод статистических испытаний, представляющий собой численный метод, который применялся для моделирования случайных величин и функций, вероятностные характеристики которых совпадали с решениями аналитических задач (такая процедура получила название метода Монте-Карло). Затем этот прием стали применять и для машинной имитации с целью исследования характеристик процессов функционирования систем, подверженных случайным воздействиям, т. е. появился метод статистического моделирования.

Имитационное моделирование может быть положено также в основу структурного, алгоритмического и параметрического синтеза больших систем, когда требуется создать систему с заданными характеристиками при определенных ограничениях, которая является оптимальной по некоторым критериям оценки эффективности.

При решении задач машинного синтеза систем на основе их имитационных моделей помимо разработки моделирующих алгоритмов для анализа фиксированной системы необходимо также разработать алгоритмы поиска оптимального варианта системы. Далее в методологии машинного моделирования будем различать два основных раздела: статику и динамику, основным содержанием которых являются соответственно вопросы анализа и синтеза систем, заданных моделирующими алгоритмами.

Комбинированное (аналитико-имитационное) моделирование при анализе и синтезе систем позволяет объединить достоинства аналитического и имитационного моделирования. При построении комбинированных моделей проводится предварительная декомпозиция процесса функционирования объекта на составляющие подпроцессы, и для тех из них, где это возможно, используются аналитические модели, а для остальных подпроцессов строятся имитационные модели. Такой комбинированный подход позволяет охватить качественно новые классы систем, которые не могут быть исследованы с использованием только аналитического и имитационного моделирования в отдельности.

При реальном моделировании используется возможность исследования различных характеристик либо на реальном объекте целиком, либо на его части. Такие исследования могут проводиться как на объектах, работающих в нормальных режимах, так и при организации специальных режимов для оценки интересующих исследователя характеристик (при других значениях переменных и параметров, в другом масштабе времени и т. д.). Реальное моделирование является наиболее адекватным, но при этом его возможности с учетом особенностей реальных объектов ограничены. Например, проведение реального моделирования АСУ предприятием потребует, во-первых, создания такой АСУ, а во-вторых, проведения экспериментов с управляемым объектом, т. е. предприятием, что в большинстве случаев невозможно. История моделирования эпидемий.

Начало применению математических методов при изучении эпидемий было положено Даниилом Бернулли в середине XVII века (Bernoulli, 1760). Он впервые применил простейший математический аппарат для оценки эффективности профилактических прививок против натуральной оспы. Вслед за этим последовал значительный перерыв, который завершился работами английского ученого Уильяма Фара [14]. Он изучал и моделировал статистические показатели смертности населения Англии (Уэльса) от эпидемии натуральной оспы в 1837-1839 гг. Этот ученый впервые получил математические модели показателей «движения» эпидемии натуральной оспы в виде статистических закономерностей, что позволило ему в итоге составить прогностическую модель этой эпидемии.

В начале XX века статистический подход У.Фарра в изучении эпидемий был переосмыслен и затем развит в работах Джона Браунли, в которых он анализировал статистические закономерности «движения» эпидемиологических показателей с помощью малоизвестных методов математической статистики. Однако этот статистический подход в изучении закономерностей развития эпидемий существенно отличается от аналитического подхода, который был предложен в конце XIX века сначала в России [9], а затем в Англии [16]. Благодаря этим исследователям, в начале XX века были сформулированы основы современной теории математического моделирования эпидемий, разработаны первые прогностические модели эпидемий (корь, ветрянка, малярия и др.), изучены их основные свойства, получены аналитические формулы для прогнозирования эпидемий.

В 20-е годы XX века аналитический подход получил дальнейшее развитие среди ученых Великобритании [15]. Исторически первой стала модель Кермака и Мак Кендрика, предложенная в 1927 г. Это - детерминированная модель, в которой механизм заражения реализуется через встречи восприимчивых с заражёнными. Теоретические работы этих и многих других ученых и сегодня широко цитируются и используются учеными Запада в анализе и прогнозе эпидемий (вспышек) актуальных инфекций (грипп и ОРВИ; холера и ОКИ; парентеральные гепатиты В и С; ВИЧ/СПИД, сифилис и гонорея и ряд других инфекций). Однако в большинстве этих моделей предполагалось наличие возбудителя с постоянными характеристиками, что не вполне соответствует действительности.

С появлением в середине 50-х годов XX века первых электронно-вычислительных машин (ЭВМ) стал оформляться следующий этап в развитии МТЭ, когда число научных работ и публикаций по математическому и компьютерному моделированию эпидемий стало быстро увеличиваться. В работах того времени стали появляться все более сложные математические модели, в которых существенную роль играли случайные факторы эпидемического процесса, поэтому большинство моделей этого периода имели стохастический (вероятностный) характер, а рабочим аппаратом была теория вероятностей и случайных процессов. Этот этап в развитии МТЭ был связан с «натиском» на эпидемиологию «чистых» математиков, которым удалось создать множество абстрактных моделей, но с весьма ограниченным эпидемиологическим содержанием [5]. 

Следующий этап в развитии МТЭ, который относится ко второй половине XX века, был связан с быстрым прогрессом в области компьютерных технологий (разработаны мощные компьютеры с новейшими инструментами программирования и моделирования).

В 60-70 годы в странах Запада были разработаны новые типы детерминированных и стохастических моделей эпидемий, ориентированные на изучение закономерностей развития социально-значимых вирусных и бактериальных инфекций (Anderson, May, 2004.). Однако, несмотря на высокую сложность таких моделей и изощренность математического аппарата, большинство моделей продолжало иметь абстрактный характер, т.е. они были слабо связаны с постановкой и решением практических задач эпидемиологии. Дело в том, что ведущие научные центры по изучению эпидемий в США и в странах Западной Европы в то время располагались в университетах или в медицинских школах при университетах, которые были достаточно далеки от реальных проблем эпидемиологии, ее реальной практики. В свою очередь, эпидемиологи плохо воспринимали абстрактные математические (детерминированные или стохастические) модели эпидемий и вспышек и не могли их сочетать с практическими потребностями.

Таким образом, в 70-е годы XX века на Западе наметился серьезный разрыв между «чистой» теорией математического моделирования эпидемий и реальной практикой применения этой теории в эпидемиологии.

Первые исследования, которые наметили пути преодоления указанного разрыва, были выполнены в 60-е годы в СССР академиком О. В. Барояном и профессором Л. А. Рвачевым [1, 2, 3]. Ими была разработана новая методология математического моделирования эпидемий - эпиддинамика Данная методология [2] основана на методе научной аналогии в отображении эпидемического процесса (процесс «переноса» возбудителя инфекции от больных к здоровым) с процессом «переноса» материи (энергии, импульса и др.) в уравнениях математической физики [6]. Действительно, в ходе развития эпидемии среди населения территории, пораженной инфекционным заболеванием, формируется сложный самоподдерживающийся процесс «переноса» популяции возбудителя на сообщество восприимчивых людей. Эпидемиологическое содержание данного-процесса связано с адекватным его отображением, как в календарном времени «t», так и во «внутреннем» времени «г», которое фиксирует развитие инфекционного заболевания у множества лиц, пораженных инфекцией. Система уравнений, которая описывает развитие эпидемического процесса, представляет собой систему нелинейных уравнений в частных производных с соответствующими начальными и граничными условиями, весьма «схожими» с уравнениями гидродинамики [10].

С применением этой методологии в ИЭМ им. Н. Ф. Гамалеи АМН СССР в 60-70-е годы были разработаны уникальные модели эпидемий гриппа для территории СССР, которые составлены на основе балансов «потоков» индивидуумов, проходящих основные стадии-состояния инфекционного процесса типа SEIR, где: S - восприимчивые, Е - в инкубации, I -инфекционные больные, R - переболевшие.

Новая модель эпидемий гриппа на территории СССР имела адекватное медико-биологическое содержание, т.к. отражает особенности развития как индивидуальных, так и «коллективных» процессов гриппозной инфекции среди восприимчивого населения множества городов, пораженных патогеном. Эффективность моделирования эпидемий гриппа была продемонстрирована в 70-е годы при прогнозировании более 170 эпидемий на территории более 100 городов СССР [2].

Новая методология моделирования эпидемий оказала существенное воздействие на исследования по математическому и компьютерному моделированию эпидемий в СССР (в России). Так, к концу 90-х годов в ГУ НИИЭМ им. Н.Ф.Гамалеи РАМН с ее помощью была реализована уникальная «коллекция» математических (компьютерных, в виде Windows-приложений) моделей для изучения эпидемий и вспышек значимых инфекций с феноменологией типа SEnlmRF, где: En - «п» стадий инкубационного периода; Im -«m» стадий различных клинических форм инфекционного заболевания; R-переболевшие заболеванием, F - погибшие от осложнений. В настоящее время математическое моделирование эпидемий продолжается. Можно отметить работы таких математиков как Андреева Е.А. [52], Колесин И.Д. [50],[51], Герасимов А.Н., Разжевайкин В.Н. [98],[99], в которых построены неуправляемые и управляемые модели эпидемий, обоснован выбор тех или иных факторов.

Исследователи, которые занимались вопросом построения моделей эпидемии, учитывали наиболее значимые, с их точки зрения, факторы, влияющие на динамику процесса передачи инфекции. Следует отметить, что авторы приведённых выше моделей не предлагали методик для определения коэффициентов моделей. Не проводились исследования условий устойчивости системы, допустимых значений параметров, характерных режимов системы, наличия особых состояний. Не были учтены возрастные особенности протекания заболевания или социальные условия различных слоев населения.

В настоящей работе исследовано несколько моделей, с помощью которых может быть описан процесс развития эпидемии в неоднородном сообществе, состоящем из п возрастных или социальных групп. Для проведения своего исследования мне необходимо построить и обосновать ряд моделей: неуправляемых и управляемых, детерминированных и стохастических.

Для стохастической модели особый интерес представляет построение численной схемы решения стохастических дифференциальных уравнений, описывающих процесс развития эпидемии. В работе ставится задача построения численной схемы для моделирования решения стохастического дифференциального уравнения. Для разработки этого алгоритма планируется применить метод унифицированного разложения Тейлора-Ито по повторным стохастическим интегралам с их последующей аппроксимацией с помощью полиномиальной системы функций, предложенный Кузнецовым Д.Ф. [24].

Для стохастической модели, целесообразным видится проведение следующих исследований: изучение влияния возмущений на поведение фазовых траекторий, устойчивости положения равновесия в зависимости от интенсивности возмущений, выявление значений параметра а, при которых система допускает описание детерминированной моделью, и значений, при которых система может быть описана только стохастической моделью.

Исходя из всего вышесказанного цель диссертационной работы:

1) разработать и обосновать дискретную неуправляемую детерминированную математическую модель, описывающей динамику эпидемии в неоднородном сообществе, состоящем из п групп, рассчитать для данной модели параметры задачи, построить на её основе управляемую модель,

2) разработать численную схему решения задачи оптимального управления эпидемией с целью минимизировать затраты на её погашение,

3) найти стационарные состояния неуправляемой системы и выяснить, являются ли они устойчивыми,

4) исследовать зависимость решения задачи оптимального управления от параметров модели,

4) исследовать динамику эпидемии при различных видах управления: только вакцинацией, только изоляцией, комбинацией вакцинации, изоляции и просветительско-образовательной программы,

5) решить задачу оптимального управления эпидемией с учётом латентного периода и исследовать зависимость решения задачи от величины скрытого периода,

6) выявить наиболее рентабельный и гуманный способ управления эпидемией,

7)разработать и обосновать непрерывную неуправляемую детерминированую математическую модель, описывающую динамику эпидемии в неоднородном сообществе, состоящем из п групп, построить на её основе стохастическую модель,

8) разработать численную схему решения стохастического дифференциального уравнения с возмущёнными параметрами, описывающего процесс развития эпидемии, 9) исследовать влияние возмущенных параметров на поведение системы, а также выявить условия, при которых система допускает описание с помощью детерминированной модели, и условий при которых система может быть описана только при помощи стохастической модели.  

Решение ДЗОУ с помощью вакцинации методом градиентного спуска

Введём управление как скорость вакцинации Vj (число вакцинированных на і — том шаге в j - той группе). Динамические уравнения управляемой модели эпидемии в неоднородном сообществе, состоящем из п групп: xj+1 = xj + At(-x)XPJkyL - Hjxj - vj 4-Aj), k=l (1.3.2.1) y;+l = yj + At(x;pjky - Yjy - yj - jl-yj), k=l (1.3.2.2) где j = l,n, i=0,q-l, (1.3.2.3) (1.3.2.4) Ограничения на вакцинацию: )0 v; Aj? j = l,n,i = 0,q-l. 6)5 ; А, О, j=ljn i = o9q-i j=i Если v- - это норма вакцинации группе j, то система уравнений примет вид: k_1 (1.3.2.5) y;+1 = yj+At(Xj Jpjkyi - yjy; - - r ), где j=l,n, i=0,q-l, (1.3.2.6) xJ=xJO yJ=yj0, Функционал: 1(у) = (Су)+В.у])А1 + В - Ы (1.3.2.7) j=l i=0 j=I характеризует цель управления для (1.3.2.1), которая состоит в том, чтобы минимизировать затраты на погашение инфекции, где С — средняя стоимость одного больного для общества в неделю (известная величина, для России это примерно 50$ [79, стр.7]), Dj - стоимость вакцинации одного человека в у -той группе. Последнее слагаемое обозначает стоимость остаточных больных, которые могут вызвать вторичную инфекцию, поэтому их стоимость Bj (j = l,n,) должна быть большой (как штраф за недолеченных больных). Если принять С равным одной условной денежной единице, то в (1.3.2.7): и q-1 J(v)=Е2 І+dJvPAt+Sty? - inf j=l i=0 j=I (1.3.2.8) где dj - относительная стоимость вакцинации одного человека в і-той группе, bi -относительная стоимость одного недолеченного больного в і-той группе на момент Т (причём Ь 1, так как каждый недолеченный больной в будущем может заразить несколько человек). Функционал для (1.3.2.5): W J CyJ + d/jX At + XbjyJ - inf (1.3.2.9) j=l i=0 j=i 1.3.3 Необходимые условия оптимальности [101] 1) Определим функцию Понтрягина для задачи (1.3.2.1)- (1.3.2.3), (1.3.2.5): Н, (Xі ,у«, v1 ,p1+1,qi+1 Д0) = -Х0 (у] + djV;)At + j=l j=i k=i n П +S ЧГІУІ+Л«хіЕ Ы - wl - ti - w% і=о, ч - L j=l k=l Согласно критерию оптимальности для дискретной задачи ОУ эпидемией с помощью вакцинации: а) векторы pj, j = 1,п, і = 0,q -1, являются решением сопряжённой системы: 8 =ан8 (Xі , , ,ры,д,+1Л) І = dH.l(x,,y,,vi,pM,q1+\h) і = —Го Pj дк\ ,4j ду) или (А,0 =1): для і = q — 1,0 Р;=P;+1(i - At(XPjkyL+nj))+q;+1AtE3jkyL5 k=I k=I n n q; = qj+1 - At - Atp!T VL + AtStfVL - Atqf (Yj + h + ), k=l k=l б) из условия трансверсальности: pj=0,qj=-br в) maxHi(xi,yi,vi5p,+1,qi+1A0) = max(-X(y;+djv;)At + veV veV T""f J J J +ХРІ+,[Х1 + At(-xiXPjkyL - » - vj +Aj)] + j=l k=l +11+At(x;J;pjkyL - Tiy; - ujy; - д ж= j=l k=l max +vjp At), i = 0,q-l, veV J=l следовательно для (1.2.1.3): О, ecnH(dj + pj+1)At 0 w = AJ? если( + р;+1)Аг 0 [О, AJ, если (d, + p;+I) At = О 2) Метод множителей Лагранжа для дискретной задачи ОУ эпидемией с помощью вакцинации: Функция Лагранжа для задачи (1.2.1.1)-(1.2.1.3), (1.2.1.5): L=12 ;+drtAt+ЕЇХК1 - х; +x)At± kY[ + At(V;+u.jX; - л,»+ j=l 1=0 j=l i=0 k=l +ЕЕЯҐ(УГ - у) - ;д Ёад.+Д (У/,+ад+ад» j=l 1=0 k=l Производные функции Лагранжа: ЯТ n n ff = Р;-РГ +Р ОХУІ + И,)-Ф ІР,УІ =О C j k=l k=1 ЯТ n " —-- At+At P pkJx- + q; - q;+1 - At q k+VL+Atq;+1 (Yj+ +дЛ)=о С% k=l k=l i = l,q-l Откуда: P;=P;+1 - р (ІХУк+ )+q;+1 SPJkyk k=l k=l q; = q? - At- AtJTp VL + At qirVL " A + i + W k=l k=l i = q-l,0 Pj(q) = o чДя) = -ьг 0, если( + р;+1)Аі 0 = djAt + p;+1At, i = l,q-l = v]= dv] Ая ecnn(dj+Pj )At 0 [0, AJ, если (dj + pJ+1)At = О __ 1 .Зададим начальное управление (v j)0, i = 0,q-l, j = l,n. 2.3ададим начальные значения (х ),(у )J = l,n.

По формуле (1.3.2.1) вычислим допустимые траектории, по формуле (1.3.2.5) начальное значение функционала J. З.Для і = q -1,0 (с конца) вычисляем согласно формуле: Р;=pf1 - РГ (ЇХУІС+nj)+ЯГАЇ2ХУ!С k=l k=l n q; =qj+1 - At- At P VL + At qSTVi - Atq CYj + Hj + ). k=l k=l i = q-l,0, где Pj(q) = 0, qj(q) = -br. dL 4.Вычисляем для і = 0, q -1, j = 1, n: (—-). 5.Вычисляем следующее приближение для управления: Проверяем условие: 0 v Aj5 j = 1,п. (для (1.2.1.3)) Если оно не выполняется, то делаем проекцию градиента: если Vj 0, то Vj = 0, если v] Aj ,то v = А . б.По формуле (1.3.2.1) вычисляем допустимые траектории (Xj)1,i = l,q, j = l,n, по формуле (1.3.2.5) следующее значение функционала. 7.Сравним значения JH J1. Если J1 J, то переходим к пункту (2), присвоив v j найденные в пункте (5) значения управлений. Если J J , то возвращаемся к пункту (5) и уменьшаем шаг а, например два раза, проверяем условие 0 v Aj, j = 1,п и делаем шаги 6, 7 и 8. 8.Процесс продолжается до тех пор, пока Jk+1 - Jk є. Рассмотрим процесс распространения эпидемии как дискретную задачу оптимального управления: 1(х0,у,[у]Г1) = (Су[+Ву1)А1 + Ву" Ы (1.5.1) i=0 или (если С=1): І УМГ1) = ! + dV)At + by4 - inf (1.5.2) i=0 Х ХЧНУХУ+Л-ЦХ -УЧАТ, i = 0;q-l [уы = У + (Р -1-Д-у)у А1, i = 0;q-l x elcR , i = 0Tq _ (1.5.4) y eYjCzR", i = 0;q МГКЛУ1,..., -1) (1.5.5) V(x,y)- множество допустимых управлений, D0- множество допустимых процессов, D - множество компонент допустимых процессов и подмножеств G] а X,, Gf с: Y; - множеств достижимости на і-том шаге і = 0; q. Наряду с задачей (1.5.2)-(1.5.5) рассмотрим семейство усечённых по отношению к ней задач, каждая из которых отличается от исходной тем, что в качестве начальной точки рассматривается xkeGj,, yk є Gk: q-l І(хк,ук,МГ1) = Е(УІ +cvi)At + byq -»inf (1.5.6) x,+1 = x1 + (-pVy1 + Л - цх1 - v )At, і = k;q -1 yi+l = y + (pxy _(д. + д + y)yi)At, і = k;q-l Л+1 (1.5.7) x eXjCR", i = k;q y eY.cR", i = k;q (1.5.8) v1 eV cRr, i = k;q-l (1.5.9) Введём множества: Vk(x,y) = {[v]q0-I:vieVi,i = k;q-l, xi+I =xi+(-pxiyi+A-f,ixi-vi)AteXi+1, i = k;q-l у +,=у! + (РхУ-(ц + 1 + у)У)А1е +1, i = k;q-l}, Gk={xeXk:Vk(x) 0}.

Функция в х л=„№№№=M!- M#y +cv )At+by,) (L5 10) есть функция Беллмана дискретной задачи оптимального управления. Пусть Dk(x, у) (k = 0,...,q) - множество первых компонент допустимых управлений усечённой задачи, т.е. Dk(x,y) = {vk eVk3vk+1 eVk+1,...,vq- eV4"1 : ,... 1]єVk(x,у)} Теоремаі.1. (Принцип перехода.) Если ни одно из множеств Gk, k = 0,...,q не является пустым, то функция Беллмана удовлетворяет рекуррентным соотношениям, называемым уравнением Беллмана: Bk(x,y) = inf [(yk+cvk)At + Bk+1([xk+(-pxkyk+A- ixk-vk)At, veDk(x) (1.5.11) ук + (Рхкук-(ц + Д + у)ук)А1)]) гдехкєОк, укєв2к, k = 0,...,q-l. Дляк=ф Bk(x,y) = by\ yqeGq (1.5.12) Теорема 1.2. (Принцип оптимальности.) Пусть ([x],[y],[v]jj-1)- оптимальный процесс в задаче (1.5.2)-(1.5.5), І = І(х,у,[у]Г)= „mf І уМУҐ), (1.5.13) [v]g- eD0(x) и хк eGj.,yk EG - некоторая точка оптимальной траектории([х],[у]), тогда управление [v]4.-1 является оптимальным в усечённой задаче (1.5.6)-( 1.5.9). Смысл данной теоремы в том, что экстремум в правой части (1.5.10) достигается на оптимальном управлении, подуправление [v]4.-1 оптимального управления оптимально и, как следствие, подпуть [х]ч,[у]-1 оптимального пути оптимален. Дискретное уравнение Беллмана (1.5.11) является достаточным условием оптимальности. Схема Беллмана. Алгоритм решения задачи (1.5.2)-(1.5.5) состоит из трёх этапов: I этап (по убывающему индексу к). Для k=q, согласно (1.5.12), Bk(x,y) = byq, уєСд, (Gq = Yq). k=q-l: Строим множество G cXq.,, G cY (если для хєХ р уєУ ч существует veV4-1, такое, что Fq_1 (х, у, v) є G4, то х є Gq_,, у є Gq_j, a v є Dq-1 (x) и для

Устойчивость неуправляемой системы

По определению, точка а=(аь а2, ..., ап) является положением равновесия системы Xj =fi(x1,...,xn), i = l,n, то есть имеется решение Xj(t)=aj, j = l,n, тогда и только тогда, когда фазовая скорость f(ai,...,an)=0. Таким образом, для отыскания всех положений равновесия указанной системы нужно решить систему уравнений f; (аь.. .,ап)=0, І = 1,11. Найдем положение равновесия неуправляемой системы при условии р, Л, ц, р, у 0: Откуда х, (t) = — ИЛИ х_ (t) = —, тогда 1 Р 2 \1 л- yl(t)„ -=М Ьо лР , ( ) 1 х ря л Л y2(t) = —— =0 _ АЛ Цч ,Л m Т.о. получаем хі,Уі- малые приращения величин X/ и у і в = 1 + 1 окрестности первого положения равновесия. хт = -(pxj + PXjXyJ + )- ц(х + хх) -f Л = = -рхУі - pxjyj - рхіУі - pXlyj - цх - jiXj + Л ХҐА цч А, „ /А ич X где Рх1у1 - второго порядка малости (можно пренебречь). Аналогично, Sr=(pxf+pxjXyf+yp - A.(y+уг)= = pxy у + px j y t + РхіУі + px - A,yj - = =/- + + -.)./+ -ГРЛ , 1 т

Таким образом, линеаризованная система имеет вид: рл х, = X "хі"хУі Уі = хіі т Iх) Найдем условия, накладываемые на (З, Л, ц, /і, у, при которых данная -х ґ г, л Л X система, а значит и матрица А = х ц О была бы устойчивой. Для этого необходимо, чтобы в и)ь=Р2+р-—1-рл-Хц=0 элементы/? были неположительными. Рассмотрим квадратное уравнение: р +р Ьрл-А,ц = 0 X о = ( )2-4(рл-ад X - Ч(1Г)2-4 РЛ-А40 Pl=— —L о М+ (М)2_4(рл- ) 0 при РЛ Я,ц, см.( ) 2 р, 2 - комплексные числа (силу малости /Г), имеющие отрицательные Г Л Х действительные части, значит положение равновесия (хь уі), где Хі=— чел., Ли Уі= - чел., является асимптотически устойчивым. к (3 Подставим значения коэффициентов (рассчитаны ниже): /5=3-10 , Л=238, /л=0,001,1=0,701. п 3-Ю"5-238,2 л( 5 ) = ( V-4(3-10-5-238-хорошо наблюдается: 40 000 38 000 36 000 34 000 32000 30 000 28 000 26 000 24 000 22 000 20 портрет у(х) Линеаризуем описанную выше систему в окрестности второго Л положения равновесия: х о Пусть Х2 Х1 И , где Х-,у0- малые приращения величин х2 III" ЛЛ ШЛ У 2 = Уі+У2 у2 в окрестности второго положения равновесия. х2=-{рх2 +Рх2){у2 +у2)-/л(х2+х2) + К = = -/ьМ - рх % - рх7у - p5L% - jUX - fix- + Л = 2- 2 2- 2 2 2 2- = -/?—0-/3—у -рх -Q-ju /лх +Л = м м М Л _ s т л _ = -Х-р—у? Мху +A=-jLix7 -Р—У-у где Рх7у?- второго порядка малости (можно пренебречь). Аналогично, Р2 =(/}х02+/к2)(у+у2)-Л(у +y2) = = fix%y j +fix% +fix0y% +Px.y0 -Ay -X% = 2J2 1/1 2- 2 2J2 Л л . Л = fi—0+/з—у.+рх.-0-Л-0-Яуо = М M л_ ._ л __ = - ,- 2= Д) 2 Таким образом, линеаризованная система имеет вид: Л х2 = -/ Х -J3 у М Найдем условия, накладываемые на Д А, ц ft, у при которых данная система, а значит и матрица Л = (/? Л)у Л -м р— А = Л ,Л о (/? Я) была бы устойчивой. Для этого необходимо, чтобы в характеристическом элементы/? были неположительными. і) f А)+(Я//- Л) = Рассмотрим квадратное уравнение: р2+р(/Л-— г-л) + (Л//-/?Л) = 0 М м -(М- +л)-1(М- -+Л)2-4(ЛМ-/ЗА) Л- Ч—А Рг = _(//_А+А)+ (м- +Л)2-4(ЛМ-/ЗА) М V м 2 Г6 Л =- Подставим значения коэффициентов: /5=3-10 , А—238, fi—0,001, 1=0,701. D = (-0,012)2 - 4(-0,000013) -(-0,012) -л/05000196 рх = — - -1 = -0,002 -(-o,oi2)+J05000196 р2=- } » = 0,026 рХ2- действительные числа разных знаков, значит положение равновесия (х2, ут), где = 238000 чел., у2=0 чел., не является устойчивым.Оно могло бы быть устойчивым, если быр2 0, для этого необходимо, чтобы (jU \-Л)2-4{Л/Л-(5А) (jU — h я) или V м м Я/1 -/ЗА 0, то есть Я/л /ЗА, чего не может быть в силу условия ( ). Такаим образом, найдена единственная точка устойчивого равновесия для однородного сообщества при параметрах, рассчитанных для города Архангельска. Известно, что любая управляемая система работает под воздействием случайных возмущений и помех, то есть поведение такой системы в реальных условиях невозможно изучить без привлечения вероятностных методов. Так, например, невозможно сколько-нибудь полно изучить характеристики устойчивости и управляемости процесса распространения эпидемии, зная только начальные условия и уравнения динамики процесса.

В действительности процесс распространения эпидемии происходит в реальности, которая постоянно изменяется под воздействием множества случайных факторов. Анализ динамики управляемых механических, электромеханических, экономических, экологических и ряда других систем при случайных внешних воздействиях сводится к исследованию вероятностных и статистических свойств решений систем дифференциальных уравнений, возмущённых случайными процессами. В общем случае такие системы описываются уравнением вида: Ф) = А(Х, t) + B(X, tmt, ев), (1.9.1.1) at X{0,CD) = XQ(CO) (1.9.1.2) где X(t,a )eR" - вектор состояния системы; %(t,a))&Rm - стохастическое возмущение, представляющее собой векторный белошумный случайный процесс. Будем называть белым шумом любую случайную функцию с некореллированными значениями, имеющую бесконечную дисперсию и конечную дисперсию интеграла от неё по любой конечной области изменения аргумента. A(X,t)GR" и B(X,t)eRn,an - матричные функции своих аргументов; X(О, со) GR" - случайный вектор начальных условий. К исследованию систем вида (1.9.1.1)-(1.9.1.2) сводится решение широкого класса задач статической механики, электродинамики, финансовой математики, протеиновой кинетики и других дисциплин. Первая такая задача была рассмотрена Л.Башелье [37] в связи с изучением одномерного броуновского движения частицы. Результаты Л.Башелье были обобщены А.Эйнштейном и М.Смолуховским [36] на многомерный случай. Более широкая постановка задачи о стохастическом рассмотрении динамических систем содержится в работе А.А.Андронова, А.А.Витта и Л.С.Понтрягина [20]. Эти фундаментальные работы положили начало статистическому описанию динамических систем, получившему в настоящее время широкое применение и развитие. Если рассматривать белый шум %(t,ai) на временном промежутке [0,+оо) в классе обобщенных функций, то на него можно смотреть, как на производную -мерного винеровского процесса f(t,co), ґє[0,+со) с коэффициентом диффузии а2 = 1. Таким образом, (t,a ) = w(t,a )= l, ґєГ = [0,+ВД). at Приходим к следующей стохастической модели состояния. dX(t, со) = А{Х, t)dt + В(Х, t)df(t, со) (1.9.1.3) Х(0,о)) = Х0(а) (1.9.1.4) Стохастическая модель состояния (2.1.3)-(2.1.4) представляет собой задачу Коши для системы стохастических дифференциальных уравнений.

Анализ численного решения при различных параметрах

Разобьём общество г. Архангельска на три возрастные группы: I группа - дети от 0 до 6 лет, II группа - дети от 7 до 14 лет, III группа - взрослые. Для проведения эксперимента на реальной модели были взяты статистические данные по развитию эпидемии гриппа в городе Архангельске. Информация предоставлена Территориальным управлением по эпиднадзору города Архангельска за период с 1 января 2005 года по 2 июня 2006 года (79 недель) [см. приложение 6]. С ростом стоимости управления растёт число больных, следовательно, общее число переболевших: Из рисунка 41 видно, что усиление управления эпидемией с помощью карантина не снижает, а, наоборот, увеличивает число подверженных инфицированию, так как снижение числа инфицированных (рис.39) происходит за счёт разрыва связи между больными и здоровыми, подверженные не заразились и не перешли в разряд больных. Теперь введём в рассмотрение коэффициент Ъ (стоимость оставшихся больных на конечный момент времени Т=10 недель) и придадим ему различные значения от Ідо 100, Сі=с2=Сз=3: Из таблицы 10 видим, что с увеличением коэффициента Ъ суммарные затраты на погашение эпидемии растут, продолжительность управления тоже растёт, стремясь к предельному значению - 10 недель. Значит выгоднее изолировать как можно больше больных, чем оставить их в обществе, что может вызвать вторичную инфекцию. Рассмотрим процесс распространения эпидемии как дискретную задачу оптимального управления: xi+1 = Xі + (-pVy H- A- MX At, i = 0;q-l ІУІ+1 = +(( - p. -ц-у)уі-иі)Аі, i = 0;q-l х єХсГ, i = 0 q _ (2.4.4) y1 GY;(zRn, i = 0;q [u]J-! =( , ,..., -1) (2.4.5) U(x,y)- множество допустимых управлений, D- множество допустимых процессов, D1 - множество компонент допустимых процессов и подмножеств G\ cz X;, Gf с: Yi - множеств достижимости на і-том шаге і = 0;q. Наряду с задачей (2.4.2)-(2.4.5) рассмотрим семейство усечённых по отношению к ней задач, каждая из которых отличается от исходной тем, что в качестве начальной точки рассматривается хк є Gk, ук є Gk: ІСх У.ИГ1 ! +cui)At + byq - inf (2.4.6) i=k x1+l = x +(-$х1у1 +A-\ixl)At, i = k;q-l yi+1 = y1 + (PxV1 - (ц + p, + y)y - u )At, і = k;q-l x eXjCR", i = k;q y GYjCiR", i = kTq (2.4.7) (2.4.8) u eU cR , i = k;q-l (2.4.9) Введем множества: ик(х) = {[и]Г:и;еиМ = к;Я-1, xi+I = Xі + (-ЭхУ + Л - uxj)At є Хі+1, і = k;q-l у1+,=уі+(Рхіуі-(ц + Д + У)у,-иі)АієУі+1, i = k;q-l}, Gk={xeXk:Uk(x) 0}. Функция есть функция Беллмана дискретной задачи оптимального управления. Пусть Dk(x, у) (k = 0,...,q) - множество первых компонент допустимых управлений усечённой задачи, т.е. Dk(x, у) = {uk є Uk3uk+1 є Uk+1,..., uq_l є U4"1 :[u\uk+1,...,u4_1] є Uk(x,y)}

Принцип перехода. Если ни одно из множеств Gk, k = 0,...,q не является пустым, то функция Беллмана удовлетворяет рекуррентным соотношениям, называемым уравнением Беллмана: Bk(x,y)= inf [(yk + cuk)At + Bk+1([xk+(-pxkyk+A-j xk)At, и.оЧх) (2.4.11) ук+((Зхкук-(ц + Д + у)ук-ик)А1)]) гдехкєСк, ykeG2k, k = 0,...,q-l. Дляк=Ч: Bk(x,y) = byq, yqeGq (2.4.12) Принцип оптимальности. Пусть ([x],[y],[u]q_1)- оптимальный процесс в задаче (2.4.2)-(2.4.5), 1 1( , )= о inf І(х0,у,[иҐ), (2.4.13) [ulg- eDoCx) и xkeGk,yksGk- некоторая точка оптимальной траектории([х],[у]), тогда управление [u]q-1 является оптимальным в усечённой задаче (2.4.6)-( 2.4.9). Смысл данной теоремы в том, что экстремум в правой части (2.4.10) достигается на оптимальном управлении, подуправление [u]k_1 оптимального управления оптимально и, как следствие, подпуть [x]k_1,[y]k_1 оптимального пути оптимален. Дискретное уравнение Беллмана (2.4.11) является достаточным условием оптимальности. Схема Беллмана. Алгоритм решения задачи (2.4.2)-( 2.4.5) состоит из трёх этапов: I этап (по убывающему индексу к). Для k=q, согласно (2.4.12), Bk(x,y) = byq, yeGq, (Gq=Yq). k=q-l: Строим множество G czX р G czY , (если для хєХ.,, уєУ._, существует ueU4"1, такое, что Fq-1(x, у, u)eG4, то Ч Ч xeG , ysGj_p a uGDq_1(x,y) и для каждого xeG , yeG -множество допустимых компонент управлений D4-1 (х, у). Далее для каждого х є G ,, у є G _, находим значение функции Беллмана, Ч Ч используя (2.4.11): ВчЧ(х,у)= inf [(y 4cyq-1)At+B4([x»_1-l-(-Pxq-1yq-I+A-px4-,)At], х,У«Ан( ) [у"-1+(рхч-уЧ-(Ц+Д+У)УчЧ-ич"1)Аф]= inf [(yq-1+cuq-1)At+b(yq-1+ (2.4.14) ueD Cx) х, єОч_,(х) -KPxq4 -ц-Д-у)уч4 -uq- )At] и uq_1(x,y)- компоненту оптимального управления в каждой точке х є Gq_p у є Gq_] на шаге q-1, на которой достигается экстремум в (2.4.14). Здесь, очевидно, w-l= umax, если cAt - bAt 0 О, если cAt - bAt 0 k=g-2: Находим множество Gq_2czXq_2, Gj_2cYq_2 и для каждого x є Gq_2, у є G2_2 строим множество D4-2 (х, у). Bq-2(x, у) = inf [(yq 2 + cuq"2)At + Bq4([x4-2 + (-Pxq-2yq-2 + Л usD4 2(x) x.yeG4-2M (2.4.15) xq-2)At],[yq-2 + (Pxq-2yq-2 -(ц+іі + у)у4-2 -uq"2)At])] Решаем задачу минимизации (2.4.15) для каждого xeG -,, yeG2,, определяем значение функции БеллманаВч_2(х) и йч-2(х)- компоненту оптимального управления в каждой точке xeG _2, yeG2_2 на шаге q-2 и т.д. для каждого k=q-3,...,0 Находим множество G,cX0, GQC:Y0 и для каждого xeGJ yeG2, определяем множество D0(x). В(х,у)= inf [(у + си + ВЧ[х0 + (-Рх0у + Л ueD(x) t.yeG0(x) (2.4.16) -ux)At], [y + (Pxy - (]i + Д + y)y - u)At])] Решая задачу (2.4.16), находим B(x,y) и й(х,у) для каждого х є Go,y є G2Q. Итак, на первом этапе решения задачи (2.4.2)-(2.4.5) для каждого xeG ysG ,k = 0,...,q-l находятся значения функции БеллманаВк(х,у)и компоненты оптимального управления йк(х,у) для каждогохєО,,уєО2,к = 0,... -1. Найденное на I этапе оптимальное управление является синтезом. В отличие от программного управления, которое зависит только от момента времени t (шаг к) и определено только для точек xk,yk,k = 0,...,q-l, принадлежащих оптимальной траектории, синтезирующая функция управления u = G(t, х, у) для всех точек х є UkloGJ,, у є U=0 G2. Таким образом, решение уравнения Беллмана равносильно решению проблемы синтеза для задачи (2.4.2)-(2.4.5), которая заключается в построении оптимального управления в форме синтеза, зависящего от состояния системы хк є G,,yk є G2. на каждом шаге. II этап. Среди всех точек с координатами х GG{,,y «EG2, выбирается заданное начальное значение (хо,уо) и соответствующее ей й(х,у). Оптимальное значение целевой функции (2.4.2): і; =В0(х,у0,й)= inf В(х,у0) (2.4.17) uusD0 Шэтап. (по возрастающему индексу к)

Алгоритм численного решения задачи методом проекции градиента

Вывод: С ростом стоимости вакцинации растёт остаточное число подверженных заболеванию и число инфицированных (Рис.51), резко снижается продолжительность управления вакцинацией. Но в тоже время незначительно, но растёт продолжительность управления карантином, и значительно - программой «Здоровье», так как его стоимость гораздо меньше стоимости карантина (Рис.52). Увеличивается суммарная стоимость затрат на погашение эпидемии (таблица 12). Теперь зафиксируем стоимость вакцинации и программы «Здоровье», меняем относительную стоимость карантина. Линия (1) соответствует Ci=0,5; линия (2) соответствует С2=1,5; линия (3) соответствует Сз=2,5; линия (4) соответствует С4=3; Вывод: С ростом стоимости карантина снижается продолжительность управления карантином, и, как следствие, растёт число инфицированных, остаточное число подверженных заболеванию снижается, так как они заражаются интенсивнее и переходят в разряд больных. Но в тоже время продолжительность управления вакцинацией и программой «Здоровье» незначительно, но растёт. Также незначительно растёт суммарная стоимость затрат на погашение эпидемии (таблица 13). Теперь зафиксируем стоимость вакцинации и карантина, меняем относительную стоимость программы «Здоровье». Линия (1) соответствует Zi=0,l; линия (2) соответствует z2=0,05; линия (3) соответствует гз=0,01; линия (4) соответствует Z4=0,0005; ДинамикаХ4Щ 3_ 4 Вывод: С ростом стоимости программы «Здоровье» резко снижается продолжительность управления программой «Здоровье», и, как следствие, растёт число инфицированных и остаточное число подверженных заболеванию. Но в тоже время продолжительность управления вакцинацией растёт, управление карантином не изменяется. Значительно растёт суммарная стоимость затрат на погашение эпидемии (таблица 14). Итак, можно сделать общий вывод: с ростом стоимости какого-то вида управления продолжительность его снижается, но в то же время растёт продолжительность других управлений.

Увеличивается суммарная стоимость затрат на погашение эпидемии. Общая эпидемиологическая картина ухудшается. Рассмотрим задачу (4.1.1), (4.1.3), (4.1.5), (4.1.6). Разобьём отрезок [0;Т] на q равных частей точками 0 = t0 tj ... tq =Т так, что At = ti+1i5 і = 0, q — 1. Рассмотрим задачу (4.1.1), (4.1.3), (4.1.5), (4.1.6): V(x,y)- множество допустимых управлений вакцинацией, U(x,y)-множество допустимых управлений карантином, W0 (х, у)-множество допустимых управлений программой «Здоровье». D0- множество допустимых процессов, D1 - множество компонент допустимых процессов и подмножеств GjczXj, GfcrY;- множеств достижимости на і-том шаге i = 0Jq. Разобьём отрезки управления [0;umax], [0;vmax], [0;wmax] на 1, г, к равных частей соответственно точками 0 = u0 u1 ... u,=umax, Au = ui+1-ui3 і = 0,1 — 1 0 = v0 v1 ... vr = vmax, Av = vi+1-vi5 i = 0,r-l 0 = w0 Wl ... wk=wmax ,Aw = wi+1-wi5 i = 0,k-l Находим B0(x,y) Hv0(t),u0(t),w0(t) для каждого x =G[,,yeGo. Итак, на первом этапе решения задачи для каждого xeGk,y GGk,k = 0,...,q-l находятся значения функции БеллманаВ0(х,у) и компоненты оптимального управления vk(x,y) для каждогох є Gk,у є Gk, k = 0,...,q -1. Найденное на I этапе оптимальное управление является синтезом. В отличие от программного управления, которое зависит только от момента времени t (шаг к) и определено только для точек xk,yk,k = 0,...,q-l, принадлежащих оптимальной траектории, синтезирующая функция управления v = v(t, х, у) для всех точек х є Uk оGk, у є Uklo Gk. Таким образом, решение уравнения Беллмана равносильно решению проблемы синтеза для задачи, которая заключается в построении оптимального управления в форме синтеза, зависящего от состояния системы хк є Gk,yk є Gk на каждом шаге. і Находится xeG yeGg- оптимальная точка из условия минимизации функции В0(х, у) на множестве G0 и оптимальное значение целевой функции : Г0=В0(х,у)= inf В(х,у) х;. yeG0 III этап, (по возрастающему индексу к) Последовательно применяя найденный оптимальный синтезvk(x,у), uk(x,y),wk(x,y) и оператор перехода с учётом начальной фазовой точки находим оптимальную траекторию [х]4, =(х,х1,...Дч), [у]4, = (у,у1,...,уч) и соответствующее оптимальное управление [V]}"1 =( , ,..., -1). v0 (х, у), и0 (х, у), w0 (х, у) - найдено на I этап. Для начальных данных х0=3500, у0=300 и ограничениях на управление: 0 v 20, 0 u 50, 0 w 0,2, і = 0;q — 1, зафиксировав относительные стоимости: вакцинации одного человека d, информационной программы на одного человека 1, остаточную стоимость больного b и меняя относительную стоимость изоляции одного больного с, получим: Из таблицы 15 и рис. 56 видно, что при относительной стоимости изоляции с=1 управление проводилось, в основном, с помощью карантина (изоляции) и информационной программы, в меньшей степени — вакцинацией. К концу 8 недели эпидемия была полностью погашена. С ростом стоимости изоляции в пять раз (от с=1 до с=5), когда с=Ь=5, к концу 10-й недели эпидемия не погашена, остаточное число больных равно 40 чел., управление карантином (изоляцией) снижается, управление информационной программой и вакцинацией усиливается, суммарные затраты на погашение эпидемии возросли. При дальнейшем росте относительной стоимости изоляции (с=10), управление карантином (изоляцией) стремительно снижается, опять усиливается управление с помощью вакцинации. Остаточное число больных 460 чел. Суммарные затраты на погашение эпидемии снова возросли. Когда с=50, управление карантином (изоляцией) выключается. Остаточное число больных 640 чел. Суммарные затраты на погашение эпидемии снова возросли (за счёт штрафа за остаточных больных). При повышении стоимости карантина остаточное число подверженных инфицированию снижается частично за счёт усиления управления вакцинацией, частично за счёт перехода в число инфицированных. Общая эпидемиологическая картина ухудшается. Зафиксировав относительные стоимости: изоляции одного больного с, информационной программы на одного человека 1, остаточную стоимость больного b и меняя относительную стоимость вакцинации одного человека d, получим:

Похожие диссертации на Задача оптимального управления в модели эпидемии