Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Некоторые минимаксные задачи управления и маршрутизации Серов Вячеслав Петрович

Некоторые минимаксные задачи управления и маршрутизации
<
Некоторые минимаксные задачи управления и маршрутизации Некоторые минимаксные задачи управления и маршрутизации Некоторые минимаксные задачи управления и маршрутизации Некоторые минимаксные задачи управления и маршрутизации Некоторые минимаксные задачи управления и маршрутизации Некоторые минимаксные задачи управления и маршрутизации Некоторые минимаксные задачи управления и маршрутизации Некоторые минимаксные задачи управления и маршрутизации Некоторые минимаксные задачи управления и маршрутизации
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Серов Вячеслав Петрович. Некоторые минимаксные задачи управления и маршрутизации : Дис. ... канд. физ.-мат. наук : 01.01.02 Екатеринбург, 2002 107 с. РГБ ОД, 61:02-1/883-X

Содержание к диссертации

Введение

Глава 1. Задача обхода системы множеств в классе позиционных стратегий 31

1.1. Постановка задачи последовательного обхода системы множеств в классе позиционных стратегий 31

1.2. Уравнение Беллмана 40

1.3. Оптимальная минимаксная стратегия 44

1.4. Задача на узкие места 52

1.5. Эвристические стратегии 54

Глава 2. Минимаксные задачи последовательного управления 58

2.1. Одна минимаксная задача управления с импульсным ограничением на управление и ее расширение в классе конечно-аддитивных мер 60

2.2. Необходимые условия оптимальности обобщенного управления 66

2.3. Задача последовательного программного уклонения для собственно линейной системы с комбинированным ограничением на управления 77

2.4. Необходимые условия оптимальности в задаче программного уклонения с геометрическими ограничениями на управление 84

2.5. Примеры 89

Приложение 94

Литература 97

Введение к работе

Актуальность темы. Работа посвящена минимаксным задачам маршрутизации и последовательного управления.

В последние годы классические задачи комбинаторной оптимизации (в первую очередь, задача коммивояжера (ЗК), задача о наикратчайших путях (ЗНП), задача о минимальном остовном дереве) стали изучаться в обобщенной постановке, когда вместо фиксированного узла і, рассматривается множество М<, которому может принадлежать узел і,. Преимуществом таких обобщенных постановок задач комбинаторной оптимизации является то, что появляется дополнительная свобода варьировать узлы Х{ для достижения лучшего качества. Однако в ряде задач следует считаться с наличием неконтролируемых воздействий.

В связи с этим, в настоящей работе делается следующий шаг в этом направлении, и предлагается постановка, в которой нет возможности выбирать точки Хі или управлять ими. Таким образом, получаем игровую ситуацию, когда распоряжение точками Zj отдается игроку-противнику или (противостоящей) природе. Множествами М,- моделируется (непредсказуемое) поведение точек Хі (они могут представлять собой, в зависимости от конкретной задачи, помехи, ошибки, возмущения, шумы, сбои и т.п., или разумные управления игрока-противника).

Особый интерес представляют позиционные динамические задачи (ЗК ЗНП и др.), когда решения принимаются игроками в динамике, в зависимости от предыдущих действий противника. Построение позиционных стратегий управления является здесь новым, неисследованным и трудным кругом задач. Основной вопрос при решении задач этого класса заключается в следующем: как подойти к конструированию управления по принципу обратной связи в динамической игре с комбинаторным функционалом, и как сформулировать и решить задачу в замкнутом виде?

Н.Н. Красовским, А.И. Субботиным и их сотрудниками была создана теория позиционных дифференциальных игр.1'2;3;4;^6 Настоящая работа,

'Красовскии Н.Н., Субботин А.И. Позиционные дифференциальные игры. - М.: Наука, 1974. 3Krasovskii N.N., Subbotin A.I. Game-theoretical control problems. - New York: Springer, 1987. 3Osipov Yu.S., Kryazhimski A.V. Inverse problems for ordinary differential equations: Dynamical solutions. - London: Gordon and Breach, 1995.

'Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. - М.: Наука, 1981. 5Субботин А. И. Минимаксные неравенства и уравнения Гамильтона -Якоби. - М.: Наука, 1991. "КуржанскиА А.Б. Управление и наблюдение в условиях неопределенности. - М.: Наука, 1977.

в которой вводится и изучается обобщенная ЗК в игровой постановке в классе позиционных стратегий, основана на этом подходе, связанном с минимизацией гарантированного результата в классе позиционных стратегий, что объективно сближает рассматриваемую постановку с задачами теории дифференциальных игр. В 7 даны многочисленные примеры содержательных задач управления, формализуемых в рамках теории дифференциальных игр. Теория дифференциальных игр получила свое глубокое развитие в работах Р.В. Гамкрелидзе, Н.Н. Красовского, А.В. Кряжимского, А.Б. Куржанского, Е.Ф. Мищенко, Ю.С. Осипова, Л.С. Понтрягина, Б.Н. Пшеничного, А.И. Субботина, В.Е. Третьякова, А.Г. Ченцова, Ф.Л. Черноусько, А.А. Чикрия; отметим также исследования Э.Г. Альбрехта, В.Д. Батухтина, П. Варайи, Н.Л. Григоренко, П.Б. Гусятникова, А.Ф. Клейменова, А.Н. Красовского, Дж. Лейтма-на, Н.Ю. Лукоянова, М.С. Никольского, B.C. Папко, Н.Н. Петрова, Л.А. Петросяна, Н.Н. Субботиной, A.M. Тарасьева, В.И. Ухоботова, В.Н. Ушакова, В. Флеминга, А. Фридмана и др.

Обобщенная (неигровая) ЗК и ее решение методом динамического программирования рассматривались8"9 А.Г. Ченцовым и его сотрудниками. Следует отметить, что многие комбинаторные задачи могут быть переформулированы в виде ЗК или обобщенной ЗК. Как отмечается в литературе, ЗК занимает центральное место в комбинаторной оптимизации, и она явилась прототипической задачей современной комбинаторной оптимизации. Простота ее формулировки сочетается с трудностью решения. Многие подходы к решениям, ставшие стандартными в комбинаторной оптимизации, сначала были развиты и опробованы в контексте ЗК. Таким образом, в данной работе объединяются рамки и инструментарий теории динамических игр (программное движение, позиционная стратегия, движение, порожденное позиционной стратегией, многократный минимакс, позиционный минимакс, и др.) и весьма нетривиальная комбинаторная задача, каковой является обобщенная ЗК, так что данная тематика органически связана с задачами управления.

В диссертации рассматриваются также некоторые программные минимаксные задачи оптимального управления. Основой рассматривае-

7 Айзеке Р. Дифференциальные игры. - М.: Мир, 1967.

8Chentsov A.G., Korotayeva L.N. The dynamic programming method in the generalized traveling salesman problem//Mathl. Comput. Modell. - 1997. - Vol. 25, N 1. - P. 93-105.

вКоротаева Л.Н., Сесекин A.H., Ченцов А.Г. Об одной модификации метода динамического программирования в задаче последовательного сближения//Журн. Выч. Мат. Мат. Физ. - 1989. - Т. 29, N 8. - С. И07-П13.

мых конструкций является теория принципа максимума Л.С. Понтря-гина. В работе изучаются, в частности, задачи сближения и уклонения траекторий управляемой системы относительно дискретной по времени системы выпуклых компактов, при различных типах (в том числе комбинированных) ограничений на управление. В идейном отношении предлагаемые конструкции следуют подходу,10»11 который предполагает совместное исследование пары экстремальных задач (оптимального управления и математического программирования (МП)), находящихся в двойственности. Такой подход дает возможность в целом ряде случаев для решения задач оптимального управления использовать методы математического программирования, получая эквивалентные по результату конечномерные экстремальные задачи. В11 подход был продвинут на случай задачи сближения с выпуклым компактом в заданной момент времени (при геометрических ограничениях на управления). В работе Н.Н. Красовского12 для решения задач оптимизации впервые была применена проблема моментов. Различные задачи управления на основе функционального подхода рассматривались в работах Ф.М. Кирилловой, Р. Габасова, М.И. Гусева, А.Б. Куржанского, Ю.С. Осипова.

В работах Ю.И. Бердышева, А.В. Кряжимского, А.Г. Ченцова рассматривались задачи последовательного управления при обходе системы компактных множеств, когда производится совокупная минимизация системы рассогласований; такие постановки связывают конструкции теории оптимального управления и теории маршрутных задач. Задачи последовательной оптимизации в игровой постановке изучались в работах А.Н. Красовского, Н.Н. Красовского, Н.Ю. Лукоянова, А.А. Чикрия13>,4>15 .

В ряде прикладных задач приходится решать вопросы взаимодействия двух управляемых систем с импульсными управлениями; это взаимодействие может проходить в условиях неполной информации и, возможно, конфликтности. Задачи управления с обратной связью традиционно являются одним из предметов теории дифференциальных игр.

10Красовский Н.Н. Теория управления движением. - М.: Наука, 1968.

"Красовский Н.Н. Игровые задачи о встрече движений. - М.: Наука, 1970.

Красовскии Н.Н. К теории оптимального регулярования//Автом. Телемех. - 1957. - Т. 18, N 11. - С. 960-970.

,3Krasovskii A.N., Kraeovskii N.N. Control under lack of information. - Boston: Birkbauser, 1995.

"Красовский H.H., Лукоянов Н.Ю. Задача конфликтного управления с наследственной информа-цией//Прикл. Матем. Мех. - 1996. - Т. 60, вып. 6. - С. 885-900.

15Chikrii A.A. Conflict-controlled processes. - Dordrecht: Kluwer, 1997.

Также приходится работать и с минимаксными задачами программного управления (см.1'2,4'6'8-10, а также работы16»17'18 ). В диссертации исследуется, в частности, минимаксная задача импульсного программного управления в условиях, когда о фазовом состоянии одного из объектов имеется лишь неполная информация, а также в условиях последовательного обхода системы множеств. В смысле интегральных ограничений, ограничение на полный импульс управляющей программы представляет основной интерес, поскольку для многих задач механики, космической навигации, экономики, биомедицины, радиотехники и др. актуальны именно такие ограничения на управляющее воздействие. Для решения в замкнутом виде таких задач, рассматриваемых в диссертации, используются процедуры компактвфикации в классах обобщенных управлений-мер.

Цель работы. Построение теории позиционного управления в игровой комбинаторной задаче последовательного обхода системы множеств. Получение необходимых условий оптимальности для задач последовательного управления относительно системы выпуклых компактных множеств при различных ограничениях на управления.

Методы исследования. Используются методы теории оптимального управления, дифференциальных игр, функционального анализа, теории меры, комбинаторной оптимизации.

Научная новизна.

  1. Построена теория позиционного управления в минимаксных задачах последовательного обхода конечной системы множеств.

  2. Получены необходимые условия оптимальности в классе конечно-аддитивных управлений-мер для задач управления линейными системами с импульсными ограничениями и разрывными коэффициентами при управлении, включая задачи последовательного сближения с системой выпуклых компактов.

3. Получены необходимые условия оптимальности в задаче про
граммного уклонения для собственно линейной системы.

Теоретическая и практическая ценность. Полученные результаты могут быть использованы при синтезе управления в прикладных

Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. -М.: Наука, 1969.

17Гамкрелидэе Р.В. Основы оптимального управления. - Тбилиси: Изд-во Тбил. ун-та, 1977.

Куржанский А.Б., Осипов Ю.С. К задачам программного преследования в линейных систе-мах//Изв. АН СССР. Техн. киберн. -1970. - N 3. - С. 18-29.

задачах, связанных с маршрутизацией (например, в динамических сетевых задачах) при наличии неопределенностей. Результаты также могут применяться для построения управления в задачах последовательного обхода множеств.

Апробация работы. Результаты диссертационной работы докладывались на семинарах отдела управляемых систем ИММ УрО РАН, совместных семинарах кафедры теоретических основ радиотехники РТФ УГТУ-УПИ и отдела управляемых систем, VII Всесоюзной конф. "Качественная теория дифференциальных уравнений" (Рига, 1989), VII Всесоюзной конф. "Управление в механических системах" (Свердловск, 1990), 2 Междунар. Семинаре "Негладкие и разрывные задачи управления и оптимизации" (Челябинск, 1993), 11 Междунар. Семинаре ИФАК "Control Appications of Optimization" (С-Петербург, 2000), 5 Симпозиуме ИФАК "Nonlinear Control Systems" (С-Петербург, 2001).

Публикации. Основные результаты диссертации опубликованы в 12 работах [1-12].

Структура и объем работы. Диссертационная работа состоит из введения, двух глав, приложения и списка литературы. Общий объем — 107 страниц машинописного текста. Библиографический список содержит 101 наименование.

Постановка задачи последовательного обхода системы множеств в классе позиционных стратегий

В этой главе рассматривается игровой вариант обобщенной задачи коммивояжера (ОЗК). Задача состоит в том, чтобы посетить все множества из заданной системы попарно непересекающихся множеств Aii,..,,Mm в Rn так, чтобы минимизировать стоимость обхода. Задача осложнена наличием неопределенных факторов в пределах множеств Мк\ значения этих факторов заранее неизвестны. Для решения этой задачи мы применяем упорядочивающий алгоритм Беллмана-Хелда-Карпа [2, 67] и подходы теории динамических игр (см.: например, [25, 27, 63, 92]).

Приведем сначала некоторые предварительные сведения. В стандартной форме задача коммивояжера формулируется следующим образом. Даны точки ("города") XQ, Х\, ..., хт в Rn, где город хо есть начальный город. Коммивояжер, начиная движение из XQ, имеет своей целью посетить все города i,..., хт (каждый город должен быть посещен в точно сти один раз), и при этом минимизировать стоимость обхода. Возвращение в город XQ не предполагается, так что рассматривается открытая ЗК (случай замкнутой ЗК легко получается модификацией открытой ЗК). Обычно рассматриваются два вида функций стоимости, которые определяют аддитивную ЗК.

Каждая фиксированная перестановка г определяет свою очередность посещения системы множеств Mi,..., Mm, так что будем называть перестановки г также (полными) маршрутами.

Используя терминологию теории динамических игр, которая очень удобна в данном случае, задача коммивояжера может рассматриваться как задача нахождения оптимального управления г, где допустимое множество управлений есть множество всех перестановок г чисел 1,..., т. В такой (программной) постановке маршруты г (допустимые управления) заданы на всем "интервале времени" [0, т] заранее, то есть до начала обхода, и впоследствии не корректируются.

В [23, 83] рассматривается обобщение ЗК, когда можно варьировать город Хк в пределах заданного непустого компактного множества Мк С Rn (fee l,m). В этой ОЗК требуется перенумеровать множества Mk, к 1, т, в порядке МГ1,..., МГтп и выбрать m-набор (%k)keTjn точек

xi Є МГ11...,хт Є М так, чтобы минимизировать (комбинаторную) целевую функцию

m 1 = S Crk(Xk-UXk)

или

где 2 есть фиксированный начальный город, a Cj{x,y) есть стоимость перехода из ж в у Є М,-. Таким образом, это задача совместной минимизации по г и m-наборам (fe)keT m

I -» min inf (1.1.1)

Последовательно соединяя точки жо, i , т получаем ломаную линию в Rn. Определим программное движение, или траекторию вдоль заданного маршрута г из точки XQ как любой кортеж (й)&єот Такй, что V? Є l,m : Xj Є Мг (здесь 0,m — {0} U l,m). Итак, в задаче (1.1.1) оптимизируется и маршрут, и траектория. Задача (1.1.1) является дискретно-непрерывной задачи оптимизации, и декомпозиция этой задачи на дискретную подзадачу (выбрать г) и непрерывную подзадачу (выбрать точки посещения х во множествах М ., к Є 1, m) невозможно, поскольку решения этих подзадач взаимозависимы (г и (xk)k nK являются связанными переменными: (x )fcej = {xk)ke\jn{r)) Задача (1.1.1), так же как и ЗК, является программной задачей оптимального управления, и оптимальное управление {r, {%)k =] m} может быть вычислено заранее, перед началом обхода.

Рассмотрим теперь иную, игровую задачу обхода заданной системы попарно непересекающихся множеств Mi,..., Mm в классе ломаных линий. Множества Mfe, к 1,т, предполагаются компактными (и не обязательно выпуклыми). Векторы xjj Є Mk теперь являются неопределенными факторами. Именно, разделяем теперь управление {г, (яй) :єТт} на две части, отдавая право выбирать маршрут г первому игроку (игроку 1), а право выбирать точки посещения Хк Є МГк, к Є 1, m, - второму игроку (игроку 2).

Поскольку XQ фиксирован, будем, для удобства, рассматривать целевую функцию / как функцию г и {хк)кЇЇ :

Иг, Ы ео } = Сп(хк-ъ хк) (1.1.2)

fc=l

(или

НгЛяк)кбїї) = ы$хсгк{хк-ъхк) ), (1.1.3)

где а: Є МГк} к 1,т; Жо задано.

Скалярные функции Cfc, к Є 1,т, могут быть, например, расстояниями

с (я, у) = z-y

или минимальным временем движения между точками а; и г/ для объекта

имеющего возможность двигаться в любом направлении в Rn со скоростью 0 v а:

Ск(х,у) = х у\\/а.

Предполагается, что функции с&, А; Є l,m, ограничены сверху. Целью игрока 1 является минимизация целевой функции (1.1.2) (или (1.1.3)), а целью игрока 2 - ее максимизация.

Рассмотрим следующую антагонистическую многошаговую позиционную игру двух игроков. В начальный момент "времени" к = 0 траектория находится в состоянии XQ. Игрок 1 выбирает г\ - номер первого множества для посещения. После этого игрок 2 выбирает точку х\ в пределах множества МГд, и, таким образом, траектория приходит в точку х\. Игрок 1 получает информацию о состоянии х\ ("измеряет" его), а затем, зная гу и xi, выбирает номер т второго множества для посещения. После этого игрок 2 выбирает точку х% Є МГ2, и так далее. На (к + 1)-м шаге игрок 1 на основании информации о г\,...,Гк и Xk Є МТк выбирает номер Гк+і следующего множества для посещения, затем игрок 2 выбирает точку х +і Є МГк+1, так что траектория приходит в точку Xk+i-На последнем, m-м, шаге игрок 1 не имеет больше выбора (т.к. остается посетить только одно множество МТт), но игрок 2 выбирает точку хт Є МТт, В результате получаем маршрут обхода г = (ri,...,rm) и траекторию XQ, Х\, ..., хт. При такой игровой формализации игрок 1 на каждом шаге, взависимости от того, какая неопределенность х реализовалась, может генерировать различные продолжения пройденной части маршрута. Получая во время движения информацию о точках Xk, он может, в частности, использовать "неправильное" поведение противника с тем, чтобы улучшить для себя итоговое значение /.

Вышеописанная поочередная игра двух игроков является игрой с информационной дискриминацией первого игрока (в том смысле, что на каждом шаге он "ходит первым" и не знает, каким будет ход противника на этом шаге, тогда как игрок 2, "ходит вторым", зная ход игрока 1 на этом шаге). Итак, игроки ходят поочередно, при этом первый игрок ходит первым.

В качестве игрока 2 может рассматриваться как реальный игрок, разумно противодействующий игроку 1 и стремящийся максимизировать /, так и противостоящая природа, "управляющая" неопределенными факторами, ограниченными условиями Xk Mk, к Є l,m.

Уравнение Беллмана

Построим теперь позиционную стратегию, решающую Задачу 1.1,1 для случая функционала (1.1.2).

Для любого множества Н 21,т такого, что \Н\ 2, определим функцию Беллмана рекурсивным уравнением J(H-y) mm sup {сг(у,х) + J(H \ {г}; х)} (1.2.1 с краевым условием J({i}; у) = sup ъ(у, х) (i в T7m). (1.2.2) ХЄМІ

Функция (1.2.2) характеризует некоторую меру возможных потерь, если траектория, стартующая из г/, прибывает на множество М{.

Принимая во внимание специфику задачи обхода системы множеств, следует вычислять функцию Беллмана по у только на множестве W. Более того, достаточно вычислять J(H\ у) на меньшем множестве позиций (Я, у) таких, что Я Є 21,m, у Є W#, где

WH± \J Mj (Я:Я[ тп-1), jl,m\H

Множество Я в (1.2.1) играет роль множества индексов тех множеств Mfc, которые осталось посетить.

Решение уравнения (1.2.1), (1.2.2) находим рекурсивно. Начиная с краевого условия (1.2.2), на первой стадии вычислим функцию J{H\y) для всех одноэлементных множеств Я = {к} и точек ує{[)Щ)\Мк

(fc Є 1, m). Затем вычислим 7(Я; у) для всех двухэлементных множеств Я — {/г, 5} и точек

го

уе(и )\(м,им5)

(&, 5 Є 1, m, & s), и так далее. Продолжая этот рекурсивный процесс, на предпоследней стадии вычислим фугкцию J(H; у) для всех (т — 1)-элементных множеств Я \ {к} и точек у Є Mfc (fc Є l,m). Наконец, на последней стадии вычисляем значение J(l, m; 2).

Отметим, что по сравнению с 1 рассуждение "по шагам" А;, А; Є l,m, заменяется в этом параграфе рассуждением "по слоям" множеств Я кардинальности т — к + 1, fc Є 1, т. Именно, шаг с номером & соответствует слою оставшихся для посещения множеств Н с кардинальным числом jtf = т — к + 1, и наоборот: для данного Н сразу получаем номер шага к = т — \Н\ + 1. Кроме того, хранение множества индексов г уже посещенных к — 1 множеств МІ на fc-м шаге эквивалентно знанию индексов j остающихся для посещения т — к + 1 множеств Mj.

Далее, имея в виду цель построить стратегию, разрешающую Задачу 1.1.1, мы параллельно с вычислением J(H;y)) находим и храним номер

Rk(H;y)±z(H;y) (1.2.3)

(к = т \Н\ + 1), доставляющий минимум в (1.2.1), для всех Н и у, которые могут возникнуть на этом шаге. Если такой г(Я; у) не единствен, выбираем и запоминаем любой из них.

Теорема 1,2.1. Стратегия RQ, определенная соотношениями (1.2.1)-(1-2.3), удовлетворяет условию

sup I(x(-)) = J{T/m;x0). (1.2.4)

Доказательство. Покажем сначала, что

sup Д (-)) J(T l;xo). (1.2.5)

x{-)X(R)

Зафиксируем произвольное ж{-) = (r, (xf)kQ ) из _Х"(Й). Теперь, двигаясь в обратном направлении, от последнего множества Мг вдоль траектории (XQ, ajj1,..., zJJJ, получаем следующую последовательность неравенств. Имеем:

J{{rmbxm-l) = SUP 4 m-l m) CroJxm bXm),

XmM Q

V{rm-brm) SUP ( ( -2 -1) + SUp CroJxm i,Xm)} V-l m m k—m—l

Далее, в силу определения стратегии Я0, номер г _а был выбран из условия минимума (1.2.1), поэтому

т

= У{гІ-іЛ-і)ї ( -і ї)- (1-2.7)

fc=m—1

Тогда, рассуждая по индукции, предположим, что

т

J({rl-..,ri};xU) Y. li, )

г=к

верно для к Є 2, т — 1, и докажем, что аналогичное неравенство справедливо и для к — 1. В самом деле,

J(irk-v rmh4-2) mm sup { ( .2,2:) +

+Ф2.- Г!,};Ї)}= «Up Ro ( 2,1) + 7(( ,..., } )} fc-l

m

i=k l

Продолжая этот попятный процесс, получим на последнем шаге (с точностью до обозначений 1, т — {г,..., г }) неравенство

т

=i

Поскольку х(-) было выбрано произвольным, то справедливость неравенства (1.2.5) установлена. Теперь покажем, что на самом деле в (1.2.5) есть равенство. Для доказательства этого достаточно построить движение гс(.) Є Х(Я), на котором

Одна минимаксная задача управления с импульсным ограничением на управление и ее расширение в классе конечно-аддитивных мер

В этой главе рассматриваются задачи сближения и уклонения траекторий управляемой системы относительно дискретной по времени системы выпуклых компактов, при различных типах ограничений на управление. В идейном отношении предлагаемые конструкции следуют подходу [24, 25], который предполагает совместное исследование пары экстремальных задач (оптимального управления и математического программирования), находящихся в двойственности. Такой подход дает возможность в целом ряде случаев для решения задач оптимального управления использовать методы математического программирования, получая эквивалентные по результату конечномерные экстремальные задачи. В [25] подход был продвинут на случай задачи сближения с выпуклым компактом в заданной момент времени (при геометрических ограничениях на управления). В работе Н.Н. Красовского [28] для решения задач оптимизации впервые была применена проблема моментов. Различные задачи на основе функционального подхода рассматривались в [12,35-40].

В работах [4-7,43,74,84] рассматривались задачи последовательного управления по отношению к системе выпуклых компактов, когда производится совокупная минимизация системы невязок. Далее, в ряде прикладных задач приходится решать вопросы взаимодействия двух управляемых систем с импульсными управлениями; это взаимодействие может проходить в условиях неполной информации и, возможно, конфликтности. Задачи управления с обратной связью традиционно являются одним из предметов теории дифференциальных игр (см., например, [25-27,63,95]). Также приходится работать и с минимаксными задачами программного управления (см., например, [24-27,11,13,63,95]. В 2.1,2.2 исследуется минимаксная задача импульсного программного управления в условиях, когда о фазовом состоянии одного из объектов имеется лишь неполная информация. В смысле исследуемых ограничений, основной интерес представляет ограничение на полный импульс управляющей программы и(-), поскольку для многих задач механики, космической навигации, экономики, биомедицины, радиотехники и др. актуальны именно такие ограничения на управляющее воздействие. В литературе часто применяются модели с другими, в основном, квадратичными интегральными ограничениями на управление. Это может мотивироваться, например, непроясненностью и трудностью многих вопросов, возникающих при изучении компактификаций множества допустимых управлений и пучка траекторий динамической системы в случае ограничения на импульс управления. Причем эти трудности не снимаются даже в случае непрерывных коэффициентов при управлении в уравнении движения объекта. Этим и объясняется тот факт, что в работах по теории оптимального управления и теории дифференциальных игр чаще всего использовались множества интегрально ограниченных управлений, обладающие свойством компактности. Предполагаемая разрывность (по времени) коэффициентов в уравнении системы доставляет дополнительную трудность при построении пространства обобщенных управлений-мер, поскольку в этом случае, вообще говоря, неприменима теорема Рисса [11] о представлении линейных функционалов, и класса обобщенных управлений в виде счетно-аддитивных мер (этот класс хорошо изучен и имеет "удобные" свойства) "не хватает" для решения задач оптимизации в замкнутом виде. Возникает необходимость компактифицировать задачу в более широком классе обобщенных управлений. В работах А.Г. Ченцова рассматривались компактификации в классе конечно-аддитивных мер.

Похожие диссертации на Некоторые минимаксные задачи управления и маршрутизации