Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Квадратичная сходимость алгоритмов решения дифференциальных игр Иванов, Григорий Евгеньевич

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Иванов, Григорий Евгеньевич. Квадратичная сходимость алгоритмов решения дифференциальных игр : автореферат дис. ... кандидата физико-математических наук : 01.01.09.- Москва, 1994.- 18 с.: ил.

Введение к работе

Актуальность темы. Последние несколько десятилетий интенсивно развивается математическая теория оптимальнох'О управления, формирующая научную базу, необходимую для создания сложных технических систем, управляемых человеком. Важной областью математической теории управления является теория дифференциальных игр, исследующая задачи управления системой несколькими игроками,-, имещих различные цели. В силу сложности, данных задач в теории дифференциальных игр как правило рассматриваются игры двух игроков с противоположными интересами (игры с нулевой суммой). В дальнейшем речь будет идти только о таких играх.

В рамкзх теории дифференциальных игр может быть., исследовано оптимальное управление объектом в конфликтных ситуациях, возникающих, например, в военном деле, а также, что более важно, в ситуациях, когда на объект воздействует помеха, играющая роль одного из игроков. Задача состоит в нахождении оптимального гарантированного управления объектом, обеспечивающего опташльный гарантированный результат, то есть наилучший результат, который может достичь первый или второй игрок при самых неблагоприятных действиях соперника.

Понятие "дифференциальная игра" было введено Р.Айзексом. В нашей, стране труда академиков Я.С.Понтрягша и. К.Н.Красэвского положили начало развития двух направлений в исследовании дифференциальных игр, различающихся математической формализацией игры и классами стратегий игроков.

Фундаментальные результаты в теория дифференциальных игр были получены также в работах Н.Л.Григоренко, П.Б.Гусятникова, А.Б.Кур-жанского, Е.Ф.Мищенко, М.С.Никольского, Ю.С.Осипова, Е.С.Половин-кина, Б.Н.Шеничного, Н.С.СатимоЕа, А-.И.Субоотина, А.С.Чевпрва, Ф.Л.Черноусько.У.Флеминга, А.Фридмана и др. -;

На основе теории дифференциальных игр в работах Н.Д.Боткина, М.А.Ззрха, В.М.Кейна, В.С.Пацко, А.П.Погомарёва, Е.В.Сидоровой, Н.Н.Субботиной, А.М.Тарасьева, В.Л.Туровой, А.А.Успенского, В.Н.Ушакова, А.П.Хринукова и др. были предложены алгоритмы, вичислящкэ оптимальный гарантированный результат к строящие оптимальные гарантированные стратегии.

Как показали эти работы, алгоритмы исследования даже только линейных дифференциальных игр являттся довольно сложными. Так реализация существующих алгоритмов для дифференциальных игр в пространстве к3 требует весьма значительных ресурсов ЭВМ, а реализация задач большей размерности технически осуществима только для весьма бедного класса дифференциальных игр.

В связи с этим важным является анализ скоростз- сходимости алгоритмов с целью выбора из имещахся и построения новых наиболее аффективных методов. В настоящее время далеко не для всех алгоритмов получены удовл творительные оценки скорости сходимости.

Большинство современных алгоритмов, исследувдих дифференциальные игры, использрт следующий общий метод. Сначала вычисляется оптимальный гарантированный результат (либо альтернированный интеграл Л.С.Понтрягинз, который является множеством уровня оптимального гарантированного результата). Затем на основе вычисленного оптимального гарантированного результата строятся оптимальные гарантированные управления. Для вычисления оптимального гарантированного результата отрезок времени, на котором происходит игра, разбивают, на мелкие шаги и строят некоторую попятную конструкцию. В качестве попятной конструкции как правило используй* либо альтернированные суммы Л.С.Понтрягина, либо конструкцию Н.Н.Крэсовск.го. Любая из этих конструкций вычисляет оптимальный гарантированный результат с некоторой погрешностью, вызванной дискретизацией по времени. Впервые эффективная оценка этой погрешности была получена А.П.Пономарёвым, который показал,

что альтернированные суммы Понтрягина сходятся к альтернированному интегралу с линейной по ..мелкости разбиения времени скорстыо.

При вычислении оптимального гарантированного результата наряду с погрешностью, связанной с дискретизацией по вре...зни возникает погрешность, связанная с дискретизацией по пространству. Дело в том, что функции или мнозвства, задающие гарантированный результат и вычисляемые в п.пятной конструкции, как щмеило, не могут быть заданы аналитически. Поэтому необходимо вводить пространственную дискрвтизацию, что вызывает дополнительную погрешность алгоритма. В настоящее время для большинства алгоритмов отсутствуют оценки погрешности, связанной с дискретизацией по пространству. 3 то же время указанная погрешность является весьма существенной. Она приводит к необходимости" задавать очень мелкую пространственную дискретизации, что требует очень больших, ресурсов ЭВМ (объёма машинной памяти и количества операций). Важной причиной большой алгоритмической сложности задач теории дифференциальных игр является принципиальнг негладкость этих задач.

Цель работы. Исследование скорости сходимости алгоритмов решения линейных дифференциальных игр с выпуклой функцией платы. Определение условий гладкости для дифференциальных игр, ь.ґл которых алгоритмы, основанные на конструкции альтернированных сумм Понтрягина, сходятся с квадратной скорости).

Методика исследования. Используется описание дифференциальной игры в терминах Функций, сопряжиных (в смысле выпуклого анализа) к функциям цены игры. При работе с множествами, ограничивающими управления игроков, а также с альтернированным интегралом и его аппроксимациями, применяется аппарат опорных функций.

Научная ццил^иа. І) Получмш характеризаппя сильно выпуклых множеств через их оперные функции. Исследованы качественные свойства таких функций.

2) Для линзйных дифференциальных игр с выпуклым терминальным

_ 4 -

множеством и сильно выпуклым множеством, ограничит щим управление перзого игрока, доказана квадратичная сходимость альтернированных сумм к альтернированному интчгралу Понтрягша. Получен аналогичный результат для игр с лшшцавым терминальным функционалом.

  1. Исследованы погрешности алгоритмов вичисленая функции, сопряженной к цене игры, связанные с дискретизацией по пространству. Для дифференциальных игр с сильно выпуклыми терминальным множеством и множеством, ограничивающим управление первого игрока, доказана квадратичность указанной погрешности на каждом шаге по времени.

  2. Получены оценки общих погрешностей рассматриваемых алгоритмов и показана .трактическая реализуемость данных алгоритмов. Указаны некоторые клчссы дифференциальных игр, для которых полученные оценки погрешностей могут быть существенно улучшены.

5) Разработан метод аналитического ' вычисления выпуклых
оболочек функций, на основе которого рассмотррч пример дифферен
циальной игры в к2, показывающий существенность условия сильной
выпуклости для квадратичной сходимости рассматриваемых алгорит
мов.

Практическая ценность. Алгоритмы, рассмотрение в диссертации, позволят находить оптимальное гарантированное управление .техническими системами, на которые воздействует помеха.

Апробация работы. Основные результаты диссертации доложены на заседаниях семинара' по дифференциальным игрзм е Московском физико-техническом институте, на кафедре оптимального управления Московского государственного университета и на пятой международной школе "Понтрягинские чтения" (г.Вороввж, 1994т).

Публикации. Основные результаты диссертации опубликованы в пяти статьях, список которых приведен в конце автореферата.

Структура и j6b8M диссертации. Диссертация состоит из вввдэ-

ния, одиннадцати параграфов, приложения и списка литературы, ekjdd-чащего 102 наименования. Общий объем работа 149 машинописных страниц.