Введение к работе
Предмет исследования. Диссертационная работа связана с изучением и разработкой методов и алгоритмов моделирования задач гарантированного управления .и оценивания в нелинейных дискретных динамических системах при наличии неопределенности в форме неуправляемых параметров и сигналов, дающих неполную информацию о фазовых состояниях систем. Подход, положенный в диссертации v основу построения моделей таких задач управления и оценивания, базируется на принципе гарантированного результата. При таком подходе неконтролируемым параметрам системы и ошибкам измерения сигнала предписывается поведение, ухудшающее показатель качества процесса, в соответствии с которым формируются процедуры управления или оценивания. Моделирование получаемой неполной информации о фазовом состоянии конкретной системы осуществляется с помощью конструирования нового фазового пространства, имеющего более сложную структуру. Выбранный подход приводит к рассмотрению задач моделирования процессов управления и оценивания в нелинейных дискретных динамических системах с неполной информацией в рамках теории оптимального гарантированного управления и оценивания.
Актуальность темы. Математические задачи управления динамическими системами, изменение состояния которых описывается уравнениями различных типов, представляют собой хорошо развитую область исследований. Фундаментальные ее результаты получены в работах Л.С.Понтрягина, Н.Н.Красовского, В.Г.Б5лтянского, Р.В.Гам-крелидзе, Е.Ф.Мищенко, Р.Беллчана, Р.Калмана и др. Вместе с тем потребности практики и прежде всего задачи, возникающие в механике , физике, технике, экономике, биологии и т.д., привели к расширению круга.задач, рассматриваемых в рамках теории управляемых процессов. Так, в классических постановках задач этой теории изучались системы, в которых органам управления доступна полная информация об их текущих ; состояниях и данные системы не подвержены действию каких-либо возмущений. В то же время в реальных технических и других управляемых системах наиболее распространена ситуация, когда поступающая информация позволяет оценить только некоторую область возможных состояний системы, в которой имеются неконтролируемые параметры. Большое число работ
посвящено исследованию систем, где оценка состояний системы и учет неопределенных факторов основываются на знании их вероятно-стньн характеристик. На практике же частовозникают задачи управления механическими и другими объектами при наличии в математических моделях таких объектов возмущений и неопределенностей, информация о которых исчерпывается знанием ограничивающих их множеств и результатов измерений сигналов. При этом не исключено, что данные параметры могут реализоваться наихудшим для управляющей сторо"ны. образом. Тогда естественным становится подход к оцениванию качества управления в таких системах, связанный с получением оптимального гарантированного (минимаксного) результата.
Становление ' теории оптимального гарантированного управления относится к началу 60-х годов и связано с именами советских и зарубежных математиков Н.Н.Красовского, Л.С.Понтрягина, Р.Айзек-са, У.Флеминга. Крупный вклад в развитие этой теории внесли Э.Г.Альбрехт, В.Д.Батухтин, Р.Беллман, А.Брайсон, Р.В.Гамкрелид-зе, В.И.Жуковский, М.И.Зеликин, А.Ф.Клейменов, А.Н.Красовский, А.Б.Нряжимский, А.Б.Куржанский, Дж.Лейтман,"П.-Л.Лионе, В.И.Максимов, А.А.Меликян, Е.Ф.Мищенко, М.С.Никольский, Г.ОльсДер, Ю.С.Осипов, .А.Г.Пашков, В.С.Пацко, Н.Н.Петров, Л.А.Петросян,-Г.К.Пожарицкий, Б.Н. Пшеничный, А.И.' Субботин, Н.Н.Субботина, В.Е.Третьяков, В.Н. Ушаков, А. Фридман, Хо Ю-Ши, А.Г.Ченцов, Ф.Л.Черноусько, А.А.Чикрий, Р.Эллиотт и многие другие.
Данная работа относится к одному из разделов теории оптимальных процессов - задачам управления и оценивания (наблюдения) в динамических системах по результатам измерений в присутствии возмущений. Важным классом этого раздела являются задачи в дискретных (многошаговых) динамических системах, функционирующих в условиях неполной информации. Результаты, полученные при решении таких задач, могут использоваться как при моделировании реального, динамического процесса, так и при управлении конкретными механическими системами.
Для рассматриваемых в данной работе задач управления-наблюдения принята минимаксная постановка, восходящая к работам Н Н.Красовского 1,г и получившая дальнейшее развитие в исследованиях А.Б.Куржанекого 3 и др. (см. 2'3 и библиографию к ним). В рамках этого подхода Н.Н.Красовским, А.Б.Куржанским и их учениками изучен широкий класс задач управления и оценивания в ус-
ловиях конфликта и неопределенности. Ряд принципиальных результатов в данной области теории управления и оценивания получен в работах Б.И.Ананьева, Д.Бертсекаса, Р.Габасона, М.И.Гусева, И.Я.Каца, Ф.М.Кирилловой, Л.В. Кряжимского, М.С. Никольского, О. И. Никонова, Ю.С. Осипова, В. Г. Покотило, Е.Н. Пшеничного, А.И. Субботина, Т.Ф.Филипповой, Ф.Л.Черноусько, В.И.Ширяева, Ф.Швеппе (см. 2~4 и библиографию к ним).
В предлагаемой работе исследуются задачи минимаксного управления и оценивания в динамических системах, описываемых нелинейными дискретными уравнениями. При этом предполагается, что в задании правых частей уравнений, описывавших динамику конкретной системы, начальных условиях и в канале измерений присутствуют априори неопределенные параметры (в том числе и управляемые) , статистическое описание которых отсутствует и известны только ограничивающие их множества. Качество рассматриваемых в работе процессов оценивается различными функционалами (достаточно общими) , определенными на реализациях соответствующих информационных множеств 2,3(т.е. на множествах состояний системы, совместимых с имеющейся информацией). Формализация изучаемых задач и их решение основываются на общем подходе к исследованию проблем управления и оценивания в условиях неопределенности, который предложен в работах Н.Н.Красовского 1,г, А.Б.Куржанского 3 и развит в работах их учеников (см. г~4 и библиографию к ним).
Следует отметить, что изучение вопросов управления и оценивания в дискретных динамических системах помимо их самостоятельного значения ,особенно важно вследствие использовании компьютеров для решения задач, формализуемых непрерывными математиче-ск>!ми моделями. Так, при решении задач механики управляемого полета, конструировании адаптивных управляющих регуляторов и преобразующих информацию фильтров возникает необходимость перехода
1 Красовский Н.Н. К теории управляемости и наблюдаемости линей
ных динамических систем // Прикл. математика и механика. 1964.
Т. 28, вып. 1. С, 3-14.
2 Красовский Н.Н. Теория управления движением. М.: Наука, 1968.
3 Куржанский А.Б. Управление и наблюдение в условиях неопреде
ленности. М.: Наука, 1977.
* Красовский Н.Н. , Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
от непрерывных систем к дискретным.
Цель работы состоит в изучении теоретических проблем математического моделирования задач минимаксного управления и оценивания для нелинейных дискретных динамических систем с неполной информацией, разработке общих схем и численных методов, их решения, а также -программного обеспечения, позволяющего моделировать их действие на компьютере.
Методы исследования. В основе разрабатываемых в диссертации методов лежат концепции теории оптимального гарантированного управления и оценивания в условиях неопределенности, используются понятия и результаты из теории игр, теории оптимального управления, функционального анализа, линейного и выпуклого математического программирования.
Научная новизна. Полученнные в диссертации результаты являются новыми. Среди них отметим следующие.
-
Изучена многошаговая задача апостериорного минимаксного оценивания для нелинейной дискретной динамической системы с разделенными движениями в условиях неполной информации и ограничения- на действие измерителя, формализация которой имеет вид апостериорного е-минимаксного фильтра. На основе введенного понятия информационно-сопряженной (И-сопря»енной) системы, которая представляет собой последовательность одношаговых операций, использующих всю доступную для наблюдателя информацию, исследована структура основных элементов данной задачи и предложены конструктивные методы построения информационного множества рассматриваемого процесса и на его базе - выходных параметров апостериорного с-минимаксного фильтра.
-
Исследована многошаговая задача программного минимаксного управления-наблюдения для нелинейной дискретной динамической системы с разделенными движениями и неполной информацией. Для ее решения предложена конструкция, основу которой составляет построение множества допустимых программных управлений наблюдателя, гарантирующих ему результат управления-наблюдения, не превышающий заданного значения критерия процесса.
-
В цеілях решения многошаговой задачи позиционного минимаксного управления в классе нелинейных дискретных динамических систем с разделенными движениями и неполной информацией .предложена конструкция построения с-оптимальной стратегии, сочетающая прямые и попятные * процедуры, основывающиеся на решениях вспомога-
тельных программных задач минимаксного управления.
-
Для достаточно общего класса дискретных динамических систем с неполной информацией предложен численный алгоритм моделирования решения задачи апостериорного минимаксного оценивания и разработано (совместно с В.А.Тюлюкиным) программное обеспечение для персонального компьютера, реализующее его действие.
-
Предложены конструктивные методы решения задач апостериорного минимаксного оценивания, программного и позиционного минимаксного управления по неполным данным для общего класса нелинейных дискретных динамических систем с неразделенными движениями.
Теоретическая и практическая ценность. Полученные в диссертации результаты развивают теорию задач оптимизации гарантированного оценивания и управления для нелинейных дискретных динамических систем с неполной информацией. Они могут служить основой вычислительных алгоритмов оценивания состояния и управления для дискретных динамических систем, функционирующих в условиях неопределенности. Предложенный численный алгоритм решения задачи апостериорного минимаксного оценивания для достаточно общей дискретной динамической системы с неполной информацией и соответствующее ему программное обеспечение могут быть использованы при проведении опытно-конструкторских работ по моделированию функционирования информационно-управляющих систем реальных механических объектов. Полученные в диссертационной работе результаты были -использованы при выполнении ряда прикладных работ по темам НИР Института математики и механики УрО РАН'- Военно-космической академии им. А.Ф.Можайского МО РФ, в/ч 30895 и отражены в 12 научно-технических отчетах и 5 публикациях за период с 1973 по 1987 гг.
Апробация работы. Результаты диссертационной работы докладывались на Всесоюзной конференции "Динамическое управление" (Свердловск, 1979), всесосскзных конференциях по оптимальному управлению в механических системах .(Москва,1982; Казань, 1985; Львов, 1988), Всесоюзном семинаре "Эволюционное моделирование и обработка данных радиофизического эксперимента" (Москва, 1984), VI Всесгозном съезде по теоретической и прикладной механике (Ташкент, 1986), III Уральской региональной конференции "Функционально-дифференциальные уравнения и их приложения" (Пермь, 1988), III Международном семинаре "Негладкие и разрывные задачи управ-
лания и их приложения" (С.-Петербург, 1995). Результаты, составившие содержание диссертации, обсуждались на научных семинарах отделов динамических систем (руководитель семинара - чл.-корр РАН А.И.Субботин), оптимального управления (руководитель семинара - академик РАН А.Б.Куржанский) и управляемых систем (руководитель семинара - профессор А.Г.Ченцов) Института математики и механики УрО РАН, а также в Институте проблем управления РАН (руководитель Межведомственного совета по управлению движением кораблей и специальных подводных объектов-академик РАН И.В.Пран-гишвили), в Военно-космической академии им. А.Ф.Можайского МО РФ (руководитель семинара - профессор Л.А.Майборода) и в С.-Петербургском государственном университете (руководитель семинара -профессор Л. А. Пнтросян)..
Публикации. По теме диссертации опубликовано более 26 работ. Список основных публикаций приводится в конце автореферата, Результаты, вошедшие в диссертацию, получены автором. В совместных работах [17,18,22], содержание которых частично изложено в 15, 16 (при описании общей схемы и численного алгоритма построения области достижимости наблюдаемого объекта)', автору принадлежат постановка задачи и основные идеи алгоритма. В совместной работе (11] автору принадлежат основные результаты работы и она идейно-примыкает к содержанию главы III.
Структура и объем работы. Диссертация состоит из введения, пяти глав, разбитых на 20 параграфов, одного Приложения и библиографического списка, включающего 177 наименований. Общий объем диссертации составляет 241 стр. машинописного текста.