Содержание к диссертации
Введение 4
1 Задача среднеквадратической фильтрации 13
Некоторые вспомогательные результаты 13
Постановка задачи среднеквадратической фильтрации 16
Лемма о прямой и двойственной задачах 19
Решение линейно-квадратической задачи 22
Решение краевой задачи 26
Рекуррентное уравнение оптимальной оценки 35
Заключение к первой главе 39
2 Упрощённый фильтр в задаче среднеквадратического оценивания 40
Прямая и двойственная задачи 40
Редуцированная система и фильтр Калмана 48
Уровень неоптимальности упрощённого фильтра 51
Численные примеры 53
Пример 1 53
Пример 2 55
Эффективность упрощённых фильтров 57
2.5 Заключение ко второй главе 58
3 Гарантирующее оценивание в случае неопределённых
детерминированных помех 59
Задача минимаксного оценивания 59
Упрощённые оцениватели и границы их уровней неоптимальности ... 63
Оцениватель, оптимальный для линейно-квадратической задачи 64
Оцениватель, оптимальный в среднеквадратическом смысле
для редуцированной системы 68
3.3 Численные примеры 70
Пример 1 71
Пример 2 73
3.4 Заключение к третьей главе 75
4 Гарантирующее оценивание в случае комбинированных помех 76
Постановка задачи 76
Линейно-квадратическая задача и ее решение 79
Границы уровней неоптимальности упрощённых оценивателей 84
Упрощённые оцениватели 91
Оцениватель, оптимальный для линейно-квадратической задачи 91
Квазиимпульсный оцениватель 91
Численные примеры 93
Заключение к четвёртой главе 97
Заключение 98
Литература 99
Введение к работе
Во многих динамических системах будущее определяется не только текущим состоянием, но и значениями процесса в предшествующие моменты времени. Например, модель процесса может содержать сосредоточенное или распределённое запаздывание. Это отличает подобные системы от наиболее изученного класса марковских систем. Процессы с последействием описывают при помощи интегральных, интегро-дифференциальных уравнений, дифференциальных уравнений с отклоняющимся аргументом. Функциональные уравнения возникают уже в XVIII веке в связи с геометрической задачей, рассмотренной Л. Эйлером [122]'. Однако систематические исследования в этой области связывают обычно с именем В. Вольтерра, который впервые ввёл запаздывание в уравнения модели „хищник-жертва" [19, 20, 155] и детально изучил их. Подробный обзор развития теории функциональных уравнений и обширную библиографию можно найти в статьях А. Д. Мышкиса [61, 62].
Большой вклад в развитие теории уравнений с последействием внесли Р. Беллман, Г. А. Каменский, В. Б. Колмановский, Н. Н. Красовский, К. Кук, С. М. В. Лунел, Р. К. Миллер, А. Д. Мышкис, С. Б. Норкин, А. Л. Скубачевский, Дж. К. Хейл, Я. 3. Цыпкин, Л. Е. Шайхет, Л. Э. Эльсгольц. Из наиболее крупных, основополагающих исследований в этой области следует указать [4, 14, 19, 20, 27, 44, 63, 84, 86, 89, 124, 131, 132, 143], где можно также найти многочисленные примеры описания процессов такими уравнениями. Из недавних работ см., например, [107, 157].
Уравнениями такого вида моделируют различные процессы в технике, физике, медицине, экологии и т. д. В частности, уравнения с последействием встречаются в авиационно-космической отрасли. В качестве примеров можно назвать расчёты динамики завихрённой жидкости в баках ракет-носителей и космических аппаратов с жидкостными ракетными двигателями [71], изучение процесса сгорания в ракете с жидким топливом [72], исследования в области аэроупругости (построение математических моделей в задачах динамики вязкоупругих элементов, обтекаемых потоком жидкости или газа) [18]. К указанному типу уравнений приводит задача автоматического управления посадкой самолета (там существенным является запаздывание в реакции тяги на отклонение рычага управления двигателем, а также запаздывание при обработке управляющих сигналов сервоприводами аэродинамических рулей) [23]. Кроме того, интегральные уравнения возникают при описании аэродинамики летательного аппарата [70].
В качестве примеров использования уравнений с последействием в других обла-
стях можно указать задачи по исследованию функционирования щитовидной железы, построение модели системы для поддержания уровня сахара в крови, описание системы регулирования артериального давления, построение различных моделей лазеров и нейронных сетей, изучение полимерной кристаллизации и растяжения полимерного волокна. Также к уравнениям с последействием приводят задачи управления движением твёрдого тела при помощи пропорционально интегральных или пропорционально интегро-дифференциальных регуляторов, задачи исследования тепловых потоков в материалах с памятью формы и др. О математических моделях в биологии см., например, [8] и [19], где изучается изменение численности двух и более видов живых организмов, оказывающих влияние друг на друга.
Важным классом уравнений с последействием являются дифференциальные уравнения с отклоняющимся аргументом. Большое количество реальных задач, описываемых этими уравнениями, приведено в монографиях [4,14,132]. Можно назвать, например, задачу о стабилизации курса корабля (запаздывание возникает в канале наблюдения), уравнения, описывающие ядерные реакторы (там могут быть разные причины задержек — задержки, вызванные конечностью времени теплопередачи, временем разогрева реактора, задержка срабатывания системы управления и т.д.). При помощи систем с запаздыванием моделируют работу типовых элементов технологических процессов, содержащих пневматические и гидравлические контуры. Там запаздывание вызвано конечной скоростью распространения жидкости по тонким трубкам, временем, необходимым для перемешивания жидкостей и т.д. Кроме того, часто модели высокого порядка могут быть аппроксимированы моделями низкого порядка с запаздыванием [132]. В статье [61] также можно найти ссылки на работы, посвященные приложениям дифференциальных уравнений с отклоняющимся аргументом.
Другой, не менее важный вид уравнений с последействием — интегральные уравнения. Интегральные уравнения составляют основу теории вязкоупругости [5, 6] — ими описывают напряжённо-деформированные состояния некоторых материалов. В книге [143] приводятся примеры интегральных уравнений Вольтерра, возникающих в полярографии, а также при описании процессов, протекающих в ядерных реакторах. Уравнение восстановления, являющееся частным случаем уравнением Вольтерра второго рода, используется во многих областях (см., например, [139] и [83]). Примеры приложения интегральных уравнений можно найти также в классических учебниках [60] и [82]. Движение частицы в жидкости, а также многие биологические задачи описываются интегро-дифференциальными уравнениями [74]-[76].
Итак, как мы видим, уравнения с последействием играют важную роль при моделировании самых разных явлений.
Поскольку непрерывные уравнения с последействием применимы для описания различных процессов, то не менее важны и их дискретные аналоги — разностные уравнения. Уравнения такого типа и их приложения описаны в монографиях [91, 115, 126, 138]. Кроме того, разностные модели появляются и при дискретизации непрерывных уравнений, когда непосредственное решение последних представляет
затруднения. Процедуры дискретизации численного решения интегральных уравнений описаны в [91, 93, 94, 106, 115, 116, 95]. В монографии [115] изложена теория z-преобразования, используемого при исследовании разностных уравнений.
В теории дискретных уравнений Вольтерра важнейшим понятием является резольвента. Она играет такую же фундаментальную роль, как матрица Коши для обыкновенных дифференциальных уравнений. Соответствующие результаты см., например, в [32], [133] и [153].
Разностные уравнения Вольтерра изучались и отечественными, и зарубежными учёными. Статьи М. Р. Крисчи и его соавторов [108]—[113], а также исследования [114,134,142,147] посвящены проблемам асимптотического поведения решений вольтерровых систем, их ограниченности и периодичности.
В работах С. Н. Элайди и его соавторов рассматриваются вопросы асимптотической и экспоненциальной устойчивости [119], равномерной асимптотической устойчивости [120] для линейных уравнений, а также устойчивости в целом для нелинейных уравнений [117]. Вообще, значительная часть имеющейся по дискретным уравнениям Вольтерра литературы рассматривает вопросы устойчивости. В работе [97] используется теорема о неподвижной точке для изучения нелинейных дискретных уравнений Вольтерра. Получены достаточные условия, которые гарантируют, что устойчивость решения линейного уравнения влечёт за собой соответствующую устойчивость нулевого решения нелинейного уравнения. Кроме того, получены достаточные условия, которые гарантируют существование асимптотически периодических решений. В [98] при помощи резольвенты изучены различные типы устойчивости линейных уравнений. Получены некоторые необходимые и достаточные условия их устойчивости. В статьях [96] и [148] дискретные уравнения Вольтерра используются для исследования устойчивости соответствующих интегро-дифференциальных уравнений типа свёртки, поскольку качественное поведение последних сохраняется при переходе к их разностным аналогам. Большой вклад в развитие теории дискретных уравнений Вольтерра внесли В. Б. Колмановский и Л. Е. Шайхет. В частности, они изучали устойчивость детерминированных и стохастических систем при помощи построения функций Ляпунова (см., например, [30, 33, 36, 41, 145]). Л. Е. Шайхет рассматривал также задачи оптимального управления [135, 137], оценивания [136] и стабилизации [17]. Кроме того, он изучал разностные уравнения с непрерывным временем [146, 151]. Из работ В. Б. Колмановского необходимо упомянуть исследования об ограниченности решений вольтерровых систем [24, 31] и об их асимптотических свойствах [32, 34, 35].
В [116] вводятся модели распространения эпидемий, описываемые уравнениями в непрерывном времени. Різ этих моделей получены системы дискретных уравнений, после чего проведено сравнение непрерывной модели с её разностным аналогом. Работа [116] продолжает исследования, начатые в публикациях [93] и [118]. В статье [121] уравнения Вольтерра возникают применительно к задачам биологии.
Проблемы оценивания составляют важный для приложений класс задач. Ярким примером здесь является навигация [15, 21, 69]. Задачи оптимальной среднеквадра-
тической фильтрации для систем с последействием рассматривались В. Б. Колма-новским, Л. Е. Шайхетом, А. Ю. Веретешшковым и др. В непрерывном случае, когда состояние системы описывается интегральными уравнениями, эта проблема решена в работе [127J. Затем М. В. Басин обобщил эти результаты: в статье [9] — на случай дискретно-непрерывных наблюдений, а в [103, 104, 105] — на случай наблюдений более общего вида. Другой подход к той же проблеме предложен в [42], где задача фильтрации сводится к задаче оптимального управления; решая последнюю, авторы получают, что искомый оптимальный оцениватель удовлетворяет некоторому интегральному уравнению Фредгольма второго рода. Решение аналогичной проблемы в случае, когда система описывается дифференциальным уравнением с запаздывающим аргументом, дано в [38]. В этой работе авторы также переходят к соответствующей задаче оптимального управления, которая затем решается методом Беллмана. Задача среднеквадратической фильтрации для дискретных уравнений Вольтерра решена в [136].
Из всего вышесказанного можно сделать вывод, что проблемы оценивания для дискретных уравнений Вольтерра актуальны. Кроме того, в гарантирующей постановке такие задачи практически не изучены.
Дадим теперь общую характеристику данной диссертационной работы.
Объектом исследования диссертации являются линейные дискретные уравнения Вольтерра вида
x(t + l) = ^A(t,A;)a;(A;) + Q;(t), t = 0,..., N, x(0) = x0, (1)
fc=0
где xq ~ начальное состояние, A(t, к) — известные детерминированные функции, а a(t) — помеха. В зависимости от предположений о функции a(t) будем рассматривать детерминированные или стохастические уравнения указанного типа.
Предмет изучения составляют задачи оценивания для динамических систем, описываемых уравнениями (1); при этом рассматриваются различные гипотезы о помехах.
Цель работы состоит в построении границ уровней неоптимальности предлагаемых конструктивных алгоритмов фильтрации.
Задачи диссертации. При выполнении работы ставились следующие задачи:
Найти зависимость между прямой и сопряжённой переменными краевой задачи, возникающей в проблеме среднеквадратического оценивания.
Построить верхнюю границу уровня неоптимальности упрощённого оценивате-ля в задаче линейной стохастической фильтрации.
В задачах фильтрации при неопределённых возмущениях разработать упрощённые оцениватели, для которых построить верхние границы уровней их неоптимальности.
Методы исследования. В работе используются методы теории вероятностей, выпуклого анализа, теории двойственности выпуклых задач и теории гарантирующего оценивания.
Диссертация содержит 4 главы, опишем их краткое содержание.
Первая глава носит вспомогательный характер. В ней рассматривается новая форма решения задачи оптимальной среднеквадратической фильтрации. Опишем постановку задачи. Пусть проводятся измерения z{t) — H'{t)x{t)+p{t) процесса, описываемого дискретным уравнением (1). При этом делаются классические предположения о возмущениях в системе и в наблюдениях — все помехи являются независимыми друг от друга и от начального состояния центрированными случайными векторами с известными ковариационными матрицами. Начальное состояние — случайный вектор с заданной ковариационной матрицей и нулевым средним. Требуется
найти такой оцениватель Форг, чтобы линейная оценка /(Ф) = ^ Ф'(і)г(і) скалярной
t=o величины a'x(N) была оптимальна в среднеквадратическом смысле:
гі(Фор{) = inf гі(Ф), гі(Ф) = |е(/(Ф) - а'х(і\)уУ . (2)
Здесь Е — символ математического ожидания, а а — заданный вектор.
Поставленная задача была решена в работе [136] методами, основанными на использовании уравнения Винера-Хопфа. Однако в диссертации решение получено другим способом — проблема оптимальной фильтрации сведена к некоторой вариационной задаче. Такой подход нужен для наших построений в следующих главах. Поэтому в первой главе рассматривается вариационная задача, которая эквивалентна проблеме (2). Проводится детальный анализ соответствующей краевой задачи — впервые найдено важное соотношение между прямой и двойственной переменными, позволяющее свести краевую задачу к начальной. Кроме того, выведено рекуррентное уравнение калмановского типа для оптимальной оценки вектора состояния системы.
Итак, в первой главе даётся решение проблемы (2) с использованием нужного нам вариационного подхода. Однако поиск оптимального оценивателя может быть затруднён. Действительно, из полученных в первой главе формул следует, что их использование требует довольно больших вычислительных затрат. На практике же может оказаться, что предпочтительнее пожертвовать оптимальностью в пользу скорости вычислений. В таком случае вместо оптимального алгоритма можно использовать некоторый другой, упрощённый. Тогда необходимо знать, насколько близки значения функционала качества <і(Ф) для упрощённого ФаиРГ и оптимального Форг
оценивателей. С этой целью введём величину, являющуюся отношением этих значений, и назовём её уровнем неоптимальности используемого упрощённого алгоритма: А = (І(Фаррг)/<і(Форі). Понятно, что поскольку d{^0pi) неизвестно, то и уровень неоптимальности неизвестен, можно лишь утверждать, что он не меньше единицы. Однако можно оценить его значение сверху. Если при этом окажется, что найденная граница близка к единице, то это будет означать, что значения функционала (1(Ф) для оптимального и упрощённого оценивателей отличаются друг от друга незначительно, а следовательно, применение выбранного субоптимального алгоритма допустимо.
Вторая глава диссертации посвящена воплощению именно этой идеи: для задачи оптимальной среднеквадратической фильтрации предлагается существенно более простой алгоритм и строится оценка его уровня неоптималыюсти.
Поиск указанной верхней границы основан на применении теории двойственности. Поясним его суть. Наряду с функционалом с/(Ф) исходной задачи рассмотрим функционал д(Х) двойственной ей задачи. Пусть d0 = inLpd(i>) и g0 = supAg(A) — их оптимальные значения, а также выполнено соотношение двойственности do = g- Нам требуется оценить сверху уровень неоптимальности Д = (1{Фа-ррг)/йо или, что то же, оценить снизу величину do. Сделаем это следующим образом:
d0 = д = supfl-(A) ^ sup д {уц),
А V
где v — число, а ц — некоторый известный элемент соответствующего функционального пространства. В качестве ц удобно взять решение задачи, двойственной к упрощённой задаче. Таким образом, мы приходим к поиску максимума функции скалярной переменной (при этом максимизация производится на множестве тех и, для которых элементы v\i являются допустимыми). Очевидно, эта проблема много проще исходной. Следовательно, для применения описанной идеи нам надо выписать двойственную к исходной задачу, убедиться в выполнении соотношения двойственности, а затем найти максимум функции одного числового аргумента.
Теория двойственности изложена во многих руководствах (см., например, обзоры [80] и [81], а также монографии [1, 25, 88]). Описанное построение границы уровня неоптимальности приближённого оценивателя впервые было применено в [56] к задаче гарантирующего оценивания вектора неизвестных параметров при непрерывных измерениях. Идея подобных оценок неоптимальности упрощённых алгоритмов оказалась очень плодотворной — она применима для множества типов задач, как детерминированных, так и стохастических. Рассматриваемые системы могут быть самыми разнообразными, использующими для своего описания разностные уравнения, дифференциальные, дифференциальные с отклоняющимся аргументом и т.п. В статье [58] аналогичная оценка найдена при анализе чувствительности фильтра Калмана-Бьюси по отношению к априорным значениям ковариационных матриц шумов. В [57, 123, 140] подобные формулы получены для динамических систем, описываемых линейным дифференциальным уравнением, а в [39] — для систем, описываемых дифференциальным уравнением с запаздыванием. При этом в задачах минимаксного оценивания предлагается использовать оцениватели, оптимальные для аппроксимирующих их задач среднеквадратической фильтрации. Статья [129] предлагает два
упрощённых метода оценивания вместо оптимального, требующего решения сложной системы функционально-дифференциальных уравнений в пространстве трёх переменных.
В [37, 38] для линейных динамических систем, описываемых дифференциальными уравнениями с запаздыванием, была решена проблема оптимальной фильтрации в предположении, что начальное состояние системы почти всюду равно нулю. Однако случай ненулевых начальных условий оставался неисследованным. В работах [40, 130] к этой задаче применяется описанный подход (в настоящее время оптимальное решение найдено и опубликовано в [59]).
В работах [43] и [128] изучается минимаксная фильтрация для линейных динамических систем с запаздыванием при неопределенных статистических характеристиках. Такое предположение о помехах приводит к сложным негладким экстремальным задачам. В [128] в качестве субоптимального оценивателя предлагается использовать решение более простой гладкой аппроксимирующей задачи. В [43] предполагается, что запаздывание существенно меньше времени наблюдения. Исходя из этого при помощи идеи разложения по малому параметру получены новые конструктивные алгоритмы и оценены уровни неоптимальности для них. В статье [92] приводится численный пример для механической системы с одной степенью свободы. Вычисления показали высокую эффективность предложенных алгоритмов. Во всех случаях они обеспечивали вполне приемлемую, а нередко и почти оптимальную точность. При этом уровни неоптимальности без труда вычислялись и давали гарантированную информацию о качестве используемых алгоритмов.
Монография [141] посвящена общей разработке изложенного подхода.
Данная диссертационная работа продолжает это направление. Здесь описанные идеи применяются к дискретным системам Вольтерра. Поскольку свои особенности есть у каждого объекта исследования, то техника здесь отличается от использованной ранее.
Как уже было сказано, во второй главе предлагается некоторый субоптимальный алгоритм для проблемы оптимальной среднеквадратической фильтрации. Суть его заключается в том, что вместо уравнения Вольтерра рассматривается система, описываемая редуцированным уравнением. Если увеличить размерность вектора состояния, то такую систему можно представить в стандартном виде, когда текущее состояние зависит лишь от предыдущего. Оптимальный фильтр в этом случае определяется формулами калмановской фильтрации. Поиск такого оценивателя несложен, и именно его предлагается использовать в исходной задаче в качестве субоптимального. Описанная выше техника позволяет оценить уровень его неоптимальности.
Одним из направлений теории фильтрации является гарантирующее оценивание. Классические методы оценивания исходят из предположения, что статистические характеристики ошибок и возмущений известны. Например, известно их вероятностное распределение или какие-то моментпые харатеристики. Однако на практике для многих систем часто невозможно получить достаточно большое количество экспериментальных данных, которые позволили бы определить необходимые статистические
характеристики распределений. По словам Р. Калмана, „для того, чтобы моделировать неопределённость при помощи вероятностного механизма, необходимо чересчур много информации, которая не может быть извлечена ... в большой массе практических задач" [26]. Например, такая ситуация имеет место в аэрокосмической отрасли, где эксперименты слишком дороги. Многие же явления вообще нельзя считать случайными ввиду отсутствия статистической устойчивости или принципиальной невозможности её проверки. Поэтому в последние десятилетия стали развиваться методы гарантирующего или минимаксного оценивания. Основополагающий вклад в развитие теории управления и наблюдения в условиях неопределенности внесли работы X. Витзенхаузена, И. Я. Каца, Н. Н. Красовского, А. Б. Куржанского, М. Л. Лидова, Б. Т. Поляка, П. Хьюбера, Ф. Л. Черноусько, Ф. Швеппе, П. Е. Эльясберга (см. работы [28, 29, 45, 46, 49, 85, 87, 90, 149, 150, 156]). В них основное внимание уделяется общим вопросам гарантирующего оценивания и их связям с соответствующими разделами выпуклого и функционального анализа и теории управления.
Положение теории гарантирующих оценок освещают обзоры [47] и [48].
Одно из направлений новых методов оценивания было инициировано работой М.Л. Лидова [49] при постановке задачи о „наихудшей корреляции". В ней границы амплитуд возмущений считаются заданными, а их спектральный состав неизвестным. Задачи с такими предположениями о шумах изучали В. А. Архангельский, Б. Ц. Бахшиян, Л. Ю. Белоусов, М. И. Войсковский, М. И. Гусев, М. Л. Лидов, A. PL Матасов, А. В. Назин, С. А. Назин, Р. Р. Назиров, А. Р. Панков, В. Н. Соловьёв, П. Е. Эльясберг (см., например, работы [22, 7, 10, 51, 64, 65, 67, 77, 80, 141, 144, 152]).
В третьей главе диссертации рассматривается система, возмущения которой принадлежат указанному типу — известны лишь их границы. В этом случае проблема оптимального оценивания сводится к минимаксной задаче. Ввиду сложности её решения мы пользуемся упрощёнными оценивателями. Как и в предыдущей главе, строятся оценки уровней неоптималыюсти таких фильтров.
В четвёртой главе рассматриваются те же уравнения для описания системы и наблюдений, что и ранее, но делаются более общие предположения о шумах. Если в первой и второй главе это были случайные процессы, а в третьей — последовательности детерминированных ограниченных величин, то в этой главе рассматриваются так называемые комбинированные помехи. Они представляют собой сумму двух составляющих, первая из которых является детерминированным вектором из некоторого множества, а вторая — центрированным случайным вектором, дисперсии компонент которого ограничены известными положительными числами. Помехи такого типа можно представить также как случайные процессы, математические ожидания и интенсивности которых не известны, но принадлежат некоторой заданной области. Аналогичные предположения делаются и для вектора начального состояния системы. При таких гипотезах о помехах ставится задача оптимального оценивания.
Шумы с неизвестными точно статистическими характеристиками рассматривались во многих работах (см., например, статьи Б. И. Ананьева [2, 3], А. В. Борисова и А. Р. Панкова [16], С. Верду и В. Пура [154], М. Л. Лидова [50], И. Я. Каца и
А. Б. Куржанского [28, 29], А. И. Матасова [43, 92, 128, 140, 141], А. Р. Ланкова и К. В. Семенихина [66, 67, 68], В. Н. Соловьёва [78, 79]).
Так как возмущения в системе и в измерениях содержат неизвестные детерминированные составляющие, то для описания качества оценивания вводится гарантированное значение ошибки оценки. Аналогично предыдущей главе, вместо неизвестного оптимального алгоритма фильтрации рассматриваются упрощённые методы и строятся оценки их уровней неоптимальности. В качестве аппроксимирующего здесь предлагается использовать не только оцениватель, оптимальный для некоторой „близкой" классической задачи среднеквадратической фильтрации, но и так называемый „квазиимпульсный" оцениватель. Он получен из эвристических соображений о структуре оптимального решения.
В заключении подведены итоги работы, сформулированы результаты, представляемые к защите.
Научная новизна. В работе получены следующие новые результаты: