Введение к работе
Актуальность проблемы. Методы оптимального оценивания параметров в темпе поступления измерительной информации широко применяют в различных областях науки и техники (в задачах фильтрации сигналов, навигации самолетов, спутников, судов и других движущихся объектов, в задачах траекторных измерений и т.п.).
На практике часто встречаются задачи оптимального оценивания параметров, стесненные всевозможными ограничениями. Различают два типа ограничений: на переменные состояния (фазовые ограничения) и на их приращения, параметры,"управления, воздействия (в широком смысле -ограничения на "управления"). Наиболее частыми ограничениями являются принадлежность параметров замкнутым ограниченным областям их определения, ограничения типа неравенств и, как вырожденный; случай,- типа равенств и т.д. Такие процессы называются рестриктивными, то есть подчиняющиеся ограничениям.
В соответствии с принципом максимума Л.С. Понтрягина двухточечная краевая задача (ДТКЗ) оптимизации процессов управления и фильтрации выражает необходимые (а иногда и достаточные) условия их оптимальности. При наличии ограничений на управления и состояния такие процессы трудно поддаются оптимизации. Задачи их оптимизации существенно более сложны, чем задачи оптимизации процессов, не стесненных ограничениями, в силу их существенной нелинейности.
В настоящее время наибольшее распростронение при решении задач оптимизации рестриктивных ДТКЗ получили численные подходы. Обычно здесь применяются методы последовательных приближений (по управлениям, по начальным или финальным условиям, по состояниям, по сопряженным переменным и пр.). В процессе последовательных приближений производится многократная двухсторонняя прогонка решения ДТКЗ. что приводит к большим вычислительным затратам. Также недавно У. Бадамом и Д.Цоодолом был получен вариант комбинированного алгоритма решения рестриктив-ной ДТКЗ. Суть алгоритма состоит в сочетании идеи двух ранее известных алгоритмов, использующих методы пикаровских приближений и градиентного спуска. Особенностью этих процедур оценивания является итеративный поиск экстремума целевой функции, зависящей от всего объема наблюдений выборки. Это существенно ограничивает возможности использования итеративных алгоритмов оценивания (необходимость запоминания всей выборки). Во многих приложениях объем выборки не фиксирован, а растет в ходе наблюдений, и требуется последовательно (рекуррентно) уточнять оценку по мере поступления новых данных (задача фильтрации).
Кроме того, имеется ряд подходов к решению рестриктивной ДТКЗ оптимизации, альтернативных методу последовательных приближений. Это методы инвариантного погружения и пошаговой аппроксимации. Метод инвариантного погружения позволяет сводить ДТКЗ к задачам Коши для функциональных уравнений. В общем случае точное решение рекуррентных функциональных уравнений инвариантного погружения не известно, лишь задача оптимизации линейного скалярного рестриктивного управляемого процесса является единственным известным примером, допускающим точное решение соответствующих уравнений.
В работах В.В. Поддубного развивается новый подход к численному решению задач оптимизации многомерных нелинейных ре-стриктивных рекуррентных процессов. Подход основан на пошаговой аппроксимации подходящей системой функций (полиномами, элементарными или специальными функциями) решений уравнений инвариантного погружения нелинейных рестриктивных ДТКЗ оптимизации. Такой подход позволяет на одной прямой прогонке находить с заданной точностью все финальные значения оптимального процесса, а на последовательности однократных обратных прогонок получать с соответствующей точностью полное решение рестриктивной ДТКЗ оптимизации.
Задачей диссертации была разработка точных алгоритмов рестриктивной фильтрации. Для решения этой задачи использовалась идея проверки конечного числа гипотез о характере локализации компонент вектора оптимального управления относительно интервалов их возможных значений (на нижней границе интервала, на верхней границе интервала или внутри интервала). Второй задачей данной работы является исследование точности разработанных методов и алгоритмов. Из-за нелинейности алгоритмов рестриктивной фильтрации оценить абсолютную и относительную (сравнительную) эффективность представляется достаточно сложной проблемой, поскольку аналитические оценки эффективности в этом случае построить практически никогда не удается. Исследование эффективности алгоритмов фильтрации методами статистических испытаний (Монте-Карло) требует слишком много времени и вычислительных ресурсов в силу обычно большой длительности реализаций, их нестационарности, высокой размерности вектора состояния фильтрационных оценок и поэтому редко может быть проведено практически. Кроме того, могут быть неизвестны законы распределения возмущений в системе и каналах наблюдений, из-за чего проблема статистических испытаний становится неопределенной.
Помимо случая, когда неизвестное управление находится внутри некоторого интервала, интересна ситуация, когда и матричные параметры также лежат внутри интервала, то есть являются интер-
вальными. Поскольку при построении алгоритмов оптимизации и фильтрации обычно требуется обращение таких матриц, задача еще более усложняется, так как не совсем ясно, что понимать под обращением интервальной матрицы. Поэтому третьей задачей диссертации ставилось исследование возможностей интервальной фильтрации состояний линейных динамических процессов без решения задач обращения интервальных матриц.
Работа выполнялась в соответствии с планами важнейших научных исследований в рамках госбюджетной НИР "Развитие системных средств автоматизации и разработка математического и програмшю-технического обеспечения, исследования и оптимизации управляемых систем, информационных процессов и деятельности человека-оператора" ( шифр "Информатизация" ), выполняемой СФТИ по единому заказу-наряду 1991-1995 г.г., гос. регистрация № 01.9.50001753, а также НИР "Разработка методов, алгоритмов и правил обработки навигационной информации и управления в навигационно-унравляющих комплексах судов и летательных аппаратов в сложных навигационных условиях" ( шифр "Навигатор" ), выполняемой СФТИ по межвузовской научно-технической программе "Конверсия и высокие технологии, 1994-1996 г.г.".
Цели работы: 1) Разработка точных (не приближенных) конструктивных методов решения задач фильтрации рестриктивных процессов при различных предположениях о характере априорного распределения неизвестных управлений (или возмущений с априорно ограниченными значениями, приращениями т.д.). 2) Разработка методики сравнения эффективности нелинейной фильтрации. В силу того, что ошибки фильтрации в общем случаи не являются независимыми, требуется соответствующая модификация известных тестов проверки гипотез против односторонних альтернатив, уместных в данном случае. 3) Разработка подхода к решению задачи фильтрации состояний линейной динамической системы с интервальными параметрами и неизвестными ограниченными управлениями. 4) Проверка предложенных алгоритмов оценивания методом имитационного моделирования.
Результаты по решению перечисленных выше задач выносятся на защиту.
Научная новизна результатов, полученных в диссертации, состоит в следующем: 1) Предложены точные (не приближенные) алгоритмы рестриктивной фильтрации, позволяющие находить решение задачи оптимизации функции Гамильтона рестриктивной ДТКЗ за конечное число шагов. При этом алгоритм оценивания управления сводится к комбинаторной процедуре проверки гипотез о возможных значениях только вектора финальных оптимальных управлений, поэтому алгоритмы рестриктивной фильтрации характеризуются ли-
нейным ростом объема вычислений с увеличением времени наблюдения Т (Зт гипотез на каждом шаге), в отличие от алгоритмов полного перебора гипотез, которые требуют проверки ЗтГ гипотез, то есть приводят к экспонециальному росту обьема вычислений. 2) Предложена схема сравнения эффективности нелинейных алгоритмов по разности абсолютных значений ошибок фильтрации с использованием одновыборочных критериев знаков и знаковых рангов с бутстреп-рандомизацией. Данная методика может быть использована в исследованиях, направленных на выявление относительных преимуществ и недостатков тех или иных алгоритмов нелинейной фильтрации в одних и тех же условиях.
Методика исследования. В работе используются методы теории вероятностей и математической статистики, теории случайных процессов, оптимизации, математического анализа, имитационного моделирования.
Теоретическая ценность работы: разработаны точные алгоритмы решения рестриктивных ДТКЗ оптимизации.
Практическая ценность работы. Предложено и исследовано несколько подходов к построению алгоритмов фильтрации рестриктивных рекуррентных процессов, не требующих использования методов последовательных приближений.
Реализация результатов работы. Полученные в диссертационной работе результаты использовались в Красноярском государственном университете при чтении учебного курса "Обработка изображений".
Апробация работы. Основные результаты докладывались и обсуждались на VIII Международном симпозиуме по непараметрическим методам в кибернетике (г. Красноярск, октябрь 1995г.), на Международной научно-технической конференции по использованию результатов конверсии науки в вузах Сибири для Международного сотрудничества (Сибконверс'95) (г. Томск, октябрь 1995г.), на III Международной научно-технической конференции "Микропроцессорные системы автоматики" (г. Новосибирск, февраль 1996г.), на Международной конференции студентов и аспирантов по фундаментальным наукам "Ломоносов-96" (г. Москва, апрель 1996г.), на Втором Сибирском конгрессе по прикладной и индустриальной математике (INPRIM - 96) (г. Новосибирск, июнь 1996г.), а также на семинарах и конференциях в Сибирском физико-техническом институте.
Публикации. Основное соддержание диссертации опубликовано в 6 печатных работах.
Структура и обьем работы. Диссертация состоит из введения, 4 глав и заключения, списка литературы, насчитывающего 85 наименований. Общий объем работы - 125 страниц, включая 25 рисунков, 9 таблиц и 1 справку об использовании результатов.