Введение к работе
-3-
Актуальность работы. Формальные математические методы обработки информации и анализа сложных динамических объектов заняли законное место в инструментарии решения разнообразных прикладных задач управления и оптимизации в технических, экономических, социальных и других реальных системах. Для их эффективного решения ключевым условием является выбор адекватной математической модели явлений, протекающих при наличии случайных воздействий и априорной неопределенности. Для ряда технических задач набор таких моделей и соответствующий математический аппарат уже существует. Наличие этих моделей определено высокой изученностью указанных систем и явлений, и наличием соответствующих детерминистических законов физики. Использование для решения задач анализа, оценивания и оптимизации в таких системах со случайными возмущениями классической теории стохастических дифференциальных уравнений (СДУ) с винеровскими процессами представляется исчерпывающим.
В то же время существует ряд явлений и порожденных ими задач анализа и управления, формальное описание которых с помощью известных математических моделей является недостаточным. Для них предложен некоторый набор моделей, однако они являются "локальными", то есть условия их адекватности и применимости весьма обременительны. К подобным явлениям в области авиационной и ракетно-космической техники относится, например, движение маневрирующего летательного аппарата в турбулентной атмосфере в условиях неопределенных управляющих воздействий, и связанные с ним задачи слежения и наведения. К этому же классу принадлежат задачи обнаружения, распознавания и сопровождения множественных воздушных целей в условиях помех различного рода.
Случайные процессы такого вида обладают общей ключевой особенностью: они представляют собой "склейку" решений разных СДУ, проведенную в случайные моменты времени. При этом закон смены "локальных" моделей также случаен. Для обозначения таких систем одним из наиболее употребляемых является термин " системы со случайной структурой". Исследование задач анализа, оценивания и оптимизации в этих системах различными математическими средствами выполнялось и ранее. В нашей стране идеи использования таких систем были изложены в 1961 г. в цикле статей1 в качестве возможного подхода к решению одной прикладной задачи стабилизации. Развернутое описание диффузионного процесса со случайной структурой и переключениями в виде марковского скачкообразного процесса (МСП) с конечным числом состояний было приведено в пионерской статье Р.Л. Стратоновича2, а затем и в его классической монографии3. С объектами такого рода автор связывал понятие условно-марковского процесса. В дальнейшем теоретические результаты по анализу, оцениванию и управлению, а также методы и численные алгоритмы решения различных прикладных задач были предложены Т.А. Авериной, В.М. Артемьевым, Р. Бро-кеттом, В.А. Бухалевым, В.А. Васильевым, И.С. Деминым, А.В. Добровидовым, В.В. Домбровским, СВ. Емельяновым, Т.В. Завьяловой, С.С. Ломакиной, И.Е. Казаковым, И.Я. Кацем, Г.М. Кошкиным, И. А. Кузнецовым, Д. Либерзоном, П.В. Пакшиным,
1 Красовский Н.Н., Лидский Э.А. Аналитическое конструирование регуляторов в системах со случайными свой
ствами, I—III. // Автоматика и телемеханика.— 1961.— Т. 22, No 9-11.
2 Стратонович Р.Л. Условные процессы Маркова // Теория вероятностей и ее применения.— 1960.— Т. 5, No 2.—
С. 172-195.
Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления.— М.: Изд-во МГУ, 1965.
-4-А.В. Пантелеевым, B.C. Пугачевым, В.Г. Репиным, К.А. Рыбаковым, И.Н. Синицы-
ным, А.Н. и Ф.А. Скляревичами, В.И. Смагиным, И.Л. Сотсковой, Г.А. Тимофеевой,
В.И. Уткиным и др.
В 1966 г.4 Л. Баум и Т. Петри ввели понятие " скрытой марковской модель!'' (СММ) как случайной функции от марковской цепи. Начиная с этого времени, исследования СММ разделилось на ряд направлений5'6. Это деление обусловлено подклассами исследуемых процессов, рассматриваемыми задачами, методами их решения и областями применения. Анализ СММ как частного случая временных рядов (включая вопросы эргодичности, стационарности и устойчивости), а также задачи оценивания/идентификации и статистических выводов о таких моделях исследовались И.А. Богуславским, М.Ю. Бородовским, П. Бриантом, Дж. Вильямсоном, А. Витерби, Дж. Гамильтоном,Г.К. Голубевым, О.Н. Граничиным, Р. Греем, В. Женон-Катало, О. Зей-тони, X. Ито, Дж. Киффером, К. Кобаяси, Т. Ковером, В. Кришнамурти, В. Ларедо, Б. Леруа, Г. Линдгреном, В.В. Моттлем, И.Б. Мучником, Ш. Мэйном, П. Нараяном, Л. Рабинером, М. Россиньолем, Дж. Томасом, Р. Фонтаной, К. Франком, Р.З. Хась-минским, У. Хольстом.
Другое ключевое направление исследований СММ было связано с процессами в непрерывном времени. Это свойство определило концепцию описания данных процессов в терминах стохастических динамических систем, что наиболее полно отражено в монографии Р. Эллиотта, Л. Аггуна и Дж. Мура.7 Задачи анализа и оценивания состояний в таких СММ, в том числе в условиях неопределенности, рассматривались в работах К. Барбозы, Т. Башара, Ф. Бернара, П. Бертрана, Т. Бьорка, Ф. Букаса, А. Дембо, М. Джеймса, Ф. Дюфура, А. Германи, А. Жерарди, Э. Косты, X. Мао, А.И. Матасова, Б.М. Миллера, 3. Пана, А.Б. Пиуновского, В. Рунггалдьера, К. Сеси, К. де Сузы, А. Трофино, М. Фрагозо, Л. Шайхета.
Многочисленные приложения теоретических результатов по анализу, оцениванию и оптимизации в СММ для решения практических задач навигации и слежения за воздушными и морскими судами, управления финансами и страхования, экономики и управления производством и телекоммуникационными системами, передачи информации и кодирования, обработки почерка, речи, сигналов и изображений, биологии и физиологии, климатологии и физики плазмы можно почерпнуть из работ К.В. Авра-ченкова, В. Анисимова, Я. Бар-Шалома, В. Блейра, X. Блома, М. Гоша, Дж. Пина, Л. Кампо, Т. Кирубиджана, Р. Люгенбуля, Т. Жантье, С. Маркуса, Р. Мотвани, Р.Ш. Липцера, В. Павловича, П. Перейры, Б. Розовского, С. Сатчела, Д. Смита, М. Солы, Ф. Спаньоло, Я. Цвитанича, А.Н. Ширяева, Д. Эйнгворда и др.
Анализ опубликованных результатов приводит к следующим выводам, определяющим направления исследований данной диссертации.
-
Отсутствует универсальный математический аппарат вероятностного описания и анализа стохастических дифференциальных систем со случайной структурой.
-
В подавляющем большинстве статей по СММ, в качестве переключающих выступали МСП с конечным числом состояний. Это обстоятельство сильно сужает класс реальных явлений, которые могут быть описаны с помощью таких моделей.
4 Ваит L. Е., Petrie Т. Statistical inference for probabilistic functions of finite state Markov chains // Ann. Math.
Statist.- 1966.- Vol. 37.- Pp. 1554—1563.
5 Cappe 0., Moulines V., Ryden T. Inferences in Hidden Markov Models.— NY: Springer, 2005.
8 Ephraim Y., Merhav N. Hidden Markov processes // IEEE Trans. Inform. Theory.— 2002.— Vol. 116, no. 6.— Pp. 1518-1569.
7 Elliott R. J., Aggoun L., Moore J. B. Hidden Markov Models: Estimation and Control.— Berlin: Springer-Verlag, 1995.
-
Отсутствует формальное доказательство марковского свойства пары "диффузионный процесс с переключениями — процесс переключений".
-
Не найден общий вид решения задачи оптимальной в среднеквадратичном смысле (СК-оптимальной) фильтрации состояний СММ. Исследования в этой области привели к пессимистичному результату: оптимальная оценка будет конечномерной только для весьма узкого класса систем без наблюдений диффузионной компоненты. Тем не менее, вычисление СК-оптимальных оценок даже посредством решения уравнений Кушнера-Стратоновича или Закаи для условной плотности, является ключевым для решения последующих задач оптимального управления по неполной информации и разработки численных алгоритмов соответствующих оптимальных и субоптимальных процедур.
-
Исследование задач оценивания и управления в системах наблюдения со СММ в условиях априорной неопределенности зачастую ограничивалось рассмотрением линейных или кусочно-линейных систем. С другой стороны, множество допустимых оценок/управлений обычно постулировалось линейными функциями наблюдений. Наконец, в качестве показателей оптимальности выступали робастные Н и Н2 критерии, которые косвенно накладывали специфическое ограничения на вид неопределенности как параметров системы, так входных и воздействий/шумов.
Помимо этих выводов следует указать все термины, использующиеся для обозначения случайных процессов и динамических систем, структура которых подвержена марковским скачкообразным изменениям:
— условно-марковские процессы,
- системы со случайной структурой, системы с изменяющейся структурой,
системы с марковскими переключениями,
системы в случайном (марковском) окружении,
кусочно-детерминированные процессы, гибридные системы,
скрытые марковские модели и процессы.
Множества объектов, соответствующих каждому термину, пересекаются, но не совпадают. В диссертации для этого "пересечения" вводится единый термин " скрытой марковской системы" (CMC), обозначающий любую динамическую систему наблюдения, в которой уравнения состояния и/или наблюдения определяют случайную функцию от внешнего ненаблюдаемого (скрытого) марковского скачкообразного процесса - субординатора. Если субординатор имеет конечное число состояний, то соответствующая скрытая марковская система называется традиционной (ТСМС), в противном случае будет использоваться термин " обобщенная скрытая марковская система''' (ОСМС).
Цели и задачи работы. Целью диссертации является разработка теоретических основ и методов вероятностного анализа и статистического оценивания процессов и параметров в скрытых марковских системах с непрерывным временем, при наличии различных комплексов априорной и статистической информации.
Для достижения выбранной цели необходимо:
-
сформировать комплексный систематический подход к определению и изучению ОСМС, включая выбор для них класса процессов переключений и вероятностного описания соответствующих стохастических дифференциальных систем со случайной структурой:
-
решить задачу анализа состояний ОСМС:
-
построить теорию оптимального линейного, условно-оптимального и оптимального нелинейного оценивания состояний в CMC по разнородным наблюдениям:
-
решить задачу байесовской идентификации параметров CMC:
-
построить теорию минимаксного линейного оценивания частично наблюдаемых случайных элементов со значениями в гильбертовых пространствах в условиях априорной неопределенности их моментных характеристик, с приложениями к задачам оценивания состояний неопределенно-стохастических систем наблюдения, описываемых СДУ с мерой:
-
построить теорию минимаксного апостериорного оценивания в CMC по разнородным наблюдениям в условиях неопределенности:
-
продемонстрировать эффективность разработанных теоретических методов анализа и оценивания в CMC при решении практических задач системного анализа и обработки информации в области авиационной и ракетно-космической техники.
Методы исследования. В главах 1-4 используются современные методы теории вероятностей, математической статистики и стохастического анализа, теории обыкновенных и стохастических дифференциальных уравнений с мартингалами в правой части, а также аппарат дифференциальных уравнений в частных производных и их стохастических аналогов. В главе 5, посвященной решению задач минимаксного оценивания, используются методы функционального и выпуклого анализа.
Научная новизна. В работе получены новые теоретические результаты в области анализа и оценивания в CMC, среди которых можно выделить следующие.
1. Предложен единый математический формализм для описания и анализа со
стояний ОСМС:
- выделен и проанализирован класс специальных МСП, служащих переключателями в ОСМС,
- решена задача анализа ОСМС: получено обобщение уравнения Фоккера-
Планка-Колмогорова (уравнения ФПК) для переходной вероятности и плотности рас
пределения, и определены условия существования и единственности их решений.
2. Представлены решения задач оптимального оценивания состояний и пара
метров CMC по разнородным наблюдениям:
решены задачи оптимальной линейной, условно-оптимальной (полиномиальной) и оптимальной нелинейной фильтрации и сглаживания МСП:
решены задачи оптимальной нелинейной фильтрации и сглаживания состояний ОСМС в форме обобщения уравнения Закаи для условной плотности распределения, и определены условия существования его решения:
решена задача байесовской идентификации параметров CMC.
3. Найдено решение задачи минимаксного линейного оценивания частично на
блюдаемых случайных элементов со значениями в гильбертовых пространствах в усло
виях априорной неопределенности их моментных характеристик, получено условие
минимаксности линейной оценки типа условия Винера-Хопфа.
4. Получено решение задачи минимаксной линейной фильтрации в
неопределенно-стохастических системах, заданных СДУ с мерой.
5. Разработана теория минимаксного апостериорного оценивания состояний и
параметров в CMC в условиях статистической параметрической неопределенности.
Практическая ценность работы состоит в том, что ее теоретические результаты могут служить основой для разработки программно-алгоритмического обеспечения решения прикладных задач анализа систем наблюдения, идентификации их
-7-параметров и оценивания состояний, в областях авиационной и ракетно-космической
техники, информационно-телекоммуникационных сетей и физики плазмы.
Апробация работы. Результаты диссертации докладывались на научных семинарах и сессии Института проблем информатики РАН; на научных семинарах кафедры математической статистики факультета вычислительной математики и кибернетики Московского государственного университета, кафедры прикладной механики и управления Механико-математического факультета и Института механики Московского государственного университета, кафедры компьютерных методов физики Физического факультета Московского государственного университета, отдела физики плазмы Института общей физики РАН им. A.M. Прохорова, факультета прикладной математики и кибернетики Томского государственного университета, кафедры кибернетики Московского государственного института электроники и математики, кафедры теории вероятностей Московского авиационного института. Материалы диссертации представлялись на международных конференциях: 30th, 31st, 34th, 43th Conferences of Decision and Control (CDC) (1991 Brighton, UK; 1992 Tucson, USA; 1995 New Orleans, USA; 2004 Nassau, Bahamas), IFAC Conference "System Structure and Control" (1995 Nantes, France), 3rd European Control Conference (ECC) (1995 Roma, Italy), IFAC Conference "Singular Solutions and Perturbations in Control Systems'1 (1997 Переславль-Залесский, Россия), International Conference "Rare Events" (1999 Riga, Latvia), 44th Conference on Decision and Control and the European Control Conference (ECC-CDC) (2005 Seville, Spain), IEEE Siberian Conference on Control and Communications (SIBCON) (2007, Томск, Россия), IFAC Workshop "Adaptation and Learning in Control and Signal Processing" (ALCOSP) (2007 Санкт-Петербург, Россия), Х-й Международной конференции "Системный анализ и управление" (2005 Евпатория, Украина), 3-й, 5-й и 6-й международных конференциях "Идентификация систем и задачи управления" (SICPRO) (2004, 2006, 2007 Москва, Россия).
Работа поддержана грантами РФФИ (05-01-00508-а и 07-02-00455-а) и программой ОИТВС РАН "Фундаментальные алгоритмы информационных технологий" (проект 1.5).
Публикации. Основные результаты диссертации представлены в 21 научной статье, опубликованной в журналах, входящих в список ВАК. Помимо этого, результаты частично опубликованы в других журналах, сборниках статей и трудах конференций на русском и английском языках, общее число публикаций — 65.
Структура и объем диссертации. Диссертация содержит введение, шесть глав, заключение, приложение и список используемой литературы. Работа состоит из 327 страниц, включая 68 рисунков, 2 таблицы и список литературы, содержащей 330 наименований. Приложение составляет 63 страницы.