Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Фатьянова Ольга Александровна

Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации
<
Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Фатьянова Ольга Александровна. Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации : Дис. ... канд. физ.-мат. наук : 05.13.18 Ульяновск, 2006 135 с. РГБ ОД, 61:06-1/864

Содержание к диссертации

Введение

Глава 1 Постановка задачи 20

1.1 Линейная дискретная стохастическая система 20

1.2 Задача оценивания вектора состояния в стационарном случае. Фильтр Калмана 21

1.3 Задача оценивания вектора состояния в квазистационарном случае. Уровни неопределенности. Оптимальный метод идентификации 24

1.4 Адаптивный фильтр Калмана 26

1.5 Линейные дискретные стохастические системы в стандартном наблюдаемом виде 27

1.6 Задачи и методы данного исследования 29

Глава 2 Вспомогательные функционалы качества 33

2.1 Требования к построению вспомогательных функционалов качества 33

2.2 Оптимальный критерий качества 34

2.3 Построение "минусового" вспомогательного функционала качества 35

2.4 Построение "плюсового" вспомогательного функционала качества 36

2.5 Выводы 44

Глава 3 Численные алгоритмы идентификации по методу ВФК 45

3.1 Идентифицируемость по методу ВФК 45

3.2 Условия и скорость сходимости вероятностных беспоисковых итеративных алгоритмов 46

3.3 Многомерная процедура стохастической аппроксимации . 48

3.4 Оптимальный алгоритм идентификации 49

3.5 Субоптимальный алгоритм 50

3.6 Выводы 50

Глава 4 Модель чувствительности 51

4.1 Вычисление частных производных минусового ВФК . 52

4.2 Вычисление частных производных плюсового ВФК . 54

4.3 Разработка вычислительно эффективных формульных схем для модели чувствительности 56

4.4 Выводы 62

Глава 5 Динамический контроль устойчивости на основе критерия Джури 63

5.1 Необходимость контроля устойчивости 63

5.2 Критерий Джури 65

5.3 Вычисление коэффициентов характеристического многочлена 67

5.4 Вычисление коэффициентов характеристического многочлена. Частные случаи 79

5.5 Эвристический алгоритм для контроля устойчивости . 81

5.6 Стратегии корректировки в эвристическом алгоритме для контроля устойчивости 82

5.7 Выводы 85

Глава 6 Вычислительные эксперименты 86

6.1 Программный комплекс 86

6.2 Типы проводимых экспериментов 88

6.3 Построение линий уровня функционалов качества 89

6.3.1 Эксперименты для размерности п = 1 91

6.3.2 Эксперименты для размерности п = 2 93

6.4 Время сходимости вероятностных численных алгоритмов оптимизации 94

6.4.1 Эксперименты для размерности п = 1 96

6.4.2 Эксперименты для размерности п — 2 99

6.5 Проверка работоспособности эвристического алгоритма

контроля устойчивости при использовании различных стра

тегий корректировки 102

6.6 Выводы по результатам численного моделирования 105

Заключение 107

Литература

Введение к работе

Актуальность темы. Задача адаптивной идентификации дискретных стохастических систем, то есть задача нахождения неизвестных параметров путём настройки с целью достижения экстремума критерия качества, возникает во многих отраслях1, в частности, в биологии, медицине, сейсмологии, связи, экономике, навигации и радиолокации.

Развивая идею адаптивного подхода, исследователи стремились создать методы, дающие несмещённые оценки параметров. Первоначальная идея обучающихся фильтров2, воспринятая многими исследователями раннего периода (в числе которых, в частности, Sen3 и Горский4), оформилась в генеральное направление поисков, известное научному сообществу как принцип минимальной ошибки предсказания (МОП)5 и считающееся на данный момент "классическим". Отличительная особенность МОП-методов состоит в том, что оптимальный настраиваемый параметр в* отыскивается в процессе минимизации (производимой в допустимом множестве О) функционала невязки r(t) = z(t) — z(t): то есть разности между наблюдаемым выходом z(t) системы и предсказанной оценкой выхода z(t). Наличие обратной связи по функционалу качества в реальном процессе идентификации, а не только в предварительных (теоретических) построениях, позволяет трактовать принцип МОП как активный принцип адаптации.

Хотя МОП-методы стали предметом огромного числа исследований за последние 30 лет, смещение оценок по-прежнему остается досадным неудобством. Так, было показано6, что в тех случаях, когда идентифика-

^ustafsson F. Adaptive Filtering And Change Detection. — Chichester, Weinheim, New York, Brisbane, Singapore, Toronto: John Wiley & Sons LTD, 2000. - 498p.

2Prouza L. Bemerkung zur linearen Predictoren mittels eines lernenden Filters.// Trans, of the First Prague Conference on Information Theory. Prague, 1957.

3Sefl O. Filters and predictors which adapt their values to unknown parameters of the input process, j j Trans, of the Second Prague Conference on Information Theory. Prague, 1960.

4Горский А.А. Автоматическая оптимальная фильтрация. //Изв. АН СССР, OTH, Энергетика и автоматика, 1962, вып. 5. — С.87-96

5Caines Peter Е. Linear stochastic systems. — John Willey & Sons, New York Chichester Brisbane Toronto Singapore, 1988.

6Grospeaud 0., Poinot T. and Trigeassou J.C. Unbiased identification in closed-loop by an output error technique.// In: Proceedings European Control Conference ECC'99, CD-ROM, file F0792, 1999.

дня базируется лишь на неполных и зашумленных измерениях вектора состояний системы, несмещенность оценок не может быть гарантирована. Более того, реальность в настоящее время такова, что несмещенные оценки оптимальных параметров могут быть получены только при некоторых специальных допущениях и в специальных формулировках задач7. Причиной смещения оценок, получаемых с помощью МОП-методов, является способ формирования функционала качества идентификации, а именно тот факт, что предсказывается не истинное (недоступное) состояние x(t) объекта, а неполные зашумленные наблюдения z(t): имеющиеся в наличии.

Работа алгоритмов идентификации дополнительно осложняется тем, что минимизацию критерия качества обычно нужно осуществлять в некотором компактном множестве — области устойчивости системы. Особенность адаптивных систем заключается в том, что даже кратковременный выход вектора настраиваемых параметров из допустимого множества может приводить к расходимости системы. Следовательно, традиционные методы условной оптимизации, например, метод штрафных функций, не гарантируют сохранение устойчивости процесса идентификации. Кроме того, трудности возникают на этапе проверки адаптивной системы на устойчивость, поскольку эта проверка сводится к вычислению коэффициентов характеристического многочлена. Их приближённые значения хоть и можно получить численными методами, но с большими вычислительными затратами. В связи с указанными сложностями исследования в области обеспечения устойчивости адаптивных систем недостаточны и в практическом отношении ограничиваются конкретными примерами небольших размерностей.

Таким образом, в области адаптивной идентификации на данный момент, в числе других, остро стоят две проблемы: (1) построение функционалов качества для получения несмещённых оценок в случае неполных зашумленных измерений и (2) разработка методов контроля устойчивости адаптивной системы произвольной размерности и их внедрение в процесс идентификации.

7Landau I.D., Karimi A. An output error recursive algorithm for unbiased identification in closed-loop. Automatica, 1997, vol. 33. — pp.933-938

Целью работы является повышение качества (скорости сходимости и устойчивости) идентификации систем с активным принципом адаптации. Достижение поставленной цели обеспечивается решением следующих задач:

построением вспомогательного функционала качества, который

гарантирует несмещенность оценок в условиях неполных зашум-ленных измерений;

обладает свойством практической реализуемости, то есть задействует только доступные величины;

разработкой и исследованием работоспособности эвристического ал
горитма в качестве средства контроля устойчивости в процессе иден
тификации, в частности:

получение явных формул коэффициентов характеристического полинома для систем произвольной размерности, но специального вида (а именно — стандартного наблюдаемого вида) с тем, чтобы в дальнейшем иметь возможность перейти (посредством невырожденных преобразований) к системам общего вида;

разработка и практическая апробация возможных стратегий корректировки, применяемых при выходе настраиваемого параметра из допустимой области.

Методы исследования. Для получения теоретических результатов использованы методы теории вероятности, случайных процессов и математической статистики, а также дискретной математики, линейной алгебры и методов численной оптимизации. Для программной реализации алгоритмов и получения экспериментальных результатов использованы язык высокого уровня C++ и среда Mat lab.

Достоверность результатов диссертации обеспечена математическими доказательствами теоретических построений и подкреплена реальными данными в соответствии с методологией математического моделирования и вычислительного эксперимента.

Научная новизна. В работе введено понятие эквиминимальных функционалов, то есть функционалов, у которых совпадают аргументы минимизации. С этой точки зрения, построен новый вспомогательный функционал качества, отличающийся двумя свойствами: доступность (практическая реализуемость из доступных величин) и эквиминималь-ность с исходным, однако недоступным критерием качества фильтрации, — результат оформлен в виде теоремы. Новый функционал, названный "плюсовым" (поскольку в качестве исходного функционала взят квадратичный критерий разности вектора состояний и его калмановской скорректированной оценки), испытан практически с целью выявления его селективных свойств, определяющих скорость сходимости алгоритмов идентификации.

Построены новые, эффективные формульные схемы для вычисления функций чувствительности, основанные на специальном виде матриц.

Для динамического контроля и поддержания устойчивости адаптивной системы разработан и экспериментально опробован новый эвристический алгоритм. Предложены и протестированы стратегии корректирующих действий в этом алгоритме.

Для линейных дискретных систем произвольной размерности в стандартном наблюдаемом виде впервые выведены явные формульные зависимости коэффициентов характеристического уравнения от настраиваемых параметров.

Практическая и теоретическая значимость. Работа носит теоретический и практический характер.

Прикладная значимость работы подкреплена наличием программного комплекса, зарегистрированного в Отраслевом фонде алгоритмов и программ [11]. Программа, созданная средствами Matlab/C++, полезна как инструментарий студента при изучении адаптивных систем обработки информации методами численного моделирования и вычислительного эксперимента.

Предложенный в работе "плюсовый" функционал качества дает специалистам, применяющим адаптивную обработку сигналов, инструмент повышения качества работы методов идентификации. Математикам, работающим в области идентификации, предложенный функционал демон-

стрирует новые полезные идеи преобразований для улучшения селективных свойств функционала качества.

Сравнительный анализ плюсового и минусового функционалов качества может использоваться как рекомендация по обоснованному выбору того или иного функционала для конкретной прикладной задачи.

Предложенный и испытанный соискателем эвристический алгоритм контроля устойчивости представляет собой простое (в вычислительном отношении) средство, способное на практике придавать адаптивной идентификации желаемое свойство безусловной работоспособности в широком классе стандартных наблюдаемых моделей произвольной размерности.

Основные положения, выносимые на защиту.

  1. Построение нового ("плюсового") вспомогательного функционала качества, который задействует только доступную информацию и является эквиминимальным по отношению к исходному (недоступному) критерию качества фильтрации, обеспечивая тем самым несмещенность оценок, получаемых посредством алгоритмов идентификации.

  2. Экспериментальное испытание нового функционала с целью анализа его селективных свойств, определяющих скорость сходимости алгоритмов идентификации.

  3. Эффективные (экономичные с вычислительной точки зрения) формульные схемы для вычисления функций чувствительности.

  4. Разработка и испытание эвристического алгоритма для контроля и обеспечения устойчивости адаптивной системы в процессе идентификации, а также разработка и апробация стратегий корректирующих действий при выходе настраиваемого параметра за пределы допустимого множества.

  5. Теорема о коэффициентах характеристического уравнения для линейных дискретных систем произвольной размерности в стандартном наблюдаемом виде, позволяющая алгоритмизировать контроль устойчивости системы.

Апробация работы. Результаты диссертации докладывались и обсуждались на следующих конференциях:

4th European Congress on Computational Methods in Applied Sciences and Engineering (ECCOMAS-2004), Jyvaskyla, Finland (2004);

International Conference on Computational Science (ICCS-2003), St. Petersburg, Russia - Melburne, Australia (2003);

Всероссийская научная конференция "Управление и информационные технологии", Л ЭТИ, Санкт-Петербург (2003);

Международный симпозиум "Надёжность и качество", ПГУ, Пенза (2002);

IV Всероссийская научная internet-конференция "Компьютерное и математическое моделирование в естественных и технических науках", ИМФИ ТГУ им. Г. Р. Державина, Тамбов (2002);

XII ежегодная студенческая научно-практическая конференция, УлГУ, Ульяновск (2002);

XI ежегодная студенческая научно-практическая конференция, УлГУ, Ульяновск (2001);

Личный вклад автора. Постановка задачи, доказательство всех утверждений и теорем, программная реализация вычислительных алгоритмов, планирование и проведение экспериментов, а также последующий анализ результатов моделирования выполнены соискателем самостоятельно.

Публикации. По теме диссертации опубликовано 11 работ, их список помещён в конце автореферата.

Структура диссертации. Работа состоит из введения, шести глав, заключения, приложений и списка литературы из 102 наименований. Диссертация общим объёмом 135 страниц содержит 22 таблицы и 43 иллюстрации.

Задача оценивания вектора состояния в стационарном случае. Фильтр Калмана

Под стационарным понимается вариант задачи оценивания состояния xt по результатам измерений z(t) ( = 1, 2,...), в котором матрицы системы не зависят от t.

Введем ряд обозначений. Пусть р(-) — спектральный радиус матрицы. Под квадратным корнем из матрицы А О будем понимать такую матрицу В — А 2, что А = ВВТ, причем В = Вт. Для удобства дальнейшего изложения дадим несколько известных определений.

Определение 1.1 Пара матриц {А, В], где А — квадратная, а В — прямоугольная, называется стабилизируемой, если существует матрица С такая, что A -f ВС — устойчивая матрица, т. е. р(А + ВС) 1.

Определение 1.2 Пара матриц {А, В}, где А — квадратная, а В — прямоугольная, называется детектируемой, если существует матрица D такая, что р{А + DB) 1. Теперь сформулируем теорему о фильтре Калмана в стационарном случае (см. [42]): Теорема 1.1 Пусть в стационарном варианте задачи оценивания выполнены условия: 1. R 0 2. пара матриц {Ф, Н} — детектируемая, 3. пара матриц {Ф, Q5} — стабилизируемая. Тогда справедливы следующие утверждения:

1. Любое решение Pit) дискретного (разностного) уравнения Риккати (здесь оно представлено в рекуррентном виде) P{t + 1) = ф (p(t) - Pit)HT (HP(t)HT + Я)"1 HP{t)\ ФТ + Q с начальным условием P(t = 0) 0 имеет предел lim P{t) = Poo, и t—юо этот предел совпадает с единственным неотрицательно определенным решением дискретного алгебраического уравнения Риккати Р = ф(р-РН (НРНТ + R) 1 НР\ Фт + Q.

2. Для калмановского коэффициента усиления K{t) = P(t)HT (HP(t)HT + R) l существует предел Коо = lim Kit), t— oo причем матрицы A = Ф(/ — К Н) и В = {I — КооЩФ устойчивы: р{А) 1 и ріВ) 1.

В этой теореме не предполагается ни устойчивость матрицы Ф, ни полная наблюдаемость системы. Однако, если принять хотя бы одно из этих требований, то условия (2) и (3) теоремы будут выполнены автоматически. Будем предполагать, что р(Ф) 1, det Ф ф 0 и система полностью наблюдаема, т.е. rank([/) = п, где и={Нт\(НФ)т\...\(НФп-1)т]т

Заметим, что det Ф ф 0 следует из невырожденности фундаментальной матрицы решений ДУ, соответствующих системе (1.1-1.2), т.е. не является принципиальным ограничением.

В этих условиях существуют установившиеся оценки x{t ) и x(t+), оптимальные в среднеквадратическом смысле, причем они единственны и подчиняются следующим уравнениям калмановской фильтрации:

Начальные значения (t = 0): x(t+ = 0)=х0 (1.5) P(t+ = 0) = Р0 (1.6) Этап 1: экстраполяция, t = 0, 1,... ж(Г + 1) = ФхіҐ) (1.7) Р(Г + 1) - ФР(і+)Фт + д (1.8) Этап 2: коррекция оценок по измерениям, t = 1, 2,... #( ) = Р{Г)НТ(НР(Г)НТ + Я} 1 (1.9) .( +) = ж(Г) + АГ( ) (г(0 - #ж(Г)) (1.10) p(t+) == P(r)-K{t)HP(r) (1.11)

Таким образом, согласно приведенной теореме и сделанным предположениям, при t — оо достигается установившийся режим фильтрации. Практически это происходит достаточно быстро в силу свойства устойчивости матриц А и В (см. условия теоремы) и тем быстрее, чем больше запас устойчивости для любой из этих матриц [42].

Построение "минусового" вспомогательного функционала качества

Определим "плюсовый" ИФК: Л( +) = Е{ег( +)е( +)}, = 0,1,,.. (2.4) и затем впервые введем "плюсовый" ВФК: Je(t+) = -E{eT(t+)e(t+)}, 4 = 0,1, (2.5)

Выведем формулы для вычисления e(t+), учитывая при этом требования, сформулированные в разд. 2.1 (стр. 33). Результат оформим в виде двух теорем (Теорема 2.2 и Теорема 2.2) и трех лемм (Лемма 2.1, Лемма 2.2, Лемма 2.3). Замечание 2.1 В нижеследующих доказательствах будем, как обычно, считать, что сумма равна 0, если верхний предел меньше нижнего. Лемма 2.1 Справедливы следующие равенства: E{rT(t)(I-HK)Tv(t)} = R-E{vT(t)KTHTv{t)} (2.6) E{vT(t)(I-HK)r(t)} = R-E{vT{t)HKv{t)} (2.7)

Доказательство. Подставим (1.15) в выражение Е {rT(t)(I — HK)Tv(t)} , затем воспользуемся (1.2) и (1.13) и раскроем первые скобки: E{rT(i)(/-#A-)T )} = E{(Hx{t) + vT(t)-Hx{r))(I-HK)Tv(t)} = = Е{Яж( )(/-ЯЛОГі ( )} + + Е{ї;г(г)(/-#А )Г7;(г)} - Е{Я (Г)(/-ЯА )тг;(0} Из (1.2) и (1.12-1.14) видно, что ( ) и v(t) независимы. Кроме того, в силу постановки задачи, x(t) и v(t) также независимы. Следовательно, первое и второе слагаемое в предыдущей формуле обращаются в нуль: Е {rT{t){I - HK)Tv(t)} = Е {vT(t){I - HK)Tv(t)} Вновь раскроем скобки. Учтем (1.4) и получим: E{rT{t){I-HK)Tv{t)} = E{vT(t)v{t)}-E{vT{t)KTHTv{t)} = = R-E{vT{t)KTHTv(t)} Равенство (2.7) проверяется аналогично. Лемма 2.2 Справедливо следующее равенство: еф+) = (I - HK)(z{t) - z(t)) - v{t) = (1- HK)r{t) - v(t) (2.8)

Доказательство. Распишем первую компоненту e(t+) = x(t) — x(t+), учитывая (1.16) и затем применяя последовательно (1.14), (1.13) и (1.2): e{1](t+) = He(t+) = Hx(t)-H(x(r) + K(z(t)-z(t))) = - Hx{t) - z(t) - HK(z(t) - z(t)) = = z(t)-v(t)-z(t)-HK(z(t)-z(t)) Сгруппировав слагаемые, придем к требуемой формуле: e[i)(t+) = (1- HK)(z(t) - z(t)) - v(t) = (1- HK)r(t) - v(t) Теорема 2.1 Существует величина e (t+), такая, что Е {el](t+)e{1](t+)} =Е{4]( +)Є[І]( +)}+СОТІ5« (2.9) В частности, величина [і](+) может быть взята в виде: еф+) = yJr №-K{l]) + 2K{l]R

Доказательство. Воспользуемся Леммой 2.2. Возведем обе части (2.8) в квадрат и возьмем математическое ожидание: Е{ef4( +)} = . E{(rT(t)(I - HKf - vT(t))((I - HK)r(t) - v(t))} = = E{rT(t)(I - HK)(I - HK)r(t)} + E {vT(t)v(t)} - E{rT(t)(I-HK)Tv(t)} - E{vT(t)(I-HK)r(t)} Используя Лемму 2.1 и (1.4), получим: E{ef,j( +)} = E{rT{t){I-HK)(I-HK)r{t)}+R - R + E{vT{t)KTHTv{t)}-R + E{vT(t)HKv{t)} = = Е {rT(t)(I- HK){I-HK)r(t)} + + E{vT(t)(KTHT + HK)v{t)}-R Поскольку r(t) и R скаляры, a HK = Кщ = KTHT, можно записать: E{e[i](i+)} = №{rT(t)(I - HK)T(I - HK)r(t)}+2HKR- R = = E{r\t)(l-K{l])2}+2K{1]R-R Занесем второе слагаемое под знак математического ожидания: E{el](t+)}=E{r2(t)(l-K{l])2 + 2K[1]R}-R (2.10) В (2.10) выражение, стоящее под знаком математического ожидания, неотрицательно, поскольку представляет собой сумму неотрицательных величин: 0 Кщ 1 (свойство коэффициента Калмана), R 0 (см. (1.4)). Тогда, чтобы обеспечить Условие 2 (стр. 33), примем: [i]( +) = yJr №-K{1]) + 2K{1]R Очевидно, что при этом выполняется (2.9), причем константа равняется —R. Лемма 2.3 При 1 і п верно следующее равенство:

Действительно, из постановки задачи и из уравнения адаптивного фильтра следует, что ошибка Є[г+1](+) не зависит от шума v{t + г), поскольку t < t + і при 1 < і. Аналогично, e^+ij(t+) не зависит от шума w(t — j + i), так как t < t — j + i при 1 < і, 1 < j < і. Далее, шумы {v(t)} и {w(t)} представляют собой взаимно независимые последовательности по условию задачи.

Второе и третье слагаемое в левой части являются константами (причем второе равно R). Следовательно, получаем: Е {е|+1](г+)} Л-const = Е< (r(t + i) + J2 Kmr{t + і - j + 1) j > (2.19) Выражение, стоящее под знаком квадрата в правой части (2.19), есть искомая величина [г-+1], обеспечивающая выполнение (2.14)

Условия и скорость сходимости вероятностных беспоисковых итеративных алгоритмов

Взяв в формуле (3.3) скалярную матрицу A[ ][] = \, і = 1, 2,..., N, получаем алгоритм, представляющий собой стохастический аналог градиентного метода. Это алгоритм, разработанный Роббинсом и Монро, называется многомерной процедурой стохастической аппроксимации и часто упоминает ся в литературе [3, 63, 58, 16]: [t + l] = ЄЩ - Л[ + 1]5г[фй Л[ + 1] = j±-, t = l, 2, ... Определение 3.1 Алгоритм идентификации называется оптимальным, если он обеспечивает лучшую среди всех алгоритмов скорость сходимости 9Щ к 6 [45].

Оптимальным методом идентификации для данной задачи будет метод наименьших квадратов (МНК) [45], где A[t] определяется но следующей формуле: A[t + 1] = ЛСД - Л"1М5ГМ (ЯМАЙКИ)"1 S[t]A[t]. Обозначим Q[t] = Л-1 [і] и выпишем оптимальный алгоритм: зададим начальное значение Г2[1] = /; вычислим n[t +1] = Q[t] + S[t]TS[t]; из системы линейных уравнений Q[ + 1]A0[] = —5т[/:]є[і] найдем приращение A0[t]; вычислим новое значение вектора параметров 6[t + 1] = 9[t] 4- A6[t]

К недостаткам оптимального алгоритма следует отнести тот факт, что на каждом шаге приходится решать СЛУ (с матрицей Г2[ + 1] 0). Это довольно трудоемкая операцией, поэтому имеет смысл упростить метод так, чтобы обойтись без нее и тем самым значительно сократить объем вычислений.

Субоптимальный алгоритм

Введем алгоритм, называя его субоптимальным, поскольку он представляет собой упрощенный вариант оптимального. Упрощение выполним следующим образом: в матрице [ [2] оставим только диагональные элементы: 2 . о Oe\t] ST[t]S[t] о деЩ дв\щ Субоптимальный алгоритм запишем следующим образом: зададим начальное значение Q[l] = /; пересчитаем диагональные (т.е. ненулевые) элементы матрицы О,: %,-][ + !] = %,-][ ] + дє[і] двщ , i = l,2,...,N вычислим новое значение вектора параметров:

В данной главе показана идентифицируемость по методу ВФК, что позволят отыскивать истинное значение исходного параметра как аргумент минимизации ВФК ("минусового" или "плюсового"), применяя для этой цели вероятностные итеративные алгоритмы оптимизации. Три алгоритма, рассмотренных в данной главе, записаны в форме, удобной для вычислительной реализации в рамках программного комплекса для моделирования и будут использованы в Главе 6 для экспериментальной апробации новых теоретических результатов из Главы 2 и Главы 5.

Численная реализация вероятностных итеративных алгоритмов идентификации включает в себя вычисление градиента функционала качества. Эта операция должна быть проделана на каждом шаге алгоритма, поэтому особенно важно, чтобы она выполнялась эффективно. В этой главе разработаем формульные схемы для функций чувствительности, позволяющие добиться существенной вычислительной экономии благодаря учету особенностей матриц в стандартном наблюдаемом виде.

Введем алгоритм, называя его субоптимальным, поскольку он представляет собой упрощенный вариант оптимального. Упрощение выполним следующим образом: в матрице [ [2] оставим только диагональные элементы:

В данной главе показана идентифицируемость по методу ВФК, что позволят отыскивать истинное значение исходного параметра как аргумент минимизации ВФК ("минусового" или "плюсового"), применяя для этой цели вероятностные итеративные алгоритмы оптимизации. Три алгоритма, рассмотренных в данной главе, записаны в форме, удобной для вычислительной реализации в рамках программного комплекса для моделирования и будут использованы в Главе 6 для экспериментальной апробации новых теоретических результатов из Главы 2 и Главы 5.

Численная реализация вероятностных итеративных алгоритмов идентификации включает в себя вычисление градиента функционала качества. Эта операция должна быть проделана на каждом шаге алгоритма, поэтому особенно важно, чтобы она выполнялась эффективно. В этой главе разработаем формульные схемы для функций чувствительности, позволяющие добиться существенной вычислительной экономии благодаря учету особенностей матриц в стандартном наблюдаемом виде.

Разработка вычислительно эффективных формульных схем для модели чувствительности

Рассмотрим подробнее выбор 9Т Є 0. Первая стратегия корректировки, предложенная в изначальном варианте алгоритма в [27], состоит в том, чтобы взять 0 = 0[t — 1], поскольку на предыдущей итерации система была устойчива. Этот подход работоспособен для тех случаев, когда $ расположено близко к границе О и выход за границы произошел на последних шагах идентификации. Однако, если выход происходит на начальном этапе идентификации, когда шаг велик, эта стратегия приводит к тому, что параметр в может оставаться неизменным в течение продолжительного времени (несколько тысяч итераций или несколько десятков тысяч итераций). Идентификация как бы останавливается (см. рис. А. 11)). Для возникновения такой ситуации достаточно, чтобы 9[t — 1] оказалось достаточно близко к границе в, что нередко и происходит на практике. Чтобы идентификация продолжилась, необходимо, чтобы шаг стал достаточно малым, причем чем Л л. ближе 6[t — 1] к границе 0, тем меньше должен стать шаг. Соответственно, когда идентификация наконец продолжится, сходимость значительно замедлится, поскольку малая величина шага будет обусловлена не потребностями алгоритма аппроксимации, а требованиями устойчивости.

Впервые явление остановки идентификации для первой стратегии описано автром данной работы на основании данных вычислительных экспериментов и опубликовано в [65]. В [65] предложена вторая стратегия: взять в качестве W центр .области 0. Также в [65] приводятся формулы для п = 2 для вычисления $. Эксперименты подтвердили работоспособность второй стратегии: остановка идентификации не происходит. Однако у нее есть два существенных недостатка. Во-первых, для болыпих размерностей нахождение центра области G представляется трудноразрешимой задачей. Во-вторых, метод плохо работает для случая, когда 9 расположено близко к границе 0.

На конечном этапе идентификации 9[t] приближается к 9 , и следовательно, к границе 0. Если в этой ситуации окажется, что 9[t] $. 0, то корректировка /Ч /ч по второй стратегии отбросит 9[t] далеко от 9 . Шаг при этом уже мал, и по УЧ требуется большое количество итераций, прежде чем 9[t] вновь приблизится

Когда же это произойдет, ситуация может вновь повторяться вновь и вновь, сколько угодно много раз, иричем требуемое качество идентификации так и не будет достигнуто (рис. А. 12). /ч л.

Проблему отыскания центра области 0 можно обойти, взяв качестве 9 любую точку, находящуюся далеко от границы области устойчивости. Для задачи заданной размерности нахождение такой точки не составляет труда. Например, это может быть 9 в предшествующий началу идентификации момент времени (Jstart — 1) (Полагаем, что идентификация начинается спустя некоторое время от начала моделирования). К сожалению, вторая проблема при этом не снимается.

Первая стратегия хорошо работает в тех ситуациях, когда выход за гра л ницы G происходит на заключительном этапе идентификации из-за близости к ним 0 . Если же выход за границы 0 происходит на начальном этане идентификации, то первая стратегия приводит к нарушению сходимости. Вторая стратегия, напротив, лучше для второго случая, но не всегда работоспособна в первом.

Разработаем комбинированную стратегию корректировки, лишенную недостатков двух предыдущих стратегий. Возьмем за основу первую стратегию и модифицируем ее следующим образом. Если корректировка потребовалась в момент времени о и затем г раз подряд, то в момент времени (to 4- г) будем проводить корректировку вида: & := [t0 - г]

В случае, если параметр требуется отбросить назад слишком далеко (скажем, более чем на М итераций), то будем применять вторую стратегию.

Таким образом, третья стратегия представляет собой синтез двух преды-дущих. Когда выход за границы 0 происходит на конечном этапе идентификации из-за близости к ним в , то третья стратегия похожа на первую и незначительно отбрасывает в назад по времени. Если же выход за границы 0 происходит на начальном этапе идентификации, то третья стратегия сводится ко второй, для которой характерно значительное изменение в. Таким образом, третья стратегия более универсальна, поскольку соотносит способ корректировки с ситуацией. Это хорошо видно на рис. А. 13.

Похожие диссертации на Вспомогательные функционалы качества и контроль устойчивости в задачах стохастической идентификации