Содержание к диссертации
Введение
1 Проблема активной параметрической идентификации стохастических нелинейных непрерывно-дискретных систем и задачи диссертационного исследования 13
1.1 Активная параметрическая идентификация динамических систем при предварительно выбранной модельной структуре 13
1.1.1 Этапы процедуры активной параметрической идентификации 14
1.1.2 Выбор метода решения оптимизационных задач в процедуре активной параметрической идентификации 15
1.2 Современное состояние проблемы активной параметрической идентификации непрерывно-дискретных систем 20
1.3 Структурно-вероятностное описание модели. 21
1.4 Цель и задачи исследования 23
1.5 Линеаризация модели 24
1.6 Выводы. 27
2 Оценивание неизвестных параметров 28
2.1 Критерий максимального правдоподобия для линейных нестационарных моделей 28
2.2 Алгоритмы вычисления критерия максимального правдоподобия и его градиента для линейных нестационарных моделей 32
2.3 Алгоритмы вычисления критерия максимального правдоподобия для линеаризованных моделей 36
2.4 Алгоритмы вычисления градиента критерия максимального правдоподобия для линеаризованных моделей 39
2.5 Выводы 45
3 Планирование оптимальных входных сигналов 46
3.1 Исходные понятия теории оптимального планирования эксперимента 46
3.2 Процедуры построения непрерывных оптимальных планов 50
3.3 Вычисление информационной матрицы Фишера 56
3.3.1 Выражение информационной матрицы Фишера для линейных нестационарных моделей 56
3.3.2 Алгоритм вычисления информационной матрицы Фишера для линейных нестационарных моделей 58
3.3.3 Вычисление информационной матрицы Фишера для моделей, полученных в результате линеаризации 62
3.3.4 Особенности реализации разработанных алгоритмов 65
3.4 Вычисление производных информационной матрицы Фишера по компонентам входного сигнала 66
3.4.1 Нахождение производных информационной матрицы Фишера по компонентам входного сигнала для линейных нестационарных моделей 66
3.4.2 Алгоритм вычисления производных информационной матрицы Фишера по компонентам входного сигнала для линейных нестационарных моделей 71
3.4.3 Вычисление производных информационной матрицы Фишера по компонентам входного сигнала для моделей, полученных в результате временной линеаризации 74
3.4.4 Нахождение производных информационной матрицы Фишера по компонентам входного сигнала для моделей, полученных в результате статистической линеаризации... 75
3.4.5 Алгоритм вычисления производных информационной матрицы Фишера по компонентам входного сигнала для моделей, полученных в результате статистической линеаризации 84 3.5 Выводы
4 Программное обеспечение активной параметрической идентифи кации стохастических нелинейных непрерывно-дискретных систем .
4.1 Назначение и общие сведения о программном обеспечении
4.2 Характеристика возможностей и структура программного обеспечения
4.3 Описание пользовательского интерфейса
4.4 Выводы
5 Примеры применения разработанного программного обеспечения к некоторым стохастическим динамическим системам
5.1 Активная идентификация системы, описывающейся моделью с экспоненциальной нелинейностью
5.2 Активная идентификация системы, описывающейся моделью маятника с трением
5.3 Активная идентификация системы с нелинейным элементом релейного типа с зоной нечувствительности
5.4 Выводы
Список использованных источников
- Выбор метода решения оптимизационных задач в процедуре активной параметрической идентификации
- Алгоритмы вычисления критерия максимального правдоподобия для линеаризованных моделей
- Алгоритм вычисления информационной матрицы Фишера для линейных нестационарных моделей
- Характеристика возможностей и структура программного обеспечения
Выбор метода решения оптимизационных задач в процедуре активной параметрической идентификации
Для решения задачи (1.1), (1.2) используются методы нелинейного программирования [40-47], которые включают в себя большую группу численных методов, многие из которых ориентированы на решение оптимизационных задач соответствующего класса. Выбор того или иного метода обусловлен сложностью вычисления критерия оптимальности и сложностью ограничивающих условий, необходимой точностью решения, мощностью имеющейся вычислительной машины и т.д. Подавляющее большинство таких методов относится к числу итерационных, т.е. порождающих последовательность точек в соответствии с предписанным набором правил, включающим критерий окончания. При заданной начальной точке х методы генерируют последовательность х х х2,.... Преобразование точки х в х представляет собой итерацию. Общее правило построения последовательности х имеет вид xk+1 = xk+akdk, k = 0,l,..., (1.3) где точка х - начальная точка поиска; d - приемлемое направление перехода из точки х в точку х , обеспечивающее выполнение условия f и называемое направлением спуска; а - величина шага. Для решения задач условной оптимизации используются численные методы, которые делятся на две группы:
1. Методы, использующие преобразование задачи условной оптимизации в последовательность задач безусловной оптимизации (отсутствуют какие либо ограничения на множество допустимых решений) путем введения в рассмотрение вспомогательных функций. Здесь можно выделить такие методы, как метод штрафных функций, метод барьерных функций. При этом исходные ограничения учитываются в неявном виде.
2. Методы непосредственного решения задачи условной оптимизации, основанные на движении из одной допустимой точки, где выполнены все ограничения, к другой допустимой точке с лучшим значением целевой функции. Эти методы часто называют методами возможных направлений, среди которых выделяют метод проекции градиента [40-46]. Данный метод представляет практический интерес лишь в тех случаях, когда проектирование выполняется легко, что определяется простотой устройства допустимого множества D. Численные методы решения задачи безусловной минимизации в зависимости от наивысшего порядка частных производных функции f (х), используемых для формирования dk и а из (1.3) , принято делить на три группы:
Методы нулевого порядка, использующие только информацию о значе нии функции f (х). Эффективными методами нулевого порядка считаются метод вращающихся координат или метод Розенброка [40-42,45], метод деформируемого многогранника или метод Нелдера-Мида [40,42,45,47], метод сопряженных направлений или метод Пауэлла [40,43,45], метод конфигураций или метод Хука-Дживса [40,41,45,47] и разнообразные методы случайного поиска [40,44,45]. Данные методы целесообразно применять в тех случаях, когда другие методы с более высокой скоростью сходимости не способны решить поставленную задачу (например, если минимизируемая функция не является гладкой).
Методы первого порядка (градиентные методы), использующие инфор мацию о первых производных функции f (х). В градиентных методах d в соот ношении (1.3) берется равным антиградиенту функции f (х) в точке х , т.е. ите рационный процесс имеет вид: xk+1 = xk-a f fxM a 0
Наиболее эффективными среди градиентных методов являются метод сопряженных градиентов или метод Флетчера-Ривса [40-47] и квазиньютоновские методы, основанные на аппроксимации матрицы вторых производных или обратной к ней. Исторически первым квазиньютоновским методом является метод Дэвидона-Флетчера-Пауэлла [40-47]. В настоящее время выделяют метод Бройдена-Флетчера-Голдфарба-Шенно [43,46,47]. Градиентные методы целесообразно применять в тех случаях, когда есть возможность вычислять производные минимизируемой функции.
Методы второго порядка, требующие для своей реализации знания вто рых производных функции f(x). Методы второго порядка следует использовать лишь в тех случаях, когда достаточно легко получить матрицу вторых производных минимизируемой функции. К этой группе относятся метод Ньютона и его модификации [40-47], среди которых заслуживают внимание методы доверительной области [46-48], оказавшиеся весьма эффективными для задач высокой размерности.
Одним из наиболее эффективных методов решения нелинейной задачи (1.1), (1.2) является метод последовательного квадратичного программирования [46,47], состоящий в последовательном решении задач квадратичного программирования, аппроксимирующую данную задачу оптимизации. Квадратичная задача оказывается более простой по сравнению с исходной задачей и приводит к более простым ограничениям. В нашем случае критерии оптимальности при оценивании неизвестных параметров и планировании эксперимента получаются достаточно сложными функциями, поэтому целесообразно было применить именно этот подход для решения задач оптимизации.
Алгоритмы вычисления критерия максимального правдоподобия для линеаризованных моделей
Анализ научной отечественной и зарубежной литературы показал большой интерес к проблеме активной параметрической идентификации динамических систем на основе планирования эксперимента. Отметим, что в современных исследованиях синтез оптимальных входных сигналов осуществляется методами теории оптимального планирования эксперимента и методами теории оптимального управления с определенным преобладанием методов первой группы.
Большой вклад в рассмотрение задачи планирования эксперимента при различных способах задания модели динамического объекта и подходы к их решению был сделан в монографии В.Г. Горского, Ю.П. Адлера, А.М. Талалая [17].
Отметим также такие работы Г. Гудвина и Р. Пейна [50], Л. Льюнга [8], Э. Уолтера и Л. Пронзато [10], связанные с использованием планирования входных сигналов для стохастических моделей в форме передаточных функций. Аналогичные вопросы, но для моделей в пространстве состояний, обсуждались, например, в статьях Р. Мехры [51,52], монографии В.И. Денисова, В.М. Чубича, О.С. Черниковой, Д.И. Бобылевой [53].
Что касается непрерывно-дискретных систем, здесь наиболее полно рассмотрены и изучены вопросы планирования оптимальных входных сигналов для детерминированного случая.
В статьях В.Н. Овчаренко [54-58], Э. Морелли [59] рассматривались вопросы планирования входных сигналов при построении непрерывно-дискретных моделей с детерминированными линейными уравнениями состояний, при этом неизвестные параметры входили в матрицы состояния и управления. В работе В.И. Денисова и А.А. Попова [38], а также в статьях К. Жобертье, Ф. Бурнонвил-ля, П. Котон и Ф. Ренделя [60], К. Жобертье, Л. Денис–Видаль, П. Котон и Г. Джоли-Бланшар [61] аналогичные вопросы рассматривались при построении непрерывно-дискретных моделей с детерминированными нелинейными уравнениями состояний. Вопросы активной идентификации стохастических непрерывно-дискретных систем менее изучены. По-видимому, причина во многом обусловлена самой сложностью проблемы.
Задача планирования входных сигналов во временной области при построении непрерывно-дискретных линейных стационарных моделей со стохастическими уравнениями состояний и измерений приведена, например, в статьях А.Ж. Аб-денова [62], А.Ж. Абденова, В.И. Денисова, В.М. Чубича [63], А.А. Попова [64], в которых неизвестные параметры входят в матрицы состояния и управления. В статьях В.И. Денисова, В.М. Чубича, Д.И. Бобылевой [65-67], а так же в монографии В.И. Денисова, В.М. Чубича, О.С. Черниковой и Д.И. Бобылевой [53] данная проблема рассматривалась для общего вхождения неизвестных параметров, т.е. когда неизвестные параметры входят в матрицы состояния, управления, возмущения, измерения, в начальные условия и в ковариационные матрицы шумов системы и измерений в различных комбинациях.
На момент написания диссертации было получено выражение для элементов информационной матрицы одноточечного плана для стохастических линейных и нелинейных непрерывно-дискретных систем, описываемых моделями в пространстве состояний [68]. В дальнейшем автором будет предпринята попытка распространить концепцию активной идентификации на многомерные стохастические нелинейные непрерывно-дискретные системы, описываемые нестационарными моделями в пространстве состояний, содержащие, в том числе и существенные нелинейности и соответствующие наиболее общему случаю, когда неизвестные параметры входят в уравнения состояния и наблюдения, начальные условия и ковариационные матрицы шумов системы и измерений в различных комбинациях.
Описание моделей в пространстве состояний позволяет с единых методологических позиций рассматривать различные системы (нелинейные и линейные, нестационарные и стационарные), учитывая имеющиеся физические представления о механизмах работы системы и создавать мощные программные средства для анализа и синтеза динамических систем.
Рассмотрим следующую управляемую, наблюдаемую, идентифицируемую модель динамической системы: На основании выполненного анализа можно сформулировать цель настоящей работы как развитие теоретических и методологических основ концепции активной параметрической идентификации стохастических нелинейных непрерывно-дискретных систем на основе планирования входных сигналов.
Иными словами, необходимо для математической модели (1.6), (1.7) с учетом высказанных априорных предположений разработать процедуру активной параметрической идентификации на основе планирования входных сигналов, исследовать эффективность и оценить целесообразность ее применения для стохастических нелинейных непрерывно-дискретных систем, содержащих, в том числе и существенные нелинейности. Для этого необходимо решить следующие задачи:
1. Разработка процедур оценивания неизвестных параметров математических моделей методом максимального правдоподобия с возможностью вычисления соответствующих градиентов по рекуррентным аналитическим формулам. 2. Разработка процедур синтеза оптимальных входных сигналов с возможностью вычисления соответствующих градиентов по рекуррентным аналитическим формулам.
3. Разработка программного обеспечения активной параметрической идентификации стохастических нелинейных непрерывно-дискретных систем, снабженной пользовательским интерфейсом.
При активной параметрической идентификации нелинейных систем (1.6), (1.7) с указанными априорными предположениями будем применять временную [69-71] и статистическую [3,72-78] линеаризации, в результате сводя исходную задачу к соответствующей задаче для модели вида (1.8), (1.9) со специальным образом определенными векторами a[u(t),t]1, A(t k+i) и матрицами F(t), H(t k+i).
Непрерывно дифференцируемость вектор - функций f[x(t),u(t),t и h[x(t k+i),t k+i] по x(t), u(t) и x(t k+i) соответственно позволяет осуществить линеаризацию во временной области [20,21,68] нелинейной модели (1.6), (1.7).
Алгоритм вычисления информационной матрицы Фишера для линейных нестационарных моделей
Планирование входных сигналов является, по-видимому, наиболее эффективным способом управления экспериментом, использующимся при построении моделей стохастических динамических систем. Отметим, что свобода в выборе входных характеристик существенно зависит от приложений. В экономических и экологических системах у экспериментатора нет возможности воздействовать на систему с целью проведения идентификационных экспериментов, в то время как в лабораторных условиях и на стадиях разработки нового оборудования выбор входных величин имеет лишь амплитудные и мощностные ограничения.
Предварим рассмотрение алгоритмов синтеза оптимальных входных сигналов изложением некоторых основополагающих понятий и результатов теории планирования эксперимента для нашего случая.
Исходные понятия теории оптимального планирования эксперимента Под непрерывным нормированным планом условимся понимать совокупность величин Здесь веса Pi могут принимать любые значения в диапазоне от 0 до 1, в том числе и иррациональные. Множество планирования Qu определяется ограничениями на условия проведения эксперимента. На практике чаще всего используются два типа ограничений [17,51,52]. Ограничения на амплитуду отдельной управляющей функции имеют вид а u(t) b. Ограничения на мощность управляющего сигнала задаются, например, соотношением J uT(t)u(t)dt с.
Для плана (3.1) нормированная информационная матрица М() определяет ся соотношением
Будем считать, что входные сигналы являются кусочно-постоянными функциями, сохраняющими свои значения на интервале между соседними измерениями. В этом случае точки спектра плана (3.1) будут иметь следующую структуру
Нормированные информационные матрицы обладают следующими свойствами: 1. Для любого непрерывного нормированного плана информационная мат рица М(Д) - вещественная, симметричная, неотрицательно-определенная матрица порядка s х s (s - количество неизвестных параметров). 2. Множество матриц М(Д), соответствующее всем возможным нормиро ванным планам (3.1), является выпуклым. Если область допустимых входных сигналов Qv замкнута, то и множество информационных матриц замкнуто. 3. Для любого непрерывного нормированного плана , всегда найдется дис кретный план п, спектр которого содержит не более чем q = +1 точек и нормированная информационная матрица M(q) которого совпадает с информационной матрицей М(4) плана . Последнее свойство важно с практической точки зрения. Оно позволяет заменить непрерывный нормированный план, обладающий теми или иными экстремальными показателями информационной матрицы, столь же эффективным дискретным планом. Подчеркнем, что в [51-53] приведено универсальное доказательство теоремы 3.1, применимое как к статическим, так и к динамическим моделям.
Планирование оптимальных экспериментов опирается на критерии оптимальности планов [14-18]. Поскольку для модели (1.6), (1.7) информационная матрица плана и сам оптимальный план зависит от неизвестных параметров, в дальнейшем будем иметь в виду только локально-оптимальное планирование. Воспользуемся критериями А - и D - оптимальности.
План , называется А - оптимальным, если его дисперсионная матрица имеет наименьший след, т.е. А - оптимальный план позволяет найти оценки неизвестных параметров с минимальной средней дисперсией. При этом эллипсоид рассеивания имеет минимальную сумму квадратов длин осей и наименьшую длину диагоналей параллелепипеда, описанного около этого эллипсоида.
План называется D - оптимальным, если =aig max detMfc) = aig mm detD($) = aig mm Г-lndetM )! eQ eQ SeO где D() = M_1 () - дисперсионная матрица плана. Для D - оптимального плана объем эллипсоида рассеивания оценок параметров минимален. Для указанных оптимальных планов чрезвычайно полезной оказывается следующая обобщенная теорема эквивалентности. Теорема 3.2 [39,51-53,65]. Следующие утверждения: эквивалентны между собой. При этом информационные матрицы планов, удовлетворяющих условиям 1 - 3, совпадают и любая линейная комбинация планов, удовлетворяющих 1 - 3, также удовлетворяет 1 - 3. Подчеркнем, что для критерия А - оптимальности: можно решать непосредственно (напрямую) с помощью общих методов численного поиска экстремума [40-47], в том числе и с применением методов глобальной оптимизации [85,86]. Характерной особенностью этого подхода является большая размерность экстремальной задачи. Для критериев А - и D - оптимальности получается задача выпуклого программирования, возможные варианты решения которой представлены, например, в [15]. Остановимся на следующем варианте прямой градиентной процедуры построения непрерывных оптимальных планов из [20,53,65]!:
Характеристика возможностей и структура программного обеспечения
В точках D - оптимального плана , функция JLI(U, , ) достигает своего максимального значения s можно решать непосредственно (напрямую) с помощью общих методов численного поиска экстремума [40-47], в том числе и с применением методов глобальной оптимизации [85,86]. Характерной особенностью этого подхода является большая размерность экстремальной задачи. Для критериев А - и D - оптимальности получается задача выпуклого программирования, возможные варианты решения которой представлены, например, в [15]. Остановимся на следующем варианте прямой градиентной процедуры построения непрерывных оптимальных планов из [20,53,65]!: в котором q = + 1, s - количество неизвестных параметров. Вычислим ин 2 формационные матрицы м{л]\ одноточечных планов для i = l,2,...,q и по формуле (3.2) информационную матрицу всего плана 0 . Положим к = 0. Шаг 2. Считая веса РрР ,- ,Pq фиксированными, для задачи выполним одну итерацию метода последовательного квадратичного программирования (см. п. 1.1.2). Составим план Соответствие значений параметров Х[М()], n(U,), ц прямой процедуры критериям А D - оптимальности определяется соотношениями (3.3), (3.4).
Если требуемое условие оптимальности выполняется (см. следствия из теоремы 3.2), закончим процесс. В противном случае повторим вс сначала, скорректировав начальный план
Таким образом (см. соотношения (3.6)-(3.9)), применение прямой градиентной процедуры синтеза непрерывных А – или D – оптимальных планов предполагает разработку алгоритмов вычисления ИМФ и их производных по компонентам точек спектра плана эксперимента (3.1). Другой подход (его называют двойственным) к решению оптимизационной задачи (3.5) основан на обобщенной теореме эквивалентности. В этом случае рассматриваемая задача уже не является задачей выпуклого программирования, но размерность пространства варьируемых параметров может оказаться существенно меньше, чем при прямом подходе. Возможные варианты двойственных процедур представлены, например, в [14,18]. Остановимся на следующей двойственной градиентной процедуре построения непрерывных оптимальных планов из [20,21,53,6s] 1:
Соотношения (3.10) - (3.12) показывают, что, как и в случае прямой градиентной процедуры, для применения двойственной градиентной процедуры синтеза непрерывных А – или D – оптимальных планов необходимо разработать алгоритмы вычисления ИМФ и ее производной по компонентам точек спектра плана эксперимента.
Мы будем использовать комбинированную (прямую двойственную) процедуру, заключающуюся в сочетании прямого и двойственного подходов, первый из которых используется для улучшения начального приближения, а второй – для его последовательного уточнения.
Практическое применение в процедуре активной параметрической идентификации построенного непрерывного оптимального плана затруднительно, поскольку веса pj в общем случае являются произвольными вещественными числами, заключенные в интервале от нуля до единицы. Несложно заметить, что в случае заданного числа возможных запусков системы v величи ны lq = vpj могут оказаться нецелыми числами. Поэтому необходимо округлить величины lq до целых чисел. Очевидно, что полученный в результате такого округления план будет отличаться от оптимального непрерывного плана, причем приближение тем лучше, чем больше число возможных запусков V.
Выражение информационной матрицы Фишера для линейных нестационарных моделей
Впервые аналитическое выражение элементов ИМФ для гауссовских стационарных линейных непрерывно-дискретных систем, описываемых моделями в пространстве состояний, было получено в работе А.Ж. Абденова и А.А. Попова [87] для случая, когда неизвестные параметры входят в матрицы состояния и управления. При этом было использовано представление фильтра Калмана в форме нормированной обновляющей последовательности.
В [88] для такого же характера вхождения неизвестных параметров, но с применением уравнений фильтра Калмана в форме ненормированной обновляющей последовательности, было получено соответствующее выражение, что позволило оптимизировать процедуру вычисления информационной матрицы за счет исключения необходимости извлекать квадратный корень из матрицы в каждый момент времени. Эта идея впоследствии была использована в [53,89] при выводе ИМФ для гауссовских линейных стационарных систем для более общего случая вхождения неизвестных параметров в матрицы состояния, управления, возмущения, измерения, в начальные условия и в ковариационные матрицы шумов системы и измерений.
В [68] представлено выражение ИМФ для гауссовских линейных нестационарных непрерывно-дискретных систем при таком же вхождении неизвестных параметров. Для математической модели (1.8), (1.9) представим выражение для элементов информационной матрицы плана, сосредоточенного в одной точке: N-l My(U;0)= I Sp