Содержание к диссертации
Введение
Глава 1. Анализ проблемы робастного оценивания состояния ЭЭС
1.1. Краткая характеристика проблемы 13
1.1.1. Вводный пример 13
1.1.2. Неверные измерения: источники ошибок и разновидности 17
1.1.3. Взаимосвязь задач робастного оценивания и идентификации НИ . 21
1.2. Роль локальной избыточности измерений 23
1.2.1. Критические группы, локальные избыточность и наблюдаемость . 25
1.2.2. Условие топологической идентифицируемости НИ 30
1.2.3. Условие алгебраической идентифицируемости НИ 33
1.2.4. Иллюстративный пример 35
1.3. Анализ существующих методов обеспечения робастности оценок 38
1.3.1. Классификация методов 38
1.3.2. Методы идентификации НИ 40
1.3.3. Комбинаторные методы, LMS-, LTS-оценки 48
1.3.4. Неквадратичные методы 54
1.4. Выводы 58
Глава 2. Неквадратичные критерии оценивания состояния ЭЭС
2.1. Общие положения 60
2.2. Устойчивая модель ошибок измерений 61
2.2.1. О нормальной модели ошибки 61
2.2.2. Подход минимаксной дисперсии Хьюбера 63
2.2.3. Устойчивые плотности распределения ошибок 66
2.3. Робастные М-оценки 70
2.3.1. Монотонные оценки 70
2.3.2. Немонотонные оценки 73
2.4. Пороговые свойства робастных М-оценок 76
2.4.1. Об определении предела устойчивости оценок в ЭЭС 76
2.4.2. Пороговая точка: устойчивость в глобальном 78
2.4.3. Устойчивость в локальном 82
2.4.4. Иллюстративный пример. Диаграмма устойчивости 84
2.4.5. Результаты исследований 91
2.5. Улучшение пороговых свойств монотонных М-оценок 94
2.5.1. Масштабирование строк матрицы R~]/2H с помощью весов w... 94
2.5.2. Метод расчета оптимальных весов 95
2.5.3. Обобщенные М-оценки типа Хилла, Швеппе, Маллоуза 100
2.5.4. Результаты исследований 101
Глава 3. Численные методы оценивания состояния ЭЭС по неквадратичным критериям
3.1. Общие положения 110
3.2. Вычислительные свойства задачи 112
3.2.1. Вырожденность минимума и многоэкстремальность 112
3.2.2 Малая область сходимости ньютоновских методов 116
3.3. Модифицированный метод Ньютона 119
3.3.1. Определение направления поиска 119
3.3.2. Определение шагового множителя 122
3.3.3. Применение метода для нахождения немонотонных М-оценок . 124
3.3.4. Сравнение с существующими методами 128
3.4. Улучшение обусловленности метода: оценивание при ограничениях 131
3.4.1. Метод модифицированной функции Лагранжа 132
3.4.2. Метод расширенной системы Хачтела 135
3.4.3. Блочная формулировка метода расширенной системы 137
3.4.4. Определение длины шага. Коррекция второго порядка 138
3.5. Результаты численного исследования 141
3.5.1. Описание тестовых примеров 141
3.5.2. Выбор параметров модифицированного метода Ньютона 143
3.5.3. Сравнение с другими способами модификации 144
3.5.4. Исследование методов улучшения обусловленности 152
Глава 4. Параллельные вычислительные алгоритмы оценивания состояния ЭЭС в нейросетевом базисе
4.1. Общие положения 160
4.2. Базовая модель нейронной сети 162
4.3. Анализ устойчивости непрерывной модели НС 166
4.3.1. Критерий наименьших квадратов 167
4.3.2. Неквадратичный критерий Хьюбера 169
4.4. Выбор шага в дискретной модели НС 171
4.4.1. НС с постоянным шаговым множителем 171
4.4.2. НС с адаптивным шаговым множителем 176
4.5. Модели нейронных сетей, использующие множители Лагранжа 179
4.5.1. Модели для оценивания с ограничениями в форме неравенств . 180
4.5.2. Обобщение на случай ограничений в форме равенств 187
4.6. Результаты численного моделирования 187
4.6.1. Устойчивость и робастные свойства НС 188
4.6.2. Исследование факторов, влияющих на быстродействие НС 191
4.6.3. НС, использующие множители Лагранжа 197
Заключение 201
Литература 204
- Роль локальной избыточности измерений
- Устойчивая модель ошибок измерений
- Улучшение обусловленности метода: оценивание при ограничениях
- Анализ устойчивости непрерывной модели НС
Введение к работе
Актуальность проблемы. Решение аналитических задач оперативного контроля и управления электроэнергетическими системами (ЭЭС) требует использования оперативной модели энергосистемы, формируемой в темпе процесса по данным телеметрической информации о положении коммутационной аппаратуры и значениях параметров режима. Эта модель необходима для оптимизации и коррекции параметров режима ЭЭС, анализа ее надежности, проведения различных имитационных расчетов, связанных с проверкой тех или иных прогнозируемых ситуаций и т.д. Одним из этапов построения оперативной модели ЭЭС является оценивание ее состояния.
Для корректной статистической постановки задачи оценивания и последующего выбора процедуры ее реализации важно иметь представление о вероятностном распределении ошибок телеметрических измерений. Существующая теория оценивания состояния ЭЭС, берущая начало в 70-х годах прошлого века, построена на предположении, что ошибки измерений подчиняются нормальному закону распределения. К этому закону прибегали и прибегают для обоснования применения статистического критерия наименьших квадратов, лежащего в основе методов оценивания состояния ЭЭС. Однако, несмотря на математическую красоту, возможности практического использования такой постановки задачи оказываются чрезвычайно ограниченными. Нормальный закон распределения ошибок измерений на практике никогда не бывает корректным. Большие ошибки измерений, порождаемые более длинными "хвостами" функции плотности распределения, - наиболее очевидное, но не единственное свидетельство его невыполнения. Резкое искажение результатов оценивания состояния ЭЭС, вызываемое такими ошибками, приводит к неверному представлению о режиме функционирования ЭЭС и, следовательно, принятию неверных управляющих решений.
Неустойчивость процедуры наименьших квадратов к грубым ошибкам неверных измерений (НИ) является одной из причин, препятствующих широкому использованию результатов оценивания в практике оперативного управления ЭЭС. Поэтому на протяжении последних 40 лет разрабатываются и совершенствуются методы обнаружения и идентификации неверных измерений. Анализ современных разработок в этой области свидетельствует о тенденции ко все большему увеличению сложности (как алгоритмической, так и временной) процесса анализа достоверности измерений. Это усугубляется ростом размерности расчетных схем ЭЭС и количества обрабатываемых измерений. Растет понимание влияния других начальных допущений. Все это свидетельствует об актуальности вопроса пересмотра традиционной постановки задачи оценивания состояния ЭЭС с целью ее ориентации на получение оценок, устойчивых к нарушениям исходных допущений и оптимальных не только для заданной нормальной модели ошибки измерений, но и в некоторой ее окрестности, отвечающей неполным знаниям и представлениям о вероятностных свойствах телеметрических измерений. Такие оценки называют робастными.
Исследования непосредственно связаны с выполнением научных тем лаборатории энергетических систем Отдела энергетики ИСЭиЭПС КНЦ УрО РАН «Разработка интегрированной системы управления нормальными и аварийными режимами региональной электроэнергетической системы на базе технологий искусственного
интеллекта», гос.рег. №01.960.005932 (1996-2000 гг.), «Разработка методов исследования и обеспечения режимной надежности региональной электроэнергетической системы с применением новых информационных технологий», гос. per. №01.200.116595 (2001-2005 гг.), «Методы изучения и моделирование надежности функционирования региональных энергетических систем с учетом их производственно-экономической организации», гос.рег. №0120.0603398 (2006-2010 гг.).
Цели и задачи исследования. Целью исследования является разработка научно-методических основ робастного оценивания состояния ЭЭС на основе неквадратичных критериев. Для этого поставлены следующие задачи:
-
Изучение влияния свойств ЭЭС и ее измерительной системы на возможность получения робастных оценок состояния ЭЭС.
-
Разработка теоретических подходов к построению и анализу робастных процедур оценивания состояния ЭЭС, малочувствительных к отклонениям от исходных предположений.
-
Разработка и исследование численных методов и алгоритмов робастного оценивания состояния ЭЭС, обеспечивающих быструю и надежную сходимость вычислительного процесса.
Методология исследований. Разработанные в диссертации научные положения, методы и модели базируются на теории оценивания состояния ЭЭС и теории робастной статистики, использовании прикладной теории множеств и графов, теории вероятностей, теории оптимизации, нелинейного программирования, методов имитационного моделирования, теории искусственных нейронных сетей. Достоверность научных результатов и теоретических выводов подтверждается вычислительными экспериментами для тестовых схем, в том числе путем сопоставления разработанных методов и моделей с широко применяемыми на практике, а так же опытом их использования при оперативном управлении режимами региональной ЭЭС.
Научная новизна. В ходе выполнения исследования в работе получены следующие новые результаты:
-
Разработаны и обоснованы количественные (топологические и алгебраические) показатели, характеризующие локальную избыточность измерений и локальную наблюдаемость параметров режима ЭЭС.
-
Получены необходимые и достаточные условия идентифицируемости НИ, определяемые уровнем локальной избыточности и задающие принципиальные ограничения на возможность идентификации плохих данных в составе измерений.
-
Предложена устойчивая модель ошибки измерения и обосновано применение неквадратичных критериев для робастного оценивания состояния ЭЭС.
-
Разработан математический аппарат анализа и оптимизации пороговых свойств робастных оценок. Получены условия их устойчивости к НИ в ситуации локальной избыточности измерений в ЭЭС.
-
Разработаны численные методы оценивания состояния ЭЭС по неквадратичным критериям, основанные на модификации метода Ньютона, в том числе с учетом ограничений в форме равенств.
-
Решена задача эффективного расчета оптимального шагового множителя, обеспечивающего высокую надежность и скорость сходимости численных методов при использовании критериев, имеющих кусочно-линейную функцию первой производной.
-
Предложены новые принципы организации вычислений по оцениванию состояния ЭЭС, ориентированные на применение нейроподобных вычислительных устройств параллельной архитектуры.
-
Разработаны вычислительные модели нейросетевых алгоритмов как с непрерывной, так и с дискретной динамикой. Для различных критериев оценивания доказаны их устойчивость и оптимальность решений.
Практическая значимость. Использование предложенной постановки задачи оценивания состояния ЭЭС и методов ее решения приводит к повышению надежности результатов оценивания состояния и, следовательно, качеству оперативной модели ЭЭС в условиях непредсказуемого поведения ошибок телеметрических измерений. При этом исключается необходимость разработки сложных алгоритмов идентификации НИ. Теоретические и методические положения робастного оценивания состояния ЭЭС могут быть использованы при решении других электроэнергетических задач, имеющих дело со случайной исходной информацией.
Использование результатов. Численные методы и алгоритмы робастного оценивания состояния ЭЭС легли в основу создания программы "PSSE", предназначенной для оперативного расчета установившегося режима ЭЭС по данным телеметрических измерений, которая была внедрена в среду ОИК АСДУ региональной Коми энергосистемы (ныне филиал ОАО «СО ЕЭС» Коми РДУ).
Апробация. Основные положения диссертации неоднократно докладывались и обсуждались на семинарах, совещаниях и конференциях различного уровня как отечественных, так и зарубежных: межрегиональной с международным участием молодежной научной конференции «Севергеоэкотех» (г.Ухта, 1999, 2000, 2001, 2004, 2006); Коми республиканской молодежной конференции (г.Сыктывкар, 1997, 2000, 2004); Всероссийском научном семинаре с международным участием «Методические вопросы исследования надежности больших систем энергетики» (г. Иркутск, 1998, г.Сыктывкар, 1999, г.Вышный Волочек, 2000, г.Казань, 2001, г.Туапсе, 2002, г.Вологда, 2007); Всероссийской научно-технической конференции «Энергосистема: управление, качество, безопасность» (г. Екатеринбург, 2001); 2-й Всероссийской научно-технической конференции «Энергосистема: управление, качество, конкуренция» (г.Екатеринбург, 2004); 3-й Международной научно-технической конференции «Энергосистема: управление, конкуренция, образование» (г. Екатеринбург, 2008); Межрегиональном научно-техническом семинаре «Оперативное управление электроэнергетическими системами - новые технологии» (г. Сыктывкар, 2003); V-й Всероссийской научно-технической конференции «Нейроинформатика» (г. Москва, 2003); Всероссийской конференции «Математические и информационные технологии в энергетике, экономике, экологии» (г. Иркутск, 2003); Международной конференции «2005 IEEE St.Petersburg Power Tech» (St.Petersburg, 2005).
Исследования в области анализа локальной избыточности измерений были поддержаны грантом УрО РАН для молодых ученых и аспирантов (2005).
Публикации. По теме диссертации опубликовано более 30 печатных работ, в том числе отдельные разделы в 3 коллективных монографиях и 3 статьи в изданиях, входящих в перечень рекомендованных ВАК РФ.
Структура и объем работы. Диссертация содержит 220 страниц текста и состоит из введения, четырех глав, заключения, перечня литературы из 204 наименований. Работа иллюстрирована 43 рисунками и 40 таблицами.
Роль локальной избыточности измерений
В конце предыдущего раздела было отмечено, что задачу обеспечения устойчивости оценивания состояния ЭЭС к НИ можно свести к формальной задаче разделения множества измерений на хорошие (7) и плохие (). В данном разделе рассматривается вопрос о разрешимости этой задачи. Неспособность методов идентифицировать НИ необязательно свидетельствует об их неработоспособности, но может быть следствием принципиальной невозможности получить робастное решение. Поэтому важно отличать свойства методов решения от свойств задачи.
Определение 1.1. Под идентифицируемостью НИ будем понимать совокупность условий, определяющих возможность отделения множества неверных измерений S = {v, v, = v, + , + bt} от множества хороших измерений Т = (v( v, = у, + ,} при любых сочетаниях грубых ошибок bt.
Известно, что необходимым условием идентифицируемости НИ является наличие избыточности в телеметрической информации. Обычно избыточность измерений определяют как отношение числа т измерений к числу п искомых компонент вектора состояния. Этот показатель не отражает структурных особенностей измерительных систем и, вообще говоря, большое значение т/п не означает даже наблюдаемости ЭЭС. Избыточность измерений в ЭЭС имеет существенно локальный и, как правило, неравномерный характер. Она зависит как от топологии схемы и размещения в ней измерений, так и от алгебраических свойств уравнений электрической сети.
Наиболее простым является вопрос об идентифицируемости одиночных НИ. В начале 80-х годов прошлого века в теории наблюдаемости ЭЭС К.А.Клементсом и др. [87] введено понятие критического измерения. Критическое измерение это неизбыточное измерение, удаление которого из состава исходных данных делает систему ненаблюдаемой. Расчетное значение такого измерения всегда равно измеренному значению и ошибки в нем необнаруживаемы. В работах [94,74,86] установлено, что идентифицировать неверное измерение нельзя и при наличии избыточности. А именно, если НИ входит в минимально зависгшую группу измерений. Понятие минимально зависимой группы было введено К.Клементсом и др. [89] для обозначения взаимосвязанной группы измерений, характеризуемой тем свойством, что при удалении одного из измерений группы оставшиеся становятся кри тическими. В [И], при рассмотрении задачи синтеза системы сбора данных, обеспечивающей возможность обнаружения ошибок в измерениях, показано, что в системе из одного контура с измеренными перетоками в ветвях минимальное число измерений, необходимое для идентификации одного НИ, равно к + [к/2], где к - число узлов контура, [z] — целая часть числа z. Если из данного состава измерений удалить одно, то оставшиеся будут образовывать минимально зависимую группу измерений. Таким образом, необходимое условие идентифицируемости одиночных НИ формулируется следующим образом: одиночное неверное измерение идентифицируемо, если оно не является критическим и не принадлежит минимально зависимой группе измерений.
Попытка установить условия идентифицируемости множественных НИ была предпринята К.Клементсом и П.Дэвисом в работе [86]. Введя понятие критической группы измерений (определение дано ниже), авторы доказали, что НИ не-идентифицируемы, если их число в какой-либо критической группе размерности р больше, чем р-2. Исходя из этого, они делают вывод, что в противном случае НИ идентифицируемы. Однако не трудно привести пример с множественными согласующимися НИ, опровергающий это заключение. Необходимость в более глубоком изучении структурных свойств измерительной системы в рамках проблемы идентифицируемости НИ стала очевидна с переключением внимания исследователей с методов идентификации НИ на некоторые методы устойчивого оценивания, предлагаемые теорией робастной регрессии, в частности метод наименьшей медианы квадратов [153-155]. Дело в том, что в основе построения этой и подобных оценок лежит утверждение робастной статистики, согласно которому максимальное число идентифицируемых НИ не превышает половины избыточных измерений, т.е. величины [(т - п)/2[ [176]. Утверждение справедливо, когда любые п строк т х п матрицы коэффициентов линейно независимы. В задаче оценивания состояния ЭЭС в силу локальной природы избыточности измерений это условие не выполняется, что делает методически несостоятельным непосредственное применение в [153-155], а вслед за ними в [18,56,61,62 и др.] метода наименьшей медианы квадратов для оценивания состояния ЭЭС.
Условия идентифицируемости множественных НИ, излагаемые в данной работе, получены в результате развития идеи определения уровня избыточности для каждого отдельного измерения [51,53-55].
Ключевую роль в определении показателей локальной топологической избыточности измерений, а так же в установлении условий идентифицируемости НИ будет играть понятие критической группы измерений, являющееся обобщением критического измерения.
Определение 1.2. Критическая группа измерений определяется как множество измерений, удаление которых из вектора исходных данных приводит к уменьшению ранга матрщы Н производных измерений на единицу, при этом ни одно из его подмножеств таким свойством не обладает.
Проще говоря, критическая группа это множество измерений, потеря которых критична для наблюдаемости ЭЭС, но ни одно из его подмножеств таковым не является.
Следует отметить, что определение критической группы (critical kuple) в том виде, в каком оно используется здесь, было дано ККлементсом в [3,86]. Впервые же понятия «критическая пара», «критическая тройка» и т.д. были использованы им в [88]. Между тем в 90-х годах прошлого века в некоторых публикациях стали использовать термин критическая группа (critical set) для обозначения минимально зависимых групп. Совпадение понятий действительно имеет место, но лишь для групп размерности два: всякая минимально зависимая группа из двух измерений является критической, а объединение пересекающихся критических пар образует минимально зависимую группу измерений. В общем случае это не так. Подмена терминов началась с работ бразильских исследователей [92]. Возможно, это связано с тем, что в те времена критические группы высокого порядка (тройки, четверки и т.д.) были не востребованными ни с методической, ни с теоретической точек зрения, а минимально зависимые группы оказались в центре внимания. Но если на английском языке сочетания «critical kuple» и «critical set» все еще различаются, то на русский язык они переводятся одинаково, что порождает терминологическую путаницу. В данной работе используется оригинальная терминология К.Клементса.
Устойчивая модель ошибок измерений
Когда известно распределение ошибок измерений, тогда наилучшей оценкой jc вектора состояния ЭЭС является та, при которой достигается максимум плотности вероятностей вектора = v — v(x). Такая оценка в наибольшей степени использует информацию о параметрах, содержащуюся в измерениях, и называется оценкой максимального правдоподобия. Обозначим через f{) функцию плотности распределения вероятностей ошибок . Тогда оценивание состояния ЭЭС по методу максимального правдоподобия формулируется следующим образом:
Очевидно, что различным распределениям ошибок соответствуют различные оценки вектора х. Не смотря на то, что механизмы возникновения помех при телеизмерениях в целом известны [9], вероятностные характеристики ошибок измерений исследованы недостаточно. Причиной этого является трудоемкость исследования этой проблемы, связанная с большим разнообразием средств измерений, элементов систем сбора и передачи данных, вносящих свои помехи, сложность метрологического обследования измерительного оборудования, в частности трансформаторов тока и напряжения. Найти вероятностные распределения ошибок телеизмерений для огромного числа эксплуатируемых в ЭЭС приборов невозможно. Поэтому в лучшем случае обычно предполагают, что неизвестная плотность /( ) распределения вероятностей ошибки принадлежит некоторому параметрическому семейству (нормальному, двойному показательному или какому-то другому). Начиная с первых работ в области оценивания состояния ЭЭС [7,182-184], считается, что ошибки измерений распределены по нормальному закону: Это было обусловлено в основном вычислительными удобствами: максимум правдоподобия (2.1) достигается в таком случае при векторе х, минимизирующем функцию наименьших квадратов (1.2). Гамм А.З. отмечает, что «можно найти оправдание этой модели лишь в том известном в статистике обстоятельстве, что случайная величина (ошибка измерения), полученная суммированием большого числа случайных величин (ошибок измерительных приборов, преобразователей и др.), имеет распределение, близкое к нормальному» [7]. На практике оценка наименьших квадратов, замечательно ведущая себя при идеальных условиях, оказывается неробастной и теряет свои оптимальные свойства уже при небольших отклонениях от нормального закона распределения (2.2). Под небольшими отклонениями понимаются либо малые отклонения в распределениях всех измерений, либо большие отклонения в нескольких из них (грубые, большие ошибки) [58,38]. Более длинные хвосты плотности распределения реальных ошибок, объясняемые появлением грубых ошибок в измерениях, - одно из очевидных отклонений, которое привело к необходимости постановки и решения в рамках задачи оценивания состояния ЭЭС более сложной задачи - идентификации неверных измерений (см. главу 1). Но даже при отсутствии грубых ошибок нормальная модель оказывается под сомнением, хотя бы потому, что погрешность измерения всегда содержит составляющую ошибки квантования измеряемого параметра. Акцентирование внимания на зависимости свойств оценок состояния ЭЭС от закона распределения ошибок измерений, приведенное выше, порождает естественный вопрос о возможности использования для построения оценки вместо функции плотности (2.2) другой похожей на нее функции, имеющей удлиненные хвосты. Ответ на вопрос, какой эта функция должна быть, дает минимаксная теория Хьюбера [124,58]. Теория Хьюбера разработана для одномерных задач [124]. Чтобы применить ее к многомерной задаче оценивания состояния ЭЭС, определим точность оценки х, максимизирующей (2.1) в предположении, что ошибки измерений распределены по гипотетическому закону /( ) = /г( ), в то время как на самом деле имеет место закон f0{)- Для этого найдем матрицу ковариаций cov(#x), где 8Х =х-х - вектор уклонений оценки от истинного значения х . Обозначим
Улучшение обусловленности метода: оценивание при ограничениях
Направление поиска рк вычисляется как решение линейной системы вида Gkpk = -Wf(xk). Для положительно определенной матрицы Gk вектор рк есть направление спуска. Если Gk положительно определенная, но плохо обусловленная матрица, результат численного решения системы будет отличаться от точного решения вследствие ошибок округления в ЭВМ на величину : рк = Сгк1У/(хк)+ . Это отличие может быть значительным и приводить к замед лению скорости сходимости ньютоновских методов и даже к их отказу, если из-за ошибок вычислений результат расчета рк указывает в сторону возрастания минимизируемой функции. Последнюю ситуацию можно избежать, используя численно устойчивую процедуру факторизации Gk, генерирующей положительно определенную матрицу LDlI = Gk + Е, где Е - неотрицательная диагональная матрица [20]. Конечно, проблема медленной сходимости с помощью поправки Е не решается. Внесение поправок будет излишним, если устранить причины плохой обусловленности линейной подзадачи. Известно, что обусловленность зависит от многих факторов [34,115,100]. В данном разделе речь пойдет об устранении причин, возникающих на этапе постановки и решения задачи оценивания состояния ЭЭС. Факторы, определяемые свойствами объекта (неоднородность расчетной схемы ЭЭС, расположение в сети измерений и их неравноточность, тяжесть режима и пр.), считаются заданными. Ухудшение обусловленности задачи возникает при обработке фиксированных параметров режима, например, нулевых инъекций транзитных узлов, как обычных измерений. Необходимость выдерживания точных значений этих параметров требует задания величин дисперсий их ошибок близких к нулю, что приводит в результате к значительному увеличению числа обусловленности матрицы Gk. Условия фиксации значений параметров гораздо естественнее представлять в виде ограничений-равенств с, (х) = 0. Задача оценивания состояния ЭЭС формулируется тогда в виде: при ограничениях и решается методом множителей Лагранжа. Такая постановка в рамках оценивания состояния по квадратичному критерию была впервые предложена в [72] и нашла самое широкое применение за рубежом.
Особенность задачи заключается в том, что матрица коэффициентов системы линейных уравнений, получаемая на каждом шаге итерационного процесса, является знаконеопределенной. Это исключает возможность применения традиционных LDlI -алгоритмов решения разреженных систем уравнений, столь эффективных в задаче оценивания без ограничений, и требует применения специальных методов численной факторизации [146,168]. Ниже представлен подход, сохраняющий все преимущества положительно определенного LDLT -разложения. Используем постановку (3.36)-(3.37) для нахождения робастных М-оценок, но вместо функции Лагранжа рассмотрим модифицированную функцию Лагранжа, расширенную за счет добавления квадратичного штрафа: где Л - вектор множителей Лагранжа, R x - положительная диагональная матрица штрафных коэффициентов, гг (х) = (v; - v, (х))/стІ . Необходимые условия оптимальности (3.36-3.37), записываемые в виде условий Куна-Таккера: где С - дс(х)/дх - матрица Якоби ограничений. Для решения нелинейной системы уравнений (3.39) применим модифицированный метод Ньютона. Линеаризуем (3.39) в окрестности текущей точки хк, аппроксимируя нелинейные зависимости разложением в ряд Тейлора первого порядка и полагая, что матрицы Якоби в процессе линеаризации постоянные, (3.41) Кк = С, о . Заметим, что для наблюдаемой ЭЭС Fk является положи тельно определенной матрицей, тогда как в методе [72] она может быть вырожденной, если среди ограничений имеются критические по условию наблюдаемости ЭЭС. Эта особенность позволяет в полной мере использовать процедуры положительно определенной факторизации с предварительным символьным упорядочением, не опасаясь появления нулевых диагональных элементов в процессе численного разложения матрицы коэффициентов Кк.
Анализ устойчивости непрерывной модели НС
Устойчивость рекуррентной нейронной сети как замкнутой динамической системы является важнейшим условием ее работоспособности. В устойчивой нейронной сети переходный процесс, вызванный каким либо воздействием, со временем затухает. Ниже приводятся результаты исследования свойств предложенной модели НС с точки зрения ее устойчивости, оптимальности состояний и быстродействия. Теорема 4.1. Пусть функция у/ непрерывная и удовлетворяет условию Липшица: \y/{t-)-y/{r- l\r - г \, где -С - постоянная, для любых г, г є R. Тогда нейронная сеть с непрерывной динамикой (4.3-4.4) устойчива и траектория у (і) каково бы ни было исходное приближение у(0) = у о сходится к ближайшей точке равновесия у , удовлетворяющей необходимому условию оптимальности функции (4.1). Доказательство. Как доказано в [118], любая НС вида —— = -g{x{t)), где g(x) - вектор градиента функции энергии Е(х), устойчива и сходится к равновесию, если Е(х) ограничена снизу, непрерывно дифференцируема и градиент g(x) удовлетворяет условию Липшица. Нетрудно заметить, что из лишпицевости функции у/ следует непрерывная дифференцируемость целевой (энергетической) функции (4.1) и существование константы Липшица для ее градиента (4.4). В равновесном состоянии НС справедливо равенство: тогда учитывая (4.3) делаем вывод, что траектория нейронной сети может привес ти только в стационарную точку функции (4.1). Иными словами, вектор полу чаемый на выходе НС, удовлетворяет необходимому условию оптимальности пер вого порядка. Таким образом, с точки зрения теории оптимизации нейросетевой алгоритм (4.3-4.4) при выполнении условий теоремы 4.1 обладает свойством глобальной сходимости, в смысле [32]: для любой исходной точки уо решение y(f) сходится к точке, удовлетворяющей необходимому условию оптимальности. Свойство глобальной сходимости выражает надежность алгоритма и имеет первостепенное зна чение при решении любых задач реального времени на основе автоматизированных и, тем более, автоматических систем управления. Глобальная сходимость к стационарному решению не влечет сходимость к глобальному оптимуму. Тем не менее, известно [32], что если целевая функция выпуклая, то необходимое условие оптимальности оказывается достаточным, чтобы точка у была точкой глобального минимума. Так при использовании традиционной модели нейрона с монотонно неубывающей функцией активации типа гиперболический тангенс y/(r)=aanh(r/a) или кусочно-линейной (V, приЫ я, у/[г) = не только ограничивается влияние больших невязок [sgn(r) а, при г а, измерений, но и обеспечивается глобальная сходимость нейронной сети к глобальному оптимуму независимо от выбора исходной точки у0. При использовании невыпуклых функций Е(у) траектория y(t) сходится к той точке (возможно локального) минимума, в области притяжения которой оказывается начальное приближение уо. Помимо установления факта сходимости НС чрезвычайно важным является вопрос о скорости сходимости и факторов влияющих на нее. Для этого рассмотрим свойства решений уравнений движения (4.3-4.4) нейронной сети при минимизации (4.1) в рамках оценивания состояния ЭЭС по методу наименьших квадратов и с использованием выпуклой неквадратичной функции Хьюбера. Без потери общности для упрощения выкладок будем полагать ту = 1 и w] = 1. Оценивание состояния ЭЭС по критерию наименьших квадратов при нормальном распределении ошибок измерений обеспечивает статистически оптимальные несмещенные оценки параметров режима. Функция активации нейронов линейная ц/{г)=г. Покажем, что нейронная сеть в этом случае асимптотически экспонетрюлъно устойчива. Запишем уравнения (4.3-4.4) движения нейронной сети, которые в данном случае являются линейными, в векторной форме
Матрицу НТ R XH в силу симметричности можно представить [41] через собственные числа A = diag(Zl,A2i...,An) и собственные векторы как HTR lH Запись (4.7) в новых координатах представляет собой несвязанное множество дифференциальных уравнений и позволяет рассматривать движение нейронной сети независимо по каждой из координат. Переходная составляющая z {t) решения каждого из уравнений вида (4.7), как известно, имеет вид: где Cj - постоянная, определяемая из начальных условий. Если состав измерений обеспечивает наблюдаемость ЭЭС, то матрица положительно определен ная и А 0. Отсюда, заметим, следует единственность точки глобального оптимума. Время затухания переходного процесса по каждой координате определяется лишь значениями собственных чисел Л. и не зависит от начального приближения. Если Дщщ - минимальное собственное число, соответствующее наиболее "медленной" компоненте Zb то общее время сходимости нейронной сети к решению z (у ) можно оценить как время достижения zk -окрестности своего установившегося значения Zk , определяемое по формуле [36]