Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Гольцов Анатолий Сергеевич

Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности
<
Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гольцов Анатолий Сергеевич. Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности : Дис. ... д-ра техн. наук : 05.13.06 Орел, 2004 222 с. РГБ ОД, 71:06-5/221

Содержание к диссертации

Введение

1. Традиционные постановки и методы решения задач адаптивного управления 19

1.1. Особенности задач управления в системах связи и навигации 19

1.1.1. Адаптивные системы демодуляции многопозиционных сигналов, принятых в условиях априорной неопределенности 19

1.1.2. Системы управления антеннами, установленными на подвижных носителях 23

1.1.3. Анализ алгоритмов обучения нейронных сетей, используемых в сетях передачи и обработки информации 34

1.2. Автоматизированные системы контроля и управления вязкостью расплава полимеров и нефтепродуктов в процессе их производства 37

1.3. Принцип достоверной эквивалентности в задачах адаптивного управления 43

1.4. Адаптивное управление в условиях априорной неопределенности 46

1.4.1. Синтез наблюдателей переменных состояния объекта управления 47

1.4.2. Синтез формирователя управляющих воздействий при стохастическом описании неопределенностей 50

1.4.3. Регуляторы с оптимизируемыми параметрами 53

1.4.4 Адаптивное управление при минимаксном описании неопределенностей 60

1.5. Выводы и постановка задач дальнейших исследований 62

2. Регуляризованная модель системы управления 66

2.1. Априорная модель системы управления 66

2.2. Регуляризованная модель множества допустимых возмущающих воздействий 69

2.3. Регуляризованная модель допустимых управляющих воздействий 72

2.4. Регуляризованная модель ограничений на переменные состояния и фазовые траектории 74

2.5. Выводы 76

3. Синтез систем обучения модели объектов управления 78

3.1. Регуляризованная постановка задачи синтеза системы обучения модели объекта управления 78

3.2. Система обучения модели объекта управления с непрерывными возмущающими воздействиями 80

3.3. Анализ эффективности системы обучения модели объекта управления 84

3.4. Система обучения модели объекта управления с кусочно-непрерывными возмущающими воздействиями 89

3.5. Система обучения нейронных сетей с ПИД-регулятором обучающих воздействий 96

3.5.1. Математическая модель нейронной сети в пространстве состояний 97

3.5.2. Алгоритм обучения нейронной сети в контуре управления 102

3.5.3. Оценка эффективности алгоритмов обучения нейросетей 104

3.6. Выводы 108

4. Синтез адаптивных регуляторов управляющих воздействий 111

4.1. Регуляризованная постановка задачи синтеза регулятора управляющих воздействий 111

4.2. Адаптивные регуляторы управляющих воздействий 113

4.3. Сравнительный анализ алгоритмов управления 117

4.3.1. Сравнительный анализ следящих систем автоматического управления нелинейным объектом 117

4.3.2. Сравнительный анализ алгоритмов управления линейным объектом 124

4.4. Адаптивная система управления газотурбинным двигателем . 131

4.5. Выводы 136

5. Адаптивные системы связи и навигации 139

5.1. Постановка задач синтеза адаптивной системы демодуляции КАМ-сигналов, принятых по телефонной сети связи 139

5.2. Идентификация импульсных функций модели канала связи . 142

5.3. Анализ эффективности адаптивных систем демодуляции 147

5.4. Синтез адаптивной системы автосопровождения изделия АРГС-54Эпо углам 155

5.4.1. Постановка задачи синтеза адаптивной системы автосопровождения 155

5.4.2. Алгоритм оптимального оценивания положения цели 159

5.4.3. Алгоритм формирования управляющего воздействия 159

5.5. Сравнительный анализ эффективности систем сопровождения . 160

5.6. Выводы и рекомендации 168

6. Синтез адаптивных систем для промышленности . 170

6.1. Адаптивные ультразвуковые расходомеры вязких сред 170

6.1.1. Постановка задачи 170

6.1.2. Алгоритм оптимального оценивания переменных состояния ультразвуковых расходомеров 173

6.1.3. Экспериментальные исследования метрологических характеристик ультразвукового расходомера жидкости 176

6.1.4. Экспериментальные исследования метрологических характеристик ультразвукового расходомера газа 179

6.2. Адаптивная система измерения вязкости и энергии внутримоле кулярных связей молекул жидкостей 183

6.2.1. Априорная математическая модель вискозиметра 183

6.2.2. Алгоритм оценивания переменных состояния вискозиметра 185

6.2.3. Экспериментальные исследования вискозиметра 186

6.3. Адаптивная система автоматического регулирования вязкости расплава полимеров в процессе их производства 188

6.3.1. ПИ-наблюдатель переменных состояния поликонденсатора 189

6.3.2. ПИД-регулятор управляющих воздействий 191

6.3.3. Результаты применения в промышленности 192

Заключение 194

Библиографический список 197

Приложение 217

Введение к работе

Актуальность проблемы. Для управления сложными объектами в условиях априорной неопределенности применяют адаптивные системы управления. Теория адаптивного управления была создана и развита в научных школах: Р. Беллмана, К. Гловера, Д. Дойла, Р. Калмана, А.А. Красовского, Н.Н. Красовского, А.Б. Куржанского, A.M. Летова, К. Острема, Б.Н. Петрова, А.С. Позняка, Б.Т. Поляка, Л.С. Понтрягина, В.Ю. Рутковского, Дж. Саридиса, А.А. Фельдбаума, В.Н. Фомина, А.Л. Фрадкова, Я.З. Цыпкина, В.А. Якубовича и многих других ученых. Однако существующая теория адаптивного управления решает частные задачи при существенных ограничениях. Возмущающие воздействия считают эргодическими цветными гауссовскими шумами (ЭЦГШ), либо сигналами с ограниченной энергией (уровень сигнала с ограниченной. энергией с течением времени должен уменьшиться до нуля). Управляющие воздействия формируют пропорционально текущим значениям переменных состояния объекта управления (ОУ), либо используют регуляторы с заранее выбранной структурой (как правило, по эмпирическим правилам) и постоянными настраиваемыми параметрами.

Однако в реальных ситуациях в адаптивных системах автоматического управления можно использовать лишь одну реализацию возмущающих воздействий, которые являются произвольными, ио ограниченными по абсолютной величине функі}иями времени. Поэтому традиционные адаптивные системы автоматического управления с реальными возмущающими воздействиями неизбежно имеют статическую погрешность регулирования и создают существенное перерегулирование управляемых переменных. Кроме того, в нелинейных задачах адаптивного управления возникают двухточечные краевые задачи (ДКЗ), которые (за редким исключением) нельзя решать в процессе управления в реальном времени даже численными методами. В некоторых задачах управления известны траектории перехода в требуемое состояние только для части переменных состояния ОУ, а для другой части переменных состояния с помощью неравенств задано лишь множество допустимых траекторий. Существующие алгоритмы адаптивного управления такие ограничения не учитывают.

Качество синтетических волокон, полимеров, пластмасс, лаков, красок, машинных масел и других нефтепродуктов определяют по их вязкости, которая в процессе синтеза этих продуктов изменяется в большом диапазоне. Однако существующие промышленные вискозиметры не обеспечивают требуемые точность измерений и надежность. Промышленные вискозиметры, пригодные для измерения вязкости расплавов полимеров и пластмасс, в РФ и странах СНГ не производят. Поэтому на предприятиях химической и нефтеперерабатывающей промышленности РФ и стран СНГ вязкость указанных продуктов в процессе их производства определяют, как правило, с помощью лабораторного анализа контрольных порций (проб) один раз в смену. Управление технологическими процессами синтеза этих продуктов осуществляют с помощью автоматизированных систем, управляемых аппаратчиками на основе их личного опыта и интуиции. Поэтому указанные предприятия выпускают большое количество некондиционной продукции.

В автоматизированных системах поддержки принятия решений и управления, предназначенных для применения в органах государственной власти, используют прогнозирующие модели социологических и других процессов с лингвистическими и семантическими переменными, разработанные с помощью методов экспертного оценивания. Эти модели отличаются высокой степенью субъективизма и не позволяют определять фундаментальные свойства систем управления: управляемость, наблюдаемость и устойчивость.

Таким образом, задача синтеза адаптивных систем автоматического управления нелинейными объектами является актуальной научной проблемой, решение которой имеет большое теоретическое и прикладное значение.

Работа выполнена в рамках комплексной программы РАН и комплексной национальной программы Украины по созданию и развитию энергоресурсосберегающих технологий.

Цель и задачи исследования. Целью исследования является разработка основ алгоритмического синтеза систем автоматического управления для нелинейных задач адаптивного управления сложными объектами с ограниченными по абсолютной величине возмущающими воздействиями.

Для достижения этой цели потребовалось решить следующие задачи:

1. Выполнить регуляризацию исходной постановки нелинейной задачи адаптивного управления с ограниченными по абсолютной величине возмущающими воздействиями к виду, позволяющему применять принцип достоверной эквивалентности;

2. Разработать с помощью регуляризации, принципа максимума и инвариантного погружения метод решения в реальном времени нелинейной задачи оптимального управления с заданными ограничениями в конечный момент времени (с фиксированной правой границей);

3. Осуществить регуляризацию исходной постановки задачи оценивания переменных состояния нелинейного многомерного ОУ с ограниченными по абсолютной величине возмущающими воздействиями к виду, позволяющему применять для ее решения методы вариационного исчисления;

4. Разработать алгоритм оценивания в реальном времени переменных состояния нелинейного многомерного ОУ с ограниченными по абсолютной величине возмущающими воздействиями, который обращает в минимум функционал критерия обобщённой работы в регуляризованной задаче оценивания;

5. Разработать алгоритм формирования в реальном времени управляющих воздействий, обращающих в минимум функционал критерия обобщённой работы в регуляризованной задаче адаптивного управления.

6. Выполнить анализ эффективности разработанных методов и алгоритмов решения нелинейных задач оценивания и адаптивного управления многомерными объектами.

Методы исследований. В диссертации применялись методы теорий: регуляризации, аппроксимации В-сплайнами, исследования операций, случайных процессов, оценивания и идентификации систем, оптимального и адаптивного управления, нейронных сетей.

Научная новизна исследований. В диссертации получены следующие основные результаты, отличающиеся научной новизной:

1. На базе методов регуляризации А.Н. Тихонова и принципа максимума разработаны основы алгоритмического синтеза адаптивных систем автоматического управления для нелинейных задач управления сложными объектами с ограниченными по абсолютной величине возмущающими воздействиями;

2. Предложен метод регуляризации нелинейной задачи оценивания переменных состояния многомерного объекта с ограниченными по абсолютной величине возмущающими воздействиями, который позволяет преобразовать ограничения в форме неравенств в эквивалентные нелинейные алгебраические и дифференциальные уравнения для вспомогательных переменных и учитывать текущие и предшествующие значения выходных сигналов измерительных устройств и скорости изменения этих сигналов во времени;

3. Разработан алгоритм оценивания переменных состояния нелинейного многомерного объекта с ограниченными по абсолютной величине возмущающими воздействиями, который обращает в минимум функционал критерия обобщённой работы в регуляризованной задаче оценивания и осуществляет ПИД-регулирование обучающих воздействий на модель объекта управления;

4. Предложен метод регуляризации нелинейной задачи адаптивного управления, в котором исходные ограничения в форме неравенств на управляющие воздействия преобразуют в эквивалентные нелинейные алгебраические и дифференциальные уравнения для вспомогательных переменных, а ограничения на переменные состояния в конечный момент времени преобразуют в эквивалентные ограничения на траекторию;

5. Разработан алгоритм формирования управляющих воздействий (с помощью многомерных самонастраивающихся ПИД-регуляторов), обращающих в минимум функционал критерия обобщённой работы в регуляризованной задаче адаптивного управления;

6. Реализованы реальные структуры адаптивных систем автоматического управления электроприводом антенны радиолокационной станции и технологическим процессом производства полимеров, реализующих разработанные в диссертации алгоритмы с реальным экономическим эффектом.

Практическая значимость и результаты внедрений. Разработанные основы алгоритмического синтеза адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределённости составляют основное функциональное ядро локальных и интегрированных систем управления технологическими процессами и производствами химической и нефтеперерабатывающей промышленности, систем обработки и передачи информации и других сложных технических систем.

Адаптивную систему автоматического контроля вязкости расплава полимеров и автоматического управления технологическим процессом производства полимеров, разработанную в диссертации, можно применять (после соответствующей доработки) в системах управления технологическими процессами на предприятиях химической и нефтеперерабатывающей промышленности, производящих синтетические волокна, полимеры, пластмассы, лаки, краски, машинные масла и другие нефтепродукты.

Метод составления регуляризованной модели состояния сложных многомерных объектов, разработанный в диссертации, можно применять при разработке формализованных прогнозирующих моделей в пространстве состояний процессов с лингвистическими и семантическими переменными, предназначенных для автоматизированных систем поддержки принятия решений и управления. Такие модели отличаются тем, что позволяют определять фундаментальные свойства системы управления (управляемость, наблюдаемость и устойчивость) с помощью критериев, разработанных в теории управления техническими системами.

Результаты диссертационных исследований внедрены:

1. В в/ч 93872 в научно-исследовательских работах «Антенна-Р», «Элик-сир-О», «Эхо-О» и «Эгида-О» используют метод составления регуляризован ных моделей состояния сложных систем специального назначения и алгоритмы обучения этих моделей;

2. В Санкт-Петербургском высшем зенитно-ракетном командном училище в учебном процессе и при проведении научно-исследовательской работы применяют адаптивный алгоритм последовательного обнаружения и идентификации сигналов в реальной сигнально-помеховой обстановке при наличии неполной априорной информации о параметрах сигнала и шума в случае, когда интервал корреляции шума соизмерим с длительностью сигнала;

3. В Открытом акционерном обществе "НПП РАДАР ММС" (г. Санкт-Петербург) используют метод преобразования ограничений в форме неравенств в эквивалентные нелинейные алгебраические и дифференциальные уравнения в пространстве состояний; самонастраивающийся ПИД-наблюдатель переменных состояния нелинейных объектов управления, формирующий в реальном масштабе времени оценки переменных состояния, оптимальные по используемому критерию оценивания; самонастраивающийся ПИД-регулятор для нелинейного объекта управления, который формирует в реальном времени управляющие воздействия, оптимальные по используемому критерию управления;

4. Способ определения вязкости и энергии внутримолекулярных связей жидких сред в трубопроводах реализован в системах автоматического контроля и управления вязкостью расплавов полимеров в процессе их производства. Шесть таких систем установлены в химическом цехе завода органического синтеза Могилевского ПО "Химволокно" в 1994 г. (г. Могилев, Белоруссия). Срок службы вискозиметров 10 лет. Подтвержденный средний годовой экономический эффект (полученный при эксплуатации вискозиметров в 1994-2001 г.г.) равен 36890,55 марок ФРГ;

5. Алгоритм определения расхода газа ультразвуковым расходомером используют с 1997 г. в образцовом расходомере газа, разработанном в Государственном научно-исследовательском институте метрологии измерительных и управляющих систем "Система" (г. Львов, Украина). В результате погрешность определения расхода газа снижена до 0,5%, что дало основание для применения разработанного расходомера в качестве образцового;

6. Алгоритм определения расхода жидкости с помощью ультразвукового расходомера применяют в автоматизированной системе учета потребления горячей воды и тепловой энергии, установленной в 1996 г. в Комплексе водных видов спорта (г. Львов, Украина);

7. Алгоритм определения расхода жидкости ультразвуковым расходомером используют с 1996 года Львовским государственным университетом в автоматизированной системе учета потребления воды и тепловой энергии;

8. Уточненная математическая модель ультразвукового расходомера, в которой учитывают реальный профиль скоростей потока жидкости в поперечном сечении трубопровода, и алгоритм оптимального оценивания расхода применялась в 1994-1996 г.г. в Научно-производственном центре "Прувер" (г. Львов, Украина) в системах учета расхода жидкостей, газов и тепловой энергии. Эти системы были разработаны по заказу Конструкторского бюро "ХАРТРОН-ВИЭТ" (г. Харьков, Украина), ОАО "ДНЕПРОГАЗ" (г. Днепропетровск, Украина) и ГНИЙ метрологии измерительных и управляющих систем "Система" (г. Львов, Украина).

Основные положения, выносимые на защиту. Разработанные в диссертации основы алгоритмического синтеза адаптивных систем автоматического управления для нелинейных задач управления сложными объектами содержат следующие новые научно-обоснованные результаты, которые выносятся на защиту:

1. Метод составления регуляризованных моделей состояния многомерных ОУ, который отличается тем, что преобразует с помощью сплайнов ограничения в форме неравенств на переменные состояния, и возмущающие воздействия в эквивалентные нелинейные алгебраические и дифференциальные уравнения для вспомогательных переменных;

2. Алгоритм оценивания в реальном времени переменных состояния нелинейного многомерного ОУ с ограниченными по абсолютной величине возмущающими воздействиями, который отличается тем, что обращает в минимум функционал критерия обобщённой работы в регуляризованной задаче оценива ния и осуществляет ПИД-регулирование обучающих воздействий на используемую модель объекта управления;

3. Метод регуляризации нелинейной задачи адаптивного управления, отличающийся тем, что осуществляет с помощью сплайнов преобразование ограничений в форме неравенств на управляющие воздействия в эквивалентные нелинейные алгебраические и дифференциальные уравнения для вспомогательных переменных, а ограничения на переменные состояния в конечный момент времени преобразует в эквивалентные ограничения на траекторию;

4. Алгоритм формирования в реальном времени управляющих воздействий, отличающийся тем, что обращает в минимум функционал критерия обобщённой работы в регуляризованной нелинейной задаче адаптивного управления с помощью самонастраивающихся ПИД-регуляторов;

5. Теоремы, определяющие эффективность разработанных методов и алгоритмов;

6. Адаптивная система автоматического контроля вязкости расплава полимеров и автоматического управления технологическим процессом производства полимеров, реализующая разработанные в диссертации методы и алгоритмы с реальным экономическим эффектом.

Апробация работы. Основные результаты диссертации докладывались: на 8 Международных конгрессах и научно-технических конференциях: 3h NATIONAL SCIENTIFIC SYMPOSIUM with international participation "METROLOGY & reliability 95 " (Sozopol, Bulgaria, 1995); II международная конференция "Управление энергоиспользованием" (Львов, 1995); 4h National Scientific Symposium with international participation "Metrology & Reliability 96 " (Sozopol, Bulgaria, 1996); Proceedings "1-st International Modelling School. - Krym Autumn 96" (Rzeszow, 1996); "Приборостроение-96" (Судак, 1996); VI Международный конгресс двигателестроителей (Харьков, 2001); III Международная конференция "Идентификация систем и задачи управления" (Москва, 2004); IX Международный конгресс двигателестроителей (пос. Рыбачье, Крым, 2004);

на 14 Всесоюзных и Республиканских научно-технических конференциях: Проблемы идентификации нестационарных объектов в измерительной технике (Ленинград, 1975); Математическое моделирование и гибридная вычислительная техника (Куйбышев, 1977); Автоматизация теплофизических исследований (Минск, 1979); Методы и средства машинной диагностики состояния газотурбинных двигателей (Харьков, 1980); Методы теории идентификации в задачах измерительной техники и метрологии (Новосибирск, 1982); Вычислительные методы и математическое моделирование (Минск, 1984); Автоматизация и роботизация в химическом машиностроении (Тамбов, 1988); Математическое, алгоритмическое и техническое обеспечение АСУТП (Ташкент, 1988); Диагностика состояния динамических систем (Ивано-Франковск, 1992); "Метрологія і вимірювальна техніка" (Харков, 1996); І конгрес "Ресурсозбереження-96" (Киев, 1996); 2-я Всероссийская научная конференция "Проблемы создания и развития информационно-телекоммуникационных систем специального назначения" (Орел, 2001); Третья Всероссийская научная конференция "Проблемы создания и развития информационно-телекоммуникационных систем специального назначения" (Орел, 2003);

на семинаре кафедры ИУ-1 МГТУ им. Н.Э. Баумана (Москва, 2004).

Публикации. По теме диссертации опубликовано 67 научных работ, в том числе: 1 монография; 11 статей в изданиях, рекомендованных ВАК Минобразования и науки РФ; 3 патента на изобретение и 36 статей в других изданиях.

В совместных публикациях соискателем выполнено следующее. В статье [47] разработан метод аналитического проектирования адаптивной системы управления вязкостью полимеров в процессе их производства. В работах [127], [168]-[171], [173], [174] на базе метода регуляризации с использованием В-сплайнов разработаны алгоритмы определения нестационарных входных воздействий на различные объекты. В статьях [103]-[105], [178], [179], [192], [196], [197], [199], [217] разработаны алгоритмы оценивания переменных состояния слолшых объектов с ограниченными по абсолютной величине возмущающими воздействиями. В статьях [180], [215] получены метод и алгоритм определения погрешностей идентификации, обусловленных структурной неопределенностью математических моделей ОУ. В статьях [182], [193] разработаны метод и алгоритм демодуляции многопозиционных сигналов, принятых по каналу связи в присутствии произвольных шумов, ограниченных по абсолютной величине. В [198] предложен метод определения регуляризующих свойств алгоритма фильтра Калмана.

Структура и объем диссертации. Диссертация состоит из введения, 6 глав, заключения и приложения, изложенных на 222 страницах. Она содержит 89 рисунков и список использованных источников из 223 наименований.

В первой главе выполнен анализ задач синтеза систем управления объектами, работающих в условиях априорной неопределенности. Существующая теория адаптивного управления базируется на принципе достоверной эквивалентности, в соответствии с которым при формировании оптимальных управляющих воздействий в нейтральных системах вместо неизвестных переменных состояния и параметров можно использовать их оценки, найденные в процессе управления в результате анализа измеренных значений выходных сигналов ОУ. Координаты оптимальных (желаемых) траекторий перехода управляемых переменных в требуемое состояние должны быть заданы в явном виде или косвенно - с помощью критерия эффективности управления. Неизвестные процессы, протекающие в элементах ОУ, и возмущающие воздействия описывают с помощью авторегрессии, отбеливающих фильтров, полиномов, рядов или сплайнов, содержащих подлежащие идентификации параметры. В теории адаптивного управления сложились два подхода к описанию априорных неопределенностей математической модели системы управления: стохастический и детерминированный (минимаксный).

При стохастической постановке задач управления с параметрической неопределенностью (методы, основанные на байесовском подходе, самонастраивающиеся ПИД-регуляторы и т.д.) погрешности измерений и неконтролируемые возмущающие воздействия считают центрированными белыми гауссовскими шумами (ЦБГШ), либо цветными шумами, сформированными отбеливающими фильтрами из ЦБГШ. Результаты, полученные при такой постановке, хорошо известны, составляют стройную математическую теорию и позволяют решать многие задачи управления.

Однако при практическом применении стохастических методов адаптивного управления возникает целый ряд существенных затруднений вычислительного и принципиального характера. Этот подход нельзя применять в системах управления с неизвестными функциями распределения вероятностей возмущающих воздействий. Кроме того, в нелинейных задачах с известными статистическими характеристиками шумов (не являющихся ЦБГШ) чрезвычайно трудно составить уравнение Фоккера-Планка-Колмогорова (ФГЖ) для апостериорной плотности распределения вероятностей параметров и переменных состояния системы управления. Но если и удалось составить уравнение ФПК, то с увеличением размерности отбеливающего фильтра (степени полинома, порядка сплайнов) быстро нарастают трудности численного решения краевой задачи для этого нелинейного уравнения в частных производных.

При минимаксном описании неопределенностей (минимаксные методы, #оо-оптимизация, 1\-оптимизация, //-анализ и синтез, LMI-техника и т.д.)

предполагается, что неизвестные параметры уравнений математической модели ОУ принадлежат некоторому ограниченному множеству, а возмущающие воздействия являются ограниченными, но в остальном неизвестными функциями времени. Цель управления состоит в достижении наилучшего качества управления при наихудшей для выбранного управления реализации последовательности возмущающих воздействий. Управляющие воздействия формируют с помощью линейных регуляторов с заданной структурой и неизвестными параметрами. Идентификацию параметров ОУ и регулятора осуществляют различными методами (наиболее часто применяют градиентные методы, алгоритмы стохастической аппроксимации и рекуррентный МНК). Среди этих методов наиболее перспективными являются подходы, основанные на аппроксимации градиента функции потерь, которые не требуют выполнения предположений о центрированности и некоррелированности помех. При этом часто в управляю щие воздействия добавляют специальные тестовые сигналы, обеспечивающие сходимость оценок параметров ОУ и регулятора к их оптимальным значениям. С помощью такого подхода удается получать алгоритмы, формирующие несмещенные и состоятельные оценки параметров. Однако строгое обоснование этих алгоритмов получено только в линейных задачах. Кроме того, тестовые сигналы оказывают дополнительные динамические воздействия на объект управления и могут привести к появлению нежелательных эффектов. Возникают и вычислительные проблемы при реализации алгоритмов адаптивного управления в минимаксной постановке в реальном масштабе времени. Структуру регулятора и критерии качества идентификации параметров регулятора и модели ОУ в нелинейных задачах выбирают эмпирически (без гарантий несмещенности оценок).

Показано, что среди существующих методов синтеза адаптивных систем управления наиболее перспективен вариант минимаксного подхода, использующий вероятностное описание неопределенностей. Сформулированы задачи диссертационного исследования.

Во второй главе с помощью методов регуляризации исходные условия, задающие конечные значения переменных состояния объекта, и ограничения на возмущающие воздействия, переменные состояния и допустимые управляющие воздействия, заданные в виде неравенств, преобразованы в систему нелинейных алгебраических и дифференциальных уравнений для вспомогательных переменных. Предложено применять систему измерительных устройств, образованную параллельным соединением измерительного преобразователя, цифрового сглаживающего фильтра и блока, определяющего скорости изменения выходных сигналов объекта управления. Выходной сигнал этой системы измерительных устройств получают суммированием выходных сигналов блоков системы с настраиваемыми весовыми коэффициентами (параметрами регуляризации). Математическая модель этой системы измерительных устройств совместно с уравнениями состояния объекта управления и уравнениями, определяющими множества допустимых возмущающих воздействий, допустимых фазо вые траектории перехода управляемых переменных в заданное конечное состояние и допустимых управляющих воздействий, образуют регуляризованную модель системы управления. Показано, что такая регуляризованная модель системы управления позволяет применять принцип достоверной эквивалентности.

В третьей главе для регуляризованной модели системы управления получен регуляризованный функционал критерия минимума обобщенной работы для задачи обучения модели объекта управления (оптимального оценивания переменных состояния нелинейного объекта управления и возмущающих воздействий).

Доказаны теоремы, определяющие алгоритмы формирования в скользящем временном окне оценок переменных состояния объекта управления и возмущающих воздействий, оптимальных по указанному критерию. Полученные оптимальные наблюдатели переменных состояния нелинейного объекта реализуют алгоритмы ПИД-регулирования оценок переменных состояния и возмущающих воздействий. Выполнен анализ асимптотических свойств этих ПИД-наблюдателей. Показано, что ПИД-наблюдатели формируют несмещенные и состоятельные оценки переменных состояния при любых значениях параметров регуляризации. Требуемые значения частных показателей качества переходных процессов ПИД-наблюдателя обеспечивают выбором параметров регуляризации. Выполнен сравнительный анализ эффективности решения задач оптимального оценивания с помощью разработанных алгоритмов и традиционными методами.

На базе адаптивного ПИД-наблюдателя разработан алгоритм автоматического обучения многослойных нейронных сетей, пригодный для использования в реальном времени в системах управления сетями сбора, передачи и обработки информации. Выполнен сравнительный анализ эффективности разработанного алгоритма и существующих алгоритмов обучения нейронных сетей.

В четвертой главе для регуляризованной модели системы управления получен регуляризованный функционал критерия обобщенной работы. Доказаны теоремы, определяющие алгоритмы формирования в скользящем временном окне управляющих воздействий, оптимальных по регуляризованному критерию обобщенной работы. Разработанные алгоритмы формирования управляющих воздействий реализует законы ПД- и ПИД-регулирования Показано, что адаптивная система управления с адаптивным ПИД-регулятором устойчивая и астатическая при любых значениях параметров регуляризации. Требуемые значения частных показателей качества переходных процессов управления обеспечивают выбором параметров регуляризации и интервала непрерывности сплайнов. Выполнен сравнительный анализ эффективности решения задач оптимального управления с помощью разработанных алгоритмов и известными традиционными методами.

В пятой главе на базе алгоритмов оптимального оценивания, полученных в главе 3, разработана адаптивная система демодуляции многопозиционных сигналов, принятых по каналу связи с неизвестной математической моделью. Эта система содержит подсистему идентификации математической модели канала связи и подсистему демодуляции. В отличие от традиционных систем демодуляции разработанная система не требует знания законов распределения вероятностей шумов, действующих в канале связи, и реализует алгоритм ПИ-регулирования интервальных оценок информационных параметров.

Разработан алгоритм адаптивного ПИД-наблюдателя углового положения цели для систем автосопровождения (СА) радиолокационных станций. На базе алгоритмов оптимального управления, полученных в главе 4, разработан алгоритм адаптивного ПИД-регулятора углового положения электроприводной антенны СА. Разработаны предложения по модернизации штатной СА изделия АРГС-54Э путем замены существующих алгоритмов алгоритмами адаптивного ПИД-наблюдателя и адаптивного ПИД-регулятора. Выполнен сравнительный анализ характеристик штатной и модернизированной СА.

В шестой главе на базе алгоритмов, полученных в главах 2, 3 и 4 диссертации, разработаны адаптивные ультразвуковые расходомеры вязких жидкостей и газов. Получена математическая модель в пространстве состояний турбулентного течения вязких жидкостей в трубопроводах. Разработан алгоритм оптимального оценивания переменных состояния ультразвуковых расходомеров вязких жидкостей и газов. Приведены результаты экспериментальных исследований метрологических характеристик разработанных ультразвуковых расходомеров. Разработана адаптивная система автоматического измерения вязкости и энергии активации молекул расплава полимеров в трубопроводах. Получена математическая модель процесса течения расплава полимера в сужающем устройстве трубопровода. Разработан алгоритм оптимального оценивания вязкости и энергии активации молекул полимера. Приведены результаты экспериментальных исследований и применения в промышленности разработанной системы.

Разработана адаптивная система автоматического управления вязкостью расплава полимеров в процессе их производства. Приведены результаты экспериментальных исследований и применения в промышленности разработанной системы автоматического управления вязкостью.

Адаптивные системы демодуляции многопозиционных сигналов, принятых в условиях априорной неопределенности

В настоящее время в сетях передачи данных наблюдаются тенденции увеличения количества многопозиционных КАМ-передач [1], [2], [4]-[6]. Это обусловлено уменьшением стоимости переданного сообщения и повышением скорости информационного обмена. Однако многопозиционные передачи оказываются очень чувствительными к различным искажениям и помехам, действующим в телефонном канале связи, который использует ограниченную полосу частот F. В результате происходит межсимвольная интерференция (МСИ). В телефонном канале МСИ может простираться на 20 - 30 символов [6]. Переход с двухпроводной абонентской линии на четырех проводную соединительную линию на коммутационных телефонных станциях (АТС) обеспечивается дифференциальными системами (ДС). Дифференциальные системы всегда недостаточно сбалансированы. Они настроены на средние значения импеданса двухпроводной линии. Однако из-за различия параметров кабелей и не одинаковой длины абонентских линий импеданс линий имеет большой разброс. Как известно, в длинной линии, работающей на несогласованную нагрузку, возникает отражение части сигнала. В двухпроводной линии ничто не препятствует возвращению эхо-сигнала назад по каналу связи. Вместе с сигналом, передаваемым другим модемом, эхо-сигнал распространяется по тракту. Несбалансированность дифференциальных систем также является причиной попадания в тракт части сигнала встречного направления. Если отраженный сигнал, отразится второй раз на удаленном конце, тогда приемник получит не только передаваемый ему сигнал, но и его задержанную копию. Кроме того, сигналы, передаваемые по телефонным сетям, искажаются по амплитуде и фазе из-за межсим-волыюй интерференции с помехами от рядом расположенных витых пар проводов.

Связь абонентов по коммутируемым телефонным сетям при каждом наборе номера осуществляется по новому каналу, так как каждый раз выбирается новый маршрут соединения. Выбранный канал связи имеет неизвестные импульсные функции c0(tk), c\(tk), /J00( ), h20(tk), поэтому для уменьшения вероятности появления ошибок применяют адаптивные алгоритмы демодуляции в сочетании с различными способами компенсации МСИ в принятом сигнале [1]-[6]. Адаптивная система демодуляции многопозиционных сигналов с квадратурной амплитудной модуляцией (КАМ-сигналов), реализующая эти методы, содержит систему выделения видеосигналов ys{tk) и ycfa) синфазного и квадратурного каналов, систему идентификации импульсных функций канала связи и демодулятор (рис. 1.2). Адаптивная система демодуляции КАМ-сигналов На рисунке 1.2 приняты следующие обозначения: АГГК - адаптивный генератор гармонических колебаний; ФНЧ - фильтр нижних частот; СИИФ -система идентификации импульсных функций канала связи; ДМ - демодулятор.

В существующих адаптивных системах демодуляции сигналов применяют байесовские методы оценивания и метод наименьших квадратов [1]-[6], [16]. Для реализации байесовских методов необходима информация о корреляционной функции эхо-сигнала и функциях распределения вероятностей шумов. Однако в реальных условиях такие данные получить затруднительно.

При работе адаптивной системы демодуляции, построенной на основе метода наименьших квадратов (МНК), не требуется информация о законе распределения шума. Однако недостатком данного метода является то, что с его помощью получают смещенные оценки информационных параметров [7]. Поэтому применение классического МНК, как показали выполненные исследования, возможно при довольно больших отношениях сигнал/шум (для сигнала КАМ-32 - при ОСШ 15 дБ). При меньших отношениях сигнал/шум вероятность ошибки демодуляции превышает 10" .

Для реализации байесовских методов оценивания необходимо знать корреляционные функции и законы распределения вероятностей шумов и им 23 пульсные функции трактов эхо-сигналов. Однако в реальных условиях характеристики помех, создаваемых рядом расположенной витой парой проводов, по априорным данным неизвестны. Поэтому в телефонных сетях связи, работающих на высоких скоростях передачи данных при низких значениях отношения сигнал/помеха, имеется большая вероятность появления ошибок. Идентификацию импульсных функций трактов эхо-сигналов, создаваемых рядом расположенной парой проводов, можно осуществить с помощыо регуляризованного метода оценивания переменных состояния динамических систем, разработанного в [17]. Таким образом, существующие системы демодуляции многопозиционных сигналов модемных систем связи не обеспечивают требуемое качество приема. Это связано с тем, что эти системы основаны на традиционных методах адаптивного управления и оценивания.

Синтез наблюдателей переменных состояния объекта управления

Правильный выбор математической модели объекта управления является решающим условием, гарантирующим успех в решении задачи адаптивного управления. Этот выбор должен основываться как на понимании самой процедуры идентификации модели, так и на содержательной и формализованной информации об идентифицируемом объекте. Качество полученной модели может быть, в частности, оценено по критерию среднеквадратической ошибки, в котором множество проектных переменных включает структуру модели. Вопросам идентификации математических моделей сложных объектов посвящена обширная литература, в том числе, работы

В стохастических задачах управления обычно используют модель динамики объекта управления в пространстве состояний. Метод переменных состояния основан на понятии состояние системы, математическое определение которого дано Заде [58]. Состояние объекта управления в момент времени t описывают совокупностью фазовых переменных z\(t),...,zm(t), связанных с его входными сигналами известными функциональными зависимостями и характеризующих поведение объекта управления в будущем при условии, что известны входные сигналы и состояние объекта в исходный момент времени. Если в отдельных элементах объекта управления происходят неизвестные процессы, то эти процессы описывают с помощью рядов Фурье, полиномов [75], В-сплайнов [102], [128], вэйвлет-рядов [129] и других финитных базовых функций с неизвестными параметрами 6\,...,6q, подлежащими идентификации в процессе управления.

Возмущающие воздействия v}(/),...,vr(t) считают цветными гауссовски ми шумами с известными вероятностными характеристиками. Предполагается, что эти возмущающие воздействия можно получить на выходе линейной динамической системы (отбеливающего фильтра), на входы которого подают цен 48 трированные белые гауссовские шумы. Неизвестные параметры 0q+\t...y0q+r отбеливающего фильтра подлежат идентификации в процессе управления. Эволюцию во времени параметров описывают уравнениями Предполагается, что начальные оценки #До) параметров являются случайными величинами с известными вероятностными характеристиками. Переменные состояния V\(t),...,vr(t) отбеливающего фильтра и неизвестные параметры включают в состав расширенного вектора переменных состояния объекта управления: Процессы, происходящие в объекте управления и отбеливающем фильтре, описывают в пространстве состояний матричным дифференциальным уравнением: с начальными условиями x(t0)=x0; M{[x(t0)-x0]-[x(t0)-x0]T \=D0, (1.4.3) где: x(t) - расширенный вектор переменных состояния ОУ; u{t) - вектор управляющих воздействий; w(t) - вектор ЦБГШ с известной матрицей интен-сивностей R; М {} - оператор математического ожидания; DQ - матрица дисперсий погрешностей задания начального состояния объекта управления. Текущие значения части переменных состояния измеряют с помощью измерительного устройства. Выходные сигналы измерительного устройства связаны с переменными состояния уравнением наблюдения (в общем случае нелинейным) y(t) = h(x(t),t)+n{t), (1.4.4) где у(() - вектор выходных сигналов измерительного устройства, а «(/) - век 49 тор погрешностей измерений, которые считают ЦБГШ с известной матрицей интенсивностей Е. Оптимальную оценку x(t) вектора переменных состояния x(t) вычисляют с помощью алгоритма фильтра Калмана: = /т«(1\ )+т-Ы0-К (ф)1 (1.4.5) K(t)=V(t)-H(t)T.E-1; О-4-6) F(t).V +V(t).F{t)T -K{t\E-K(tf +G -R-G{tf (i.4.7) с начальными условиями ( оЬ о; K o)=Ab (1.4.8) rjifi V{t)- матрица дисперсий погрешностей оценивания; Н ) = щ/Ш«Ш H(t) = - h{x(t\t). (1.4.9) Оценка x(t) = M{x(t)} вектора переменных состояния x(t), вычисленная путем интегрирования системы дифференциальных уравнений (1.4.5)-(1.4.7) с начальными условиями (1.4.8), обращает в максимум условную плотность вероятности векторного случайного процесса x(t) на всем интервале наблюдения вектора выходных сигналов y{t). Это, как известно [7], эквивалентно минимизации квадратичного функционала і г 0 +W0- M MF " -МО-АМФ)]} (1А10) по переменным x(t) и w(t) при ограничении (1.4.2). 1.4.2. Синтез формирователя управляющих воздействий при стохастическом описании неопределенностей В теории оптимального оценивания известно, что обновляющий процесс фильтра Калмана m=y(n-h{x{t),t) является вектором белых гауссовских шумов с матрицей интенсивностей Е и математическим ожиданием M{${t)} = y{t)-h(x{t\t). (1.4.11) Тогда из формул (1.4.2), (1.4.5) и (1.4.11) следует, что эволюцию состояния объекта управления описывает стохастическое уравнение: = /W M M+A:(0-#(0. (1-4.12) В задачах с фиксированными концами начальное x{to) и конечное ((дг) состояния объекта управления заданы уравнениями (1.4.3) и уравнениями x(tN) = xN; M{[x(tN)-xN]-[x(tN)-xN]T \=DN. О-4-13) В задачах стохастического управления считают, что управляющие воздействия принадлежат заданному множеству U ограниченных функций:

Регуляризованная постановка задачи синтеза системы обучения модели объекта управления

Рассматривается задача синтеза систем обучения модели нелинейного обьеісга (2.1.1), (2.1.4) с ограниченными по абсолютной величине возмущающими воздействиями (2.1.3). Система обучения содержит (рис. 2.4) объект управления, систему измерительных устройств выходных сигналов ОУ, регуляризованную модель объекта и регулятор обучающих воздействий. Состояние регуляризованной модели ОУ описывают уравнением (2.2.8): at где .s(v(/),w ) - вектор выходных сигналов нелинейного преобразователя (2.1.1) (либо (2.2.2)). Выходные сигналы системы измерительных устройств (рис. 2.3), связаны с переменными состояния модели ОУ уравнением (2.1.6): y(t) = h(x(t),w(t))+n(t), n(t) - вектор, образованный погрешностями системы измерительных устройств. В разделе 2.2 регуляризованная модель формирователя допустимых возмущающих воздействий получена в виде уравнений (2.2.5): Ч МК0 Н; v{t)=w{t)+71{t), либо уравнений (2.2.7): dv(t) 1 /ч / ч ґи 0),есл dt т [w{t- т), w(0), если t т иначе Для составления функционалов критерия обобщенной работы систем \Т ..(ЛТ обучения модели ОУ сформируем вектор z(t) = x(t) v(t) . Априорную математическую модель ОУ (2.1.1) с формирователем допустимых возмущающих воздействий (2.2.5) преобразуем в систему уравнений: = f(x(t),u(t))+ Mt - г)+ ф): «t)= 4Н - r)+ n( U ). (3.1.1) а модель ОУ (2.1.1) с формирователем допустимых возмущающих воздействий (2.2.7) опишем системой уравнений: w dt[v(t) f{x{t),u{t))+s{v(t),w ) 0 + — г ; Ф)= лг0 w(0)_ (3.1.2) Сформируем вектор сигналов рассогласования между выходными сигналами измерительных устройств и их прогнозом, формируемым с помощью модели ОУ (вектор сигналов рассогласования): e(x(t),l)= y{t)-h{x{t\s{v{t\w )). (3.1.3) Если 77(/) и n(t) - ЦБГШ, то при известном управляющем воздействии u\t) оптимальная оценка МАв(1) расширенного вектора переменных состояния z(t) динамической системы (3.1.2), (3.1.3), (2.3.7), (2.3.8) обращает в максимум условную плотность вероятности f{z(t )/Y(tj )} [7]. При этом максимизация условной плотности вероятности p{z(t )/Y{( )} эквивалентна минимизации функционала критерия максимума апостериорной вероятности (МАВ): сії J МАВ--- \h - &fn-i+ \ h - v(oJL + і J \\\еША2 + Wff и п2 —1 Т где: \\q\\ , = q- А q ; DQ И DV - матрицы дисперсий погрешностей задания А начальных условий, а Н и R?1 - матрицы интенсивностей ЦБГШ n(t) и Tj(t). Но функционал JMAB является и функционалом критерия обобщенной работы этой стохастической системы, так как определяет взвешенную суммарную энергию, которой обладают сигналы, образованные погрешностями задания начальных условий, сигналы рассогласования и входной белый шум /,(0 [73]. Для системы обучения модели ОУ (3.1.2), (3.1.3) с непрерывными ограниченными по абсолютной величине возмущающими воздействиями составим регуляризованный функционал метода наименьших квадратов (функционал РМНК): Ja- W- 0f. +i.w(0)-v(0f + J-. j ф(,),, dl + Z DQ Z Dv Z Q D + 77-jflW l!-! » (3.1.4) L 0 L где T - интервал непрерывности сплайнов; D - матрица дисперсий погрешностей измерительных устройств; х\ - параметр регуляризации; L положительно определенная матрица нормирующих множителей (например, дисперсий погрешностей сплайн-аппроксимации). Функционал (3.1.4) определяет взвешенную суммарную энергию, которой обладали бы сигналы, образованные погрешностями задания начальных условий, сигналами рассогласования e(x(t),t) и погрешностями rj(t) аппроксимации возмущающих воздействий (2.1.3) сплайнами. Поэтому функционал (3.1.4) можно трактовать как функционал критерия обобщенной работы системы обучения регуляризованной модели ОУ. 3.2. Система обучения модели объекта управления с непрерывными возмущающими воздействиями Теорема 1. Пусть нелинейный объект управления (2.1.1) с непрерывными ограниченными по абсолютной величине возмущающими воздействиями (2.1.3) имеет регуляризованную модель состояния (3.1.2) и пусть выходные сигналы системы измерительных устройств и вектор переменных состояния X\t) объекта управления связаны нелинейным уравнением (2.1.6), где n\t) -вектор погрешностей измерений, a T]\t) - вектор погрешностей аппроксимации возмущающих воздействий сплайнами первого порядка (2.2.7). Тогда оценку x\t) переменных состояния x[t) объекта управления, оптимальную по регуляризованному критерию обобщенной работы с функционалом (3.1.4), формирует самонастраивающийся ПИД-регулятор обучающих воздействий: d_ dt

Регуляризованная постановка задачи синтеза регулятора управляющих воздействий

В этой главе выполнен синтез подсистемы формирования управляющих воздействий адаптивной системы управления нелинейным объектом с ограниченными по абсолютной величине возмущающими воздействиями (рис. 2.4). Эта подсистема содержит обучаемую модель ОУ, формирователь задания регулятору управляющих воздействий и регулятор управляющих воздействий. Объект управления образован двумя подсистемами (2.1.2а), (2.1.2Ь). Управляющие воздействия поступают только на входы подсистемы (2.1.2а). Поэтому в диссертации при синтезе алгоритма формирования управляющих воздействий используют только эту часть обучаемой модели ОУ: i(0=/ifeW (0)+ (0)-«(0+ i(0; і(о)= і(о), (4ЛЛ которая определяет в явном виде зависимость части переменных состояния модели оценок ОУ, объединенных в вектор x\(t), от управляющих воздействий u{t), где х2(?) и W\(t) - известные значения входных воздействий 2(0 и wl(0 подсистемы (2.1.2а) модели ОУ. В разделе 2.3 регуляризованная модель формирователя допустимых возмущающих воздействий получена в виде уравнений (2.3.2): н(0=. МФ); К0=«( - МО- 4Л-2 либо уравнений (2.3.3): )- г№ -1-ММ -т)=№"Г т. (4U) at г [ u\t - т), иначе где (/) - вектор погрешностей аппроксимации оптимальных значений управляющих воздействий сплайнами. 112 На входы формирователя задания регулятору управляющих воздействий поступают текущие значения выходных сигналов обучаемой модели ОУ (оценки переменных состояния ОУ JCJ(0, x2(t) и возмущающих воздействий w(t)) и ограничения (2.1.9), (2.1.10): y\{x2{t\t) xx{t) y2{x2{t\t), т{х2((),і)+є2(()=0. Формирователь задания регулятору управляющих воздействий по алгоритму (2.4.2), (2.4.5): d/( l ( - )) = r jihiOA если x}j(t - r) y\j(x2(t),t) y2{x2(t\t),еслиі]у(/-т) yl(x2{t),t) ; 1,і( т) иначе = s\(Xl(t-z)) dm{x2(t),t) dm(x2(t),t) , ч dt dx2(t) вычисляет текущие значения координат требуемой (желаемой) траектории перехода ОУ в заданное конечное состояние (2.1.8), объединенные в вектор r(t), и передает их в регулятор управляющих воздействий. В разделе 2.4 показано, что по алгоритму (2.4.6): l(0 яЫФ)= BjWf1 f2{xMm регулятор управляющих воздействий вычисляет оценки q{x\(t\i) значений координат, в которых находится в этот момент времени объект управления, и которые связаны с требуемыми значениями r{t) уравнением (2.4.4): q{xx{t\l)=r{t)+d{t), (4.1.4) S(t) - вектор допустимых погрешностей управления. При этом было установлено, что если условия (2.4.2)-(2.4.6) выполняются, то ограничения (2.1.8)-(2.1.10) будут выполняться автоматически. 113 Из уравнений (4.1.1)-(4.1.4) следует, что для синтеза адаптивного регулятора управляющих воздействий целесообразно применять регуляризованный функционал МНК: ,i и / iv /цд-1 2 " v т v "д"1 / = vNo)-4(oJ2„_,+ 0)- -. 2 І "D;1 « "D KO- lOV ,+«2 (C-i // (4.1.5) с параметром регуляризации «2 и положительно определенными матрицами D\, Dr и Du нормирующих множителей. Функционал (4.1.5) определяет нормированную суммарную энергию, которой обладали бы сигналы, образованные погрешностями задания начальных условий, погрешностями управления r{t)-q{x\(/),/) и погрешностями (/) аппроксимации управляющих воздействий (2.1.11) сплайнами. Поэтому функционал (4.1.5) можно трактовать как функционал критерия обобщенной работы системы (4.1.1)-(4.1.4) (регулятора управляющих воздействий). При этом, если //(/) и n(t) - ЦБГШ, то функционал (4.1.5) является функционалом критерия максимума апостериорной вероятности. 4.2. Адаптивные регуляторы управляющих воздействий ПИД-регулятор непрерывных ограниченных по абсолютной величине управляющих воздействий в задаче управления нелинейным объектом (2.1.1)-(2.1.11) можно получить минимизацией регуляризованного функционала (4.1.5) критерия обобщенной работы с учетом ограничений (4.1.1), (4.1.3), (4.1.4). Теорема 4. Пусть объект управления имеет нелинейное уравнение оптимального оценивания переменных состояния (4.1.1) и на этот объект действуют непрерывные ограниченные по абсолютной величине управляющие воздействия и At), изменение во времени которых описывают с помощью сплай 114 нов первого порядка (4.1.3). Пусть выходные сигналы формирователя допустимых траекторий связаны с вектором переменных состояния xx(t) объекта управления нелинейными уравнениями (4.1.4), где S(t) - вектор допустгшых погрешностей управления. Тогда непрерывные управляющие воздействия Uj(t), оптимальные по ре (4.2.1) (4.2.2) гуляризованному критерию обобщенной работы (3.1.5), формирует самонастраивающийся многомерный ПИД-регулятор: u{t)= 4#(ф)+ К„ (0- V{t)-q(xx (t),t)]\\);

Похожие диссертации на Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности