Содержание к диссертации
Введение
ГЛАВА I. ЗАДАЧИ СИНТЕЗА СТОХАСТИЧЕСКИХ СИСТЕМ И МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 26
I. Постановки задач синтеза оптимальных автоматических систем 26
2. Формальная схема метода динамического программирования 44
3. Использование достаточных координат при записи уравнений Беллмана 61
ГЛАВА 2. ТОЧНЫЕ МЕТОДЫ СИНТЕЗА 73
4. Системы с линейными объектами управления, квадратичным критерием оптимальности и неограниченными управлениями 73
5. Синтез следящих систем с ограниченной скоростью
исполнительного двигателя 85
ГЛАВА 3. СИНТЕЗ КВАЗИОПТИМАЛЬНЫХ СИСТЕМ В СЛУЧАЕ МАЛЫХДИФФУЗИОННЫХ ЧЛЕНОВ УРАВНЕНИЯ БЕЛЛМАНА 103
6. Расчёт квазиоптимальной системы слежения за дискретным марковским процессом 106
ГЛАВА 4. ПРИБЛИЖЁННЫЙ СИНТЕЗ СТОХАСТИЧЕСКИХ СИСТЕМ УПРАВЛЕ НИЯ ПРИ МАЛОЙ ВЕЛИЧИНЕ УПРАВЛЯЮЩИХ ВОЗДЕЙСТВИЙ 125
7. Приближённое решение задач синтеза для стационарного режима работы автоматической системы 128
8. Расчёт квазиоптимального регулятора для колебательного объекта управления 141
9. Синтез квазиоптимальных управлений в случае коррелированных помех 150
10. Нестационарные задачи. Оценки качества приближённого синтеза 160
II. Исследование асимптотической сходимости метода последовательных приближений (УІ) - СУШ) 176
12. Синтез стохастических систем с распределёнными параметрами. Управление концентрацией в трубопроводе конечной длины 184
ГЛАВА 5. УПРАВЛЕНИЕ СТОМСТИЧЕСКИМИ КОЛЕБАТЕЛЬНЫМИ СИСТЕМАМИ КВАЗИГАРМОНИЧЕСКОГО ТИПА 204
13. Оптимальная стабилизация колебаний в системах со случайными возмущениями типа белого шума 205
14. Оптимальное управление квазигармоническими системами при наличии шума в канале обратной связи 228
ГЛАВА 6. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ ТЕХНИЧЕСКИЕ ЗАДАЧИ СИНТЕЗА 241
15. Управление динамическими объектами, содержащими неизвестные параметры 241
16. Некоторые стохастические задачи управления с ограничениями на фазовые координаты 254
17. Программа численного синтеза и результаты счёта на ЭВМ 271
18. Расчёт квазиоптимальной системы управления проветриванием выемочных участков угольных шахт 281 19. Система стабилизации скорости резания токарных станков 291
РИСУНКИ, ГРАФИКИ, ВСПОМОГАТЕЛЬНЫЕ ФОРМУЛЫ 297
ЗАКЛЮЧЕНИЕ 328
ЛИТЕРАТУРА 331
- Постановки задач синтеза оптимальных автоматических систем
- Системы с линейными объектами управления, квадратичным критерием оптимальности и неограниченными управлениями
- Расчёт квазиоптимальной системы слежения за дискретным марковским процессом
- Приближённое решение задач синтеза для стационарного режима работы автоматической системы
- Оптимальная стабилизация колебаний в системах со случайными возмущениями типа белого шума
Постановки задач синтеза оптимальных автоматических систем
Задача синтеза автоматической системы состоит в нахождении структуры блока управления J на схеме рис. 3. У этой проблемы есть две стороны: математическая и техническая. С математической точки зрения задача считается решенной, если установлен вид функции - отображения определяющей однозначное соответствие между входными функциями \ X(t) 0 - Т I и j U (t) : 0 6 Т\ и вектор-функцией управляющих воздействий j H(t) : O T Tt [ э "] отрезок времени, на котором рассматривается работа системы). При этом по смыслу задачи мгновенные значения компонент вектора U.(t)= - U/t (t). ,, г( )) в момент времени t не могут зависеть от будущих значений X(t) и Ч (t) ,и поэтому отобра жение (I.I) можно записать в виде где 5с =55с( ; Os &t] , If = U(i);0 i tlj -pea-лизовавшиеся к моменту времени V функции X и U .
Техническая сторона вопроса связана с конкретной реализацией закона управления (1.2). Преобразование, определяемое формулой (1.2), может осуществляться либо с помощью элементов аналоговой электронной техники, либо путем использования аналоговых или цифровых вычислительных машин. При сложных функционалах техническая pea - 27 лизация преобразования (1.2) может оказаться затруднительной. Поэтому зачастую именно требование простоты устройства блока управления определяет характер априорных предположений о свойствах объекта управления, случайных воздействий на систему и т.д.
Основное внимание в дальнейшем уделяется расчету оптимальных законов (алгоритмов или стратегий) управления (1.2). При рассмотрении конкретных примеров решения задачи синтеза приводятся также структурные схемы, реализующие оптимальный алгоритм управления.
Для того, чтобы сформулировать задачу синтеза оптимальной автоматической системы, необходимо задать:
1) уравнения динамики объекта управления;
2) цель управления;
3) вероятностные характеристики случайных процессов, воздействующих на систему;
4) ограничения (если таковые имеются) на область допустимых значений управляющих воздействий U, , фазовых переменных X и т.д.
Рассмотрим подробнее некоторые конкретные формы условий I) - 4), которые чаще всего используются в дальнейшем.
Системы с линейными объектами управления, квадратичным критерием оптимальности и неограниченными управлениями
Задачи синтеза оптимальных управлений для линейных систем с квадратичными функционалами в настоящее время изучены наиболее подробно. Характерной особенностью таких систем является линейность оптимального закона управления (блоки 9 и Р на рис. 5 и 7 - линейные усилители), что позволяет исследовать их с помощью хорошо разработанных методов линейной теории систем. Поскольку теория оптимальных линейных систем широко представлена в литературе, ниже рассматриваются лишь некоторые примеры решения задач синтеза, иллюстрирующие основные принципы расчета таких систем.
Расчёт квазиоптимальной системы слежения за дискретным марковским процессом
Блок-схема исследуемой системы изображена на рис. 14. Пусть U (t) представляет собой симметричный марковский процесс на два положения (y(t)l) , причем априорные вероятности Jb ( 11) = = Р ( Ч (t) = і 1 ) удовлетворяют уравнениям
Здесь j\ определяет интенсивность переходов между состояниями U = +l и м=-1 в единицу времени (формула (6.1) - частный случай формулы (1,17) при ИЧ = 2, Л«. . (t) = Л (t) =J ). Таким образом, из (6.1) следует, что в реализациях Ч (t) импульсы и интервалы независимы и распределены по экспоненциальному зако-ну Р (Т С) = Г .
Наблюдаемый процесс И (t) является аддитивной смесью входного сигнала и не зависящего от него белого шума интенсивности
Объект управления U описывается скалярным уравнением где , (t") - не зависящий от Ц (t) и (t ) белый шум интенсивности В , а управляющее воздействие Я предполагается ограниченным по модулю.
Для оценки качества работы системы используется интегральный критерий оптимальности где функция штрафа С ( U ; X) = С (± 1 ) X ) - заданная, выпуклая вниз, функция рассогласования С ( 4 (t )-X(t ))= C(2(t)) , причем С (О ) - 0 . Для используемого здесь метода последовательных приближений существенным является условие дифференцируемости С ( у - х) . Ниже при проведении конкретных расчетов эта функция взята квадратичной.
Особенностью данной задачи в отличие, скажем, от задач, изучавшихся в 4,5, является то, что наблюдаемая пара случайных процессов (jf(t).JC(t)) не является марковской совокупностью, и поэтому, как отмечалось в 3, для использования метода динамического программирования необходимо введение нового пространства состояний, образуемого достаточными координатами, которые уже обладают марковским свойством.
I. Достаточные координаты и уравнение Беллмана Покажем, что в данной задаче достаточными координатами X являются текущее значение выходной переменной X(t) и величина апостериорной вероятности 1 (1) = Р ( It) =+ 1 Ч ) .В дальней - 108 ших расчетах вместо "U? , ( 1 в качестве второй компоненты X + удобнее рассматривать величину 2 - U . (1) - VJ: (-1) через которую в силу условия нормировки U?"t (I4) + W: (-\. =1 апостериорные вероятности 1 Л (і) и W , (-1) выражаются однозначным образом.
Очевидно, что величина Ъ , изменяется во времени случай-ным образом. Выведем стохастическое дифференциальное уравнение , которому подчиняется случайная функция , = 2 ( "t ) . При этом рассмотрим несколько более общий случай несимметричного по вероятности входного сигнала (j(t) , когда вместо (6.1) априорные свойства Ч (і) задаются уравнениями т.е., когда интенсивности перехода между состояниями Ц - + 1 и ы - — 1 сверху вниз М и снизу вверх V неодинаковы.
Перейдем к дискретному отсчету времени. При этом непрерывные функции в (6.2) заменятся на последовательность случайных величин. Приводимый здесь упрощенный вывод уравнений для 2 ( t ) так же, как и обоснование достаточности координат Л, = (t Х+) базируется на результатах работ I 81, 100 1 . Строгое доказательство этих результатов дано в Г125, 175 1 .
Приближённое решение задач синтеза для стационарного режима работы автоматической системы
В тех случаях, когда диффузионные члены уравнения Беллмана не являются малыми, и применение метода, изложенного в главе 3 нецелесообразно, можно использовать другой асимптотический метод приближенного синтеза, изучаемый в данной главе. Он основан на использовании относительной малости величины управляющего воздействия Ц на объект управления.
С формально математической точки зрения факт малости управляющих воздействий проявляется в том, что в уравнении Беллмана при нелинейном члене появляется малый параметр.
Физически малые управления означают, что управляющие воздействия мало влияют на ход фазовых траекторий системы, и поэтому динамика системы близка к неуправляемому движению. Это, в частности, всегда имеет место в задачах с ограниченными управлениями при большой интенсивности шумов, действующих на объект управления.
Действительно, пусть, например, объект управления (невозмущенный) представляет собой устойчивую механическую систему. Тогда действие больших случайных возмущений приводит к большим отклонениям состояния системы от положения равновесия. Возникающие при этом в системе "внутренние" силы инерции и упругости могут значительно превосходить управляющие силы (ограниченные), и поэтому их влияние на динамику системы оказывается относительно малым.
Таким образом, условия эффективной применимости рассматриваемого здесь приближенного метода в определенном смысле противоположны условиям применимости метода главы 3. Грубо говоря, если метод гл. 3 эффективен при малых шумах, действующих на объект управления, то данный метод, наоборот, целесообразно использовать, когда эти шумы имеют высокую интенсивность.
Оптимальная стабилизация колебаний в системах со случайными возмущениями типа белого шума
В этой главе рассматриваются некоторые задачи синтеза оптимальных систем автоматического управления с квазигармоническими объектами управления. Термин "квазигармонический" здесь понимается в том смысле, что динамика объекта в процессе управления мало отличается от гармонического колебания. Для систем второго порядка, которые рассматриваются ниже, это означает, что фазовые траектории системы на плоскости ( X ; X ) за время "t = 25Г близки к окружностям.
Методы исследования таких систем (в том числе и управляемых) имеют, вообще говоря, весьма обширную библиографию (см., например, [ 5, 16, 25, 129, 147, 169 3 и библиографию к ним). В основе этих методов лежит восходящая к работам Пуанкаре 218,219 J идея о разделении движений в колебательных системах на "быстрые" и "медленные", которая в сочетании с методом осреднения [ 30 ] позволяет получать для "медленных" переменных уравнения движения, которые легко интегрируются. Для получения этих уравнений используются различные варианты методов последовательных приближений.
Важную роль в инженерной практике играют различные приближенные методы, основанные на использовании уравнений первого приближения для медленно меняющихся переменных. Впервые такой метод исследования нелинейных колебательных систем был предложен в работах Ван-дер-Поля [ 29, 221 J (метод медленно меняющихся амплитуд), Из других методов первого приближения отметим также метод "средней крутизны" [ 72 ] и метод "гармонического баланса" [ 43, 44, 147 ] , который широко используется в инженерных расчетах систем автоматического регулирования.
Более точные результаты можно получить, если обратиться к регулярным асимптотическим методам, важнейшим из которых является асимптотический метод Крылова-Боголюбова-Митропольского С 16 ] . Первоначально этот метод был разработан для исследования нелинейных колебаний в детерминированных неуправляемых системах. В дальнейшем этот метод использовался также при исследовании стохастических [ 53, 140, 171 ] и управляемых Q 2, 31, 147 ] систем.
Метод Крылова-Боголюбова-Митропольского применялся также для решения детерминированных задач синтеза систем оптимального управления [ 102, 197 ] . Распространению этого метода на решение некоторых стохастических задач оптимального управления посвящена данная глава диссертации. В 13 рассматривается асимптотический метод синтеза оптимальной квазигармонической системы при случайных возмущениях типа белого шума без учета погрешностей измерения текущего состояния объекта управления. В 14 метод решения, изложенный в 13, обобщается на случай, когда в цепи обратной связи имеется аддитивная помеха типа белого шума.