Содержание к диссертации
Введение
1. Состояние теории оптимального управления объектами рассматриваемого класса 20
1.1. Математическое описание задачи управления 20
1.1.1. Уравнения динамики управляемых объектов 21
1.1.2. Выбор критерия оптимизации. Постановка задачи управления 29
1.2. Сравнительный анализ методов решения нелинейной задачи
аналитического конструирования оптимального регулятора 35
1.2.1. Методы синтеза оптимальных управлений по квадратичному критерию качества 35
1.2.2. Методы синтеза управлений по критерию обобщённой работы 39
1.2.3. Синтез оптимальных управлений с использованием функциональных рядов Вольтерра 46
1.3 Обоснование и постановка задач исследования 52
2. Математический аппарат функциональных рядов Вольтерра в решении многомерных дифференциальных уравнений с квадратичными и кубическими нелинейностями 55
2.1. Формирование членов и определение области сходимости многомерного функционального ряда Вольтерра 55
2.2. Стандартный функциональный ряд Вольтерра в решении многомерных однородных дифференциальных уравнений с полиномиальными нелинейностями 2.2.1. Решение дифференциальных уравнений с квадратичными нелинейностями 68
2.2.2. Решение дифференциальных уравнений с кубическими нелинейностями 2.3. Анализ точности решения нелинейных дифференциальных уравнений с помощью различных видов рядов Вольтерра 71
2.4. Взвешенный функциональный ряд Вольтерра в решении многомерных однородных дифференциальных уравнений с полиномиальными нелинейностями 75
2.4.1. Определение весовых коэффициентов взвешенного ряда Вольтерра из
условия приближения к истинному решению 2.4.2. Решение дифференциальных уравнений с квадратичными нелинейностями 79
2.4.3. Решение дифференциальных уравнений с кубическими нелинейностями 80
3. Аналитическое конструирование оптимальных регуляторов по критерию обобщённой работы с использованием рядов Вольтерра 82
3.1. Подход к синтезу квазиоптимальных управлений на основе функциональных рядов Вольтерра 82
3.2. Стандартный функциональный ряд Вольтерра в решении задачи аналитического конструирования оптимального регулятора 3.2.1. Решение задачи аналитического конструирования для объекта с квадратичной нелинейностью 85
3.2.2. Решение задачи аналитического конструирования для объекта с кубической нелинейностью 90
3.2.3. Определение области асимптотической устойчивости синтезируемой с помощью ряда Вольтерра системы управления 92
3.2.4. Сравнение предлагаемого подхода к синтезу управлений с известными методами 96
3.3. Взвешенный функциональный ряд Вольтерра в решении задачи
аналитического конструирования оптимального регулятора 102
3.3.1. Определение весовых коэффициентов взвешенного ряда Вольтерра из условия минимума вспомогательного функционала 102
3.3.2. Решение задачи аналитического конструирования для объекта с квадратичной нелинейностью 107
3.3.3. Решение задачи аналитического конструирования для объекта с кубической нелинейностью 109
4. Аналитическое конструирование оптимального регулятора скорости для системы векторного управления асинхронным электроприводом 113
4.1. Постановка задачи аналитического конструирования оптимального регулятора для электропривода 113
4.2. Аналитическое конструирование квазиоптимального регулятора скорости 1 4.2.1. Построение математической модели асинхронного двигателя 116
4.2.2. Построение математической модели системы векторного управления скоростью асинхронного электропривода 1 4.2.3. Синтез регулятора скорости и его сравнение с другими регуляторами на основе моделирования 137
4.2.4. Экспериментальное подтверждение результатов моделирования... 145
Заключение 154
Список литературы
- Математическое описание задачи управления
- Формирование членов и определение области сходимости многомерного функционального ряда Вольтерра
- Подход к синтезу квазиоптимальных управлений на основе функциональных рядов Вольтерра
- Постановка задачи аналитического конструирования оптимального регулятора для электропривода
Введение к работе
В современный и обозримый будущий периоды времени перед теорией управления будут возникать [1] всё более сложные и ответственные задачи. Это связано не только с автоматизацией как неотъемлемой чертой научно-технического прогресса, но и ролью управления как средства обеспечения стабильности и безопасности в условиях нарастающих конфликтов, экологического кризиса, истощения традиционных природных ресурсов и других трудно обратимых процессов.
Современная теория управления неразрывно связана [2] с идеями оптимизации, которые пронизывают все её разделы, являясь по существу основой анализа и проектирования (синтеза) систем управления объектами самой различной природы. Идеи оптимизации сделались одним из основных инструментов развития теории управления, а теория управления в свою очередь оказала решающее влияние не только на развитие математических теорий, но и трансформировала само содержание понятия «оптимальность» в управление.
Несмотря на то, что общая задача оптимального управления давно стала классической и разработано много методов её решения, работы по созданию новых алгоритмов не теряют своей актуальности, поскольку конкретные прикладные задачи настолько разнообразны, что невозможно предложить единственный универсальный подход, который показал бы себя одинаково эффективно во всех возможных случаях.
Самые разнообразные по своему физическому содержанию задачи управления могут быть сведены к двум основным математическим постановкам [3]:
1. Задачи программирования траекторий движения, обладающих, в частности, некоторыми желаемыми экстремальными свойствами. Решению задач этого класса (то есть синтезу систем оптимальных по режиму управления) посвящено большое число публикаций [4—17]. 2. Задачи синтеза регулятора, позволяющего стабилизировать движение объекта вдоль программной траектории в соответствии с выбранным критерием качества — аналитическое конструирование оптимального регулятора (АКОР) [18-23]. Рост актуальности решения данного класса задач (то есть синтеза систем оптимальных по переходному процессу) связан с тем фактом, что реальное движение объекта управления всегда отличается от желаемого по причине отсутствия полной априорной информации о параметрах, свойствах и условиях функционирования, а также зачастую с невозможностью точной реализации программных управлений. Данные обстоятельства вызвали необходимость разработки регуляторов, функционирующих по принципу обратной связи: по отклонениям от программного движения и гасящих эти отклонения. Методы АКОР находят всё расширяющееся применение в прикладных задачах управления различными сложными объектами, что связано с такими их достоинствами [24], как общность, логическая завершённость, принципиальная математическая простота. Одному из подходов решения задачи АКОР посвящена настоящая работа.
Непрерывный рост сложности технических систем, а также требований к точности управления ими, приводит к необходимости развития методов синтеза нелинейных многомерных систем управления, обеспечивающих в отличие от линейных систем высококачественное функционирование объектов при изменении их рабочих режимов в широком диапазоне, в том числе и в режимах близких к предельным. В данном направлении к настоящему времени достигнуты значительные результаты. t Это, например, работы В. В Солодовникова., Е. П. Попова, В. А. Бессекерского, А. А. Вавилова, Е. И. Хлыпало, В. В. Яковлева, С. Е. Душина и другие работы в области частотных методов расчёта и проектирования нелинейных систем. Это работы В. М. Матросова, В. Д. Фурасова, В. М. Кунцевича, М. М. Лычака по синтезу нелинейных систем с применением аппарата функций Ляпунова. Широкие возможности для синтеза нелинейных систем открываются с позиций решения обратных задач динамики (А. Е. Барбашин, П. Д. Крутько, Л. М. Бойчук). Серьёзные результаты получены в теории аналитического конструирования нелинейных регуляторов благодаря А. А. Красовскому, В. И. Зубову, А. Г. Александрову, Ю. П. Петрову и др. Новые подходы и методы синтеза нелинейных систем предлагает синергетическая теория управления А. А. Колесникова. Первый, основной вывод, вытекающий из анализа указанных работ, можно сформулировать следующим образом [24]: в настоящее время не существует законченных общетеоретических методов исследования и проектирования многомерных нелинейных систем управления. Причинами этого являются:
• невыполнение для них принципа суперпозиции;
• разнообразие классов функций, используемых для описания динамики нелинейных объектов управления и управляющих устройств;
• разнообразие требований к качеству процессов в различных режимах функционирования систем управления;
• различные уровни сложности управляемых объектов, характеризуемые многомерностью, многосвязностью, многоконтурностью и т. д.;
• отсутствие общего математического аппарата для аналитического решения систем нелинейных дифференциальных уравнений.
Неизвестны также простые инженерные методы проектирования систем управления для многих практически важных классов нелинейных объектов. В связи с этим задача синтеза нелинейных многомерных систем управления отнесена академиками А. А. Красовским и А. А. Колесниковым к центральной проблеме современной теории управления.
Второй вывод заключается в следующем: не смотря на развитие численных и качественных методов анализа и синтеза нелинейных систем, существовала и существует необходимость получения аналитических, пусть даже приближённых, решений задач конструирования регуляторов для различных классов нелинейных объектов. Выделение таких классов объектов имеет большое теоретическое и практическое значение в связи с тем, что аналитические методы являются наиболее предпочтительными с точки зрения общности получаемых решений, простоты их использования, экономии машинного времени при нахождении или анализе решений. Отмеченные особенности аналитических решений, позволяющих относительно легко исследовать свойства системы при изменении её параметров в широких пределах, определяют целесообразность применения аналитических методов в практике проектирования и наладки систем автоматического управления. Кроме того, «наличие конструктивной аналитической теории всегда свидетельствовало о высоком уровне развития той или иной точки науки. Это положение вряд ли изменится и в эпоху мощного развития численных и алгоритмических методов, так как связано с неподавлением естественного интеллекта искусственным» (А. А. Красовский).
Широкое распространение полиномиальных моделей (моделей с нелинейными характеристиками полиномиального вида относительно фазовых координат) для описания процессов самой различной природы вызвало появление и становление теории полиномиальных систем, которая в первую очередь связана с именами Н. Винера [25], Д. Джорджа [26], Г. Ван-Триса [27-29], Д. Баррета [30] и Р. Флейка [31, 32]. Отдельные аспекты этой теории отражены и в отечественных монографиях [33-43] Ю. С. Попкова, К. А. Пупкова, В. И. Капалина, А. С. Ющенко, Н. Д. Егупова, Л. В. Данилова и др. Важнейшее достижение указанной теории состоит в разработке для полиномиальных систем математического описания типа «вход-выход» с помощью функциональных рядов Вольтерра (ФРВ) [40, 44-51]. Прямая функциональная связь между входом и выходом при известных ядрах Вольтерра обеспечивает относительно простое аналитическое решение задачи определения движения нелинейного объекта под действием произвольного входного сигнала. В основе такого подхода лежит теорема Фреше и её обобщения - континуальные аналоги теоремы Вейерштрасса [52] об аппроксимации непрерывных функций на отрезке вещественной оси многочленом. ФРВ является обобщением понятия интеграла свёртки, используемого для описания линейных объектов, на нелинейные динамические системы. В связи с этим данное описание позволяет с успехом применять для анализа и синтеза полиномиальных систем известные аналитические, в частности частотные, методы, разработанные для линейных систем управления.
Динамические модели с полиномиальными нелинейностями очень широко используются [24] для описания процессов самой различной природы, например: объектов химической технологии [53, 54], промышленных объектов с рециклом [54, 55], объектов биологии и экологии [56, 57], робототехнике [58-62], радиотехнике [63-67], процессов в летательных аппаратах [68-70] и др. Выделенное множество полиномиальных объектов управления можно значительно расширить, включив в него объекты с нелинейными характеристиками, являющимися непрерывными действительными функциями, после предварительной их аппроксимации полиномиальными зависимостями.
Указанный сравнительно простой и эффективный аппарат рядов Вольтерра в настоящей работе рассматривается как основной математический аппарат решения нелинейных дифференциальных уравнений объектов (с постоянными параметрами) для формулируемой далее задачи оптимального управления. Решение задач АКОР для стационарных полиномиальных объектов с применением аппарата ФРВ является первой характерной особенностью данной работы.
Анализ возможных постановок задач управления, вытекающих из трёх основных способов формализации требований к качеству движения синтезируемых систем, показал [24], что первый способ, состоящий в задании первичных показателей качества переходных процессов, и второй, заключающийся в представлении желаемого движения системой дифференциальных уравнений, практически невозможно использовать при конструировании нелинейных многомерных систем управления. Первый способ формализации в общем случае нельзя применять к нелинейным системам вследствие зависимости характера их переходных процессов от вида входных воздействий и начальных условий данных систем. Применение же второго способа к многомерным объектам встречает серьёзные трудности, связанные с учётом имеющихся ограничений на управляющие воздействия и с заданием структуры системы дифференциальных уравнений с большим числом параметров, описывающей желаемое движение. В связи с этим наиболее приспособленным для применения к сложным нелинейным многомерным объектам управления является способ формализации, основанный на введении оптимизируемого функционала (критерия качества) интегрального типа.
Использование интегральных критериев качества позволяет определить требования к переходным процессам системы управления путём задания значений весовым коэффициентам интегрального критерия, число которых может быть значительно меньше числа параметров системы дифференциальных уравнений, описывающей желаемое движение синтезируемой многомерной системы, и меньше числа первичных показателей качества, определяемых для каждой координаты многомерного объекта. При этом практически произвольный выбор весовых коэффициентов обеспечивает синтезируемой системе фундаментальное свойство - свойство асимптотической устойчивости. Главное достоинство данного способа формализации задач управления заключается в том, что он позволяет использовать для синтеза управляющих устройств сложными объектами результаты теории синтеза систем оптимальных по режиму управления и результаты теории синтеза систем оптимальных по переходному процессу.
Основу современной теории оптимальных систем составляют [71] принцип максимума Л. С. Понтрягина [72,73] и метод динамического программирования Р. Беллмана [74-76]. Целевой функционал, используемый в методе Л. С. Понтрягина, не содержит членов, зависящих от управления. Оптимальное управление находится при условии, что оно заключено в определённой разрешённой области, то есть учитываются физические возможности автоматических систем. Кроме того, принцип максимума устанавливает необходимые условия сильного экстремума функционала, то есть экстремума в классе кусочно-непрерывных функций. К числу недостатков принципа максимума относятся: сложность метода, релейный характер полученного управления и его «программный» (когда управление зависит от времени) вид.Другой метод решения задач оптимального управления, получивший название динамического программирования, предложен американским учёным Р. Беллманом. Принцип оптимальности определяет достаточно общее необходимое условие оптимальности динамических систем, но он не является всеобщим - принцип справедлив только для систем, у которых оптимальная траектория не зависит от предыстории системы, а целиком определяется её исходным состоянием. Основное достоинство данного метода заключается в том, что при наличии ограничений на управляющие воздействия и фазовые координаты объекта он позволяет синтезировать замкнутую (когда управление зависит от фазовых координат) систему оптимального управления, что очень важно для задач АКОР. Общая и отчётливая формулировка метода динамического программирования, данная Р. Беллманом, а также многочисленные приложения метода к разнообразным проблемам теории принятия решения, экономики, экологии и других областей знания способствовали закреплению [77] этого метода как одного из важнейших инструментов теории управляемых процессов.
К методу динамического программирования примыкает «линейно-квадратичная задача» (задача Летова—Калмана) теории управления. А. М. Летовым и Р. Калманом были получены [18-23] аналитические решения задачи об оптимальной стабилизации линейных стационарных объектов при квадратичном функционале качества. Дальнейшее развитие теории АКОР было связано с применением функционала обобщённой работы (ФОР) А. А. Красовского. В работах [78-85, 68, 86, 69, 87-98] и др. содержится последовательное развитие постановок задач и формулировок принципа минимума ФОР. Это развитие идёт в направлении расширения классов управляемых объектов, форм целевого функционала и метода доказательства так называемой основной теоремы А. А. Красовского. Применение неклассического (полуопределённого) ФОР позволяет для сложных нелинейных задач оптимизации сократить вычислительные затраты на два-три и более порядков в сравнении с классическим целевым функционалом сходного типа, что является-неоспоримым преимуществом ФОР и показано во многих работах [68-70, 78-98] путём сопоставления материалов обширных численных решений и общими теоретическими путями. Кроме того, попытки [99, 100] общего сопоставления систем, оптимальных в смысле минимума ФОР и классических функционалов, в отношении традиционных прямых показателей качества переходных процессов или точности при стохастических возмущениях свидетельствуют в пользу ФОР как в отношении запаса фазы и амплитуды для линейных стационарных систем [99], так и статистической точности [100].
ФОР А. А. Красовского позволяет задать [101] следующие требования к синтезируемым управлениям: точность приведения объекта в заданное положение в указанный момент времени (терминальная задача); минимизация отклонений фазовых координат рассматриваемого процесса от желаемых позиций (квазитерминальная задача); минимизация затрат на управление безынерционными исполнительными устройствами в оптимальной системе.
Таким образом, использование ФОР в задачах АКОР обладает большими преимуществами, что позволяет перейти от теоретических исследований к решению достаточно сложных практических задач [101]. Решение задач АКОР на основе принципа минимума критерия обобщённой работы А. А. Красовского является второй отличительной особенностью данной работы.
Настоящая диссертационная работа была посвящена разработке такого подхода к синтезу управлений, который максимально сочетал бы в себе указанные положительные свойства принципа минимума ФОР А. А. Красовского и метода исследования нелинейных объектов с помощью ФРВ. Проведённая в данном направлении исследовательская работа определила принадлежность данного подхода к классу методов с прогнозирующей моделью [70, 87, 92, 98, 102]. Методы синтеза управлений на основе прогнозирующей модели являются наиболее универсальной формой оптимального в смысле минимума ФОР алгоритма управления. Иллюстрацией и обоснованием этого могут служить работы [70, 92, 103-106]. Опыт организационного управления показывает [107], что прогнозирование, предвидение является необходимым элементом всякого рационального управления. Определение оптимального управления посредством прогнозирования свободного движения управляемого объекта является вполне естественным, в несколько неопределённых и эвристических формах это было предложено Г. Зиболцем [108], К. Келли [109] и др. ещё задолго до появления строгой теории. Методы синтеза управлений данного класса основаны на интегрировании (решении) уравнения свободного движения управляемого объекта. Если не принимать во внимание ошибок интегрирования, то методы с прогнозирующей моделью следует отнести к точным методам оптимизации.
Таким образом, проведённые исследования установили возможность модификации метода прогнозирующей модели А. А. Красовского на основе ФРВ, позволяющей рассчитывать реализуемые на практике алгоритмы квазиоптимального управления полиномиальными многомерными объектами по строго формализованным методикам с относительно небольшими затратами вычислительных ресурсов, в частности - возможность получения квазиоптимального закона управления асинхронным электроприводом.
Цель работы состоит в модификациях метода прогнозирующей модели А. А. Красовского на основе использования ФРВ, позволяющих синтезировать квазиоптимальные законы управления многомерными объектами с квадратичными и кубическими нелинейностями; в разработке на их основе квазиоптимального закона управления асинхронным , электроприводом роботизированной системы дистанционного обнаружения и слежения за подвижными целями.
Достижение указанной цели требует решения следующих задач исследования. 1. Разработать методики приближённого аналитического решения с помощью различных видов ФРВ однородных дифференциальных уравнений, описывающих свободные движения многомерных объектов управления с квадратичными и кубическими нелинейностями.
2. Разработать аналитический способ определения весовых коэффициентов взвешенного функционального ряда Вольтерра (ВФРВ), обеспечивающего более точное решение дифференциального уравнения свободного движения объекта и, как следствие, решение задачи квазиоптимального управления с меньшим значением критерия качества по сравнению с использованием стандартного ФРВ.
3. Модифицировать метод прогнозирующей модели А. А. Красовского на основе применения различных видов ФРВ и разработать соответствующие методики синтеза квазиоптимальных управлений для многомерных объектов с квадратичными и кубическими нелинейностями.
4. Применить разработанные методики синтеза квазиоптимальных управлений к построению системы векторного управления скоростью асинхронного электропривода роботизированной системы дистанционного обнаружения и слежения за подвижными целями.
Объектом исследования являются системы управления с полиномиальными нелинейностями фазовых координат второй и третьей степеней.
Предметом исследования является метод синтеза квазиоптимальных управлений с использованием прогнозирующей модели объекта (метод прогнозирующей модели А. А. Красовского).
Методы исследования. При получении теоретических результатов использовались методы функционального анализа, теории дифференциальных уравнений, теории устойчивости, теории оптимального управления и аппарат ФРВ. При исследовании электромеханической системы (асинхронный электропривод) применялись методы обобщённой теории электрических машин, цифровое моделирование и экспериментальное исследование. Научная новизна. В работе получены следующие новые результаты, лежащие в основе предлагаемых модификаций метода прогнозирующей модели А. А. Красовского с использованием ФРВ:
• разработаны методики приближённого аналитического решения с помощью различных видов ФРВ однородных дифференциальных уравнений с квадратичными и кубическими нелинейностями в области сходимости ФРВ, для определения границ которой предложена соответствующая методика;
• предложен способ аналитического определения весовых коэффициентов ВФРВ;
• в виде модификаций метода прогнозирующей модели А. А. Красовского на основе различных видов ФРВ разработаны методики синтеза квазиоптимальных управлений, образующих вместе с полиномиальными объектами второй и третьей степеней, асимптотически устойчивые системы управления в ограниченной области фазового пространства, для определения границ которой предложена соответствующая методика;
• на основе разработанных методик синтеза квазиоптимальных управлений получен закон регулирования, используемый в системе векторного управления скоростью асинхронного электропривода роботизированной системы дистанционного обнаружения и слежения за подвижными целями.
Основные научные положения, защищаемые в диссертации. На защиту выносятся следующие результаты исследований.
1. Приближённые аналитические решения многомерных дифференциальных уравнений, описывающих свободные движения объектов управления с квадратичными и кубическими нелинейностями, которые в области сходимости ФРВ определяются с инженерной точностью в виде суммы первых двух (ненулевых) членов ФРВ по строго формализованной процедуре, не требующей больших объёмов вычислений.
2. Способ аналитического определения весовых коэффициентов ВФРВ, обеспечивающего решение задачи квазиоптимального управления с меньшим значением критерия качества по сравнению с использованием стандартного ФРВ. Согласно указанному способу весовые коэффициенты находятся из условия приближения получаемого решения в виде ФРВ уравнения свободного движения объекта к его точному решению.
3. Модификации метода прогнозирующей модели А. А. Красовского на основе различных видов ФРВ, представленные в виде соответствующих методик синтеза квазиоптимальных управлений для объектов с квадратичными и кубическими нелинейностями, которые обеспечивают при использовании стандартного ФРВ решение задачи АКОР, совпадающее с решениями известных методов (метода степенных рядов и метода А. А. Красовского), но с гораздо меньшими вычислительными затратами, а при использовании ВФРВ — решение задачи квазиоптимального управления с меньшим значением критерия качества, чем при использовании стандартного ФРВ.
4. Синтезированный закон регулирования, обеспечивающий по сравнению с законом, предложенным в работе А. В. Садового, и ПИД-законом более качественное регулирование скорости асинхронного электропривода в режимах работы, характеризующихся резкими и частыми изменениями задания по скорости при постоянном моменте нагрузки на валу двигателя и при моменте нагрузки, искажённом помехами.
Достоверность научных положений, выводов и рекомендаций, содержащихся в диссертации, подтверждена строгими математическими доказательствами теоретических результатов, совпадением получаемых результатов с результатами широко известных методов синтеза (метода степенных рядов и метода А. А. Красовского), практическим применением разработанных квазиоптимальных законов управления в конкретной электромеханической системе.
Практическая ценность. Практическая значимость разработанных в диссертации методик синтеза управлений определяется следующим: указанные методики позволяют без особых трудностей аналитического и вычислительного характера, присущих широко известным методам, синтезировать легко реализуемые на практике квазиоптимальные по ФОР системы управления многомерными объектами, описываемыми дифференциальными уравнениями с квадратичными и кубическими нелинейностями.
Результаты работы могут быть использованы в различных отраслях промышленности при создании современных устройств автоматического управления, а также при разработке систем автоматизированного проектирования указанных устройств.
Реализация результатов. Работа выполнена в ГОУ ВПО «Тульский государственный университет» (ТулГУ). Полученные результаты использованы в научно-исследовательской работе (НИР) при выполнении гранта РФФИ № 05-01-96707 «Разработка методов аналитического конструирования оптимальных регуляторов и математическое моделирование оптимальных по точности и быстродействию нелинейных систем управления динамическими объектами», при выполнении НИР «Блокировка» в Тульском филиале ФГУП «КБ машиностроения», а также в учебном процессе ТулГУ, о чём свидетельствуют соответствующие акты.
Апробация работы. Основные результаты, полученные в диссертационной работе, были представлены и обсуждены на второй Всероссийской научно-практической конференции «Системы управления электротехническими объектами» (Тула, 2002), Международной научно технической конференции «Системные проблемы качества, математического моделирования, информационных и электронных технологий» (Москва, 2003), первой Всероссийской научно-технической конференции студентов и аспирантов «Идеи молодых - новой России» (Тула, 2004), Межрегиональной научно-технической конференции «Интеллектуальные и информационные системы» (Тула, 2004), XVII Международной научной конференции «Математические методы в технике и технологиях» (Кострома, 2004) и IX Всероссийской научно-технической конференции «Проблемы проектирования и производства систем и комплексов» (Тула, 2006). Публикации. По результатам выполненных исследований автором лично и в соавторстве опубликовано 8 печатных работ.
Структура и объём работы. Диссертация состоит из введения, четырёх глав, заключения, библиографического списка на 189 наименований, 12 приложений. Материал изложен на 172 страницах. Работа содержит 19 рисунков и 7 таблиц.
Математическое описание задачи управления
В основе анализа и синтеза автоматических систем управления лежит понятие математической модели управляемого процесса, которая должна отражать свойства реального объекта в пределах требуемой для управления точности. В дальнейшем, согласно работам [НО, 111], под объектом управления будем понимать выделенную в реальном производственном процессе, функционирующем с определенной целью в условиях действия возмущений, математическую модель канала управления с т входными и п выходными переменными. Такое определение объекта управления соответствует практической ситуации, с которой мы имеем дело при решении прикладных задач, и отражает тот факт, что информацию о реальном процессе, необходимую для установления способа управления им, можно условно разделить на три вида: информация о динамических свойствах объекта, то есть описание изменения фазовых координат вектора состояния объекта X(t) = {xi(t),..., xn(t)) под действием детерминированных входных сигналов, являющихся компонентами вектора управления V(t) = (ul(t),...,um(t))T; информация о воздействии на объект внешней среды, содержащая описание возмущающих воздействий, составляющих вектор V(/) = (vi(t),..., vr(t)) ; информация о требуемом характере изменения выходной переменной, вытекающая из общего критерия качества функционирования объекта, который также учитывает и меру эффективности управляющих воздействий.
В результате конкретизации содержания этих пунктов можно выделить множество объектов, являющееся типичным для многих задач автоматического управления, для которого в дальнейшем разрабатываться методики аналитического синтеза квазиоптимальных регуляторов.
Анализ литературных источников [40, 54, 60, 110-121] показал, что реальные объекты в электромеханике, энергетике, химии, металлургии и т. д. можно достаточно точно описать многомерным нелинейным дифференциальным уравнением: X(0 = F(X) + B(X).U(0 + K-V(0 (1.1) где t — время, X(t) = (х{ (t), ...,xN (/)) - вектор размерности N фазовых координат объекта (точка вверху обозначает производную данной переменной по времени), F(X) — вектор размерности N полиномиальных функций от компонентов вектора фазовых координат, XJ(t) = (щ (t), ...,йт (t)) - вектор размерности т управляющих воздействий, Y(t) = (уг(t),..., vr (t)) вектор размерности г возмущающих воздействий, B(X) - матрица размерности Nxm коэффициентов при управляющих воздействиях, К - постоянная матрица размерности Nxr. Многомерные стационарные объекты, описываемые уравнением (1.1), предполагаются управляемыми в некоторой ограниченной области фазового пространства, содержащей точку X = 0.
Предполагается, что возмущения, действующие на объект, описываются ограниченными по величине функциями, представляющими собой устойчивые решения линейных дифференциальных уравнений vi(t) = cn-e Xivt +ci2-e Xi2t+... (ХпД/2,... 0, / = 1...г), (1.2) причём коэффициенты cn,ci2,— могут скачком изменять свои значения в случайные, но разделённые достаточно длительным интервалом, моменты времени, в течение которого система управления успевает идентифицировать возмущения и затем соответствующим образом их отработать. В этом случае все возмущающие воздействия (в общем случае также и определённое количество их производных) можно включить [122] в расширенный вектор состояния х(0 = fa(0 » ХМ)Т = fa (0» » xN(t)t М0 vr(0, vt(0,..., vr(t), ...)T с последующим решением задачи АКОР для объекта, описание которого не содержит возмущений в явном виде: Х(0 = F(X) + B(X)-U(0. (1.3)
Среди полиномиальных объектов (1.3) целесообразно выделение определённого множества объектов, содержащих в своём математическом описании кроме линейных составляющих полиномиальные нелинейности только второй или только третьей степеней. Данному множеству объектов в настоящей работе уделяется основное внимание.
Формирование членов и определение области сходимости многомерного функционального ряда Вольтерра
Рассмотрим решения многомерных однородных дифференциальных уравнений с постоянными коэффициентами Х(0 + А] Х(0 + А2 [Х(0 Х(0] = 0, (2.1) Х(0 + А, Х(0 + А3 [Х(0 Х(0 Х(0] = 0, (2.2) описывающих свободные движения выделенного множества нелинейных стационарных объектов управления (1.4) и (1.5) соответственно.
Дифференциальные уравнения (2.1) и (2.2), как и (1.4) и (1.5), являются частными случаями неоднородного дифференциального уравнения с квадратично-кубической нелинейностью Х(0 + А! Х(0 + А2 [Х(0 8 Х(0] + А3 [Х(0 Х(0 8 Х(0] = В(Х) U(0. (2.3) В дальнейшем это уравнение будет рассматриваться для определения областей сходимости решений в виде ФРВ уравнений (2.1) и (2.2), а также для определения областей асимптотической устойчивости синтезируемых с помощью ФРВ систем управления объектами (1.4) и (1.5).
Когда объект управления описывается не одним дифференциальным уравнением, а системой таких уравнений, решением будет являться вектор с элементами решений по каждой координате фазового пространства. Следовательно, ряд Вольтерра, описывающий аналитическое решение системы уравнений, будет записываться в виде суммы векторов: Х(0 = Xj (0 + Х2 (0 + Х3 (0 + Х4 (0 + ... (2-4)
Формирование членов многомерного ряда Вольтерра осуществляется по тем же принципам, что и одномерного ряда (см. пункт 1.2.3), только вместо скалярной функции скалярного аргумента x(t) используется векторная функция скалярного аргумента X(t) = (xl (t), х2(t),..., хп (t))T. Для многомерных однородных дифференциальных уравнений (2.1), (2.2) первый член ряда определяется [167] выражением Х1(0 = Н(0-Х0, (2.5) где Х0 = X(t = t0=0)— вектор размерности п начальных условий объекта, Н(0 = е"Аг . (2.6)
Рекуррентное соотношение для формирования всех последующих членов ФРВ можно записать аналогично выражению (1.41): х/(0 = -Е /Н( -т).АА-Х$+1(т).Ж, / = 2,3,4,... к=2 о Для уравнения (2.1) степень полиномиальной нелинейности которого N = 2, это соотношение преобразуется в x/ (0 = -Z JHC - т) А2 К СО х/-. СО] Л, / = 2, 3, 4,... , (2.7) г=1 О а для уравнения (2.2) при iV = 3 получаем x/(0 = -fl jH( )-A3-[xil(T)XM+1(T)Xi_ia_1(x)].A, / = 3,4,5,... (2.8)
Основным условием применения ФРВ является сходимость ряда. Для определения области сходимости ФРВ в приложении 1 доказано утверждение 1: если матрица (—Aj) дифференциального уравнения (2.3) имеет собственные числа с отрицательными вещественными частями и если вектор начальных условий Х0 и вектор управляющих функций V(t) ограничены соответствующими положительными константами X0 i?Q, U(0 i, причём нормы вектора и матрицы задаются выражениями v(0 их 1 Р(0 nxq = max sup v/ (t)\ -max ]N sup Pij(t) \ i n J=l {o t x то нелинейное дифференциальное уравнение (2.3) имеет единственное непрерывное решение, описываемое функциональным рядом Вольтерра, сходящимся в области Х(ґ) R (RQ R, R R), радиус которой для уравнения с квадратичной нелинейностью (А3 = (0)) определяется соотношением
Важно подчеркнуть, что результат (2.9) совпадает с результатом [166] 2-G! так как G = Z2 А2І, полученным другим способом для объектов с квадратичной нелинейностью. Это косвенно свидетельствует о достоверности сформулированного утверждения и о более общем характере подхода его доказательства, применимого для объектов с полиномиальными нелинейностями выше второй степени, в частности для третьей.
Основываясь на результатах данного утверждения, определяющего достаточные условия сходимости ФРВ, найдём количество членов ФРВ, которое необходимо учитывать при решении дифференциальных уравнений (2.1) и (2.2), описывающих свободные движения объектов управления выделенного множества. Для этого рассмотрим нелинейное дифференциальное уравнение (2.3). Его решение эквивалентно [140] решению нелинейного интегрального уравнения то есть нормы членов ряда Вольтерра уменьшаются приблизительно как члены геометрической прогрессии со знаменателем q = 1/2. На этом основании вслед за работой [167] приходим к выводу, что при выполнении условия (2.15) ряд Вольтерра для объекта с квадратичной нелинейностью сходится, причём переходные процессы таких объектов управления с инженерной точностью можно описать первыми двумя-тремя членами ряда.
Теперь на основе доказанного утверждения получим оценку области, в которой движение объекта с квадратичной нелинейностью с инженерной точностью описывается первыми двумя-тремя членами ряда Вольтерра.
Подход к синтезу квазиоптимальных управлений на основе функциональных рядов Вольтерра
Как уже отмечалось в пункте 1.2.2, согласно основной теореме А. А. Красовского, оптимальное управление, доставляющее минимум ФОР (1.19) на траектории движения объекта (1-3), определяется выражением (1.22), в котором функция Беллмана является решением уравнения Ляпунова (1.28). Указанная теорема лежит в основе метода прогнозирующей модели А. А. Красовского (см. пункт 1.2.2), в соответствии с которым, если исходный объект (1.3) без управляющего воздействия асимптотически устойчив, то решение уравнения Ляпунова легко найти при условии, что для дифференциального уравнения, описывающего свободное движение указанного динамического объекта, известно решение в форме Коши x(o = w(r,x0), где X0 = X(t = 0) - начальное состояние свободного движения объекта. В данном случае функция Беллмана определяется [121] выражением 5(Х)= jWT0,X).Q-W( 3X)- 5 Х = Х0. (3.1) о Формула (3.1) непосредственно выводится из уравнения Ляпунова для асимптотически устойчивого объекта.
Замена вектора начального состояния объекта Х0 на вектор текущего состояния X(t) в формуле (3.1) связана с тем, что в каждый момент времени (или в начале каждого интервала времени, на которые разбито текущее время в дискретных системах управления) система контроля и оценивания реального управляемого процесса определяет вектор состояния X(t) (необходимый для организации управления по обратной связи), в зависимости от которого на выходе управляющего устройства формируется сигнал управления. Таким образом, в каждый момент времени обеспечивается равенство X(t) = Х0.
Так как для определения управления (1.22) требуется производная функции Беллмана по вектору координат, продифференцируем обе части (3.1) по X и при условии, что Q является симметричной матрицей, получим: aga.2.j? .Q.w(a). . (з.2) оХ оХ
Приближённое аналитическое решение в форме Копій W(/,X) при X = Х0 дифференциального уравнения, описывающего свободное движение рассматриваемого объекта управления, целесообразно представить в виде ФРВ. Как уже было отмечено (см. пункт 2.1), ряд Вольтерра для устойчивого объекта имеет соответствующую область сходимости, содержащую точку начала координат фазового пространства X. Так как в АКОР по ФОР объект управления предполагается устойчивым в некоторой области фазового пространства, также содержащей точку начала координат, то использование ряда Вольтерра в окрестности X = 0 при решении рассматриваемой задачи оптимального управления является вполне правомерным.
Данное положение было принято автором в качестве отправного пункта для построения модификаций метода прогнозирующей модели на основе применения рядов Вольтерра. Согласно указанным модификациям квазиоптимальный закон управления для асимптотически устойчивого объекта определятся выражением (1.22), а входящая в него функция Беллмана строится (см. (3.1)) на основе приближённого аналитического решения в виде ФРВ задачи Коши для рассматриваемого объекта управления с полиномиальными нелинейностями фазовых координат.
Таким образом, предлагаемый подход к синтезу квазиоптимальных по ФОР управлений на основе рядов Вольтерра включает следующие этапы: 1) приближённое решение задачи Коши в виде стандартного ФРВ или ВФРВ для дифференциального уравнения, описывающего свободное движение рассматриваемого объекта управления {см. главу 2) X2(t,XQ) для (2.1), \У(ґ,Х0) = Х,(ґ,Х0) + С(Х0)- 2 ] Х3(/,Х0) для (2.2), (Xj(/, X0),X2(t, X0),X3(t, Х0) - первый, второй и третий члены ФРВ соответственно, С(Х0) — диагональная матрица весовых коэффициентов, определяемая на основе функционала (2.35) или равная единичной матрице в случае применения стандартного ФРВ), 2) построение на основе найденного решения W(?,X0) функции Беллмана согласно выражению (3.1), 3) определение на основе полученной функции Беллмана S(X) квазиоптимального по ФОР закона управления согласно выражению (1.22), а также (3.2).
Постановка задачи аналитического конструирования оптимального регулятора для электропривода
Для определения весовых коэффициентов ВФРВ, используемого при решении задачи АКОР, кроме способа, описанного в пункте 2.4.1, можно предложить дополнительный способ, вытекающий их самой сущности задачи оптимального управления.
В соответствии с постановкой задачи АКОР (см. пункт 1.1.2) требуется найти закон оптимального управления, который обеспечивал бы минимальное значение заданного критерия качества (в нашем случае ФОР) при движении системы из одного состояния в другое. Поэтому очевидно, что управление, доставляющее меньшее значение критерию качества, является более приближенным к оптимальному. Отсюда вытекает, что условие минимума заданного критерия качества можно использовать в качестве способа получения весовых коэффициентов: подставив решение уравнения свободного движения объекта в виде ряда Вольтерра с неопределёнными весовыми коэффициентами в заданный функционал качества и взяв частные производные от полученного выражения по всем весовым коэффициентам, можно получить систему уравнений, решение которой позволит определить искомые весовые коэффициенты для ВФРВ.
На основе вышесказанного можно предложить следующий способ нахождения весовых коэффициентов ВФРВ. Сначала записывается (см. (2.36)) свободное движение рассматриваемого объекта в виде ВФРВ с неопределёнными весовыми коэффициентами. Далее это решение подставляется во вспомогательный функционал, в качестве которого можно принять широко распространённый классический квадратичный функционал (1.18). Здесь отметим, что использование ФОР, оптимизация по которому мало что меняет в техническом существе требований предъявляемых к оптимальной системе по сравнению с квадратичным функционалом, весьма затруднительно для определения весовых коэффициентов, поэтому остановимся на функционале (1.18). При этом управление, входящее в функционал (1.18) можно выразить из уравнения объекта при условии, что существует обратная матрица для матрицы коэффициентов при управляющих воздействиях:
Подставив (2.36) и (3.21) в (1.18), получим функционал, который будет зависеть от начальных условий Х0 и весовых коэффициентов С. Минимизация данного функционала по каждому весовому коэффициенту сп {і = 1,..., п) позволит получить систему из п уравнений, из которой надлежит найти все п коэффициентов. Здесь мы сталкиваемся с проблемой решения этой системы: получаемый функционал (при постоянной матрице В) представляет собой полином 4-ой степени (для объекта (1.4)) или 6-ой степени (для объекта (1.5)) относительно весовых коэффициентов, а получаемая из него система уравнений, соответственно, является системой кубических полиномов или полиномов пятой степени, аналитических решений которых не существует. Подчеркнём, что нам для решения задачи АКОР требуется именно аналитическое определение коэффициентов.
В качестве одного из вариантов решения возникшей проблемы можно предложить отбрасывание в функционале, получаемом подстановкой (2.36) и (3.21) в (1.18), всех слагаемых со степенями весовых коэффициентов выше второй (с ростом степени слагаемого, его вес уменьшается), чтобы получить систему линейных уравнений относительно искомых коэффициентов. Уменьшение веса слагаемых с ростом степеней весовых коэффициентов связано с тем, что весовые коэффициенты в соответствии с выбранным видом ВФРВ (см. пункт 2.3) стоят при втором члене ряда (см. (2.36)), который по условию сходимости (см. пункты 1.2.3, 2.1) меньше первого члена ряда. В связи с этим при умножении вектора фазовых координат на самого себя (см. (1.18), (3.21)) слагаемые с большими степенями весовых коэффициентов окажутся с меньшими величинами коэффициентов.
В качестве другого варианта преодоления указанных трудностей можно предложить нахождение весовых коэффициентов из условия минимума функции Беллмана (см. (3.1)) или, другими словами, — функционала (1.18) без слагаемого с управлением: оо о Использование функционала (3.22), во-первых, позволяет расширить область применения методики синтеза - модели объектов могут содержать не только квадратную, но и прямоугольную матрицу В(Х), во-вторых, функционал (3.22) позволяет значительно упростить уравнения, которыми приходится оперировать при нахождении весовых коэффициентов, и, как следствие, упростить выражения самих весовых коэффициентов. Кроме того, целесообразность применения функционала (3.22) подтверждают результаты исследований, согласно которым наличие в функционале (1.18), в отличие от (3.22), слагаемого с управлением не приводит к уменьшению критерия обобщённой работы в задаче АКОР.