Содержание к диссертации
Введение
ГЛАВА 1. Математические методы анализа робастных свойств 23
1.1. Частотный подход к оценке границ робастной устойчивости SISO-систем 23
1.2. Обобщение подхода для МІМО-систем и методика сравнительного анализа регуляторов 39
1.3. Спектральный подход к оценке робастного качества замкнутых систем 45
ГЛАВА 2. Методы синтеза робастных регуляторов 49
2.1. Спектральный метод робастной стабилизации для SISO-систем 49
2.2. Оптимизационный частотный подход к синтезу робастных регуляторов для одного класса нелинейных систем 65
ГЛАВА 3. Вопросы стабилизации плазмы в сферическом Токамаке mast 71
3.1. Математическая модель плазмы как объекта управления 71
3.2. Анализ и синтез системы вертикальной стабилизации 79
3.3. Вопросы проектирования системы управления током и формой плазмы 90
Заключение 97
Литература 98
- Частотный подход к оценке границ робастной устойчивости SISO-систем
- Обобщение подхода для МІМО-систем и методика сравнительного анализа регуляторов
- Оптимизационный частотный подход к синтезу робастных регуляторов для одного класса нелинейных систем
- Математическая модель плазмы как объекта управления
Введение к работе
1. Актуальность, цели и основные результаты исследований
В практике решения формализованных задач, связанных с управлением реальными динамическими объектами, неизбежно возникают проблемы, порождаемые наличием различных неопределенностей в задании соответствующих математических моделей. Это обстоятельство определяется как отсутствием полной информации о динамических свойствах объектов управления, так и о свойствах действующих на них внешних возмущений, зачастую носящих случайный характер.
Особо следует отметить тот факт, что при использовании формализованных подходов к рассмотрению систем стабилизации тех или иных движений динамических объектов применяется хорошо развитый математический аппарат теории линейных систем. Естественно, что он базируется на использовании линеаризованных моделей, приближенно описывающих поведение объекта в окрестности стабилизируемых движений (в частности — положений равновесия). Отсюда возникают дополнительные погрешности, порождаемые неточностями линеаризации.
Отмеченные обстоятельства определяют то постоянное внимание, которое уделяется в последние годы развитию и практическому использованию математических методов учета указанных неопределенностей при проведении исследовательских и проектных работ по созданию систем управления динамическими объектами различных классов ([20],[26],[32], [41-46], [53], [76]).
Следует отметить, что постоянно возрастающие возможности современных компьютерных технологий и систем позволяет реализовывать алгоритмически сложные и ресурсоемкие оптимизационные методы, ориентированные на учет различных требований к качеству процессов управления, в том числе с учетом и компенсацией неточностей моделирования.
В современной терминологии малая чувствительность замкнутой системы (в смысле сохранения определенного свойства) по отношению к неточностям в задании модели объекта управления характеризуется понятием робастности. Особенно важной является задача обеспечения роба-стной устойчивости, т.е. сохранения устойчивости замкнутой системы при любых возмущениях модели объекта в определенных пределах. Стремление к выполнению желаемых ограничений на динамические характеристики замкнутой системы с возмущенным объектом определяют задачу обеспечения робастного качества.
Одним из наиболее важных и перспективных направлений для практических приложений современной теории управления является термоядерная энергетика.
В настоящее время явно вырисовывающиеся проблемы нехватки традиционных источников сырья для производства энергии подстегивают активный поиск альтернатив, и одним из наиболее перспективных вариантов считается термоядерный синтез. В практическом аспекте его реализация, по-видимому, будет базироваться на наиболее актуальной концепции магнитного удержания плазмы в токамаках [2], [22], [80-81].
Ключевыми проблемами на пути реализации этой концепции являются непродолжительное время жизни и неустойчивость плазмы. Многолетний опыт проведения исследовательских работ по проектированию и эксплуатации токамаков различных типов показал, что успешное преодоление указанных проблем с достаточной мерой гибкости и эффективной технологической поддержкой может быть реализовано только на базе применения систем автоматического управления с обратной связью. Соответственно представляется исключительно значимой роль формализованного математического, алгоритмического и программного обеспечения, привлекаемого для проведения соответствующих исследовательских и проектных работ по созданию таких систем.
Известно [17],[22],[65], что в качестве основного элемента исходной математической модели, описывающей динамику плазмы в токамаке, используется исключительно сложная нелинейная система дифференциальных уравнений Грэда-Шафранова в частных производных. Естественно, что полный комплекс формализованного описания используется только на этапах имитационного моделирования и на отдельных стадиях анализа процессов управления.
Однако при проектировании законов формирования обратных связей (регуляторов) в задачах стабилизации плазмы принято опираться на использование линейных моделей, получаемых линеаризацией исходной модели динамики токов в окрестности базового положения равновесия, определяемого выбранным сценарием разряда.
При этом чаще всего требуется, чтобы один и тот же проектируемый регулятор обеспечивал устойчивость и желаемое качество замкнутой системы как на отдельных стадиях развития сценария, так и для нескольких положений равновесия, соответствующих некоторому набору характерных сценариев разряда с учетом погрешностей моделирования и линеаризации. Естественно, что подобное требование может быть реализовано только путем обеспечения определенных робастных свойств системы управления плазмой, играющих исключительно важную роль в комплексе ее динамических характеристик.
Исследовательские работы по изучению робастных особенностей систем управления плазмой в токамаках начались сравнительно недавно, применительно к международному проекту ITER ([11-12],[22],[62-66],[80-81]), и в настоящее время находятся в стадии непрерывного развития.
Сложность плазмы как объекта управления, функционирующего в экстремальных физических условиях, а также ряд специфических особенностей, связанных с подходами к ее моделированию, порождает необходимость в проведении дополнительных исследований, связанных с моди-
фикацией существующих методов анализа и синтеза робастных регуляторов и разработкой новых, позволяющих, в том числе использовать преимущества оптимизационного подхода. Это определяет актуальность развития соответствующей теории и вычислительных методов анализа и синтеза, а также их адаптации к решению комплекса прикладных задач управления плазмой в современных токамаках.
Целью диссертационной работы является проведение исследований, направленных на развитие математических методов и алгоритмического обеспечения задач анализа и проектирования систем стабилизации плазмы, обладающих желаемыми робастными свойствами. Кроме того, целью диссертации служит решение конкретных прикладных задач, связанных с управлением плазмой в токамаке MAST.
Исследования, представленные в диссертационной работе, проводились по следующим направлениям:
развитие частотного подхода для построения границ робастной устойчивости замкнутых систем и разработка методики сравнительного анализа робастных свойств стабилизирующих регуляторов;
использование информации о частотных ограничениях неопределенностей в задании спектральной плотности мощности внешних возмущений для получения оценок робастных диапазонов качества;
разработка методов построения робастных регуляторов с учетом частотных ограничений на неструктурированные неопределенности в задании математической модели объекта управления;
развитие комбинированного подхода для обеспечения желаемых динамических и робастных свойств замкнутой системы со стандартными нелинейностями в канале управления;
решение прикладных задач управления вертикальным положением, током и формой плазмы в токамаке MAST на базе полученных теоретических результатов.
Диссертационная работа состоит из введения, трех глав, заключения и списка литературы, включающего 111 наименований.
Во введении рассматривается общая постановка задач, решаемых в диссертационной работе, и проводится краткий обзор опубликованных научных работ по теме исследований.
Первая глава посвящена вопросам анализа робастных свойств линейных замкнутых систем. Здесь в центре внимания находится спектральный подход для оценки степени влияния неструктурированных неопределенностей в задании математических моделей объекта управления и воздействующих на него внешних возмущений. Предлагается развитие частотного метода оценки границ робастной устойчивости и на его основе формируется методика проведения сравнительного анализа робастных свойств стабилизирующих регуляторов. Отдельное внимание уделяется робастному качеству замкнутых систем применительно к задаче среднеквадратичного синтеза при наличии неопределенностей в задании спектральной плотности мощности возмущающего воздействия, ограниченного в частотной области.
Во второй главе диссертации основное внимание уделяется задаче синтеза регуляторов, придающих желаемые робастные и динамические свойства замкнутой системы. Предлагается аналитический метод синтеза робастных регуляторов для SISO-систем, основанный на интерполяционном алгоритме Неванлинны-Пика. Приводится решение для случаев аддитивного и мультипликативного способов введения неструктурированной неопределенности для линейной модели объекта управления. В отличие от известных подходов, здесь используется функциональная параметризация допустимого множества регуляторов, предложенная в работах [8-9],[13].
Предлагается комбинированный метод синтеза регуляторов, позволяющий применить оптимизационный подход для целенаправленного поиска допустимого компромисса между характеристиками качества дина-
мических процессов и робастными свойствами замкнутых систем.
При этом динамические показатели качества оцениваются по результатам имитационного моделирования исходной нелинейной системы, что соответствует моделям, обычно используемым в практике решения вопросов управления плазмой в токамаках.
Третья глава посвящена решению практических задач анализа и синтеза робастных регуляторов для системы управления вертикальным положением, током и формой плазмы токамака MAST [88-91]. Рассматриваются некоторые характерные особенности математических моделей, используемых в этих задачах, предлагаются способы учета этих особенностей при использовании известных методов синтеза регуляторов.
Для системы вертикальной стабилизации плазмы токамака MAST разработаны несколько регуляторов с использованием различных методов синтеза. Проведен сравнительный анализ построенных регуляторов в отношении их робастных свойств.
Для синтеза регулятора формы плазмы применен комбинированный оптимизационный подход, позволяющий обеспечить допустимый компромисс между динамическими характеристиками переходного процесса в замкнутой нелинейной системе с ограничениями и робастными свойствами, оцениваемыми по соответствующему линейному приближению.
Кроме того, для системы стабилизации формы плазмы построен ро-бастный регулятор с использованием метода LQG-оптимизации [1], [19] и проведено сравнение полученных регуляторов. Полученные в этой главе результаты иллюстрируют применимость и эффективность методов и алгоритмов, разработанных в диссертации.
Основными результатами, полученными на основе проведенных исследований, и выносимым на защиту являются следующие:
Для неструктурированных неопределенностей развит частотный подход к построению границ робастной устойчивости и робастного каче-
ства замкнутых систем и на его основе предложена соответствующая методика сравнительного анализа стабилизирующих законов управления;
разработан аналитический метод построения робастных регуляторов для SISO-систем с ограниченными в частотной области непараметрическими неопределенностями аддитивного и мультипликативного типа;
предложен комбинированный оптимизационный подход, обеспечивающий синтез регуляторов на базе допустимого компромисса между динамическим качеством и робастной устойчивостью замкнутой системы;
на базе полученных результатов решены практические задачи по анализу и синтезу системы стабилизации плазмы в токамаке MAST, подтверждающие работоспособность и эффективность принятого подхода.
Теоретическая и практическая ценность результатов диссертации. В работе представлены новые математические методы и вычислительные алгоритмы, позволяющие эффективно решать задачи анализа робастных свойств и синтеза робастных регуляторов для систем управления динамическими объектами, что определяет теоретическую значимость диссертационной работы. Практическая направленность диссертации выражается в том, что результаты исследований адаптированы для решения специфических задач, возникающих в практике исследования и разработки систем управления плазмой в современных токамаках.
Апробация работы. Результаты, полученные в диссертации докладывались на международных конференциях «Процессы управления и ус-тойчивсть» 2004 (г. Санкт-Петербург), PHYSCON 2005 (г. Санкт-Петербург, 2005), 11 International Workshop on Spherical Torus (Санкт-Петербург, 2005), Beam Dynamics & Optimization (BDO'2006) (Санкт-Петербург, 2006), PHYSCON 2007 (Potsdam, Germany, 2007), III всероссийская научная конференция «Проектирование инженерных и научных приложений в среде MATLAB» (Санкт-Петербург, 2007), а также на семинарах кафедры компьютерных технологий и систем и лаборатории компью-
терного моделирования систем управления СПбГУ.
Результаты диссертации были использованы в рамках инновационной программы СПбГУ «Пилотный проект №22. Прикладные математика и физика»: «Разработка программно-методического комплекса по созданию линейных математических моделей управления плазмой в токама-ках», «Программно-методическое обеспечение по методам стабилизации плазмы в современных токамаках».
Публикации. Основное содержание диссертации отражено в 7 печатных работах, две из которых опубликованы в журналах, входящих в Перечень изданий, рекомендованных ВАК РФ.
2. Общие формулировки и постановки рассматриваемых задач
Рассмотрим основные принципы работы и устройство токамака MAST [93], схема поперечного сечения которого представлена на рис. 1.
Главными конструктивными элементами токамака являются герметичная проводящая тороидальная камера, заполненная газом, система электромагнитов, создающих вихревое электрическое поле для обеспечения пробоя газа, а также управляющие электромагниты полоидальной системы - играющие роль исполнительных органов системы управления.
Первым шагом в развитии сценария разряда в токамаке является этап создания условий для пробоя плазмы, включающий в себя подготовку камеры, достижение высокого вакуума, низкого уровня рассеянных полей и требуемого напряжения на обходе. После пробоя газа и его ионизации в камере возникает плазма и начинается этап подъема тока плазмы до предусмотренного сценарием значения.
Полученная плазма с сильным током подвержена действию возмущений различной природы как со стороны внешних факторов (взаимодействия магнитных полей), так под влиянием своих внутренних процессов
(изменения внутреннего давления, вихревые явления и др.).
Pl(CS)
Рис. 1. Схема поперечного сечения вакуумной камеры токамака MAST.
Экстремально высокая температура центральной области плазмы порождает необходимость использования системы магнитного удержания и стабилизации с высокой точностью для предупреждения возможности касания плазмой стенок рабочей камеры и обеспечения требуемой продолжительности жизни плазмы.
Токамак MAST относится к классу сферических токамаков (с малым аспектным отношением), для которых характерна неустойчивость плазмы в вертикальном направлении: в связи с этим уделяется особое внимание задаче стабилизации вертикального положения плазмы.
Указанные особенности поведения плазмы в токамаке определяют задачи соответствующей системы управления. Рассмотрим основные ком-
поненты этой системы и измеряемые динамические характеристики, используемые при формировании обратных связей.
Управляющими устройствами токамака MAST являются пары электромагнитов полоидальной системы Р2 - Р6 и центральный соленоид CS. Каждая пара и центральный соленоид имеют независимые источники питания, а управляющими воздействиями являются величины напряжений, приложенных к обмоткам электромагнитов.
Внешняя граница горячей области плазмы оценивается сепаратрисой магнитного поля, положение плазмы описывается измеряемыми смещениями контрольных точек С (геометрический центр сечения плазмы), In (внутренняя граничная точка) и Out (внешняя граничная точка). Эти смещения получают путем расчетов по данным измерений напряженностеи магнитных полей. Кроме того, в систему стабилизации поступает информация о токах в управляющих катушках и величине тока плазмы.
В токамаке MAST система управления плазмой решает три задачи. Во-первых, это обеспечение устойчивости плазменного шнура в вертикальном направлении, для чего выделена отдельная пара катушек Р6. При этом перемещение плазмы отождествляется с величиной вертикального смещения контрольной точки С.
Во-вторых, осуществление стабилизации тока плазмы, реализуемого магнитным полем центрального соленоида CS.
Третья задача — это управление параметрами формы плазмы с помощью полоидальных катушек РЗ - Р5.
Система стабилизации в целом должна обеспечивать работу в разных режимах, обусловленных выбором различных сценариев разряда, и при этом адекватно соответствовать особенностям поведения плазменного шнура при скачкообразных изменениях плотности плазмы, а также при отклонениях от положения равновесия, обусловленных начальными условиями или воздействиями внешних возмущений.
Перечисленные задачи позволяют использовать различные подходы к формализации решаемых задач с привлечением известных математических методов и разработкой новых подходов, отвечающих упомянутым особенностям систем стабилизации плазмы в токамаках.
Динамика электрических токов, протекающих в активных и пассивных контурах токамака, описывается системой" обыкновенных нелинейных дифференциальных уравнений
= V. (B.l)
Здесь 4/(1,1 ) - вектор полоидальных потоков магнитной индукции, протекающих через поперечное сечение контуров системы; R - квадратная диагональная матрица сопротивлений контуров, I - вектор токов, протекающих через контуры, / - ток плазмы и V - вектор напряжений, приложенных к управляющим катушкам. К уравнениям (В.1) добавляют нелинейные конечные уравнения системы измерения
Y = G(l,Ip). (В.2)
Следует отметить, что система (В.1) имеет положение равновесия, определяемое токами и напряжениями, соответствующими равновесию плазмы, как магнитогидродинамической системы. Это равновесие находят на базе системы уравнений в частных производных Греда-Шафранова [17],[57], а равновесные токи и напряжения определяют точку покоя, относительно которой осуществляют линеаризацию системы (B.l), (В.2).
Результатом линеаризации служит стационарная (LTI) система
х = Ах + Bu + Gd(0,
e = Lx + Mu, (В.З)
y = Cx + Du + Fd(/),
где хеЕп — вектор отклонений токов, и є Ет - вектор отклонений напряжений, є є Ер - вектор контролируемых переменных, у є Ек — вектор отклонения измеряемых переменных (включая геометрические смещения), d є Ет* - вектор внешних возмущений. Все отклонения рассатриваются по отношению к положению равновесия.
В дальнейшем систему (В.З) будем трактовать как номинальную модель плазмы в процессе стабилизации положения равновесия. Задача состоит в поиске стабилизирующего управления (регулятора) в виде
и = Щр)у, p = d/dt, (В.4)
где К(р) - искомая передаточная матрица такая, что характеристический
полином замкнутой системы (В.З), (В.4) гурвицев, а её динамика удовлетворяет совокупности заданных требований и ограничений.
Основное внимание в работе уделяется решению задач анализа роба-
стных свойств замкнутых систем и синтеза регуляторов, обеспечивающих
робастную устойчивость и качество в применении к задачам управления
плазмой в токамаках. \
Среди возможных внешних возмущений, которые воздействуют на плазму, принято особо выделять наиболее неблагоприятный вариант
d(t) = (dl(t) d2(i)) , именуемый <г-,Р-drops», который определяется вне-
-— -L
запными скачками её плотности, dx{t) = d$e ,р, d2(t) = dle tl, где d^, d,,
/р, t; — заданные вещественные числа, фиксированные для каждой точки
сценария горения плазмы.
Рассмотрим содержание частотного подхода к учёту неструктурированных неопределённостей (непараметрического типа) в математической модели линейного объекта управления. Отметим, что для любого регуля-
тора, обеспечивающего устойчивость номинальной замкнутой системы, можно указать допустимые границы изменения характеристик неопределенности, в пределах которых замкнутая данным регулятором система будет оставаться устойчивой, а возможное ухудшение функционалов качества не выйдет за определенные ограничения.
Подобный подход следует признать весьма эффективным для исследования проблемы робастности системы управления током и формой плазмы, поскольку вопрос о достаточно точном задании дифференциальных уравнений динамики процесса стабилизации в настоящее время по-прежнему остаётся открытым.
По существу, пока даже невозможно указать те конкретные параметры плазмы, системы питания, системы измерений и регуляторов, погрешности в задании которых существенно влияют на выход за пределы области устойчивости положения равновесия. Это затрудняет привлечение параметрического подхода к учёту неопределённостей, поскольку требует проведения достаточно сложных и длительных исследований полной нелинейной системы уравнений в частных производных, описывающих процесс стабилизации.
В связи с этим представляется уместным предварительно проводить гораздо более грубые, но эффективные исследования в рамках учета неструктурированных неопределенностей, что позволит делать некоторые обобщённые выводы, приводящие к формированию общей точки зрения на причины возникновения потери устойчивости и возможные способы борьбы с ней.
Прежде всего, дадим общее понятие робастных свойств линейных систем в рамках частотного подхода. Рассмотрим замкнутую линейную систему управления, представленную в виде блок-схемы на рис. 2. Здесь T(s, А), K(s) и H(s, К, А) — передаточные матрицы объекта, регулятора и
замкнутой системы е = H(s, К, A)d соответственно. Символом А обозна-
чена передаточная матрица той части объекта управления, которая представляет неопределенность в задании его математической модели. В
дальнейшем будем полагать, что компоненты этой матрицы являются правильными рациональными дробями с гурвицевыми знаменателями. Относительно матрицы A(s) известно лишь то, что она принадлежит заданному множеству: A(s) є D.
Введем в рассмотрение характеристический полином 5(5, К, А)
замкнутой системы, зависящий от выбора регулятора и конкретной реализации неопределенности. Пусть пъ — его степень, а Ъ1=Ъ1 (К, А), где
/ = 1, пъ - корни, которые должны находиться в открытой левой полуплоскости С" на плоскости корней.
Рис. 2. Структурная схема системы с неопределенностью.
Определение 1. Будем говорить, что замкнутая система с математической моделью e = H(,s,K,A)d обладает свойством робастной устойчивости (является робастно устойчивой) по отношению к неопределенности А(я), если для любой A(s) є D выполняется условие 8{ (К, А) є С",
/ = 1, л3. В этом случае будем говорить, что регулятор u = К(^)у обеспечивает робастную устойчивость замкнутой системы.
Введем в рассмотрение некоторый функционал J = J(H(s, К, А)),
характеризующий качество функционирования системы. При фиксированном регуляторе этот функционал отображает множество D неопределенностей на множество I = J(H(s, К, D)) є R1 числовой оси.
Определение 2. Будем говорить, что замкнутая система e = H(^,K,A)d обладает определенным робастным качеством, если она является робастно устойчивой по отношению к неопределенности А(^), и
если справедливо включение IczSRczR1, где SR — допустимое множество значений рассматриваемого функционала. В этом случае будем говорить, что регулятор и = К(л")у обеспечивает определенное робастное качество
замкнутой системы.
Очевидно, что в связи с введенными определениями особое значение имеет вопрос о задании множества D допустимых неопределенностей. Простейшим способом является ограничение сверху их «величины» (меры), в качестве которой удобно принять норму пространства Банаха Нот
[3], [24] определяемую формулой
||(A(j)L= sup АА(а>), (В.5)
ює[0,оо)
где ^4Д (со) = а(А(/'оо)) — максимальное сингулярное число матрицы A(jcu). При этом наиболее часто множество D задается в виде
D = {A(^):[|(A(5)||00
где р > О - заданное число (с использованием соответствующего масштабирования обычно полагают /3 = 1) хотя возможны и иные варианты, например:
D = {ДСО: АА(а)) < Ща>), V'со є [О,»)}, (В.7)
где N(co) — заданная неотрицательная функция частоты.
В рамках частотного подхода представляет очевидный интерес рассмотрение следующих вопросов анализа робастных свойств замкнутых линейных систем:
будет ли замкнутая система сохранять устойчивость для любых неопределенностей из множества D, заданного в виде (В.6) или (В.7);
какова верхняя числовая граница области робастной устойчивости на множестве D типа (В.6) по норме Н^, т.е. при каком максимальном
значении (3 = рот будет сохраняться устойчивость для любых неопределенностей, удовлетворяющих ограничению ||(А(5)||00 < |3;
какова верхняя частотная граница области робастной устойчивости на множестве D типа (В.7) т.е. при какой максимальной (для каждого со) функции N((o) = Nm() будет сохраняться устойчивость для любых неопределенностей, удовлетворяющих ограничению АА(ю) < iV(co) Vco є [0,оо);
обладает ли замкнутая система определенным робастным качеством на множестве D при заданном допустимом множестве Ш;
какими являются максимальные границы, определяющие множества (В.2) или (В.З), которые гарантируют сохранение робастного качества, т.е. выполнение включения I с: 9 с R1, где I = У(Н(.у, К, D)).
В соответствии с введенными определениями, совокупность задач, решаемых в диссертации, сводится к рассмотрению вопросов о развитии методов анализа робастных свойств систем управления и синтеза регуляторов, обеспечивающих робастную устойчивость и качество. Для частных динамических систем, моделирующих динамику плазмы в токамаках, исследуются конкретные специфические задачи, с использованием оптимизационного подхода.
Уточнение и конкретизация решаемых задач по указанным направлениям осуществляется в соответствующих главах работы.
3. Обзор литературы по теме исследований
Проблематика математического моделирования физических процессов, протекающих в плазме, широко освещается в многочисленных публикациях, опубликованных начиная с 50х годов XX века. В работах [17], [57] описаны методы определения параметров равновесия плазмы с учетом особенностей конструкции различных токамаков.
Работы [22], [65] посвящены рассмотрению характерных особенностей построения математических моделей динамики токов в токамаках и их линеаризации в окрестности базового равновесия плазмы.
Необходимо заметить, что в целом, опубликованных работ, посвященных применению методов современной теории управления с обратными связями в задачах управления плазмой достаточно мало. Это связано с относительной новизной рассматриваемых задач, особенно применительно к токамакам с низким аспектным отношением, характеризующихся высокой степенью неустойчивости плазмы в вертикальном направлении. Здесь необходимо выделить работы [2], [62-66], [75], [88-93], [108].
Основополагающими трудами, связанными с применением математических методов и моделей для аналитического синтеза законов управления, являются труды Летова A.M. [30-33], Зубова В.И. [19-21], Красовско-го А. А. [26, 27].
С начала 1960х годов появление работ Р. Калмана, Г. Прайма [23], [82-83], [98] привело к переходу от использования классических частотных подходов в теории управления к созданию новых концепций, базирующихся на описании объектов управления в форме систем дифференциальных уравнений в терминах пространства состояний. В работах Л. Пон-трягина [97], Р. Беллмана [61], К. Мерриема [36], были предложены формализованные постановки проблем управления в виде оптимизационных
задач. В частности, на их основе получила развитие теория LQG-оптимального синтеза [1], [24], [48-51], [56], [67-68] широко используемая в практике проектирования систем управления. В дальнейшем была установлена непосредственная связь этой методики с оптимизационными задачами в пространстве Харди Н2 [69-70], [74]. Однако, в ряде работ [78],
[107] были выявлены существенные недостатки этих подходов в отношении учета неопределенностей в задании модели объекта управления.
Основы современных подходов к оценке робастных свойств систем при возмущении коэффициентов характеристического полинома были заложены известной публикацией В.Л. Харитонова [55] доказательства теоремы, получившей его имя, которая позволила свести проверку гурвицево-сти семейства полиномов к исследованию четырех фиксированных полиномов. В мировой научной литературе она стала известна несколько позднее, после выхода в свет статьи [85].
В работе [101] была решена обратная задача: для заданного устойчивого характеристического полинома определить максимальный радиус шара в пространстве его коэффициентов, внутри которого сохраняется устойчивость замкнутой системы. Полученные результаты были обобщены в монографии [59], где рассматривается шар устойчивости в пространстве параметров при линейной зависимости коэффициентов полинома.
В настоящее время для анализа робастных свойств также широко применяются методы, основанные на использовании годографа Цыпкина-Поляка [102], а также теореме об отображении Заде и Дезоера [15], [109]. В качестве работ, где подробно изложен общий комплекс подходов к определению робастных свойств систем, следует указать [76], [100], [111].
Работы Г. Зеймса [ПО] определили новую парадигму, которая способствовала развитию Л-теории, предлагающей удобную трактовку неопределенностей в задании модели объекта, что позволяет рассматривать вопросы робастности в частотной области. Подробное изложение этого под-
хода представлено в ряде работ [72], [79], [84]. Интенсивные исследования в этой области в 1980-х годах позволили установить тесную связь между результатами современной теории управления и классическими частотными методами анализа и синтеза систем управления.
Особо необходимо упомянуть работы Д. Дойла [68-69], [74], [96], посвященные вопросам анализа робастных свойств систем со структурированными возмущениями, положившие начало так называемой ц-теории, в рамках которой предложено решение задачи робастного качества в виде метода DK-итераций. Этот подход получил развитие в монографии А. Ланзона [86], где предложены методы выбора и оптимизации весовых матричных функций в задаче робастного качества.
Вопросы робастности систем стабилизации плазмы отражены в работах [34-35], [58], [63-64], [87], [92]. Данная диссертация развивает полученные в них результаты.
Частотный подход к оценке границ робастной устойчивости SISO-систем
Конкретизируем основные понятия, связанные с анализом робастной устойчивости в частотной области для замкнутых систем с неструктурированными неопределенностями (немоделируемой динамикой). Наиболее просто это можно сделать на примере SISO-объекта управления со скалярным входом иєЕ1 и выходом уеЕ1, которые связаны между собой уравнением У = Рп( )и. (1.1.1) Здесь Рп (s) — номинальная передаточная функция объекта. Будем считать, что объект с математической моделью (1.1.1) стабилизируется регулятором u = -K(s)y (1.1.2) с передаточной функцией K(s), обеспечивающей гурвицевость характеристического полинома замкнутой системы (1.1.1), (1.1.2).
В дальнейшем будем полагать, что передаточная функция K(s) регулятора не изменяется в процессе функционирования, а передаточная функция P„(s) объекта подвергается воздействию неструктурированных возмущений непараметрического типа. В результате подобного воздействия, регулятор (1.1.2) фактически замыкает не объект с моделью (1.1.1), а другой объект, представляемый моделью y = P{s)u, (1.1.3) передаточная функция P(s) которого отличается от номинальной. Заметим, что при этом как структура (степени полиномов в числителе и знаменателе), так и коэффициенты передаточной функции P(s) не определены, что порождает типичную ситуацию, рассматриваемую в теории робастно-го управления.
В связи с наличием указанной неопределенности неструктурированного типа, возникают два естественных вопроса, ответы на которые позволяют оценивать качество стабилизирующего регулятора (1.1.2) в плане допустимости неконтролируемых вариаций математической модели объекта: — будет ли сохраняться устойчивость замкнутой системы при условии, что возмущение передаточной функции объекта находятся в заданных границах; — каковы предельно допустимые границы изменения возмущений, которые не приводят к потере устойчивости.
Поставленные вопросы относятся к области анализа меры робастной устойчивости линейных динамических систем. Для формализации рассмотрения проблемы, введем ряд понятий, позволяющих количественно характеризовать возмущения математических моделей вида (1.1.1).
Определение 3. Абсолютным возмущением математической модели (1.1.1) или абсолютным возмущением kA(s) номинальной передаточной матрицы Pn(s) будем называть рациональную дробь AA(s) = P(s)-Pn(s). (1.1.4)
Соответственно, относительным возмущением A0(s) модели или номинальной передаточной матрицы будем называть выражение \(s) = [P(s)-Pn(s)]Pn-\s). (1.1.5) И, наконец, взвешенным относительным возмущением A(s) моде ли или номинальной передаточной матрицы (или просто возмущением либо неопределенностью) будем называть рациональную дробь A(s) = [P(S)-PlXs)][Pn(sWd(s)r, (1.1.6) где Wd(s) - это заданная весовая дробно рациональная функция.
Введение весовой функции Wd{s) в определение возмущения (1.1.6) модели обусловлено следующими обстоятельствами. Рассмотрим амплитудно-частотные характеристики (АЧХ) Ап (со) = \Рп (у со) и Дсо) = Р(усо) для номинального и возмущенного объектов соответственно. Введем в рассмотрение допустимую границу возмущения номинальной математической модели, определяя ее ограничением сверху (для каждой частоты) величины модуля относительного изменения АЧХ положительным числом \Wd(j( )\ (в принципе, это число можно считать заданным в %). Иными словами, введение функции Wd (s) определяет условие И )-Й(ую) pn(j) \Wd(jco)\, VcoeR1.. (1.1.7) задающее допустимый «коридор» для вариаций АЧХ фактического (возмущенного) объекта (1.1.1), что изображено нарис. 1.1.1.
Таким образом, функция частоты \Wd (yco) - это относительная ширина допустимого коридора для АЧХ возмущенного объекта.
Обобщение подхода для МІМО-систем и методика сравнительного анализа регуляторов
Приведенная интерпретация частотного подхода к анализу робаст-ной устойчивости, которая была выполнена на базе системы со скалярными входными и выходными сигналами, допускает современную интерпретацию для более сложных систем управления с т управляющими входами и к измеряемыми выходами (МІМО системы).
Заметим, что для МІМО ситуации необходимо уточнить определения характеристик неопределённостей, которые ранее были приведены в первом параграфе.
Рассмотрим номинальный динамический объект с передаточной матрицей P„(s), вектором входов и є Ет и вектором выходов у є Ек, связанных уравнением у = Ря( )и. (1.2.1) Пусть объект (1.2.1) замкнут стабилизирующим регулятором u = -K(s)y (1.2.2) с заданной передаточной матрицей К( ).
Как и ранее будем считать, что матрица K(s) в процессе функционирования не изменяется, а модель объекта подвержена воздействию неструктурированных возмущений, т.е. регулятор (1.2.2) замыкает не номинальный объект (1.2.1), а реальный объект с возмущённой моделью У = Р( )и, (1.2.3) где передаточная матрица Р( ) отличается от номинала.
В прямой аналогии с предшествующим подразделом неопределенность модели может быть характеризовано следующими конструкциями: а) абсолютным возмущением Д» = Р( )-Р»; (1.2.4) б) относительным возмущением Р( ) = Р»(1,„+Д0( )), (1-2.5) где \т — единичная матрица размера тхт; в) взвешенным относительным возмущением р( )=р„ 00(1.+д( )\ад), (1.2.6) где Wrf(.s) -заданная весовая матрица.
Как и ранее, рассмотрим замкнутую систему М - Д с неопределённостью, включенной в обратную связь по мультипликативной схеме. Эта схема может быть укрупнена, как показано на рис. 1.2.1, где »ОД = -\адіод[і + РЛ ІОДҐР» , (1.2.7) I - единичная матрица размера к х к. Apis) I— ж ч Z w Mfs) Рис. 1.2.1. Неопределенность, включенная в обратную связь МІМО системы управления. Будем считать, что заданная передаточная матрица M(s) определена по формуле (1.2.7), а неизвестная передаточная матрица A(s) возмущения имеет специальную структуру. Эта структура в общем случае определяется возможным наличием как параметрической, так и неструктурированной неопределенности в математической модели объекта, и может быть пред ГА, ! о ставлена блочной матрицей Д = —і . Здесь Aj —это пх .пх диаго нальная матрица с постоянными комплексными компонентами, a A2(s) — п2 х пг дробно-рациональная матрица: они представляют параметрическую неопределенность и немоделируемую динамику соответственно.
В частном случае, когда пх = О (параметрическая неопределенность явно не выражена), обобщение частотного подхода для MIMO систем осуществляется на базе теоремы о малом коэффициенте усиления (Sandberg-Zames[110]):
Теорема 1.2.1. Система М-А, представленная нарис. 1.2.1, является устойчивой для любого устойчивого возмущения A(s), если справедливо следующее неравенство: а(А(у ш)) для всех а є [0,оо), (1.2.8) а(М(») где символ а обозначает максимальное сингулярное число, или lM( )L Однако в общем случае (для МІМО-систем) это утверждение было впервые расширено в работах J. Doyle [72], [74]. Позднее J. Doyle и другие существенно развили это направление в теории робастности, получившее в настоящее время наименование р, -подхода, в основе которого лежит следующее утверждение:
Оптимизационный частотный подход к синтезу робастных регуляторов для одного класса нелинейных систем
В практике решения задач управления различными динамическими объектами достаточно часто приоритетным требованием является обеспечение желаемых динамических характеристик замкнутой системы, таких как длительность переходного процесса Т и величина перерегулирования Р. При этом на этапе разработки качество оценивается по результатам имитационного моделирования на базе реальной нелинейной модели объекта управления.
В качестве опорной модели при решении задач управления, в том числе для управления плазмой в токамаках, часто используют линейные системы с учётом ограничений на величины управляющих воздействий ик (нелинейность типа «срезка» [37]), которые можно записать в виде (2.2.1) у = Cfxf +T fu + Erd, u = u0oSat(\). (2.2.2)
Здесь иєЕт - вектор управляющих воздействий, v є Ет - выходной сигнал регулятора, и0 є Ет — постоянный вектор ограничений управляющих сигналов, sat(-) - функция «срезки», у є Ек - вектор измерений, d = d(t) — внешнее возмущение, о— оператор покомпонентного произведения.
Поскольку наличие ограничений определяет нелинейность уравнений динамики, непосредственное использование такой модели для синтеза регулятора затруднительно. В связи с этим, синтез производится на базе линейной части системы (2.2.1), с предварительным выполнением необходимой балансировки и выделением полностью управляемой подсистемы [38], [103-104]: x = Ax + Bu + Fd, (2.2.3) y = Cx+Du + Ed. v J Стабилизирующий регулятор для объекта (2.2.3) будем искать в виде u = K(s)y, (2.2.4) отождествляя его в дальнейшем с передаточной матрицей К.
Пусть допустимые величины длительности переходного процесса и перерегулирования равны Г0 и Р0 соответственно. Выбор некоторого регулятора К = К даёт конкретные значения указанных характеристик, Т = Г(К ) и Р =Р(К ), определенных на движениях опорной модели (2.2.1),( 2.2.2). Сформируем вспомогательный функционал Fp(K) = a{\T(K)0\ + T(K)0} + b{\P(K)-P0\ + P(K)-P0}, (2.2.5) заданный на этих движениях, где а, Ъ — положительные константы. Заметим, что регулятор К будет обеспечивать желаемое качество процесса, если выполняется равенство F (К ) = О.
Для аналитического и численного синтеза стабилизирующего регулятора удобно использовать алгоритмы LQR-оптимизации [36], [103]. В классической LQR-задаче регулятор ищется из условия обеспечения минимума функционала /(К, у) = J[yrGy + urQu] , (2.2.6) о заданного на движениях линейной системы (2.2.3), (2.2.4), где элементы весовых матриц G = diag(gl,..., gk ) 0, Q = diag{qx,..., qm ) 0 можно трактовать как параметры для настройки регулятора и объединить в специальный вектор y = [gx,...,gk,ql,...,qm\&El+m {к + т -мерное евклидово пространство с положительными компонентами векторов). В результате, искомая передаточная матрица К = K(s,y) = arg min /(К,у) (2.2.7) КєСїк оптимального регулятора зависит от выбора вектора параметров у. Здесь QK - множество стабилизирующих регуляторов.
Как известно, при выполнении условий регулярности задачи LQR-оптимального синтеза [67], можно утверждать, что при всех ує +т существует оптимальный регулятор К(я,у), обеспечивающий устойчивость замкнутой линейной системы (2.2.3), (2.2.4). Введем в рассмотрение подмножество Q.aEl+m, элементами которого являются векторы параметров уєЕ++т, для каждого из которых соответствующий регулятор К( ,у) обеспечивает устойчивость нулевого положения равновесия опорной замкнутой системы (2.2.1),(2.2.4) с ограничениями (2.2.2). Условие О. Ф 0 гарантируется следующим утверждением:
Если выполнены условия регулярности задачи LQR-оптимального синтеза, то существует такой вектор параметров у = у и такие параметры vk, что регулятор K(s,y ) обеспечивает устойчивость нулевого положения равновесия нелинейной системы (2.2.1), (2.2.2), (2.2.4).
Действительно, условия регулярности гарантируют существование решения задачи LQR-оптимального синтеза при любых указанных векторах у для системы (2.2.3) с функционалом (2.2.6). При этом можно выбрать значения параметров qx,...,qm и vk так, чтобы на движениях системы (2.2.3), замкнутой регулятором K(s,y ) выполнялись неравенства uk(t) vk. Учитывая вид ограничений (2.2.2), можно утверждать, что управления для объекта (2.2.1), замкнутого тем же регулятором остаются в пределах ограничений (2.2.2).
Математическая модель плазмы как объекта управления
В качестве математической модели динамики плазмы в токамаке MAST рассмотрим LTI систему [88-91] x = Ax + Bu + Gd(0, e = Lx + Mu, (3.1.1) y = Cx + Du + Fd(0, где х є Е50 — вектор состояния плазмы, и sE5 - вектор управлений, є є Ер — вектор контролируемых переменных, у є Еп - вектор измерений, d є Emj — вектор внешних возмущений. Будем считать, что все матрицы, входящие в уравнения, имеют постоянные компоненты и заданы. Система (3.1.1) представляет собой модель объекта управления вблизи положения равновесия плазмы, полученная линеаризацией нелинейных уравнений динамики токов в окрестности этого положения.
Конструктивные особенности токамака, а также специфика моделируемого сценария разряда налагают строгие ограничения на допустимые величины управляющих сигналов, которые будем учитывать, вводя нелинейность в контур системы управления u = u0oSat(x), (3.1.2) .где v є Ет — выходной сигнал регулятора, и0 є Ет — постоянный вектор, задающий ограничения на величины управляющих сигналов, sat(-) — функция «срезки», - оператор покомпонентного произведения.
Наличие нелинейности существенно усложняет вопросы анализа и синтеза, поскольку исключает непосредственное использования методов теории линейных динамических систем. В связи с этим, наряду с нелинейной системой (3.1.1), (3.1.2) будем рассматривать линейную систему (3.1.1) при условии u = v, которая соответствует нахождению всех управляющих сигналов в пределах участков линейности функции «срезки».
Тем не менее, имитационное моделирование для оценки динамики, обеспечиваемой построенными регуляторами, будем проводить на базе нелинейной системы (3.1.1), (3.1.2). Качество динамических процессов будем оценивать количественно с помощью функционалов (длительность переходного процесса, перерегулирование и т.д.) заданных на движениях указанной системы и вычисленных по результатам имитационного моделирования соответствующих режимов.
Как было указано выше, неустойчивость плазмы в вертикальном направлении порождает одно собственное значение матрицы А линейной модели объекта, расположенной в открытой правой полуплоскости. Для стабилизации положения равновесия будем формировать регулятор по измеряемому выходу \ = К(р)у, p = dldt. (3.1.3)
Высокая размерность векторов состояния, управления и измерения, а также сложность технической реализации регуляторов, приводят к необходимости декомпозиции задачи управления на несколько более простых подзадач.
Для токамака MAST, в связи с его конструктивными особенностями (симметричное расположение управляющих электромагнитов), катушка вертикальной стабилизации Р6 (рис. Щ) практически не оказывает влияния на параметры формы и ток плазмы, а остальные катушки полоидаль-ной системы не оказывают воздействия на вертикальное положение плазмы. Это позволяет решать задачу вертикальной стабилизации автономно.
Вопрос об управлении током плазмы также можно решать в доста точной степени изолированно за счет использования центрального соленоида CS. При этом оставшиеся катушки полоидальной системы можно использовать для управления формой плазмы.
Таким образом, общая задача стабилизации плазмы в токамаке MAST декомпозируется на три независимые составляющие: задачу стабилизация вертикального смещения плазмы, задачу стабилизации её тока и задачу стабилизации параметров, определяющих форму поперечного сечения (плазменного центроида).
В результате решения указанных задач управляющее напряжение, подаваемое на управляющие катушки, представляется в виде суммы v = v1 + v2 + v3=Kw(Jp)y1+K (p)y2+ (/7) уз, (3.1.4) где Vj - управление, стабилизирующее вертикальное смещение, v2 — управление, стабилизирующее форму плазмы, v3 — управление, стабилизирующее ток плазмы. Здесь у15у2,у3 векторы измерений, формируемые из компонент вектора у, Kw{р),Ksh(р) и К р(р) - передаточные матрицы регуляторов вертикального положения, формы и тока соответственно.