Содержание к диссертации
Введение
1 Задачи и методы управления плазмой в термоядерных установках 32
1.1 Задачи идентификации и управления плазмой в токамаках и открытой магнитной ловушке 32
1.2 Методология комплексной разработки систем управления плазмой 40
1.2.1 Общая концепция разработки систем управления плазмой 40
1.2.2 Этапы комплексной разработки систем управления 42
1.3 Методы адаптации в автоколебательных системах управления 43
1.3.1 Адаптивные автоколебательные системы 43
1.3.2 Методы адаптации с автоколебаниями 50
1.4 Методы робастного управления 53
1.4.1 Сигналы и системы 53
1.4.2 Постановка задачи робастного управления 61
1.4.3 Методы решения проблемы //«, оптимизации 70
1.5 Выводы по главе 1 71
2 Идентификация моделей объектов и исполнительных устройств систем управления плазмой 73
2.1 Идентификация модели желобковых колебаний плазмы с релаксационными колебаниями плотности 73
2.1.1 Желобковая неустойчивость плазмы в установке Огра-3 73
2.1.2 Линейная модель одной моды желобковых колебаний плазмы . 75
2.1.3 Модель одной моды с релаксационными колебаниями плотности плазмы 79
2.2 Идентификация моделей горизонтальных и вертикальных смещений плазмы в токамаках 82
2.2.1 Концепция токамака 82
2.2.2 Модели плазмы в токамаке с распределением токов на камере S5
2.2.3 Идентификация модели горизонтального движения плазмы 88
2.2.4 Идентификация модели вертикального движения плазмы 99
2.2.5 Лемма и теорема о точности аппроксимации моделей 101
2.3 Линеаризация многосвязной модели формы и тока плазмы в ИТЭР 102
2.3.1 Задача управления плазмой в ИТЭР 102
2.3.2 Линеаризованная модель формы и тока плазмы в ИТЭР 105
2.4 Идентификация моделей исполнительных устройств 107
2.4.1 Идентификация моделей инверторов напряжения 107
2.4.2 Идентификация модели многофазного выпрямителя напряжения 111
2.5 Выводы по главе 2 111
3 Адаптивная автоколебательная система автоматической оптимизации плотности плазмы в открытой магнитной ловушке 114
3.1 Алгоритмы автоматической оптимизации систем с пороговым критерием качества 114
3.1.1 Способ автоматической оптимизации 114
3.1.2 Алгоритмы однопараметрической оптимизации 115
3.1.3 Алгоритмы многопараметрической оптимизации 117
3.2 Аналитическое исследование автоколебательных систем автоматической оптимизации с пороговым критерием качества 119
3.2.1 Оценка точности и быстродействия поиска 119
3.2.2 Доказательство сходимости поиска к локальному экстремуму пороговой функции качества 121
3.3 Автоматический оптимизатор для настройки угла фазирования 121
3.3.1 Постановка задачи 121
3.3.2 Блок-схема автоматического оптимизатора 122
3.3.3 Принцип действия автоматического оптимизатора 123
3.4 Результаты верификационных исследований системы автоматической оптимизации плотности плазмы в открытой магнитной ловушке, эксперименты на установке Огра-3 125
3.4.1 Временные диаграммы поиска 125
3.4.2 Результаты экспериментов на плоскости "плотность - угол фазирования" 126
3.5 Выводы по главе 3 128
4 Адаптивные системы непрерывного оценивания координатного возмущения и параметров модели плазмы в токамаках 130
4.1 Идентификатор состояния для непрерывного оценивания координатного
возмущения 130
4.1.1 Постановка задачи 130
4.1.2 Идентификатор состояния и ошибки оценивания 130
4.2 Адаптивные системы оценивания координатного возмущения и параметров модели плазмы 134
4.2.1 Непрерывное оценивание коэффициента усиления 134
4.2.2 Непрерывное оценивание постоянной времени 138
4.2.3 Совместное непрерывное оценивание параметров 142
4.2.4 Дискретное оценивание параметров 156
4.3 Физический смысл моделей смешения плазмы с сосредоточенными параметрами 163
4.3.1 Модель горизонтальных смещений плазмы 163
4.3.2 Модель вертикальных смещений плазмы 168
4.4 Модельная и экспериментальная верификация систем оценивания параметров плазмы 171
4.4.1 Моделирование системы оценивания параметров плазмы втокамакеТ-14 171
4.4.2 Эксперименты на токамаке Туман-3 176
4.5 Выводы по главе 4 179
5 Релейные системы управления положением плазмы в токамаках 182
5.1 Релейные автоколебательные системы управления горизонтальным положением плазмы в токамаках с линейными регуляторами 182
5.1.1 Постановка задачи, устойчивость и критерии качества управления 182
5.1.2 Система с ПД-регулятором токамака Т-14 185
5.1.3 Система с П-регулятором токамака Туман-3 197
5.2 Релейная автоколебательная система компенсации неконтролируемого возмущения 206
5.2.1 Синтез закона компенсации 206
5.2.2 Моделирование системы компенсации на моделях токамака Т-14 208
5.2.3 Эксперименты на токамаке Туман-3 210
5.3 Минимизация модуля ошибки стабилизации горизонтального положения плазмы токамака в релейной автоколебательной системе со стационарным регулятором 216
5.3.1 Постановка задачи 216
5.3.2 Блок-схема системы управления ТВД 217
5.3.3 Эксперименты на установке ТВД 219
5.4 Релейная система управления неустойчивым вертикальным положением плазмы в токамаке 223
5.4.1 Постановка задачи 223
5.4.2 Область управляемости 223
5.4.3 Оптимизация фазовых ограничений 226
5.4.4 Применение результатов оптимизации в ИТЭР 230
5.5 Выводы по главе 5 232
6 Адаптивные системы минимизации амплитуды автоколебаний смещений плазмы в токамаках 234
6.1 Оптимальные автоколебания в релейных системах с апериодическими объектами второго порядка 234
6.1.1 Постановка задачи 234
6.1.2 Структурные схемы объектов 235
6.1.3 Уравнения фазовых траекторий 237
6.1.4 Фазовое пространство разомкнутых систем 239
6.1.5 Оптимальные кривые автоколебаний и законы управления 241
6.2 Система адаптивной минимизации амплитуды автоколебаний входной
величины устойчивого объекта 256
6.2.1 Постановка задачи 256
6.2.2 Синтез и исследования алгоритма адаптации без возмущения 257
6.2.3 Предельный цикл в системе второго порядка 262
6.2.4 Синтез алгоритма адаптации с аддитивным возмущением 267
6.3 Существование и единственность оптимальных замкнутых кривых автоколебаний 271
6.4 Эксперименты на токамаке Туман-3 277
6.5 Выводы по главе 6 280
7 Робастная многосвязная система управления формой и током плазмы в токамаке-реакторе ИТЭР 283
7.1 Постановка задачи управления формой и током плазмы в ИТЭР 283
7.1.1 Системы управления в ИТЭР 283
7.1.2 Технические требования к системе управления 284
7.1.3 Методология разработки регуляторов обратной связи в ИТЭР 288
7.2 Синтез и сравнительный анализ робастного Н» регулятора 289
7.2.1 //«регулятор нормализованной взаимно-простой факторизации 289
7.2.2 Нелинейный блок коррекции полной мощности 292
7.2.3 Наорегулятор //-синтеза 293
7.2.4 Линейно-квадратичный регулятор 295
7.3 Моделирование систем управления 297
7.3.1 Моделирование на линейных моделях 297
7.3.2 Влияние эффекта насыщения обмоток полоидального поля 299
7.3.3 Сравнение систем управления 303
7.3.4 Моделирование на нелинейной модели объекта 309
7.3.5 Качество управления при возмущениях типа ELMs 313
7.4 Разработка системы управления током, положением и формой плазмы в
ITER-FEAT 314
7.4.1 Токамак ITER-FEAT 314
7.4.2 Структурная схема блок-диагональной системы управления 315
7.4.3 Скалярный И» регулятор скорости вертикальных смещений плазмы 319
7.4.4 Робастность скалярной системы управления 325
7.4.5 Многомерный Н*, робастный регулятор формы и тока плазмы 332
7.4.6 Робастность многомерной системы управления 343
7.4.7 Сравнение регуляторов 346
7.5 Выводы по главе 7 347
Заключение
Оглавление 6
1 Основные результаты диссертационной работы 351
2 Актуальные задачи управления плазмой в термоядерных установках 352
Литература
- Общая концепция разработки систем управления плазмой
- Линейная модель одной моды желобковых колебаний плазмы
- Идентификация модели вертикального движения плазмы
- Аналитическое исследование автоколебательных систем автоматической оптимизации с пороговым критерием качества
Введение к работе
^
Проблема управляемого термоядерного синтеза (УТС), исследования по которой были начаты' в начале 50-х годов прошлого столетия, является одной из центральных в науке и технике. Решение данной проблемы откроет новый, безопасный, практически неисчерпаемый источник" энергии от синтеза ядер легких элементов. В нашей стране исследования по проблеме УТС были начаты и организованы академиком И. В. Курчатовым.
Идея термоядерного реактора была предложена академиками А.Д. Сахаровым и И.Е. Таммом, основанная на удержании плазмы в магнитном поле при нагреве ее до достаточно высокой температуры. В решении проблемы УТС наибольший прогресс имеют токамаки: тороидальные камеры с магнитными катушками. Направление токамаков получило развитие в нашей стране под руководством академика Л.А. Арцимовича, а затем распространилось по всему миру. Первые токамаки имели круглое поперечное сечение и были предназначены для широкомасштабного исследования физики высокотемпературной плазмы: Т-3, Т-4, Т-7, ТО-1, Т-10, Т-11, Т-15, Туман-3 (РФ), PLT, TFTR (США), TORE-SUPRA (Франция), TEXTOR-94 (Германия), FT-U (Италия) и др. Создан токамак Т-14 (РФ) для двойного адиабатического сжатия по малому и большому радиусам.
Последующее поколение токамаков имеет особенность, состоящую в вытянутости по вертикали поперечного сечения, что дает возможность повысить давление плазмы и увеличить нагрев собственным током. Платой за эти преимущества является неизбежная неустойчивость плазмы по вертикали. Тем не менее, токамаки с вытянутой по вертикали плазмой являются в настоящее время основной экспериментальной базой в УТС: JET (Европа), JT-60U (Япония), ASDEX UPGRADE (Германия), DIII-D (США), COMPASS-D (Англия), TCV (Швейцария), ТВД (РФ).
Прогресс токамаков оценивается параметром пТт (п - плотность, Т -температура, г - время удержания плазмы), который при решении проблемы УТС монотонно возрастал и приблизился к своей критической величине (критерий Лоусона), при которой происходит самоподдерживающаяся термоядерная реакция. В 80-х годах 20-го столетия началось международное сотрудничество между Европейским Сообществом, РФ, США и Японией по проектированию Международного экспериментального термоядерного реактора-токамака: ИТЭР (International Thermonuclear Experimental Reactor - ITER). Миссией ИТЭРа является демонстрация научной и технологической осуществимости использования термоядерной энергии для мирных целей.
В 60-х годах 20-го века для удержания плазмы в магнитных ловушках стали применяться, а затем стали играть существенную роль в УТС,
' ..- ЛЙОКАЛЬНАЯ
' bfriGJSHOTEKA
і С. Петербург/r/rf
5 РЭ ЩРшг/Щ .
системы автоматического управления с обратной связью. Это направление было начато в 1967-1968 годах в экспериментах на открытой ловушке с магнитными пробками ОГРА-2 в Институте атомной энергии им. И.В.Курчатова (В.В. Арсенин, В.А. Чуянов). На ОГРА-2 были подавлены желобковая (МГД) и ионно-циклотронная (кинетическая) неустойчивости плазмы. Затем системы управления получили распространение для подавления других неустойчивостей: дрейфовых, ионизационных, винтовой неустойчивости в токамаках, стабилизации в- пинчей и т. п.
В токамаках на начальном этапе основной задачей управления являлась стабилизация положения плазменного шнура по большому радиусу посредством полоидального магнитного поля. Первые эксперименты по решению этой задачи были проведены в 1971 г. на токамаке ТО-1 совместно сотрудниками ИАЭ (Л.И. Артеменков, И.Н. Головин и др.) и Института кибернетики АН УССР (Ю.И. Самойленко, В.Ф. Губарев и др.) с применением импедансного регулятора. На современных токамаках применяется комбинированное управление равновесием плазмы: программное управление используется для обеспечения сценария, а коррекция положения плазмы осуществляется маломощной системой обратной связи. Такие системы стали штатными и нашли применение для ортогонально развязанной стабилизации устойчивого горизонтального и неустойчивого вертикального положения плазмы в токамаках. Затем этот подход стал применяться для управления формой и током вытянутой по вертикали плазмы посредством ряда обмоток полоидального магнитного поля и объект управления стал принадлежать классу многосвязных динамических объектов, к каковым относится плазма в ИТЭР.
Эксперименты на токамаках показали, что основные параметры плазмы, непосредственно обеспечивающие условия для зажигания термоядерной реакции, исключительно чувствительны даже к небольшим смещениям внешней магнитной поверхности плазменного шнура по отношению к камере или диафрагме, ограничивающей шнур. При этом, в частности, было установлено, что от точности регулирования равновесия в значительной степени зависят приграничная теплопроводность, интенсивность поступления вредных примесей в плазму, потеря частиц плазмы, температура и энергетическое время жизни. Для эффективного использования внутреннего пространства вакуумной камеры токамаков, а также для снижения инкрементов неустойчивых смещений вьггянутой по вертикали плазмы, положение границы плазмы стабилизируется как можно ближе к первой стенке, и малейший сбой системы управления, например, при действии возмущений типа малого срыва, может привести к расплавлению камеры. Нарушение герметичности камеры ведет к мощному выбросу энергии плазмы наружу, возникновению больших механических
нагрузок и повреждению термоядерной установки. Такие сбои не допустимы для будущего термоядерного реактора. Качество систем управления во многом будет определять его надежность и стоимость.
Только высокоорганизованные системы управления с обратной связью способны обеспечить наилучшие параметры плазмы в течение формирования разряда и фазы горения с выделением термоядерной энергии при автоматической стабилизации ее мощности. Детально разработанные интегрированные системы магнитного и кинетического управления плазмой в термоядерных реакторах-токамаках могут реально обеспечить их высокую конкурентоспособность по сравнению с другими источниками энергии. Поэтому в УТС к устойчивости и качеству систем управления плазмой в термоядерных установках имеется повышенное внимание.
Отсюда возникает постановка задачи подробного изучения процессов, протекающих в высокотемпературной плазме при ее управлении, создания адекватных динамических моделей плазмы, разработки и исследования методов и систем для достижения наилучших режимов управления плазмой в магнитных ловушках как сложного, распределенного в пространстве, нелинейного динамического объекта с неопределенностями, подверженного воздействию неконтролируемых координатных и параметрических возмущений.
Классические системы управления, имеющие наибольшее распространение на термоядерных установках, не предназначены для решения данной задачи. Это связано с тем, что классические регуляторы синтезируются для управления одним объектом с известными структурой и параметрами без неопределенности, поэтому они не позволяют достигнуть наилучших показателей качества управления и запаса устойчивости замкнутых систем управления плазмой. В этой связи для повышения эффективности и надежности управления плазмой в термоядерных установках целесообразно применять адаптивные автоколебательные и робастные системы управления.
Если имеется возможность измерять или оценивать возмущения, действующие на объект, то применение адаптивного управления позволяет непрерывно приспосабливаться к возмущениям, реализуя возможность достижения оптимальных режимов управления с расширением запаса устойчивости. Во многих случаях процесс адаптации удачно совмещается с автоколебаниями в нелинейных системах с обратной связью, которые позволяют одновременно идентифицировать объект в темпе наблюдений и оптимально управлять им. Автоколебательные системы имеют широкое распространение в технике и природе: различные ламповые и полупроводниковые генераторы, часовые механизмы, поршневые двигатели и т. д., а также системы в живых организмах, обеспечивающие, например,
устойчивые автоколебания сердца и легких. Наибольший вклад в развитие теории нелинейных колебаний внесли как зарубежные ученые - Льенар, Пуанкаре, Ван-дер-Поль, Баргаузен и др., так и российские - Л.И. Мандельштам, Н.Д. Папалекси, А.А. Андронов, Н.М. Крылов, Н.Н. Боголюбов, Е.П. Попов и др.
Класс технических адаптивных систем имеет более короткую историю, чем автоколебательные системы. Начало активного его развития связано с разработкой автопилотов для летательных аппаратов в начале 50-х годов 20-го столетия. Адаптивные системы продолжают активно развиваться и находят практическое применение во многих технических областях для управления различными динамическими объектами: самолетами, ракетами, судами, судовыми и дизельными двигателями, электроприводами, промышленными роботами, металлорежущими станками, энергосистемами, прокатными станами, химическими реакторами и т. д. Имеется много прикладных и теоретических работ в этой области, из которых очевиден значительных вклад специалистов нашей страны: А.А. Фельдбаума, ЯЗ. Цыпкина, Б.Н. Петрова, В.Ю. Рутковского, С.Д. Землякова, В.В. Солодовникова, Л.Н. Фицнера, В.А. Якубовича, А.Л. Фрадкова, А.С. Позняка и многих других в решении проблемы адаптации.
Если нет возможности получать информацию о возмущениях в темпе наблюдений, то в этом случае эффективно применение робастного управления1. Оно дает возможность управлять с помощью одного динамического регулятора с постоянными параметрами множеством (ансамблем) объектов. При этом минимизируется чувствительность замкнутой системы к действию внешних возмущений и обеспечивается устойчивость системы при неопределенности в объекте. Робастная система по постановке задачи ее синтеза устойчива для любого представителя множества объектов, задаваемого неопределенностью. Теория робастного управления (Н„ теория) берет свое начало из 80-х годов 20-го века. Она обязана своим становлением зарубежным специалистам таким как Дж. Зеймс, М. Сафонов, Дж. Дойл, К. Гловер, Б.А. Фрэнсис, М. Видьясагар, X. Кимура, Д. Лаймбиа, К. Зу и др. Российские ученые В. Харитонов, ЯЗ. Цыпкин, Б.Т. Поляк, А.П. Курдюков и др. также внесли вклад в различные направления продолжающей бурно развиваться робастной теории управления.
Актуальность темы. Необходимость ускорения решения проблемы УТС все более возрастает из-за того, что сейчас более 86% от полной
Управление при наличии неопределенности называется робастным. Робастные системы слабо чувствительны к неточностям в априорных предположениях. Robust (англ.) - надежный, устойчивый к ошибкам.
используемой человечеством энергии производится за счет сжигания природных ресурсов: угля, газа и нефти. При этом происходит непрерывное накопление углекислого газа в атмосфере, что вызывает нарушение энергобаланса Земли и, по оценке экспертов, может привести к необратимым климатическим последствиям за время сравнимое с жизнью одного поколения. Возможным выходом из сложившейся ситуации является изменение энергетической системы нашей цивилизации, в которой основной вклад может давать термоядерная энергия без загрязнения окружающей среды. В этой связи исключительно актуальным в решении проблемы УТС является разработка высококачественных систем автоматического управления термоядерными установками, которыми являются адаптивные автоколебательные и робастные системы управления.
Целью работы является комплексная разработка и применение адаптивных автоколебательных и робастных систем управления для удержания горячей плазмы в магнитном поле термоядерных установок (типа токамаков и открытых магнитных ловушек) с предельно высокими показателями качества управления в переходных и квазистационарных режимах, обеспечивающих требуемый запас устойчивости.
Методы исследования. Для синтеза и анализа замкнутых систем управления плазмой в термоядерных установках использованы
математические методы линейной (в частности, Яда) и нелинейной теории управления, теории обыкновенных дифференциальных уравнений и функционального анализа. Для верификации полученных теоретических результатов применялся метод вычислительного эксперимента с использованием современной технологии математического моделирования и метод научного физического эксперимента на действующих термоядерных установках.
Научная новизна результатов проведенных исследований состоит в следующем:
-
Поставлен и решен оригинальный цикл научно-технических задач управления равновесием и устойчивостью высокотемпературной плазмы в магнитном поле.
-
Построены новые адекватные модели объектов и исполнительных устройств, являющихся ключами в эффективном решении поставленных задач управления плазмой и проведенных научных исследованиях.
-
Впервые предложены, разработаны и исследованы методы адаптации с автоколебаниями для управления плазмой в токамаках и открытых магнитных ловушках.
-
Применение современной Ноо теории управления, нелинейных методов синтеза и современного математического обеспечения MATLAB
позволило автору впервые разработать и исследовать многосвязные
робастные системы управления положением, формой и током плазмы в
ИТЭР в условиях разброса магнитных конфигураций плазмы для двух
версий ИТЭР (ITER с самоподдерживающейся термоядерной реакцией,
Q=co; ITER-FEAT с поддерживаемым горением, Q>10).
5. Новизна технических решений, примененных при разработке методов и
структур адаптивных автоколебательных систем, подтверждена 9-ю
авторскими свидетельствами и отражена в актах о внедрении и отзывах
ведущих зарубежных специалистов ИТЭР.
Практическая значимость. Внедрение новых методов адаптации с
автоколебаниями и Нх теории позволило существенно продвинуться в
практическом достижении оптимальных режимов управления
высокотемпературной плазмой с повышенным запасом устойчивости, что
приводит к повышению качества и надежности работы термоядерных
установок. Получены основные оценки показателей качества управления
автоматических систем, а также получены новые знания о поведении
плазмы в системах с обратной связью на ряде термоядерных установок из
класса магнитных ловушек:
ИТЭР Международный экспериментальный термоядерный
реактор (Фаза технического проектирования, г. Нака,
Япония)
ТУМАН-3 Тороидальная установка с магнитным адиабатическим
нагревом (ФТИ им. А.Ф. Иоффе, г. Санкт-Петербург)
Т-14 Токамак с сильным полем (ФИАЭ, г. Троицк, Московская
область)
ТВД Токамак вытянутый с дивертором (ИАЭ им. И.В.
Курчатова)
ОГРА-3 Открытая магнитная ловушка (ИАЭ им. И.В. Курчатова, г.
Москва) Результаты, полученные автором в проекте ИТЭР, а также результаты, полученные Российской национальной командой под руководством автора, включены в Финальный Документ по проекту; их значимость и новизна отражены в отзывах руководства ИТЭР. Завершение инженерной фазы проекта ИТЭР разработкой полной технической документации для создания токамака-реактора по двум его версиям является значительным вкладом мирового сообщества в ускорение научно-технического прогресса, касающегося практического решения проблемы УТС.
Связь с государственными планами научных исследований. Результаты научных исследований, разработок методов и систем автоматического управления, приведенные в диссертации, связаны с темами, выполненными в Институте проблем управления РАН в
соответствии с планами научных исследований АН СССР и Министерства приборостроения, средств автоматизации и систем управления СССР. Научные исследования, проведенные в диссертационной работе по проблеме УТС, выполнены в соответствии с Постановлениями Совета Министров СССР и Координационным планом по Государственной научно-технической программе "УТС и плазменные процессы", а также в соответствии с договорами о научно-техническом сотрудничестве и хозяйственными договорами между ИПУ и ИАЭ, ФИАЭ им. И. В. Курчатова, ФТИ им. А. Ф. Иоффе, НИИЭФА им. Д.В. Ефремова, Министерством РФ по атомной энергии. Работы по управлению плазмой в ИТЭР, результаты которых вошли в диссертацию, проводились в соответствии с Международным соглашением между Европейским Сообществом, Российской Федерацией, США и Японией по разработке и созданию ИТЭР.
На защиту выносятся результаты комплексной разработки и применения базовых систем управления плазмой в термоядерных установках, решения задачи идентификации плазмы и задачи оптимизации фазовых ограничений:
-
Адаптивная автоколебательная система автоматической оптимизации плотности плазмы в открытой магнитной ловушке
-
Идентификация модели горизонтального движения плазмы в токамаке с распределением токов на камере динамическим звеном низкого порядка
-
Адаптивные системы совместного оценивания в темпе наблюдения координатного возмущения и параметров плазмы в токамаках
-
Адаптивная автоколебательная система компенсации координатного неконтролируемого возмущения при стабилизации положения плазмы в токамаках
-
Адаптивные системы минимизации амплитуды автоколебаний смещений плазмы в токамаках
-
Оптимизация фазовых ограничений неустойчивого объекта: вытянутой по вертикали плазмы в токамаках
-
Автоколебательная система стабилизации положения плазменного шнура в вытянутом по вертикали токамаке с дивертором с оптимальными параметрами линейного регулятора
-
Робастные многосвязные системы управления положением, током и формой плазмы в Международном термоядерном экспериментальном токамаке-реакторе ИТЭР с Q=a> и Q>10
Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на следующих научно-технических конференциях, симпозиумах, совещаниях и семинарах по автоматическому управлению и УТС:
П, Ш Всесоюзные конференции по инженерным проблемам термоядерных реакторов (г. Ленинград, 1981,1984)
X, XIV Европейские конференции по УТС и физике плазмы (г. Москва, 1981, г. Мадрид, Испания, 1987)
Всесоюзные конференции по физике горячей плазмы (г. Звенигород, 1984, 1985)
" X Всесоюзное совещание по проблемам управления (г. Алма-Ата, 1986)
Международный семинар ИФАК по оценке методов адаптивного управления, используемых в прикладных задачах (г. Тбилиси, 1989)
V Ленинградский симпозиум по теории адаптивных систем (г. Ленинград, 1991)
Международный семинар по устойчивости и колебаниям нелинейных систем управления (г. Москва, ИПУ, 1992)
Международная конференция по автоматике, робототехнике и компьютерному зрению, ICARCV94 (г. Сингапур, 1994)
Международный аэрокосмический конгресс, 1АС'94 (г. Москва, 1994)
Международные совещания по разработке магнитной полоидальной системы ИТЭР и системы управления положением, током и формой плазмы (г. Сан-Диего, ИТЭР, США, 1996, 1998; г. Гархинг, ИТЭР, Германия, 1997; г. Нака, ИТЭР, Япония, 1997)
Международные симпозиумы по технологии термоядерного синтеза, SOFT '96, SOFT '98 (г. Лиссабон, Португалия, 1996, г. Марсель, Франция, 1998)
Международный семинар по применению Я» теории управления в ИТЭР (г. Токио, Токийский университет, Япония, 1998)
Международная конференция по проблемам управления, посвященная 60-летию Института проблем управления РАН (г. Москва, ИПУ, 1999)
36-я и 40-я Международные Конференции по принятию решений и
управлению, CDC'97, CDC01 (Калифорния, г. Сан Диего, США, 1997,
Флорида, г. Орландо, США, 2001)
Публикации. Автором опубликовано 94 работы, из них по теме диссертации - 84 печатных работы. Основные результаты опубликованы в монографии издательства "Наука", в ведущих отечественных и международных журналах: Автоматика и телемеханика (Перевод на англ.: Automation and Remote Control); Журнал технической физики; Вопросы атомной науки и техники, серия: Термоядерный синтез; Измерения, контроль, автоматизация; Plasma Devices and Operations; Fusion Engineering and Design; International Journal of Control; а также в трудах международных и национальных конференций [1-40].
Структура и объем работы. Диссертация состоит из введения, семи глав, заключения, списка цитируемой литературы из 176 наименований и приложения с актами о внедрении. Работа содержит 398 страниц, включает 131 рисунок и 21 таблицу.
Общая концепция разработки систем управления плазмой
Комплексная разработка систем управления плазмой включает в себя целый набор различных этапов, которые выполняются, как правило, параллельно-последовательно, а иногда и циклически для достижения желаемого результата. Изучение объекта управления по литературным источникам, методом обсуждения с физиками-теоретиками и физиками-экспериментаторами, с разработчиками исполнительных устройств и диагностики. Постановка задачи управления на содержательном уровне, определение основной цели. Постановки и выработка целей декомпозированных задач управления. Построение моделей составляющих блоков полного объекта управления (постановка и решение задачи идентификации или задачи линеаризации): плазмы в термоядерных установках, исполнительных и диагностических устройств. Разработка методов управления. Разработка (синтез) управляющих устройств (регуляторов): принципов действия, структур, организации, иерархии. Анализ замкнутых систем с разработанными управляющими устройствами: а Методом математического моделирования на моделях, полученных на этапе идентификации; Задачи и методы управления плазмой в термоядерных установках а Методом математического моделирования на моделях с распределенными параметрами - численный эксперимент; а Аналитическими методами теории автоматического управления. Реализация быстродействующих управляющих устройств на аналоговых и цифровых элементах. Реализация алгоритмов управления для больших термоядерных установок на современной компьютерной технике. Анализ систем управления с быстродействующими управляющими устройствами на электронных моделях в реальном времени. Внедрение разработанных управляющих устройств в практику физического эксперимента на действующих термоядерных установках. Коррекция решения промежуточных задач.
Методы адаптации в автоколебательных системах управления
Разработанные и исследованные в диссертации адаптивные автоколебательные системы (ААС) принадлежат пересечению двух обширных классов систем: автоколебательных и адаптивных. Системы класса ААС имеют, естественно, свойства данных классов систем, поэтому вначале приводятся краткие характеристики этих классов, а затем рассматриваются характерные свойства ААС. В заключение этого раздела описываются методы адаптации с автоколебаниями, предложенные в диссертационной работе.
Адаптивные автоколебательные системы Автоколебательные системы имеют широкое распространение в технике и природе. Примерами таких систем могут быть различные ламповые и полупроводниковые генераторы, часовые механизмы, поршневые двигатели и т. д., а также системы в живых организмах, обеспечивающие, например, Задачи и методы управления плагмон в термоядерных установках 44 устойчивые автоколебания сердца и легких [93]. Возможно, что такое широкое распространение автоколебательных систем связано с фундаментальной ролью принципа обратной связи в живой и неживой, природе [94], а также с нелинейностью, как правило, всех протекающих в ней процессов. Известно, что для возникновения устойчивых автоколебаний необходимо наличие нелинейного элемента, обратной связи и внешнего источника энергии [93, 95].
Термин "автоколебания" был введен в 1928 г. А.А. Андроновым. Под автоколебаниями понимаются незатухающие колебания, которые могут, существовать в системе при отсутствии переменного внешнего воздействия, причем амплитуда и период колебаний определяются свойствами самой системы, а не начальными условиями [95]. Приставка "авто" означает, что автоколебания возникают в самой системе и не вызываются внешними воздействиями. У вынужденных же колебаний амплитуда и период определяются характером внешнего воздействия. Автоколебания также отличаются от свободных колебаний, которые постепенно затухают, а их амплитуда зависит от возмущения по начальным условиям. В автоколебательных системах целой область начальных условий соответствует одна и та же амплитуда незатухающих колебаний, причем периодический процесс создается непериодическим источником энергии.
Примеры исследования различных автоколебательных явлений известны на протяжении трех веков в различных областях естествознания и техники [96], но общая теория нелинейных колебаний начала складываться.только с начала XX века. Первые наиболее значительные результаты были получены зарубежными исследователями: Ван-дер-Полем, Баргаузеном, Льенаром и др. Наибольший вклад в развитие теории нелинейных колебаний внесли российские ученые: Л.И. Мандельштам, Н.Д. Папалекси, А.А. Андронов, Н.М. Крылов, Н.Н. Боголюбов, Е.П. Попов и др.
Линейная модель одной моды желобковых колебаний плазмы
В ловушках с магнитными пробками магнитное поле спадает от оси ловушки по радиусу. В спадающем магнитном поле ионы и электроны испытывают азимутальный дрейф в противоположные стороны. В плазме как бы существуют две жидкости - ионная и электронная, текущие в противоположные стороны по азимуту. До тех пор, пока плазма имеет цилиндрическую симметрию, и направление дрейфа остается перпендикулярным градиенту плотности, этот дрейф не приводит к каким-либо видимым последствиям. Однако любое малое нарушение цилиндрической симметрии приводит к образованию пространственного заряда, появлению азимутального электрического поля и дрейфу плазмы как целого в радиальном направлении в этом поле, как желобка, вытянутого вдоль оси z по поверхности плазмы. Причем направление дрейфа желобка оказывается таким, что первоначальное возмущение усиливается возникает неустойчивость.
Ее можно устранить, если вблизи поверхности плазмы поместить электроды и, обнаружив разделение зарядов в плазме, с помощью внешней системы обратной связи менять заряды на этих электродах таким образом, чтобы суммарное электрическое поле плазменных и внешних зарядов изменило направление. Тогда возникающий радиальный электрический дрейф будет подавлять, первоначальное возмущение.
С помощью фиксированной внешней электродной структуры с конечным числом электродов нельзя подавить произвольное возмущение на поверхности плазмы. В реальной ситуации, однако, в плазму возбуждаются не произвольные, а некоторые степени свободы, причем неустойчивы лишь самые длинные из возможных азимутальных волн. Поэтому их удается стабилизировать с помощью конечного числа внешних электродов. В установке Огра-3 применен модальный подход [4], при котором возмущения на поверхности плазмы анализировались с помощью пространственного Фурье-анализа. Выделенные таким образом возмущения соответствующим образом преобразовывались, усиливались и из них с помощью пространственного Фурье-синтеза формировались управляЕОЩие напряжения.
На рис. 2.1 показана система стабилизации, состоящая из измерительных элементов - датчиков возмущений электрического поля в плазме, управляющего устройства и органов управления - электродов. Управляющее устройство, распределяющее потенциалы электродов в соответствии с возмущениями плазмы, содержит блоки пространственного Фурье-анализа и Фурье-синтеза. Эти блоки, являющиеся матрицами операционных усилителей, позволяют выделить и воздействовать в отдельности на каждую азимутальную моду т желобковых колебаний с помощью соответствующего канала стабилизации.
Линейная модель одной моды желобковых колебаний плазмы
При решении задач о желобковых колебаниях плазмы и их стабилизации потенциал возмущения раскладывается по собственным функциям задачи. В экспериментальных установках плазма имеет цилиндрическую симметрию. Учет ограниченности системы вдоль магнитного поля (оси z) обычно несущественен. Поэтому собственные функции имеют вид VSm\r,0j) = Pmv)eJm0 JeJ, где в- азимутальный угол, т -номер азимутальной моды \т \). Такая волна имеет вид желобка, вытянутого вдоль оси ловушки. Полный потенциал возмущения является суммой по всем азимутальным модам т от -со до + х : т=-ко Ч/\Г ч= /_JPт\ "J). Вид радиальной части (Рту) определяется из решения конкретной задачи. Он зависит от распределения плотности плазмы по радиусу. Система линеаризованных уравнений движения и непрерывности для электронной и ионной компонент и уравнения Пуассона для потенциала сводится к одному уравнению для радиальной части потенциала # „,(/") где р(со) - оператор плотности заряда. Это уравнение, при определении Р\со) из уравнений движения и непрерывности (сохранения числа частиц), дает возможность найти дисперсионное уравнение, связывающее частоты мод желобковых колебаний плазмы и волновые числа F(co,m)=0. (2.1.2)
Уравнение (2.1.1) второго порядка, поэтому для получения дисперсионного уравнения (2.1.2) оно дополняется двумя граничными условиями. Одно такое условие - ограниченность решения при г=0\ # (0) со. В качестве другого граничного условия на окружающей плазму поверхности радиуса b принимается соотношение p(b) = W(jco,m}p(a), (2-1.3) где а — радиус плазмы, W\jco,m) - комплексный коэффициент передачи линейного регулятора обратной связи. Если принять резкую границу распределения плотности плазмы п по радиусу dnldr = -n0S\r-a), 0 a b, где п0 - значение плотности на оси, то из дисперсионного уравнения (2.1.2) можно найти передаточную функцию одной моды [4, 29, 27]
Идентификация модели вертикального движения плазмы
В проекте ИТЭР было предложено управлять границей плазмы в диверторной конфигурации (Х-точка с одним нулем) посредством управления расстоянием (в дальнейшем называемым "щелями") между сепаратрисой и первой стенкой в шести различных точках. Поперечное сечение плазмы, расположение 9-ти обмоток полоидального магнитного поля (PF1-PF9), центрального соленоида (CS), а также расположение управляемых щелей (зазоров) между плазменной границей и поверхностью окружающих элементов представлены на рис. 2.10. Типовые отклонения сепаратрисы он заданного положения должны находиться в пределах ± 10 см, что меньше, чем 5% от большого радиуса плазмы. Щели, показанные на рисунке, выбраны для обеспечения хорошего общего управления формой и, в то же время, для точного управления ключевых точек, таких как диверторных ударных точек (g/, g2) и границей плазмы перед ионно-циклотронной радиочастотной нагревающей антенной (gi). Все катушки полоидального поля являются сверхпроводящими и имеют относительно малую площадь поперечного сечения. Каждая катушка управляется преобразователем переменного тока в постоянный ток (AC/DC converter) и вся система полоидальных полей имеет полную установочную мощность около 3 GVA.
Сценарий работы ИТЭР включает следующую последовательность фаз: плазменный старт и рост плазменного тока, диверторное (Х-точка) формирование, нагрев до зажигания, непрерывное управляемое горение, управляемое снижение термоядерной мощности и плазменного тока, прекращение существования Х-точки, плазменное выключение (прекращение разряда). Требуемая эволюция плазменной конфигурации создается программным изменением полоидальных токов (программная компонента) и добавлением управления обратной связи. Для простоты можно определить две основные фазы, которые в наибольшей степени отличаются с точки зрения требования к управлению: Идентификация моделей объектов и исполнительных устройств систем управления плазмой [ 05 лимитерная фаза, характеризуемая ограниченной лимитером плазмой с относительно низким содержанием тепловой и магнитной энергии: требования к управлению не являются очень жесткими в течении такой фазы и, в основном, необходимо только подавление вертикальной неустойчивости плазмы; диверторная (одно-нулевая) фаза, в течение которой высокое содержание тепловой и магнитной энергии представляет потенциальную опасность сохранению внешнего слоя плазмы и окружающих ее элементов; на этой фазе необходимо точное управление формой плазмы.
Линеаризованная модель формы и тока плазмы в ИТЭР
В диссертации внимание уделяется разработке управляющего устройства обратной связи для формы и тока плазмы в течение диверторной фазы сценария работы ИТЭР, когда требования к управлению исключительно жесткие. Для синтеза и анализа систем управления плазмой в ИТЭР использовались линеаризованные модели формы и тока плазмы. Они получались домашними командами ИТЭР посредством процедуры линеаризации относительно рефренсных плазменных магнитных конфигураций нелинейных плазмофизических кодов. При этом в кодах использовалось разбиение проводящих структур на ряд магнитно-взаимосвязанных контуров, расположенных в горизонтальной плоскости и пронизываемых полоидальными потоками, включая плазменный виток. Для описания равновесия плазмы использовалось уравнение Грэда-Шафранова [3, 153].
Динамика токов в обмотках полоидальных полей и в металлических структурах описывается векторным уравнением dVldt + RI = V, (2.2.20) где Р - вектор магнитных потоков, связанных с каждым контуром, R -диагональная матрица активных сопротивлений, V - вектор напряжений, Идентификация моделей объектов и исполнительных устройств систем управления плазмой 106 включающий в себя напряжения на обмотках полоидального поля и нулевые напряжения в проводящих структурах, / - вектор токов проводящих структур. Линейная форма дифференциальных уравнений получается посредством разложения токов / относительно их равновесных значений 1ге/ в выбранной конфигурации равновесия I = Ire/ +SI L + RSI + Q = SV Г2 22П dt dt .z.zij где L =3V/dt - полная матрица индуктивностей, включающая в себя плазменный вклад, 5V - вариация вектора управляющих напряжений. Вектор SW — 8\Pp /,] является возмущением, воздействующим на профиль плазменного тока, /, - внутренняя индуктивность плазменного шнура, полоидальное fip пропорционально давлению плазмы [3], Q — BVIdW матрица возмущения.
Аналитическое исследование автоколебательных систем автоматической оптимизации с пороговым критерием качества
Оптимизатор содержит вычислительное устройство (ВУ), блок фазирования (БФ), цифро-аналоговый преобразователь (ЦАП) и блок моделей (БМ). Сигнал Л, пропорциональный плотности плазмы, поступает на вход ВУ. Оно своим выходным двоичным кодом N, (/ - номер кода) управляет блок БФ, преобразующим код N, в фазовый сдвиг между двумерным вращающимся вектором входных х и выходных у величин в соответствии с уравнением у = ехри р(М1 )]Л\ При этом величина ср определяется только кодом Л и не зависит от частоты вращения векторов х и у в диапазоне рабочих частот. Индикация параметра ср производится З Адлгттивная автоколебательная система автоматической оптимизации плотности плазмы 123
ЦАП, который управляет БМ, подключаемым к ВУ переключателем Ш для проверки АО в реальном масштабе времени.
Принцип действия автоматического оптимизатора Принцип действия АО в режиме поиска max Дтач (по алгоритму (3.1.1)) состоит в следующем. Посредством указателя экстремума (УЭ) и импульсного запоминающего устройства (ИЗУ) в ВУ выделяется знак приращения пороговой плотности Дтах, при изменении которого перебрасывается триггер (Т) со счетным входом и изменяет направление счета двоичного реверсивного счетчика (PC). Причем в PC в зависимости от состояния Т прибавляется или вычитается единица при сбросе плотности Д , что приводит каждый раз к смене кода N{ и изменению на один шаг угла р. Блок фазирования АО выполнен на основе оригинального функционального преобразователя кода в проводимости, разработанного в [16,27].
Блок моделей идентифицирует режимы ограничения плотности со сбросами (модель Ml) и без сбросов (модель МП) (рис. 3.4). В отличие от модели моды (разд. 2.1.2), учитывающей высокочастотные желобковые колебания, в БМ моделируются только низкочастотные колебания плотности плазмы, как в модели, рассмотренной в разд. 2.1.3. В модели Ml реализована зависимость Дтах( ), а модель МИ представляет собой последовательное соединение инерционного звена и нелинейного звена с экстремальной характеристикой.
В процессе поиска в модели МІ тахДтач выход релаксационного генератора (РГ) (рис. 3.4) в ВУ блокируется УЭ при выборе собственной частоты РГ меньше частоты релаксационных колебаний плотности Д . Когда переключателем П2 переключают выходы моделей Ml и МП, имитируя З Адаптивная автоколебательная система автоматической оптиміпашш плотности плазмы 124 изменение структуры объекта, то сбросы Д исчезают, а шаги по (р совершаются от импульсов РГ. В результате алгоритм АО изменяется: частота управляющего воздействия задается постоянной от РГ, а не от релаксационных колебаний плотности Д модели Ml, при этом в модели МП ищется максимум значений плотности Д, достигаемых к моментам тактовых импульсов от РГ. Осциллограммы рис. 3.5 иллюстрируют автоматический переход с поиска тахДтач к поиску тахД (рис. 3.5, а) и наоборот (3.5, б) при коммутации выходов моделей. Верхние осциллограммы соответствуют выходу БМ (величина Д), а нижние -выходу ЦАП (величена (р). Положение экстремумов моделей Ml и МП разнесены в пределах шкалы ЦАП. Таким образом, АО способен целенаправленно изменять алгоритм работы, что является сочетанием автоматического поиска с адаптацией к изменяющимся свойствам объекта.
Разработанный автоматический оптимизатор был применен на установке Огра-3 в ИАЭ им. И.В. Курчатова с целью экспериментальной верификации системы автоматической оптимизации плотности плазмы. Эксперименты проводились с первой модой желобковых колебаний, которая в процессе накопления плазмы возникает раньше других мод. Блок фазирования включался в двумерный тракт обратной связи первой моды при включенных каналах стабилизации (с постоянными параметрами) второй и третьей мод. На вход ВУ оптимизатора поступал сигнал А с датчика плотности в виде фольгового детектора, который определял усредненную по объему плотность плазы по потоку быстрых атомов перезарядки. Г \Л$+ь} Рис. 3.6. Поиск оптимального угла фазирования ср на установке Огра-3 а — прекращение сбросов после нахождения р , б - рысканье в области максимальных пороговых значений плотности, в —автоматический переход на отыскание р0 t с частотой внешнего воздействия В экспериментах наблюдался разный характер поведения плотности А в зависимости от вакуумных условий при поиске тахДтм1 (рис. З.б). После нахождения АО оптимального угла фазирования (рор, сбросы либо З Адаптивная автоколебательная система автоматической оптимизации плотности плазмы 126 прекращались (рис. 3.6, а), либо происходило "рысканье" в области максимальных пороговых значений плотности (рис. 3.6, б). В первом случае возникла необходимость в изменении алгоритма поиска. Введение автоматического перехода на отыскание popt с частотой внешнего воздействия позволило продолжить поиск, когда сбросы плотности исчезали (рис. 3.6, в).
Результаты экспериментов на плоскости "плотность — угол фазирования"
Осциллограммы поиска максимума пороговой плотности из разных начальных условий на плоскости на плоскости "п — р" (рис. 3.7) (п -размерная плотность) представляются в виде траекторий, проходящих через точки с координатами поисковых шагов. Траектории расположены в некоторой области А и сходятся к зоне экстремальных значений в пределах
Адаптивная автоколебательная система автоматической оптиміпашін плотности плазмы [ 27 Экспериментальные траектории на плоскости "л-#?" при увеличении лтзч имели неоднозначную зависимость от (р (рис. 3.7), которую, по-видимому, можно объяснить нестационарности параметров плазмы (в частности, коэффициента усиления v в модельных рассмотрениях передаточной функции первой моды (2.1.4), вызывающей дрейф экстремума л тах. Оптимизатор отыскивал (рор1 в присутствии данного фактора в процессе накопления плазмы.
Нелинейность зависимости п{ р) не учтена в модели моды (2.1.4), т. к. дисперсионное уравнение желобковых колебаний плазмы (2.1.2) получено в линейном приближении. Тем не менее, сравнение осциллограмм поиска по алгоритму (3.1.1) на модели (рис. 3.1) и ни реальном объекте (рис. 3.6, б) показывает их качественное сходство. Это свидетельствует о правомерности построенной модели моды с учетом релаксационных колебаний плотности. Результаты сопоставления позволили настраивать оптимизатор на нужные режимы работы в реальном масштабе времени как при раздельной верификации алгоритмов поиска maxAIlia . и тахД, так и при автоматическом переходе с одного алгоритма на другой в случае изменения свойств объекта.
Оптимизатор находил оптимальное значение параметра (р в течение импульса инжекции плазмы длительностью 1-2 sec не более, чем за 15-16 шагов. При этом наблюдалось увеличение пороговых значений плотности в 7-8 раз (рис. 3.6) для времени жизни быстрых ионов до перезарядки 0.1- 0.2 sec. Частоты желобковых колебаний первой моды не превышали 150 kHz. Эти частоты находились в пределах частотного диапазона блока фазирования.