Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Окунькова Евгения Вячеславовна

Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора)
<
Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора) Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора)
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Окунькова Евгения Вячеславовна. Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора): диссертация ... кандидата технических наук: 05.13.01 / Окунькова Евгения Вячеславовна;[Место защиты: Московский государственный технический университет им.Н.Э.Баумана].- Москва, 2015.- 129 с.

Содержание к диссертации

Введение

ГЛАВА 1. Уравнение риккати с параметрами, зависящими от состояния. обзор состояния проблемы 20

1.1. Постановка задачи 24

1.2. Расширенная линеаризация 25

1.3. Построение управления с использованием уравнения Риккати с параметрами, зависящими от состояния 26

1.4. Дополнительные степени свободы 27

1.5. Необходимые условия существования управления при использовании SDRE подхода 27

1.6. Устойчивость и оптимальность SDRE подхода

1.6.1. Устойчивость 28

1.6.2. Оптимальность

1.7. Преимущества SDRE подхода 31

1.8. Результаты применения SDRE подхода 33

ГЛАВА 2. Построение гарантирующего управления системы с параметрами, зависящими от состояния 34

2.1. Общая постановка задачи дифференциальных игр 35

2.2. Постановка задачи синтеза гарантирующего управления для систем с параметрами, зависящими от состояния 36

2.3. Общее решение для задачи дифференциальных игр 37

2.4. SDC представление для объектов с нелинейной структурой 38

2.5. Построение стратегий дифференциальной игры

2.5.1. Уравнение Риккати с параметрами, зависящими от состояния 41

2.5.2. Построение стабилизирующих стратегий 42

2.5.3. Построение гарантирующих стратегий 43

2.6. Поиск наименее благоприятных значений параметров системы 46

ГЛАВА 3. Тяжеловодный реактор как объект управления 50

3.1. Описание тяжеловодного реактора 50 Стр.

3.2. Управление тяжеловодным реактором 53

3.2.1. Узловая модель активной зоны большого реактора с тяжеловодным замедлителем и теплоносителем под давлением мощностью 540 МВт 53

3.2.2. Линеаризация большого тяжеловодного реактора 60

ГЛАВА 4. Синтез управления для тяжеловодного реактора 67

4.1. Математическая модель 67

4.2. Построение управления 69

4.3. Построение гарантирующего управления 71

4.4. Синтез управления в программной среде Matlab 71

ГЛАВА 5. Моделирование 74

Выводы 82

Литература 84

Построение управления с использованием уравнения Риккати с параметрами, зависящими от состояния

Развитие различных областей промышленности в середине прошлого столетия очень сильно повлияло и на развитие оптимальной теории управления. Задача построения управления сводилась к приведению системы в такое состояние, в котором функция стоимости была бы минимальной. Появились прикладные задачи стабилизации, для которых было необходимо разрабатывать регуляторы, а для задач слежения – стратегии управления. Среди таких прикладных областей можно отметить построение оптимальных траекторий полета для воздушных судов и космических аппаратов. В частности, линейная теория оптимального управления, для которой объект управления считается линейным и регулятор обратной связи полагается также линейным относительно входа системы, хорошо изучена и широко применяема [21].

Тем не менее, в последнее время, доступность мощных и недорогих микропроцессоров определила открытие все больших преимуществ нелинейной теории управления и соответствующих прикладных задач. После нескольких лет плодотворных исследований сейчас существует ряд техник для синтеза управлений для нелинейных систем. В частности, развитием сложной и строгой математической структуры для формулировки и анализа алгоритмов системного конструирования нелинейных регуляторов занималось много исследователей, начиная с семидесятых годов прошлого столетия (например, Исидори, 1995г.; Халил, 2002г.; Крстик, Канеллакопулос и Кокотович, 1995г.; Слотин, Ли, 1991г.; ван дер Шафт, 1999г.; Афанасьев, Колмановский, Носов, 2003г.; Красовский, 1959г.; Демидович, 1967г.; Ляпунов, 1959г.; Понтрягин, Болтянский, Гамкрелидзе, Мищенко, 1969г.; Пупков, Коньков [22] и т.д.). В связи с быстрыми технологическими изменениями в разных областях промышленности требования к точности и стоимости нелинейных систем управления увеличиваются. И хотя несколько методов справедливо считаются хорошо теоретически проработанными, существует нехватка комплексного подхода к управлению, которая бы, кроме устойчивости, отвечала еще и требованиям и к качеству, и к робастности для расширения областей применения нелинейных систем. Фактически на данный момент, большинство разработанных теоретических подходов имеют малую применимость из–за сильных ограничений, наложенных на систему.

Разработчики систем управления стремятся к разработке алгоритмов управления, которые бы предлагали систематизированный и простой подход, при этом оптимизирующий качество системы, и предлагают компромиссное между сложностью системы и ее ошибками решение.

Построение управления с использованием уравнения Риккати с параметрами, зависящими от состояния, хорошо известно и стало очень популярным среди ученых. Этот метод предлагает эффективный алгоритм для синтеза нелинейного управления с обратной связью, учитывающий нелинейности в состояниях системы и предлагая при этом большую гибкость управления с помощью весовых матриц, зависящих от состояния. Это метод, впервые предложенный Пирсоном в 1962 году [44], широко рассмотренный Рейдом в 1972г. [45], доработанный Верни и Куком в 1975г. [51], изученный независимо Мрацеком и Клутье в 1998г. [42], и упоминающийся в работах 1996 года Фридланда. Метод основан на факторизации (или параметризации) нелинейной динамики в вектор состояний и матричную функцию, которая также зависит от состояния. При таком подходе SDRE алгоритм полностью учитывает нелинейности системы, переводя нелинейную систему в линейную структуру с матрицами, в которых коэффициенты зависят от состояния (SDC), и минимизируя нелинейный функционал качества, который выражен в квадратичной форме. Алгебраическое уравнение Риккати c SDC матрицами решается, в таком случае, в интерактивном режиме и предоставляет субоптимальный закон управления. Коэффициенты этого уравнения зависят от заданного в пространстве состояния. Алгоритм тогда включает решение в заданной точке пространства алгебраического уравнения Риккати с параметрами, зависящими от состояния, или SDRE.

Отсутствие уникальности в параметризации создает дополнительные степени свободы, что в свою очередь предоставляет гибкость при построении управления, а значит может быть использовано для улучшения оптимальности и устойчивости регуляторов. Поскольку SDRE зависит только от текущего состояния системы, расчеты можно проводить в режиме реального времени. В этом случае SDRE определяется вдоль траектории состояний системы. Очевидно, что это очень правильный и гибкий подход для моделирования и управления в режиме реального времени в замкнутом контуре.

Также и с расчетной точки зрения управление на основе SDRE, основанное на линейной параметризации, представляет эффективный числовой метод, который основан только на алгебраическом уравнении Риккати. Таким образом, управление на основе SDRE представляет собой интересную альтернативу к трудоемким задачам по решению нелинейных двухточечных краевых задач или дифференциальных уравнений в частных производных, выраженных через уравнения Гамильтона – Якоби – Беллмана. Постановка задачи при использовании SDRE в линейно – квадратичной форме позволяет синтезировать управление для нелинейных систем в достаточно «прозрачном» виде, т.е. параметры управляющих сигналов и сигналов состояния могут регулироваться изменением коэффициентов в матрицах штрафа. Таким образом, этот подход предлагает схожий (по гибкости управления) с существующим линейным H2 метод управления [20].

Общее решение для задачи дифференциальных игр

Ядерный реактор – это установка, в которой осуществляется управляемая самоподдерживающаяся цепная реакция деления ядер. Реактор называют тяжеловодным, так как в качестве замедлителя нейтронов в нем используется тяжелая вода (D2O). Тяжелая вода имеет самый большой коэффициент замедления по сравнению с легкой водой и графитом, т.е. поглощение нейтронов в ней минимально. Это дает возможность использовать в данных реакторах в качестве ядерного топлива природный уран. Пробег нейтронов в тяжелой воде велик (по сравнению с пробегом в легкой воде), поэтому размеры тяжеловодных реакторов значительно превышают размеры легководных реакторов равной мощности. Тяжеловодные реакторы применяют в таких странах, как Канада, Индия, Китай, Республика Корея, Пакистан, Аргентина, Румыния, Япония [14].

В качестве теплоносителя в тяжеловодных реакторах обычно применяют как тяжелую воду (это реакторы PHWR – Pressurized Heavy Water Reactor), так и легкую воду (реакторы LWR – Light Water Reactor), но существуют прототипы тяжеловодных реакторов, в которых в качестве теплоносителя используется газ (реакторы HWGCR – Heavy Water Gaz Cooled Reactor). Максимальное распространение получили реакторы PHWR CANDU (CANDU – CANada Deuterium Uranium – Канадский тяжеловодный урановый реактор).

Горизонтальный бак (бак–каландр), изготовленный из нержавеющей стали, пронизан с торцов трубами каландра и заполнен тяжелой водой. Рабочие каналы с тепловыделяющими сборками (ТВС) размещены в трубах каландра и образуют активную зону реактора. Бак–каландр находится в бетонном боксе, заполненном водой, которая выполняет функцию биологической и тепловой защиты. Теплоноситель (тяжелая вода) подается индивидуально в каждый рабочий канал с одного торца бака–каландра, омывает твэлы ТВС в канале, нагревается и выходит из канала с другого торца бака, направляясь в парогенератор. Первый контур подобного реактора имеет обычно две петли охлаждения; давление в контуре составляет 10 МПа.

Рабочие каналы проходят через оба торцевых слоя биологической защиты, что позволяет присоединять к каналам стыковочные узлы перегрузочных машин. Рабочие каналы, находящиеся в пределах активной зоны, изготовлены из сплава Zr–4, слабо поглощающего тепловые нейтроны. Пространство в баке между трубами каландра заполнено тяжелой водой с близким к атмосферному давлением. Температуру замедлителя (тяжелой воды) в баке–каландре поддерживают на уровне 70С. Давление в баке невелико, тонкостенные трубы каландра, изготовленные из алюминиевого сплава, слабо поглощают тепловые нейтроны, что наряду с другими факторами положительно сказывается на балансе нейтронов и позволяет получить относительно высокое значение коэффициента воспроизводства, приближающееся к 0,9. Давление теплоносителя несут рабочие каналы. Для сведения к разумному минимуму перетечки теплоты теплоносителя к замедлителю, зазор между трубой каландра и трубой рабочего канала заполняют газом. Рост температуры замедлителя обусловлен в основном внутренним тепловыделением вследствие замедления нейтронов и поглощения энергии c – квантов. Тепловыделение достигает 6–7% тепловой мощности реактора. Теплоотвод от замедлителя осуществляется автономным контуром охлаждения. В качестве топлива используется диоксид урана природного обогащения (0,714% по изотопу 235U). В каждый рабочий канал помещают 12 ТВС длиной 492 мм, ТВС состоит из стержневых твэлов. Оболочка твэла изготовлена из сплава Zr–4. Тепловыделяющие сборки в каждом рабочем канале автономны, что позволяет проводить перегрузку топлива на ходу, проталкивая отработавшие сборки по длине канала. Эту операцию выполняют с помощью двух перегрузочных машин, расположенных с торцов бака–каландра. Стыковочные узлы каждой машины соединяются с каналом, уплотняются с ним и удаляют элементы герметизации канала. Загрузочная машина подает ТВС в канал, проталкивая ее на полную длину, а машина выгрузки принимает с противоположного торца выгоревшую ТВС.

Режим работы реактора с перегрузкой на ходу позволяет иметь минимальную топливную загрузку активной зоны, а, следовательно, и свести к минимуму устройства компенсации избыточной реактивности. Система компенсации состоит из герметичных камер, заполненных водой, выполняющей роль поглотителя тепловых нейтронов. Уровень воды в камерах может изменяться от максимума до нуля. Компенсация избыточной реактивности осуществляется также подачей в замедлитель раствора сильных поглотителей тепловых нейтронов (бора или гадолиния). Кроме того, для выравнивания эпюры энерговыделения в бак–каландр вводятся регулирующие стержни из нержавеющей стали. Оперативное снижение мощности выполняется стержнями, содержащими кадмий.

Аварийный останов реактора [11] осуществляется сбросом в объем бака–каландра вертикальных стержней аварийной защиты, содержащих кадмий, с одновременным интенсивным впрыском в замедлитель раствора нитрата гадолиния. В отдельных конструкциях тяжеловодных реакторов аварийный останов может осуществляться сбросом замедлителя из бака– каландра в специальный сбросный бак.

Узловая модель активной зоны большого реактора с тяжеловодным замедлителем и теплоносителем под давлением мощностью 540 МВт

Большой реактор с тяжеловодным замедлителем и теплоносителем под давлением – это реактор с тяжелой водой под давлением, который использует необогащенную окись урана как топливо и тяжелую воду в качестве замедлителя и теплоносителя. Выходные мощности равны 1800 МВт тепловой и 540МВт электрической соответственно. Размеры активной зоны: диаметр 800 см и высота 600 см. Поскольку он достаточно широкий по сравнению с длиной миграции нейтронов существует необходимость в распределенных в пространстве приборах измерения реактивности и механизмов, фиксирующих потоки нейтронов. Чтобы управлять и наблюдать за распределением потока нейтронов активную зону разделяют на четырнадцать зон. Каждая зона включает контролер жидкой зоны (LZC– Liquid Zone Controller), который используется в качестве первоначального метода последовательного точечного управления реактивностью, варьируя уровни воды. Чем выше уровень воды, тем меньше ввод реактивности и тем меньше мощность реактора в этой отдельно взятой зоне и окружающем ее пространстве. Чем ниже уровень воды, тем выше ввод реактивности и тем больше мощность реактора будет в этой зоне и ее окружении. Основная цель системы контроля за жидкими зонами в пространственном управлении распределением энергии – избежать любых колебаний с ксеноном. Эта система также компенсирует любые небольшие возмущения, вызывающие незначительные изменения реактивности, такие как перегрузка топлива. Система контроля жидкой зоны обеспечивает управление реактивностью в пределах порядка 3,5 мК. Эта система также работает при постоянных возмущениях реактивности. В случае возникновения нетиповых событий, которые требуют ввода более 3,5 мК, активируются поглощающие стержни системы защиты и управления, а если менее 3,5 мК, то активируется механическая система контроля перемещения регулирующих стержней.

Мощность реактора может быть определена и измерена с помощью следующих устройств. В каждой зоне существует два внутризонных детектора вертикальных потоков нейтронов, которые измеряют мощность в зоне. Детектор измеряет поток нейтронов в разных точках внутри зоны для оценки распределения мощности и оценки суммарной мощности. Также существует три ионизационных камеры вне зоны для измерения общей мощности. Тем не менее, не существует инструмента для измерения концентрации йода, ксенона и предшественников запаздывающих нейтронов, которые принадлежат этой системе [50].

Четырнадцать зон реактора полагаются как маленькие активные зоны, разделенные диффузией нейтронов. Учитывая различные взаимодействия нейтронов, такие как генерация нейтронов и поглощение нейтронов в каждой зоне, а также их рассеяние между различными зонами, диапазон изменения мощности в зоне может быть представлен следующим образом [48]:

Предшественники запаздывающих нейтронов появляются в результате деления ядер, но теряются в результате радиоактивного распада. Т.к. динамические свойства йода и ксенона значительно медленнее, чем у предшественников, то только одна эффективная группа предшественников запаздывающих нейтронов учитывается, т.е. md = 1. Следовательно, концентрация предшественников запаздывающих нейтронов может быть записана: это в значительной степени продукт деления, а именно из-за очень большого сечения поглощения нейтронов, довольно большого выхода продуктов деления и нестабильного поведения. Он получается как прямой продукт деления и через радиоактивный /? - распад 135Те, причем распад із5Те в issj практически мгновенный:

Эта обратная по реактивности ксенона связь вызывает изменения в распределении потока нейтронов и в свою очередь вызывает пространственные колебания в распределении мощности в большом ядерном реакторе.

Скорость изменения концентрации йода определяется как скорость генерации через деление и потери через радиоактивный распад. Скорость изменения концентрации ксенона определяется как скорость генерации через деление и распад йода; потери определяются через радиоактивный распад и преобразование 135Хе в стабильный 136Хе.

Мгновенное изменение в блоке управления зоны (ZCC – zonal control compartment) прямо пропорционально результирующей скорости потока в ZCC. Колебания притока воды в каждую зону напрямую связаны с положением регулирующего клапана и отток воды остается постоянным. Изменение уровня воды в каждой зоне может быть выражено через функцию входных сигналов регулирующих клапанов и описывается следующим выражением:

Модель большого тяжеловодного реактора, представленная формулами (3.1) - (3.14) должна быть линеаризована, чтобы можно было описать поведение реактора в окрестности установившегося состояния рабочей точки и соответственно c минимальным изменением в мощности, концентрации предшественников запаздывающих нейтронов, концентрации йода и ксенона, уровней воды в жидких зонах, температурах топлива и теплоносителя [39]. Общая мощность реактора Рд считается постоянной при работе реактора в установившемся режиме, а значит распределение мощности не изменяется с течением времени. Это условие выполнимо, если уровни мощности в зонах постоянны и концентрации йода, ксенона и предшественников запаздывающих нейтронов находятся в равновесии с ними. Из узловых уравнений (3.4), (3.6), (3.7), (3.10) и (3.12) получаем следующие условия устойчивого состояния:

Построение гарантирующего управления

В модели выше приведены уравнения основных параметров реактора, а именно для уровня мощности P, концентрации предшественников запаздывающих нейтронов C, концентрации йода I, концентрации ксенона X, уровня воды H.

Реактор состоит из четырнадцати зон, физические данные которых подробно расписаны в третьей главе данной работы.

Управление реактором рассмотрено в концепции гарантирующего управления с применением теории дифференциальных игр, подробно описанной во второй главе, и с применением метода «расширенной линеаризации», представленного в первой главе этой работы.

Поскольку задача рассматривается в концепции дифференциальной игры, то также необходимо ввести и второго игрока. В данной работе он представлен в виде возмущений или помех, которые действуют на систему. В моделировании это реализовано с помощью белого шума с достаточно большим коэффициентом усиления.

Преобразование исходной системы в систему с линейной структурой и с параметрами, зависящими от состояния, а также введение квадратичного функционала качества дают возможность перейти от решения уравнения Гамильтона - Якоби - Беллмана - Айзекса к уравнению Риккати с параметрами, зависящими от состояния (SDRE).

Для решения задачи останова реактора, т.е. при F = 0 и ҐЄ[0,ОО), а также принимая во внимание, что V(x) в явном виде не зависит от времени, получаем: [/(jc)+g1(jc (0+g2( )M(0]+-r We (jc)+Mr(0 (0-wr(0 (o] = o. (4-9)

После преобразований, подробно описанных во второй главе этой работы, получаем управления или стратегии игроков:

Для построения управления (4.13) необходимо определить матрицу S, остальные коэффициенты заданы. S находится в программной среде MatLab. Для этого используется функция LQR из программного обеспечения системы Matlab. С помощью этой функции для каждой зоны реактора были вычислены коэффициенты К, S, е. деленная, Q-NR N 0- положительно полуопределенная.

Этот метод вычисления и условия соответствуют постановке задачи в данной работе. Коэффициенты, полученные для всех зон реактора, представлены в Приложении.

На основе полученного управления было произведено моделирование останова реактора. Модель реактора, воспроизведенная с помощью Simulink, и листинг соответствующей программы в Matlab приведены в Приложении данной работы.

Полученные в результате моделирования данные подробно рассмотрены в пятой главе. ГЛАВА 5. МОДЕЛИРОВАНИЕ Общая модель реактора состоит из четырнадцати зон. В модели Simulink (см. Приложение) зоны реактора не связаны и рассматриваются каждая самостоятельно, в то время как в связанной с Simulink числовой моделью в Matlab зоны связаны между собой специальными коэффициентами взаимодействия. Для каждой зоны реактора также задан начальный уровень мощности и объем зоны.

В работе моделируется ситуация останова реактора. Поскольку моделируется снижение мощности индивидуально в каждой зоне реактора, то можно также говорить, что данное моделирование подходит и для задач изменения общего уровня мощности реактора путем снижения уровня в той или иной зоне.

Уровень мощности реактора регулируется уровнем воды. Уровень воды рассматривается как функция входного сигнала по управлению регулирующими уровень воды клапанами и представлен в виде (3.10).

Для каждой зоны была собрана математическая модель в Simulink. Формулы и числовые характеристики параметров описаны в Matlab. Листинг программы можно посмотреть в Приложении. Кроме того, для каждой модели было проведено моделирование для решения уравнения Риккати в виде S(0) и в виде S(x0). Для каждой зоны были заданы соответствующие значения матриц Q и R. Ниже представлены графики мощности и управления для нескольких зон реактора.

Стоит отметить, что поскольку моделирование производилось на персональном компьютере, а коэффициенты для разных характеристик реактора могут достигать минус восемнадцатой степени, после ряда испытаний, для возможности осуществления исследований на персональном компьютере, было решено увеличить все временные характеристики в миллион раз, а именно время жизни нейтронов, скорость нейтронов и постоянные распада. Т.е. время на графиках ниже измеряется в мегасекундах.

Из графиков, представленных ниже, мы видим, что сконструированное управление справляется с поставленной задачей стабилизации – останова реактора, несмотря на наличие возмущающих воздействий.

Стоит также отметить, что время, необходимое для стабилизации значений по йоду и ксенону, согласно данным других статей, может составлять от пятнадцати до тридцати пяти часов. А в некоторых работах время, указанное для моделирования подобных моделей реакторов, может составлять до семидесяти часов. Поэтому графики для этих параметров в данной работе не были подробно рассмотрены, и считается, что они соответствуют общей тенденции графиков изменения мощности, только на установку этих параметров требуется гораздо большее время.

Похожие диссертации на Гарантирующее управление нелинейными объектами (на примере тяжеловодного ядерного реактора)