Введение к работе
Актуальность. Одна из проблем, с которой сегодня сталкиваются разработчики, состоит в необходимости оценивания состояния объекта в условиях меняющегося окружения и варьирующихся параметров самого объекта. Множество факторов, такие как внешние возмущения, старение оборудования, погрешности измерений, оказывают негативное влияние на систему, что приводит к тому, что параметры объекта при анализе и синтезе задаются неточно. Такие системы называются системами с неопределенными параметрами. Эти параметры могут быть как интервальными, так и периодически изменяющимися или функциями некоторых переменных. Поэтому проблема оценки неизмеряемого вектора состояния очень актуальна, и на сегодняшний день ее решение требуется во многих приложениях.
Стоит отметить ряд существенных преимуществ использования устройств и систем оценки вектора состояния. Во-первых, возможность восстановить недоступные для измерения переменные позволяет исключить установку дополнительных датчиков, что способствует улучшению эксплуатационных и стоимостных характеристик систем управления. Во-вторых, наличие датчиков требует учета в модели объекта управления дополнительной динамики самих датчиков, что может вызвать проблемы синтеза обратной связи в связи с чрезмерным ростом порядка модели объекта управления.
Задача построения наблюдателя заключается в синтезе динамической системы, с помощью которой можно получить оценку вектора состояний по измеряемым данным, таким как вход и выход системы. Большое число научных работ посвящено решению данной задачи для разных классов объектов управления при различных свойствах и параметрах системы, а также доступной информации.
Основы теории наблюдателей для линейных стационарных систем управления были заложены математиком Д. Люенбергером в 1963 году. На сегодняшний день продолжается поток научных трудов, посвященных развитию данной теории, ее применению к новым классам объектов управления в разной постановке задач.
На текущем этапе развития теории автоматического управления задача оценивания неизмеряемого вектора состояния для полностью определенных линейных стационарных систем решена. Но если рассматривать системы с неопределенностями, то для них данная задача еще не нашла окончательного и однозначного решения. Работы, посвященные построению устройств оценки вектора состояния систем с неизвестными возмущениями, продолжают появляться.
Что же касается нелинейных объектов управления, то здесь задача построения наблюдателя имеет гораздо более сложный характер, и на данный момент имеет решение только для некоторых отдельных классов нелинейных динамических систем.
Множество моделей, в том числе и моделей роботов, и различных робототехнических комплексов, описываются уравнениями с неопределенными параметрами, что приводит к затруднению синтеза наблюдателей, используя классические методы синтеза. Таким образом, на практике существуют ситуации, когда классические методы построения наблюдателей, оценки которых сходятся к точному значению состояния при отсутствии шума (например, наблюдатель Люенбергера), не применимы. В основном, причиной тому становится наличие в системе параметрической неопределенности.
Одним из возможных решений является использование алгоритмов интервальной оценки, под которой понимается синтез интервального наблюдателя, гарантирующего оценивание множества допустимых значений для вектора состояния системы (т.е. интервал значений). Решение поставленной задачи осложняется параметрической и
сигнальной неопределенностью матриц модели рассматриваемой системы, что затрудняет применение классических методов синтеза наблюдателей (для линейных или нелинейных систем).
Стоит отметить, что большинство стандартных разработанных подходов имеют строгое обоснование лишь для случаев, когда модель объекта наблюдения частично линейна или близка к линейной, что затрудняет их применение во многих прикладных областях, например в робототехнике. С другой стороны, широкий класс нелинейных и неопределенных систем может быть эквивалентно описан так называемыми ЛПП-системами («линейные с переменными параметрами», от англ. LPV - Linear Parameter-Varying). Часто, в нелинейном случае, построение наблюдателя или регулятора основано на преобразовании системы в канонические формы, что может быть сложно реализуемо на практике. Именно поэтому класс ЛПП-систем стал очень популярным во многих практических задачах. С целью расширения спектра рассматриваемых классов систем, в данной работе будут рассматриваться ЛПП-системы, описание которых будет приведено позже.
В этом случае алгоритмы построения наблюдателей для указанного класса систем, описываемые в данной диссертационной работе, могут найти широкое применение в науке и технике.
Таким образом, развитие методов интервальной оценки и алгоритмов построения интервальных наблюдателей для систем, обладающих параметрической неопределенностью, является актуальной задачей. Бурно развивающаяся практика привела к развитию аппарата для учёта неопределённостей нестатистической или, в общем случае, неизвестной природы. Этот фактор послужил развитию интервального анализа, подходящего для исследования содержательных моделей, которые основаны на достаточно общих допущениях о характере неопределённости, когда отсутствует какая-либо предварительная информация о рассматриваемых величинах, кроме знания некоторых ограниченных множеств, к которым принадлежат значения этих величин.
Интервальные наблюдатели генерируют два вектора оценок: минимальных и максимальных значений для каждого элемента вектора состояний объекта. При построении оценки для ЛПП-систем часто не удается применять методы адаптивного управления, основанные на предположении о квази-стационарности неизвестных параметров. Методы робастного управления и оценивания или методы гибридных систем (систем с переключениями) могут приводить в таких случаях к сложно реализуемым и сложно анализируемым на практике решениям.
Оценка неизмеряемого вектора состояния относится к фундаментальным проблемам современной теории автоматического управления. На протяжении последних десяти-пятнадцати лет теория интервальной оценки имела достаточно широкое развитие и распространение. Используемый в данной работе подход к синтезу интервальных наблюдателей основан на теории кооперативных систем (Gouze et al., 2000; Kieffer & Walter, 2006; Smith, 1995; Walter & Kieffer, 2003).
Кооперативные системы составляют подкласс монотонных систем, состояние и выходные траектории которых сохраняют относительный порядок в каждый момент времени. Благодаря свойству кооперативности удается обеспечить положительность ошибки наблюдения, что необходимо для построения интервального наблюдателя. Более подробно оно рассматривается в первой главе работы.
Подобные системы имеют практическое приложение в области робастного управления, где предполагается наличие различного рода неопределенностей в динамике системы; технических областях, таких как робототехника, горно-
добывающая отрасль, оборудование заводов и цехов; системах управления летательным аппаратами, двигателями; системах, относящихся к космической области, изучению океана, сельскому хозяйству, военному делу; транспортных системах, строительстве и других отраслях промышленности. Но при этом единых алгоритмов построения интервальных наблюдателей для данного класса систем разработано не было.
Следовательно, существует необходимость в разработке алгоритмов построения интервальных устройств оценки для различных классов систем в присутствие параметрической неопределённости, которые можно представить в виде модели ЛПП-систем, что подчеркивает актуальность данной работы. Использование интервального наблюдателя позволяет построить область, гарантированно ограничивающую реальную траекторию протекания процессов в рассматриваемой динамической системе.
Другими словами, предложенный алгоритм производит трансформацию заданного интервала неопределенности для начальных условий объекта и вектора неизвестных параметров и входов во множество допустимых значений переменных состояния. В этом случае, наблюдатель восстанавливает не оценку текущего состояния объекта (в возмущенном случае реальное состояние находится в некоторой, требующей дополнительного определения, окрестности этой оценки), а интервал, гарантированно содержащий вектор состояния системы. Подобная постановка задачи может быть востребована при наблюдении, к примеру, за мехатронными и робототехническими комплексами, подверженными воздействию быстро меняющихся неизвестных возмущений и вариациям параметров.
Цель диссертационной работы. Целью диссертационной работы является разработка алгоритмов оценивания вектора состояния динамических систем с существенной сигнальной и параметрической неопределенностью математической модели в условиях, когда классические алгоритмы оценивания не могут быть применимы.
Поставленная цель достигается с использованием методов интервального оценивания. В ходе исследования разработаны алгоритмы синтеза интервальных наблюдателей для класса ЛПП-систем.
Научная новизна. Впервые интервальные наблюдатели для конкретного класса систем были предложены в 2000 году в работе Gouze J.-L., Rapaport A., Hadj-Sadok Z. "Interval observers for uncertain biological systems", посвященной наблюдению за биореактором. Два классических наблюдателя оценивали нижнюю и верхнюю границы области, содержащей значения вектора состояния. Изначально, коэффициент усиления наблюдателя выбирался таким образом, чтобы ошибка наблюдения обладала свойством кооперативности. Т.е. построение интервального наблюдателя было возможным только для кооперативных систем, что являлось серьезным ограничением. В диссертационной работе это ограничение будет снято.
Этот результат был расширен на случай набора наблюдателей в работе Bernard О., Gouze J. L. (2004) "Closed loop observers bundle for uncertain biotechnological models". Рассматривалось пересечение всех интервальных оценок для улучшения скорости сходимости и уменьшения размеров полученной области. Наконец, в работе Moisan М., Bernard О., Gouze J. L. (2009) "Near optimal interval observers bundle for uncertain bioreactors" данный результат был улучшен путем введения критерия оптимальности для системы наблюдателей, позволяющего получить оптимальный наблюдатель. В
статье приведено доказательство применимости такого подхода для биотехнологических систем с большими неопределенностями в описании.
Как видно, понятие интервального оценивания (interval/set-membership estimation) было известно и ранее, но существовавшие алгоритмы имели высокую вычислительную сложность, затруднявшую их практическую применимость в системах наблюдения реального времени. За прошедшие годы теория интервальных наблюдателей получила широкое распространение. Однако единых алгоритмов построения интервальных наблюдателей для ЛПП-систем разработано не было, несмотря на высокую практическую значимость этих классов объектов управления. Новизна диссертационной работы заключается в развитии алгоритмов оценивания вектора состояния динамических систем с существенной неопределенностью математической модели и алгоритмов построения интервальных наблюдателей для данного класса систем.
Теоритическая и практическая значимость. Проводимые в рамках данной научной работы исследования являются фундаментальными исследованиями, нацеленными на практические приложения, которые могут использоваться в различных отраслях промышленности и техники, где затруднено применение классических методов оценивания. Примерами реальных технических систем, к которым могут быть применены разработанные алгоритмы интервальной оценки, являются робототехнические комплексы, используемые для экспериментальных результатов в данной диссертационной работе.
Также, наглядным примером являются системы обнаружения сигнала, которые используются для большого количества различных систем диагностики и мониторинга. В данном контексте, в подобных системах решается задача робастного обнаружения ошибок. Для обеспечения робастности и изоляции возмущений при классическом подходе требуется знание сигналов, которые могут быть неизвестны в связи с неопределенностью модели, для того, чтобы максимизировать чувствительность к определенным ошибкам.
Основной идеей применения интервальной оценки является рассмотрение неопределенности в интервале и проверка принадлежности измерений интервалу всех возможных значений выходов. Для решения этой задачи, оценка данного интервала вычисляется с использованием интервального наблюдателя. Основным преимуществом является то, что априори должны быть доступны только границы неопределенности.
Примером подобной задачи может служить гидравлическая лаборатория, где поддерживается определенный уровень воды в резервуарах. Неисправность соответствует выходу уровня воды из заданного интервала. Подробнее данный пример рассмотрен в диссертационной работе.
Соответственно, в тех случаях, когда в самой постановке задачи присутствует понятие интервала, методы интервальной оценки хорошо применимы.
Алгоритмы построения интервальных наблюдателей, представленные в данной диссертационной работе, также могут быть использованы в качестве основы решения других смежных задач теории управления. Например, в задачах стабилизации параметрически возмущенных систем с использованием информации, полученной интервальным наблюдателем. Некоторые результаты в данном направлении уже были получены автором и его коллегами и представлены на одной из конференций. Было показано, что если выполняются интервальные соотношения (истинное значение состояния гарантированно находится внутри интервала оценки) и траектории наблюдателя сходятся к одному положению равновесия, то состояние системы тоже
будет сходиться к этому положению равновесия. Т.е. управление строится с целью стабилизировать именно интервальный наблюдатель, что приводит к стабилизации объекта управления.
Также полученные результаты применимы в задачах оценки влияния внешних воздействий на динамическую систему.
Решение задачи оценки состояния систем в условиях неопределенности их модели при использовании интервальных методов позволяет не только достичь поставленных целей в области оценивания вектора состояния систем, но и дает возможность развить различные теоретические результаты, расширить область применения полученных алгоритмов оценки, создать новые алгоритмы и технологии оценивания.
Важно отметить, что в результате научных исследований в рамках данной диссертационной работы удалось в значительной мере ослабить требования к построению интервальных наблюдателей, что, в свою очередь, значительно расширяет область их возможного применения.
Важным пунктом является значимость данного проекта в образовательном процессе. Результаты работы могут быть использованы в широко распространенных мехатронных учебно-исследовательских комплексах, которые входят в лабораторное оборудование многих отечественных и иностранных высших учебных заведений, для проведения научных исследований и учебного процесса в области мехатроники, робототехники и систем автоматического управления.
Методы исследования. Теоретической основой исследований служит применение теории автоматического управления, интервальной арифметики, методов, использующих аппарат функций Ляпунова. Достижение результатов диссертационной работы осуществляется за счет применения теории кооперативных систем, дифференциальных неравенств, математического моделирования.
Положения, выносимые на защиту:
Методы синтеза интервальных наблюдателей для ЛПП-систем с существенной неопределенностью математической модели (в условиях, когда применение стандартных методов оценивания затруднено):
-
Интервальный наблюдатель для кооперативной ЛПП-системы, позволяющий получить множество допустимых значений вектора состояния, для случая с измеряемым вектором переменных параметров.
-
Интервальный наблюдатель для не кооперативной ЛПП-системы, с заменой координат, обеспечивающей свойство кооперативности исходной системе, для случая с измеряемым вектором переменных параметров.
-
Интервальный наблюдатель для кооперативной ЛПП-системы для случая с неотрицательными значениями состояния и не измеряемым вектором переменных параметров.
-
Интервальный наблюдатель для кооперативной ЛПП-системы для случая со знакопеременными значениями состояния и не измеряемым вектором переменных параметров.
Апробация работы. Основные результаты диссертации докладывались на следующих конференциях:
-
18th International Conference on Methods and Models in Automation & Robotics, 26-29 August 2013, Mi^dzyzdroje, Poland. Analysis conditions on interval observer synthesis for linear systems with variable parameters.
-
9th IFAC Symposium on Nonlinear Control Systems, 4-6 September, 2013, Toulouse, France. On Interval Observer Design for a Class of Continuous-Time LPV Systems.
-
XLI научная и учебно-методическая Конференция, 31 января - 3 февраля 2012 г. Построение интервальных наблюдателей для линейных систем с переменными параметрами.
-
XIV конференцию молодых ученых «Навигация и управление движением», 13-16 марта 2012 г. Синтез интервального наблюдателя для линейных систем.
-
The 51st IEEE Conference on Decision and Control, Maui, Hawaii, December 10-13, 2012. On Set-Membership Observer Design for a Class of Periodical Time-Varying Systems.
-
I Всероссийский конгресс молодых ученых, 10-13 апреля 2012 г. Интервальное оценивание параметров линейных систем.
-
II Всероссийский конгресс молодых ученых, 9-12 апреля 2013. Разработка интервального наблюдателя для линейных систем с переменными параметрами при различных начальных условиях.
-
XLII научная и учебно-методическая конференция НИУ ИТМО, 29 января - 1 февраля 2013. Разработка систем интервального наблюдения для нестационарных систем с переменными параметрами применительно к мехатронным и робототехническим комплексам.
-
XLII научная и учебно-методическая конференция НИУ ИТМО, 29 января - 1 февраля 2013. Разработка методов построения интервальных наблюдателей для линейных нестационарных систем с неизвестными параметрами.
10. XLII научная и учебно-методическая конференция НИУ ИТМО,
29 января - 1 февраля 2013. Анализ условий синтеза интервальных наблюдателей для
линейных систем с переменными параметрами.
Автор проходил ряд научных стажировок, среди которых:
-
Центральная школа г. Лилль и Государственный Институт Исследований в Информатике и Автоматике INRIA LNE (team Non-A), г. Лилль, Франция, 11.06.2012 -30.06.2012.
-
Лаборатория интегрированных материалов и систем АРИА ИМС (Laboratoire de l'lntegration du Materiau au Systeme), Университет Бордо 1, г. Бордо, Франция, 09.05.2011-26.05.2011.
-
Лаборатория интегрированных материалов и систем АРИА ИМС (Laboratoire de l'lntegration du Materiau au Systeme), Университет Бордо 1, г. Бордо, Франция, 05.12.2010-11.12.2010.
Работа выполнена на кафедре «Систем Управления и Информатики», исследование выполнено при поддержке гранта Президента Российской Федерации № МК-464.2013.8, а также при поддержке Министерства образования и науки Российской Федерации, соглашение 14.В37.21.1928 и 14.В37.21.0875.
Для апробации разработанных алгоритмов интервального наблюдения был использован исследовательский комплекс на базе Lego Mindstorm NXT. На основе данной платформы были сконструированы «робот-сегвей» (Segway) и «робот-болбот»
(BallBot), кинематические схемы, конструкции, математические описания и технические особенности которых подходят для изучения и раскрытия содержания алгоритмов, разработанных в рамках данной работы.
Публикации. Материалы диссертации опубликованы в 9 печатных работах, а также статьях и сборниках научных трудов всероссийских и международных конференций. Среди опубликованных трудов 6 работ отпечатаны в рецензируемых журналах [1-6], входящих в перечень ВАК.
Личный вклад автора. Представленные в диссертационной работе результаты получены либо лично соискателем, либо при его непосредственном участии.
Структура и объем диссертации. Диссертация состоит из введения, четырех основных глав с примерами и заключениями. Основная часть работы изложена на 114 страницах. Список литературы включает 149 наименований.