Содержание к диссертации
Введение
1 Оценивание качества продуктов процесса первичной переработки нефти с помощью виртуальных анализаторов 11
1.1 Назначение виртуальных анализаторов 12
1.2 Особенности процесса ректификации нефти и разработки ВА 13
1.3 Роль ВА в системе управления 14
1.4 Процедура идентификации модели виртуального анализатора 15
1.5 Постановка цели и задач исследования 29
2 Идентификации моделей ВА без учета ограничений на параметры модели 31
2.1 Описание технологического объекта 31
2.2 Обработка данных измерений 33
2.3 Формирование обучающей и проверочной выборок 38
2.4 Выбор структуры модели 40
2.5 Выбор входов и определение параметров модели 43
2.6 Определение значимых параметров при идентификации модели ВА 49
2.7 Динамическая модель ВА 52
2.8 Выводы 60
3 Применение строгой модели процесса для построения ВА 63
3.1 Назначение аналитических моделей при построении ВА 63
3.2 Строгая модель атмосферного блока ЭЛОУ АВТ-2 65
3.3 Выводы 74
4 Идентификации моделей ВА с учетом ограничений на параметры модели 75
4.1 Алгоритм идентификации ВА с использованием ограничений на параметры модели 75
4.2 Тестирование предложенных алгоритмов на промышленных данных 87
4.3 Выводы 93
5 Приложение для определения модели ВА с учетом ограничений 94
5.1 Назначение программы для ЭВМ 94
5.2 Описание программы для ЭВМ 94
5.3 Выводы 99
Заключение 100
Обозначения и сокращения 101
Список используемых источников
- Процедура идентификации модели виртуального анализатора
- Обработка данных измерений
- Строгая модель атмосферного блока ЭЛОУ АВТ-2
- Тестирование предложенных алгоритмов на промышленных данных
Введение к работе
Актуальность работы.
Управление процессом переработки нефти осуществляется в условиях
регламентированных целевых показателях качества продуктов. Целью
управления процессом является максимизация выхода целевых продуктов
заданного качества, по возможности, при минимальном расходе энергетических
и материальных затрат. Выбор величины управляющих воздействий
осуществляется исходя из ограничений на значения параметров
технологического процесса, показателей качества продуктов и критериев эффективности процесса.
Поступающее на установку первичной переработки нефти сырье отличается по составу, соответственно, изменяется и состав полученных продуктов. Для получения продуктов регламентированного качества требуется информация о качестве получаемых продуктов, на основании которой корректируется режим работы ректификационной колонны. Как правило, оценка качества выходного продукта осуществляется на основе результатов лабораторных анализов и данных поточных анализаторов. Данные заводской лаборатории и поточных анализаторов не позволяют своевременно оценить качество товарной продукции, а полученная задержка информации о характеристиках выходного продукта вызывает излишние материальные затраты и приводит либо к получению меньшего объема целевых продуктов с большим запасом по качеству, либо к производственному браку, когда продукт, не соответствует нормам, снижается эффективность процесса. Настройка технологического режима работы установки первичной переработки нефти часто занимает время от нескольких часов до нескольких суток.
Регулярно поступающая оперативно измеряемая информация с контрольно-измерительных приборов установки дает возможность оператору спрогнозировать изменение качества продуктов и через управляющее воздействие поддерживать качество продуктов. Но данная оценка качества продуктов проводится по плохо формализованным критериям и зависит от опыта обслуживающего персонала, присутствует также временная задержка от момента обнаружения изменений показаний приборов до принятия решений.
Последнее время для оперативного оценивания качества продуктов процесса нефтепереработки в составе АСУ ТП широко применяются виртуальные анализаторы (ВА). Они представляют собой программно-алгоритмические комплексы, содержащие в себе модели, связывающие оперативно измеряемые показания контрольно-измерительных приборов с оценкой качества продукта.
Методы разработки моделей ВА для задач управления процессом ректификации нефти получили развитие как в трудах отечественных ученых О. С. Кожинского, Р.А. Аузана, Г. М. Бакан, Т.И. Копысицкого, Н.Н. Бахтадзе, А.П. Веревкина, А.Г. Шумихина, А.А. Мусаева так и трудах зарубежных ученых D. N. Saraf, N. Bolf, P. Angelov, L. Fortuna, P. Kadlec, M. Kano и др.
ВА позволяют оперативно получать оценку качества продуктов, но низкое качество моделей ВА не позволяет использовать преимуществ оперативного оценивания качества продуктов. Причиной низкого качества моделей ВА в промышленных условиях являются:
1) малая обучающая выборка данных измерений показателя качества
продукта;
-
погрешности показаний контрольно-измерительных приборов;
-
малый диапазон изменчивости величины входов ВА;
-
воздействие внешних неизмеряемых возмущений;
-
неточные данные о времени отбора проб продуктов для лабораторных измерений качества.
Невозможность регулярного оперативного оценивания состава сырья, частое отсутствие стационарных состояний технологического объекта, сложность динамики массообменного процесса препятствует применению строгой (аналитической) модели процесса. Выбор структуры модели ВА часто делается с отрывом от физико-химических особенностей технологического процесса.
Учитывая изложенное, можно заключить, что проблема оперативного оценивания качества продуктов процесса первичной переработки нефти является актуальной. С целью преодоления указанных проблем и повышения эффективности АСУ ТП требуется разработка новых алгоритмов и методов для идентификации моделей ВА.
Цель и задачи исследования. Цель настоящей работы – разработка алгоритмов и методов идентификации моделей ВА, реализуемых в составе АСУ ТП, для процесса первичной переработки нефти.
Для достижения общей цели поставлены следующие основные задачи:
-
провести анализ существующих методов идентификации моделей ВА;
-
определить класс моделей ВА, обеспечивающих более точную оценку качества продуктов;
-
разработать алгоритмы обработки данных измерений поточного анализатора, других контрольно-измерительных приборов;
-
разработать метод определения набора входов для модели ВА при малой обучающей выборке данных;
-
разработать алгоритмы и методы идентификации моделей ВА в условиях малой обучающей выборки данных;
-
получить модели ВА на примере процесса первичной переработки нефти.
Положения, выносимые на защиту.
-
Метод сглаживания переходных характеристик ВА с использованием вейвлет-преобразования.
-
Метод определения набора входов для модели ВА, исходя из промышленных данных и данных строгого моделирования процесса.
-
Алгоритм идентификации линейной регрессионной модели статического ВА с использованием ограничений на параметры модели.
4. Алгоритм идентификации динамической модели ВА в виде импульсных характеристик с использованием ограничений на коэффициенты модели.
Научная новизна.
-
Разработан алгоритм для определения набора входов модели ВА, исходя из данных пошагового тестирования, полученных на основе строгой модели процесса ректификации нефти.
-
Предложен метод сглаживания переходных характеристик ВА с использованием вейвлет-преобразования.
-
Разработаны алгоритмы получения моделей ВА процесса первичной переработки нефти с учетом ограничений на параметры модели. Интервалы изменения параметров модели находятся в результате строго моделирования процесса ректификации нефти.
Практическая значимость работы. Разработанные модели приняты Киришским нефтеперерабатывающим заводом для их использования в управлении процессом первичной и вторичной переработки нефти на установке ЭЛОУ АВТ-2.
Модели, полученные с использованием разработанного алгоритма идентификации, внедрены на АВТ-8 Омского нефтеперерабатывающего завода.
Разработана и зарегистрирована программа «Расчёт параметров модели виртуального анализатора с учетом ограничений», предназначенная для определения параметров модели ВА в составе АСУ ТП.
Динамические модели ВА реализованы на программных средствах АСУ ТП, Profit Suite for Advanced Control & Optimization (АРС-сервер Honeywell) на базе АСУ ТП Experion PKS.
Методы исследования. В диссертационной работе при решении поставленных задач были использованы: теория идентификации объектов управления, теория ректификации, математическое моделирование, теория автоматического управления, методы оптимизации, теория вероятности, математическая статистика. В качестве инструментов моделирования и программирования применялись пакеты прикладных программ: MATLAB, UniSim (моделирование промышленных процессов, корпорация Honeywell), Visual Studio Express.
Обоснование и достоверность результатов и выводов обеспечивается корректным применением используемых в работе теоретических методов и подтверждается полученными в диссертации результатами численных и экспериментальных исследований.
Апробация работы. Основные положения и результаты работы докладывались и обсуждались на: XXXVI Дальневосточной математической школе-семинаре имени академика Е.В. Золотова (Владивосток, 2012г.), XXXVII Дальневосточной математической школе-семинаре имени академика Е.В. Золотова (Владивосток, 2013г.), XXXVIII Дальневосточной математической школе-семинаре имени академика Е.В. Золотова (Владивосток, 2014г.), Международной конференции «Нефть и Газ – АТР 2015. Ресурсы, транспорт, сотрудничество» (Владивосток, 2015г.), Международной научной конференции
«Дискретная оптимизация и исследование операций» (Владивосток, 2016г.), XII
Всероссийском совещании по проблемам управления (Москва, 2014г.), XXVIII
Международной научной конференции «Математические методы в технике и
технологиях» (Саратов, 2015г.), XXIX Международной научной конференции
«Математические методы в технике и технологиях» (Санкт-Петербург, 2016г.),
Международной научно-практической конференции
«НЕФТЕГАЗОПЕРЕРАБОТКА-2016» (Уфа, 2016г.).
Публикации. По теме диссертации опубликовано 17 печатных работ, из них 7 статей в изданиях, рекомендованных ВАК, 1 статья в издании, индексированном Scopus, 1 авторское свидетельство о регистрации программы для ЭВМ.
Структура и объем работы. Диссертационная работа включает в себя введение, 5 глав основного текста, выводы по диссертации, список литературы из 126 наименований и 5 приложений. Работа изложена на 133 странице, содержит 22 рисунка, 21 таблицу.
Процедура идентификации модели виртуального анализатора
Виртуальный анализатор – инструмент, используемый во многих процессах нефтепереработки: первичной переработки нефти, каталитическом крекинге, висбрекинге и т.д. Он используются для решения различных проблем, таких как: дублирование (back-up), анализа чувствительности (what-if analysis), прогнозирования в реальном времени для управления установкой, проверки достоверности работы датчиков и для диагностирования неисправностей. Последние годы от нефтеперерабатывающих компаний в соответствии с изменением законодательства требуют соблюдать все более строгие ограничения на качество продуктов и на выбросы загрязняющих веществ. Учет данных ограничений требует глубоких знаний о процессе и его параметрах. Очевидна и необходимость использования адекватной поставленным задачам измерительной системы.
Измерительные устройства работают в различных неблагоприятных погодных условиях, требуют регулярной замены, возможны и непредвиденные поломки. Кроме того, некоторые измерительные устройства работают со значительной временной задержкой, что может понизить эффективность работы установки. Исходя из минимизации материальных затрат на обслуживание измерительной системы, стремятся использовать минимальное количество измерительных устройств. Обычно для оценки качества характеристик товарных продуктов применяется анализ проб в лаборатории. В связи с чем, необходимая информация поступает со значительной задержкой [2].
Невозможность оперативного измерения показателей качества продуктов, ввиду ограничений технологии измерения, приводит к ситуации, когда недоступны показания по целевым (контролируемым) параметрам процесса, необходимым для формирования управляющего воздействия.
Виртуальные анализаторы имеют ряд преимуществ: 1) являются доступной альтернативой дорогостоящим измерительным устройствам, таким как поточный анализатор (ПА), позволяют реализовать более полную измерительную систему; 2) могут работать параллельно с обычными датчиками, позволяют получать информацию для выявления неисправностей; 3) легко могут быть реализованы на имеющемся оборудовании (компьютеры); 4) способствуют оперативному прогнозированию технологического режима, избегая значительных временных задержек (рисунок 1.1).
Первичная переработка нефти является непрерывным процессом. Показания ВА, полученного на данных измерений параметров процесса, фокусируются обычно на описании такого статического (установившегося) состояния и не способны удовлетворительно описывать переходное состояние, какое наблюдается при пуске установки, либо ее остановки.
На практике причинами изменения режима работы установки являются изменение требований по качеству продуктов; колебания состава сырья, поступающего на установку; изменение активности катализатора; засорение теплообменников и т.д. [2].
Физико-химический (тепло-массообменный) процесс, как правило, сложен и изменяется во времени, что приводит к трудностям идентификации технологического объекта, возможны погрешности измерения датчиков, а также их отказы. Под воздействием этих факторов надежность виртуального анализатора уменьшается, что приводит к появлению ошибок в оценке качества производимой продукции. Чтобы избежать ухудшения производительности ВА часто необходимо проводить калибровку модели [55].
Схема взаимодействия ТП, АСУ ТП и ВА ВА либо существуют самостоятельно, в форме некоторой интеллектуальной надстройки контура управления, либо входят в состав АСУ ТП. Они позволяют восстановить необходимые сведения по имеющимся данным, идентифицировать скрытую динамику протекающих процессов и визуализировать ее на экране дисплеев дежурной смены [20].
Целью управления процессом является максимизация выхода целевых продуктов заданного качества, по возможности, при минимальном расходе энергетических и материальных затрат.
Управляющее воздействие на процесс формируется на основании показаний ВА. Учитываются ограничения на величину управляющих переменных и контролируемых параметров технологического процесса.
Существуют различные подходы к построению ВА: физическое моделирование, искусственное (интеллектуальное) моделирование (нейронные сети), нечеткая логика и гибридные методы.
В большинстве случаев выделяют два способа построения ВА: на основе строгой (детерминированной) модели процесса (model-driven) и на основе статистической обработки данных измерений параметров технологического процесса, включая данные лабораторного контроля (data-driven) [4]. ВА, построенные на основе аналитической модели процесса, также называют моделями, построенными в соответствии с концепцией «белого» ящика. Они основаны на известных физических, химических законах и свойствах процесса. Данные модели разрабатываются главным образом при проектировании установок и обычно фокусируются на описании идеального установившегося состояния процесса, что препятствует получения качественных моделей ВА на их основе. Использованию строгой модели процесса для ВА для оценивания качества продуктов препятствует отсутствие данных о изменяющемся составе сырья. Тем не менее ВА на основе строгой модели процесса также активно используется в качестве инструмента анализа технологического процесса [56].
Трудности идентификации строгой модели процесса вынуждают разработчиков использовать ВА на основе статистической обработки данных технологического процесса. Данный подход известен как «черный» ящик и предполагает отсутствие знаний о процессе [4]. Оценка качества продукта с помощью статистической модели ВА определяется на основании оперативно измеряемых параметров технологического процесса. С помощью данных моделей оперативно производится оценка целевого (оцениваемого) показателя качества процесса на основе его взаимосвязи (корреляции) с другими значимыми переменными процесса, что позволяет использовать показания модели для управления процессом в замкнутом контуре [2].
Обработка данных измерений
Температура и давление верха колонны К-1 регистрируются датчиками TIС1022 и PIС1211. С низа колонны К-1 отбензиненная нефть частично забирается в трубчатую печь П-1, где нагревается и поступает в куб колонны К-1 для поддержания температуры низа. Температура нагретой нефти на входе в колонну регистрируется датчиком TI1021, а остальная нефть пройдя трубчатую печь П-2, расход регистрируется датчиком FICP_2, направляется в сложную колонну К-2, где отбираются все остальные фракции. Температура нефти на входе в колонну К-2 регистрируется датчиком TI1036. Температура и давление верха колонны К-2 измеряются датчиками TIС1032 и PIС1215. Вниз колонны К-2 подается перегретый водяной пар, расход которого фиксируется датчиком FIC1338. С целью рационального использования тепловых потоков применяются 2 циркуляционных орошения (ЦО), расход первого циркуляционного орошения - FIC1330, второго - FIC1337. С верха колонны уходят пары бензина и воды, датчик расхода бензина FIC1333. Для отбора остальных продуктов используют 3 отпарные колонны (стриппинги), вывод 1-го стриппинга (керосиновая фракция КФ), 2-го стриппинга (дизельная фракция ДФ) и 3-го сриппинга (атмосферный газойль АГ) расходы регистрируются датчиками FIC1334, FIC1335, FIC1336. Потоки керосиновой и дизельной фракции объединяются в целевую фракцию ЦФ (целевой продукт). Температуры на перетоке из колонны в стриппинги регистрируются датчиками TI1039, TI1040, TI1041. В нижнюю часть стриппингов подается перегретый водяной пар, расход которого фиксируется датчиками FIC1339, FIC1340, FIC1341. Расход остатка колоны К-2, мазута, регистрируется датчиком FIC1307.
Идентификация моделей ВА для оценивания качества продуктов включат в себя следующие стадии: обработка данных измерений, формирование обучающей и проверочной выборок, идентификация структуры модели, выбор входов и определение параметров модели. Далее каждый шаг будет рассмотрен подробнее. 2.2 Обработка данных измерений
Для получения моделей в процессе обработки данных показаний контрольно-измерительных приборов решались следующие проблемы: 1) некорректная величина измерения (выброс); 2) частичное отсутствие измерений; 3) шумовая составляющая; 4) мультиколлинеарность данных; 5) смещение данных; 6) задержка измерений выхода; 7) несовпадение времени измерений входов и выхода; 8) извлечение измерений выхода. Некорректная величина измерения (выброс). Частичное отсутствие измерений. Если при получении статической модели, каждому измерению выхода соответствует одно измерение входа и отсутствие или некорректность измерения в какой-то момент времени может не повлиять, то для динамической модели, когда измерение выхода зависит от динамики изменения входа, т.е. от нескольких измерений входа. Данная проблема может привести к необходимости исключения измерения выхода из выборки. При наличии малой выборки, данное действие приводит к сокращению выборки измерений выхода, получению модели худшего качества. Под малой выборкой понимается выборка, в которой на один оцениваемый параметр модели ВА приходится до пяти измерений выхода модели.
Чтобы избежать исключения измерения выхода при отсутствии (некорректности) измерения по входу, данные матрицы измерений входов обрабатываются следующим образом. Отсутствующему измерению входа присваивается предыдущее (корректное) измерение по данному входу. Если отсутствует первое измерение по входу, то первому измерению входа присваивается первое по времени известное (корректное) измерение.
Если отсутствует (некорректно) измерение выхода, то данное измерение исключается из выборки. Некорректность измерения определяется на основании рабочих диапазонов величины входов и выхода.
Также использовался дополнительный алгоритм обработки оперативно измеряемых показаний контрольно-измерительных приборов, состоящий из комбинации условий для исключения единичных выбросов. Если (/)- показания контрольно-измерительного прибора на шаге і, х(і)- измененные показания ЛГ-1 2 ( +1)- (0 контрольно-измерительного прибора на шаге і, х = среднее м-1 значение модуля изменения величины входа, м- количество измеренных показаний входа, к1, к2 - коэффициенты, фиксирующие во сколько раз допустимо превышение среднего значения, используются следующие условия: а. х(/)-х(/-1) 1х - превышение среднего значения в к1 раз приращения измененных показаний контрольно-измерительного прибора на шаге і. - превышение среднего значения в к1 раз приращения показаний контрольно-измерительного прибора на шаге і. c. \х(і + 1)-х(і)\ к1х - превышение среднего значения в к1 раз приращения показаний контрольно-измерительного прибора на шаге /+1. d. JC(/)-JC(/-1) 23C - превышение среднего значения в к2 раз приращения показаний контрольно-измерительного прибора на шаге і. e. JC(/-1)-JC(/-1) 2JC- превышение среднего значения в к2 раз разницы измененных и неизмененных показаний контрольно-измерительного прибора на шаге /-1. Изменение значение входа на шаге і, т.е. х(і) = х(і-\), делается при выполнении логических комбинации условий: (a b c ) d e, (2.1) где - операция логического умножение, - операция логического сложение. Пример обработанных данных представлен на рисунке 2.2 80 70 60 50 40 30 20 10 необработанные данные обработанные данные 19.01.15 23.01.15 26.01.15 30.01.15 Период времени Шумовая составляющая. Для решения проблемы присутствия в данных шумовой составляющей в процессе определения параметров модели использовалось усреднение показаний входов модели. Мультиколлинеарность данных. Для решения данной проблемы при определении параметров модели использовались метод гребневой регрессии, метод Лассо, шаговая регрессия, частный метод наименьший квадратов (проекция на скрытые структуры).
Смещение данных. Данные измерений, где было выявлено отклонение показаний контрольно-измерительных приборов, не отображающее изменение состояния процесса, не использовались при формировании выборок для определения модели ВА.
Задержка измерений выхода. Задержка поступления измерений выхода модели относительно времени измерения входов была скомпенсирована сопоставлением времени измерения выхода времени измерения показаний входов модели (датчиков).
Строгая модель атмосферного блока ЭЛОУ АВТ-2
Сглаживание переходных характеристик осуществляется обнулением коэффициентов детализации dz,i от первого до выбранного уровня разложения, при котором из переходных характеристик удаляются высокочастотные составляющие ограниченного частотного спектра, определяемого выбранным вейвлетом.
При использовании в качестве критерия выбора уровня разложения в вейвлет-преобразовании, до которого осуществляется сглаживание переходных характеристик, качества полученной на обучающей выборки модели, для проверочной выборки были получены результаты для различных вейвлетов пакета Wavelet Toolbox (MATLAB) [117]. Результаты приведены в таблице 2.8. Показатели качества модели, полученной без использования сглаживания, приведены в таблице 2.9. Таблица 2.8 – Качество моделей при автоматическом выборе уровня разложения до которого осуществляется сглаживание При выборе уровня разложения, до которого осуществляется сглаживание, вручную, на основании сохранения тренда переходных характеристик был получен результат, указанный в таблице 2.10.
На основании полученных результатов качества моделей сделан вывод о необходимости сглаживания переходных характеристик вручную до сохранения тренда. Тестирование предложенного метода сглаживания для объектов промышленной установки первичной переработки нефти показало, что снижение среднеквадратической ошибки прогнозных значений выхода ВА на проверочной выборке может составлять до 15 % [112].
Для сравнения результатов сглаживание переходных характеристик различными методами, использовались следующие методы: 1. Скользящее среднее. 2. На основе построения линейной регрессионной модели. 3. На основе построения квадратичной регрессионной модели. 4. Фильтр Савицкого-Голея. 5. Робастная версия метода 2. 6. Робастная версия метода 3. 7. На основе вейвлет-преобразования. Полученные результаты для указанных методов приведены в таблице 2.11. По результатам видно, что лучшая величина критерия качества модели получена при сглаживании ПХ с помощью предложенного метода на основе вейвлет-преобразования.
Преимуществом использования динамических моделей является возможность автоматического определения временной задержки от каждого входа к выходу. При верном выборе структуры модели и отсутствии шумовой составляющей в измерениях входов, выхода, начальные коэффициенты импульсной характеристики до времени запаздывания показаний выхода будут равны нулю. На практике, при неизвестности структуры модели и наличии шумовой составляющей начальные коэффициенты нулю не равны.
Время запаздывания показаний выхода для динамических моделей определялось также как и для статических моделей с помощью: 1) взаимнокорреляционной функции; 2) перебором задержки с определение ее величины, обеспечивающей получение модели лучшего качества. С учетом важности оперативного получения показаний, перед определением модели, время измерения показаний выхода соотносится с соответствующим временем измерением показаний входов. После определения качества модели при различной величине задержки при идентификации модели ВА использовалась максимальная величина запаздывания, при котором качество модели сопоставимо с наилучшим. В таблице 2.12 в столбцах 2-5 приведены показатели качества модели в зависимости от используемой задержки. В столбцах 6-7 приведены показатели качества для данных моделей, полученные для одной и той же задержки равной 120 минутам на проверочной выборке. В отличие от линейной регрессионной модели показания моделей на проверочной выборке до величины фактического времени запаздывания реального объекта сопоставимы, на проверочной выборке при использовании одинаковой задержки для данных моделей, полученных при различных задержках, результаты наоборот значительно различаются. Данных факт объясняется подстраиванием моделей под указанную при определении моделей величину задержки. У статической модели нет возможности подстроиться под указанную при определении моделей величину задержки.
В отличие от статической модели для динамической модели не требуется определение интервала усреднения. Для нее используются дополнительные параметры: временной интервал между используемыми измерениями входов и глубина модели (используется одно значение глубины модели для всех входов динамической модели), определяемые перебором диапазона, полученного исходя из физико-химической сущности технологического процесса. Физический смысл глубины модели в длительности динамики процесса. Недостаточная глубина модели ухудшит качество модели, избыточная глубина модели требует большего количества измерений выхода. При уменьшении интервала между используемыми измерениями входов полученные модели лучше улавливают динамику процесса, но требует большего количества измерений выхода для определения параметров импульсных характеристик.
Величина интервала между используемыми измерениями входов, также как глубина модели, индивидуальна для каждого входа, в данной работе величина данных параметров взята идентичной для всех входов. В таблице 2.13 и таблице 2.14 представлены показатели качества модели, прогнозирующей качество продукта процесса первичной переработки нефти при различных интервалах между используемыми измерениями входов и глубине модели.
Тестирование предложенных алгоритмов на промышленных данных
Загрузка данных измерений. Выполняется загрузка показаний контрольно-измерительных приборов, измеряющихся регулярно и являющихся входами линейной регрессионной модели, и данных измерений оцениваемого показателя качества, являющегося выходом модели. Загрузка данных осуществляется через Меню/Загрузить входы и Меню/Загрузить выход.
Формат загружаемых файлов csv (от англ. Comma-Separated Values -значения, разделённые запятыми) - текстовый формат, предназначенный для представления табличных данных. Файлы можно открывать, формировать, редактировать в текстовом редакторе. Структура файла представляет собой матрицу, состоящую из элементов. Строки файла представляют собой строки матрицы, элементы в строке, разделенные точкой с запятой образуют столбцы матрицы. Данные файлы можно открывать, формировать, редактировать также в программах, представляющих данные в виде таблицы (Microsoft Office Excel). Рисунок 5.1 – Файл измерений входов
Для того чтобы данные были восприняты программой первая строка должна представлять совой название столбцов. Для файла измерений входов это название входов, для файла с данными выхода название первого столбца произвольное, но не пустое, второй столбец название выхода. Последующие строки файла данных входов должны содержать числовые значения регулярных измерений входов (рисунок 5.1). Для файла измерений выхода со второй строки первый столбец содержит номер строки входов (без учета первой строки с названиями столбцов), соответствующий времени измерения выхода. Второй столбец выхода содержит соответствующую первому столбцу величину измерения выхода (рисунок 5.2).
Программа производит обработку загруженных данных. Для данных входов обработка представляет собой замену отсутствующего (пустого) значения на предыдущее (строка выше). Соответственно, если отсутствует элемент второй строки файла, будут проверяться значения входа ниже, при обнаружении оно будет присвоено элементу второй строки. Если в файле после второй строки присутствует нечисловое значение (кроме отсутствующего значения), будет выдано сообщение о наличии нечислового значения. Для данных выхода после первой строки, при отсутствии значения в первом и втором столбце, данная строка учитываться программой не будет.
Доступные для изменения параметры.
1. Интервал усреднения (рисунок 5.3). В связи с тем, что модель виртуального анализатора статическая, каждому измерению выхода соответствует по одному измерению входа. При наличии значительной шумовой составляющей в измерениях входа, ее влияние можно уменьшать, используя усредненное значение измерений входа на заданном интервале, от текущего измерения и до предыдущего, определяемого величиной интервала усреднения. При выборе значения интервала равного 1, будет использоваться только текущее измерение входов (соответствующее измерению выхода). Недостатком выбора значительного интервала усреднения является искажение данных измерений входов, особенно проявляющимся при динамическом режиме работы объекта.
2. Процент обучающей выборки в данных. Загруженные данные измерений выхода делятся на следующие друг за другом две выборки, обучающую и проверочную. На обучающей выборке определяются значения параметров модели, на проверочной, оценивается качество полученной модели. Величина параметра определяет процент обучающей выборки от обработанных загруженных данных измерений выхода.
3. Гребневый коэффициент. Штрафует значения нормы вектора полученных параметров. В случае мультиколлинеарности, когда между входами имеется почти линейная зависимость, имеется бесконечно много решений, обеспечивающих близость полученных с помощью модели оценок выхода к результатам его измерений. Следует учесть, что увеличение значения гребневого коэффициента ведет к уменьшению модуля величины параметра модели, при этом величина оценки выхода стремится к среднему значению измерений выхода на обучающей выборке.
4. Задержка измерений выхода. Измерения выхода могут измеряться с задержкой. Физически место отбора пробы продукта может располагаться на удалении от контрольно-измерительных приборов, обеспечивающих данными входы. Для соответствия времени измерения выхода с измерениями входов необходимо сдвигать назад время измерения выхода.
5. Начальный элемент выборки выхода. Служит для сокращения величины выборки выхода, причина которой может заключаться либо в отсутствующих измерениях входов (соответствующих первому столбцу входов), либо наличия в начале выборки некорректных измерений.