Содержание к диссертации
Введение
1 . Состояние вопроса и задачи исследования 12
1.1 Анализ электропотребления горного предприятия ОАО «Качканарский ГОК «Ванадий» 12
1.1.1 Исследование существующего метода прогноза электропотребления 12
1.1.2 Анализ электроснабжения фабрики окускования 15
1.2 Анализ технологического процесса и основного оборудовании фабрики окускования 18
1.2.1 Технология добычи и переработки руды на ГОКе 18
1.2.2 Шихтоподготовка 19
1.2.3 Производство агломерата 24
1.2.4 Производство окатышей 27
1.3 Анализ методов прогнозирования. Выбор метода прогнозирования элек тропотребления горного предприятия 32
1.3.1 Общие сведения о прогнозировании. Выбор метода прогнозирования 32
1.3.2 Основные положения теории искусственных нейронных сетей 35
1.3.3 Сбор и обработка данных для нейронной сети 49
1.4 Цели и задачи исследований 55
2. Синтез нейронной сети, прогнозирующей потребление электрической энергии цехом агломерации 59
2.1 Сбор данных для нейронной сети 59
2.2 Отбор переменных и понижение размерности 62
2.3 Удаление выбросов и препроцессирование 79
2.4 Экспериментирование с обобщенно-регрессионными сетями 83
2.5 Определение архитектуры нейронной сети 87
2.6 Обучение нейронной сети 88
2.7 Анализ полученной нейронной сети 90
2.8 Выводы 100
3. Исследование электропотребления цехов фабрики окускования методом искусственных нейронных сетей 103
3.1 Цех окатышей 103
3.1.1 Сбор данных для нейронной сети 103
3.1.2 Отбор переменных и понижение размерности 104
3.1.3 Удаление выбросов и препроцессирование 110
3.1.4 Экспериментирование с обобщенно-регрессионными сетями 112
3.1.5 Определение архитектуры нейронной сети 115
3.1.6 Обучение нейронной сети 116
3.1.7 Анализ полученной нейронной сети 118
3.2 Технологическая линия по подготовке шихты для агломерации 125
3.2.1 Сбор данных для нейронной сети 125
3.2.2 Отбор переменных и понижение размерности 127
3.2.3 Удаление выбросов и препроцессирование 134
3.2.4 Экспериментирование с обобщенно-регрессионными сетями 136
3.2.5 Определение архитектуры нейронной сети 139
3.2.6 Обучение нейронной сети 140
3.2.7 Анализ полученной нейронной сети 142
3.3 Технологическая линия по подготовке шихты для обжига 150
3.3.1 Сбор данных для нейронной сети 150
3.3.2 Отбор переменных и понижение размерности 152
3.3.3 Удаление выбросов и препроцессирование 159
3.3.4 Экспериментирование с обобщенно-регрессионными сетями 163
3.3.5 Определение архитектуры нейронной сети 166
3.3.6 Обучение нейронной сети 167
3.3.7 Анализ полученной нейронной сети 168
3.4 Исследование разработанной системы прогнозирования потребления электрической энергии фабрикой окускования 178
3.5 Выводы 185
4. Исследование алгоритма работы системы анализа и прогнозирования электропотребления Качканарского ГОКа, основанной на статистическом ме тода корреляционно-регрессионного анализа 188
4.1 Исследование алгоритма анализа и прогнозирования удельного электропотребления 188
4.2 Исследование алгоритма анализа и прогнозирования общего электропотребления 192
4.3 Выводы 195
5. Сравнительный анализ и технико-экономические показатели существующей и разработанной на основе метода искусственных нейронных сетей систем прогнозирования потребления электроэнергии 196
5.1 Сравнительный анализ систем прогнозирования потребления электрической энергии 196
5.2 Методика определения стоимости электрической энергии 202
5.3 Оценка экономического эффекта от использования разработанной на основе метода искусственных нейронных сетей системы прогнозирования электропотребления 206
5.4 Выводы 211
Заключение 212
Библиографический список
- Анализ электропотребления горного предприятия ОАО «Качканарский ГОК «Ванадий»
- Сбор данных для нейронной сети
- Сбор данных для нейронной сети
- Исследование алгоритма анализа и прогнозирования удельного электропотребления
Введение к работе
Актуальность работы. Для крупных горных предприятий в условиях современного энергорынка актуальной задачей является составление достоверной заявки для электроснабжающей организации на потребление электроэнергии на некоторый срок вперед, позволяющей существенно снизить финансовые издержки, связанные с отклонениями фактического потребления электроэнергии от заявленного. Как правило, в соответствии с условиями договора электроснабжения, предприятие-потребитель обязано ежегодно предоставлять заявку на плановое потребление электроэнергии с разбивкой по месяцам и почасовой детализацией. В связи с этим, у предприятия-потребителя возникает задача краткосрочного и среднесрочного прогнозирования потребления электроэнергии с упреждением один календарный месяц и детализацией один час.
Решение данной задачи -сложный и трудоемкий процесс, особенно для крупных горных предприятий, технологические процессы которых являются сложными и многофакторными. Кроме того, горное предприятие имеет сложную, разветвленную структуру, что делает практически невозможным достижение погрешностью алгоритма прогнозирования на базе распространенного метода корреляционно-регрессионного анализа значения менее 5% [19,38]. График электрической нагрузки каждого предприятия формируется под влиянием большого количества различных факторов. Также, всегда существуют отклонения о г запланированного режима ведения технологического процесса. В результате для крупных горных предприятий актуальной задачей является создание системы краткосрочного и среднесрочного прогнозирования электропотребления, позволяющей минимизировать отклонения величин объема потребляемой от заявленной на рынке электроэнергии. Поэтому исследования, направленные на разработку системы, основанной на нелинейном методе нейро-сетевого моделирования, являются актуальными.
Степень научной разработанности проблемы. Вопросами прогнозирования электропотребления с применением методов нейросетевого моделирования занимаются в Институте систем энергетики им. Мелентьева СО РАН, Но-
восибирском государственном техническом университете, Уральском государственном техническом университете, Пермском государственном техническом университете и ряде других организаций. Результаты исследований в этой области представлены в работах Гамма А.З., Глазуновой A.M., Демура А.В., Сухомлиновой О.А., Олейникова В.К., Богатырёва Л.Л., Воропая Н.И., Колосок И.Н., Готмана Н.Э., Старцевой Т.Б., Курбацкого В.Г., Манова Н.А., Манусова В.З., и других.
Несмотря на широкий спектр работ, в них не рассмотрены вопросы прогнозирования электропотребления на основе метода искусственных нейронных сетей для крупных горных предприятий, бесспорно имеющие свою специфику.
Целью диссертационной работы является разработка и исследование методики прогнозирования потребления электрической энергии фабрикой окускования горно-обогатительного комбината на примере ОАО «Качканарский ГОК «Ванадий» на основе искусственных нейронных сетей, обладающей высокой точностью, достоверностью и устойчивостью в условиях изменения режимов работы предприятия и внешних влияющих факторов, позволяющей предприятию минимизировать отклонение величин объема потребляемой от заявленной на рынке электроэнергии за счет составления достоверной заявки, что приводит к экономии материальных и природных ресурсов государства.
Для достижения сформулированной цели в работе были поставлены и решены следующие задачи:
1. Анализ технологического процесса добычи и переработки руды на
ОАО «Качканарский ГОК «Ванадий», основного технологического и электро
механического оборудования, технологических и энергетических показателей
цехов фабрики окускования.
2. Анализ существующих методов прогнозирования и выбор наиболее со
временного метода, основанного на нелинейных моделях, теории искусствен
ных нейронных сетей, для решения задачи прогнозирования
электропотребления фабрикой окускования.
Исследование и отбор факторов (предикторов), влияющих на потребление электроэнергии каждым цехом фабрики окускования.
Разработка алгоритма синтеза нейронной сети, включающего определение структуры сети, количество слоев и нейронов в слое, функций активации нейронов, и синтез нейронных сетей для каждого цеха фабрики окускования.
Разработка системы прогнозирования потребления электрической энергии фабрики окускования на основе нейронных сетей цехов данной фабрики.
Оценка точности разработанной системы прогнозирования электропотребления фабрики окускования.
Разработка путей повышения точности прогнозирования потребления электроэнергии как отдельными цехами, так и фабрикой окускования в целом.
Исследование влияния упреждения прогноза и точности задания независимых переменных на точность прогнозирования электропотребления.
Разработка и исследование на основе существующего метода планирования электропотребления на ОАО «Качканарский ГОК «Ванадий» алгоритма работы системы анализа и прогнозирования общего и удельного электропотребления, основанного на статистическом методе корреляционно-регрессионного анализа. Результаты, полученные в ходе данного исследования, должны являться базовыми для оценки достоверности результатов, полученных при прогнозировании электропотребления методом искусственных нейронных сетей.
10. Выполнение сравнительного анализа существующей и разработанной
систем прогнозирования потребления электроэнергии путем расчета экономи
ческого эффекта от внедрения системы прогнозирования электропотребления
основанной на методе искусственных нейронных сетей.
Методы исследования. Для решения поставленных задач в работе использовались положения теории вероятности, принципы системного подхода, методы математической статистики и нейросетевого моделирования. Теоретические исследования сопровождались разработкой различных математических моделей, реализованных на ПЭВМ в виде программных средств в системе Mat-
8 Lab. Исследование алгоритмов прогнозирования электропотребления проведено на основе экспериментальных данных, полученных на предприятии ОАО «Качканарский ГОК «Ванадий».
При выполнении работы использованы научные труды, результаты теоретических и экспериментальных исследований по данной теме российских и зарубежных специалистов, материалы научно-технических конференций и семинаров.
Научная новизна работы состоит в следующем:
1. Разработана модель прогнозирования потребления электроэнергии фабрикой окускования горно-обогатительного комбината, основанная на методе искусственных нейронных сетей, характеризуемая повышенной точностью прогнозирования по сравнению с известными. В результате проведенного анализа погрешности прогнозирования для известных видов нейронных сетей установлено, что для фабрики окускования нейронные сети должны описывать соответствующие технологические комплексы производства отдельных компонентов готовой продукции. Поэтому модель имеет модульную структуру, каждый модуль представляет собой многослойную нейронную сеть цеха фабрики с прямым распространением сигнала без обратных связей со следующими параметрами: размерность вектора входных данных от 15 до 17 элементов; первый скрытый слой нейронов с логистическими функциями активации, который содержит 11 или 12 нейронов; второй скрытый слой нейронов с логистическими функциями активации или гиперболическим тангенсом, который содержит 9 или 10 нейронов; одни нейрон выходного слоя с линейной функцией активации; число синаптических связей от 295 до 322. Для обучения применялся нелинейный метод Левенберга-Марквардта с учителем, который показал наилучшие показатели сходимости. Целевая функция обучения - минимум среднего квадратического отклонения между фактическим значением потребления электроэнергии и полученным на выходе сети.
9 2. Определен набор статистических методов и методика их применения, позволяющие установить показатели влияния входных факторов на величину электропотребления. Такими методами являются методы аналитической группировки, в том числе многофакторной аналитической группировки, оценки надежности корреляционных связей между переменными, анализа трехмерной диаграммы рассеяния. В результате применения методов отобраны значимые входные факторы для синтеза нейронных сетей цехов фабрики. Определено, что вероятность ошибочного установления связи между отобранными для обучающего множества входными факторами и прогнозируемой величиной составляет менее 1%.
Практическая ценность работы. Результатом выполненных исследований является разработанная модель, которая лежит в основе системы прогнозирования электропотребления фабрики окускования горно-обогатительного комбината, основанная на методе искусственных нейронных сетей. Разработанная система позволяет определять перспективные объемы электропотребления для составления достоверной заявки при покупке электроэнергии на оптовом или розничном рынке, что ведет к экономии финансовых средств предприятия-потребителя. Защищаемые научные положения позволяют проводить достаточно точное краткосрочное и среднесрочное прогнозирование, пересмотреть установленные подходы к прогнозированию электропотребления на горных предприятиях, производить текущее уточнение прогнозов для целей регулирования электропотребления. Разработанные принципы формирования набора исходных данных, а также предложенная система прогнозирования могут использоваться для различных горных и промышленных предприятий.
Проведена оценка экономического эффекта от внедрения разработанной системы прогнозирования электропотребления на основе метода искусственных нейронных сетей при погрешности задания входных переменных ±15%, условии постоянства цен на электроэнергию (эффект рассчитан за 2007 г. по фабрике окускования при годовом электропотреблении - 393 млн. кВт-ч). Снижение платы за электроэнергию по данным за 2007 г. составляет при упреждении
10 прогноза одни сутки - 3,3 млн.руб. с НДС, при упреждении прогноза 30 суток -2,8 млн.руб. с НДС.
Выполненный сравнительный анализ эффективности использования разработанной системы прогнозирования с существующей на предприятии системой, основанной на традиционных вероятностно-статистических методах, показал целесообразность применения метода искусственных нейронных сетей в задачах прогнозирования электропотребленры крупных горных предприятий в новых рыночных условиях.
Реализация работы. Результаты диссертационной работы приняты к внедрению на ОАО «Качканарский горно-обогатительный комбинат «Ванадий».
Обоснованность и достоверность научных положений подтверждена корректным применением классических методов математической статистики, апробированных структур искусственных нейронных сетей, использованием обучающих множеств, объединяющих фактические данные измерений, контроля и наблюдений за три года, численными экспериментами на ЭВМ с использованием контрольного и тестового множеств.
Установлены показатели точности решения задачи прогнозированрія электропотребления фабрикой окускования.
При точном соответствии значений запланированной и произведенной продукции относительное среднее квадратическое отклонение прогноза составляет 2,98%.
При погрешности задания входных факторов ±15% математическое ожидание среднего квадратического отклонения прогноза на 30 суток вперед на тестовом множестве не превышает 3,37% от среднего значения потребления электрической энергии фабрикой окускования за расчетный период, при упреждении прогноза одни сутки - 3,15%. Аналогичный показатель для существующей на ОАО «Качканарский горно-обогатительный комбинат «Ванадий» системы равен 5,22%.
Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на первой молодежной научно-практической конференции ООО «УГМК-Холдинг», 2003 г., на научных конференциях Уральского государственного горного университета в 2003-2008 гг.
Публикации. По теме диссертации опубликовано пять печатных работ.
Анализ электропотребления горного предприятия ОАО «Качканарский ГОК «Ванадий»
ОАО «Качканарский горно-обогатительный комбинат «Ванадий» (далее ГОК) является крупным потребителем электрической энергии. Его годовое потребление составляет порядка двух миллиардов киловатт-часов. Планирование потребления в настоящее время ведется по нормам на производство продукции, а его точность оставляет желать лучшего. Удельный расход электрической энергии принимается с учетом данных аналогичного периода прошлого года. Планирование электропотребления осуществляется сроком на один год с разбивкой по месяцам.
Электроэнергия для нужд ГОКа приобретается на розничном рынке электрической энергии и мощности у энергоснабжающей организации в соответствие с заключенным договором электроснабжения. В соответствие с этим договором ГОК обязуется ежегодно предоставлять заявку на плановое потребление электроэнергии с разбивкой по месяцам и почасовой детализацией. При этом за ним остается право ежемесячно корректировать количество приобретаемой энергии. Таким образом, в соответствие с договором электроснабжения, ГОКу необходим точный прогноз с упреждением один календарный месяц и детализацией один час. В связи с тем, что информация о почасовом потреблении электроэнергии на предприятии не была предоставлена, в данной работе поставлени и решена задача прогнозирования за период времени, равный одной смене.
Для планирования режимов работы энергетического оборудования, планирования и анализа предстоящих затрат на производство продукции, а также последующего анализа отклонений необходима разбивка потребления электро- энергии по структурным подразделениям комбината. Поэтому целесообразно делать прогноз для каждого цеха в отдельности, а заявленное количество приобретаемой электроэнергии определять как сумму полученных величин. В качестве объекта, для которого делается прогноз, выбрана фабрика окускования. Выбор обусловлен наличием достаточного количества информации о данном объекте, собранной на предприятии. При планировании на фабрике выделяют три объекта: цех агломерации, цех окатышей и цех шихтоподготовки, причем затраты электроэнергии на подготовку шихты для агломерации и обжига планируются и учитываются отдельно.
Потребление электроэнергии цехами фабрики окускования за 2007 г. приведено в табл. 1.1. По результатам этой таблицы построена круговая диаграмма структуры годового потребления электроэнергии фабрикой окускования (рис. 1.1), из которой видно, что большая часть потребления электроэнергии (64,10%) приходится на цех окатышей, в два раза меньше (31,98%) - на цех агломерации, на цех шихтоподготовки приходится 3,92% от общего потребления.
Таким образом, особое внимание следует уделить прогнозированию потребления электроэнергии цехами окатышей и агломерации, т.к. величина отклонения фактического потребления электроэнергии фабрикой окускования от запланированного будет определяться, в основном, точностью этого прогноза. Удельный расход электроэнергии принимается с учетом данных аналогичного периода прошлого года. Плановое потребление электроэнергии цехом агломерации и технологической линией по подготовке шихты для агломерации определяется по нормам на производство агломерата, а потребление электроэнергии цехом окатышей и технологической линией по подготовке шихты для обжига - по нормам на производство окатышей. К№" норма удельного расхода электроэнергии цехом окатышей, кВт-ч/т; - норма удельного расхода электроэнергии на подготовку шихты для обжига, кВт-ч/т; 0, — плановое производство окатышей, т. Используемый на предприятии метод прогнозирования не точен, погрешность прогноза составляет более 5%, при этом среднее значение модуля абсолютной ошибки прогнозирования, остается достаточно высоким [19,38,44]. Метод сопряжен с большим объемом работы по ручному сбору информации о потреблении электроэнергии, объемам производства продукции структурными подразделениями комбината. На предприятии отсутствует автоматизированная система контроля и учета электропотребления, недостаточно узлов технического учета по показаниям которых можно было бы достаточно точно оценить объемы электропотребления отдельных технологических переделов предприятия. Уменьшить погрешность прогнозирования возможно за счет внедрения системы АСКУЭ, которая позволит автоматизировать процесс сбора и организации массива исходных данных, для проведения алгоритма расчета прогнозируемых параметров электропотребления. При этом погрешность прогноза можно снизить до величины не более 5% [62].
Сбор данных для нейронной сети
Следуя рекомендациям пункта 1.3.3.1, первоначально следует отбирать все переменные, которые по имеющимся из предметной области знаниям могут оказать влияние на прогнозируемую величину. В данном случае прогнозируемой величиной является потребление электрической энергии цехом агломерации. В [1,61] выделены следующие значимые факторы: сезонность колебаний энергопотребления, температура окружающей среды, принадлежность дней недели к типам, освещенность, влажность и атмосферное давление. Ниже приведено обоснование влияния каждого из указанных факторов на прогнозируемую величину.
В качестве примера влияния времени года на потребление электроэнергии в вышеуказанном источнике рассмотрен график энергопотребления Новосибирска с 2004 по 2006 год, на котором однозначно прослеживается синусоида с периодом 365 дней.
Влияние температуры связано с тем, что жизнедеятельность человека, технологические процессы на предприятиях и заводах требуют создания специальных условий, одним из которых является поддержание температуры помещений на определенном уровне. Очевидно, что энергозатраты на поддержание температуры внутри помещений на требуемом уровне пропорциональны отклонению температуры внешней поверхности стен помещения от этого уровня.
Также в этом источнике приведены графики усредненного за год потребления электроэнергии в зависимости от времени суток. Из графиков видно, что характер энергопотребления можно разбить на пять типов: понедельник, вторник-четверг, пятница, суббота и воскресение.
Влияние освещённости на энергопотребление наиболее сильно проявляется в утренние и вечерние часы. Однако при этом следует заметить, что этот параметр наиболее заметно влияет на энергопотребление в крупных городах, где доля энергопотребления населения сравнима с промышленной. Поэтому можно сделать вывод, что на потребление электроэнергии промышленных предприятий этот параметр влияет слабо. Кроме того, большинство помещений фабрики окускования являются зарытыми, поэтому естественное освещение составляет незначительную часть от общего.
Влажность сказывается на человеческом факторе восприятия температуры, а также на теплопроводности воздушного слоя. Но влияние этого фактора, как и предыдущего, проявляется в крупных городах. При прогнозировании потребления электроэнергии влиянием этого фактора также можно пренебречь.
Атмосферное давление и его изменение влияет на человеческий фактор. Как и в предыдущем случае, отмечено, что влияние этого фактора в промышленных городах минимально, поэтому этим фактором также пренебрегают при прогнозировании энергопотребления промышленных предприятий.
Можно использовать априорную информацию об объекте прогнозирования и дополнить список факторов, влияющих на потребление электроэнергии цехом агломерации. Такими факторами являются фактическое производство агломерата, номер смены (время суток), пуски технологических линий.
Влияние количества выпущенной продукции на энергопотребление очевидно (чем больше объем выпускаемого агломерата, тем выше потребление электрической энергии) и не требует каких-либо пояснений.
Номер смены напрямую связан со временем суток. Очевидно, что в ночные смены в цехе отсутствует персонал, работающий по восьмичасовому графику, и, таким образом, ночью снижается потребление электроэнергии на бытовые нужды, но повышается потребление электроэнергии на искусственное освещение (внутреннее и наружное).
Пуски технологических линий дают сильные скачки потребления электрической энергии. Кроме того, количество работающих технологических линий определяет удельные затраты электроэнергии на производство агломерата, поэтому этот фактор также необходимо учитывать.
Также следует помнить о том, что потребление электроэнергии представлено временным рядом, поэтому существует связь между членами самого ряда [51].
На предприятии была собрана следующая информация: - потребление электрической энергии; - фактическое производство агломерата; - время работы агломашин; - график работы персонала, работающего по пятидневной рабочей неделе.
На областной метеостанции была получена следующая информация: - среднее, максимальное и минимальное значения температуры уличного воздуха; - среднесутчоное значение атмосферного давления на уровне моря.
Метеорологические данные собраны с детализацией один день, остальные - одна смена. Всего собрано 4523 наблюдения, включающих в себя потребление электрической энергии, фактическое производство агломерата, время работы агломашин; из них 4382 наблюдения содержат среднее, максимальное и минимальное значения температуры уличного воздуха, из которых 2860 наблюдений содержат среднесуточное значение атмосферного давления. Такой объем должен обеспечить репрезентативность обучающей выборки - ее способность полно и адекватно представлять свойства гипотетической генеральной совокупности [23]. В силу большого объема данных в работе приводятся только те наблюдения, которые необходимы для демонстрации расчетов.
Время суток можно заменить номером смены. Первая смена соответствует периоду с 20:00 часов предыдущих суток до 8:00 часов текущих суток, вторая смена - периоду с 8:00 часов до 20:00 часов текущих суток.
Сбор данных для нейронной сети
Суть экспериментов с обобщенно-регрессионными сетями заключается в поиске и исключении из обучающего множества малозначимых переменных, с целью уменьшения размеров сети и повышения точности прогноза. В п. 1.3.2.2 были выявлены корреляции принятых к рассмотрению независимых переменных с потреблением электрической энергии. Также было отмечено, что корреляционная связь потребления электрической энергии с атмосферным давлением, статусом дня и номером смены является слабой, однако данные о статусе дня и номере смены были включены в обучающее множество для обобщенно-регрессионных нейронных сетей, чтобы оценить влияние их наличия на точность прогноза.
Изначально, все данные 4382 наблюдений были введены в рабочее пространство MatLab в виде структуры с именем BaseA. После масштабирования переменных в соответствии с формулой (2.14) и табл. 2.14 эти данные были переписаны в структуру DataA. После этого в структуру было добавлено поле lag, содержащее десять векторов последовательных значений потребления электрической энергии цехом агломерации, образованных смещением исходного вектора на величину запаздывания от 1 до 10 элементов. Следующим этапом является удаление элементов векторов с номерами, записанными в поле Datalndex структуры surges. При этом следует учитывать, что при создании массивов предыдущих значений, записанных в поле lag, в них попали и значения выбросов, поэтому во всех полях структуры Da taA должны быть удалены элементы с номерами, записанными в surges, и последующие 10 элементов. После этого во всех полях удаляются десять первых элементов, а в поле lag - дополнительно последние десять элементов. Это необходимость связана с тем, что первые и последние десять элементов поля lag содержат некорректные значения. Описание полученной в результате описанных преобразований структуры DataA приведено в виде табл. 2.15. каждое поле представляет собой вектор из 4284 значений
Структура DataA является базой для формирования обучающего и контрольного множеств. Обучающее множество в системе MatLab должно состоять из двух матриц - входной и целевой. Строка входной матрицы представляет собой вектор значений, принимаемых входной переменной, а целевой матрицы — прогнозируемой переменной [3]. Поэтому поля структуры DataA, в соответствие с рекомендациями [68], в случайном порядке записываются в строки матрицы Inputs, размерностью 17x4284 элемента. В целевую матрицу-строку Output записывается поле структуры DataA.
Контрольное множество формируется путем изымания случайных столбцов матрицы Inputs, характеризующих некоторый образ.
В результате получаем обучающее множество, состоящее из 3784 обучающих примеров, и контрольное множество, состоящее из 500 примеров. После того, как первые обучающее и контрольное множества сформированы, можно переходить непосредственно к экспериментам с обобщенно- регрессионными нейронными сетями.
Целью экспериментов является отыскание наилучшего набора переменных для обучающего множества классической нейронной сети прямого распространения. Поэтому в процессе экспериментов необходимо оценивать точность прогноза, даваемого обученной обобщенно-регрессионной сетью. Т.е. критерием качества прогноза, даваемого нейронной сетью, является остаточная дисперсия реального значения потребления электроэнергии, не объясняемая нейронной сетью SyV , кВт2-ч2: 4 = — , (2.15) где Wt — значение потребления электрической энергии на выходе нейронной сети, о.е.; W, - масштабированное фактическое значение потребления электрической энергии, о.е. W0 — базисное значение потребления электрической энергии, кВт-ч N— число элементов контрольного множества. Результаты экспериментов приведены в табл. 2.16.
Эксперименты с обобщенно-регрессионными нейронными сетями (табл. 2.16) полностью подтверждают оценки корреляционной связи между переменными, сделанные в разделе 2.2 (см. табл. 2.12): при удалении независимых переменных, более сильно коррелированных с прогнозируемой величиной, наблюдается большее снижение точности прогноза, при удалении малозначимых переменных наблюдается повышение точности. Также данные табл. 2.16 подтверждают предположение о том, что совокупность переменных Qa, Т\ и Т2 несет в себе существенную информацию, которая не содержится ни в переменной Ол ни в переменных Т] и Гг, поэтому удаление одной из этих переменных снижает точность прогноза.
При уменьшении количества учитываемых предыдущих значений ряда также наблюдается снижение точности прогноза. Таким образом, окончательно принято решение, что обучающее множество должно содержать следующие независимые переменные: - количество фактически произведенного за смену агломерата; — время работы агломашин; - среднесуточное значение температуры уличного воздуха; - порядковый номер дня в году; - значения потребления электрической энергии в предыдущие десять смен.
Как говорилось выше, прогнозирование потребления электрической энергии будет осуществляться классической многослойной нейронной сетью с прямым распространением сигнала без обратных связей, т.к. сети этого типа получили наибольшее распространение для решения задач регрессии [35,50,61,62,77]. В п. 1.3.2.5 была отмечена необходимость экспериментов с количеством слоев сети и количеством нейронов в слое. Первоначально следует принять к рассмотрению сеть с одним скрытым слоем. Количество нейронов скрытого слоя можно оценить по выражениям (1.5), (1.6), (1.8). Для этого необходимо определить числом элементов обучающего множества.
Для объективной оценки точности прогнозирования понадобится тестовое множество, содержащее в себе и значения выбросов. Кроме того, для обучения нейронной сети и экспериментов с ее архитектурой понадобятся обучающее и контрольное множество. В разделе 2.4 был описан процесс формирования структуры DataA, являющейся базой для создания обучающего и тестового множеств. В данном случае эта структура формируется аналогично, за исключением процедуры удаления выбросов: элементы с номерами от 4199 и более не удаляются, т.к. в качестве тестового множества решено использовать последние 184 наблюдений (четвертый квартал последнего года). Использование большего количества наблюдений приведет к уменьшению объема обучающего множества, что скажется на точности прогнозирования.
Исследование алгоритма анализа и прогнозирования удельного электропотребления
Наибольшую плотность связи с потреблением электрической энергии цехом окатышей имеют количество произведенных за смену окатышей и время работы обжиговых машин. Поэтому процедура удаления выбросов аналогична описанной в разделе 2.3: с помощью графических средств системы MatLab строится трехмерная диаграмма рассеяния, на которой отыскиваются выбросы, после этого они записываются в рабочее пространство системы MatLab в виде структуры с именем surges. Выбросы в зависимостях потребления электрической энергии от других предикторов выявить будет очень сложно, т.к. большая часть вариации прогнозируемой переменной объясняется временем работы обжиговых машин и производством окатышей, поэтому точки на диаграммах рассеяния в зависимости от других переменных будут сильно разбросаны. Кроме того, в силу меньшей плотности связи, выбросы зависимостей потребления электрической энергии от других переменных оказывают меньшее влияние на процесс обучения.
Для построения трехмерной диаграммы рассеяния в рабочее пространство MatLab из собранной базы данных вводятся векторы О, Т и JF, содержащие 4382 последовательных значения количества произведенных окатышей, суммарного времени работы обжиговых машин и потребления электроэнергии цехом окатышей соответственно. Вращая диаграмму с помощью инструмента Rotate 3D, находим выбросы, которые передаем в рабочее пространство MatLab, используя инструмент Data Cursor. Всего было обнаружено девять выбросов, результат проделанных операций изображен на рис. 3.1. Как и в случае с цехом агломерации, зависимость потребления электроэнергии на рассматриваемой диаграмме рассеяния представлена некоторой поверхностью, но в данном случае точки более плотно группируются вблизи одной линии, принадлежащей этой поверхности. После того, как выбросы найдены, переходим к масштабированию переменных. Масштабирование осуществляется в соответствии с выражением (2.14). Параметры этого выражения приведены в табл. 3.10. Пере Эксперименты осуществляются аналогично методике, изложенной в разделе 2.4. Перед началом экспериментов в структуру DataO добавляется поле lag, содержащее десять векторов последовательных значений потребления электрической энергии цехом окатышей, образованных смещением исходного вектора на величину запаздывания от 1 до 10 элементов.
Следующим этапом является удаление выбросов. Для этого во всех полях структуры DataO удаляются элементы с номерами, записанными в surges, и последующие 10 элементов. После этого во всех полях удаляются десять первых элементов, а в поле lag — дополнительно последние десять элементов. Описание полученной в результате описанных преобразований структуры DataO приведено в виде табл. 3.11.
Процедура создания обучающего и контрольного множеств аналогична описанной в разделе 2.4. Поля структуры DataO в случайном порядке записываются в строки матрицы Inputs. В целевую матрицу-строку Output записывается поле W структуры DataO. Контрольное множество формируется путем изы-мания случайных столбцов матрицы Inputs. После того, как первые обучающее и контрольное множества сформированы, переходим непосредственно к экспериментам с обобщенно- регрессионными нейронными сетями. Следует обратить внимание на то, что в данном пункте к рассмотрению приняты среднесуточное и крайние значения температуры воздуха за сутки.
Производство агломерата за текущую смену Статус текущего дня
Время работы обжиговой машины №1 за текущую смену Время работы обжиговой машины №2 за текущую смену Время работы обжиговой машины №3 за текущую смену Время работы обжиговой машины №4 за текущую смену Потребление электроэнергии цехом окатышей за текущую смену Текущий номер смены Порядковый номер текущего дня в году Среднесуточная температура воздуха за текущие сутки Крайние значения температуры воздуха за текущие сутки Потребление электроэнергии цехом окатышей одну смену назад Потребление электроэнергии цехом окатышей две смены назад Потребление электроэнергии цехом окатышей три смены назад Потребление электроэнергии цехом окатышей четыре смены назад Потребление электроэнергии цехом окатышей пять смен назад Потребление электроэнергии цехом окатышей шесть смен назад Потребление электроэнергии цехом окатышей семь смен назад Потребление электроэнергии цехом окатышей восемь смен назад Потребление электроэнергии цехом окатышей девять смен назад Потребление электроэнергии цехом окатышей десять смен назад - каждое поле представляет собой вектор из 4283 значения
Это связано с тем, что плотность связи этих переменных примерно одинакова, поэтому выбор одной из этих переменных по плотности ее связи с прогнозируемой величиной может оказаться необъективным, т.к. эмпирические корреляционные отношения генеральной совокупности могут иметь другое со отношение. Поэтому выбор наиболее подходящей переменной будет осуществляться на основании практических результатов. Критерием выбора набора предикторов, как и в разделе 2.4, является остаточная дисперсия реального значения потребления электроэнергии, не объясняемая нейронной сетью. Этот показатель рассчитывается по формуле (2.15), чем он ниже, тем точнее сеть аппроксимирует объективно существующую зависимость между переменными. В ходе экспериментов использовалась обобщенно-регрессионная сеть с величиной отклонения гауссовой функции 0,1 о.е.
Результаты экспериментов, приведенные в табл. 3.12 опровергают то, что максимальная температура воздуха днем и минимальная ночью имеют более плотную связь с потреблением электрической энергии, чем ее среднесуточное значение.