Содержание к диссертации
Введение
Г л а в а 1. Современные компьютерные модели потребления электроэнергии в жилом секторе 12
1.1. Задачи анализ энергоэффективности 12
1.1.1. Измерение и верификация энергетической эффективности многоквартирных жилых домов 16
1.1.2. Энергетический бенчмаркинг 16
1.1.3.Тарификация энергопотребления 19
1.2. Методическое обеспечение анализа энергетической эффективности многоквартирных домов 20
1.3. Математические методы и модели анализа энергоэффективности зданий
1.3.1. Статистические модели 22
1.3.2. Нейронные сети 24
1.3.3. Машина опорных векторов 26
1.3.4. Когнитивные модели 27
1.4. Автоматизированные системы коммерческого учета энергоресурсов 30
1.5. Модели бенчмаркинга 35
1.6. Объект исследования – многоквартирные жилые дома 40
Выводы 44
Г л а в а 2. Методы, алгоритмы и программные средства предобработки и очистки данных для задач управленияв системах коммерческого учета энергопотребления 46
2.1. Источники и типы данных 46
2.2. Проблемы качества данных в хранилищах данных 53
2.3. Проблемы качества данных в АСКУЭ 54
2.4. Очистка данных электроэнергоучета 56
2.4.1. Масштабирование данных электроэнергоучета 56
2.4.2. Кластеризация профилей энергопотребления 57
2.4.3.Очистка отдельных профилей энергопотребления 60
2.5. Оптимизация издержек расщепления оплаты 65
2.5.1. Проблема издержек расщепления оплаты 66
2.5.2. Алгоритм решения задачи оптимизации издержек расщепления оплаты 68
2.5.3. Вычислительный эксперимент 73
Выводы 79
Г л а в а 3. Разработка многофакторных моделей потребления электроэнергии жильцами многоквартирных домов 81
3.1. Моделирование потребления электроэнергии в МКД с помощью обобщенных линейных моделей множественной регрессии 81
3.2. Моделирование потребления электроэнергии в МКД с помощью SVM
3.2.1. Метод опорных векторов 88
3.2.2. Отбор признаков 92
3.2.3. Модель уровня МКД 94
3.2.4. Модель уровня групп МКД 99
3.3. Многомерные адаптивные регрессионные сплайны 106
3.3.1. Модели MARS для отдельного МКД 111
3.3.2. Модели MARS уровня групп МКД 115
3.4. Экспериментальная оценка производительности алгоритмов построения регрессионных моделей 117
Выводы 119
Г л а в а 4. Методы и методики поддержки принятия решений при реализации политики повышения энергоэффективности с использованием моделей интеллектуального анализа данных 121
4.1. Валидация нормативов потребления электроэнергии в жилых помещениях многоквартирных домов 121
4.2. Методы поддержки принятия управленческих решений на основе регрессионных моделей 1 4.2.1. Расчет скорректированного базового потребления энергетических ресурсов 126
4.2.2. Бенчмаркинг энергоэффективности МКД на основе регрессионных моделей 132
4.3. Методика оценки энергоэффективности МКД на основе анализа среды функционирования и регрессионных моделей 135
4.4. Методика оценки нормативов потребления электроэнергии в МКД
4.4.1. Классификация алгоритмов извлечения знаний 150
4.4.2. Алгоритм извлечения продукционных правил из многофакторных регрессионных моделей на основе гиперкубов 152
4.4.3. Экспериментальная оценка эффективности методики 155
Выводы 158
Заключение 160
Список литературы 162
- Методическое обеспечение анализа энергетической эффективности многоквартирных домов
- Проблемы качества данных в хранилищах данных
- Моделирование потребления электроэнергии в МКД с помощью SVM
- Бенчмаркинг энергоэффективности МКД на основе регрессионных моделей
Введение к работе
Актуальность исследования. Тема энергоэффективности Российской экономики на протяжении длительного времени остается актуальной. Работы над повышением этого показателя ведутся в разных областях: принимаются законы, тарифы, исследуются новые материалы и технологии. Одной из отраслей, которые, по мнению исследователей, обладают значительным потенциалом энергосбережения, является жилищно-коммунальное хозяйство.
В 2015 г. принят национальный стандарт ГОСТ 56743–2015, содержащий общие положения по определению экономии энергетических ресурсов. Среди методов расчета энергоэффективности объектов был предложен метод компьютерного моделирования. Широкое распространение автоматизированных систем коммерческого учета электроэнергии (АСКУЭ) в жилом секторе в совокупности с автоматизацией процессов выставления счетов потребителям энергоресурсов позволяет накапливать значительные объемы детальных данных и использовать их для анализа энергопотребления в многоквартирных домах. Технологии анализа подобных данных могут стать частью механизма управления реализацией энергосберегающей политики в муниципальных образованиях, а также могут быть использованы при управлении энергосбытовыми процессами и для информационно-аналитической поддержки принятия решений в сфере тарифного регулирования.
Исследования в данной предметной области связаны с рядом трудностей, среди которых – отсутствие доступных тематических банков данных. Показания АСКУЭ используются для коммерческого и технического учета, причем учитывается чаще всего только электроэнергия, тогда как подробные данные о потреблении других видов энергоресурсов (газ, тепловая энергия, горячая вода) отсутствуют. Фактически доступность данных по всем видам энергоресурсов, потребляемых многоквартирными жилыми домами (МКД), – невыполнимое на сегодня условие. Доступ к сведениям о многоквартирных домах и их жильцах также ограничен. Тем не менее разработка общих методов, подходов и алгоритмов анализа энергоэффективности может осуществляться для отдельного энергоресурса, сведения о котором являются наиболее полными и детальными (в рамках данного исследования – электроэнергия).
Несмотря на перспективы исследований энергоэффективности, основанной на данных (в зарубежной литературе – data-driven energy efficiency), самым распространенным методом определения энергоэффективности для МКД на практике остается «классический» энергоаудит, – дорогостоящий, но достаточно точный способ обследования объектов. В условиях ограниченных ресурсов (как денежных, так и кадровых) проведение детального обследования для значительной группы МКД становится весьма трудной задачей. Выходом из ситуации может стать предварительное оценивание энергоэффективности объектов, на основе результатов которого может быть принято решение о целесообразности применения энергоаудита.
Зарубежные исследователи обратили внимание на задачу разработки методик компьютерного «экспресс-энергоаудита» несколько десятилетий назад. Особенности применения различных моделей описали в своих работах Ф. Магоулес, Х. Жао, В. Шабунько, Ц. М. Лим, С. Брахим, М. Макдональд, С. Ливенгуд, Т. Олофссон, А. Мейер, Р. Ламбертс, Д. Шипли, Г. Тодесцо, М. Аделаар, В. С. Ли и др.
К сожалению, результаты опубликованных работ невозможно соотнести с российскими реалиями в силу ряда причин: различия климатических, экономических условий, менталитета потребителей услуг и многих других. Важной причиной является различие структур жилого сектора: зарубежные исследователи, как правило, анализируют процесс потребления энергии в отдельных домовладениях, в то время как большинство зданий в российских городах представляют собой МКД.
В отечественных публикациях тема анализа энергоэффективности на основе моделей (для жилого сектора) затронута в работах С. М. Карпенко, В. С. Макарова, М. В. Щербакова, И. А. Башмакова, М. П. Силича, А. Г. Фи-ногеева.
Закономерность иерархической упорядоченности, значительная степень влияния на зависимую величину поведенческих паттернов потребителей энергии, а также ряд других факторов, характерных для многоквартирных домов, обусловливают необходимость создания специфических инструментов информационно-аналитической поддержки управления энергосбытовыми процессами.
Все это подтверждает актуальность исследований в области интеллектуального анализа данных о потреблении энергоресурсов в жилом секторе. Данное исследование посвящено разработке моделей, методик и алгоритмов управления эффективностью потребления электроэнергии в МКД.
Целью исследования является разработка моделей и методик поддержки принятия управленческих решений при реализации политики повышения энергоэффективности многоквартирных жилых домов. Для достижения поставленной цели требуется решить следующие задачи:
-
Разработка способов очистки и предобработки данных для задач управления энергоэффективностью объектов жилого сектора в муниципальных образованиях (населением от 250 до 500 тыс. человек).
-
Разработка алгоритма выравнивания остатков (издержек расщепления оплаты) на лицевых счетах жильцов многоквартирных домов для данных, используемых при принятии управленческих решений.
-
Разработка многофакторных моделей потребления электроэнергии и методики получения формализованных оценок электроэнергетической эффективности многоквартирных домов.
-
Разработка методики поддержки принятия решений в области энергосбережения в жилом секторе на основе бенчмаркинга электроэнергетической эффективности МКД, базирующегося на моделях машинного обучения и анализе среды функционирования.
5. Разработка методики оценки нормативов потребления электроэнергии в МКД для информационной поддержки управленческих решений в сфере тарифного регулирования на основе алгоритма извлечения знаний из многофакторных моделей машинного обучения.
Объектом исследования диссертационной работы является система сбора, обработки и анализа данных о потреблении электроэнергии в многоквартирных жилых домах крупного города (на примере г. Саранска).
Предметом исследования является алгоритмическое, информационное и методическое обеспечение средств поддержки принятия управленческих решений при реализации политики повышения энергоэффективности многоквартирных жилых домов.
Методы исследования. В процессе решения поставленных задач использованы методы машинного обучения, системного анализа, теории управления, математической статистики, интеллектуального анализа данных, теории оптимизации.
Научная новизна заключается в следующем:
-
Предложен способ очистки данных о потреблении электроэнергии, поступающих из АСКУЭ. Отличительными особенностями способа являются определение множественных ошибок на основе SD-метода и выявление ошибок, распространенных на разных уровнях подсистемы сбора данных АСКУЭ, за счет осуществления иерархической кластеризации временных рядов.
-
Разработаны многофакторные регрессионные модели потребления электроэнергии в многоквартирных жилых домах и методики получения формализованных оценок электроэнергетической эффективности, соответствующие различным уровням иерархии системы: квартира, дом, группа домов, отличающиеся использованием факторов различной природы: климатических, социальных, экономических, технических, что позволяет применять их в системах измерения и верификации электроэнергоэффективности, а также в системах энергетического бенчмаркинга.
-
Предложена методика поддержки принятия управленческих решений в области энергосбережения в жилом секторе на основе бенчмаркинга электроэнергетической эффективности МКД, базирующегося на многофакторной регрессионной модели и анализе среды функционирования, отличающаяся применением обработки входных данных, представленных порядковыми и номинальными переменными с учетом наличия сложных нелинейных зависимостей.
-
Предложена методика оценки нормативов потребления электроэнергии в МКД для информационной поддержки управленческих решений с целью формирования тарифного меню на основе разработанного алгоритма извлечения знаний из регрессионных моделей, который отличается возможностью автоматического подбора числа требуемых продукционных правил для адекватной интерпретации результатов моделирования.
Практическая ценность работы заключается в том, что представленные модели, методики и алгоритмы реализованы в виде программной системы,
позволяющей выполнять предобработку данных и определение формализованных оценок энергоэффективности многоквартирных домов с целью принятия управленческих решений по энергосбережению.
Практическая значимость результатов диссертационного исследования подтверждается внедрением разработанных методик и алгоритмов в деятельность ООО «Саранский расчетный центр» и ПАО «Мордовэнергосбыт», а также свидетельством о государственной регистрации программы для ЭВМ. Кроме того, результаты внедрены в учебный процесс в Мордовском университете при подготовке студентов по направлению подготовки 09.03.01 «Информатика и вычислительная техника». Внедрение результатов работы подтверждается соответствующими актами.
Достоверность научных результатов обосновывается корректностью применения математического аппарата, адекватностью разработанных регрессионных моделей тестовым выборкам, экспериментальными исследованиями и результатами опытной эксплуатации.
Соответствие паспорту специальности. Работа соответствует следующим пунктам паспорта специальности ВАК 05.13.10 «Управление в социальных и экономических системах»:
– пункту 3 «Разработка моделей описания и оценок эффективности решения задач управления и принятия решений в социальных и экономических системах»;
– пункту 6 «Разработка и совершенствование методов получения и обработки информации для задач управления социальными и экономическими системами»;
– пункту 10 «Разработка методов и алгоритмов интеллектуальной поддержки принятия управленческих решений в экономических и социальных системах»;
– пункту 11 «Разработка методов и алгоритмов прогнозирования оценок эффективности, качества и надежности организационных систем»;
Положения, выносимые на защиту:
-
Способ очистки данных автоматизированных систем коммерческого учета энергопотребления для задач управления реализацией политики энергосбережения в муниципальных образованиях.
-
Комплекс многофакторных регрессионных моделей и методика моделирования процесса потребления электроэнергии жильцами многоквартирных домов для получения формализованных оценок электроэнергетической эффективности.
-
Методика поддержки принятия решений по энергосбережению на основе энергетического бенчмаркинга многоквартирных жилых домов, базирующаяся на многофакторной регрессионной модели и анализе среды функционирования.
-
Методика оценки нормативов потребления электроэнергии в МКД для информационной поддержки управленческих решений при разработке
тарифных меню на основе разработанного алгоритма извлечения знаний из регрессионных моделей.
Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались: на ежегодной научной конференции «Огарев-ские чтения» (Саранск, 2014, 2015, 2016); IV Международной научной конференции «Проблемы управления, обработки и передачи информации» (Саратов, 2015); I Всероссийской научной конференции по проблемам управления в технических системах (ПУТС-2015) (Санкт-Петербург, 2015); XIII Международной научно-технической конференции «Новые информационные технологии и системы» (НИТиС-2016) (Пенза, 2016).
Публикации. По материалам диссертации опубликовано 11 работ, в том числе 7 – в рецензируемых изданиях, входящих в перечень ВАК РФ, получено одно свидетельство о государственной регистрации программы для ЭВМ.
Объем и структура диссертации. Диссертация состоит из введения, четырех глав с выводами, заключения, списка использованных источников и двух приложений. Общий объем работы составляет 181 страницу, из них 160 страниц основного текста, включая 45 рисунков. Список литературы содержит 148 наименований.
Методическое обеспечение анализа энергетической эффективности многоквартирных домов
В мировой практике используются четыре основных метода измерения и верификации энергетической эффективности зданий [26].
1. Метод краткосрочных измерений. Основывается на комбинации краткосрочных измерений энергопотребления отдельного инженерного оборудования или инженерных систем (чаще всего модернизированных). При этом энергопотребление всего здания оценивается аналитически, с помощью статистических данных и данных производителя инженерного оборудования.
2. Метод продолжительных серий измерений. Основывается на периодических или непрерывных измерениях энергопотребления отдельного инженерного оборудования или инженерных систем (чаще всего модернизированных). При этом энергопотребление всего здания также оценивается аналитически, с помощью статистических данных и данных производителя инженерного оборудования.
3. Анализ показаний приборов учета энергопотребления всего здания. Основывается на долгосрочных измерениях энергопотребления всего здания в целом с помощью приборов учета.
4. Расчетно-экспериментальный метод на базе компьютерного моделирования. Основывается на проведении компьютерного моделирования энергопотребления, чаще всего здания в целом.
За рубежом в качестве инструмента информационно-аналитической поддержки управленческих решений при реализации политики энергосбережения широко применяется бенчмаркинг энергоэффективности, который заключается в распространении передового опыта и лучших достижений в данной области. При этом важную роль играют организационные и стимулирующие факторы, влияющие на уровень эффективности объектов в сфере энергосбережения. Организационные факторы включают сбор, обработку и распространение информации, стимулирующие – льготы, налоги и кредиты для целевого повышения уровня энергоэффективности. Опыт ведущих промышленных стран Западной Европы и США указывает на целесообразность использования бенчмаркинга для выявления лучших по определенным критериям компаний и структурных подразделений в разных направлениях их деятельности [35].
В общем смысле бенчмаркинг (англ. benchmarking) – практика сравнения измеренной фактической производительности устройства, процесса, объекта или организации по отношению к своим более ранним состояниям, аналогичным объектам или установленным нормам с целью информирования и мотивации к повышению производительности. Бенчмаркинг в равной степени включает два процесса: оценку и сопоставление. Его цель состоит в том, чтобы на основе исследований установить потребность в изменениях и путь достижения успеха в результате этих перемен.
На практике применение бенчмаркинга бывает связано с рядом проблем. Одной из них является отсутствие единой его процедуры, которая была бы принята всеми компаниями. Широкое применение бенчмаркинга привело к появлению различных методик. Одна из фундаментальных работ была посвящена преимуществам в конкурентоспособности компаний вследствие использования бенчмар-кинга [62]. В процессе реализации это процедуры проводится сравнение товара, услуги, технологии, процесса и т.д. по основным (существенным) критериям с лучшими существующими в отрасли и на рынке образцами. После оценки каждого параметра проводится комплексная оценка объекта в целом, в результате чего возникает представление об относительном уровне качества, конкурентоспособности, эффективности и т.д. объекта оценки по отношению к лучшим существующим аналогам. Цель энергетического бенчмаркинга создание и совершенст 18
вование точной модели потребления энергии на предприятии с целью оценить возможность сокращения потребления энергии, используя опыт лучших компаний на рынке. Как показывает практика ряда стран, наличие в легком доступе результатов бенчмаркинга – это реальная сила, которая мотивирует владельцев зданий и управляющие компании к реализации мер по повышению энергоэффективности и снижению затрат на эксплуатацию. Отсутствие же возможности сравнивать показатели энергетической эффективности зданий ограничивает мотивацию их собственников к поиску финансовых ресурсов для инвестиций в повышение энергоэффективности зданий. Рейтинги формируют базу для оценки энергетической эффективности и позволяют выявить те здания, где затраты энергии выше. Они служат основой для разработки государственной политики и формирования стимулов для повышения энергоэффективности зданий и помогают измерить прогресс в достижении целей. Во многих частях мира, в том числе в ЕС, Австралии, Китае, США, Канаде, рейтинг энергетической эффективности жилых домов или коммерческих зданий является обязательным или добровольным, а его результаты доступны в сети Интернета для быстрого определения места конкретного здания в рейтинге [5].
Рейтинг зданий по уровню энергоэффективности позволяет определить объекты с низким уровнем энергоэффективности: на 20–30 % выше среднего удельного расхода энергии, на 10 % выше среднего удельного расхода и просто выше среднего. Именно здесь в первую очередь нужно проводить энергетические обследования, по итогам которых принимается решение о включении здания в программы капитального ремонта или повышения энергоэффективности. Присвоение рейтинга позволяет: 1) оценивать уровень и динамику удельных расходов и класс энергоэффективности; 2) устанавливать очередность включения зданий в программы энергосбережения и планы капитального ремонта (начинать надо со зданий с низким рейтингом); 3) определять прогресс в динамике удельных расходов и повышении класса энергоэффективности. Для обеспечения полноценного энергетического бенчмаркинга необходим четко выработанный регламент для консолидации и обработки данных энергопотребления. Примером такого регламента может служить документ, подготовленный энергетическим департаментом США [133]. Энергетический бенчмаркинг позволяет более обоснованно подойти к тарификации энергопотребления многоквартирных жилых домов (МКД).
Проблемы качества данных в хранилищах данных
Применение компьютерных моделей при решении задач управления энергосбережением требует прежде всего наличия исторических данных, на основе которых должен осуществляться подбор параметров и гиперпараметров разрабатываемой модели. Очевидно, что чем более полными и корректными будут данные, тем выше окажется качество модели, что в свою очередь скажется на достоверности результатов анализа энергетической эффективности.
Повсеместная интеграция информационных технологий во все сферы деятельности человека приводит к накоплению значительных объемов данных. В сферах энергетики и коммунального хозяйства с целью упрощения процессов начисления платы за предоставляемые ресурсы и услуги уже на протяжении десятилетий активно используются различные биллинговые и учетные системы. Прежде такие системы строились на основе несовершенных (по сегодняшним меркам) СУБД, сегодня же мы имеем возможность говорить о хранилищах данных, обладающих богатыми инструментами аналитики и большим числом источников поступающей информации. В то же время никогда не переставали (и вряд ли перестанут в будущем) быть актуальными вопросы качества данных в подобных системах.
В рамках данного исследования впервые (среди отечественных работ) создан набор данных, описывающих МКД с детализацией по квартирам, включающий целый ряд разнообразных признаков. Для построения такого набора использовалась информация из различных источников. Общая схема представлена на рисунке 2. Биллинг
Часть признаков извлечена из биллинговой системы, используемой для начисления платы за жилищно-коммунальные услуги (ЖКУ) ООО «Саранский расчетный центр». Прежде всего это обезличенные сведения о жильцах (возраст, число проживающих в квартире, наличие льгот), данные о начислениях и оплате ЖКУ, информация технического характера (как для МКД, так и для отдельных квартир).
Климатические данные представлены двумя признаками: длина светового дня и среднесуточная температура воздуха в конкретный день. Эти данные могут быть получены при помощи пакетов для языка R «weatherData» [125] и «maptools» [124], которые в свою очередь загружают актуальные данные из специализированных WEB-сервисов.
Данные АСКУЭ имеют первостепенное значение: величина потребленной электроэнергии при разработке моделей является переменной отклика. В рамках настоящего исследования использованы данные, собранные при помощи АСКУЭ, функционирующей в г. Саранске. Внедрение этой системы на территории города было начато в конце 2010 года, и, согласно сведениям ее разработчика ООО «ЭнергоКруг», на 1 августа 2014 года были подключены 1 200 домов. С целью осуществления независимого от поставщика и потребителя учета количества и качества энергоресурсов была проведена интеграция АСКУЭ с биллинговой системой ООО «Саранский расчетный центр» [39].
Загрузка данных АСКУЭ в рамках экспериментов осуществлялась в два этапа: на первом при помощи специализированной .NET-библиотеки для построения ETL-процессов rhino-etl данные о приборах учета и показания извлекаются из csv-файлов и записываются в таблицы реляционной базы данных под управлением MS-SQL Server. Сведения интегрируются с информацией биллинга с помощью специальной хранимой процедуры и загружаются в среду R при помощи пакета RODBC [130].
Для формирования набора данных использованы ежесуточные показания квартирных приборов учета с декабря 2013 по апрель 2015 года для 122 многоквартирных домов. Для ряда вычислительных экспериментов рассмотрены также подмножества, представленные 50 и 20 объектами. Следует заметить, что несмотря на то, что, значения всех признаков рассматриваются по состоянию на конкретный день, большая часть данных изменяется намного реже (состав жильцов квартиры, наличие льготников), а некоторые вообще являются неизменными для конкретных объектов (например, год постройки МКД). Кроме того, очевидно, что сведения обладают иерархической структурой и разные признаки присущи разным уровням иерархии: например, тип крыши – уровню МКД, число зарегистрированных жильцов – уровню квартиры, климатические факторы – всем анализируемым объектам.
Итоговый набор представлен признаками, описанными в таблице 2. Таблица 2 – Список признаков набора данных
Исследуемое множество многоквартирных домов достаточно гетерогенно: здания построены по разным проектам в разные годы, расположены в различных районах города, имеют разную этажность. Для иллюстрации этого факта целесообразно рассмотреть результаты разбиения выборки на группы схожих объектов (по признакам уровня МКД). На практике для объектов, описанных различными признаками (номинальными, порядковыми и т.д.) применяется расстояние Говера, которое определяется следующим образом [84]: " iL v (4) где Бф - расстояние между / и у наблюдениями для к признака, wijk - весовой коэффициент для к признака. Расстояния Sj]k при этом определяются как для вещественных и целочисленных, так и для категориальных переменных: где rk = тах( ) - тіп(л: ),Х — значение к признака для / объекта. Определение оптимального числа кластеров целесообразно осуществлять с помощью индекса оценки силуэта (Silhouette index) [132]. Пусть a(i) - среднее значение величины расстояния между і-м объектом и остальными объектами внутри кластера, Ь(ї)- наименьшее значение средней величины расстояния между /-м объектом и объектами внутри кластера, к которому /-й объект не принадлежит. Тогда индекс оценки силуэта можно представить в следующем виде: СУ-_ ко-чо о\1) — (6) тах{а(0,Д/ )} . Чтобы представить результат кластеризации множества МКД на иллюстрации, необходимо осуществить сокращение размерности исходного множества. Такая процедура может быть проведена с использованием метода t-SNE [138]. Концепция этого алгоритма заключается в следующем. Есть набор данных с точками, описываемыми многомерной переменной с размерностью пространства существенно больше трех. Необходимо получить новую переменную, существующую в двумерном или трехмерном пространстве, которая бы в максимальной степени сохраняла структуру и закономерности в исходных данных. SNE начинается с преобразования многомерного евклидового расстояния между точками в условные вероятности, отражающие сходство точек.
Моделирование потребления электроэнергии в МКД с помощью SVM
Следует отметить, что, несмотря на результаты проведенного эксперимента, алгоритм, показавший лучшие результаты, нельзя однозначно признавать безальтернативным решением. Причиной является прежде всего то, что профили потребления электрической энергии в МКД определяются целой совокупностью факторов, таких, например, как температура воздуха (при резких похолоданиях потребление электроэнергии кратковременно возрастает), длина светового дня и т.д. Более сложные много факторные статистические модели, возможно, могли бы показать более высокие результаты [142]. В то же время описанный в данной работе подход может значительно упростить труд аналитика, как связанный с коммерческим или техническим учетом, так и преследующий более сложные цели, имеющие отношение к области Data Mining.
Описанный способ был применен для очистки данных электроэнергопотребления, полученных с использованием системы АСКУЭ, функционирующей на территории г. Саранска. Результатом, с одной стороны, стало сокращение числа записей в исходном массиве данных (за счет исключения заведомо некорректных профилей), а с другой – повышение качества данных и минимизация влияния ошибок на результаты последующих процедур анализа.
Среди прочих признаков регрессор, характеризующий сумму задолженности квартиры на конкретную дату, имеет особое значение. Для этого существует несколько причин: во-первых, эта величина применяется при принятии управленческих решений для расчета потребления энергоресурсов в денежном выражении (согласно ГОСТу) [10]; во-вторых, признак целесообразно использовать при выявлении нетехнических потерь электроэнергии (самой часто встречающейся их разновидностью является кража); в-третьих, учет начислений, как правило, ведется более строго, нежели учет прочих величин, что приводит к меньшему количеству ошибок в данных [45].
Для муниципальных образований, в которых счета потребителям жилищно-коммунальных услуг выставляются по принципу единой квитанции, характерна проблема «издержек расщепления» платы. Оплата населением услуг при использовании единых платежных документов подразумевает необходимость распределения поступающих денежных сумм между поставщиками (в отличие от схемы, при которой собранными денежными средствами распоряжается управляющая компания). В идеальном случае для конкретного лицевого счета ситуация должна выглядеть следующим образом: если существует задолженность по квартплате, то это означает, что она есть по каждой из статей (например, горячему водоснабжению, газу, электроснабжению и т.д.). Однако на самом деле в процессе ведения баз данных и выставления счетов на оплату неизбежна ситуация, при которой по тому или иному лицевому счету необходимо произвести перерасчет за предыдущие периоды. Причем перерасчеты могут производиться по отдельным услугам (например, за горячую воду, если выяснилось, что в определенный момент ее качество не соответствовало нормам или ее подача прекращалась на период больше допустимого). В результате по ряду статей образуются переплаты, тогда как по другим статьям может иметься задолженность. При этом сальдо (совокупный остаток по статьям) на лицевом счете отдельного абонента может быть нулевым, положительным (задолженность), отрицательным (переплата). Потребитель, не знакомый с принципами расщепления оплаты, но в то же время регулярно вносящий нужные суммы, указанные в графе «итого» платежных документов, может быть озадачен тем фактом, что у него имеется задолженность перед одной из ре-сурсоснабжающих организаций. Подобная ситуация в рассматриваемой предметной области иногда называется «издержками расщепления» [15].
Для организации, отвечающей за биллинг, вышеописанная ситуация является нежелательной еще и по причине того, что отчеты, которые формируются на основе имеющихся данных, могут представлять искаженную картину структуры задолженностей. Принятие каких-либо управленческих решений с использованием подобной отчетности становится затруднительным.
В рамках данного исследования в качестве решения предложен алгоритм, в основе которого лежит симплекс-метод. Алгоритм обеспечивает построение моделей с использованием выражений на языке OML на основе данных биллинга. Используя решатель SimplexSolver (входящий в состав фреймворка Solver Foundation), алгоритм определяет значения переменных, соответствующие оптимальному плану. Затем происходит процесс записи операций в базу данных. Ниже описывается вариант реализации алгоритма, разработанный для автоматизированной системы начислений ООО «Саранский расчетный центр».
Основными ограничениями, в рамках которых должен действовать алгоритм, являются следующие. 1. Общее сальдо по лицевому счету в результате не должно изменяться (очевидно, что сумма «к оплате» в квитанции должна оставаться прежней). 2. Не должно изменяться общее сальдо по поставщику в рамках одного дома (например, если дом имеет некоторую сумму задолженности перед постав 67 щиком, предоставляющим коммунальные услуги горячего водоснабжения и отопления, то эта сумма после работы алгоритма должна остаться неизменной). 3. Выравнивание остатков выполняется на множестве лицевых счетов абонентов по различным статьям, но всегда в пределах одного конкретного многоквартирного дома. 4. По итогам проведенных операций на статьях лицевых счетов суммы переплаты и задолженности уменьшаются, что не влияет на размер сальдо по лицевым счетам. В качестве примера ситуации, требующей использования процедуры «расщепления», можно привести следующий случай: потребитель № 1, исправно (своевременно) вносящий плату за ЖКУ, видит в своем платежном документе, что на его лицевом счете имеется задолженность за электроэнергию в размере 300 рублей и в то же время переплата по статье «Центральное отопление» на сумму 350 рублей (ситуация проиллюстрирована в таблице 4). Сальдо по лицевому счету в этом случае составляет – 50 рублей. Жилец того же дома, потребитель № 2, имеет переплату по статье «Электроснабжение» на сумму 300 рублей и задолженность по статье «Центральное отопление» на сумму 350 рублей. Сумма задолженностей перед поставщиком электроэнергии составляет 300 рублей, сумма переплат 300 рублей, сальдо по поставщику (если принять, что в доме всего две квартиры) – 0 рублей. Для поставщика услуги «Центральное отопление» эти суммы соответственно равны 350, 350 и 0 рублей.
Бенчмаркинг энергоэффективности МКД на основе регрессионных моделей
Сложность принятия решений при реализации политики энергоэффективности в муниципальных образованиях определяется структурой объекта управления, большим числом факторов, влияющих на показатели эффективности, ограниченностью ресурсов, а также рядом других причин.
При реализации мероприятий в области энергосбережения и повышения энергетической эффективности среди прочих решаются следующие задачи:
1. Задача определения нормализованной экономии, полученной в результате реализации мер повышения энергетической эффективности объектов [10]. Для решения такой задачи целесообразно осуществление расчета скорректированного базового потребления.
2. Задача определения приоритета выбора объектов при реализации мер повышения энергетической эффективности [16]. Инструментом решения такой проблемы может стать энергетический бенчмаркинг. Энергетический бенчмар-кинг – относительно новый термин для нашей страны, которым описывается механизм сравнительного анализа энергоэффективности некоторых объектов. В то время как классический энергоаудит подразумевает целый комплекс мер по обследованию многоквартирных домов, включающий в том числе и анализ эффективности систем отопления, вентиляции и водоснабжения, бенчмаркинг позволяет осуществить «экспресс-оценку» потенциала энергосбережения в рамках муниципальных образований без привлечения серьезных ресурсов [16].
В развитых странах бенчмаркинг является широко используемым инструментом. Так, в США на сегодняшний день проведен бенчмаркинг более чем для четверти миллиона зданий площадью почти 30 млрд м2 (с помощью системы Energy Star американского Агентства по охране окружающей среды) [5].
Главной проблемой, которая возникает при сравнении различных объектов на предмет эффективности потребления энергоресурсов является изменчивость целого ряда факторов, влияющих на конечный потребляемый объем. Степень влияния многих из таких факторов была оценена при помощи различных методов в главе 3 диссертации. Процедуру, которая позволяет получить сравнимые оценки для разных по множеству признаков объектов (в контексте задачи оценки энергоэффективности), в зарубежной литературе называют нормализацией (normalization) [79]. ГОСТ 5674–2015 вводит соответствующее по смыслу понятие скорректированного базового потребления энергетических ресурсов, которое определяется как потребление энергетических ресурсов за базовый период, скорректированное для учета различных условий эксплуатации в отчетный период [10]. Корректировки используются для пересчета объемов базового потребления энергетических ресурсов для приведения к сопоставимым условиям отчетного периода. ГОСТ допускает применение статистических моделей для расчета корректировок. В рамках данного исследования термины «нормализация» и «корректировка» используются как синонимы.
В качестве самого простого и очевидного способа можно рассматривать нормализацию по времени (объем потребленного энергоресурса за единицу времени). Далее данные можно нормализовать относительно площади, получив в результате величину, измеряемую в киловатт-часах на квадратный метр (американские исследователи в качестве единицы площади рассматривают квадратный фут). Теоретически данная величина может приниматься как мера энергоэффективности. Однако следует помнить, что при этом мы делаем допущение: предполагается, что величина потребленной энергии линейно зависит от площади. Следующим фактором, относительно которого проводят корректировку, является температура воздуха. Проведение такой нормализации, в частности, позволяет сравнивать эффективность зданий, находящихся в различных климатических зонах.
Данные можно нормализовать с учетом дополнительной информации о жильцах. Фактически при проведении исследований почти всегда в расчет принимаются только климатические данные. В то же время уже давно в зарубежных публикациях было отмечено, что объемы энергии, потребляемые разными жильцами, проживающими в совершенно одинаковых по конструкции зданиях, могут отличаться на 200-300 % [75]. Необходимость учета фактора возраста людей, участвующих в статистических исследованиях (age adjustment), была прежде всего отмечена в работах, анализирующих качество жизни населения в контексте медицинского обслуживания, где нормализацию также называют стандартизацией (standardization) [50].
Нормализация данных в отношении фактора t подразумевает определение коэффициентов нормализации. Для этого рассчитываются значения аппроксимирующей функции: где 7 - среднее значение регрессора на всем наборе данных. Кроме того, определяются значения y? = f(t,x1,x2,...,xny (58) Значение нормализующего коэффициента может быть представлено как к = у /у. (59) В рамках эксперимента рассмотрим SVR-модель, обученную на множестве данных о 50 МКД. На рисунке 33 изображены смоделированные агрегированные профили для двух многоквартирных домов.
На рисунке 34 изображены нормализованные относительно длины светового дня профили рассматриваемых МКД. Различия между профилем № 1 (изображен на графике более темной линией) до нормализации и после позволяют сделать вывод о существенном влиянии фактора нормализации на моделируемую величину для данного МКД. В то же время нормализованный профиль № 2 (изображен на графике светлой линией) не так значительно отличается от исходного. Иными словами, протяженность светового дня сильнее влияет на величину потребляемой энергии в МКД № 1, чем в МКД № 2.