Содержание к диссертации
Введение
1. Анализ прогнозируемых процессов и постановка задачи исследования 8
1.1. Описание прогнозируемых процессов, их особенностей и области использования результатов 8
1.2. Постановка задачи исследования 16
2. Выявление факторов, влияющих на величину спроса, и построение зависимостей спроса от основных факторов 19
2.1. Обзор известных подходов 19
2.2. Использование факторного анализа для выделения основных факторов, влияющих на величину спроса на нефтепродукты 31
2.3. Корреляционный анализ связи между величиной спроса на нефтепродукты и переменными, влияющими на него 34
2.4. Определение зависимостей спроса на нефтепродукты от основных факторов 44
2.5. Математическая модель для расчета ВВП 56
3. Прогнозирование значений основных показателей, влияющих на спрос на нефтепродукты 65
3.1. Обзор известных методов прогнозирования 65
3.2. Построение моделей изменения валового внутреннего продукта во времени с использованием регрессионных зависимостей 78
3.3. Сравнение точности прогнозирования различными методами в зависимости от периода прогнозирования и объема используемой выборки 83
3.4. Прогнозирование спроса на нефтепродукты в Российской Федерации 106
3.5. Прогнозирование спроса на нефтепродукты по регионам 112
4. Определение прогнозируемых значений спроса на нефтепродукты с использованием теории нечетких множеств и теории принятия решений в условиях неопределенности 118
4.1. Обзор известных подходов 118
4.2. Определение исходных данных о величине валового внутреннего продукта и расходов на оборону с использованием экспертных оценок 124
4.3. Построение математической модели спроса на нефтепродукты с нечеткими входными и выходными переменными 127
4.4. Результаты построения математической модели спроса на нефтепродукты с нечеткими входными и выходными переменными 132
4.5. Определение прогнозируемых значений спроса на нефтепродукты с использованием элементов теории принятия решений в условиях неопределенности 144
5. Разработка структуры автоматизированной системы прогноза 148
5.1. Информационное обеспечение 154
5.2. Алгоритмическое обеспечение 156
5.3. Программное обеспечение , 158
5.4. Техническое обеспечение 160
Основные результаты работы 164
Список литературы 166
Приложения 171
- Описание прогнозируемых процессов, их особенностей и области использования результатов
- Корреляционный анализ связи между величиной спроса на нефтепродукты и переменными, влияющими на него
- Сравнение точности прогнозирования различными методами в зависимости от периода прогнозирования и объема используемой выборки
- Построение математической модели спроса на нефтепродукты с нечеткими входными и выходными переменными
Введение к работе
Актуальность темы. В условиях рыночной экономики, при планировании деятельности нефтяных компаний, создании планов реконструкции нефтеперерабатывающий заводов (НПЗ), приобретает актуальность задача прогноза спроса на основные виды нефтепродуктов, такие как автобензин, дизельное топливо, авиакеросин и топочный мазут.
Сложность решаемой задачи обусловлена ограниченностью имеющейся выборки статистических данных, существенной нестационарностыо прогнозируемых показателей, наличием нелинейности, а также отсутствием методики прогноза спроса па нефтепродукты после этмены системы государственного планирования потребления.
Точность и достоверность прогноза может быть повышена при использовании формализованных методов и вычислительной техники. В настоящее время разработаны различные методы прогнозирования. Крупный вклад в развитие прогнозирования формальными методами внесли Р. Браун, Дж. Бокс, Г. Дженкинс, Четыркин Е.М., Емельянов СВ. и др. Вместе с гем, нахождение методов, эффективных в условиях малой выборки данных и явной неста-пюнарности процесса, остается актуальной задачей.
Цель работы. Целью диссертационной работы является создание методики прогнози-юваиия спроса, а также структуры, информационного и алгоритмического обеспечения ав-'оматизированной системы прогноза спроса на нефтепродукты в регионах страны, облегающей решение задач управления и планирования деятельности НПЗ и вертикалъно-[нтегрированной нефтяной компании (ВИНК) в целом.
Методы исследования. При проведении исследования использовались: математиче-кая статистика, факторный анализ, математическая экономика, теория нечетких множеств и рннятия решений в условиях неопределенности, методы идентификации математических юделей, прогнозирования временных рядов, построения автоматизированных систем. При роведении расчетов использовались современные пакеты прикладных программ для ЭВМ.
Научная новизна
-
Выявлены переменные, влияющие на величину спроса на основные виды нефте-родуктов, из них выделены переменные, линейно-независимые между собой - валовой нутренний продукт (ВВП) и расходы на оборону. Построены математические людели троса на основные виды нефтепродуктов.
-
Путем выявления специфики изменения прогнозируемого показателя - ВВП, ана-иза известных методов, а также проведения расчетов, выявлен метод, обеспечивающий тибольшую точность прогноза. Найдена оптимальная величина выборки и оценена точ-
ность прогноза для различных горизонтов прогнозирования (периодов времени, на котор осуществляется прогноз).
3. Показано, что при прогнозировании спроса на нефтепродукты па длительную п<
спективу (10-15 лет) или в период реформ экономики эффективно применение теории неч<
ких множеств. Предложен метод построения нечеткой модели для случая четких параметр
и нечетких входных и выходных координат, который может быть использован как для пр
гнозирования спроса на нефтепродукты, так и для построения нечетких моделей между др
тими переменными.
4. Разработана методика прогноза спроса на нефтепродукты - выделены задачи, р
шаемые на каждом этапе, и найдены наиболее эффективные алгоритмы их решения, обесп
чивающие повышение эффективности решения задачи оптимального оперативного управл
ния нефтеперерабатывающим заводом.
Практическая пенность. Практической ценностью обладает методика определена прогнозируемых значений спроса на основные виды нефтепродуктов. Разработанная автом; тизированная система применима для прогнозирования спроса на автобензин, дизельное тс пливо, авиакеросин и топочный мазут и может быть использована при планировании де; тельности вертикально-интегрированных нефтяных компаний и составлении производствен ных программ нефтеперерабатывающих заводов. Предлагаемая методика применима да прогнозирования различных нестационарных случайных процессов с нелинейным трендої при малой выборке данных.
Апробация работы и публикации. Результаты работы докладывались и обсуждалие на XI и XII Международных конференциях "Математические методы в химии и технологи ях" (Владимир, 1998 г., Великий Новгород, 1999 г.) и на VII международной конференіщі "Проблемы управления безопасностью сложных систем" (Москва, 1999 г.) По теме диссер тации опубликовано шесть статей.
Структура работы. Данная диссертационная работа состоит из введения, пяти глав, за ключения и четырех приложений.
Описание прогнозируемых процессов, их особенностей и области использования результатов
Объем выборки данных по спросу на нефтепродукты мал. В связи с этим целесообразно для определения прогноза спроса использовать результаты прогноза показателя, имеющего больший объем ретроспективных данных. Это позволяет надеяться на получение более достоверного прогноза. Такой показатель должен отражать экономические процессы, происходящие в стране, поскольку состояние экономики во многом определяет потребности в ресурсах, в том числе и в нефтепродуктах. Этим условиям в полной мере отвечает такой показатель, как валовой внутренний продукт.
Валовой внутренний продукт (ВВП) [8-9] - центральный макроэкономический показатель; отражает стоимостной результат развития экономики, дает характеристику конечной готовой продукции и услуг, произведенных на территории данной страны. В валовой внутренний продукт не включается стоимость потребленных при его производстве предметов труда (материальные затраты на сырье, материалы, топливо, полуфабрикаты, комплектующие изделия и узлы и т.п.). Показатель ВВП применяется при решении целого ряда экономико-статистических задач, таких, например, как измерение темпов экономического роста.
На рис 1.1 показано изменение ВВП России в процентах к объему ВВП в 1958 г. [3-4, 10-19] (до этого данный показатель не вычислялся). Хотя длина этого временного ряда - порядка 40 точек - больше длины рядов спроса на нефтепродукты, все-таки эта выборка довольно ограничена по объему. На рис. 1.1 видно, что временной ряд ВВП явно делится на две части с различным характером изменения показателя. На первом этапе, в период 1958-1989 г.г. наблюдался рост ВВП, этот этап можно назвать этапом стабильного развития экономики. Затем, после 1989 г., начался этап экономических реформ - характер изменения ВВП стал другим.
Временной ряд ВВП можно рассматривать как случайный процесс, причем, как видно на рис. 1.1, этот процесс нестационарный и обладает явно нелинейным трендом (т.е. законом изменения среднего). При анализе изменения ВВП представляет интерес уточнить, влияют ли на значение ВВП в момент времени t его значения в предыдущие моменты времени (в прошлом, позапрошлом году и т.д.). Для этого можно использовать автокорреляционную функцию. Автокорреляционная функция валового внутреннего продукта представлена на рис. 1.2. Проверка значимости коэффициентов корреляции при различных сдвигах во времени - лагах (см. Приложение 1, Табл. П. 1.5) показала, что по критерию Стьюдента значимыми являются первые три значения величины r , а по критерию Фишера - первые четыре значения. Это означает, что на значение ВВП в текущем году существенное влияние оказывают значения этого же показателя в трех предыдущих годах. Задача прогноза спроса на нефтепродукты возникла в последние годы, когда вместо государственной планово-распределительной системы снабжения нефтепродуктами появились рыночные отношения и большое количество компаний -производителей и поставщиков нефтепродуктов. В условиях плановой экономики такая задача решалась плановыми органами с учетом норм расхода нефтепродуктов и построения балансовых моделей между отраслями [20-22]. Сейчас эта методика неприменима, поскольку в рыночных условиях спрос определяется не нормами, а потребностями, которые зависят от целого ряда экономических факторов. В связи в необходимостью выполнения большого количества расчетов задачу необходимо решать с применением современной вычислительной техники, что требует разработки ряда алгоритмов. При этом необходимо выбрать наиболее эффективные из существующих методов прогнозирования и разработать методику решения задачи в целом. Целью диссертационной работы является создание методики прогнозирования спроса, а также структуры, информационного и алгоритмического обеспечения автоматизированной системы прогноза спроса на нефтепродукты в регионах страны, облегчающей решение задач управления и планирования деятельности НПЗ и вертикально-интегрированной нефтяной компании (ВИНК) в целом. Для достижения поставленной в работе цели необходимо решить несколько задач. Первой задачей является построение модели спроса на нефтепродукты. Для этого необходимо выявить основные переменные, влияющие на величину спроса. Поскольку переменных много и эти переменные могут быть сильно коррелированы между собой, то далее необходимо выделить из них линейно-независимые переменные. После этого надо решить задачу определения зависимости спроса от основных факторов, т.е. найти вид и параметры модели спроса на нефтепродукты. Второй задачей является определение прогнозируемых значений переменных, входящих в модель спроса. При этом необходимо проанализировать известные методы прогнозирования и выбрать из них наиболее эффективные для решения данной задачи. Необходимо учесть, что эффективность метода может существенно зависеть от срока, на который делается прогноз. В результате данной работы должны быть предложены эффективные алгоритмы, позволяющие решать задачу прогнозирования спроса, после чего необходимо апробировать выбранные методы на реальных данных и предложить новые, если точность известных методов окажется недостаточной. На основе этих алгоритмов должна быть разработана автоматизированная система, позволяющая решать задачу прогноза спроса на нефтепродукты для вертикально-интегрированных компаний и нефтеперебатывающих заводов Российской Федерации.
Корреляционный анализ связи между величиной спроса на нефтепродукты и переменными, влияющими на него
Термин "эконометрия" переводится как измерения в экономике. Наиболее существенная задача эконометрического исследования - оценка и проверка экономической модели. Эконометрические методы разработаны для оценивания параметров экономических моделей. В общем случае эконометрическая модель представляет собой математическую модель, параметры которой оцениваются с помощью математической статистики. Она может использоваться в качестве средства анализа и прогнозирования как на макро-, так и на микроэкономическом уровне на основе реальной статистической информации.
Наиболее распространены эконометрические модели, представляющие собой систему регрессионных уравнений, связывающих величины входных и выходных переменных. Данные модели дают возможность получить количественные оценки коэффициентов каких-либо функций, если имеется возможность выделить факторы, влияющие на эти функции, и высказать гипотезу об их форме. Существует целый ряд математико-статистических приемов, позволяющих получить регрессионные уравнения. Наиболее популярным из таких методов является метод наименьших квадратов, на базе которого разработано несколько модификаций эконометрических моделей. Наряду с регрессионными уравнениями, в эконометрическую модель включаются "тождества", выражающие взаимозависимость между переменными, вытекающую из особенностей структуры используемой статистики.
В книгах [44-47] приведены эконометрические модели, предназначенные для прогнозирования экономического регионального развития. При этом для отдельных отраслей экономики описываются специально созданные системы уравнений, включающих по несколько десятков переменных. Для наиболее значимых показателей развития экономики также были созданы эконометрические модели большой размерности.
Преимуществами эконометрических моделей являются: 1. Возможность учета взаимовлияния различных факторов, определяющих развитие социально-экономических систем. Комплексный учет взаимовлияния различных показателей, отражающих свойства реальных экономических процессов, является важным средством повышения качества прогнозов. 2. Возможность учета воздействия внешних по отношению к модели экономических и неэкономических факторов. 3. Возможность получения взаимосбалансированных многовариантных прогнозов по достаточно большому числу показателей. Модельные расчеты позволяют получать сбалансированное, взаимоувязанное в непротиворечивую систему прогнозное решение. Недостатки: 1. Эконометрические модели имеют же недостатки, что и описанные выше экономические модели динамики (большое количество уравнений, получение коэффициентов в которых обычно затруднено вследствие недостатка исходных данных). 2. Высокая стоимость работ, связанных с разработкой и реализацией эконометрических моделей, которые требуют формирования специальных баз данных, информационно-управленческих систем и привлечения квалифицированных специалистов по эксплуатации моделей, снижает эффективность применения данного метода. В статье «Необратимая микроэкономика» [48] рассматривается термодинамический подход к описанию экономики. Зависимость от времени поведения экономической системы (рынок, страна), состоящей из экономических агентов, описывается системой динамических уравнений. В противоположность обычному подходу - максимизации функции полезности/прибыли - приводится правило нулевых потерь для принятия решений экономическими агентами: в результате принятие какого-либо решения экономическим агентом его функция благосостояния не должна ухудшаться, т.е. он не должен нести каких-либо потерь.
Недостатком такого подхода является то, что данные, необходимые для расчета приведенных в статье систем уравнений, в полном объеме для всех экономических агентов найти очень трудно. В связи с этим реальные расчеты возможны только на уровне крупных экономических подсистем (промышленность, сельское хозяйство и т.д.), что ведет к снижению точности результатов.
Как показано в первой главе, на величину спроса на нефтепродукты влияет множество факторов (см. уравнения (1.1)-(1.4)). Таким образом, из известных методов для решения поставленной задачи построения моделей спроса на нефтепродукты, могут быть использованы следующие методы: - факторный анализ - для выделения основных факторов, влияющих на величину спроса на нефтепродукты; - корреляционный анализ - для выявления основных, линейно-независимых между собой переменных, существенно влияющих на спрос; - метод пошаговой регрессии - для определения структуры и параметров зависимостей спроса от выделенных основных переменных. При применении факторного анализа получают факторную модель (см. уравнения (2.5)-(2.8)), в которой все анализируемые переменные Х{,...,Х зависят от нескольких общих (скрытых) факторов, т.е. исходное множество переменных делится на группы таким образом, что переменные каждой группы зависят в основном от одного фактора. Степень влияния факторов на переменные определяется величиной факторных нагрузок. Для интерпретация природы полученных факторов в предметной области проводится ортогональное вращение по методу "варимакс" (см. уравнения (2.9)-(2.10)).
Сравнение точности прогнозирования различными методами в зависимости от периода прогнозирования и объема используемой выборки
Достоинства: модель обеспечивает стабильность прогноза даже в точках цикла с наименьшими значениями прогнозируемой переменной, т.к. коэффициенты вычисляются путем усреднения всего набора имеющихся данных, а не только результатов наблюдений в пределах одного цикла.
Недостатки: модель сложна для пользователя, кроме того, периодичность с периодом, меньшим одной единицы времени, может стать незаметной; ширина интервала наблюдения не позволяет различать колебания из семейства колебаний с угловыми частотами 2л" / 3 + 2л/,у = 1,2,3,....
Разложение в ряд Фурье применяется в случае, если анализируемая кривая имеет периодическую колебательную составляющую, однако в рассматриваемых рядах, хотя и имеется периодическая составляющая, но ее влияние не очень существенно, поэтому применение к ним данного метода неправомочно.
На вход системы автоматического управления действуют полезный сигнал и помеха, которые являются коррелированными между собой стационарными случайными процессами с равными нулю средними значениями. Н. Винером была предложена общая формула для нахождения реализуемой оптимальной частотной передаточной функции системы (оптимального фильтра Винера) - уравнение Винера-Хопфа. В системе с таким фильтром выходной сигнал минимально в среднеквадратичном отличается от полезного сигнала.
На основе общей формулы оптимального фильтра как частный случай может быть получено выражение для оптимальной частотной передаточной функции системы, осуществляющей при наличии помех статистическое упреждение (предсказание) сигнала.
Поскольку исследуемые экономические показатели по своей природе не являются стационарными (и уравнения спектральной плотности этих величин сложно получить), их прогнозирование с помощью оптимального фильтра Винера-Хопфа, скорее всего, нецелесообразно. Прогнозирование нестационарных процессов с использованием фильтра Калмана [57-60]
Результаты, связанные с задачами фильтрации и прогнозирования для широкого класса нестационарных процессов и статистик помех были получены независимо друг от друга Р.Калманом и Р. Бьюси.
В основе используемой Калманом и Бьюси концепции лежит предположение о том, что случайный процесс является марковским. Описывая все случайные процессы с помощью дифференциальных уравнений или уравнений состояния, они показали, что при случайных воздействиях оптимальная линейная система (оптимальный фильтр Калмана-Бьюси) должна удовлетворять некоторой системе неоднородных линейных дифференциальных уравнений. При решении задачи вводятся два основных предположения: модель формирования входного сигнала определяется линейной динамической системой, возбуждаемой белым шумом, коэффициенты которой могут зависеть от времени; всякий наблюдаемый сигнал содержит в качестве аддитивной помехи белый шум.
Подход Калмана заключается в определении дифференциального уравнения процесса, и для восстановления параметров этого уравнения требуется численное решение довольно сложного уравнения Риккати.
Однако на экономическую систему действует большое количество помех, рассмотрение которых в качестве белого шума является слишком грубым, и изменения экономических показателей вызваны, скорее всего, внешними причинами, а не внутренними свойствами объекта, поэтому для экономических систем лучше использовать другие методы.
Применяется для анализа одномерных временных рядов. Метод состоит в преобразовании одномерного ряда в многомерный, исследовании полученной многомерной траектории методом главных компонент и последующим восстановлением одномерного ряда. При этом часто оказывается возможным выделить отдельные слагаемые исходного ряда, такие как медленный тренд общего вида, медленные сезонные составляющие, периодические составляющие (если они есть) и случайные вариации. Это, в свою очередь, позволяет прогнозировать как сам временной ряд, так и тенденции развития его составляющих.
Особенностью метода является использование диалога исследователя с ЭВМ в процессе применения метода. Это связано с необходимостью интерпретации промежуточных результатов и управлением работой алгоритма в процессе многоэтапной процедуры обработки.
Недостатком является трудная реализация метода и необходимость длительного обучения для его полноценного и правильного использования (т.е. практика в обработке временных рядов именно этим методом), в основном на этапе визуального анализа информации.
Анализ рассмотренных методов показывает, что наиболее подходящими методами для прогнозирования ВВП, в свете вышеуказанных особенностей изменения этого показателя, являются: метод Холта, метод адаптивного сглаживания Брауна и метод Бокса-Дженкинса. Кроме того, можно осуществлять прогнозирование на основе регрессионных зависимостей.
Построение математической модели спроса на нефтепродукты с нечеткими входными и выходными переменными
Во второй главе были получены зависимости (2.15)-(2.18), из которых следует, что величина спроса на нефтепродукты зависит от таких показателей, как валовой внутренний продукт (ВВП) и расходы государства на оборону. Таким образом, для определения прогнозных значений спроса на нефтепродукты необходимо иметь прогнозные значения этих основных показателей. Для этого могут применяться различные методы.
Как было показано в третьей главе, точность прогнозирования снижается при увеличении периода прогнозирования и при резких изменениях в динамике анализируемого показателя (например, при переходе от этапа стабильного развития экономики к этапу экономических реформ). Поэтому в том случае, когда прогноз делается на длительную перспективу - 10-15 лет, или когда состояние экономики резко изменяется под воздействием большого числа трудно прогнозируемых факторов (как в настоящий момент), целесообразно использовать другие методы, такие как метод экспертных оценок и теория нечетких множеств. В этом случае сначала определяется прогноз для основных переменных и функции принадлежности для каждого из прогнозируемых значений методом экспертных оценок, после чего строится нечеткая модель. В данной главе рассматривается определение прогнозных значений спроса на нефтепродукты с применением метода экспертных оценок, элементов теории нечетких множеств и теории принятия решений в условиях неопределенности.
Методы экспертных оценок используются для анализа объектов и проблем, развитие которых либо полностью, либо частично не поддается математической формализации, т. е. для которых трудно разработать адекватную формализованную модель.
Метод интервью [28, 39] предполагает беседу прогнозиста с экспертом, в ходе которой прогнозист в соответствии с заранее разработанной программой ставит перед экспертом вопросы относительно перспектив развития прогнозируемого объекта. Успех такой оценки в значительной степени зависит от способности интервьюируемого эксперта экспромтом давать заключения по разным вопросам. Недостатком такого подхода является то, что довольно трудно найти экспертов такого уровня.
В методе Дельфи [28, 31, 39] проводится индивидуальный опрос экспертов, обычно в форме анкет. Затем производится статистическая обработка анкет и формируется коллективное мнение группы, выявляются, обобщаются аргументы в пользу различных суждений: вся информация сообщается экспертам. Участников экспертизы просят пересмотреть оценки и объяснить причины своего несогласия с коллективным суждением. Эта процедура повторяется 3-4 раза. В результате происходит сужение диапазона оценок. При статистической обработке результатов экспертных оценок в виде количественных данных, содержащихся в анкетах, определяются статистические оценки прогнозируемых характеристик и их доверительные границы, статистические оценки согласованности мнений экспертов.
Недостатком этого метода является невозможность учета влияния, оказываемого на экспертов организаторами опросов при составлении анкет, кроме того, на практике очень сложно подобрать группу необходимых экспертов.
Метод "мозговой атаки" [39]. Эксперты совместно обсуждают проблему и свободно общаются друг с другом при единственном ограничении - запрещается критика, что способствует свободе высказывания. Все высказанные идеи и мнения фиксируются и затем, на втором этапе, происходит их анализ и отбор.
Недостаток этого подхода, как и у предыдущих двух методов, связан с трудностями подбора группы экспертов, которые были бы достаточно компетентны и имели бы возможность принять участие в обсуждении вопроса о прогнозе макроэкономических показателей и с трудностью принятия решений по идеям, высказанным при "атаке".
Поскольку такие показатели как ВВП и расходы на оборону являются довольно сложными экономическими параметрами (связанными с политической обстановкой), в качестве экспертных мнений в работе использовались опубликованные в открытой печати оценки официальных организаций, а не отдельных лиц. Исходя из этого, рассмотренные методы не вполне подходят для такой ситуации, но могут быть использованы в том случае, если у исследователя появится возможность работать с группой экспертов, компетентных в рассматриваемом вопросе. Поэтому наиболее целесообразно для целей данной работы использовать элементы статистической обработки информации (принятой, например, в методе Дельфы).
При использовании интервальных оценок указывается диапазон изменения показателя: a = [amin,amax]. При этом предполагается, что все значения из этого интервала имеют одинаковую вероятность. Равновероятность значений величин является основным недостатком интервальных оценок.
Понятие нечеткого множества основывается на предположении о TOM,YTO любой элемент лишь в некоторой степени принадлежит данному множеству, поэтому одним из основных способов математического описания нечеткого множества является определение степени такой принадлежности некоторым числом, например из интервала [0, 1]. При этом границы интервала, т.е. 1 и 0, означают, соответственно, "принадлежит" или "не принадлежит".
Пусть Е - множество, х - элемент Е. Тогда нечетким множеством А множества Е называется множество упорядоченных пар {{х, р. 4(х))}, Vxe, где / ( ) -степень принадлежности х к А . / ( ) называется функцией принадлежности (см. рис. 4.1).
Обычные множества составляют подкласс класса нечетких множеств. Над нечеткими множествами выполняются те же операции, что и над обычными, а также операции, введенные для использования нечетких множеств в математическом аппарате принятия решений. Операции над нечеткими множествами, такие как объединение и пересечение, можно определить различными способами.