Содержание к диссертации
Введение
Глава 1. Обзор методов моделирования динамики потребления товаров на макрорынках 14
1.1 Общие подходы к моделированию рядов динамики социально-экономических показателей 14
1.2 Параметрический подход к моделированию и прогнозированию рядов динамики 21
1.3 Показатели качества идентификации модели 27
1.4 Моделирование и прогнозирование динамики потребления на товарных рынках 33
Выводы по первой главе 47
Глава 2. Разработка комплекса моделей динамики потребления 49
2.1 Модели в виде дробно-рациональных функций 49
2.2 Моделирование колебательной компоненты на основе гармонических функций с переменной амплитудой 58
2.3 Декомпозиция многокомпонентных моделей динамики 63
Выводы по второй главе 69
Глава 3. Моделирование и прогнозирование динамики потребления с помощью предложенного комплекса моделей 71
3.1 Исследование качества идентификации и прогнозирования по предложенным моделям 71
3.2 Моделирование потребления нефти в развитых странах 82
3.3 Моделирование жизненных циклов на макрорынках программного обеспечения
3.4 Другие примеры моделирования социально-экономической динамики с помощью предложенного инструментария 106
Выводы по третьей главе 114
Заключение 116
Список использованных источников
- Параметрический подход к моделированию и прогнозированию рядов динамики
- Моделирование и прогнозирование динамики потребления на товарных рынках
- Моделирование колебательной компоненты на основе гармонических функций с переменной амплитудой
- Моделирование потребления нефти в развитых странах
Параметрический подход к моделированию и прогнозированию рядов динамики
Поскольку процессы, протекающие в социально-экономических системах (СЭС), являются по своей природе случайными, то для их изучения используется аппарат теории вероятностей и математической статистики.
Дискретным отображением процессов, протекающих в СЭС, являются ряды динамики (динамические ряды, временные ряды) - последовательность наблюдений (значений, уровней) показателя Yt, упорядоченных во времени t.
Социально-экономические временные ряды обладают характерной структурой, включающей набор компонент, каждая из которых формируется под воздействием определенного типа факторов.
Детерминированная часть Dt в структуре временного ряда учитывает наиболее значительные и стабильные, долговременные факторы, формирующие основную тенденцию и/или регулярные колебания динамики. Прочие факторы, влияние каждого из которых невелико или кратковременно, формируют стохастическую компоненту st. В структуре модели стохастическая компонента представляет собой отклонения модельных значений от реальных, поэтому называется также необъясненной компонентой (unexplained component), случайным отклонением, погрешностью, ошибкой (error) или остатком (residual).
В составе детерминированной части принято выделять три основных компоненты, различающихся по характеру и причинам возникновения.
Тренд (trend) или главная тенденция Tt представляет собой наиболее общую динамику, «основное течение» ряда. Тренд характеризуется направлением динамики (рост либо спад) и ее скоростью (ускорением либо замедлением). Циклические (cycle) или конъюнктурные колебания Ct относительно тренда представляют собой многолетние циклы, зачастую апериодические, различающиеся по амплитуде и форме. Сезонные (seasonal) колебания St возникают под влиянием регулярно (ежегодно, еженедельно, ежедневно и т.д.) повторяющихся факторов и являются строго периодическими. Однако форма колебаний и их амплитуда также могут изменяться со временем.
Некоторые из указанных компонент могут отсутствовать в модели, в зависимости от особенностей динамики конкретного показателя, а также реализованной частоты дискретизации наблюдений. Считается, что чем короче интервал наблюдения, тем проще может быть модель, адекватная выборке.
Все перечисленные компоненты являются ненаблюдаемыми (unobserved), поэтому их выделение является неоднозначным. Декомпозиция исходного ряда динамики предполагает выделение ненаблюдаемых компонент наиболее адекватным, т.е. отвечающим целям моделирования, способом.
Декомпозиционный подход к построению системы моделей (decomposition approach in model-building) динамики является частью системного подхода к анализу рядов динамики.
В ходе декомпозиции требуется определить наличный набор компонент ряда, структуру их взаимодействия и специфицировать модель каждой из компонент. Известные методы декомпозиции и предложение метода итерационной параметрической декомпозиции более подробно рассматриваются в пункте 2.3 настоящего исследования.
На практике возникают случаи, когда циклическую компоненту не удается отделить от тренда. Тогда для них используют общий термин тренд-циклическая компонента Tt [76], под которой подразумевается алгебра тренда и циклической компоненты: их сумма, произведение, только тренд, только циклическая компонента. Чаще всего такая ситуация возникает на коротких выборках, охватывающих менее одного периода циклических колебаний.
Сезонную и циклическую компоненты можно объединить термином колебательная компонента St. Эти компоненты, с одной стороны, обладают значительным сходством, поскольку представляют собой регулярные колебания динамики ряда относительно тренда. Общими являются и варианты алгебры взаимодействия с другими компонентами ряда.
Однако циклические колебания охватывают несколько лет, поэтому значительно больше подвержены изменениям и, как следствие, зачастую являются непериодическими. Каждый следующий цикл такой компоненты может быть не похож на предыдущий из-за существенного изменения экономической среды в течение периода колебаний.
Сезонные колебания, напротив, являются строго периодическими. Изменения сезонных колебаний проявляется в основном в постепенном увеличении или уменьшении их амплитуды и/или формы.
Соответственно, при моделировании сезонных и циклических колебаний первые хорошо описываются периодическими тригонометрическими функциями, а для вторых может потребоваться отдельная модель для каждого периода колебаний. В структуре ряда динамики дополнительно учитывают и другие компоненты: - календарную компоненту, связанную с различным количеством дней в месяцах и кварталах, праздничными днями и каникулами, строго привязанными к определенным датам и заранее известным; - выбросы - аномальные движения временного ряда, связанные с редко происходящими событиями, которые резко и кратковременно отклоняют ряд от общего закона движения: такие как крупные аварии, локальные вооруженные конфликты, природные катастрофы; - инфляционную компоненту, учитывающую изменение стоимости денег во времени. Существуют известные статистические и экономико-математические инструменты для устранения этих компонент из динамики ряда [22, 126, 133]. В дальнейшем будем полагать, что рассматриваемые ряды динамики при необходимости предварительно очищены от этих компонент.
Компоненты ряда могут взаимодействовать различными способами [9, 85, 103]. Традиционно рассматривается два основных варианта структуры ряда динамики - аддитивная и мультипликативная.
Моделирование и прогнозирование динамики потребления на товарных рынках
В числителе дроби в формуле (1.7) стоит сумма квадратов отклонений, которая интерпретируется как мера остаточного, не объясненного моделью разброса. Знаменатель дроби является мерой общего рассеивания Yt относительно линии математического ожидания mY . Коэффициент детерминации является мерой, позволяющей определить, в какой степени найденная модель дает лучший результат для объяснения исследуемой динамики, чем горизонтальная прямая mY, соответствующая стационарности показателя.
В общем случае коэффициент детерминации лежит в пределах от нуля до единицы. В случае если модель совершенно не объясняет показатель, коэффициент детерминации может быть отрицательным. Это может быть вызвано, к примеру, вычислительной ошибкой, неверным выбором структуры модели. Чем ближе коэффициент детерминации к единице, тем точнее модель.
Основным недостатком R является тот факт, что при усложнении модели он неизбежно возрастает и потому не всегда может служить критерием выбора. Поэтому для сравнения моделей вводится скорректированный коэффициент детерминации, учитывающий количество параметров в модели т: R2=\-(\-R2)- R2. п-т-\ Скорректированный коэффициент детерминации при т 0 строго меньше обычного R . При достаточно большом значении т (5 и более параметров) разница становится существенной, поэтому R не рекомендуется использовать для оценки качества моделирования, а лишь для сравнения моделей с различным числом параметров.
В общем случае следует руководствоваться принципом простоты: при приблизительно равной точности моделей следует выбирать более простую -с меньшим числом параметров, аддитивной структурой, линейным вхождением параметров.
Качество прогнозирования также определяется в первую очередь точностью полученного по модели прогноза, поскольку целью прогнозирования является получение количественных оценок будущих наблюдений временного ряда.
Для оценки точности прогноза по модели можно использовать МАЕ- и МАРЕ-оценки, рассчитанные на прогнозной части выборки:
Второй коэффициент Тейла (1.10) более распространен на практике. Значение второго коэффициента Тейла для конкретной выборки всегда ниже, чем первого. Нетрудно видеть, что чем меньше любой из коэффициентов, тем точнее прогноз. Для удобства восприятия их значения на практике зачастую выражают в процентах, как и МАРЕ. В дальнейшем в работе приводятся процентные значения коэффициентов Тейла.
Необходимо отметить, что в некоторых практических случаях необходимо использовать другие показатели качества моделирования. Например, в прогнозировании на валютных рынках наиболее важным является определение направления динамики, а величина ошибки прогноза становится второстепенной. В логистике нехватка запасов товара является более существенной ошибкой, чем избыток, т.е. положительные и отрицательные ошибки прогноза не являются равнозначными.
Как видно из приведенных формул (1.8)-(1.10), оценка точности прогноза возможна лишь после получения реальных прогнозных значений. Чтобы исследовать прогнозные качества модели применяют следующую процедуру.
Исходная выборка разбивается на две части - рабочую и контрольную (рисунок 1.3). В контрольную часть включаются / последних наблюдений, причем объем контрольной выборки не должен составлять более трети объема рабочей. рабочая контрольная прогноз исходная выборка Рисунок 1.3. Выделение рабочей и контрольной выборки.
Модель строится на рабочей части выборки, а контрольная служит для расчета оценок прогноза. Предполагается, что в будущем прогнозные свойства модели не изменятся, поэтому можно использовать полученные оценки прогноза как ожидаемые. Для получения окончательного прогноза модель строится по полному объему исходных данных.
Таким образом, для обеспечения качественного моделирования необходимой посылкой является достаточная точность модели (Rz 0,7) и точность прогнозирования по контрольной выборке (кп 20%).
Динамика потребления товара в течение всего периода с момента выхода товара на рынок и до прекращения его продаж формирует жизненный цикл продукции (ЖЦП). Под продукцией будем понимать товары, товарные группы, услуги, технологии, организации, бренды и т.п.
В различных дисциплинарных направлениях даются разные определения понятия «жизненный цикл», но в любом случае выделяются следующие существенные свойства [20]: протяжённость во времени; наличие нескольких последовательных и взаимосвязанных стадий (фаз). Переход от одной стадии к другой характеризуется существенными количественными и качественными изменениями. Жизненные циклы можно выделить как для отдельных продуктов, так и для их видов, семейств, сортов и целых отраслей.
В качестве количественных характеристик, отражающих стадию ЖЦП, могут применяться различные показатели. Чаще всего используются объемы продаж, в физических или в денежных единицах, а также занимаемая доля рынка. При моделировании в денежных единицах дополнительно следует учесть инфляцию.
Хотя существует множество видов ЖЦП [49, 51], наиболее традиционным можно считать жизненный цикл, состоящий из пяти стадий: внедрения, роста, зрелости, насыщения и спада (рисунок 1.4).
На стадии внедрения наблюдается ускоряющееся увеличение значений показателя. На стадии роста ускорение замедляется. На стадии зрелости увеличение идет с замедлением. После прохождения пика ЖЦП начинается стадия насыщения, когда величина показателя снижается с ускорением темпа. На стадии спада снижение происходит с замедлением. Причем на практике на стадии спада ЖЦП может приближаться как к нулевому уровню, так и к некоторой ненулевой константе (асимптоте).
Математически стадии ЖЦП можно выделить, используя условия равенства нулю первой и второй производных функции, описывающей ЖЦП. Для этого необходима неразрывная модель ЖЦП, допускающая дифференцирование.
Моделирование колебательной компоненты на основе гармонических функций с переменной амплитудой
Для других моделей наблюдается аналогичная зависимость, причем R составляет не менее 0,78 при уровне шума 30%, а кп при том же уровне шума не превышает 35%. Точность моделирования исходных данных практически не зависит от параметров моделей.
Наибольшее влияние на точность прогнозирования моделей оказывает положение точки максимума t0. Зависимости к-п от положения t0 на выборке в процентах от ее полного объема представлены на рисунках Б.З и Б.4.
Из графиков видно, что наименьшая ошибка прогнозирования наблюдается при положении точки максимума в области 40-60% от объема выборки (не более 20% при уровне шума до 30%). При этом сам объем выборки на точность прогнозирования почти не влияет. Наихудшие результаты прогнозирования (к-п до 50% при уровне шума
Kn/S 30%) получены при положении точки максимума в начале выборки (0 30% от ее объема). При приближении t0 к правому краю выборки точность прогнозирования снижается медленнее. Удовлетворительные результаты могут быть получены даже при положении точки перегиба за пределами выборки при уровне шума до 10%.
Таким образом, модели (2.1)-(2.4) можно применять для моделирования относительно коротких выборок при положении точки максимума вблизи средины выборки даже при значительному ровне шума (до 30%). При положении точки максимума вблизи начала выборки применять модели возможно только при низком уровне шума (1-5%). В то же время при положении точки максимума в конце или даже за пределами выборки (справа) возможно моделирование при уровне шума до 10-15%.
Это означает, что данные модели позволяют прогнозировать еще не сформировавшиеся циклы, находящиеся на стадии внедрения и роста, при условии, что зашумленность выборки невелика.
Тестирование моделей сезонных колебаний с переменной амплитудой (2.6)-(2.7) было выполнено на выборках объемом 12, 24, 36 и 48 наблюдений, при глубине прогноза 8-12 наблюдений (до трети объема исходной выборки).
Исследование проводилось на различных сочетаниях параметров в заданном диапазоне (таблицы А.8-А. 10, порядка 400 сочетаний для каждой модели). Частота колебаний выбиралась в соответствии с теоремой Котельникова-Шеннона, на каждый период колебаний приходилось не менее 3 наблюдений. Фаза колебаний перебиралась в диапазоне [-л-; л-]. Параметры изменения амплитуды описывают как ситуацию ее увеличения, так и уменьшения. Всего для каждой модели было сгенерировано порядка 250 000 выборок. Графики зависимости этих показателей от Kn/S для каждой из моделей представлены на рисунках Б.5-Б.7. По результатам тестирования средний R находится в пределах 0,79 при уровне шума до 30%. Коэффициент несоответствия к-п не превышает 10% при том же уровне шума и при объеме выборки 24 значения и более. При уменьшении же объема выборки до 12 значений коэффициент несоответствия кп достигает 10-15% даже при уровне шума 1%. При этом точность для п = 12 прогнозирования остается одинаково низкой при всех сочетаниях значений параметров.
В целом для моделей (2.6)-(2.7) можно отметить отсутствие зависимости точности как моделирования, так и прогнозирования от параметров гармоники (фазы и частоты). Не наблюдается улучшения точности прогнозирования и при увеличении наблюдаемого на выборке числа периодов колебаний.
Незначительная зависимость наблюдается от параметров А0, А\, а, но она связана не с изменением качества идентификации, а с базой для процентных соотношений: при значительном уменьшении амплитуды прогнозные значения могут быть весьма низкими. Из-за этого при одинаковой абсолютной величине ошибки, ее относительная величина возрастает.
Таким образом, при соблюдении теоремы Котельникова-Шеннона модели (2.6)-(2.7) могут применяться для выборок объемом 24-48 значений. Число периодов колебаний на выборке не играет большой роли, для идентификации достаточно даже двух периодов.
В соответствии с поставленной в главе 1 задачей, необходимо смоделировать и проанализировать процессы потребления нефти и нефтепродуктов в развитых странах. Также необходимо проанализировать сезонные колебания потребления нефти, для чего требуется внутригодовая статистика. Поквартальная статистика потребления нефти и нефтепродуктов предоставляется с 1984г. для следующих стран, входящих в двадцатку лидеров по потреблению нефти в мире на 2013г. (таблица 1.1) [153]:
Наибольший интерес вызывает прогнозирование глубины предстоящего спада, а также определение положения максимума тренда, и, соответственно, момента начала спада. Визуально лишь у Японии, Франции, Италии и Германии можно констатировать наличие сезонных колебаний, для других стран требуется исследование автокорреляции остатков после удаления тренда. Возможно и наличие многолетних циклических колебаний. Для развивающихся стран, в том числе для Китая и Индии, входящих в пятерку лидеров, напротив, характерен стабильный рост с близким к линейному трендом. Внутригодовая статистика для этих стран не предоставляется, поэтому судить о наличии и характере сезонных колебаний не представляется возможным.
Моделирование и прогнозирование динамики объемов потребления нефти в указанных странах было осуществлено на рабочей выборке за 1984-2008гг. (п = 100 наблюдений), при этом контрольная выборка содержала данные за 2009-2013гг. (/ = 20 наблюдений) [44]. Сводные характеристики точности полученных моделей представлены в таблице 3.2. Графики полученных моделей и их компонент представлены в приложении В.
Моделирование потребления нефти в развитых странах
Максимум второго цикла был достигнут в III квартале 2007г. и составил 1,33 тыс.т. Таким образом, второй цикл оказался более низким, но более продолжительным, чем первый. Также можно отметить отсутствие асимптотического уровня, т.е. модель цикла в долгосрочной перспективе стремится к нулю. В данный момент цикл уже достиг стадии спада, следовательно, рекомендуется вновь обновить предлагаемый ассортимент.
Сходный характер динамики свойственен и для социальных процессов на макро- и мезоуровне (региональном и муниципальном).
В качестве одного из таких примеров рассмотрим динамику международной миграции - численность населения, выбывшего из Российской Федерации в течение 1998-2010гг. [33]. Статистика об общей численности выбывшего населения, численности выбывших в страны СНГ и Балтии и другие зарубежные страны предоставляется ежемесячно, общий объем исходных данных составляет 156 наблюдений. Для проверки качества прогнозирования, вынесем в контрольную выборку 24 наблюдения (15% выборки) за 2009-2010гг.
В рассматриваемый период эмиграционный поток из РФ снижался, но снижение происходило неоднородно. В динамике показателя можно выделить миграционные волны, причем формирование каждой волны происходило достаточно независимо. Поэтому для моделирования циклической компоненты нельзя использовать гармоники, как это было показано в предыдущем примере. Вместо этого предлагается для описания 108 каждой волны использовать дробно-рациональную модель, которая ранее применялась для описания тренда. В модель вводится фиктивная переменная, обозначающая границы каждого цикла 8t (a,b): Сезонные колебания в данном случае имеют форму, близкую к треугольной, и для их моделирования требуется использовать сумму трех гармоник. Амплитуда колебаний изменяется пропорционально тренду.
Таким образом, модели международной миграции (числа выбытий) имеют следующую пропорционально-мультипликативную структуру:
Границы циклов приходятся на январь 1998 - май 2001, февраль 2005 -январь 2009. Общая точность модели оценивается R2 =0,991 иМАРЕ = 8,5%. График полученной модели в сравнении с исходными данными показан на рисунке 3.19.
Экспоненциальный тренд убывает с 10 тыс. чел. в начале 1998г. до 1,5 тыс.чел. в конце 2011г., приближаясь к асимптотическому уровню в 1,1 тыс.чел. В дальнейшей перспективе можно ожидать изменения направления тренда и смены спада на медленный рост.
Первая волна, связанная с кризисом 1998г., имеет значительную амплитуду (до 50% тренда при достижении максимума в марте 1999г.) и относительно небольшую продолжительность (2 года и 5 месяцев). Вторая волна имеет значительно меньшую амплитуду (не более 27% от тренда, максимум в марте 2007г.), но ее продолжительность составляет 4 года.
Гармоники, входящие в состав сезонной компоненты в данном случае не имеют индивидуального смысла, а лишь служат для моделирования формы колебаний. Амплитуда сезонности составляет порядка 25% от тренда.
В данном случае тренд описывается моделью гиперболического косинуса, т.е. уже в прогнозной части рассматриваемого периода происходит смена спада на рост. Необходимо учитывать, что данная модель имеет
Видим, что при построении общей модели удается выделить лишь одну волну в составе циклической компоненты, с границами в апреле 1998 - июле 2000. Две другие волны, выделенные для числа выбытий в страны СНГ и Балтии и другие страны, накладываясь, в сумме практически погашают друг друга. Однако их присутствие приводит к искажению тренда общей модели -асимптотический уровень определяется очень низко и не удается определить начало изменений и смену спада на рост. В результате это приводит к заниженному прогнозу.
Таким образом, в данном случае эффективнее строить модели более мелких, а не агрегированных показателей, и при необходимости, суммировать их.
Отметим, что такое решение будет правильным не для всех случаев. Зачастую агрегирование приводит к взаимному погашению не детерминированных компонент, а случайных остатков. Тогда модель, построенная по агрегированным данным, оказывается более качественной, чем сумма моделей составляющих динамики.
Рассмотрим также примеры моделирования и прогнозирования показателей естественного движения населения по Самарской области, а именно числа родившихся (без умерших на первом году жизни), числа умерших и ожидаемой продолжительности жизни при рождении в 1991 2010гг. Для расчета МАРЕ-оценки в прогнозную часть вынесены данные за Модель родившихся (без мертворожденных) в Самарской обл. за год В данном случае модель (2.3) описывает не «пик», как это было в предыдущих примерах, а «яму», возникшую в середине 90-х гг. ХХв. Модель констатирует замедление темпов роста числа родившихся в перспективе, однако предельный уровень модели достаточно высок и составляет порядка 60 тыс. чел.