Оптимизация линейной оценки прогнозирования на основе теоретико-информационного подхода Баринов Алексей Владимирович

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Баринов Алексей Владимирович. Оптимизация линейной оценки прогнозирования на основе теоретико-информационного подхода : диссертация ... кандидата технических наук : 05.13.01.- Нижний Новгород, 2001.- 129 с.: ил. РГБ ОД, 61 02-5/415-8

Содержание к диссертации

Введение

1. Задача прогнозирования случайного временного ряда 14

1.1. Постановка задачи оптимального прогнозирования. Статистический подход 14

1.2. Линейная оценка прогнозирования 21

1.3.Адаптивный подход. Метод максимальной энтропии (метод Берга) 25

1.4. Анализ динамических свойств и проблема оптимальности 30

Выводы. 34

2. Теоретико-информационный подход 36

2.1 .Выбор порядка АР-модели прогнозирования 36

2.2. Проблема однородности выборочных данных 40

2.3.Синтез адаптивного алгоритма на основе информационного критерия оптимальности 46

Выводы 59

3. Результаты экспериментальных исследований 60

3.1 . Программа экспериментальных исследований 60

3.2.Модели сигналов и помех 63

3.3 .Результаты математического моделирования 72

Выводы 86

4. Автоматизированная система прогнозирования 88

4.1 .Блок-схема автоматизированной системы прогнозирования 88

4.2.Разработка ПО АСП 90

4.3. Пример практического применения: задача прогнозирования рыночной конъюнктуры 96

4.4.Обсуждение полученных результатов 104

Выводы 112

Заключение 113

Список литературы 116

Линейная оценка прогнозирования
Проблема однородности выборочных данных
Программа экспериментальных исследований
Пример практического применения: задача прогнозирования рыночной конъюнктуры

Линейная оценка прогнозирования

Под прогнозированием мы будем понимать научное (т.е. основанное на системе фактов и доказательств, установленных причинно-следственных связей) выявление вероятных путей развития явлений и процессов, оценку показателей, характеризующих эти явления и процессы для более или менее отдаленного будущего. Таким образом прогнозирование - это научная деятельность, направленная на выявление и изучение возможных альтернатив будущего развития и структуры его вероятных траекторий [75].

Объектами прогнозирования, естественно, не могут являться любые явления или процессы. Если результат процесса однозначен, то он не может быть предметом прогностического исследования. Если же сам процесс и его результат, независимо от его характера (природного, технического или экономического), имеет множество возможных альтернатив для реализации, то прогноз может принести существенную пользу.

Основой системы доказательств является качественный анализ процесса, т.е. раскрытие и обоснование причинно-следственных отношений, формирование общих гипотез и концепций будущего развития, оценка характера влияния основных составляющих этого процесса.

Поскольку прогноз по сути есть некоторое суждение относительно будущего неизвестного состояния системы или поведения процесса, то очевидна связь теории прогнозирования, теории вероятностей и математической статистики, выраженная в попытке преодоления проблемы априорной неопределенности.

Опыт свидетельствует о том, что при наличии определенной инерционности рассматриваемых процессов и взаимосвязей, и сохранении в будущем основных внешних причин и условий их развития, правомерно с достаточной степенью вероятности ожидать сохранения уже выявившихся черт и характера этого процесса. Тем самым становится целесообразно применять разнообразные методы обнаружения и экстраполяции преобладающей тенденции развития анализируемого объекта, объединенных идеей статистического подхода [4, 10, 23-25, 46,75].

Статистические методы прогнозирования не являются единственно возможными. Например, в прогнозировании активно используются различные методы получения и обобщения экспертных оценок. В ряде случаев прибегают к разработке так называемых сценариев развития, морфологическому анализу, историческим аналогиям и т.д. Большие возможности для прогнозирования кроются в применении имитационных моделей, систем искусственного интеллекта, нейронных сетей [45, 58, 77-79]. Однако до настоящего времени преобладающими являются статистические методы, что обусловлено, по видимому весьма развитым аппаратом анализа, практика применения которого имеет достаточно длительную историю. Вдобавок, статистические методы прогнозирования не исключают возможности их использования в качестве важных элементов комплексных методик, предусматривающих сочетание различных методов прогнозирования.

Центральная идея статистических методов прогнозирования основывается на модели стационарного временного ряда. Случайный временной ряд -случайный процесс в дискретном времени - некоторая последовательность случайных величин, измеряемых обычно через равные временные интервалы. Отличительная особенность методов статистического прогнозирования заключается в том, что они имеют дело со вполне определенной последовательностью чисел, которая в рамках статистического подхода признается реализацией случайного процесса. Использование модели случайного временного ряда напрямую связано с уже упоминавшейся проблемой априорной неопределенности. Имеющийся ряд - это детерминированная последовательность чисел, однако будущий член данной последовательности неизвестен. Одним из основных средств анализа и прогнозирования в рамках статистического подхода является модель. Модель есть по сути упрощение реального процесса, помещение его в рамки аналитических выражений, его формализация. Естественно, что уже сам факт использования модели говорит о невозможности получения абсолютно достоверных прогнозов реальных процессов. Очевидно также, что от того насколько обоснованно выбрана та или иная модель зависит в конечном итоге не только точность прогноза, но и возможность прогнозирования как таковая.

Понятие модель будем использовать в двух значениях: как модель временного ряда, выражающая закон генерирования членов ряда, и как прогнозная модель, или предиктор. Главное отличие двух типов моделей в том, что на выходе модели временного ряда фактические члены ряда, а на выходе прогнозной модели - оценки будущих членов ряда. Теоретически, свойства предиктора исследуются в предположении, что он применен для получения прогнозов некоторого процесса, генерируемого моделью, заданной аналитически.

Процесс прогнозирования, опирающийся на статистические методы, таким образом разбивается на два этапа. Первый заключается в обобщении данных, наблюдаемых за некоторый промежуток времени, и в представлении существующих статистических закономерностей в виде модели. Статистическую модель получают либо в виде аналитически выраженной тенденции развития, либо в виде уравнения зависимости от одного или нескольких факторов-аргументов. На втором этапе на основе найденных закономерностей определяется ожидаемое значение прогнозируемого признака или члена числовой последовательности.

Чтобы использовать аппарат теории случайных процессов для изучения экономической динамики, введем формализованное описание некоторых основных понятий [10, 12].

Реализацией случайного процесса назовем последовательность п результатов наблюдений х(0), х(1),..., х(я-1) некоторого процесса в дискретные моменты времени =0,1, ...п-1. Последовательность наблюдений x(f)j, полученных в равноотстоящие моменты времени, будем называть динамическим или временным рядом, а соответствующую ему вероятностную модель - случайным процессом с дискретным временем.

С каждым случайным процессом х(ґ) обычно связывают одну или несколько неслучайных функций. Такими функциями могут быть: математическое ожидание, дисперсия, автокорреляционная функция.

Математическим ожиданием случайного процесса x(t) называют неслучайную функцию Мх(ґ)] от времени, значения которой при каждой заданной величине параметра t=ti равны математическому ожиданию случайной величины x(tt) (т.е. математическому ожиданию случайной величины при фиксированном времени). Математическое ожидание представляет собой усреднение случайных значений функции х(/) для каждого заданного момента времени, вокруг которого группируются результаты наблюдений. Степень рассеивания этих наблюдений вокруг среднего значения характеризуется дисперсией процесса. Дисперсией случайного процесса x(t) называется неслучайная функция Цх(0.Ь зависящая от времени, значения которой при каждом фиксированном моменте времени t=ti равны дисперсии 0[х( )] случайной величины х(/.)5 рассматриваемой в момент времени tt.

Проблема однородности выборочных данных

Таким образом, можно сделать вывод, что рассматриваемые величины равны друг другу и соответствуют дисперсии порождающего шума только в идеальном случае, т. е. при полном соответствии авторегрессионной модели (в общем случае бесконечного порядка) анализируемому процессу, и, вдобавок, при бесконечном объеме выборочных данных, по которым происходит настройка АР-параметров. Вообще говоря, дисперсия порождающего шума является по сути математической абстракцией, которая позволяет судить о потенциально достижимой степени декорреляции исходного ряда. Дисперсия нескомпенсированного остатка - это приближенная оценка дисперсии порождающего шума.

В случае анализа реальных процессов по выборкам конечной длины реальная ошибка прогнозирования будет заведомо выше вычисленной дисперсии нескомпенсированного остатка. Более того, как видно из рис. 2.1. коренным образом может отличаться и характер зависимостей этих величин от основных параметров АР-модели прогнозирования. Таким образом дисперсию нескомпенсированного остатка следует использовать лишь в качестве предварительного критерия точности прогнозирования.

Для выбора порядка АР-модели предложено много различных критериев -своего рода целевых функций. Два подобных критерия были предложены Акаике [81, 82]. Первый из них - это так называемая окончательная ошибка прогнозирования (ООП). Согласно этому критерию, выбор порядка АР-модели осуществляется таким образом, чтобы минимизировать среднюю дисперсию ошибки на каждом шаге предсказания. Акаике рассматривает ошибку предсказания как сумму мощностей в непредсказуемой части анализируемого процесса и как некоторую величину, характеризующую неточность оценивания АР-параметров. ООП для АР-процесса определяется выражением ООП(М) = о] где TV- число отсчетов данных (объем выборки), М- порядок АР-модели, сг, -оценочное значение дисперсии порождающего шума (дисперсия нескомпенсированного остатка). Видно, что чем больше значение ст , тем менее точной является оценка прогнозирования, при этом содержимое круглых скобок растет с увеличением порядка М, характеризуя тем самым увеличение неопределенности оценки дисперсии.

Второй критерий Акаике основан на методике максимального правдоподобия и получил название информационного критерия Акаике (ИКА). Согласно этому критерию, порядок модели определяется посредством минимизации некоторой теоретико-информационной функции. В предположении, что исследуемый процесс имеет гауссовы статистики, ИКА будет определяться выражением [39]: HKA(M) = Nln(a2M(N)) + 2M . (2.1) Член 2М в (2.1) характеризует плату за использование дополнительных АР-коэффициентов, не приводящих к значительному уменьшению дисперсии ошибки прогнозирования. Отметим, что при больших объемах выборки наблюдений член NlncrM(N) имеет определяющее значение и критерий (2.1) становится в этом случае асимптотически эквивалентен критерию минимума дисперсии ошибки прогнозирования.

Таким образом, выбирается порядок модели, который минимизирует значение ИКА. Однако, многие исследователи отмечают [34, 39, 67], что порядок модели, выбираемый в соответствии с критерием min ИКА, в случае данных, не соответствующих авторегрессионным процессам, очень часто оказывается заниженным. Это объясняется тем, что в случае коротких выборок данных данный критерий также не обеспечивает удовлетворительных результатов, так как в этом случае первое слагаемое в (2.1) теряет свой вес.

Кроме того, ИКА не дает ответа на вопрос об оптимальном объеме выборки, его свойства исследовались в предположении о стационарности анализируемых рядов, а это не всегда достижимо на практике.

В рамках данной работы возникает необходимость применения универсального критерия, который позволил бы не только определить наиболее подходящий порядок модели прогнозирования, но объем массива выборочных данных, то есть оптимизировать качество используемой модели в целом.

Важнейшим условием применения авторегрессионных моделей для прогнозирования случайных временных рядов является однородность выборочных данных, т.е. их принадлежность к одной генеральной совокупности. Во многих случаях предположение об однородности требует дополнительной проверки. Причем здесь одинаково неприемлемы как слишком осторожные, так и завышенные оценки гипотетических интервалов стационарности, которые в равной мере приводят к очевидным потерям полезной информации.

Задача проверки однородности двух нормальных совокупностей N(KX),N(K2) с нулевыми средними и неизвестными матрицами автоковариаций Кх, К2 размером {пхп) каждая в терминах проверки статистических гипотез формулируется следующим образом:

Программа экспериментальных исследований

Программа экспериментов включала в себя исследование динамических свойств алгоритма прогнозирования, т.е. зависимости основных параметров модели от объема обучающей выборки наблюдений. Особый интерес, несомненно представляет исследование скорости сходимости оценок дисперсии нескомпенсированного остатка и дисперсии ошибки прогнозирования к своим истинным значениям.

Как уже отмечалось выше (глава 2), в асимптотическом случае величины дисперсии порождающего шума, дисперсии нескомпенсированного остатка и дисперсии порождающего шума равны друг другу, вследствие чего в целом ряде работ [34, 37, 39], посвященным теоретическому обоснованию использования АР-моделей, они взаимозаменяемы. Однако в случае конечных выборок наблюдений это не так. Методы математического моделирования позволяют проводить серию независимых испытаний, что дает возможность, используя статистическое усреднение, получить состоятельные оценки данных величин для случая конечных выборок. Этот пункт программы исследований несомненно ценен тем, что позволяет наглядно продемонстрировать принципиальное различие трех используемых в работе величин.

Важным пунктом программы являлось получение экспериментальных зависимостей параметров прогноза от порядка используемой модели. Необходимо показать, как меняются свойства алгоритма прогнозирования при использовании заниженных или завышенных порядков моделей прогнозирования.

Были исследованы зависимости величины информационного рассогласования (2.11) от двух основных параметров АР-модели: ее порядка и объема обучающей выборки наблюдений.

Программа исследований включала в себя также анализ эффективности предложенного алгоритма оптимизации в расчете на присутствие неоднородности в выборочных данных, причем характер и степень неоднородности в общем случае могут быть различными.

Очевидно, что проведение экспериментов невозможно без разработки соответствующей компьютерной программы, реализующей алгоритм прогнозирования, адаптивный алгоритм оптимизации параметров, а также алгоритмы экспериментальных исследований. В рамках данной диссертационной работы алгоритмы реализованы с применением языка программирования Visual Basic. Ряд вспомогательных вычислений реализован с применением электронных таблиц MS Excel.

Необходимым условием проведения экспериментов является получение случайных временных рядов с заданными статистическими свойствами. В качестве таких рядов могут быть, например выбраны искусственно сгенерированные ряды типа авторегрессии, для которых в частности априори известны дисперсия порождающего шума, порядок процесса и вектор АР-коэффициентов. Еще одним типом широко используемых рядов являются процессы, состоящие из смеси гармонических сигналов различной амплитуды и частоты с аддитивным шумом наблюдения. Гармонические сигналы не являются в чистом виде авторегрессионными процессами и для них, в частности, невозможно указать истинный вектор АР-коэффициентов и истинный порядок процесса. Использование таких процессов в экспериментах позволяет установить насколько хорошо авторегрессионная модель наблюдений согласуется с достаточно широким классом циклических процессов и позволяет обнаружить и спрогнозировать эти составляющие временного ряда.

Поскольку искусственно сгенерированные ряды могут иметь в принципе неограниченную длину, то одним из основных пунктов программы экспериментальных исследований является подтверждение теоретических результатов в асимптотике, т.е. при достаточно представительной выборке данных и при большом числе повторений опыта. Следует отметить, что повторяемость результатов эксперимента является неоспоримым преимуществом методов математического моделирования.

В качестве случайных временных рядов, на примере которых исследуются свойства модели прогнозирования и эффективность предложенного алгоритма оптимизации параметров модели, в работе используются авторегрессионные процессы двух фиксированных порядков (т\=8, т2=Ю) с различными наборами АР-коэффициентов и полигармонический сигнал, состоящий из смеси синусоид различной амплитуды и частоты с аддитивным белым гауссовским шумом.

Пример практического применения: задача прогнозирования рыночной конъюнктуры

Приведенный пример практического использования разработанного алгоритма не означает его узкой направленности на решение задач сугубо экономического или биржевого характера. Это может быть и анализ загруженности канала связи, и ранняя диагностика неисправностей оборудования, задачи метеорологии и т. д. Однако именно социально-экономические временные ряды в наибольшей степени подвержены влиянию самых различных факторов, качественно влияющих на характер процессов. Сложная структура таких процессов не позволяет использовать многие существующие методы анализа в силу ограниченности границ их применения. Таким образом для анализа эффективности предложенного алгоритма оптимизации линейной оценки прогнозирования сознательно был выбран ряд биржевых котировок акций как наиболее сложный для прогнозирования и, одновременно, представляющий несомненный интерес с точки зрения практических потребностей. Разработанная методика здесь получает ощутимые преимущества по сравнению с классическими методами.

Объективная оценка эффективности разработанного алгоритма и точности получаемых прогнозов невозможны без сравнения с результатами, получаемыми с применением уже существующих программных пакетов, реализующих те или иные методы статистической обработки информации и анализа временных рядов.

Из зарубежных статистических пакетов, получивших распространение в России можно выделить такие, как STATGRAPHICS, SPSS, SYSTAT, STATISTICA, S-plus и др. Из отечественных можно назвать пакеты STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП:СтатЭксперт, САНИ, ForecastExpert [11, 31,59]. Основную часть имеющихся статистических пакетов составляют специализированные пакеты и пакеты общего назначения. Специализированные пакеты, как правило, ориентированы на решение задач из одного-двух разделов статистики. Среди пакетов, реализующих методы анализа временных рядов следует выделить такие как ЭВРИСТА, МЕЗОЗАВР, ОЛИМП:СтатЭксперт, ForecastExpert. Некоторые простейшие возможности для анализа временных рядов включаются также и в табличные процессоры общего назначения, такие как MS Excel, Lotus 1-2-3 и т.д. Практически все из доступных статистических пакетов реализованы в виде версий под операционную систему MS Windows, имеют единый пользовательский интерфейс, средства обмена данными (clipboard, DDE, OLE), возможности графического представления полученных результатов.

Однако, несмотря на разнообразие и несомненную полезность существующих программных продуктов, нельзя не отметить ряд присущих им недостатков. В первую очередь это относится к "закрытости" программ. Это вынуждает использовать только те методы и алгоритмы, которые заложены разработчиками. Кроме того, в документации к распространяемым программам указаны лишь основные сведения о возможностях программ, носящих скорее рекламный характер, нежели содержательный анализ используемых методов с указанием границ применимости.

Например, программа SPSS содержит достаточно мощный блок анализа временных рядов и, в частности, процедуру оценивания авторегрессионной модели по выборке наблюдений. Но, к сожалению, в программе отсутствует процедура построения прогноза с использованием полученной АР-модели. Кроме того, при оценивании АР-параметров, порядок модели и объем выборочных данных устанавливаются пользователем самостоятельно. Очевидно, что в этом случае велика вероятность чисто субъективного подхода, приводящего в конечном итоге либо к серьезным потерям в точности, либо к серьезным затратам времени на осуществление дополнительных оптимизационных процедур. Следует отметить, что подбор наиболее подходящей модели вряд ли возможно осуществить путем перебора нескольких вариантов, так как оценить качество модели по двум-трем реализациям прогноза невозможно в связи с принципиально вероятностным характером задачи прогнозирования. Еще одним недостатком готовых продуктов являются так называемые "соглашения по умолчанию". Для того чтобы излишне не усложнять процедуру выбора методики прогнозирования и не отпугнуть пользователя многочисленными параметрами и допущениями, разработчики вынуждены делать упор на автоматическом или почти автоматическом подборе модели прогнозирования. Данный подход не требует от пользователя специальных знаний из области анализа временных рядов, однако может привести к выбору неадекватной модели или ряда ее параметров, а в ряде случаев и к прямым ошибкам.

Такую ситуацию можно проиллюстрировать следующим рисунком. На рис. 4.9 изображен участок временного ряда цен акций РАО ЕЭС в период с 09.09.96 по 24.04.97 и пример прогноза. Этот пример приведен в демонстрационной версии программы ForecastExpert. Из графика отчетливо видно, что временной ряд явно неоднороден по своей структуре. Следовательно, прогноз с использованием модели, настроенной по всей выборке скорее всего будет ошибочным. Данный факт иллюстрируется рис. 4.10, где кривая 1 - прогноз на 10 шагов в будущее (2 рабочие недели) в отсчете от 10.04.97 с использованием АР-модели, представленной в примере, с параметрами 7V=150, М=8. Кривая 2 на том же графике - прогноз с параметрами N=65, М=18, подобранными с использованием разработанного в диссертации алгоритма. Качественное различие вариантов прогнозов, подтверждающее важность проблемы оптимизации параметров АР-модели, легко заметить из сопоставления их с истинной динамикой ряда в период с 10.04.97 по 24.04.97 (кривая 3). Несмотря на то, что прогноз 2 имеет в целом меньшую по абсолютной величине ошибку прогнозирования, прогноз 1 гораздо в большей степени согласован с реальным процессом по динамике.

Оптимизация линейной оценки прогнозирования на основе теоретико-информационного подхода Баринов Алексей Владимирович

Линейная оценка прогнозирования

Проблема однородности выборочных данных

Программа экспериментальных исследований

Пример практического применения: задача прогнозирования рыночной конъюнктуры

Похожие диссертации на Оптимизация линейной оценки прогнозирования на основе теоретико-информационного подхода