Введение к работе
Актуальность темы диссертации. Одним из важнейших направлений в прикладной математике является прогнозирование некоторых показателей динамических явлений на основапии имеющихся в распоряжении исследователя экспериментальных статистических данных, представляющих временной ряд. Статистическое прогнозирование временных рядов широко применяется как в системах автоматизации научных исследований, так и при построении компьютерных систем поддержки принятия решений в таких областях пауки, как физика, экономика, социология, медицина и т. д. В связи с многообразием областей применения имеется множество научных работ, посвященных этому направлению. Однако большинство разработанных к настоящему времени методов статистического прогнозирования временных рядов предъявляют достаточно "жесткие" требования как к моделям, по которым строятся прогнозы, так и к собранный данным: гауссовость случайных ошибок наблюдений, независимость наблюдений, постоянство математического ожидания и дисперсии случайных ошибок, точное знание параметрического семейства моделей, отсутствие "выбросов" и т.д.
В практических приложениях часто возникают ситуации, когда имеют место искажения гипотетических моделей (см., например: Айвазян С.Л., Ершов Л.А., Краснснкср В.М., Хьюбер П., Хампель Ф., Раусеу П., Смоляк С.А., Тмтарепко Б.П., Харин Ю.С.), т.е. собранные данные не удовлетворяют некоторым гипотетическим модельным условиям, налагаемым на них известными методами прогнозирования. Причинами могут служить малый объем выборки, ошибки при сборе и обработке данных и др. В таких случаях оказывается, что методы статистического прогнозирования, обеспечивающие оптимальный прогноз (минимизирующий риск прогнозирования) в предположении выполнения всех модельных условий относительно собранпых данных, дают неточный, а иногда и абсолютно неверный прогноз при появлении некоторых искажений гипотетической модели.
Поэтому важное значение приобретает как оценивание устойчивости традиционно используемых методов прогнозирования временных рядов к определенным типам искажений, что особенно важно в процессе принятия решений о направлении научных исследований, так и разработка более точных и надежных, чем гипотетические, моделей временных рядов с искажениями а построение на их основе новых робастных методов прогнозирования, устойчивых к искажениям. Исследования в этих направлениях пользуются в настоящее время наибольшим спросом в таких важных областях практических приложений, как автоматизация банковской деятельности, создание систем экологического мониторинга, систем оценки эффективности экономических инструментов управления, что отмечено Российским государственным высшим аттестационным комитетом при анализе тематики диссертаций но специальности 05.13.16 (см. Бюллетень ГВАК РФ, 1998, №1, С.28). Для разработки систем автоматизации научных исследований важны также работы в области синтеза алгоритмов и программных процедур, реализующих робастные методы прогнозирования временных рядов на ЭВМ.
Связь работы с крупными научными программами, темами. Исследования проводи лись в рамках госбюджетных научных тем "Исследование проблем устойчивости и опти маяьности в теории статистического прогнозирования (1991-1996гг.)" Лг« государственно} регистрации 19941201 по приказу Минобразования. "Разработка методов и алгоритмої робастного (устойчивого) статистического анализа многомерных и динамических дашгш при наличии функциональных искажений (1996-2000гг.)" № государственной регистрации 19963454 по Государственной программе фундаментальных исследований РБ "Алгоритм", госбюджетной НИР "Разработать систему проблемно-ориентированных паке тов прикладных программ в области статистического анализа и моделирования (1996-1998гг.)" № государственной регистрации 19972532 (по ГНТП "Информатика") я хоздоговора с концерном "Белхимнефтепром" 'Разработка экономико-математических моделей и создание программного обеспечения для прогнозирования показателей химической отрасли (1995-1996гг.)" № 30891.
Цель и задачи исследования. Целью диссертационной работы является анализ устойчивости традиционно используемых методов прогнозирования временных рядов и анализ характеристик традиционно используемых критериев обнаружения искажений при наличии "выбросов" и функциональных искажений тренда, сиптез новых робастных методов прогнозирования временных рядов и критериев обнаружения искажений, а также разработка алгоритмов и программных процедур, реализующих эти методы на ЭВМ. В связи с этим необходимо решить следующие задачи:
получить точные выражения или асимптотические разложения для количественных
характеристик устойчивости к "выбросам" и функциональным искажениям трен
да традиционно используемых методов статистического прогнозирования временных
рядов;
разработать новые методы прогнозирования временных рядов, робастаые к "выбро
сам" и функциональным искажениям тренда;
получить точные выражения для вычисления критических уровней искажений, гарантирующих заданный уровень точности методов статистического прогнозирования временных рядов при наличии "выбросов" и функциональных искажений тренда;
получить аналитические выражения: для характеристик точности традиционно используемых критериев обнаружения "выбросов" во временных рядах;
разработать новые критерии обнаружения "выбросов" во временных рядах;
разработать алгоритмы и создать программное обеспечение, реализующее методы
статистического прогнозирования и критерии обнаружения "выбросов" для времен
ных рядов.
Научная новизна полученных результатов.
-
Впервые проведен анализ устойчивости к "выбросам" методов прогнозирования с использованием оценки по методу наименьших квадратов (МНК) и робастной оценки Хьюбера для временных рядов с трендом: аналитически и с помощью вычислительных экспериментов.
-
Аналитически и с помощью вычислительных экспериментов получены новые оценки устойчивости среднеквадратического риска к функциональным искажениям тренда временного ряда для метода прогнозирования с использованием оценки МНК.
-
Для авторегрессионных временных рядов впервые решены задачи анализа устойчивости к "выбросам" метода прогнозирования в случае известных параметров, метода прогнозирования в случае неточно заданных параметров и метода прогнозирования с использованием оценки МНК.
-
Разработан новый локально-медианный метод прогнозирования временных рядов с трендом, проведен аналитический анализ его устойчивости к "выбросам"; с помошью вычислительных экспериментов произведено сравнение этого метода с известными методами прогнозирования по величине риска.
-
Проведен анализ точности критерия Льюнга обнаружения "выбросов" для временных рядов с трендом; предложен новый итерационный локально-медианный критерий обнаружения "выбросов" для временных рядов с трендом, произведено сравнение этого критерия с критерием Льюнга с точки зрения точности обнаружения "выбросов" с помощью вычислительных экссериментов.
-
Разработаны алгоритмы, реализующие в ТШЇЇ "СТАТПРО" вышеперечисленные методы прогнозирования и критерии обнаружения искажений, а также оценена их вычислительная сложность.
Практическая значимость полученпых результатов. Полученные теоретические результаты могут быть использованы в практических задачах прогнозирования по реальным данным при выборе исследователем метода прогнозирования в условиях искажений гипотетической модели данных. Разработанные алгоритмы включены в пакет прикладных программ "СТАТПРО" (СТАТистическое Прогнозирование), разработанный в 1997 году в НИЛ статистического анализа и моделирования в рамках НИР "Разработать систему проблемно-ориентированных пакетов прикладных программ в области статистического анализа и моделирования" (номер госрегистрации договора 19972532) по Государственной научно-технической программе "Информатика".
Экономическая значимость полученных результатов. Разработанный в НИЛ статистического анализа и моделирования пакет прикладных программ "СТАТПРО", в состав которого включены результаты диссертационной работы, может рассматриваться как коммерческий продукт, на который имеется спрос в организациях, занимающихся обработкой
результатов научных исследований, а также, в экономических, финансовых, банковских, экологических и других учреждениях.
Основные положения диссертации, выносимые на защиту.
-
Точные выражения и асимптотические разложения для количественных характеристик устойчивости к " выбросам" методов прогнозирования с использованием одеяки МНК и оценки Хьюбера для временных рядов с трендом.
-
Точные выражения для количественных характеристик устойчивости к функциональным искажениям тренда метода прогнозирования с использованием оценки МНК для временных рядов с трендом.
-
Точные выражения и асимптотические разложения для количественных характеристик устойчивости к "выбросам" метода прогнозирования в случае известных параметров, метода прогнозирования в случае неточно заданных параметров я метода прогнозирования с использованием оценки МНК для авторегрессионных временных рядов.
-
Новый локально-медианный метод прогнозирования временных рядов с трендом.
-
Оценки точности критерия Льюнга и нового локально-медианного критерия обнаружения "выбросов" для временных рядов с трендом.
Личный вклад соискателя. Основные результаты, приведенные в диссертации, получены автором самостоятельно. Соавторам в совместных работах принадлежат предметные постановки задач и выбор направления исследований.
Апробация результатов диссертации. Основные результаты диссертации докладывались и обсуждались неоднократно в 1995-1998 годах на научных семинарах кафедры математического моделирования и анализа данных, на научной конференции "Современные проблемы радиотехники, электроники и связи" в Минске (1995), республиканской научной конференции, посвященной 25-летию факультета прикладной математики и информатики в Минске (1995), международной научной конференции "Компьютерный анализ данных и моделирование" в Минске (1995), V межгосударственной научной конференции, посвященной 75-летщо Б ГУ "Актуальные проблемы информатики: математическое, программное и информационное обеспечение" в Минске (1996), международной научно-практической конференции "Проблемы теории я практики статистики в переходный период" в Минске (1996), IV Всемирном конгрессе общества Бернулли по математической статистике в Вене (1996), IV Европейском конгрессе по технологиям искусственного интеллекта и программному обеспечению в Аахене (1996), VII Белорусской математической конференции в Минске (1996), Республиканской научной конференции "Математические методы в макро- и микроэкономике" в Минске (1996), международной научной конференции "Распознавание образов и обработка информации" в Минске (1997), I Европейской конференции
по анализу сигналов и прогнозированию а Праге (1997), VI научной конференции стран СНГ "Применение многомерного статистического анализа в экономике и оценке качества продукции" в Москве (1997).
Опубликованность результатов. По теме диссертационной работы имеется 15 печатных работ, из цих 5 научных статей, 2 заключительных отчета по НИР и 8 тезисов докладов на математических конференциях.
Структура и объем диссертации. Диссертация состоит из введения, общей характеристики работы, пяти глав, заключения и списка использованных источников, включающего 89 наименований. Общий объем диссертации составляет 107 страниц машинописного текста, включая 18 рисунков и 9 таблиц.