Введение к работе
Актуальность работы
Во многих областях науки и техники встречаются явления, которые важно изучать в их развитии и изменении во времени. Временные ряды, то есть совокупности упорядоченных во времени измерений некоторой переменной, распространены в геофизике (метеорология, сейсмология), медицинских исследованиях (электрокардиограммы, ряды заболеваемости), экономике (ряд изменения цен), демографии (прирост населения), технических дисциплинах (оценивание траекторий летательных аппаратов, управление производственными процессами). Статистический анализ временных рядов, основными задачами которого являются адекватное описание структуры и прогнозирование временного ряда, начал развиваться в сороковых годах. К настоящему моменту хорошо известны классические процедуры, разработанные Т.Андерсоном, Дж.Дурбиным, Э.Хеннаном, Дж.Боксом и Г. Дженкинсом, позволяющие решать задачи идентификации и прогнозирования моделей временных рядов, описываемых уравнениями авторегрессии-скользящего среднего (АРСС). Эти процедуры являются асимптотически эффективными, если процессы АРСС моделируются гауссовскими шумами. Я.З.Цыпкиным и Б.Т. Поляком построены минимаксные на классе распределений шумов алгоритмы оценивания параметров моделей АРСС и рассмотрены методы идентификации для некоторых типовых классов распределений. На практике, как правило, даже класс распределения шумов бывает неизвестен. С этим связана потребность в разработке соответствующих непараметрических процедур. Асимптотически эффективные оценки параметров моделей АРСС в условиях непараметрической модели шумов построены Дж.П.Крейссом с использованием адаптивного подхода. Существование этих оценок доказано при условии симметричной плотности и конечного четвертого момента шумов. Однако, многие экономические данные, например, колебание цен на сельскохозяйственную продукцию, описываются временными рядами с бесконечной дисперсией. Непараметрические знаковые процедуры для модели авторегрессии с бесконечной дисперсией шумов разработаны Ю.Н.Тюриным и М.В.Болдиным. Представляется актуальным распространение указанных подходов на другие классы моделей временных рядов и, в частности, на модели скользящего среднего.
Кроме того, многочисленные исследования указывают на то, что любые реальные данные содержат аномальные ошибки, к наличию которых классические процедуры весьма чувствительны. В связи с этим возникает необходимость в разработке робастных методов, которые лишь незначительно уступают в эффективности классическим методам при точном выполнении условий их оптимальности, и, в отличие от них, сохраняют достаточно высокую эффективность при нарушении
этих условии.
К числу методов, обладающих свойством робастности, принадлежат знаковые методы. Оптимальные знаковые процедуры разработаны и применяются при решении многочисленных статистических проблем: в задачах проверки гипотезы о симметрии плотности распределения независимых случайных величин (Э.Леман); проверки гипотезы о сдвиге в одновыборочной задаче (Р.Фишер); проверке гипотез о сдвиге в двувыборочной задаче (А.П.Муд); проверки гипотез и оценивания в модели линейной регрессии с независимыми погрешностями (Ю.Н.Тюрин) и в модели авторегрессии (Ю.Н.Тюрин и М.В.Болдин).
Настоящая работа посвящена разработке оптимальных знаковых методов идентификации моделей скользящего среднего (СС) и моделей линейной регрессии с автокоррелированными погрешностями в условиях априорной статистической неопределенности непараметрического типа.
Цели и задачи работы
Целью работы является построение асимптотических и точных (для выборок конечного объема) знаковых критериев для проверки адекватности описания наблюдений моделями СС и линейной регрессии с коррелированными погрешностями при неизвестном распределении шумов.
Для достижения сформулированной цели ставятся следующие задачи:
построить асимптотические и точные локально оптимальные знаковые критерии для проверки гипотезы о независимости наблюдений против различных альтернатив об их автокоррелированности;
построить знаковый критерий для проверки адекватности описания наблюдений уравнением СС заданного порядка и оценить коэффициенты этого уравнения;
построить знаковые критерии для проверки адекватности описания данных схемами линейной регрессии с автокоррелированными шумами в случае, когда альтернативные схемы имеют число неизвестных параметров равное числу наблюдений.
Методы исследования
В работе использованы современные методы теории вероятностей, теории случайных процессов, математической статистики, а также методы математического моделирования на ЭВМ.
Научная новизна
В работе получены следующие новые научные результаты:
— построена знаковая оценка вектора неизвестных параметров
уравнения СС без предположения о конечности дисперсии шумов, моделирующих процесс СС;
найдено асимптотическое распределение построенной оценки и вычислена ее асимптотическая эффективность;
вычислен функционал влияния знаковой оценки, доказана ее ро-бастность;
установлена оптимальность знаковых критериев для проверки гипотезы о независимости наблюдений против альтернативы об их ав-токоррелированности;
доказано, что построенные знаковые критерии являются свободными от распределения шумов.
Практическая ценность
Разработаны алгоритмы и программное обеспечение для ЭВМ, позволяющие решать задачи идентификации динамических объектов, описываемых уравнениями СС. Компьютерные программы применены для описания динамики и прогнозирования эпидемического процесса гепатита А в г.Новомосковске Тульской области.
Апробация работы
Материалы диссертации докладывались и обсуждались на Зеи Всесоюзной школе-семинаре «Динамика полета, управление и исследование операций» в 1990 году, на семинаре кафедры «Теория вероятностей» механико-математического факультета МГУ (руководитель проф. Ю.К. Беляев) в 1993 году и на научных семинарах кафедры «Теория вероятностей» МАИ. Материалы третьей главы опубликованы в трудах Международной конференции «Signals and Systems» в Варшаве в 1991 году.
Публикации
По теме диссертации опубликовано 5 печатных работ. Структура и объем работы
Диссертация состоит из введения, четырех глав и заключения. Содержание работы изложено на 195 страницах машинописного текста, иллюстрированного 9 рисунками и 5 таблицами. Список использованных источников составляет 87 наименований.