Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Кудров Александр Владимирович

Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом
<
Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Кудров Александр Владимирович. Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом : диссертация ... кандидата физико-математических наук : 08.00.13, 01.01.05 / Кудров Александр Владимирович; [Место защиты: Центр. эконом.-мат. ин-т РАН (ЦЭМИ)].- Москва, 2009.- 102 с.: ил. РГБ ОД, 61 09-1/498

Содержание к диссертации

Введение

О максимумах частичных выборок случайных последовательностей с псевдостационарным трендом. 20

1 Определения и результаты 20

2 Доказательство основного результата 23

Максимум частичных выборок в гауссовских последовательностях с псевдостационарным трендом . 29

1 Определения и результаты 29

2 Вспомогательные леммы 31

3 Доказательство основного результата 35

Верификация полученных аппроксимаций методом стохастического моделирования . 38

1 Случай области притяжения Гумбеля 41

2 Случай области притяжения Фреше 43

3 Случай области притяжения Вейбулла 45

Обработка реальных данных. 70

1 Температуры в Центральной Англии 70

2 Потребление электроэнергии в России 83

Заключение. 95

Введение к работе

Настоящая работа является диссертацией на соискание ученой степени кандидата физико-математических наук. Она посвящена статистическому анализу экстремумов стационарных временных рядов с добавленным переменным трендом, обобщающим сезонную составляющую. При этом допускаются пропуски наблюдений, что существенно влияет на выбор методики в силу наличия статистической зависимости между членами временного ряда. Диссертация состоит из трех глав, введения, заключения и библиографии. В первой главе изучается предельное поведение распределения экстремального значения произвольного стационарного временного ряда с добавленным малым исевдостационарным трендом, в условиях случайного прореживания, при неограниченном росте числа наблюдений. При этом на временной ряд налагаются условия слабой зависимости далекоотстоящих экстремумов (условие перемешивания типа Лидбеттера). Это условие не всегда легко проверяемо, в силу этого во второй главе рассмотрены гаус-совские временные ряды, для которых условие слабой зависимости может быть выражено в терминах поведения корреляционной функции на бесконечности. Вторая глава посвящена исследованию предельного распределения экстремума гауссовской стационарной последовательности с малой "почти сезонной "составляющей в условиях детерминированного прореживания. Вместо условия перемешивания требуется определенная степень стремления корреляций к нулю для далекоотстоящих наблюдений. В третьей главе рассматриваются примеры обработки реальных данных с периодической структурой но методике, основанной на результатах первых двух глав. Эти результаты сравниваются с результатами, полученными на основании классической статистической теории экстремальных значений. Также проводится сравнение классической о предлагаемой методик для данных, полученных методом стохастического моделирования.

Традиционно теория экстремальных значений используется для оценки функций распределения экстремумов выборок или отрезков временного ряда. Это позволяет оценить квантили высокого уровня. Например, около 40% территории Нидерландов находится ниже уровня моря. Поэтому для того, чтобы обезопасить от морских стихий территории, расположенные вдоль побережья, необходимо сооружать дамбы. Правительство, балансируя между стоимостью и надежностью, определило, что дам-

бы должны быть такой высоты, чтобы вероятность наводнения (вероятность того, что уровень морской воды превысит высоту дамбы) в течение года равнялась Ю-4. Возникает вопрос, какой в этом случае должна быть высота дамбы, чтобы соответствовать этому требованию. Помочь ответить на этот вопрос может теория экстремальных значений.

Оценка вероятностей редких или экстремальных событий является важной задачей в управлении рисками финансовых портфелей. Теория экстремальных значений позволяет использовать некоторые фундаментальные результаты, необходимые для статистического моделирования таких событий и вычисления мер экстремального риска. Последние несколько лет финансовые рынки характеризовались значительной неустойчивостью. Это привело роде к определенной критике существующей системы управления рисками, что явилось мотивацией поиска более адекватных методологий описания редких событий.

Обычным вопросом, на который каждый хотел бы получить ответ состоит в том, что: "Если ситуация начнет развиваться нестандартным образом, насколько неточны могут быть используемые модели. "Таким образом, проблема состоит в том, чтобы понять, как моделировать редкие события, которые лежат вне промежутка доступных наблюдений. В такой ситуации кажется важным полагаться на основательные методологии. Теория экстремальных значений (ТЭЗ) дает теоретические основания, на базе которых мы можем построить статистические модели, описывая экстремальные события.

Во многих областях современной науки, инженерии и страхования, теория экстремальных событий хорошо разработана (см., например, [Embrechts et al. (1999)], [Reiss, Thomas (1977)]). Сейчас существует различные исследования, направленные на анализ экстремальных изменений, возникающих на финансовых рынках (например, кризис валютных рынков, экстремальные события на фондовых рынках, кредитные дефолты). Характер хвостов финансовых рядов анализировался, помимо прочего, в работах [Koedijk et al. (1990)], [Dacorogna et al. (1995)], [Loretan, Phillips (1994)], [Longin (1996)], [Danielsson, de Vries (2000)], [Kuan, Webber (1998)], [Straetmans (1998)], [McNeil (1999)], [Jondeau, Rockinger (1999)], [Rootzen, Kluppelberg (1999)], [Neftci (2000)], [McNeil, Frey (2000)], [Gencay et al. (2003b)]. Интересная дискуссия относительно потенциала теории экстремальных значений в управлении рисками дана в работе [Diebold et al. (1998)].

В основе классической теории экстремальных значений лежит фундаментальная теорема о предельном распределении максимума

Мп = тах(Хх,...,Хп)

п независимых одинаково распределенных случайных величин. Этот результат впервые изложен в работе [Fisher R., Tippet L. (1928)] и получил полное математическое обоснование в работе [Gnedenko В. (1943)]. Терема Фишера-Тигшета-Гнеденко описывает все возможные предельные формы распределения М„ при линейных нормализациях.

Теорема 1. (Гнеденко, Фишер, Типпет).

Пусть (Хп) - последовательность независимых одинаково распределенный случайных величин. Если найдутся последовательности ап > 0, Ьп и невырожденная функция распределения Н(х) такие, что

lim р (Мп - Ьп <Л= Н(х) (1.1)

п- \ ап J

в каждой точке непрерывности Н{х), то Н(х) совпадает с точностью до линейного преобразования аргумента х с положительным коэффициентом масштаба с одной из трех функций распределения,

Н\{х) := ехр(—е~х) (распределение Гумбеля),

, л Г ехр(—х13) , если х > 0; (/3 < 0, распределение Фреше)

ZK ' \ 0 , если х < 0

тт ( \ _ j 1 , если х > 0; (Р > 0, распределение Вейбулла)

Из[Х) :~ \ ехр(-(-х)Р) , если х<0

В монографиях [De Haan L., Ferreira A. (2006)], [Leadbetter M., Lingren G., Rootzen H. (1983)] приводятся современные доказательства этого результата и многочисленные обобщения и уточнения.

Обозначим через F(x) функцию распределения случайной величины Хи тогда

Р(Мп <х)= Fn{x),

и (1.1) можно переписать в виде

lim Fn(anx + bn) = Н(х). (1.2)

п—>оо

Если для некоторых ап > 0, Ьп выполнено (1.2), то функцию распределения F(-) называют м^^ш^еХплГ'устойчивой. Если Н{х) с точностью до линейного преобразования аргумента совпадает с одной из Ни(х), где v = 1,2,3, тогда говорят, что F(-) принадлежит области притяжения Dv, и пишут F(-) Є Dv. Параметр /3 называют экстремальным индексом. Важнейшей задачей статистического анализа экстремальных значений является задача оценивания экстремального индекса р. В классическом случае выборки независимых одинаково распределенных случайных величин оценки для (3 были предложены в работах [Pickands J. (1975)], [Hill В. (1975)], [Dekkers A., de Haan L. (1989)], свойства этих оценок изучены во многих работах, смотри например [Masson D. (1982)], [Hall P. (1982)], [Hausler E., Teugels J. (1985)], [Davis R., Resnick S. (1984)], [Smith R. (1994)], [Beirland J., Teugels J. (1989)]. Современное состояние статистического анв-лиза экстремумов в классической постановке, включая векторные выборки

и выборки, состоящие из траекторий случайных процессов, изложено в монографии [De Haan L., Ferreira A. (2006)]. Оценки экстремального индекса в случае зависимых выборок также достаточно полно изучйены, см. монографию [Embrechts P., Mikosch Т., Kluppelberg С. (1997)] и библиографию в ней, а также [Hsing Т. (1991)], [Mladenovic' P., Piterbarg V. (2008)].

Известны критерии, дающие необходимые и достаточные условия принадлежности функции распределения F(-) к той или иной области притяжения ([Leadbetter М., Lindgren G. Rootzen Н. (1983)]). Следует отметить, что существуют функции распределения, для которых (1.2) не выполняется ни при каких ап > 0, Ьп. В этом случае линейно нормированный максимум Мп не имеет невырожденной предельной функции распределения. Таким свойством обладает, например, распределение Пуассона (доказательство этого утверждения см. на стр. 38 в работе [Leadbetter М., Lindgren G. Rootzen Н. (1983)].

Обобщение классической теории экстремальных значений происходило по двум направлениям:

1-ое напр.

2-ое напр.

расширение результатов классической теории на случай зависимых стационарных временных рядов

расширение результатов классической теории на случай неоднородных выборок и нестационарных последовательностей

Основные результаты развития теории по первому направлению представлены в работах [Loynes R. (1965)], [Leadbetter М. (1983)], [Watson G. (1954)], [Berman S. (1964)]; по второму направлению - [Cramer H. (1966)], смотри также монографии [Leadbetter M., Lingren G. Rootzen H. (1983)] и [Embrechts P., Mikosch Т., Kluppelberg С (1997)] и библиографии в них. Заметим, что ограничения на зависимость между далеко отстоящими друг от друга элементами используются таким образом, что предельный закон для линеаризованных максимумов остается такими же, как если бы исходная последовательность была бы последовательностью независимых случайных величин. При этом предлагаемые ограничения на зависимость значительно слабее, чем ограничения, связанные с доказательством центральной предельной теоремы для сумм зависимых случайных величин, как например условие зависимости Розенблатта (см. [Rozenblatt М. (1956)]). Предложенные ограничения на зависимость формулируются следующим образом: обозначим

Fllt...>in{xu...,xn) = P(Xh < xi,...,Xin < xn),

где (Xn) - стационарная в узком смысле случайная последовательность. Пусть п) - числовая последовательность. Тогда говорят, что для случайной последовательности п) выполнено условие перемешивания D(un), если найдется семейство чисел (an>(),n, I = 1,2,..., и последовательность натуральных чисел (/„) такие, что /„ = о(п), аПі1п —» 0, и для произвольных множеств натуральных чисел I = {ii, ...,гр}, J = {ji, ...,jq} таких, что

l2< ... <гр< ji < ... < jq < n, ji -ip> ln,

выполняется неравенство

Данное условие слабее стандартных форм условий перемешивания (например, сильного перемешивания), поскольку оно требует асимптотической независимости событий

р я

A = f]{Xir <ип} и В = f]{Xia < ип},

Г=1 5 = 1

тогда как условие сильного перемешивания Розенблатта требует, чтобы существовала функция д(к), стремящаяся к нулю при к — со, и такая, что

\Р(АПВ)-Р(А)Р(В)\<д(к),

для всех А Є а(Хі,...,Хр),В Є a(Xp+k+i,Xp+k+2,...), где ст(-) обозначает (Т-алгебру, порожденную случайными величинами, стоящими в скобках. То есть, если последовательность удовлетворяет этому условию, то всякое событие А, относящееся к прошлому вплоть до момента р, "почти не зависит" от любого события В, относящегося к будущему, начиная с момента р + к + 1, когда значение к велико.

Для гауссовских стационарных случайных процессов и последовательностей условие перемешивания можно заменить на условие достаточно быстрого убывания корреляции к нулю при неограниченном росте временного аргумента. Первой работой в этом направлении является работа [Berman S. (1964)], в которой доказана предельная теорема о сходимости к распределению Гумбеля для распределения максимума гауссовской стационарной последовательности п), при условии, что lim„_>00r(n) logn = О, где r{n) = cov{X\,Xn+\). Далее это направление интенсивно развивалось для непрерывного времени, для гауссовских случайных полей с непрерывным и дискретным временем, имеются результаты и для более медленного убывания корреляции, получено также необходимое и достаточное условие сходимости к распределению Гумбеля в терминах поведения корреляции ([Питербарг В. И. (1981)]). Основополагающий вклад в это направление принадлежит В. И. Питербаргу. Подробное изложение этих и других фактов асимптотичской теории гауссовских процессов имеется в монографиях [Питербарг В. И. (1988)] и [Piterbarg V. (1996)].

Одним из важных направлений развития статистической теории экстремумов является исследование прореженных последовательностей, что соответствует ситуации пропущенных наблюдений при статистической обработке данных. Для гауссовских последовательностей первыми работами в этом направлении являются [Mittal Y. (1978)] для дискретного времени и [Piterbarg V. (2004)] для непрерывного времени, где получены предельные распределения для совместного распределения максимумов по прореженным и полным данным. Задачи статистического оценивания параметров распределения экстремумов в условиях наличия пропущенных наблюдений впервые поставлены и частично решены в [Mladenovic' P., Piterbarg V.

(2008)], где доказана состоятельность модифицированных оценок Хилла (определение см. ниже) экстремального индекса в условиях пропущенных наблюдений. Отметим также статьи [Ольшанский К. А. (2004)] и [Ольшанский К. А. (2004а)], где изучено поведение оценки показателя кластеризации экстремумов для полной и прореженной последовательностей.

Следующей после модели с прореживанием важной моделью в исследовании распределения экстремальных значений для неоднородных выборок является переход к выборкам и случайным последовательностям с добавленным непостоянным трендом, например, при наличии сезонной составляющей. Насколько нам известно, первой работой в этом направлении является статья [Кузнецов Д. (2005)], где рассмотрена модель стандартной статистической выборки с добавленным малым почти периодическим математическим ожиданием. В этой работе впервые получена форма предельного распределения максимума и указано, насколько малым должен быть нестационарный тренд, чтобы существовало невырожденное предельное распределение. Этот подход является несомненно очень важным при обработке данных, в которых имеется, например, сезонная составляющая.

Как сезонная составляющая, так и наличие пропущенных наблюдений, являются важными атрибутами статистического анализа временных рядов, таких как экономические и финансовые ряды, ряды, описывающие динамику изменения окружающей среды, погоды, другие. Таким образом, представляется, что разработка методов и методик статистического анализа распределений экстремальных значений стационарных временных рядов с добавленным малым трендом типа сезонного и при наличии пропущенных наблюдений, является важной и актуальной задачей статистики временных, в частности экономических, рядов.

Перейдем к подробному изложению содержания настоящей диссертации.

В первой главе рассматривается задача аппроксимации распределения максимума прореженных значений временного ряда

У/п) = Хі + апти і = 1,2,.,.,п = 1,2,... (1.3)

где {Хі, і = 1,2,...} - строго стационарная случайная последовательность, где случайная величина Х\ имеет функцию распределение F{x), которое предполагается максимум-устойчивым; {т$, г = 1,2,...} - тренд, ведущий себя регулярным образом в определенном ниже смысле (например, сезонная составляющая), а п),(Ьп) - последовательности, для которых выполняется предельное соотношение (1.2).

Обозначим и\ = апх + Ъп, и^ — апу + Ьп, ип = max(u*, и2).

В первом параграфе первой главы вводится условие типа Лидбет-
тера на перемешивание больших значений в модели (1.3), аналогичные
введенным в работах [Ольшанский К. (2004)] и [Mladenovic P., Piterbarg
V. (2006)], и носит название условие D2{v}n,u^, ап, {т^}к=\ п)- Оно состо
ит в следующем:
последовательность случайных величин {Xt, і = 1,2,...} удовлетворяет

условию >2(«^,г4,а„, {mk}k-i,...,n), если найдется семейство чисел п>і}, п,1 = 1,2,... и последовательность натуральных чисел {1п} такие, что ln = о(п), an<in — О, и для любых х, у и произвольных множеств натуральных чисел I = {гі, ...,гр}, J = {ji, -,jq} таких, что

1 < гі < г2 < ... < ip < j\ < ... < jq < Щ h ~ip> In, выполняется неравенство

suP|p( p) {XjKu^-anmj})-

-P{f]{Xj < и*» - anmi})p[ f]{X3 < u^ - апт^) | < аІПуП,
je.1 jeJ

где супремум берется по всем отображениям а из множества натуральных чисел в множество {1,2}.

Условие D2(ull,ufl,an, {гпк}к=і,...,п) гарантирует перемешивание (слабую зависимость) далеко отстоящих больших значений временного ряда (1.3).

Вводится также дополнительное условие для случайной последовательности {Хі, г = 1,2,...} - условие D (ип тап):

lim limsupn \. Р{Х\ > ип тап; Xj > ип — тап} = О,

К 'ОО п юґі

Это условие гарантирует отсутствие кластеров экстремумов, аналогично случаю независимых Хг-, подробности см. в [Leadbetter R., Lindgren G. et al. (1983)].

Пусть имеется случайная последовательность из нулей и единиц {8і, і = 1,2,...}, где событие {5i = 0} символизирует пропуск наблюдения Хі.

Для 7] = 0,1 введем "выборочные функции распределения "значений тренда для пропущенных и наблюдаемых Yi,

G„{x) - - ,

г] = 0,1, знак # обозначает число элементов множества.

Пусть G - неубывающая неотрицательная непрерывная справа ограниченная функция, обозначим а+ :— тах(а, 0), и определим функции

р+оо

/

+оо ebdG{t)\ оо /+оо (z-t)idG(t), 0<О; оо /+оо {t-zf+dG(t),0>O. оо

Сформулируем условие псевдостационарности последовательности {пік, к = 1,2,...} относительно случайной последовательности {4, А; = 1,2,...}:

найдутся функции Go(x) и Gi(rc) такие, что для обоих т] = О,1 имеет место сходимость по вероятности

G"(x) —> Gn(x), при п —> со, (1.4)

во всех точках непрерывности х соответствующей функции Gv(x). Кроме того, для любого и = 1,2,3, если F Є Д,, то для всех х и п = 0,1 существуют конечные пределы

lim E(Lu(x, G")) = Lv{x, Gv) < oo.

Функции Lu{x, Gj,) участвуют в формулах для предельного распределения вектора Мпп. Заметим, что при выполнении условия 2 лишь L2(x,Gv) не обязательно конечно.

Во втором параграфе первой главы представлены вспомогательные леммы и их доказательства. Среди них - аналог теоремы Лидбеттера для последовательности {Y/ , п = 1,2, ...,г = 1,2,...} и двух пороговых уровней.

Во втором параграфе доказан основной результат первой главы -предельная теорема для случайного вектора С М*, ^"0 > 'хх-

Мп = max{Xj+mjan; і = 1,..., п} и Мп — max{Xi+miaTl; г = 1, ...,п, 8і = 1}

при неограниченно растущем п.

Теорема 1. Пусть в модели (1.3) F Є D„, где и = 1, 2 или 3. Предположим, что для последовательности случайных величин {Хг, г = 1,2,...} выполнены условия D2(ull,ufl,an,{mk}k=i,...,n), D (ип — тап). Предположим далее, что последовательность {гпь, к = 1,2,...} псевдостацио-нарна относительно случайной последовательности {5k, к = 1,2,...} и ограничена сверху (т := supi=12i... Ші < со,). Пусть последовательности {Хі, г = 1,2,...} и {Si, г = 1,2,...} независимы. Тогда, если и = 1 или v = 3, то для всех х, у,

ИГЛ Р{Мп < и\; Мп < U2n} = e-^^,Go)-L,(Gi,maX(x,!/))] ^

71—»О0

если v = 2, то для всех х,у > т,

lim Р(Мп < <, Мп < и2п) = е-Ы*,о0)-ыаит*х{х,у))

п—>оо

Во второй главе исследуется асимптотическое поведение совместного распределения максимума гауссовской последовательности и максимума ее же с детерминированным прореживанием в модели

{Xi + тіап, г = 1,2,..., п = 1,2,...},

где Хі, і Є Z,- гауссовская стационарная последовательность с нулевым средним и единичной дисперсией, ті, г Є Z, -псевдостационарный тренд, ап = (2\пп)-1/2. Обозначим

Ъп = V2lnn (1п1пп + 1п47г).

Отметим, что последовательности п), (Ьп) являются нормирующими последовательности в предельной теореме для максимума последовательности независимых гауссовских случайных величин (1.1), см. [Berman S. (1964)], [Leadbetter М., Lindgren G., Rootzen, H. (1983)].

Прореживание задается с помощью множества индексов непрорежен-ных наблюдений Gn = {i(l),..., t(n')}, которое является подмножеством Nn, п! = [п/п], к > 1 , [] - целая часть. ( vy, Nw = ^ -L^.^vvV),

В первом параграфе второй главы представлены основные понятия и формулировки необходимые для основного результата этой главы. В частности, определяется псевдостационарпая последовательность относительно детерминированного прореживания: последовательность {cjt, к Є Сп}, где Сп С Nn и п\ —> +оо при п —+ оо, называется исевдостационарной с функцией распределения С(х), если для любого х предел

С(Х) = lim K':c^g»ieg"}l.

га—»оо П

существует. Через \А\ обозначено число элементов этого множества А.

Отметим, что С(х) — не обязательно вероятностная функция распределения, то есть, С(+оо) не обязательно равно 1. Мы предположим, что {тпі : і Є Nn}, так же как {m* : г Є Gn}, п = 1,2,..., псевдостационарные последовательности с функциями распределениями N{x) и G(x), соответственно. Заметим, что если к = 1, тогда G(x) = N(x).

Во втором параграфе доказываются вспомогательные леммы, а также дана формулировка обобщенного неравенства Бермана, введенного и доказанного В. И. Питербаргом, [Питербарг В. И. (1988)], которое состоит в следующем:

пусть имеется два гауссовских вектора X = (Xi, ...,Хп) и Y = (УЇ, ...,1^) с нулевыми средними и ковариациями гх(к,1) and ro(k,l), соответственно, причем rx(k,k) = ry(k,k) = 1. Пусть имеется набор действительных чисел 0(к) < ... < им{к), к = 1, ...,п}. Обозначим через U алгебру подмножеств Rn, порожденную всеми параллелепипедами вида х"_1[иг(г), щ+і(і)}.-Тогда для любого U ЄК, имеет место неравенство

|Р(Хє[/)-Р(Ує/)|

п М

<2 Y, \ri(k,l}-r0(k,l)\Y, Ч>Ык)М1)ЫЫ))(И1. (1.7)

k,l=l,k>l i,j=uJo

Здесь ip(x, у; г) - гауссовская двумерная плотность с нулевыми средними, единичными дисперсиями и ковариацией г, a rh = hr\ + (1- h)r0.

В третьем параграфе второй главы доказана предельная теорема для предельного совместного распределения случайных величин

Мп(Х) = max{Xi -f rriidn} и МПіК(Х) = тах{Х* + т^„}.

Пусть mn не растет слишком быстро, а именно,

max \mk\ = o(lnn) при п —> со. (1.8)

fc=l,...,n

Мы предположим, что {mj : і Є Nn}, так же как {m* : г Є Gn}, п = 1,2,..., псевдостационарные последовательности с функциями распределениями N(x) и G(x), соответственно. Заметим, что если к = 1, тогда G(x) = N(x). Введем преобразование Лапласа функции распределения М,

/

оо e^dMix) оо

и обозначим

Г-+0О ехр {-е-»-А+*>/2А ^е-х(кДГ(1) - G(l)) + G(l))}

Л K ' J-oo Ke-*N(l)/G(l)-e-* + l ^'

где ip - плотность стандартного нормального распределения. Предположим, что

/

Н-оо

e^dN{x) < оо (1.9)

G(1)^0. (1.10)

Положим, что для ковариационной функции г(п) гауссовской последовательности {Хі, і = 1, 2,...} выполняются следующие условия:

т{п)Ып = 0{1) (1.11)

п ^ г=1

ко- Л

о(1) при п — оо, (1-12)

для некоторого действительного Л.

В частности, можно предполагать г{п) произвольной на "редких" множествах R С Z, таких что

\{к : к Є R, k = l,..., п}\ = 0(n/(L(n) Inn))

для любого L(n) —> со при п —> оо. Тогда для любого ж > 0, у Є Ш,

lim Р{МП(Х) - МП,«(Х) < ад МП,К(Х) < ЬПіІЇ + апу} = і^(ге, у),

га—«jo

(1.13)

Ь„л = \/2 \п(п/к) (1п47г + Ыпп).

2v21nn

Рассмотрим случай, когда частичная выборка является на самом деле полной, то есть, найдем предельное распределение максимума гауссовскои стационарной последовательности с псевдостационарным трендом. В этом случае

F?'{xty) = Г exp {-e"^^-AiV(l)} =: F?{y), (1.14)

J oo

то есть для любых X,

lim P (Mn < anx + bn) = F?(x). (1.15)

n—>oo

Этот результат оформлен в виде следствия 2.4 во второй главе. Отметим, что, если при п —» со корреляция г(п) убывает быстрее, чем Inn, то предельным распределением для нормированного максимума гауссовскои последовательности совпадает с распределением Гумбеля. Если же скорость убывания корреляции имеет порядок In п, то получаем иное распределение, отличное от распределения Гумбеля, то есть в этом случае не выполняется условие D ().

Все результаты, полученные для максимумов Мп, очевидным образом переносятся на минимумы, так как справедливо следующее соотношение:

тп = min{Xi,...,Xn} = -тах{-Хі,...,-Хп}.

Задача оценки функции распределения максимумов в/іборок случайных последовательностей с псевдостационарным трендом играет важную роль при определении резервов, прогнозировании пиков потребления (например, потребления электроэнергии), в прогнозировании экстремальных погодных явлении (например, высоких температур) и др. К решению этих задач можно подходить как с позиции результатов классической теории экстремумов, так и с позиции результатов, являющихся расширением классической теории экстремумов, с учетом сезонности данных. Рассматриваемые данные обрабатываются с помощью этих двух подходов.

В третьей главе при помощи методов стохастического моделирования, проведено сравнение классическим подхода (без учета тренда) оценки функции распределения максимума и подхода с учетом псевдостационарного тренда, основанного на результатах из главы 1. А именно, проведено сравнение качества подходов на примере смоделированных прореженных выборок из некоторых случайных последовательностей, каждый элемент которых представим в виде суммы стационарной последовательности {Хі,і = 1,2,...}, где Хі имеет функцию распределения F(x), которая максимум-устойчива, и добавочной псевдостационарной составляющей a„sin(27ri/3), где последовательность п) такая, что выполняется

(1.2). Рассмотрены случаи, когда элементы стационарной последовательности имеют гауссовское распределение, распределение Коши и равномерное на отрезке [0; 1] распределение, и в которых элементы стационарной последовательности являются независимыми случайными величинами, так и случаи, в которых элементы стационарной последовательности являются 2-зависимыми. Прореживание моделируется при помощи последовательности (Si):

J 1, с вероятостью ^; 1 0, с вероятостью -^,

{Si} - последовательность независимых случайных величин, не зависящих от {Хі, г = 1,2,...}.

Пусть {Хі} удовлетворяет условиям основного результата главы 1.

Применим этот результат к

п(Х) = max{Xj + ansin(27ri/3); і Є N„, S{ = 1}.

Пусть

lim P {Mn(X) ;) )

= e~x'>

4(1 - F(bn))E ^ е*ЯЗ**(*)) + о (к'1) =

= 4(1 - F{bn))Li{xr„ G„) + о (k~l).

Последнее равенство имеет место в силу условия 6. Эта же цепочка верна в силу сделанного выше замечания и для любого J; U J*, I = 1, ...,fcn. Следовательно, воспользовавшись (2.11), имеем,

Р(Мп(^ U J*) < и\, МЯ(Л и Гг) < и2п) = = 1 - 4(1 - ПК)) (Чх, Go) + Za(y, G,)) + о (к;1) .

Но так как

lim га(1 - F(bn)) = 1,

п—юо

то для любого І Є {1,.., кп},

P(Mn(Ji U Jt) < иІМп(^ U J?) < ul) =

= 1--^- (Ia(s, Go) + Life, GO + o{l)).

Пусть теперь F Є Дг, тогда можно взять, [Leadbetter M.R. Lingren G. et al. (1983)],

an = inf(z : 1 - F(z) < 1/n),

bn = 0.

При этом linin-^oo an = oo. Для всех функций распределения F из D2 выполняется свойство (см. [Leadbetter M.R. Lingren G. et al. (1983)]):

n_^oo l - /< (a„) Пользуясь этим и условиями теоремы (ж, у > т), получаем, что

Sv(n, Л U Л*) =

= р=,)(i-л^)(1~ ^,:^ =

^с г 117. і -Г ^anj

j6(JlUJJ

= (1-FK)) Е P(Sj = v)((ur,-mj)0+ o(l)) =

= (1 - F(a„)) I Yl h^v) К - ^У J + о (A;"1) =

= rfn(l - F{an))E (/^K, - *)?*#*(*)) + о (A-1) = = 4(1 - F(bn))L2(xv, Gr,) + о (fc-1).

Последнее равенство имеет место в силу условия 6. Эта же цепочка верна и для любого J; U J*, I = 1,..., кп. Следовательно, для всех таких I,

Sr,(n, Jx U Jf) = КхЬ2{х^ Gv) + о (k-1) .

Подставляя это выражение в (2.11), и учитывая, как и в первом случае, что

lim n(l-F(on)) = l,

п—>оо

получаем для любого / = 1,.., кп следующее соотношение:

p(Mn(Ji и j;) < и1мпц и j?) < и2п) =

= 1 - к-1 (L2(x, Go) + L2(y, Gr)) + о (к-1).

Наконец, пусть F є D3. Тогда можно взять, [Leadbetter M.R. Lingren G. et al. (1983)],

an = W(F) - inf(z : 1 - F(z) < 1/n),

bn = w(F).

Легко видеть, что linin-.oo an = 0. Следующее свойство справедливо для всех F Є D3:

п—оо і — F[bn — ап)

при z < 0, см. [Leadbetter M.R. Lingren G. et al. (1983)]. Далее, рассуждая аналогично двум предыдущим случаям, пользуясь теперь соотношением

lim га(1 - F(bn - ап)) = 1,

п—»оо

получаем для всех I = 1,.., кп, что в этом случае

P(Mn(Ji U J*) < игппU J?) < и2п) = = 1-^1 (L3(x, Go) + L3(y, d)) + о {к'1) .

Сводя все три случая вместе, получаем из (2.9) что для всех и = 1,2, 3 и FED»,

Р(Мп < и1п, Мп < и2п) = (і - ^-п (М*. G0) + Lv{y, GO + о(1)Л " + o(l)

при n —> со. Поскольку A;n —» со, то

lim P{Mn < uln,Mn < u2n) = e-M^obMy.G^

п—юо

откуда следует утверждение теоремы.

Доказательство основного результата

Оценка вероятностей редких или экстремальных событий является важной задачей в управлении рисками финансовых портфелей. Теория экстремальных значений позволяет использовать некоторые фундаментальные результаты, необходимые для статистического моделирования таких событий и вычисления мер экстремального риска. Последние несколько лет финансовые рынки характеризовались значительной неустойчивостью. Это привело роде к определенной критике существующей системы управления рисками, что явилось мотивацией поиска более адекватных методологий описания редких событий.

Обычным вопросом, на который каждый хотел бы получить ответ состоит в том, что: "Если ситуация начнет развиваться нестандартным образом, насколько неточны могут быть используемые модели. "Таким образом, проблема состоит в том, чтобы понять, как моделировать редкие события, которые лежат вне промежутка доступных наблюдений. В такой ситуации кажется важным полагаться на основательные методологии. Теория экстремальных значений (ТЭЗ) дает теоретические основания, на базе которых мы можем построить статистические модели, описывая экстремальные события.

Во многих областях современной науки, инженерии и страхования, теория экстремальных событий хорошо разработана (см., например, [Embrechts et al. (1999)], [Reiss, Thomas (1977)]). Сейчас существует различные исследования, направленные на анализ экстремальных изменений, возникающих на финансовых рынках (например, кризис валютных рынков, экстремальные события на фондовых рынках, кредитные дефолты). Характер хвостов финансовых рядов анализировался, помимо прочего, в работах [Koedijk et al. (1990)], [Dacorogna et al. (1995)], [Loretan, Phillips (1994)], [Longin (1996)], [Danielsson, de Vries (2000)], [Kuan, Webber (1998)], [Straetmans (1998)], [McNeil (1999)], [Jondeau, Rockinger (1999)], [Rootzen, Kluppelberg (1999)], [Neftci (2000)], [McNeil, Frey (2000)], [Gencay et al. (2003b)]. Интересная дискуссия относительно потенциала теории экстремальных значений в управлении рисками дана в работе [Diebold et al. (1998)].

Если для некоторых ап 0, Ьп выполнено (1.2), то функцию распределения F(-) называют м ш еХплГ устойчивой. Если Н{х) с точностью до линейного преобразования аргумента совпадает с одной из Ни(х), где v = 1,2,3, тогда говорят, что F(-) принадлежит области притяжения Dv, и пишут F(-) Є Dv. Параметр /3 называют экстремальным индексом. Важнейшей задачей статистического анализа экстремальных значений является задача оценивания экстремального индекса р. В классическом случае выборки независимых одинаково распределенных случайных величин оценки для (3 были предложены в работах [Pickands J. (1975)], [Hill В. (1975)], [Dekkers A., de Haan L. (1989)], свойства этих оценок изучены во многих работах, смотри например [Masson D. (1982)], [Hall P. (1982)], [Hausler E., Teugels J. (1985)], [Davis R., Resnick S. (1984)], [Smith R. (1994)], [Beirland J., Teugels J. (1989)]. Современное состояние статистического анв-лиза экстремумов в классической постановке, включая векторные выборки и выборки, состоящие из траекторий случайных процессов, изложено в монографии [De Haan L., Ferreira A. (2006)]. Оценки экстремального индекса в случае зависимых выборок также достаточно полно изучйены, см. монографию [Embrechts P., Mikosch Т., Kluppelberg С. (1997)] и библиографию в ней, а также [Hsing Т. (1991)], [Mladenovic P., Piterbarg V. (2008)].

Известны критерии, дающие необходимые и достаточные условия принадлежности функции распределения F(-) к той или иной области притяжения ([Leadbetter М., Lindgren G. Rootzen Н. (1983)]). Следует отметить, что существуют функции распределения, для которых (1.2) не выполняется ни при каких ап 0, Ьп. В этом случае линейно нормированный максимум Мп не имеет невырожденной предельной функции распределения. Таким свойством обладает, например, распределение Пуассона (доказательство этого утверждения см. на стр. 38 в работе [Leadbetter М., Lindgren G. Rootzen Н. (1983)].

Основные результаты развития теории по первому направлению представлены в работах [Loynes R. (1965)], [Leadbetter М. (1983)], [Watson G. (1954)], [Berman S. (1964)]; по второму направлению - [Cramer H. (1966)], смотри также монографии [Leadbetter M., Lingren G. Rootzen H. (1983)] и [Embrechts P., Mikosch Т., Kluppelberg С (1997)] и библиографии в них. Заметим, что ограничения на зависимость между далеко отстоящими друг от друга элементами используются таким образом, что предельный закон для линеаризованных максимумов остается такими же, как если бы исходная последовательность была бы последовательностью независимых случайных величин. При этом предлагаемые ограничения на зависимость значительно слабее, чем ограничения, связанные с доказательством центральной предельной теоремы для сумм зависимых случайных величин, как например условие зависимости Розенблатта (см. [Rozenblatt М. (1956)]).

Для гауссовских стационарных случайных процессов и последовательностей условие перемешивания можно заменить на условие достаточно быстрого убывания корреляции к нулю при неограниченном росте временного аргумента. Первой работой в этом направлении является работа [Berman S. (1964)], в которой доказана предельная теорема о сходимости к распределению Гумбеля для распределения максимума гауссовской стационарной последовательности (Хп), при условии, что lim„_ 00r(n) logn = О, где r{n) = cov{X\,Xn+\). Далее это направление интенсивно развивалось для непрерывного времени, для гауссовских случайных полей с непрерывным и дискретным временем, имеются результаты и для более медленного убывания корреляции, получено также необходимое и достаточное условие сходимости к распределению Гумбеля в терминах поведения корреляции ([Питербарг В. И. (1981)]). Основополагающий вклад в это направление принадлежит В. И. Питербаргу. Подробное изложение этих и других фактов асимптотичской теории гауссовских процессов имеется в монографиях [Питербарг В. И. (1988)] и [Piterbarg V. (1996)].

Одним из важных направлений развития статистической теории экстремумов является исследование прореженных последовательностей, что соответствует ситуации пропущенных наблюдений при статистической обработке данных. Для гауссовских последовательностей первыми работами в этом направлении являются [Mittal Y. (1978)] для дискретного времени и [Piterbarg V. (2004)] для непрерывного времени, где получены предельные распределения для совместного распределения максимумов по прореженным и полным данным. Задачи статистического оценивания параметров распределения экстремумов в условиях наличия пропущенных наблюдений впервые поставлены и частично решены в [Mladenovic P., Piterbarg V. (2008)], где доказана состоятельность модифицированных оценок Хилла (определение см. ниже) экстремального индекса в условиях пропущенных наблюдений. Отметим также статьи [Ольшанский К. А. (2004)] и [Ольшанский К. А. (2004а)], где изучено поведение оценки показателя кластеризации экстремумов для полной и прореженной последовательностей.

Следующей после модели с прореживанием важной моделью в исследовании распределения экстремальных значений для неоднородных выборок является переход к выборкам и случайным последовательностям с добавленным непостоянным трендом, например, при наличии сезонной составляющей. Насколько нам известно, первой работой в этом направлении является статья [Кузнецов Д. (2005)], где рассмотрена модель стандартной статистической выборки с добавленным малым почти периодическим математическим ожиданием. В этой работе впервые получена форма предельного распределения максимума и указано, насколько малым должен быть нестационарный тренд, чтобы существовало невырожденное предельное распределение. Этот подход является несомненно очень важным при обработке данных, в которых имеется, например, сезонная составляющая.

Вспомогательные леммы

Этот результат оформлен в виде следствия 2.4 во второй главе. Отметим, что, если при п со корреляция г(п) убывает быстрее, чем Inn, то предельным распределением для нормированного максимума гауссовскои последовательности совпадает с распределением Гумбеля. Если же скорость убывания корреляции имеет порядок In п, то получаем иное распределение, отличное от распределения Гумбеля, то есть в этом случае не выполняется условие D ().

Задача оценки функции распределения максимумов в/іборок случайных последовательностей с псевдостационарным трендом играет важную роль при определении резервов, прогнозировании пиков потребления (например, потребления электроэнергии), в прогнозировании экстремальных погодных явлении (например, высоких температур) и др. К решению этих задач можно подходить как с позиции результатов классической теории экстремумов, так и с позиции результатов, являющихся расширением классической теории экстремумов, с учетом сезонности данных. Рассматриваемые данные обрабатываются с помощью этих двух подходов.

В третьей главе при помощи методов стохастического моделирования, проведено сравнение классическим подхода (без учета тренда) оценки функции распределения максимума и подхода с учетом псевдостационарного тренда, основанного на результатах из главы 1. А именно, проведено сравнение качества подходов на примере смоделированных прореженных выборок из некоторых случайных последовательностей, каждый элемент которых представим в виде суммы стационарной последовательности {ХІ,І = 1,2,...}, где Хі имеет функцию распределения F(x), которая максимум-устойчива, и добавочной псевдостационарной составляющей a„sin(27ri/3), где последовательность (ап) такая, что выполняется (1.2). Рассмотрены случаи, когда элементы стационарной последовательности имеют гауссовское распределение, распределение Коши и равномерное на отрезке [0; 1] распределение, и в которых элементы стационарной последовательности являются независимыми случайными величинами, так и случаи, в которых элементы стационарной последовательности являются 2-зависимыми.

Во всех рассмотренных случаях видно, что функция распределения К\{х) приближает эмпирическую функцию распределения нормированных максимумов прореженной выборки лучше, чем функция распределения К2(х).

В четвертой главе проведена обработка реальных данных о потреблении электроэнергии в России и температуре воздуха в Центральной Англии. Полученные результаты также сравнены с результатами, полученными с помощью классического подхода.

В первом параграфе четвертой главы представлены результаты обработки реальных данных, представляющих собой выборку, состоящую из ежедневных максимумов температур воздуха в Центральной Англии, взятых за период с 1 января 1878 по 31 декабря 1998 года, для которых описана процедура построения функции распределения годовых максимумов температур в этом регионе на основании классической теории экстремальных значений, на основании результатов главы 1 и сравним каждую из полученных функций распределения с эмпирической функцией распределения.

Во втором параграфе четвертой главы исследуются данные о почасовом потреблении электроэнергии в России за период с 7 июня 2005 года по 22 июля 2005 года. Визуальный анализ изменения потребления электроэнергии позволяет сделать вывод о периодичности потребления за сутки. Более того, можно увидеть, что имеется периодичность, связанная с днями недели, и годичная периодичность (однородность по сезонам). При полном исследовании экстремальных значений потребления необходимо учитывать и годичный тренд. Задача полного исследования в работе не ставится.

В нашем случае, такой период взят как пример однородности по сезону. Были взяты только данные со вторника по четверг каждой недели, так как максимумы потребления в течение недели за рассматриваемый период достигаются только в эти дни и для этих дней наблюдается похожая структура потребления.

Пусть последовательность (Xj) - это выборка последовательности (Xj), тогда (Y ) - это выборка последовательности (XJ -+- pj). Положим, что (Xj) обладает свойствами стационарности и асимптотической независимости. Тогда, применив результаты главы 1 для случая, когда периодический тренд равен нулю, получим предельную функцию распределения для нормированных максимумов случайного ряда (Xj) (функцию распределения экстремальных типов). Оценим эту предельную теоретическую функцию распределения. Для этого необходимо оценить экстремальный индекс функции распределения экстремальных типов. Мы будем использовать оценку Пиккандса для экстремального индекса.

Сравнивая графики В и D, приходим к выводу, что учет периодического тренда позволяет получить &в&0& лучшие оценки для описания эмпирической функции распределения максимумов, чем оценки построенные на основании выборки, состоящей из ежегодных максимумов.

Случай области притяжения Фреше

В этой главе мы продемонстрируем результаты теоремы 7 на нескольких примерах(по одному распределению из каждой области притяжения максимумов) смоделированных прореженных (с пропусками) выборок из некоторой случайной последовательности, каждый элемент которой представим в виде суммы стационарной последовательности и добавочной псевдостационарпой составляющей.

Если точки из множества В(Х) расположены столь же близко к прямой с коэффициентом наклона 1, проходящей через начало координат, как и точки множества А(Х), то не существует разницы между приближением эмпирической функции распределения нормированных максимумов при помощи функции К\(х) или при помощи функции К2{х). Иначе, разница существует. Интуитивно ясно, что одно приближение лучше другого, если QQ—множество первого расположено ближе к прямой с коэффициентом наклона 1, проходящей через начало координат, чем QQ—множество второго. Хотя во всех рассмотренных случаях преимущество одного приближения над другим будет заметно визуально, мы измерим это преимущество с использованием следующих мер отклонения от прямой:

Графики множеств A(XN) и B(XN) представлены на рисунке 4.1. Как видно из графиков, функция распределения Кх{х), лучше приближает эмпирическую функцию распределения нормированных максимумов прореженной выборки для средней части и больших значений аргумента, чем функция распределения К2(х). Определим насколько это согласуется с величинами мер отклонения от прямой, рассчитанными для индексов с разными порогами. На рисунке 4.2 изображены графики последовательностей (Measurei(l,c)) 7J1,(Measurei(2,c)) J1, на рисунке 4.3 - графики последовательностей (Meas«re2(l,c))cl1, (Measure2(2, с))с. Из рисунка 4.2 видно, что Measurei указывает на то, что только при значениях порогового индекса с больших, чем 40 функция распределения К\(х) приближает лучше, чем функция распределения К2(х): при значениях с меньших, чем 30, наоборот. Это согласуется с нашим визуальным анализом. Однако, как видно из рисунка 4.3, Measure- , указывает на то, что при всех значениях порогового индекса с функция распределения Ki(x) приближает лучше, чем функция распределения К2(х). Это можно объяснить тем, что Measurei придает больший вес большим отклонениям, чем Measure . Обратим внимание на характер функций Measurei(l, с), Measure , с), Measure2(l, с), Measure2(2, с). Очевидно, что все эти функции убывают при увеличении аргумента с. Но функции Measurei(l,c),Measure2{l,c) убывают быстрее, чем функции Measurei(2,c),Measure2(2,c). Из графиков видно, что квантили функции распределения К\{х) приближают квантили эмпирической функции распределения нормированных максимумов прореженной выборки для малых и средней части последних лучше , чем квантили функции распределения К2(х). Для больших квантилей функции распределения Ki(x) и К2(х) дают одинаковые приближения. Определить насколько это согласуется с величинами мер отклонения от прямой позволят рисунок 4.8 — 4.9 (сумма квадратов отклонений логарифмов величин) и 4.10 — 4.11 (для суммы квадратов отклонений), которые показывают, что функция распределения К\{х) приближает все эмпирические квантили (а не только малые и средние) лучше, чем К2{х). Только для больших квантилей эмпирической функции распределения нормированных максимумов прореженной выборки визуально это определить невозможно.

Случай смоделированных н.о.р.с.в. по стандартному гауссов-скому распределению. Вверху - график множества точек А({Х }), см. стр. 42, (по оси X откладываются квантили эмпирической функции распределения нормированных максимумов, по оси Y- квантили предельной функции распределения для нормированных максимумов, учитывающей прореснсивание и детерминированный тренд). Внизу - график множества точек В({Х }), см. стр. 2, (по оси X откладываются квантили эмпирической функции распределения нормированных максимумов, по оси Y-квантили предельной функции распределения для нормированных максимумов, учитывающей прореживание и не учитывающей детерминированный тренд).

Случай смоделированных 2-зависимых о.р.с.в. по стандартному гауссовскому распределению. Вверху - график множества точек A(YN), см. стр. 43, (по оси X откладываются квантили эмпирической функции распределения нормированных максимумов, по оси Y - квантили предельной функции распределения для нормированных максимумов, учитывающей прореживание и детерминированный тренд). Внизу - график множества точек B(YN), см. стр. 43, (по оси X откладываются квантили эмпирической функции распределения нормированных максимумов, по оси Y - квантили предельной функции распределения для нормированных максимумов, учитывающей прореживание и не учитывающей детерминированный тренд). 5

Случай смоделированных 2-зависимых о.р.с.в. по распределению Коши с масштабным параметром равным 1. Вверху - график множества точек A(YK), см стр. 6, (по оси X откладываются квантили эмпирической функции распределения нормированных максимумов, по оси Y квантили предельной функции распределения для нормированных максимумов, учитывающей прореживание и детерминированный тренд). Внизу - график множества точек В(Угк), см стр 4Z (п0 оси X откладываются квантили эмпирической функции распределения нормированных максимумов, по оси Y - квантили предельной функции распределения для нормированных максимумов, учитывающей прореживание и не учитывающей детерминированный тренд). Рис. 4.13: Случай смоделированных 2-зависимых о.р.с.в. по распределению Коши с масштабным параметром равным 1. На рисунке сплошной линией обозначен график меры точности Measure\{l,c) (сумма квадратов отклонений логарифмов; логарифмы квантилей эмпирической функции распределения нормированных максимумов приближаются соответствующими логарифмами квантилей предельной функции распределения для нормированных максимумов, учитывающей прореживание и детерминированный тренд) в зависимости от порогового индекса с; прерывистой линией — график меры точности Measurei(2,c).

Потребление электроэнергии в России

В этом параграфе, мы исследуем данные о почасовом потреблении электроэнергии в России за период с 7 июня 2005 года по 22 июля 2005 года. Мы воспользуемся этими данными для того, чтобы показать преимущества вышеописанной теории для максимумов по сравнению со стандартными подходами.

Визуальный анализ изменения потребления электроэнергии позволяет сделать вывод о периодичности потребления за сутки. Более того, можно увидеть, что имеется периодичность, связанная с днями недели, и годичная периодичность (однородность по сезонам). При полном исследовании экстремальных значений потребления необходимо учитывать и годичный тренд. Задача полного исследования в работе не ставится.

В нашем случае, такой период взят как пример однородности по сезону. Мы будем рассматривать только данные со вторника по четверг каждой недели, так как в эти дни наблюдается похожая структура потребления.

Положим, что {Xj) обладает свойствами стационарно-сти,асимптотической независимости в смысле определения Лидбеттера (см. введение, стр.), и функция распределения св. XI является максимум устойчивой. Тогда, применив теорему 4 (случай, когда периодический тренд равен нулю), получим предельную функцию распределения для нормированных максимумов случайного ряда {Xj) (функцию распределения экстремальных типов). Для того, чтобы оценить эту предельную теоретическую функцию распределения необходимо оценить экстремальный индекс функции распределения экстремальных типов.

Поскольку периодическая составляющая в рассматриваемый интервал времени (с 8:00 до 18:00) достаточно плоская, то выглядит разумно рассмотреть применение классической теории экстремумов, без учета влияния тренда, и сравнить полученные результаты с результатами, полученными выше.

Квантиль-квантиль график мноэюества D, см.стр.6, где по оси X откладываются квантили эмпирической функции распределения нормированных максимумов, а по оси Y - квантили теоретической функции распределения из теоремы 4, построенной по еоюедневным максимумам. Глава 6 Заключение.

В работе получены важные аппроксимации для функции распределения максимума стационарной случайной последовательности с добавленным псевдостационарным трендом: - получена предельная теорема для совместного распределения мак симума отрезка стационарного временного ряда с добавленным малым псевдо-стационарным трендом и максимума но тому же отрезку, но с про пущенными наблюдениями. С этой целью введено понятие перемешивания высоких экстремумов при наличии тренда, обобщающее введенные ранее условия типа Лидбеттера. — с целью конкретизации условия перемешивания, рассмотрен слу чай гауссовского временного ряда. Оказалось, что если корреляционная функция г{п) исходного гауссовского стационарного ряда ведет убывает к нулю быстрее, чем 1/1пп, то предельный закон распределения макси мума совпадает с законом, полусенным в условиях перемешивания. Если же где г(п) убывает к нулю пропорционально 1/Inn, то предельный закон уже отличается, он основан не на пуассоновском распределении высоких экстремумов, а на смеси иуассоновских - на процессе Кокса. То есть, най ден пример временного ряда, не удовлетворяющего введенному условию перемешивания, для которого, тем не менее, получено предельное распре деление максимума.

Эти аппроксимации позволяют оценивать высокопроцентные квантили распределения и вероятности высоких максимумов с большой точностью. При помощи методов статистического моделирования проведено сравнение точности приближения распределения максимума, основанное на полученных в данной работе предельных теоремах и точности, основанной на классических приближениях, когда рассматриваются лишь сезонные максимумы. Поскольку в новых приближениях задействованы не только сезонные максимумы, но и близкие к ним другие значения временного ряда, новые приближения оказываются точнее.

На основании полученных предельных теорем в диссертации разработаны методы статистического оценивания распределения параметров максимума отрезка временного ряда в условии наличия пропущенных наблюдений и сезонной составляющей.

Похожие диссертации на Вероятностно-статистический анализ максимумов временных рядов с псевдостационарным трендом