Содержание к диссертации
Введение
Глава 1. Физические механизмы порождения флуктуации максимальной электронной концентрации, частоты экранирования и предельной частоты слоя es 14
1.1. Механизм образования и вероятностное распределение максимальной электронной концентрации слоя es 14
1.2. Вероятностные законы распределения максимума ионизации слоя es с учетом граничных условий 24
1.3. Определение некоторых интегральных параметров слоя es по наблюдаемым данным 31
1.4. Функции распределения частоты экранирования и предельной частоты слоя es 34
1.5. Граница применимости модели случайного процесса коши для максимальной электронной концентрации слоя es 42
Выводы 53
Глава 2. Различение гипотез о одномерных законах распределения параметров слоя es 54
2.1. Различение гипотез о нормальном или коши-распределении выборки 54
2.2. Различение гипотез о функции распределения частоты экранирования слоя es
Ионосферы без учета аномальных выбросов 61
2.3. Различение гипотез о логарифмически нормальном или вейбулловском распределении выборки : 65
2.4. Различение гипотез о распределении выборки по закону лапласа или коши 72
2.5. Различение гипотез о нормальном или лапласовском распределении выборки 80
Выводы . 86
Глава 3. Построение статистических моделей параметров слоя es по экспериментальным данным 87
3.1. Заполнение пропусков в случаино-цензурированных выборках частоты экранирования и
Предельной частоты .87
3.2. Прогноз нелинейных временных рядов через взвешенную сумму одномерных регрессий 102
3.3 потенциальные прогностические возможности авторегрессионных моделей 106
3.4. Время предсказуемости и порядок дифференциального уравнения частоты экранирования и предельной частоты слоя es 115
3.5. Статистические модели частотных параметров слоя es 120
3.6. Диапазон полупрозрачности слоя es и его прогноз 126
3.7. Прогноз огибающей укв-сигнала, отраженного от слоя es 135
Выводы 142
Глава 4. Исследование свойств вероятностной модели максимальной электронной концентрации слоя es 143
4.1. Вероятностная модель линейного марковского симметричного устойчивого процесса 143
4.2. Моделирование симметричных устойчивых случайных величин и процессов 154
4.3. О сложности отличить устойчивую случайную величину с бесконечной дисперсией от стандартной гауссовской случайной величины 158
4.4. Оценки по методу моментов параметров симметричных устойчивых распределений 163
4.5. Характеристики парной взаимосвязи случайных величин из распределений с тяжелыми хвостами 168
4.6. Характеристики частной и множественной связи случайных величин из распределений с тяжелыми хвостами 175
4.7. Прогноз симметричных устойчивых процессов авторегрессии 179
4.8. Заполнение пропусков в марковских симметричных устойчивых временных рядах 185
4.9. Вероятности достижения границ симметричным устойчивым случайным процессом с независимыми приращениями 188
Выводы 192
Глава 5. Вероятности существования и прогноз частотных параметров ионосферного канала распространения радиоволн через слой es 194
5.1. Точечный и интервальный прогноз частоты экранирования и предельной частоты слоя es 194
5.2. Теоретическое описание вероятностей экранировок и отражений от слоя es 200
5.3. Определение частоты экранирования, предельной частоты, максимальной экранирующей частоты и максимальной применимой частоты слоя es 207
5.4. Прогноз максимальной экранирующей и максимальной применимой частот слоя es 214
5.5. Вероятности существования и отсутствия ионосферных каналов связи через слой es и вышележащие слои 218
Выводы 222
Заключение .223
Список литературы
- Функции распределения частоты экранирования и предельной частоты слоя es
- Различение гипотез о логарифмически нормальном или вейбулловском распределении выборки
- Статистические модели частотных параметров слоя es
- Характеристики частной и множественной связи случайных величин из распределений с тяжелыми хвостами
Функции распределения частоты экранирования и предельной частоты слоя es
При малых значениях интерквартильной широты п075 -п025, где пр - квантиль порядка р процесса n(t) ( по экспериментальным данным (п075 -п025) є[0.47, 0.6]), возможна замена нелинейностей уравнения (1.1.19) двумя членами ряда Тейлора: ln[n(t) +1] n(t), [n(t) + 1]" « 1 - n(t). Такая замена приводит к линеаризованному варианту уравнения (1.1.19) dn(t) dt = b0-b]n(t) + Z,(t),n(t)ZN0/Vi-l, (1.1.20) где b0 = а2 /\х-ар\х-а} ,bx=a2 /\х + ар\х. Но тогда, в силу линейной связи (1.1.18) процессов n(t) и N{t) максимальная электронная концентрация N(t) слоя Es будет также приближенно описываться линейным стохастическим дифференциальным уравнением = -VV(0+$oC),tf(0 tfo. (1-1.21) где Ь2 = 2а2 - ца,, 5о(0 = (0 Введем в рассмотрение вспомогательный процесс Nr (t), который является решением уравнения (1.1.21) без ограничения N(jt) N0. Процесс Nr(t) расширяет возможные значения электронной концентрации N(t) на всю действительную ось. Шум 0(/) в (1.1.21) распределен по закону Коши. Распределение Коши, как и гауссовское, относится к устойчивым распределениям [14, 29, 46, 47, 67, 68, 82, 134, 135, 139, 140]. Основное свойство устойчивых распределений - сохранение своего типа при линейных преобразованиях. Поэтому, в силу линейности уравнения (1.1.21), процесс Nr(t) будет распределен по закону Коши.
Чтобы учесть ограничение N(t) N0 возьмем усеченное в точке N0 распределение Коши с интегральной функцией распределения F(х)=5we) X N п , г, РЛХ) l-F0(N0) X-7V (LL22) где F0(x) - функция распределения Коши (1.1.17), и плотностью вероятностей W(x) r w=r4w xiW»- (1Л-23) b где й = —2—7 7П - плотность распределения Копій. я[о + (х-а) ]
Верификация. На ионосферных станциях не проводится регулярных измерений максимальной электронной концентрации слоя Es. Поэтому для набора экспериментальных данных воспользуемся связью между максимальной электронной концентрацией и измеряемой на ионосферных станциях частотой экранирования fb(t) слоя Es [4,30, 132]: N(t) = fb2(t)/mS, (LI.24) где fb{t) имеет размерность [кГц], a N(t) - [эл/см3 ]. Здесь учтено, что частота экранирования с высокой точностью соответствует максимальной плазменной частоте слоя Es [131]. Для формирования выборки N(t) использовались данные ионосферных станций Москвы, Горького, Киева, Ростова-на-Дону за июнь - июль 1976-1979 годов. Поскольку, как следует из обработки экспериментальных данных разными исследователями, N(t) достаточно адекватно описывается моделью периодически нестационарного процесса, то все данные выравнивались по уровню медианы в 12ч дня #(0 = tf(0-me(0 + me(12), (1.1.25) где те(/) - периодическая с периодом сутки функция, описывающая медиану процесса N(t) для каждого часа суток. Процесс (1.1.25) можно считать стационарным по медиане.
Прежде чем проверять точность соответствия распределения (1.1.23) экспериментальным данным необходимо оценить его параметры. Из-за того, что слой Es образуется на разных высотах и электронная концентрация регулярного слоя Е испытывает слабые флуктуации, точка отсечения N0 распределения (1.1.23) будет случайной величиной. Поэтому в качестве NQ бралось не минимальное значение процесса N(t), а его выборочный нижний однопроцентный квантиль: JV0 = Nom. Если задаться примерным значением усекаемой вероятности ґ N0-N0 1 1 p = - + -arctg Z "0.75 — -"(Ь то квартальные оценки параметров а и Ъ распределения (1.1.23) примут вид N -N L 0J1 1 0.5 АГ і г /-і\г.» tg(7tp/2)g[(l + /?)7l/4j
Для всех экспериментальных данных усеченное распределение Коши (1.1.22)-(1.1.23) показало хорошее согласие с ними. Уровень значимости по критерию %2 был не ниже 0.95. На рис. 1.2, для примера, в логарифмическом масштабе кружками отложены эмпирические значения плотности вероятностей максимальной электронной концентрации слоя Es, рассчитанные по данным ионосферной станции г. Москвы за июнь-июль 1976-1977 годов. Сплошной кривой 1 нанесена плотность вероятностей усеченного распределения Коши (1.1.23). Штриховой кривой 2 и пунктирной 3 нанесены соответственно плотность вероятностей (1.1.11) и логарифмически нормальная плотность (1.1.16). Хорошо видно, что усеченное распределение Коши (1.1.23) лучше аппроксимирует эмпирическую плотность вероятностей как в области правого хвоста распределения, так и в области моды по сравнению с плотностями (1.1.11), (1.1.16), которые заметно занижают правый хвост распределения. В области малых значений флуктуации электронной концентрации вблизи фоновых значений, которые описывает левый хвост плотности вероятностей, лучше всего согласуется с экспериментальными данными распределение (1.1.11).
Различение гипотез о логарифмически нормальном или вейбулловском распределении выборки
Аналогично анализу закона распределения случайной величины щ{і) были проанализированы законы распределения случайных величин пк {і) при возрастающих к вплоть до к = 100. Выводы из анализа не изменились - эмпирическое распределение довольно точно аппроксимируется законом Коши и неудовлетворительно - гауссовским. Для иллюстрации этого вывода на рис. 1.11 приведены функции распределения, а на рис. 1.12 - плотности вероятностей случайной величины n96(t), состоящей из суммы 96 слагаемых n{t), что соответствует суммированию на протяжении суток. Кружки на рис. 1.11, 1.12, как и раньше, соответствуют эмпирическому, кривая 1 - Коши, кривая 2 - гауссовскому законам распределения. Из рисунков хорошо видно, что, как в области медианы (моды) распределения, так и на его хвостах, оно с достаточно высокой точностью описывается распределением Коши и явно неудовлетворительно - гауссовским распределением. Причем, как следует из рис. 1.12 , повысить в области моды точность аппроксимации эмпирических точек гауссовским рас- пределением можно только за счет еще большего ухудшения точности аппроксимации на хвостах распределения и наоборот - улучшение точности аппроксимации хвостов возможно только за счет ее ухудшения в области моды. Из всего этого следует, что явление нормализации суммы большого числа случайных слагаемых, вытекающее из центральной предельной теоремы, не проявляется в достаточной степени для значений максимальной электронной концентрации слоя Es при числе слагаемых в сумме порядка 100.
Таким образом, случайная величина, получающаяся в результате линейного инерционного преобразования максимальной электронной концентрации слоя Es, с хорошей точностью описывается законом распределения Коши, что в дополнение к теоретическим выводам предыдущих параграфов свидетельствует в пользу того, что флуктуации больших выбросов электронной концентрации слоя Es подчиняются распределению Коши.
Однако у распределения Коши - бесконечная дисперсия, тогда как реальные значения N(t) имеют, очевидно, конечную дисперсию. Устранить это несоответствие можно использованием усеченного распределения Коши (см. параграф 1.2). Но случайные величины из усеченного распределения Коши не обладают некоторыми важнейшими и удобными в аналитическом плане свойствами, присущими случайным величинам Коши. В частности, среднее арифметическое S(t)=4lU 0-5-7) независимых одинаково распределенных случайных величин Коши 4,- при любых к имеет такое же распределение, как и отдельное слагаемое В)і в сумме, тогда как для случайных величин 4, из усеченного распределения Коши сумма 5(i) при к - оо, согласно центральной предельной теореме, будет сходиться к гауссовскому распределению, тем медленнее, чем больше усекаемые значения. Если усекаемые значения достаточно велики, то в (1.5.7) найдется такое к = ктт, что при к ктак распределение случайной величины Sw будет близко к распределению Коши (гипотеза Я,), а при к &тах - к гауссовскому распределению (гипотеза Я0). Применительно к максимальной электронной концентрации N(t) слоя Es величина &тах задает границу применимости модели вероятностного не усеченного распределения Коши в тех задачах, где возникает потребность в суммировании значений N(t).
Получим теоретические формулы для расчета ктах и оценим тах для максимальной электронной концентрации N(t) слоя Es по экспериментальным данным. Алгоритмы оценивания max. Определим ктт как такое значение к в (1.5.7), при котором истинная плотность вероятностей W(k)(x) случайной величины S(k) будет находиться на одинаковом расстоянии р (различные виды наиболее используемых расстояний приведены в [2, 47]) как от гауссовской плотности вероятности (1.5.6) так и от плотности вероятности Коши (1.5.4). В качестве расстояния р возьмем информационное расстояние Кульбака-Лейблера [15], так как оно среди всех других расстояний максимизирует информационное различие между случайными величинами. Теоретически расстояние Кульбака-Лейблера р между абсолютно непрерывными относительно меры v распределениями с плотностями вероятностей р(х) и q(x) определяется следующим образом p(p,q) = Mln = jpWln vidx), (1.5.8) где М - оператор усреднения, А = {х: р(х) 0} - носитель распределения р{х). Плотности р(х) и q(x), входящие в (1.5.8), представляют собой производные Радона-Никодима соответствующих вероятностных мер по мере v [21, 81, 97, 102, 140]. Основное свойство расстояния p(p,q) заключается в том, что всегда p(p,q) 0, а равенство p(p,q) = 0 достигается тогда и только тогда, когда р = q [15].
Для фиксированного к из (1.5.7) всегда можно определить, какая из гипотез Н0 ( S{k) имеют плотность (1.5.6)) или Я, ( S{k) имеют плотность (1.5.4) ) предпочтительнее, сравнивая расстояния Кульбака-Лейблера между плотностями W0, Wx и истинной плотностью W{k): p[W{k\x) xy,)] p[Ww(x),Wo(x,K)l, (1.5.9) где в качестве параметров я 0 и aj распределений (1.5.6) и (1.5.4) взяты параметры, минимизирующие расстояние р между истинным и предполагаемым распределениями: a,m=axgmfp(W{k\Wm),m = 0,l.
Если истинная плотность вероятности W(k\x) известна и абсолютно непрерывна относительно меры Лебега v, то (1.5.9) преобразуется к виду L(k) = )w {x)\n {dx , (1.5.10)
Значение kmax совпадает с таким к при котором в (1.5.10) достигается равенство Истинное распределение W(k)(x) случайной величины нам неизвестно. Поэтому в формулах (1.5.8) - (1.5.10) вместо теоретических функций будем использовать их выборочные оценки, которые можно получить по независимой выборке ISJ .S ,..., объема п случайной величины S(i). Теоретические выражения (1.5.8) - (1.5.10) имеют по крайней мере три выборочных аналога следующего вида. 1. Заменим теоретический оператор усреднения М(-) в (1.5.8) его выборочным анало 1 " гом 2JO- Тогда выборочная оценка расстояния Кульбака-Лейблера p[W-k),Wm] будет п ы иметь вид где а0 = (ц,0), а{ ={а,Ь) - оценки максимального правдоподобия (ОМП) параметров распределений (1.5.6), (1.5.4) соответственно. ОМП взяты потому, что они минимизируют выборочное расстояние Кульбака-Лейблера (1.5.11) между истинным и предполагаемым распределениями: 5m=arginfp ( w, ),m = 0,l. а», В этом случае выражения (1.5.9), (1.5.11) преобразуются к виду »5sfed$- 5-12) 2. Возьмем вместо неизвестной непрерывной истинной плотности вероятностей W{k)(x) ее выборочную оценку (гистограмму, эмпирическую плотность) в г точках: {Р\ Рг - Р г} гДе Pi эмпирическая вероятность попадания в / -ый интервал разбиения возможных значений случайной величины S . Для непрерывных распределений (1.5.6), (1.5.4) также возьмем их дискретные аналоги: {р ,Р2 —,Р?} m = 0,1. Здесь pf и р) - тео ретические вероятности попадания в і -ый интервал разбиения соответственно гауссовской случайной величины из распределения (1.5.6) и случайной величины Коши из распределе ния (1.5.4). Дискретные распределения сингулярны относительно меры Лебега. Поэтому в качестве меры v в (1.5.8) возьмем так называемую считающую меру [15,140], относительно которой дискретные распределения абсолютно непрерывны (считающая мера У {А) подсчи тывает число возможных значений случайной величины, попавших в множество А). Тогда выборочная оценка расстояния Кульбака-Лейблера piW ,Wm] будет иметь вид
Статистические модели частотных параметров слоя es
Для практического использования алгоритм МП (2.3.8) слишком сложен из-за необходимости определения статистики а, входящей в (2.3.8), через трансцендентное уравнение (2.3.7). Получим более простое квазиправдоподобное правило различения гипотез Я0 и Я,.
КП алгоритм получается из (2.3.8), если вместо статистик а, р (2.3.7), являющихся МП оценками параметров а, Р, распределения (2.3.2) при справедливости гипотезы Я,, подставить в (2.3.8) оценки параметров а, р, найденные по методу моментов. Когда величина , распределена по закону Вейбулла (2.3.2) центральные моменты к-то порядка величины 1п, будут иметь вид \xk=Xklak , k 2, (2.3.9) где постоянные Xk не зависят от параметров распределения (2.3.2): Х2 = у (1) = я2/6, Х3 = х/"(1)« -2.404, ХА =3[\)/ (1)]2 + Ч/ "(1) = Зя4/20, ?,5 = 10\(/ (1)\/"(1)+ v/(4)(l) -64.43, Х6 = 15[\/ (1)]3 + 15v/ (l)v/ "(l) = \0[ці"(1)]2 + у(5)(1) 406.868 и т.д., где \\10)(-) - (і + 1)-ые производные логарифма гамма функции (полигаммы-функции) [120]. Из (2.3.9) получаем набор оценок для а: ak=frktmk)vk , к 2, (2.3.10) где 1 т, = -(lnx,-w)A - выборочный центральный момент к -го порядка для величины 1п,. Среднее величины In 4 равно (- 1пР - С) / а - откуда набор оценок по методу моментов для параметра р : $k=exp{-a krh-C}, к 2, (2.3.11) где С = 0.5772156... - постоянная Эйлера [120]. Оценки (2.3.10), (2.3.11) асимптотически с ростом п несмещенные с дисперсиями а -2 в»; = п , , , 2а Да.ХС + Іпр)2 + а2ц2 + -(С + 1пР)(цА+1 -Ац +0(0 Нетрудно убедиться, что дисперсии оценок ак, РІ растут с ростом . Поэтому подставим в алгоритм (2.3.) вместо a, р соответственно статистики ос3, Р3 при наименьшем из возможных к = 3. При к = 2 алгоритм (2.3.8) вырождается, так как в этом случае параметры обоих распределений (2.3.1) и (2.3.2) выражаются через первые два момента величины 1п. А различие между двухпараметрическими распределениями с неизвестными параметрами и одинаковой областью определения должно заключаться в моментах более высокого порядка. Получившийся КП алгоритм различения будет иметь вид выборочного коэффициента асимметрии величины 1п : Hn где \ - некоторый порог, который определим позже.
Для практического использования алгоритма (2.3.12) необходимо найти аналитические выражения для вероятностей ошибок двух родов: вероятности Р(#0#,) принятия гипотезы Я0 при условии, что справедлива гипотеза Я, и вероятности (ЩН0) принятия гипотезы Я,, когда верна Я0. Разложим статистику (2.3.12) в двумерный ряд Тейлора по отклонениям моментов т2, тъ от их истинных значений и.2, ц3 и ограничимся первыми двумя членами разложения dG dG G{m2,mi) = G{\i2,\i3) + - -{m2-\i2) + - {m3-\xi) + R, (2.3.13) где все производные берутся в точках ц2, ц3 В [71] показано, что остаточная ошибка R в (2.3.13) имеет более высокий порядок малости по п х , чем первые два члена разложения и что статистика (2.3.12) как функция выборочных моментов будет распределена асимптотически нормально. Поэтому достаточно найти первые два момента случайной величины G при условии справедливости каждой из гипотез.
Когда верна гипотеза Я0 величины \nxi, i = \,n будут распределены нормально. Среднее и дисперсия статистики G в этом случае известны точно [66] и не зависят от параметров распределения (2.3.1): м ед)-о, Wi). J t2_ (23.,4) В случае, когда справедлива гипотеза Я,, характеристики статистики G также не зависят от параметров распределения (2.3.2). После громоздких вычислений получаем соответственно среднее, дисперсию, коэффициент асимметрии и коэффициент эксцесса статистки G: М(ОД)« -1.1395 +11.611/п + 0(тГ2), Z)(G ) 31.68/«-1836.1/«2+C («-3), g, (G\ Я,)» -26.62 / -fn + 0{пх), g2(G\Hl) = 0(n-m).
Как показало моделирование, распределение статистики G в этом случае крайне медленно сходится к нормальному закону из-за большого коэффициента асимметрии gj(G#,). Для уменьшения отрицательного коэффициента асимметрии применим к статистике G монотонное нелинейное преобразование Л = exp(G). Тогда новое КП правило различения гипотез будет выглядеть следующим образом A = expj- 1 Л =ехр{йЬЬ (2.3.15) [т2 J Я,
Поскольку в случае справедливости гипотезы Я0 статистика G хорошо описывалась нормальным законом распределения, то величина Л, когда верна гипотеза Я0, будет распределена по логарифмически нормальному закону с параметрами (2.3.14). Вероятность ошибки первого рода для правила различения (2.3.15) тогда запишется следующим образом Р(Я,Я0) Ф (2.3.16) In/г JD(G\H0) где Ф(х) - интеграл вероятностей.
Статистика Л является гладкой функцией от выборочных моментов - поэтому, как и статистика G, будет распределена асимптотически с ростом п нормально [66, 71]. Следовательно, когда справедлива гипотеза Я, о распределении выборки по закону Вейбулла, достаточно найти первые два момента величины Л. При п -» оо среднее и дисперсия Л стремятся соответственно к 0.32 и 3.244In.
Характеристики частной и множественной связи случайных величин из распределений с тяжелыми хвостами
Согласно теории ветрового сдвига поведение во времени электронной концентрации слоя Es описывается дифференциальным уравнением в частных производных параболического типа. Приближенное стохастическое дифференциальное уравнение, описывающее максимальные значения электронной концентрации, бьшо получено в Главе 1 и оказалось нелинейным уравнением первого порядка, для которого в пренебрежении процессами ионизации и рекомбинации по сравнению с динамическими процессами был получен линеаризованный вариант. Таким образом удалось построить достаточно простые вероятностные модели максимальной электронной концентрации слое Es и связанных с нею частотных параметров слоя - частоты экранирования fb{t) и предельной частоты f0{t). Но поскольку эти модели были построены в результате многочисленных, хотя и обоснованных, приближений и упрощений, весьма желательной представляется прямая проверка по экспериментальным данным ключевых характеристик модели. В первую очередь к таким ключевым характеристикам следует отнести порядок дифференциального уравнения. Замена нелинейного уравнения линейным, как известно [7, 70, 145], может существенно сократить время предсказуемости случайного процесса. Поэтому второй ключевой характеристикой модели случайного процесса является соотношение между его временем предсказуемости и интервалом корреляции, показывающее потери в точности прогнозирования при такой замене. В параграфе 3.2 был рассмотрен весьма частный случай предполагаемого вида нелинейного уравнения для fb(t) и f0{t). Здесь будет использован значительно более общий подход с использованием непараметрических методов при минимальных предположениях о вероятностной структуре данных [188,220].
Характеристики множественной и частной связи. Рассмотрим временной ряд х,, значения которого заданы в дискретные моменты времени t є0, ±1, ±2,...j. Оптимальный по минимуму среднего квадрата ошибки (СКО) прогноз этого ряда, даваемый с момента времени / на / шагов вперед, и опирающийся на р прошлых известных отсчетов х„ = ( , м x,-P+i) имеет ВИД x,+i = MXiti(x,Jxp), (3.4.1) где Мдху) - условное среднее значение х при фиксированных значениях вектора у. Функция f(xp) = Мл+ (х/+/х J от р переменных хр называется р-мерной функцией регрессии [1] или предиктором (предсказателем) [50].
Время предсказуемости временного ряда х, естественно определить как такое макси-мальное упреждение lpred прогноза хы, при котором дисперсия ошибки прогноза G2p(l) = M(t+l-xt+l)2 (3.4.2) еще заметно меньше дисперсии ст2 ряда х,. Усреднение в (3.4.2) ведется по значениям х1+1, хр, то есть М(-) = Mj (). Рассчитать lpred аналитически можно с помощью так называемого множественного корреляционного отношения г (/) [1,50]: Л/)(/) = а/(/)/а = л/1-а (/)/а2, (3.4.3) где аД/) = а - зр(1) = МХр /(x/,)-MJ((+/(x/+/)J - дисперсия прогноза (дисперсия функции регрессии). Из формул (3.4.3) видно, что множественное корреляционное отношение г]р(1) меняется в пределах 0 цр(1) 1 и является мерой точности оптимального прогноза на / шагов вперед - чем точнее прогноз (чем меньше а2(/) или чем больше ст2(/)), тем больше r\p(l). Однако традиционно множественное корреляционное отношение рассматривают как меру стохастической зависимости между отсчетом х1+1 и совокупностью отсчетов хр, так как для него справедливы следующие формулы. цр(1) = sup р[х/+„ф(х )]= p(xt+„xl+l), (3.4.4) Ф(-) где х,у) = М [[х-Мхх)\у-Муу1]/(ахау) - коэффициент корреляции между случайными величинами х и у, а супремум берется по всем функциям ф(-), для которых коэффициент корреляции р[х,+/,ф(-)] определен. Супремум в (3.4.4) достигается в точке ф(хр)з/(хр) [50], то есть оптимальный по минимуму СКО прогноз х1+1 = /Ыр) среди всех других возможных прогнозов х +1 = ф(хр) максимально коррелирует с прогнозируемым отсчетом хы.
В работах [7, 70, 145] предложено оценивать качество различных прогнозов характеристикой, названной степенью предсказуемости, которая представляет собой коэффициент корреляции между прогнозом и прогнозируемьм значением х1+1. Из (3.4.4) следует, что множественное корреляционное отношение является частным случаем степени предсказуемости, с которой совпадает при выборе оптимального по минимуму СКО прогноза, основанного на р предыдущих наблюдаемых отсчетах хр. Для любых других прогнозов х +/ = ф(хр), использующих отсчеты хр, множественное корреляционное отношение, как это видно из (4), является мажорантой степени предсказуемости.
При монотонном спадании r[p(l) с ростом / время предсказуемости можно определить как такой интервал времени lpred, в течении которого лр(/) уменьшается в X раз: Л,( ) = 1/ .- (3.4.5)
Предположим, что временной ряд х, описывается следующим нелинейным стохастическим разностным уравнением р -го порядка (аналогом стохастического дифференциального уравнения в непрерывном времени) ,+i =/( „)+ S,+i (3-4.6) где 4, - пгум с независимыми в разные моменты времени отсчетами и с нулевым средним значением. Если порядок уравнения р (порядок марковости ряда х,) в (3.4.6) неизвестен, то его можно оценить из следующих соображений. Поскольку отсчет хІ+і не зависит от отсчетов x,_m,m р при фиксированных отсчетах хр, как это следует из (3.4.6), то при прогнозе на шаг вперед (/ = 1) всегда справедливы неравенства Лр(1) Лр.(1), (1) ,(1) (3.4.7) для произвольных р = 0,1,.... Равенство в (3.4.7) достигается при р р. При р р в подавляющем большинстве случаев неравенства в (3.4.7) будут строгими, так как прогноз на шаг вперед, использующий меньшее чем р число наблюдаемых отсчетов, будет менее точен, чем оптимальный прогноз ,+i —f хр I использующий более полную информацию.
Основываясь на этих соображениях в литературе [50] вводят так называемое частное корреляционное отношение как меру стохастической зависимости между отсчетами х,+1 и х,_м при фиксированных промежуточных к -1 отсчетах xt, хм,..., xt_k+2: )=І [І)7СШ=[( (І)- І-(І))/(І-С,(І))Р (3.4.8) где ст0 (l) = a2,riJ(l) = 0,r(0) = L Частное корреляционное отношение г(к) очень удобная характеристика для оценивания порядка стохастического нелинейного разностного уравнения, так как если р - истинный порядок уравнения (3.4.6), то г(р ) = 0 при р р. Таким образом порядок нелинейного уравнения оценивается с помощью г(к) точно так же, как с помощью частной корреляционной функции (для которой г(к) является мажорантой ) оценивается порядок линейных разностных уравнений авторегрессионного типа [13].