Содержание к диссертации
Введение
ГЛАВА 1. Обзор и классификация существующих адаптивных методов и моделей стохастического прогнозирования 9
1.1. Классификация методов и моделей стохастического прогнозирования 9
1.2. Метод «накопление-смыв» (buildup & washoff) 28
І.З.ОКЗМ-диАЬ-модель 29
1 .4. Storage, Treatment, OverHow, Runoff Model (STORM) 30
1.5. Имитационные модели 31
1.6. Модели авторегрессии (AR) 32
1.7. Модели авторегрессии и скользящего среднего (ARMA) 32
1.8. Ковариационно-стационарные ряды 33
1.9. Нестационарные процессы 34
1.10. Модели с переменными коэффициентами 36
ГЛАВА 2. Проблема прогнозирования временных рядов в условиях малых выборок 40
2.1. Построение прогностических моделей 41
2.2. Принцип хаотизации 52
2.3. Построение прогнозирующей функции 61
ГЛАВА 3. Динамические системы и реконструкции по временному ряду 67
3.1. Временной ряд и процедура реконструкции 68
3.2. Инерциальное многообразие и инерциальная форма 75
3.3. Аппроксимация f и Df по точкам на аттракторе 77
3.4. Локальная размерность 78
3.5. Восстановление уравнений движения в идеальном случае 80
3.6. Зашумлённая реконструкция и проекционная регуляризация отображения Ч* 89
3.7. Методы обработки временных рядов нелинейной динамики
как алгоритмы решения некорректных задач 91
ГЛАВА 4. Русла и джокеры: о новых методах прогноза поведения сложных систем 96
4.1. Введение. Проблема прогноза 97
4.2. Предикторы и трехслойные нейронные сети 101
4.3. Когда сложная динамика может быть предсказуема. Русла и джокеры 103
4.4. Как могут возникать русла 104
4.5. Русла и прогноз временных рядов 105
4.6. Как искать русла 107
4.7. Что находится в конце русла 108
4.8. Модельный пример 109
4.9. Выводы и гипотезы 115
ГЛАВА 5. Краткосрочный адаптивный байесовский оперативный прогноз 117
5.1. Общие положения 117
5.2. Математическая постановка задачи краткосрочного прогноза 118
5.3. Модель со многими состояниями 121
5.4. Байесовский подход к задаче краткосрочного прогноза 122
5.5. Приближенное решение математической задачи краткосрочного прогноза 127
5.6. Результаты и возможности метода краткосрочного
прогнозирования 129
Выводы 138
Библиографический список использованной
Литературы
- Storage, Treatment, OverHow, Runoff Model (STORM)
- Принцип хаотизации
- Восстановление уравнений движения в идеальном случае
- Когда сложная динамика может быть предсказуема. Русла и джокеры
Введение к работе
Актуальность темы. При прогнозировании любых процессов крайне необходимо подобрать соответствующие им методы и модели. Их выбор зависит от характеристик исследуемого процесса, которые определяются в большей степени суммой действующих на него факторов.
Зная об изменении этих факторов, или, иначе говоря, о грядущих событиях, можно делать смелый количественный прогноз. Такая информация не всегда известна, или как, например, на финансовом рынке трудно доступна. Поэтому важно знать, можно ли спрогнозировать процесс, изучив предысторию, т.е. на основе статистических характеристик временного ряда. Тогда, вопрос о применимости методов статистики в предварительном анализе временных рядов является крайне важным в самом процессе прогнозирования.
Возможность количественно и качественно охарактеризовать какие-либо свойства предполагаемой модели прогноза и требования, которым она должна удовлетворять с позиции исходных данных временного ряда, обретает большую актуальность.
Под анализом временного ряда, в таком случае, подразумевается оценивание и восстановление по данной реализации свойств порождающего процесса, лежащего в основе этого ряда.
Осуществление такого подхода связано, в первую очередь, с задачами предварительной обработки данных с целью охарактеризовать наиболее общие свойства будущей модели.
Характерная особенность временных рядов состоит в том, что необходимо изучить характер корреляции между значениями ряда в различные моменты времени и далее попытаться сконструировать статистические модели прогноза, объясняющие такую корреляционную структуру ряда. Это общее утверждение требует комментария. Обычно считается, что данный временной ряд {Xt, t = 1, 2,..., N} - это отдельная выборочная реализация частного
порождающего процесса {Xt, t = 0, ±1,...}.
Порождающий процесс здесь предполагается, как способ, по которому для последовательных моментов времени образован временной ряд. В то же время этот способ не может определять фактическое значение ряда в какой-то момент времени в силу своей вероятностной природы.
Под анализом временного ряда, в таком случае, подразумевается оценивание и восстановление по данной реализации свойств порождающего процесса, лежащего в основе этого ряда.
После того, как временной ряд получен, перед исследователем возникают вопросы:
как выбрать оптимальные методы их обработки и как трактовать вопросы «засорения» данных;
принимать или не принимать во внимание «выбросы» в исходных данных;
каковы свойства породившей их динамической системы, как можно охарактеризовать ее на основе только имеющегося временного ряда и являются ли полученные данные детерминированными или случайными. Для выбора подходящего класса моделей среди множества возможных
требуется удобный критерий, процедура или цель. К сожалению, этот критерий может быть точно определен только пользователем этой модели.
Идеальный критерий выбора подходящего класса моделей должен быть таким, чтобы выбранный класс обладал свойством, что наиболее подходящая модель в этом классе для заданного множества наблюдений проходит все критерии проверки адекватности при выбранном уровне значимости. Кроме того, модель должна давать удовлетворительное предсказание. Тогда можно быть уверенными, что модель удовлетворительно представляет данные, подтверждая этим правильность выбора определенного класса моделей.
Центральным понятием при изучении динамических систем с дискретным временем является понятие устойчивости - не асимптотической устойчивости отдельной орбиты, а структурной устойчивости всего
дифференциального уравнения, отвечающего векторному полю. Важность понятия структурной устойчивости вытекает из того, что именно устойчивые векторные поля возникают в приложениях при моделировании реальных процессов: результаты моделирования не должны претерпевать качественных изменений при добавлении малых возмущений.
В основе большинства подходов, связанных с обработкой временных рядов Xi,...,XN, лежит построение так называемых запаздывающих векторов z={xis Xj+i,..., Хі+l}, или, в терминах теории управления, векторов в пространстве состояний.
Согласно теореме Такенса, в нелинейной динамике установлен тот факт, что пространство состояний, а точнее, некоторое его подмножество, поверхность в нем, в определенном смысле эквивалентно фазовому пространству нелинейной динамической системы, породившей временной ряд. Это позволило предложить новый класс методов, связанных с определением по временному ряду не только параметров статистических моделей, но и инвариантов динамической системы - фрактальных размерностей, энтропии и ляпуновских показателей, позволяющих анализировать структуру прогнозируемого процесса.
Таким образом, в начале 80-х годов фактически возникло новое направление в анализе временных рядов, связанное с использованием идей нелинейной динамики и синергетики.
В 1982-1986 гг. были разработаны некоторые базовые алгоритмы оценки инвариантов динамической системы по временному ряду. В последующие годы они применялись к широкому спектру проблем, однако, в большом числе случаев результаты их использования были неоднозначны.
Оставался открытым ряд важных проблем применимости идей теории нелинейной динамики, и в первую очередь проблема очищения от «засоренности» исходных данных, и ряд других, решение которых и явилось целью данной работы.
Основная идея предлагаемого подхода к созданию комплекса моделей
статистического прогнозирования временных рядов состоит в том, что на предварительном этапе их обработки проводится исследование основных свойств динамических систем, порождающих временной ряд, с изучением влияния «засоренности» исходных данных. Применение этих методик позволяет обосновать последующий выбор соответствующих моделей прогноза.
Цель работы состояла в том, чтобы, используя предложенную идею, разработать теоретические основы новых методов и алгоритмов предварительной обработки в задачах оценки параметров динамических систем и прогноза временных рядов на базе изучения динамических свойств прогнозируемых процессов и «засоренности» исходных данных. И далее на основе разработанной теории сконструировать близкие к наилучшим алгоритмы решения практических задач анализа и прогноза сложных систем.
Для формализованного описания рассматриваемого класса динамических систем, наблюдаемых в виде временных рядов, используется современная теория нелинейной динамики, а также теории случайных процессов и математической статистики. При реализации программной системы использованы методы алгоритмизации и языки высокого уровня для современных персональных компьютеров.
Научная новизна:
Разработана теория оптимальных алгоритмов для робастного оценивания и предсказания в задаче восстановления прогнозирующей функции по уменьшенному объёму исходных данных в условиях неопределённости.
Разработаны методы и алгоритмы исследования устойчивости оценок исходных данных временных рядов с выяснением их засорённости и наличия выбросов.
Исследованы особенности применения методов нелинейной динамики при обработке временных рядов, их возможности, ограничения на этапе предварительной обработки при построении модели прогноза.
Предложен метод краткосрочного адаптивного байесовского прогноза для экономических показателей.
Разработан алгоритм построения архитектуры и программное обеспечение системы статистического прогнозирования временных рядов.
Разработан алгоритм построения архитектуры и программное обеспечение системы статистического прогнозирования временных рядов.
Теоретическая и практическая ценность. Материал диссертации в целом представляет собой основы теории предварительного анализа задач оценки параметров и структур моделей прогноза временных рядов в условиях «засоренности» данных при построении класса параметрических моделей прогноза.
Развитая техника применима к исследованию разнообразных практических задач. Разработанные методы могут быть применены в дальнейших исследованиях динамических систем с различного рода ограничениями.
Создан программный комплекс, реализующий разработанные методы и алгоритмы. Программы использовались в ряде организаций (Ml 1 У, МГИМО, МГИЭМ, МЭИ, ИПУ РАН, Министерство экономики РФ, Астраханский региональный центр экологии).
Публикации. По теме диссертации опубликовано 9 печатных работ.
Структура работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы.
Storage, Treatment, OverHow, Runoff Model (STORM)
Этот итеративный процесс продолжается вплоть до полного исчерпания фактических точек ряда. В качестве начальных значений коэффициентов д0 и а20 могут быть взяты коэффициенты линейного уравнения регрессии, рассчитанного по первым точкам ряда.
При использовании адаптивных экспоненциальных моделей одной из главных проблем является определение оптимальных значений параметров сглаживания. Методы определения параметров сглаживания можно разделить на две большие группы: статические методы; динамические методы. Эти две группы методов различаются гипотезами относительно природы ряда.
Статические методы исходят из того, что процесс не претерпевает существенных изменений и поэтому можно определить постоянные параметры сглаживания, оптимальные для всего периода наблюдений. Статические методы при оптимизации параметров адаптации моделей экспоненциального сглаживания используют методы прямого поиска, у которых процедура построения минимизирующей последовательности основана на вычислении значений функции. Они не требуют от исследуемой функции никаких свойств, кроме непрерывности и поэтому широко применяются на практике. Как правило, эти методы эвристические по своей природе, а критерий достижения оптимального значения функции основан только на текущих результатах расчета. Вследствие этого окончание процесса может произойти далеко от решения задачи, или, наоборот, может продолжаться бесполезный счет. Таким образом, прямой поиск обычно приводит к достаточно хорошим, но строго говоря, не оптимальным результатам.
Поиск оптимального набора параметров сглаживания может осуществляться также путем направленного перебора различных их значений в заданном интервале 0а, 1. В качестве оптимального выбирается тот набор параметров, при котором получена наименьшая дисперсия ошибки прогнозирования, вычисленная либо при реализации процедуры сглаживания всего динамического ряда, либо на не использованном в расчетах участке ряда. Названные выше методы не исчерпывают всего многообразия статических методов оптимизации параметров сглаживания, однако, они достаточно хорошо отражают основные идеи этой группы методов. Характерной их чертой является неизменность параметров сглаживания во времени и поэтому названный набор этих параметров может рассматриваться лишь как «средняя» оптимальная оценка. В связи с этим такой подход наиболее эффективен при прогнозировании относительно стабильных временных рядов. В простейших моделях экспоненциальной схемы ошибки прогнозирования используются для корректировки коэффициентов механически без анализа их природы. Между тем, появление больших величин ошибок является признаком неадекватности модели исследуемому процессу. В связи с этим целесообразно использовать динамические методы оптимизации, предполагающие неоднородность развития исследуемого процесса во времени и позволяющие определить природу ошибок прогнозирования, устанавливать момент, когда прогнозирование становится неудовлетворительным, и изменять соответствующим образом параметр адаптации или даже структуру модели. В этой группе методов возможны следующие методы: метод адаптации параметров на основе использования следящего контрольного сигнала; спектральный метод; метод эволюции; симплекс-метод.
Для скорейшего обнаружения неадекватности модели исходному процессу Браун Р. предложил способ анализа прогнозирующей системы, состоящей в определении величины следящего контрольного сигнала (СКС) К,, которая вычисляется по формуле N N (і-у)5м+уЄ ё, (1-26) где: е, - ошибки прогнозирования, ё, - величина их сглаженного значения; у - постоянная сглаживания. Если модель прогнозирования хорошо отражает реальный процесс, то в силу случайности ошибок прогнозирования их сумма будет колебаться около нуля, не превышая при этом априорно установленных пределов. В случае превышения СКС значения некоторого критического уровня необходимо выяснить причины и при необходимости построить новую модель или увеличить параметр адаптации. Как только система приспособилась, необходимо снова уменьшить величину а для лучшей фильтрации шума.
Однако такой подход имеет два недостатка. Во-первых, при выходе СКС за допустимые пределы не обязательно его возвращение назад, даже при адекватности модели исследуемому процессу. Это происходит вследствие того, что все слагаемые, образующие СКС, имеют одинаковый вес. В этом случае отсутствует «автоматическая» обратная связь и необходимо вмешательство извне, чтобы привести сумму ошибок к нулевому уровню и тем самым избежать в дальнейшем ложных сигналов тревоги. Во-вторых, возможен выход СКС за допустимые пределы, в то время как система дает абсолютно точные оценки. Это возможно из-за того, что при точных прогнозах сумма ошибок, стоящая в числителе СКС, остается на фиксированном уровне, в то время как среднее абсолютное отклонение стремится к нулю.
Для устранения этих недостатков Триг Д. и Лич.А. [150] предложили модифицировать СКС К Т; (1.27) где =(1-/) -1+ . Величина е,, здесь уже не совокупная сумма отклонений, а сглаженная ошибка прогноза. Для введения «автоматической» отрицательной обратной связи предложено в качестве постоянной сглаживания использовать модуль СКС [122].
Регулирование параметра адаптации может осуществляться также на основе анализа спектральных характеристик ряда так называемым спектральным методом. Авторы этого подхода Рао А. и Шапиро А.С. [151] исходили из того, что изменения в структуре ряда должны обнаруживаться в изменении их спектральных характеристик.
Принцип хаотизации
Это несомненно снижает достоверность соответствующих статистических выводов в условиях малых выборок. Например, изучение распределения оценки Ьх коэффициента модели авторегрессии первого порядка
УІ АУІ-І+ХІ показало [14], что для небольших выборок эта оценка хотя и сохраняет свойство состоятельности, но имеет систематическое смещение (как правило, внизу), что приводит к снижению ее эффективности. Однако главное обстоятельство, на наш взгляд, состоит в том, что сами гипотезы о конкретном вероятностном распределении возмущений Xt практически невозможно проверить в случае коротких временных рядов. И если применение метода наименьших квадратов может и не опираться на оптимальные свойства получаемых оценок, то использование статистических критериев значимости (таких как F-критерий Фишера) становится, по-видимому, пустой формальностью. Последнее обстоятельство объясняется тем, что критерии, касающиеся дисперсии (т. е. хг - критерий для дисперсии нормального распределения, F — критерий для отношения дисперсии двух нормальных распределений и ряд других), очень чувствительны к отклонениям от гипотез о нормальном распределении [5]. Необходимо отметить, что применение ретроспективного метода для выбора модели и проверки ее адекватности также наталкивается при малом числе наблюдений на значительные трудности [4].
Во-первых, приходится делить и без того ограниченную выборку на две части. Причем обе они должны быть представительны, первая для построения сколько-нибудь сложных моделей, вторая (называемая контрольной) для значимости оценки найденной модели. Во-вторых, что очень важно, контрольная выборка не должна использоваться на протяжении всего процесса построения модели ни при выборе семейства моделей, ни при оценивании ее параметров. При неудовлетворительном результате контроля найденную модель следует отклонить, а вместе с ней следует отказаться и от выбранного семейства моделей и попытаться найти новое. При этом, поскольку контрольная выборка участвует в выборе во избежание «подгонки», она должна быть заменена новой для возможности беспристрастного контроля. На практике длина наблюдаемого ряда часто оказывается недостаточной для удовлетворения всем перечисленным требованиям. Поэтому, исчерпав контрольную выборку, остается либо отказаться от поисков хорошей модели, либо от ее достоверной оценки.
Таким образом, решение задачи упирается в неопределенность выбора. После того как модель найдена, остается открытым вопрос, какое она имеет отношение к рассматриваемому ряду. Иначе говоря, ввиду отсутствия обоснованного критерия адекватности, остается неясным, является ли полученная модель хорошим представлением, искомой закономерности и правомерно ли ее использование при прогнозе.
Переходя к прогнозам, надо заметить, что на них могут особенно сильно сказываться ошибки, содержащиеся в модели (назовем их ошибками спецификации). Это объясняется следующим обстоятельством. Несмотря на то, что логичнее было бы непосредственно отыскивать наилучшие алгоритмы прямого перехода от наблюдаемой выборки к прогнозу (который в данном случае является единственной целью), на самом деле действуют иначе. Вначале производят спецификацию модели, а затем используют найденную модель, условно считая ее истинной, в качестве основы для прогноза. Как было сказано выше, модели часто остаются теоретически недостаточно обоснованными (особенно в случае коротких рядов). То же относится и к прогнозу, полученному на основе таких моделей (обычно простой экстраполяцией представления искомой закономерности).
Неопределенность последствий ошибок спецификации, как правило, трудно оценить. Разделим условно эти ошибки на три группы. К первой отнесем ошибки, связанные с неправильным выбором семейства моделей в рамках данного класса, а также самого класса моделей (называем их ошибками идентификации). Вторую группу составляют ошибки, вызванные тем, что для оценивания параметров модели применяются методы, основанные на аппроксимации по «зашумленному» ряду ограниченной длины (так называемая подгонка выбранного семейства моделей под имеющиеся наблюдения). Наконец, ошибки третьей группы связаны с наличием в модели возмущений х,» которые не могут быть явно учтены в процессе составления прогноза.
Распространенной оценкой меры случайного рассеяния прогноза yt(l) является его дисперсия. Определяя дисперсию некоторого прогноза, учитывают обычно лишь ошибки третьей группы (исходя из гипотезы о характере случайных величин х,)- Очень редко (особенно в случае малых выборок) удается одновременно с ними учесть ошибки второй группы. Это объясняется тем, что, как уже отмечалось выше, статистические свойства оценок параметров модели (такие как несмещенность или эффективность) даже в случае самых «сильных» гипотез относительно случайных возмущений сохраняются лишь асимптотически. Трудности, связанные с аналитическим изучением распределений соответствующих случайных величин, не позволяют внести необходимые для малых выборок поправки. Возникает парадоксальная ситуация - при обработке коротких рядов, когда ошибки второй группы особенно велики, трудно определить их влияние на прогноз. Но в любом случае при вычислении дисперсии прогноза не учитываются возможные ошибки идентификации. Таким образом, во-первых, оценивается лишь часть неопределенности, влияющей на прогноз, и, во-вторых, используемые оценки существенно опираются на вероятностные гипотезы, проверка которых в условии малых выборок представляется затруднительной.
Восстановление уравнений движения в идеальном случае
В данном разделе рассматриваются некоторые технические вопросы, связанные с задачами оценки ляпуновских показателей (гл. 2) и прогноза по временному ряду (гл. 6). Аппроксимация по точкам - достаточно стандартная операция, и проблемы в данном случае могут возникать благодаря некоторым особенностям задач, связанных с реконструкцией. Необходимо аппроксимировать неизвестную функцию, определённую на некоторой поверхности в Rm, уравнения которой также неизвестны, известны лишь точки, принадлежащие ей. Обсуждаемые особенности связаны, во-первых, с «локальной размерностью» аттрактора, т.е. с наличием у точки, в которой аппроксимируется (z), соседей, по которым можно было бы восстанавливать функцию dN переменных.
Во-вторых, обсуждается необходимость проецирования на МИМ или касательное пространство к нему, что оказывается существенно при расчёте ляпуновских показателей и позволяет регуляризовать алгоритм их расчёта.
Рассмотрим динамическую систему x{t + T) = fT(x(t)), хєР. Пусть М ее МИМ, еЛ/, x(t + T) = PMfT(x(t)) - соответствующая МИФ. Размерность М будем обозначать dN Обозначим аттрактор системы через А, А с М. Обозначим также MR = А(М), AR = А(А).
В данном разделе обсуждаются следующие вопросы. 1) Всегда ли можно восстановить ровно dN уравнений движения 2) как и с какой точностью восстанавливаются / и Df по точкам аттрактора в случае, если длина ряда не ограничена.
Сначала рассмотрим случай «идеальных условий реконструкции». Будем считать, что справедливы следующие предположения.
Полностью отсутствует шум, а все точки аттрактора известны абсолютно точно. Матрица Df{x) невырождена для всех х є А. Будем считать, что на асимптотической стадии x(t) є М. Определение. Будем говорить, что аттрактор А имеет в точке х0 є А локальную размерность dloc, если для любой окрестности Ве достаточно малого радиуса є множество Ас\В (х0) принадлежит некоторому локальному дифференцируемому многообразию размерности dlocM loc(x0) и не принадлежит никакому дифференцируемому многообразию меньшей размерности.
Определение. Будем говорить, что аттрактор А имеет в точке х0 є А правильную локальную размерность dloc если а) его локальная размерность равна dloc и б) во всех точках аттрактора из достаточно малой окрестности Be(xQ)t т.е. для всех х є А п Вв (х0) локальная размерность также равна dloc.
Например, для окружности каждая точка имеет правильную локальную размерность 1 а для квадрата все точки кроме вершин имеют правильную локальную размерность 1, а вершины имеют локальную размерность 2, но она не является правильной.
Благодаря наличию на аттракторе всюду плотной траектории, нетрудно показать, что если в некоторой точке х правильная локальная размерность равна dloc, то во всех точках аттрактора локальная размерность не может быть меньше dloc Предположим обратное, т.е. что существует точка хєА, у которой есть окрестность В#(х), такая, что AnBs(x) принадлежит многообразию размерности меньше dloc По определению, на аттракторе существует всюду плотная траектория. Пусть ей принадлежат точки хх є Bs(xQ) и х2 = fT{xx) є В5(х).
Поскольку вместе с х{ отображается её окрестность, а матрица D/ невырождена, приходим к противоречию. Полученное противоречие доказывает утверждение. Тем не менее, могут оказаться точки, у которых локальная размерность больше dloc, подобно вершинам квадрата. Однако такие точки не всюду плотны на аттракторе, поскольку по предположению в некоторой окрестности точки х они отсутствуют. Следовательно, во всех точках всюду плотной траектории Правильная локальная размерность должна быть равна dloc.
Таким образом, если существует точка, в которой правильная локальная размерность равна dloc, то почти во всех точках аттрактора по ближайшим соседям можно будет локально восстановить dloc -мерную систему уравнений движения. Для удобства в дальнейшем будем предполагать, что в типичных случаях все локальные многообразия можно объединить в глобальное, которое будет являться МИМ, и потому dloc = dN. Справедливость этого предположения никак не сказывается на дальнейших рассуждениях, однако позволяет упростить терминологию и называть правильную локальную размерность типичной точки размерностью МИМ, а локальные уравнения движения отождествить с уравнениями МИФ.
Когда сложная динамика может быть предсказуема. Русла и джокеры
Согласно теореме Такенса, если анализируется траектория, отвечающая асимптотическому поведению, то отображение Ч определено только на реконструированном аттракторе AR являющимся частью MR. Однако вне MR отображение как Rm -»Rm не определено. Поэтому, вообще говоря, построение глобальных авторегрессионных моделей типа Rm - Rm не может быть обосновано при помощи теоремы Такенса.
При анализе экспериментальных временных рядов нельзя быть уверенным, что шум отсутствует. Но при наличии сколь угодно малого шума к «истинному» реконструированному вектору z0 прибавится некоторая добавка , и результат z = z0 + 4 в общем случае уже не будет принадлежать MR.
Следовательно, задача восстановления уравнений движения оказывается дважды некорректной: как задача аппроксимации неизвестной функции и как задача «сверхнеустойчивая» к шуму.
Таким образом, для того, чтобы решение задачи реконструкции существовало при наличии шума, необходимо добавить регуляризатор, который подавлял бы влияние шума и возвращал бы точку на локальное многообразие, где определено отображение ч/. Рассмотрим проектор рм на многообразие MR, действующий следующим образом: PMz = z для z є MR, а для z Й MR PMz = z =Mg, где z -ближайшая к z точка MR. Введем отображение G{z) = 4 (P„z) Отметим следующее.
1) G(z) определено для всех z(=Rm. Введение проектора делает реконструированное отображение устойчивым к шуму, а задачу восстановления отображения по временному ряду корректной.
2) При zeRm G(z) = T(z) Следовательно, оно обладает тем же аттрактором, что и исходное отображение ЧУ.
3) У отображения G будет dN ляпуновских показателей Л.(, совпадающих с показателями отображения ,и m-dN показателей Л = -оо.
3)Вообще говоря, вместо проектора можно использовать достаточно сильно сжимающее отображение, с тем чтобы эффективная сходимость достигалась за несколько итераций. Видимо, похожий механизм реализуется в методе радиальных базисных функций f(z) = ]T4 (z-zA) [179], при условии, что базисная функция (р(г) убывает достаточно быстро. Но для того, чтобы такое доопределение G на все Rm было корректным, скорость сходимости траекторий из Rm к Мл должна быть достаточно большой - превышать скорость сходимости траекторий на Мя к AR. В противном случае новая динамическая система G(z) будет иметь аттрактор большей размерности, нежели исходная. Этот эффект наблюдается также и при фильтрации шума при помощи рекурсивных фильтров с бесконечной характеристикой. Как было установлено в ряде работ (см. [15]), скорость экспоненциального убывания характеристики должна превышать абсолютное значение наименьшего существенного ляпуновского показателя.
Замечание. Первой работой, связанной с МИМ и dN по-видимому, является [76], опубликованная в 1987г., в которой предлагался первый алгоритм оценки dN (хотя и под другим названием). Концепция МИМ и его связь с реконструкцией, а также использование проекций на МИМ для расчетов ляпуновских показателей описаны автором диссертации в 1990г. в [49]. В 1991г. Методика была независимо предложена в [163], кроме того проекции на локальный ковариационный базис с целью подавления шума использовались в [89,257,16].
Рассмотрим теперь проблематику корректности задач оценки параметров динамических систем по временному ряду: размерностей, энтропии, ляпуновских показателей, а также параметров аппроксимации уравнений движения. Более подробно алгоритмы для некоторых из них будут охарактеризованы позднее, однако дальнейшему изложению работы следует предпослать несколько обобщающих замечаний. Они позволяют лучше пояснить стратегию исследований в основные трудности на пути применения методов нелинейной динамики.