Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Гадзаов Алексей Федорович

Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом
<
Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гадзаов Алексей Федорович. Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом : диссертация ... кандидата технических наук : 05.13.18 / Гадзаов Алексей Федорович; [Место защиты: Моск. гос. ин-т радиотехники, электроники и автоматики].- Москва, 2009.- 118 с.: ил. РГБ ОД, 61 09-5/2239

Содержание к диссертации

Введение

Глава 1. Обзор проблем разделения движения 7

1.1. Постановка задачи разделения движения 7

1.2. Методы моделирования трендов 13

1.3. Методы выявления колебаний 19

1.4. Требования к моделям и алгоритмам решения задачи разделения движения 25

Глава 2. Модели и алгоритмы обработки эмпирических данных с трендом 27

2.1. Модели исключения тренда 27

2.2. Модели и алгоритмы определения почти - периодов 41

2.3. Согласование алгоритмов исключения тренда и определения-величины почти -периодов 59

2.4. Алгоритм определения трендовых составляющих в эмпирических данных 61

2.5. Алгоритм решения задачи разделения движения 68

Вывод 70

Глава 3. Исследование динамических характеристик нелинейных систем по эмпирическим данным 71

3.1. Выделение колебаний в данных с трендом 71

3.2. Определение набора почти-периодов 81

3.3. Определение эффективных значений характерных времен при исключении тренда и определении почти-периодов 102

3.4 Выделение трендовых составляющих в эмпирических данных 107

Выводы 109

Заключение 110

Список литературы 112

Введение к работе

Актуальность работы. При исследовании эмпирических данных часто решается задача о разделении движения на трендовую и колебательную составляющие.

Для механических систем, где тренд описывается уравнением движения центра масс, его исключение не представляет особой сложности. Решение задачи о разделении движения, когда уравнения для опорной траектории неизвестны, связано с большими трудностями. Регулярных методов решения этой задачи фактически нет.

Стандартные методы исключения тренда основываются на аппроксимации исходного ряда определенной зависимостью. После определения параметров используемой модели считается, что уравнения тренда теперь известны.

В действительности, использование этого метода не гарантируют исключение тренда без потери существенной информации о процессе или возникновения колебаний, изначально не присутствующих в исследуемых эмпирических данных. Это происходит из-за несоответствия используемых моделей свойствам реальных процессов.

При исследовании оставшихся после исключения тренда колебаний возникают аналогичные проблемы. Исследуемым колебаниям навязывается определенная структура, например, ряд Фурье. Эффективный анализ колебаний возможен, когда структура модели соответствует исходным данным, что на практике встречается довольно редко. Их несоответствие компенсируется изменением структуры самой модели до тех пор, пока полученный результат не будет отвечать определенным критериям. Однако, при этом теряется физический смысл получаемых параметров, становится неясной их связь с реальным процессом.

Актуальной проблемой является разработка моделей, алгоритмов и программ, позволяющих реализовать исключение тренда, гарантирующих

4 сохранения структуры колебаний, выявление структурного полного набора почти-периодов и определение на этой основе характеристик самого процесса.

Актуальными задачами, позволяющими решать эту проблему, являются:

  1. решение задачи исключения тренда в эмпирических данных без потери-существенной информации о процессе;

  2. определение полного набора колебаний на основе алгоритмов, не связанных с их заданной структурой; '

  3. восстановление трендовой составляющей процесса; без априорного предположения о его функциональном виде.

Предмет исследования. Математические модели и методы анализа эмпирических данных. Методы исключения и восстановления тренда и определения параметров колебаний.

Объект исследования. Эмпирические данные с трендами и колебаниями, результаты измерения характеристик функционирования природных, физических, технических и экономических систем.

Цель исследования. На основе общих свойств эмпирических данных разработать модели, алгоритмы и программный комплекс исследования эмпирических данных с трендом.

Для достижения поставленной цели требуется решить следующие задачи:

  1. Разработать модели и методы, гарантирующие исключение тренда без искажения информации об исследуемом процессе.

  2. Разработать алгоритмы, не предъявляющих к исходным данным жесткой структуры колебаний, ориентированные на определение иерархии почти-периодов.

  3. Разработать методы согласования- алгоритмов исключения трендов и определения почти-периодов.

5 4) Разработать методы выделения трендовой составляющей эмпирических данных.

Методы, исследования. Методы исследования основывались на применении теории дифференциальных уравнений, функционального анализа и теории почти-периодических функций.

Научная новизна. Разработан класс моделей, алгоритмов и программ решения задачи о разделении движения в эмпирических данных, включающих:

  1. модели исключения тренда на основе свойств линейного дифференциального уравнения первого порядка с переменными коэффициентами, гарантирующие исключение тренда с выделением колебаний относительно нулевого уровня, без искажения их структуры;

  2. алгоритмы определения почти-периодов, основанные на метриках функционального анализа, без привязки к заданной структуре колебаний;

  3. класс обобщенных сдвиговых функций, обеспечивающих согласование алгоритмов исключения трендов и определения почти-периодов;

  4. алгоритм определения трендовой составляющей исследуемых данных, согласованный с характеристиками самого процесса.

Основные положения, выносимые на защиту:

  1. Модели, алгоритмы и программы исключения трендов в эмпирических данных, обеспечивающие нулевое среднее для оставшихся данных.

  2. Модели и методы определения иерархии почти-периодов.

  3. Алгоритмы согласования результатов исключения трендов и- анализа колебаний.

  4. Алгоритмы восстановления трендовой составляющей процесса.

  5. Алгоритмы проверки полученных результатов. Обоснованность и достоверность научных^ результатов

основываются' как на фундаментальных результатах теории

дифференциальных уравнений, теории почти - периодических функций и функционального анализа, так и на предъявлении эффективности разработанных моделей, алгоритмов и программ при анализе эмпирических данных, включающих нелинейные колебания с трендом. Практическая ценность.

  1. Решена задача разделения движения в эмпирических данных с трендом.

  2. Разработаны алгоритмы, позволяющие исключать тренд без искажения информации об исследуемом процессе.

  3. Разработаны алгоритмы анализа колебаний, выявляющие иерархии почти—периодов на основе общих свойств почти-периодических функций.

  4. Разработан метод определения трендовой составляющей исследуемого процесса на основе полученных характеристик самого процесса.

  5. Разработан программный комплекс в среде Matlab для решения задачи разделения движения в эмпирических данных.

Публикации. Основные результаты диссертационной работы опубликованы в 10 научных работах, в том числе 2 статьи в журналах из перечня ВАК.

Структура и объем работы. Диссертация состоит из введения, трех глав, заключения и списка литературы. Объем основного текста состоит из 118 печатных страниц, включая 2 таблицы, 38 рисунков, и список литературы из 98 наименований.

-.'' . 7 ' .' '..

Требования к моделям и алгоритмам решения задачи разделения движения

При исследовании эмпирических данных априорная информации об исследуемом процессе обычно отсутствует. Зачастую остаются неизвестными виды трендовой зависимости и структуры колебаний.

Поэтому к используемым методам обработки результатов измерений должны предъявляться требование возможности обработки данных самого широкого круга процессов, характеризующих динамику нелинейных систем.

Методы исключения тренда и определения колебаний должны быть основаны на общих, широко распространенных для разных систем свойствах. В качестве основы для построения методов исключения тренда целесообразно использовать свойства линейного неоднородного дифференциального уравнения первого порядка с переменными, коэффициентами. Это уравнение позволит исследовать данные широкого класса процессов и исключать тренд без потери существенной информации о нем.

Для идентификации колебаний целесообразно использовать метод предложенный Альтером - Джонсоном и его модификации, так как они позволяют определять параметры колебаний без привязки их к определенной структуре.

В процессе исследования эмпирических данных реальных систем возникает еще ряд задач, которые необходимо решить. Во-первых, методы исключения тренда влияют на форму и параметры оставшихся колебаний; во-вторых, отсутствует метод определения правильности найденных колебаний.

Для достоверной оценки значений получаемых колебаний необходимо иметь алгоритм согласования методов исключения тренда и определения почти-периодов и оценки точности получаемых результатов.

Поэтому актуальной задачей является разработка алгоритма согласования методов исключения трендов и определения параметров имеющихся колебаний, обеспечивающего оценку достоверности полученных параметров процесса.

В силу того, что эмпирические данные представляют собой различные комбинации трендов и колебаний. В качестве основы для такого согласования можно рассматривать фундаментальное свойство периода. Те значения параметров колебаний, при которых конечный результат наилучшим образом будет соответствовать этому соотношению, будут величинами колебаний, присутствующих в исследуемом ряду. По результатам определения набора почти-периодов может быть реализован алгоритм выделения трендов, основанный на сглаживании по полученным почти-периодам. Полная совокупность моделей, алгоритмов и программ представляется эффективной для реализации решения задачи разделения движения на составляющие его компоненты, представленных совокупностью почти-периодов и трендов. В общем случае, анализ и обработка эмпирических данных часто связаны с трудностями выделения колебаний, сопутствующих трендам. Без извлечения трендовой составляющей анализ колебаний достоверно провести проблематично, так как тренд будет вносить неточности в получаемый результат. Регулярных методов решения этой задачи нет. В случае, когда уравнения трендов не известны, определение вида трендовой зависимости представляет большие сложности, что приводит, в ряде случаев, к неопределенности получаемых для колебаний результатов. Рассмотрим в качестве основы для моделирования тренда линейное неоднородное дифференциальное уравнение первого порядка с переменными коэффициентами [40]: Пусть известны два частных решения уі(х), Уг(х) неоднородного уравнения (2.1). Тогда общее решение можно получить вовсе без квадратур Пусть уз(х) - частное решение, отличное от уі(х), уг(х). Тогда следует, что секущие N]Mi, N3M3, N2M2, ... должны пересекаться в одной точке или быть параллельными. При неограниченном уменьшении секущих они перейдут в касательные. Таким образом, касательные к интегральным кривым линейного уравнения, проведенные в точках пересечения этих кривых прямой, параллельной оси Оу, или пересекаются в одной точке, или параллельны.

Согласование алгоритмов исключения тренда и определения-величины почти -периодов

Алгоритм оценки набора почти - периодов в эмпирических данных с трендом состоит из двух этапов, в каждом из которых присутствуют времена сдвига от текущего значения. Величина сдвига At в (2.3) влияет на форму колебаний, полученных в результате исключения тренда. Это приводит к необходимости ее согласования со сдвигом т, используемым для вычисления функции Альтера - Джонсона (2). В качестве основы для такого согласования можно рассматривать фундаментальное свойство периода fit + т) — fit) — О .

Это определение задает нулевое отклонение функции, смещенной на период от значения в данный момент времени, что позволяет для почти -периодов в качестве метрики, характеризующей наилучшее приближение из набора, полученного при вариации At в (2.3), выбрать такое значение At, для которого амплитуда колебаний сдвиговой функции будет минимальной. В результате для оценки системы почти-периодов в экспериментальных данных с трендом требуется расширить понятие сдвиговой функции, включив в нее, кроме аргумента т, величину At в зависимости (2.3), что приведет к построению следующих функций на основе метрик, исключающих тренд, таблица 2. Исследование системы минимумов этой функции по т и At позволит определить набор значений почти — периодов, соответствующих исходному эмпирическому ряду. Можно выявлять как отдельные локальные минимумы, так и такие значения т или At, при которых образуются «каналы» минимумов при фиксированном значении одной из переменных.

Для выявления «каналов» минимумов строятся функции, характеризующие среднюю сумму значений по каждому аргументу функции а(т,Ді), то есть: где N и L - количество значений в соответствующем ряду. Положения почти - периодов будут характеризоваться минимумами функций (2.12) , (2.13). Рассмотрим построение функций а(т,Лг), (2.12), (2.13) на данных рис.4. Как видно из рис.9, рис.10 и рис 11, величина почти - периодов равна 10.5 и 21 год, что совпадает с результатами, полученными ранее.

Для выявления трендовой составляющей в эмпирических данных, соответствующей исходному ряду, необходимо использовать методы, позволяющие, во-первых, избежать навязывания определенной зависимости предполагаемому тренду, во-вторых, согласовать методы выделения тренда с уже найденными характеристиками процесса. Целесообразно за основу выделения тренда взять метод, при котором из исследуемых данных исключаются колебания, присутствующие в исходном ряду. В качестве способа выделения трендовой составляющей рассмотрим метод скользящей средней: где у (t) - значения трендовой составляющей y(t), т — количество элементов, по которым ведется усреднение. Взяв в качестве т количество элементов, равное почти-периоду, из исходной зависимости исключается соответствующее колебание. Применяя к y (t) соотношение (2.14) с другими т, можно исключить основные почти-периоды, в результате остается только тренд. Рассмотрим применение этого метода на данных рис.5. Пусть величина усреднения равна 11 годам (рис. 12а) и 22 годам (рис.126), что соответствует найденным почти — периодам (рис.8). Из исходного ряда были исключены основные колебания длительностью 11 и 22 года, в результате чего осталась только трендовая составляющая, рис.13. Вычтем тренд из исходных данных и обработаем полученный ряд сдвиговой функцией. Результаты отображены на данных рис. 13а) и рис.136). Из рис.7, рис.8 и рис.13 можно сделать выводы о совпадении результатов работы алгоритмов. 241 2S1, РисЮа)

Общая схема алгоритма решения задачи разделения движения, представленная рис. 14, реализуется в несколько этапов: 1) исключение трендовой составляющей; 2) определение параметров колебаний; 3) согласование алгоритмов исключения тренда и определения значений почти-периодов; 4) исключение колебаний из исходного ряда и выделение тренда; 5) сравнение значений почти-периодов, найденных в п.З и п.4 6) в зависимости от результатов сравнения принимается решение о завершении алгоритма или о его повторном прохождении. 1. Разработана система моделей, алгоритмов и программ анализа эмпирических данных с трендом, ориентированных на определение иерархии почти — периодов без задания жесткой структуры функций, используемых при анализе колебаний и трендов. 2. Метод исключения трендов структурно состоит из 4-х частей; в первой из которых на основе дифференциального уравнения с переменными коэффициентами определяются модели, гарантирующие исключение тренда с выделением колебаний относительно нулевого уровня; во второй части на основе метрик функционального анализа определены алгоритмы оценки почти-периодов без привязки к заданной структуре колебаний; в третьей части вводится класс обобщенных сдвиговых функции, обеспечивающий согласование алгоритмов исключения трендов и определения почти — периодов. Разработан метод восстановления трендовой составляющей по найденным характеристикам процесса.

Алгоритм определения трендовых составляющих в эмпирических данных

Расширение возможностей исследования функциональной активности организма путем детализации методов обработки результатов цифровой регистрации физиологических сигналов в настоящее время относят к перспективным направлениям биомедицинских исследований.

Подтверждение тому - создание ведущими медицинскими центрами и группами медицинских центров массивных баз данных цифровой регистрации физиологических сигналов различной длительности, различных групп исследуемых и т.д. Одновременно создаются алгоритмы и программные средства визуализации, обработки и анализа имеющейся информации. Так, на базе Массачусетского технологического института, при поддержке Гарвардской медицинской школы и Бостонского университета организован исследовательский центр [96]. В отрытом доступе имеется большой архив записей ЭКГ и других физиологический показателей пациентов с различным состоянием здоровья. Разработан многофункциональный программный комплекс для обработки показателей, организована возможность публикаций результатов исследований.

На сегодняшний день выявлены медленные ритмы колебаний электрической активности и неэлектрические ритмы головного мозга человека[97]. Известны влияния эндокринных систем на функциональную активность сердечно-сосудистой системы, характерные времена циклов, которых исчисляются часами- и сутками: В медицине Китая известны-длительные временные периоды (2 часа) функционирования определенных систем организма [98]. Нужно подчеркнуть, что и сегодня крайне актуальна разработка способов анализа длинных ритмов, в частности в кардиологии. Это оценка вариабельности сердечного ритма, циркадных ритмов, связь и взаимодействие различных ритмов. Взаимодействие органов и систем организма как единого целого приводит к необходимости выявления иерархии ритмов, которые могут фиксироваться в широком спектре мониторируемых физиологических показателей. Актуальна задача выявления пределов нормального функционирования этих показателей.

Задача, которая естественно возникает при обработке экспериментальных или клинических данных, - выделение имеющихся в этих данных периодичностей.

Метод, обычно применяемый для» разрешения этой задачи, -спектральный анализ, который, как известно, представляет собой суперпозицию гармонических колебаний с различными частотами и начальными фазами. Такой подход имеет существенные недостатки. Спектральный анализ может быть эффективен и давать ясные интерпретируемые результаты в том случае, если исследуемый процесс действительно представляет собой суперпозицию гармонических колебаний. В противном случае использование этого весьма сильного предположения неизбежно приводит к трудностям.

Сам вид стандартной кардиограммы показывает насколько он далек от синусоид (рис.23). Разложение в ряд Фурье является при этом формальной процедурой, принципиально не связанной с механизмом формирования динамики сердечного цикла. Несогласованность априорного предположения о гармоничности колебаний с истинным положением дел компенсируется в спектральном анализе просто увеличением числа гармонических компонент, что затрудняет интерпретацию получаемых результатов.

Рассмотрим возможности выявление ритмов с помощью функции Альтера - Джонсона, на примере электрокардиограммы. На рис.23 представлен фрагмент записи кардиограммы при мониторировании по Холтеру у здорового человека/

Обработка данных разложением в ряд Фурье привела к зависимости, представленной на рис.24. В полученных результатах содержательно виден период длительностью около 1 секунды.

На рис.25 приведена рассчитанная по данным рис.23 сдвиговая функция Альтера — Джонсона, минимумы которой определяют совокупность почти — периодов минутной записи кардиограммы здорового человека.

Полученное на рис.25 значение почти-периода по сдвиговой функции равно 0.S секунды, что несколько меньше, чем значение периода полученного методом Фурье.

На рис.26 представлена частость встречаемости длительностей сердечного ритма на анализируемом интервале кардиограммы. Полученный результат показывает, что сдвиговая функция определяет положение почти -периода сердечного цикла точнее, чем разложение в ряд Фурье.

Определение эффективных значений характерных времен при исключении тренда и определении почти-периодов

Величина сдвига At в ш , 2 1 влияет на форму колебании, полученных в результате исключения тренда. Это приводит к необходимости ее согласования со сдвигом т, используемым для вычисления функции Основой такого согласования является соотношение, определяющее периодическую функцию /(/ + г) - fit) = 0, где т период. Это определение задает нулевое отклонение функции, смещенной на период от значения в данный момент времени, что позволяет для почти -периодов в качестве метрики, характеризующей наилучшее приближение из набора, полученного при вариации At в соотношении для исключения тренда, выбрать такое значение At, для которого амплитуда колебаний сдвиговой функции будет минимальной. Для оценки системы почти периодов в экспериментальных данных с трендом применим следующую функцию: Рассмотренная функция (3.3) является одним из примеров других расширенных сдвиговых функций представленных в таблице 2.

Исследование системы минимумов этой функции по т и At позволит определить набор значений почти - периодов, соответствующих исходному эмпирическому ряду. Для исследования минимумов функции (3.3) целесообразно применить функции (3.4) и (3.5). где N и L - количество значений, в соответствующем ряду. Минимумы функций (3.4),(3.5) определяют значения наиболее выраженных почти -периодов. Для иллюстрации этого метода обработаем функцией (3.3) некоторые из рассмотренных выше примеров. На рис.35 для кларков представлены результаты, обработанные функциями (3.3), (3.4) и (3.5). На рис. 35а отчетливы проявлены «каналы» минимумов при значения т = 18 или At = 19. Из полученных данных значениям почти - периодов соответствуют минимумы функций Ф(г) и F(Af) : 2, 8, 12, 18, 27, 32, 44, 52,59, 65. Аналогичные вычисления сделаем для температур кипения химических элементов. На рис.36 представлены результаты обработки функциями (3.3), (3.4) и (3.5) этих данных. Из полученных данных на рис.36 значениям почти - периодов соответствуют минимумам Ф(г) и (At): 7, 8, 16, 18, 27, 32,34,36, 44, 52,63, 67,75. Обработка данных экономической статистики приводит к результатам, которые отображены на рис. 37. Из полученных данных значениям почти - периодов соответствуют минимумам Ф(г) и 45 и 57 лет. 61 Рис.37а) Рассмотрим применение метода выделения трендовой составляющей на данных Н.Д. Кондратьева (рис.38). Для этого воспользуемся методом скользящей средней (2.14). Величина усреднения т равна значению почти-периода на рис.376, то есть 42 лет. Для проверки корректности полученного тренда вычтем его из исходного ряда и определим параметры колебаний оставшихся данных. На рис.37в величина почти-периода равна 57 лет, что соответствует значению, полученному раннее. Совпадение значений почти-периодов говорит о правильности найденного тренда. 1. Из приведенных примеров отчетливо видна эффективность разработанных математических моделей и методов анализа колебаний эмпирических данных с трендом. 2. Методы исключения тренда, основанные на свойствах неоднородного линейного дифференциального уравнения с переменными коэффициентами, позволяют анализировать данные о динамике нелинейных систем, без потери существенной информации о процессе, как колебания относительно нулевого уровня. 3. Алгоритмы анализа колебаний, на основе метрик функционального анализа и свойств почти-периодических функций позволяют выявлять иерархию почти - периодов. 4. Согласование этих методов дает возможность выявление колебаний наиболее сильным образом проявленных в исследуемых данных. В общем случае, анализ и обработка эмпирических данных часто связана с трудностями выделения колебаний, сопутствующих трендам. Без извлечения трендовой составляющей анализ колебаний достоверно провести проблематично, так как тренд будет вносить неточности в получаемый результат. Однако регулярных методов решения этой задачи нет. Используемые в настоящий момент методы не всегда могут адекватно описать исследуемую зависимость и исключить тренд без потери информации о процессе. На основе общих свойств линейного неоднородного дифференциального уравнения решалась задача исключения трендов из эмпирических данных. Это уравнение описывает достаточно широкий класс динамических процессов, чтобы гарантировать исключение тренда из данных любой конфигурации без потери важной информации о процессе. Результатом работы алгоритма являются колебания относительно нулевого уровня. Не смотря на многообразие методов анализа колебаний, их характерным недостатком является навязывание определенной структуры колебаний эмпирическим данным. Такое предположение о характере колебаний не позволяет получить достоверную информацию об исследуемом процессе. На основе общих свойств почти - периодических функций и метрик функционального анализа решалась задача определения колебаний без привязки исследуемого процесса к жесткой структуре. В результате стало возможным достоверно определять параметры колебаний и их иерархию, что зачастую не возможно при использовании стандартных методов.

Похожие диссертации на Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом