Введение к работе
Актуальность работы. Решение многих важных прикладных задач связано с анализом стохастических процессов. Обрабатываемые данные при этом чаще всего представляют собой дискретные цифровые сигналы (временные ряды). Обычно различают предварительную (первичную) обработку сигналов и основную, или вторичную. Назначение предварительной обработки – повышение достоверности данных, выяснение особенностей временнго ряда, приведение его к виду, позволяющему корректно использовать процедуры основной обработки. Именно предварительная обработка во многом определяет успешность последующего анализа данных и всего исследования в целом.
Методы цифровой предварительной обработки весьма многообразны. К числу наиболее часто используемых можно отнести методы обнаружения наличия трендовой составляющей наблюдаемого процесса, выявления аномальных наблюдений, спонтанного изменения свойств временнго ряда - так называемой, разладки процесса.
Обозначенная область является достаточно хорошо проработанной, о чем свидетельствует большое число касающихся данного вопроса классических монографий и отдельных работ отечественных и зарубежных авторов (Бокс Дж., Дженкинс Г., Бендат Д., Пирсол А., Айвазян С.А., Мхитарян В.С., Енюков И.С., Мешалкин Л.Д. и др.). Многие работы опубликованы сравнительно недавно, что говорит о значимости рассматриваемой задачи как в теоретическом, так и в прикладном плане.
Вместе с тем, следует подчеркнуть, что практически все известные хорошо изученные методы решения перечисленных задач предварительной обработки используют в качестве предпосылки предположение о некоррелированности отсчетов временнго ряда. На практике большинство исследуемых процессов, естественно, не удовлетворяют данному требованию, в связи с чем формальное применение известных процедур предварительной обработки может привести к серьезным ошибкам.
Диссертационная работа посвящена анализу влияния нарушений предпосылки о некоррелированности данных, развитию существующей алгоритмической базы, разработке новых методов предварительной обработки применительно к процессам с коррелированными отсчетами. Отсюда вытекает актуальность проведения исследований в обозначенной области и темы диссертационной работы.
Цель работы. Целью настоящей работы является разработка методов и алгоритмов предварительной цифровой обработки коррелированных стохастических процессов, предназначенных для выявления в них трендовой составляющей, выделения серий аномальных наблюдений и обнаружения разладки.
Задачи исследования. В соответствии с поставленной целью сформулированы и решены следующие задачи:
-
Обзор существующих методов предварительной обработки стохастических процессов, решающих задачи обнаружения тренда, выделения аномальных наблюдений и обнаружения разладки.
-
Сравнительный анализ непараметрических критериев обнаружения трендовой составляющей в стохастических временных рядах; исследование свойств указанных критериев при тестировании коррелированных данных с последующей выработкой рекомендаций, позволяющих снизить негативное влияние коррелированности на качество результатов.
-
Разработка алгоритмов выделения серий аномальных наблюдений в коррелированных временных рядах на основе критерия нарушения гладкости их траектории.
-
Исследование поведения алгоритма кумулятивных сумм при решении задачи о разладке по среднему значению коррелированных последовательностей и выработка рекомендаций по настройке алгоритма с учетом коррелированности отсчетов.
-
Разработка программно-технического комплекса оперативного статистического анализа цифровых сигналов с целью практического использования предложенных методов предварительной обработки на реальных сигналах.
-
Разработка программного обеспечения лабораторных работ по методам предварительной обработки стохастических процессов и его апробация в учебном процессе.
Научная новизна.
-
Доказана существенная зависимость уровня значимости непараметрических критериев, наиболее часто используемых для обнаружения трендовой составляющей дискретного случайного процесса, от коррелированности его отсчетов и проведено сопоставление критериев по характеру и степени выраженности этой зависимости;
-
Предложен метод коррекции рассмотренных непараметрических критериев, позволяющий учесть наличие корреляции отсчетов и повысить надежность выводов, получаемых с их помощью.
-
Разработаны три алгоритма обнаружения серий аномальных наблюдений, значимо нарушающих гладкость траектории дискретного коррелированного процесса, основанные на анализе сезонных разностей и цифровой фильтрации.
-
Исследована зависимость рабочих характеристик алгоритма кумулятивных сумм от параметров корреляционной функции анализируемого процесса и показана необходимость учета этой информации при синтезе АКС.
-
Получены расчетные формулы, обеспечивающие настройку АКС с учетом коррелированности процесса при решении задачи обнаружения его разладки по среднему значению.
Методы исследования. Полученные в диссертации результаты основываются на применении аппарата теории вероятностей, математической статистики, теории случайных процессов, методов имитационного моделирования и цифровой обработки сигналов.
Обоснованность и достоверность научных положений, выводов и результатов подтверждается данными имитационного моделирования, которые в частном (предельном) случае некоррелированных отсчетов совпадают с известными теоретическими результатами, данными о применении разработанных методов и алгоритмов в программно-техническом комплексе оперативного статистического анализа реальных цифровых сигналов, апробацией полученных результатов среди квалифицированных специалистов на XXXX юбилейной международной конференции «Информационные технологии в науке, образовании, телекоммуникации и бизнесе IT+SE'2012», Украина, Крым, Ялта-Гурзуф, 2012 г.
Практическая значимость работы.
Полученные результаты исследований позволяют более эффективно использовать алгоритмы предварительной обработки при решении задач обнаружения тренда, аномальных наблюдений и разладки процессов по среднему значению с учетом корреляционных свойств наблюдаемых временных рядов. Кроме того, предложенные новые методы и подходы, учитывающие специфику работы с коррелированными процессами, способны расширить имеющуюся методологическую базу и вооружить исследователя работоспособными средствами решения рассмотренных в работе задач. Созданные алгоритмы могут применяться в технической диагностике, в научных исследованиях, при решении прикладных задач в различных предметных областях, связанных с цифровой обработкой сигналов. В частности, они нашли применение в разработанном программно-техническом комплексе предварительной обработки цифровых сигналов и легли в основу созданного программного и методического обеспечения для проведения курса лабораторных работ по данной тематике.
Реализация результатов. Результаты работы были использованы:
при разработке программно-технического комплекса оперативного статистического анализа цифровых сигналов, включающего в себя аппаратную часть в виде программных модулей для программируемых логических интегральных схем и программную часть в виде специализированного приложения для ПК;
для расширения возможностей лабораторного практикума по курсу «Анализ стохастических процессов» в Национальном исследовательском университете МЭИ в виде программного и методического обеспечения.
Апробация работы. Результаты работы и ее основные положения докладывались на международных конференциях «Радиоэлектроника, электротехника и энергетика» (Москва, 2010), «Информационные средства и технологии» (Москва, 2010), «XXXX юбилейной международной конференции «Информационные технологии в науке, образовании, телекоммуникации и бизнесе IT+SE'2012» (Украина, Крым, Ялта-Гурзуф), на заседании кафедры «Управления и Информаттики» Национального исследовательского университета МЭИ.
Публикации. По результатам выполненных исследований опубликовано 11 работ, в том числе 1 статья в рецензируемых журналах из списка ВАК, 6 тезисов докладов и 4 доклада в материалах Международных конференций.
Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, заключения и списка литературы из 100 наименований, включает 181 страницу текста, 81 рисунок, 25 таблиц.