Содержание к диссертации
Введение
ГЛАВА 1. Методы частотно-временного анализа импульсных сигналов 10
1.1 Геоакустическая эмиссия как пример импульсного сигнала 10
1.2 Методы частотно-временного анализа импульсных сигналов и их применение к анализу сигналов ГАЭ. Сравнительная характеристика 14
1.2.1 Преобразование Фурье. Методы периодограмм и коррелограмм 15
1.2.2 Параметрические методы спектрального анализа 18
1.2.3 Методы, основанные на анализе собственных векторов и значений матрицы ковариаций 18 1.2.4. Оконное преобразование Фурье. Проблема частотно-временной локализации 20
1.2.5 Вейвлет-преобразование 22
1.2.6 Вейвлет-пакеты 28
1.2.7 Преобразование Вигнера-Вилля. Классы Коэна 30
Выводы главы 1 32
Глава 2. Разреженная аппроксимация как метод эффективного анализа импульсных сигналов 33
2.1 Разреженная аппроксимация 33
2.1.1 Задача разреженной аппроксимации 33
2.2 Подходы к решению задачи разреженной аппроксимации 35
2.2.1 Преследование базиса 35
2.2.2 Согласованное преследование 36
2.3 Выбор словаря для разреженной аппроксимации сигналов ГАЭ 37
2.3.1. Словарь Габора 38
2.3.2. Словарь Берлаге 41
2.4 Сравнение алгоритмов разреженной аппроксимации на примере сигналов ГАЭ 45
2.5 Выбор метода исследования сигналов ГАЭ 50
Выводы главы 2 51
Глава 3. Модель импульсного сигнала на базе разреженных аппроксимационных схем 53
3.1 Модель импульса ГАЭ 53
3.2 Комбинированный словарь 57
3.3 Адаптивное согласованное преследование как метод идентификации модели 59
3.3.1 Процедура уточнения 60
3.3.2 Правило останова 65
3.4 Методы анализа модели 68
3.4.1 Разреженное представление в частотно-временной области 68
3.4.2 Устойчивость адаптивного согласованного преследования к шуму 70
Выводы главы 3 74
Глава 4. Моделирование и исследование сигналов ГАЭ 76
4.1. Программный комплекс обработки сигналов ГАЭ методом адаптивного согласованного преследования 76
4.1.1. Подсистема генерации словарей 77
4.1.2 Подсистема анализа сигналов 80
4.1.3 Подсистема моделирования сигналов 83
4.1.4 Методы визуализации 86
4.2 Оценка распределений параметров модели 88
4.2.1 Количество атомов в разложении. Доля импульсов с ПИН 88
4.2.2 Оценка распределения частот атомов 90
4.2.3 Оценка распределения параметров, зависящих от времени 92
4.2.4. Анализ невязки 99
4.3 Анализ реальных сигналов 101
4.3.1 Алгоритм очистки от шумов сигналов ГАЭ 101
4.3.2 Связь между размерами сдвигового источника и частотой генерируемого сигнала 104
Выводы главы 4 110
Заключение 112
Список использованных источников 113
- Методы частотно-временного анализа импульсных сигналов и их применение к анализу сигналов ГАЭ. Сравнительная характеристика
- Подходы к решению задачи разреженной аппроксимации
- Адаптивное согласованное преследование как метод идентификации модели
- Подсистема генерации словарей
Введение к работе
Актуальность работы
Подготовка землетрясения является длительным процессом и состоит из нескольких этапов. Первый из них обусловлен накоплением упругой потенциальной энергии в гипоцентральной области, его продолжительность растет с магнитудой готовящегося землетрясения и может измеряться годами. Следующий этап характеризуется пластическими подвижками, образованием микротрещин, форшоками, длится от нескольких часов до нескольких суток, и заканчивается образованием магистрального разрыва, т.е. очага землетрясения. Именно на этом этапе в различных физических полях на расстояниях сотен километров от готовящегося землетрясения наблюдаются краткосрочные предвестники. Но несмотря на большое количество работ, посвященных прогнозу сейсмических событий, эта задача современной науки до сих пор не решена. С 1999 года в сейсмоактивном регионе полуострова Камчатка лабораторией акустических исследований ИКИР ДВО РАН ведется непрерывный мониторинг сигналов акустической эмиссии (АЭ). Акустическая эмиссия представляет собой упругие колебания, возникающие в ответ на деформации окружающей среды, при этом характеристики возникающего импульсного излучения напрямую зависят от свойств происходящих пластичных процессов. АЭ звукового диапазона, возникающую при деформации горных пород, принято называть мезомасштабной или геоакустической эмиссией (ГАЭ). Исследования, проведенные ИКИР ДВО РАН, показали, что частота следования импульсов ГАЭ зависит от динамики деформационного процесса, наибольшая частота следования импульсов имеет место во время сильных возмущений, предшествующих сейсмическим событиям. Геоакустические сигналы представляют большой интерес при исследовании пластичных процессов, связанных с устойчивостью ландшафтов и формированием предвестников землетрясений. По частотному составу сигнала ГАЭ можно определять масштаб порождающего сигнал источника и оценивать расстояние от него до пункта регистрации.
Для анализа и обработки АЭ в различных частотных диапазонах используются частотные и частотно-временные преобразования, наиболее популярные - оценка спектральной плотности мощности дискретным преобразованием Фурье, спектрограммы, построенные с помощью оконного преобразования Фурье или квадратичного преобразования Вигнера-Вилля. Однако процесс исследования ГАЭ данными методами сталкивается с рядом трудностей:
широкий динамический диапазон регистрируемых сигналов сопряжен с огромными объемами регистрируемой информации, требующими специальных методов хранения, передачи, обработки и анализа;
существенная неоднородность природных сред и плохое распространение в них упругих колебаний приводит к сильному искажению и ослаблению сигналов, которое ограничивает возможности дистанционных методов исследования;
в деформационных процессах часто возникают критические процессы, проявляющиеся в резких изменениях интенсивности и направления ГАЭ;
аномалии четко локализованы по времени, поэтому анализ только в частотной области не предоставляет полной информации о сигналах и не учитывает частных особенностей;
сильная зашумленность как природными, так и техногенными шумами осложняет анализ внутренней (морфологической) структуры импульсов;
широкое разнообразие временных форм сигналов осложняет задачу классификации и требует применения адаптирующихся под конкретный сигнал методов анализа;
главным препятствием для анализа частотно-временной структуры импульсов является их короткая длительность, приводящая к плохому частотно-
временному разрешению. Длительность одиночного импульса не превосходит 200 мс, в среднем составляет около 50 мс при частоте регистрации 48 кГц, что составляет 2400 отсчетов.
В 2011 году для моделирования геоакустических сигналов лабораторией акустических исследований ИКИР ДВО РАН был впервые использован активно развивающийся метод разреженной аппроксимации, позволяющий строить компактные представления по большому в общем случае линейно зависимому набору функций.
Представленная работа посвящена разработке новой описательной модели импульсных сигналов, построенной на основе разреженных аппроксимационных схем, раскрывающей внутреннюю частотно-временную структуру импульса, и настройке данной модели под общие и частные особенности отдельных импульсов ГАЭ.
Работа является актуальной в рамках задач разработки систем мониторинга природных сред в целях обеспечения безопасности населения и хозяйственных объектов при возникновении природных и техногенных катастроф.
Цель исследования – разработка и анализ модели импульсного сигнала, построенной на основе разреженного представления и раскрывающей внутреннюю частотно-временную структуру, на примере сигналов ГАЭ.
Для достижения цели были решены следующие задачи:
-
выполнен аналитический обзор методов частотно-временного анализа импульсных сигналов;
-
изучена природа и особенности геоакустических сигналов, выполнен обзор методов регистрации и предварительной обработки;
-
разработана модель импульсного сигнала на базе разреженных аппроксимационных схем, учитывающая особенности природы генерации реальных сигналов;
-
выбран и обоснован словарь функций, обеспечивающий адекватное описание сигнала эмиссии для алгоритмов разреженной аппроксимации;
-
разработан алгоритм идентификации модели импульсного сигнала на базе алгоритма согласованного преследования, решающий задачу разреженной аппроксимации с достаточной точностью;
-
разработан модифицированный алгоритм адаптивного согласованного преследования, обеспечивающий высокую разрешающую способность в условиях ограниченных вычислительных ресурсов;
-
разработан программный комплекс для анализа импульсных сигналов методами разреженной аппроксимации, включающий подсистемы генерации словарей, генерации сигналов, моделирования и визуализации в частотно-временной области;
-
проведено исследование предложенных модели и алгоритмов на реальных и модельных сигналах для оценки их эффективности.
Объектом исследования диссертационной работы являются импульсные сигналы ГАЭ.
Предметом исследования диссертационной работы является модель отдельного импульса ГАЭ, построенная на базе разреженных аппроксимационных схем.
Методы исследования. Для решения поставленных задач использовались
методы цифровой обработки сигналов (частотно-временные преобразования,
цифровая фильтрация и спектральный анализ сигналов), методы решения
оптимизационных задач, методы разреженной аппроксимации, методы
математической статистики, а также математическое и компьютерное
моделирование.
Методология исследования включает в себя
1) анализ существующих методов обработки импульсных сигналов;
-
анализ методов решения задачи разреженной аппроксимации в обработке сигналов;
-
применение метода согласованного преследования, решающего задачу разреженной аппроксимации, для моделирования и анализа импульсных геоакустических сигналов;
-
проведение серии экспериментов по моделированию импульсов ГАЭ с помощью разработанных модели, алгоритмов и программного комплекса на модельных и реальных сигналах;
5) анализ результатов экспериментальной работы.
Научную новизну работы составляют следующие положения:
-
впервые предложена модель импульсного сигнала на базе разреженного представления, отличающаяся адекватным физической природе описанием структуры сложного импульса и позволяющая описывать сигналы короткой длительности;
-
впервые применен метод разреженной аппроксимации для анализа геоакустических сигналов, использующий комбинированные словари и позволяющий с высокой степенью детализации описывать импульсные сигналы малым числом компонент модели;
-
предложена новая модификация алгоритма согласованного преследования, позволяющая повысить точность разреженной аппроксимации за счет применения численного метода типа покоординатного спуска для итерационного уточнения структуры словаря и отличающаяся высокой разрешающей способностью и вычислительной эффективностью в условиях ограниченных вычислительных ресурсов.
Практическую значимость представленной диссертационной работы составляют следующие положения:
-
разработан и зарегистрирован программный комплекс MPComplex, реализующий алгоритмы анализа импульсных сигналов. Данное программное обеспечение может быть использовано для анализа широкого спектра сигналов импульсной природы. MPComplex внедрен в лаборатории акустических исследований ИКИР ДВО РАН на этапе постобработки данных периодов возмущения ГАЭ;
-
получены параметры модели геоакустических сигналов, которые могут использоваться для выделения и классификации импульсов эмиссии;
-
на базе модели разработан алгоритм фильтрации и очистки сигналов от техногенных шумов.
На защиту выносятся следующие основные положения:
-
модель импульсного сигнала на базе разреженной аппроксимационной схемы и алгоритм ее идентификации;
-
адаптивный алгоритм согласованного преследования с использованием численного метода типа покоординатного спуска для итеративного уточнения структуры словаря;
-
численная схема расчета адаптивного алгоритма согласованного преследования;
-
программный комплекс анализа и моделирования импульсных сигналов.
Апробация работы
Результаты по теме диссертационной работы обсуждались и докладывались на научных семинарах СПбГЭТУ «ЛЭТИ» им. В.И. Ульянова (Ленина), ИКИР ДВО РАН, КамГУ им. В.Беринга.
Работа выполнена в соответствии с Программой фундаментальных научных
исследований государственных академий наук на 2013-2020 гг., Программами
фундаментальных научных исследований Президиума РАН «Окружающая среда в
условиях изменяющегося климата: экстремальные природные явления и
катастрофы», ОФН РАН «Фундаментальные основы акустической диагностики
искусственных и природных сред», научными темами и планами работ ИКИР ДВО РАН. Работа частично выполнена в рамках гранта Президиума ДВО РАН «Разработка нового подхода к исследованию акустической эмиссии на основе метода разреженной аппроксимации», № 12-III-А-02-030.
Основные положения и результаты работы докладывались и обсуждались на следующих научно-технических конференциях:
-
15, 16, 17, 18-й Международной конференции «Цифровая обработка сигналов и ее применение» (DSPA’2013, DSPA’2014, DSPA’2015, DSPA’2016), г. Москва, 2013-2016 гг.;
-
VI международной конференции «Солнечно-земные связи и физика предвестников землетрясений» ИКИР ДВО РАН, с. Паратунка, Камчатский край, 2013 г.;
-
Мероприятии Объединенных конференций IVESC-ICEE-ICCTPEA-BDO-2014 (ICCTPEA, The International Conference on Computer Technologies in Physical and Engineering Applications), г. Санкт-Петербург, 2014 г.;
-
9-м Открытом немецко-российском семинаре «Распознавание образов и понимание изображений – OGRW-9-2014», г. Кобленц, Германия, 2014 г.;
-
Международной конференции по мягким вычислениям и измерениям (SCM'2015, SCM'2016), С.-Петербург, 2015-2016 г.;
-
Региональной конференции «Теория и практика современных гуманитарных и технических наук», г. Петропавловск-Камчатский, 2016 г.
Публикации
По теме диссертационной работы опубликовано 17 печатных работ: в том числе 4 из списка изданий, рекомендованных ВАК (из них 1 статья индексирована в базе WoS), 3 статьи в российских рецензируемых журналах, включенных в базу РИНЦ, 10 докладов в материалах международных и всероссийских научно-технических конференций (из них 3 доклада, индексированных в базе Scopus). Получено 2 свидетельства о государственной регистрации программы для ЭВМ.
Структура и объем работы
Диссертация состоит из введения, 4 глав, заключения, списка литературы из 117 наименований. В работе содержится 130 страниц машинописного текста, 78 рисунков, 17 таблиц.
Методы частотно-временного анализа импульсных сигналов и их применение к анализу сигналов ГАЭ. Сравнительная характеристика
Главная идея параметрических методов - представить исследуемый сигнал в виде некоторой параметрической модели, для которой легко оценить спектральные коэффициенты, зная параметры. Чаще всего используется авторегрессионная модель сигнала (АР-модель) р s[n] = -Yjaks[n-k] + s[nl к=\ где ак - параметры модели, Р - порядок модели, є - белый шум с нулевым средним и дисперсией, равной а2. Популярность АР-моделей обусловлена хорошим спектральным разрешением и простотой оценки параметров [27]. СПМ АР(Р)-процесса определяется следующим образом (fl )= р Т а , l + ak-exp(-jokT) к=\ здесь Т- шаг дискретизации.
Оценить параметры модели можно различными методами: методы Юла-Уокера, ковариационный, максимального правдоподобия, Берга и др. [27,28]
Параметрические методы используются для анализа систем связи [29], речевых [30], эхо-сигналов [31-33], экономических данных [34].
Методы MUSIC и EV с помощью собственных векторов и собственных значений ковариационной матрицы оценивают зависимость амплитуды гармонических составляющих сигнала от их частоты, называемую псевдоспектром [27]. Предполагается, что сигнал представляет собой сумму комплексных экспонент и белого шума. м s[n] = Y,Am exp(-jamT) + є[п], m=\ М- количество гармонических составляющих, - белый шум. Главная задача методов - разделить собственные вектора матрицы ковариаций на два подпространства: подпространство сигнала и подпространство шума. Псевдоспектр оценивается следующим образом PS(CO) 2_uVk[n]-exp(-jconT) и=0 где FM+1 VM+2..., VN - собственные вектора матрицы ковариаций, принадлежащие подпространству шума, ск- весовые коэффициенты MUSIC :ск=1, EV:ck = Работа [35] посвящена применению методов MUSIC и EV для решения задачи акустического кодирования вокализированных сигналов. В [36,37] описано применение алгоритма MUSIC в радиолокации.
Рисунок 1.2. Оценка СПМ методом БПФ Идеи Фурье оказали огромное влияние на математический анализ, физику и инженерные науки [38]. Однако, несмотря на применение для решения широкого круга задач, таких как передача и анализ стационарных сигналов, преобразование Фурье и методы, разработанные на его основе (п. 1.2.1 – 1.2.3), являются неподходящим инструментом для анализа непостоянных, непериодических, прерывающихся процессов, так как не предоставляют информацию о локализации той или иной частоты (рисунок 1.2).
Отсутствие информации о временной локализации частот в преобразовании Фурье можно частично исправить путем использования так называемых оконных функций (функции, имеющие компактный носитель) w(t). Существует большое количество оконных функций [21-25]. Спектр оконной функции характеризуется двумя параметрами: шириной главного лепестка и затуханием боковых лепестков. Выбор типа оконной функции определяется требованиями исследователя.
Если перед вычислением преобразования Фурье разбивать сигнал на части, s(t) є L2 (К) , движущимся окном, то получим преобразование, зависящее и от частоты, и от времени
Функции gz,o)(t) локализованы как по времени, так и по частоте, поэтому необходимо определиться с такими понятиями как длительность сигнала и ширина спектра. Для определения предельных соотношений, связывающих длительность сигнала и ширину спектра, в современной теории сигналов используется метод моментов [38,39], согласно которому эффективную длительность сигнала и эффективную ширину спектра ою можно вычислить следующим образом
Т.о. в частотно-временной области функцию gT,0 (t) можно представить в виде прямоугольника с центром в точке с координатами (т, rj), соответствующими математическим ожиданиям, и сторонами 2ot, 2аю (рисунок 1.3). ОПФ разбивает частотно-временную область на прямоугольники (частотно-временные окна), соответствующие функциям gXito(t), на которые раскладывается сигнал (рисунок 1.4). Согласно принципу неопределенности произведение «длительность X ширина спектра» удовлетворяют неравенству a2a2 -, (1.6) следовательно, сокращение временного разрешения влечет увеличение частотного. Примером ОПФ может служить преобразование Габора. В 1946 г. физик Габор [40] предложил анализировать частотно-временной состав сигналов, раскладывая их на модулированные функции Гаусса (такое представление тесно связано с нашим восприятием звука) и продемонстрировал возможность частотно-временной локализации. Преобразование Габора обеспечивает лучшую временную локализацию частот среди всех ОПФ, т.к. равенство в (1.6) достигается лишь для функции Гаусса [38,39] ga(f) = A-exp(-Bt2)- exp(-ja)t). Основная причина невозможности использования ОПФ для анализа импульсов ГАЭ -их краткая длительность. Плохое частотно-временное разрешение дискретного ОПФ не позволяет анализировать внутреннюю структуру сигнала (рисунок 1.5). Соотношение (1.6) ограничивает частотно-временное разрешение ОПФ.
Подходы к решению задачи разреженной аппроксимации
Несмотря на подход линейного программирования алгоритмы, решающие задачу преследования базиса, являются вычислительно очень дорогостоящими, так как на каждом шаге оптимизируют разложение по каждому атому словаря. Решить данную проблему можно за счет стратегии «жадности»: принятие локально оптимальных решений на каждом этапе решения задачи, приводящих к оптимальному конечному решению.
Согласованное преследование (MatchingPursuit, MP) – «жадный» алгоритм решения задачи РА, предложенный Малла и Шенг [38,69]. Суть алгоритма сводится к итеративному процессу поиска элементов словаря, минимизирующих на каждом шаге норму ошибки аппроксимации.
верхняя оценка разреженности получаемого решения. Алгоритм согласованного преследования представляет итерационную процедуру следующего вида R.(t) = s(t), (да, И) = arg [R1+l (t) = Rt (t) - (gm (t - rh), Rt (0) -gm(t- Th ) На основе метода согласованного преследования был разработан метод ортогонального согласованного преследования (Orthogonal Matching Pursuit, ОМР), главным отличием (2.5) max k, j которого от классической реализации стало построение ортогонального базиса, минимизирующего ошибку аппроксимации [38,96,97]. \R0(t) = s(t), 1 = 0, (т,h) = arg max (g, (t-zXR (t) \_k tl,j ; I = I m, aN = Dfs, \RM=s-Da\ где I - множество номеров включенных в разложение атомов, Dj=DI(DIDI) -псевдообратная матрица (словарь оргогонализованных атомов, номера которых включены в множество I).
Для итерационных алгоритмов MP и ОМР необходимо задавать правило останова. Критерием остановки алгоритма может служить достижение заданного порогового значения нормой ошибки аппроксимации, RN є; разреженностью полученного решения, Ns; абсолютной величиной коэффициента разложения am е.
Помимо MP и ОМР существует большое количество модифицированных алгоритмов, также относящихся к группе алгоритмов согласованного преследования (gOMP [98], гОМР [99], SWOMP [100] и др.[101, 102]). Классификация и описание алгоритмов представлены в приложении В.
Алгоритмы преследования уменьшают вычислительную сложность поставленной задачи и позволяют найти эффективное в части минимизации RN, но неоптимальное решение.
Одним из важнейших этапов решения задачи РА (2.1) является выбор словаря. Словарь должен быть подобран таким образом, чтобы обеспечивать наилучшее качество аппроксимации. Аппроксимации одного и того же сигнала на различных словарях будут отличаться как по разреженности, так и по точности. Так как главной задачей исследования импульсов ГАЭ является анализ их внутренней структуры, то выбор словаря должен быть обоснован так же и с физической точки зрения. 2.3.1. Словарь Габора
В первом приближении импульсы ГАЭ могут быть описаны модулированными функциями. На основе данного заключения изначально [103] в качестве словаря/) был выбран словарь Габора, включающий масштабированные, модулированные и сдвинутые по времени функции Гаусса, имеющие наименьшую площадь частотно-временного окна. Аналитически функция Гаусса определяется соотношением (0 = -exp(- 2)-cos(2#), -Z-L r Z-L (2.6) где А - амплитуда, выбирается таким образом, чтобы атом был нормирован g(t)=1, А 0; В - параметр, отвечающий за скорость затухания, В 0; /- частота заполняющей гармоники в Гц. Огибающие функций Гаусса симметричны относительно оси ординат и своего максимального по абсолютной величине значения достигают в 0: g(tma) = g(0) = A. В качестве атомов словаря выбираются импульсы, удовлетворяющие на границах области определения условию S + LnA 0.05-e(/)L т.е. на границе области определения амплитуда импульса должна составлять не более 5% от максимального значения е 4 0.05, „ 4-In 0.05 В (2.7) Обозначив величину 4-In 0.05 B(T ) lim end 4im end - end как критическое значение параметра В и учитывая (2.7), выражение (2.6) можно переписать в виде 8(f) = (2.8) где А - приращение параметра В к критическому значению. Согласно (2.8) у модулированной функции Гаусса можно выделить следующие независимые друг от друга параметры, уникальным образом характеризующие каждый частотно-временной атом словаря: Tend, , f. На рисунке 2.1 представлены примеры функций Гаусса длиной 10 мс с различными значениями параметров и f и их преобразования Вигнера-Вилля.
Формирование словаря согласно (2.8) в первую очередь требует определения диапазонов для значений независимых параметров. Частотный диапазон (параметр/) выбран согласно особенностям исследуемых сигналов
Распределение параметров для словаря Габора В ходе серии экспериментов методом согласованного преследования строились РА для 1000 сигналов и анализировались распределения значений параметров, влияющих на форму огибающей атомов (рисунок 2.2).
Были подобраны диапазоны наиболее вероятных по появлению в реальном сигнале значений Р(РІ [Р0;РҐ])-0.9: - Tend: 10-100% от длины участка сигнала, содержащего импульс ГАЭ; - А: 105-108. Тестирование словаря Габора проводилось на выборке из 1000 характерных одиночных импульсов ГАЭ. Был сформирован словарь из 160 функций Гаусса со следующими параметрами: 10 значений f , равномерно распределенных на отрезке 200-20000 Гц, 4 значения Tend на промежутке 10%-100% и 4 значения А на 105-108 (1044=160 атомов). Для каждого импульса по заданному словарю алгоритмом согласованного преследования строилась РА из 15 атомов. На рисунке 2.3 представлен график зависимости спада средней по 1000 импульсам ошибки, вычисляемой по формуле ERRN = Ui -100%, (2.9) от разреженности получаемого разложения. На 15й итерации алгоритма согласованного преследования ошибка в среднем составила 6%.
На рисунке 2.4 изображено разложение реального сигнала ГАЭ, полученное методом согласованного преследования. Аппроксимация построена по словарю Габора, в разложение включено 25 атомов. В среднем одиночный импульс раскладывается в сумму из 5 атомов (в ходе эксперимента получена оценка /л « 5 атомов), поэтому для рассматриваемого сигнала строилось разреженное представление, состоящее из 25 атомов ( « 5/и ). Итоговая ошибка составила около 14%. Рисунок 2.4. Аппроксимация сигнала ГАЭ с помощью словаря Габора
Адаптивное согласованное преследование как метод идентификации модели
Для эксперимента объединением монословарей, сформированных в п. 2.3.1 и 2.3.2., был получен комбинированный словарь из 320 функций. Данный словарь тестировался на 2000 сигналах ГАЭ длиной 8 мс, первая половина из которых содержала явные одиночные импульсы с амплитудой 0.02 – 0.05 Па и заполняющей частотой 5 – 15 кГц, а вторая – акустический шум. Предварительная обработка сигналов включала нормирование по амплитуде. Для каждого из исследуемых сигналов по заданному комбинированному словарю алгоритмом согласованного преследования строилась РА из 15 атомов. Использование комбинированного словаря снизило ошибку аппроксимации приблизительно на 5-10% (рисунок 3.3).
На рисунке 3.4 изображен результат анализа реального сигнала, содержащего 5 импульсов, с помощью комбинированного словаря. В среднем одиночный импульс раскладывается в сумму из 5 атомов (), поэтому для рассматриваемого сигнала строилось разреженное представление, состоящее из 25 атомов (5), итоговая ошибка достигла 17.5%.
Комбинированный словарь предоставляет лучшее качество аппроксимации по сравнению с монословарями: использование комбинированного словаря, состоящего из функций Гаусса и Берлаге, позволяет снизить ошибку аппроксимации. Функции Берлаге, являющиеся наиболее распространенной моделью сейсмических колебаний, подходят для описания элементарных импульсов ГАЭ, также имеющих сейсмическую природу, функции Гаусса, обладающие минимально возможной площадью частотно-временного окна, хорошо аппроксимируют шум. Рисунок
По результатам сравнения алгоритмов разреженной аппроксимации в п. 2.4 в качестве алгоритма идентификации модели (3.5) был выбран алгоритм согласованного преследования (2.5)[108].
Одним из критериев качества построенных разложений является точность построенных аппроксимаций, их соответствие реальным сигналам. Наиболее простым способом повышения качества аппроксимации является расширение словаря, включение в него новых атомов с параметрами из выбранных диапазонов (таблица 3.2).Однако для алгоритма согласованного преследования увеличение размерности словаря сопряжено со значительными затратами временных и пространственных вычислительных ресурсов.
Самой затратной по времени частью алгоритма является вычисление на каждой итерации скалярных произведений всех сдвигов атомов словаря с сигналом Ig(tj),Ri(f), 0 к М-1, т.о. объем вычислительных ресурсов, требуемых для выполнения алгоритма, прямо пропорционален размеру словаря М. На практике для каждого атома, включенного в словарь, высчитываются скалярные произведения всех его сдвигов с сигналом, всего L+Lg-1 скалярных произведений.
Пусть имеется словарь, состоящий из М атомов длиной Lg отсчетов, и сигнал длиной отсчетов, тогда вычисление всех скалярных произведений потребует выполнения MxLx(L + Lg-1)умножений, соответственно объем вычислительных ресурсов, требуемых для выполнения алгоритма, прямо пропорционален размеру словаря М [108]. В таблице 3.3 приведено время выполнения одной итерации алгоритма согласованного преследования для сигнала длиной 384 отсчета на словарях различной мощности (L = Lg = 384).Все вычисления проводились на персональном компьютере с характеристиками: процессор Intel Core i7-4770K3.50 ГГц, размер оперативной памяти 8 Гб.
Мощность словаря (ф. Берлаге + ф. Гаусса) Время выполнения 1 ит. MP (среднее по 100 измерениям) Основными недостатками классического согласованного преследования являются: - огромные затраты временных и пространственных вычислительных ресурсов; - «грубая» сетка в пространстве параметров словаря, в случае словарей малых размеров, т.к. в аппроксимации включаются атомы с дискретными значениями параметров.
Одним из способов повышения качества аппроксимации в условиях ограниченных вычислительных ресурсов, не требующим расширения словаря, является добавление к алгоритму процедуры уточнения в пространстве параметров. Под пространством параметров монословаря будем понимать и-мерное пространство, образованное всеми допустимыми значениями п независимых параметров атомов заданного словаря. Каждый атом в пространстве параметров представляется и-мерной точкой. Суть процедуры уточнения заключается в поиске нового, более значимого элемента разложения на каждой итерации алгоритма в окрестности выделенного атома. Найденный уточненный атом и все его сдвиги добавляются в словарь, адаптируя его к конкретным особенностям сигнала. Ниже по шагам описан процесс уточнения для монословарей с iVp+1 независимыми параметрами (Np параметров, влияющих на форму огибающей, и частота). Автором предложен способ уточнения структуры словаря, заключающийся в применении численного метода типа покоординатного спуска для поиска локального максимума функционала F(g) = \(g(t - т ; p),Ri(t)\\в пространстве параметров монословаря.
Применение метода типа покоординатного спуска позволяет итерационно уточнять структуру словаря, найденный уточненный атом и все его сдвиги добавляются в словарь, адаптируя его к конкретным особенностям сигнала. Применение алгоритма адаптивного согласованного преследования позволяет снизить объем затрачиваемых вычислительных ресурсов и получать качественные аппроксимации на словарях меньшего объема (рисунок 3.5).
Преобладающая часть времени выполнения одной итерации алгоритма с уточнением на словаре с Np+7-мерным пространством параметров складывается из времени выполнения (M + k-3Np+1)xLgx(L + Lg-\) умножений и фиксированного времени формирования уточняющего словаря из 3 р+ атомов, умноженного на количество итераций обучения к, т.о. объем вычислительных ресурсов, требуемых для согласованного преследования с уточнением, пропорционально зависит от размера словаря Ми количества итераций обучения к. Для словаря определенного размера М можно подобрать значение к, обеспечивающее высокую точность при заданных вычислительных ресурсах [108].
Подсистема генерации словарей
Модель (3.5) представляет сигнал ГАЭ в виде суммы элементарных сигналов, соответствующих отдельным сдвиговым деформациям. Каждый включаемый в разложение (3.5) атом характеризуется набором параметров, одним из которых является частота/
Зная скорость продольных колебаний в осадочных породах Vp и частоту порождаемого сигнала, можно оценить длину сдвигового источника / по формуле Дж. Бруна [114] l = 2.34V/2tf. (4.1) 104 Учитывая основной частотный диапазон регистрируемых сигналов f = 0.7 – 18 кГц и приблизительное значение Vp 1.8 – 2.5 км/с [115], получаем l 0.04 – 1.3 м.
Данный параграф посвящен анализу реальных сигналов, содержащих одиночные импульсы ГАЭ, алгоритмом адаптивного согласованного преследования (k = 7, LERR = 5%) и оценке по полученным моделям масштабов источников по формуле Дж. Бруна (4.1). Предобработка сигналов включала нормирование по амплитуде т.о., чтобы s(t)1. Для анализа сигналов использовался комбинированный словарь, состоящий из 320 функций Берлаге с параметрами Tend: 10-100% от длины сигнала (4 значения); tmax: 1-30% от длины атома (4 значения); f: 200-20000 Гц (5 значений); : 5-20 (4 значения); и 80 функций Гаусса: Tend: 10-100% от длины сигнала (4 значения); f: 200-20000 Гц (5 значений); : 105-108(4 значения). На рисунке 4.30 представлены низкочастотные импульсы ГАЭ, обладающие простой внутренней структурой. алгоритм адаптивного согласованного преследования сравнивается с ОПФ. По графикам в частотно-временной плоскости видно, что адаптивное согласованное преследование точнее, чем ОПФ, определяет временную и частотную локализацию сигнала. Модель изображенного на рисунке 4.30а импульса состоит из 2 атомов с частотами 2056 Гц и 1853 Гц, согласно формуле Дж. Бруна (4.1) данным частотам соответствуют источники масштабом l 0.33 – 0.45 м. Модель изображенного на рисунке 4.30б импульса состоит из 8 атомов с частотами от 1747 Гц и 16906 Гц. 4 атома из 8 с частотами выше 16 кГц аппроксимируют ПИН, оставшиеся 4 атома можно разбить на две группы: 3 атома с частотами от 1747 Гц до 3294 Гц (l 0.2 – 0.5 м) и 1 атом с частотой 10719 Гц (l 0.06 – 0.08 м).
На рисунке 4.31 изображен низкочастотный импульс со сложной внутренней структурой. Модель импульса состоит из 17 атомов, 2 из которых аппроксимируют ПИН (f 17 кГц). Частоты оставшихся атомов лежат в диапазоне от 78 до 6697 Гц, что соответствует масштабам l 0.1 – 12 м.
Модель импульса, изображенного на рисунке 4.32а, состоит из 4 атомов с частотами от 7702 до 10255 Гц, данным частотам соответствуют сдвиговые источники с масштабами l 0.06 – 0.12 м.
На рисунке 4.32б изображен сильно зашумленный высокочастотный импульс ГАЭ. ПИН видно как по графику временной формы, так и по представлению в частотно-временной области. Из 8 атомов, составляющих модель сигнала, 4 аппроксимируют паразитную составляющую (f 17 кГц). Остальные атомы локализованы в частотном диапазоне от 7470 до 9945 Гц (l 0.07 – 0.12 м).
Импульс, представленный на рисунке 4.32в, содержит незаметную во временной области низкочастотную составляющую: модель включает 3 атома с частотами 8863 – 10409 Гц (l 0.06 – 0.1 м) и 1 атом с частотой 2366 Гц (l 0.3 – 0.4 м). Рисунок 4.32 показывает, что адаптивное согласованное преследование по сравнению с классическим, во-первых, строит более точные аппроксимации, и во-вторых, модели, построенные адаптивным согласованным преследованием, обладают лучшей разреженностью. На рисунке 4.33 изображен анализ сигналов, содержащих две отличные частоты. 107 Рисунок 4.33. Импульсы ГАЭ с переходом от низкой частоты к высокой: а) N1 = 3, ERR = 4%; б) N1 = 7, ERR = 4%; в) N1 =8, ERR = 4.7% Импульс, представленный на рисунке 4.33а раскладывается в сумму из 3 атомов с частотами 2366 Гц, 5768 Гц и 9017 Гц. Атом с частотным заполнением в 5768 Гц описывает переход от низкой частоты в 2366 Гц (l 0.3 – 0.4 м) к высокой частоте 9017 Гц (l 0.07 – 0.1 м). Можно предположить, что импульс порожден сдвиговыми источниками двух отличных масштабов.
По графику временной формы сигнала, изображенному на рисунке 4.33б, виден переход от высокой частоты к низкой. Построенная модель состоит из 7 атомов, которые можно разбить на 2 группы: атомы с частотами от 7000 до 12266, аппроксимирующие высокочастотную составляющую (l 0.05 – 0.17 м), и атомы с частотами от 2210 до 2675 Гц, аппроксимирующие низкочастотную составляющую (l 0.25 – 0.4 м).
Визуально по графику временной формы сигнала, представленном на рисунке 4.33в, определяются две сильно отличающихся частоты. По частотно-временному представлению модели видно, что высокочастотный импульс (f = 8862 – 10719 Гц, l 0.06 – 0.1 м) накладывается на низкочастотный (f = 1706 – 2366 Гц, l 0.3 – 0.5 м).