Содержание к диссертации
Введение
Глава 1. Асимптотические свойства оценки риска при пороговой обработке вейвлет-коэффициентов 13
1.1. Вводные сведения 13
1.1.1. Вейвлет-преобразование 13
1.1.2. Связь вейвлет-коэффициентов и регулярности функции 18
1.1.3. Обработка дискретных данных 20
1.1.4. Пороговая обработка 22
1.2. Свойства оценки риска при известной дисперсии шума 29
1.3. Сходимость по вероятности оценки риска при оцениваемой дисперсии шума 34
1.4. Сходимость по распределению оценки риска при оцениваемой дисперсии шума 40
1.5. Примеры оценок дисперсии шума 44
Глава 2. Асимптотики оценки риска при пороговой обработке вейвлет-вейглет коэффициентов в задаче томографии 53
2.1. Вводные сведения 53
2.1.1. Компьютерная томография 53
2.1.2. Вейвлет-вейглет разложение (WVD) 57
2.1.3. Дискретизация и модель шума 59
2.1.4. Пороговая обработка 60
2.2. Асимптотика оценки риска при известной дисперсии шума 62
2.3. Свойства оценки риска при использовании оценки дисперсии шума 65
Глава 3. Обработка кардиосигналов 72
3.1. Вводные сведения 72
3.1.1. Электрокардиограмма и ритмограмма 72
3.1.2. Построение ритмограммы 74
3.1.3. Эктопические импульсы 76
3.1.4. Математические модели ритмограммы 78
3.2. Удаление шума из ЭКГ 81
3.3. Доверительные интервалы для разностей ритмограммы 83
3.4. Метод робастной регрессии 85
3.5. Алгоритм отсева эктопических импульсов 90
3.6. Результаты работы метода отсева 91
Заключение 94
Литература 95
- Связь вейвлет-коэффициентов и регулярности функции
- Сходимость по распределению оценки риска при оцениваемой дисперсии шума
- Асимптотика оценки риска при известной дисперсии шума
- Доверительные интервалы для разностей ритмограммы
Введение к работе
Актуальность работы. Теория вейвлет-преобразования является одним из молодых и активно развивающихся направлений современной математики. Термин «вейвлет» (wavelet) можно перевести, как «маленькая волна», он был введен А. Гроссманом и Ж. Морле [73], которые занимались изучением сейсмических сигналов. Название отражает главное отличие вейвлетов от тригонометрических функций, используемых в классическом преобразовании Фурье - их локалыюсть по времени. Поэтому если преобразование Фурье вычисляется с помощью растяжений единственной функции, то вейвлет-преобра-зование использует растяжения и сдвиги базового вейвлета. Поначалу в отечественной литературе не было единства терминологии, наравне с «вейвлетами» употреблялся термин «всплески» (см. работы Н. М. Астафьевой [1] и И. Я. Новикова и С. Б. Стечкина [20]). Но можно утверждать, что сейчас термин «вейвлеты» является общепринятым.
Фундаментальные теоретические результаты были получены в 80-90-х годах прошлого столетия. Тогда же были разработаны основные численные алгоритмы вейвлет-преобразования. Эти результаты связаны с именами И. Мейера, И. Добеши, С. Малла, Р. Койф-мана, А. Коэна и других ученых. На сегодняшний день вейвлет-анализ является мощным математическим аппаратом. Одной из первых монографий, посвященной теории вейвлетов и построения вейвлет-базисов, является книга И. Мейера «Ondelettes et Operateurs», вышедшая в 1990 году на французском языке (ее английский перевод [102] был издан два года спустя). И. Добеши предложила метод построения вейвлетов с компактным носителем [5, 53]. С. Малла разработал алгоритм вейвлет-преобразования асимптотически более быстрый, чем быстрое преобразование Фурье [13]. Ряд вероятностных аспектов теории вейвлет-разложения рассмотрен в уже упомянутой книге С. Малла [13], а также в монографиях Б. Видаковича [114], В. Хардла и др. [75] и книге А. А. Короновского и А. Е. Храмова [10].
Основные задачи, решаемые с помощью вейвлетов, заключаются в сжатии сигналов, удалении шумов (случайных и неслучайных), получении временной и частотной информации о сигнале. Например, ФБР использует вейвлеты для анализа и хранения отпечатков пальцев; вейв лет-разложение составляет основу стандарта сжатия изображений JPEG2000.
Главным инструментом сжатия сигналов и удаления шума является пороговая об-
работка вейвлет-коэффициентов. Основополагающие результаты в этой области получены американскими математиками Д. Донохо и И. Джонстоном, а также Р. Койфманом, Д. Пикардом, Дж. Керкячарианом, В. Хардлом, А. Цыбаковым [54, 58, 60-62, 65, 75]. Было предложено несколько стратегий выбора порога, в том числе, обладающих хорошими асимптотическими свойствами. Позднее эти идеи были развиты в работах Р. Аверкампа, К. Удре, Й. Элдар, X. Гао, Т. Цай, Л. Брауна, Г. Нэйсона, Я. Ванга и других [35, 43, 66, 71, 72, 103, 104, 115].
При теоретическом обосновании того или иного порога внимание уделялось свойствам ошибки (или риска в моделях со случайным шумом) пороговой обработки с исследуемым порогом. Сам риск неизвестен, т. к. на практике неизвестен чистый исходный сигнал. Но это не мешает получить асимптотические свойства риска и показать, что теоретически результат обработки в среднем должен быть близок к оригинальному незашум-ленному сигналу.
По наблюдаемым данным возможно построить оценку риска. Для вычисления одного из порогов (SureShrink) используется минимизация этой оценки, которая при определенных условиях является несмещенной. Представляют теоретический и практический интерес асимптотические свойства этой оценки риска, ее способность оценивать неизвестный теоретический риск как меру ошибки пороговой обработки. Ранее при изучении оценки риска дисперсия шума полагалась известной, что, во-первых, заметно упрощает выкладки, а во-вторых, влияет на структуру оценки (см. работы Д. Донохо и И. Джонстона [61, 78], а также упомянутые выше монографии [13, 75, 114]). В практических же задачах дисперсия шума всегда оценивается, причем зачастую по самому исследуемому сигналу. Поэтому необходимо учитывать и асимптотику оценки дисперсии шума, и характер зависимости этой оценки от наблюдаемого сигнала. Изучение свойств оценки риска пороговой обработки при оцениваемой дисперсии шума является основной задачей данной диссертации.
Вейвлет-анализ нашел успешное применение, в том числе в медицине. Например, в обработке кардиосигналов - электрокардиограмм (ЭКГ) и ритмограмм. Существует ряд количественных и качественных методик для диагностики различных сердечных заболеваний по этим сигналам. Т. к. типичная ЭКГ содержит от нескольких сотен тысяч до нескольких миллионов значений, то вычислительный аспект при обработке ЭКГ является весьма важным. Аппарат вейвлетов предоставляет сверхбыстрые алгоритмы прямого и обратного преобразования и при этом обеспечивает весьма высокое визуальное качество
обработки.
С помощью пороговой обработки коэффициентов разложения можно эффективно удалять шум из ЭКГ, упрощая качественный анализ. Риск пороговой обработки неизвестен, но можно построить и вычислить его оценку. Используя масштабное свойство вей-влетов, возможно организовать автоматический поиск различных волн в ЭКГ (см., например, работы [33, 83, 86, 90]). По ЭКГ строится производный кардиосигнал - ритмограмма, основная задача обработки которой заключается в оценке спектральных характеристик. При этом в ритмограмме обычно присутствуют паразитные импульсы, и для правильной оценки спектра необходимо либо удалить эти импульсы, либо использовать методы, устойчивые к выбросам.
Вейвлеты находят применение и в задачах обращения ряда линейных однородных операторов, когда по косвенным наблюдениям требуется восстановить исходную функцию. Например, в задаче обращения оператора Радона (называемой также задачей томографии или задачей восстановления томографических изображений). Задача обращения этого оператора относится к т. н. некорректным задачам, и как следствие, для решения требует специальных подходов, получивших название методов регуляризации. Д. Донохо [59] предложил решать задачу томографии с использованием вейвлетов и специальных функций - вейглетов (vaguelettes). При этом регуляризация производится с помощью пороговой обработки коэффициентов разложения. Такой подход зарекомендовал себя как эффективный метод восстановления томографических изображений и впоследствии был развит в работах Э. Колашика, Н. Ли, Б. Люсьера, Ф. Абрамовича, Б. Сильвермана, Дж. Калифа, С. Малла, И. Джонстона и других [31, 78, 80, 81, 84, 85, 88, 89]. Здесь тоже возникает задача нахождения ошибки пороговой обработки с помощью оценки риска. Кроме того, стоит выяснить, как влияют на свойства оценки риска асимптотические свойства оценки дисперсии шума и некорректность задачи томографии.
Объектом исследований являются нелинейные вейвлет-оценки сигналов и изображений в моделях со случайными шумами.
Целью диссертационной работы является изучение асимптотических свойств оценки риска пороговой обработки вейвлет-коэффициентов при прямом и косвенном наблюдении объекта.
Задачи диссертационной работы.
1. Выяснить, обладает ли оценка риска свойством состоятельности и асимптотической
нормальности.
Проанализировать, как влияют свойства оценки дисперсии шума на асимптотику оценки риска.
Исследовать асимптотики оценки риска пороговой обработки в задаче томографии.
Применить полученные результаты для решения прикладных задач в области обработки кардиосигналов.
Методы исследования. В работе использованы аналитические методы математического анализа, неравенства и предельные теоремы теории вероятностей, аппарат математической статистики. Кроме того, использована теория преобразования Радона и метод преобразования Фурье, адаптированный для неравномерной временной сетки.
Научная новизна и основные результаты. Все основные результаты диссертации являются новыми и заключаются в следующем.
Обоснованы свойства состоятельности и асимптотической нормальности оценки риска при пороговой обработке вейвлет-коэффициентов в случае прямого наблюдения одномерного объекта.
Изучено влияние на свойства оценки риска использование оценки дисперсии шума. Рассмотрен случай оценивания дисперсии шума как по независимой выборке, так и по коэффициентам исследуемого сигнала.
Получены асимптотические свойства оценки риска при оцениваемой дисперсии шума в задаче обращения оператора Радона.
В задаче обработки кардиосигналов вычислены значения оценок риска, проведено сравнение полученных результатов с теоретическими значениями. Предложен метод очистки кардиосигналов от нежелательных выбросов.
Теоретическая и практическая значимость. Результаты диссертации носят как теоретический, так и практический характер. Они могут быть использованы при решении таких практических задач, как сжатие и очистка от шума и паразитных импульсов сигналов и изображений.
Личный вклад автора. Все основные результаты диссертации получены лично автором или при его непосредственном участии.
Структура и объем диссертации. В работе принята двойная нумерация формул, определений, теорем и рисунков. Первое число указывает на номер главы, а второе - на порядковый номер соответствующего объекта в главе.
Диссертация состоит из введения, трех глав, разбитых на разделы, заключения и списка литературы, включающего в себя 115 наименований. Общий объем работы составляет 104 страницы.
В начале каждой главы имеется вводный раздел, поделенный на подразделы. В каждом вводном разделе приведены вспомогательные сведения по теме главы и дан обзор известных результатов.
В первой главе рассмотрен случай прямого наблюдения одномерного объекта. Установлены условия, при которых имеет место сходимость по вероятности к нулю и по распределению к нормальному закону разности оценки риска и теоретического риска. Эти условия существенным образом зависят от свойств используемой оценки дисперсии шума. Рассмотрены случаи оценивания дисперсии шума по независимой выборке и по самим вейвлет-коэффициентам.
Во второй главе исследованы асимптотические свойства оценки риска в задаче томографии. Доступны лишь косвенные наблюдения объекта, называемые томографическими проекциями или изображениями. Задача восстановления исходного объекта по этим проекциям является некорректной, что существенно влияет на свойства оценки риска пороговой обработки. Установлены условия состоятельности и асимптотической нормальности оценки риска в этом случае.
Третья глава посвящена решению различных задач обработки кардиосигналов с применением полученных результатов для оценки риска. Задача очистки кардиосигналов от шума решена с применением пороговой обработки вейвлет-коэффициентов, вычислены оценки риска такой обработки, проведено сравнение полученных значений с теоретическими результатами. Представлен алгоритм построения производного кардиосигнала -ритмограммы — на основе непрерывного вейвлет-преобразования. Разработан метод очистки ритмограммы от выбросов на основе робастного варианта метода линейной регрессии. Метод основан на математической модели ритмограммы и строит доверительные интервалы для разностей ритмограммы. Учтено, что ритмограмма по своей природе является сигналом с неравномерными временными отсчетами.
В заключении сделаны общие выводы по данной диссертации, сформулированы все
основные результаты, выносимые на защиту, и предложен ряд перспективных направлений исследований и задач, которые могут решаться с использованием результатов данной работы.
Апробация работы. Основные результаты диссертации докладывались на научном семинаре «Теория риска и смежные вопросы» под руководством профессора В. Е. Бенин-га, профессора В. Ю. Королёва и стар. преп. А. А. Кудрявцева, на научном семинаре «Современные методы обработки сигналов и изображений» под руководством доцента О. В. Шестакова и науч. сотр. Т. В. Захаровой, на XXVIII международном научном семинаре по проблемам устойчивости стохастических моделей (31 мая - 5 июня 2009 г., Закопане, Польша), на X Всероссийском симпозиуме по прикладной и промышленной математике (1-8 октября 2009 г., Сочи - Дагомыс).
Публикации. Основные результаты диссертации опубликованы в 6 печатных работах, из них 4 статьи [14, 16—18] в журналах, входящих в список ВАК «Перечень ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные научные результаты диссертации на соискание ученой степени доктора и кандидата наук», 2 работы в сборниках трудов конференций [15, 96].
Благодарности. Автор глубоко признателен профессору В. Г. Ушакову и доценту О. В. Шестакову за постоянное внимание к работе, плодотворные обсуждения и поддержку. Автор благодарит профессора В. Ю. Королёва и науч. сотр. Т. В. Захарову за разностороннюю помощь, оказанную во время исследований и работы над диссертацией.
Связь вейвлет-коэффициентов и регулярности функции
Если наложить дополнительные ограничения на ф, то можно доказать обратное утверждение.
"Утверждение 1.2. Пусть вейвлет-функция ф имеет т нулевых моментов и является т раз непрерывно дифференцируемой, причем ее производные имеют быстрое убывание. Пусть f Є L2(R) ограничена и удовлетворяет условию (1.5) для некоторого нецелого а т. Тогда f является равномерно регулярной по Липшицу с параметром а на отрезке [с + S, d — S] для любого S 0.
Доказательство обоих утверждений см. в книге С. Малла [13, п. 6.1.3]. "Утверждение 1.3 (Mallat, Hwang [95]). Пусть вейвлетф имеет компактный носитель, т нулевых моментов и т непрерывных производных, и пусть функция f Є L1 [с, d]. Если найдется такое so 0, что (W/) (s,u)\ не имеет локального максимума для и Є [с,d] и s SQ, то f равномерно регулярна по Липшицу с показателем т на [с + S, d — 5] для любого 5 0. Хотя утверждение 1.3 доказано для ф с компактным носителем, на практике обоснованный в нем принцип часто используется для вейвлетов на основе производных гауссиа-нов. "Утверждение 1.4. Пусть ф является производной порядка т от гауссиана. Тогда для любой f Є L2(R) модули максимумов (W/) (s,b) образуют линии, которые не прерываются с уменьшением s. При работе с реальными сигналами всегда имеют дело с конечными интервалами времени. Везде далее будем считать, что функция f(x) задана на интервале [0,1], а вне его тождественно равна нулю. Для обработки такой функции можно использовать вейвле-ты ф к, образующие базис L2(R) и имеющие компактный носитель, однако такой способ не является оптимальным. Даже если / является равномерно регулярной на отрезке [0,1], то вейвлеты, чей носитель пересекает точки 0 или 1, могут давать большие коэффициенты. В работе А. Коэна, И. Добеши и П. Виала [53] описан способ трансформации вейвлет-бази-са L2(K) на основе вейвлета с компактным носителем в вейвлет-базис L2[0,1]. Вейвлеты, лежащие полностью внутри [0,1], оставляются без изменения, а остальные специальным образом модифицируются с сохранением числа нулевых моментов. Подробнее об алгоритме модификации можно прочесть в оригинальной статье [53] или книгах [5, разд. 10.7] и [13, разд. 7.5]. См. также работу Д. Доиохо [57]. Предположение о регулярности /: будем считать, что функция / кусочно регулярна, т. е. отрезок [0,1] разбивается на конечное число отрезков (скажем, К), на каждом из которых / равномерно регулярна по Липшицу с некоторым показателем регулярности. Также будем считать, что минимальный показатель равномерной регулярности равен а \. Пусть отрезок [0,1] разбит на N = 2J равных частей, и значения / вычислены в точках отсчета. Вейвлет-преобразование может быть вычислено только для 2 J s 1. На практике нередко бывает удобно нормировать длину отрезка разбиения и рассматривать вместо / ее «растянутую» версию - функцию f(Nx,Ny) = fix,у). Тогда для вейвлет-коэффициентов функции / справедливо равенство Заметим, что при работе с «растянутой» функцией «растягиваются» и вейвлет-функции. Если / является равномерно регулярной по Липшицу с параметром а т, а используемый вейвлет имеет т нулевых моментов, то с учетом (1.5) получим почти для всех коэффициентов. Число коэффициентов, для которых это может быть не выполнено, имеет порядок № , а — rj \, так как это коэффициенты, вычисленные на грубых масштабах (на уровнях j п) Кроме того, на границах отрезков равномерной регулярности также возможно появление больших вейвлет-коэффициентов. Но если используются вейвлеты с компактным носителем размера /, то на каждом уровне разложения больших коэффициентом будет не более, чем (К — 1)1, всего же таких коэффициентов порядка J, т. е. порядка log2 N. Используя вейвлеты с компактным носителем, из дискретизованного сигнала размера N — 2J получаем iV коэффициентов, 1 коэффициент аппроксимации и N — 1 коэффициентов деталей или вейвлет-коэффициентов (см. (1.3)). Отметим, что вейвлет-преобразо-вание можно представить в виде умножения на ортогональную матрицу W: Предполагается, что коэффициенты разложения функции / непрерывного аргумента могут быть вычислены точно по значениям f. В работах [57, 63, 64] обсуждается, почему такое предположение вполне обосновано. Коэффициенты f\y являются коэффициентами растянутой версии /, т. е. равны VN(Wf) (2-J ,2--»fc). На практике в сигнале всегда присутствует шум, поэтому приходим к следующей задаче: имеются наблюдения X, состоящие из полезного неслучайного сигнала f и некоррелированного гауссовского шума є с нулевым средним и дисперсией т2 (аддитивный шум): Необходимо оценить f по X. Параметр а практически всегда неизвестен, для него существует лишь некоторый разумный диапазон. После применения вейвлет-преобразования имеем: где Є-w также является некоррелированным гауссовским шумом с нулевым средним и дисперсией о-2. Использование пороговой обработки вейвлет-коэффициентов позволяет получить меньший порядок среднеквадратичной ошибки, чем при оценивании классическими линейными методами (см. [13, 60]). Смысл пороговой обработки: оставить лишь достаточно большие коэффициенты и удалить все остальные. Коэффициенты, не превышающие некоторого порога, считаются коэффициентами шума. Величина порога определяется параметрами шума и свойствами полезного сигнала. В этом подразделе будет введено понятие пороговой обработки, риска такой обработки и дан краткий обзор существующих результатов в области пороговой обработки. Пороговая обработка характеризуется пороговой функцией р(х, Т) и порогом Г. В качестве аргумента в пороговую функцию подставляются вейвлет-коэффициенты Х /. Простейшая пороговая обработка - жесткая пороговая обработка: I 0 при ж Т, где Т - порог. Такая пороговая обработка является естественной для задачи сжатия чистого сигнала. Однако функция рн{х,Т) разрывна, что ведет к некоторым нежелательным последствиям, как практическим (видимые артефакты), так и теоретическим (обсуждаются ниже). Поэтому на практике обычно используют мягкую пороговую обработку с непрерывной пороговой функцией ps(x,T):
В такой пороговой обработке учитывается наличие шума - амплитуда коэффициента понижается на величину порога, которая обычно зависит от дисперсии шума. Можно использовать и другие пороговые функции р, например, в работе [72] использована т. н. полумягкая пороговая функция (semisoft или firm)
Сходимость по распределению оценки риска при оцениваемой дисперсии шума
Для оценки вклада больших коэффициентов заметим, что модуль этого вклада можно оценить сверху следующим образом (Сі и С 2 - некоторые константы, не зависящие от N):
Поэтому при делении на y/N имеем последовательность с. в. вида Ъ д2, где bjy — 0 и т2 — а1 при N —У оо. Поэтому эта последовательность сходится по вероятности к нулю.
Непосредственно утверждение теоремы элементарно доказывается с помощью метода характеристических функций и свойства воспроизводимости нормального закона. Замечание. При использовании оценки стандартного отклонения шума доказательство легко модифицируется. Вместо Р (а2 (1 — 7JV)20"2) надо рассматривать Р (а (1 — 7лг)")) результат теоремы останется верным. Понятно, что если распределение оценки дисперсии слабо сходится к некоторому пределу, но при нормировочном множителе порядка 0 а , то распределение оценки риска при делении на iV1-0 будет слабо сходиться к тому же пределу. Причем в этом случае даже не требуется независимости Xvyfz] и а2. Обычно дисперсия шума оценивается по наблюдениям Xw, но ее можно оценивать и по независимой выборке. Например, сначала провести измерение нулевого полезного сигнала, тогда в качестве наблюдений X будет выступать чистый шум е. Затем оценить дисперсию этого шума и использовать полученную оценку для работы с ненулевым полезным сигналом. При таком подходе предполагается, что шум вносится измерительным прибором, и вносимые им погрешности не зависят от исследуемого полезного сигнала, а определяются только параметрами прибора. В теоремах 1.4-1.7 наложены некоторые ограничения на оценку дисперсии, и естественно поставить вопрос о том, какие конкретно оценки можно использовать. В данном разделе рассмотрено несколько примеров таких оценок. Кроме того, дисперсия шума может оцениваться непосредственно по самим вейвлет-коэффициентам. В этом случае для трех конкретных оценок дисперсии шума получены предельные распределения оценки риска. Обоснование соотношений (1.35) можно найти соответственно в работе П. Бикела [40] и монографии М. Дж. Кендалла и А. Стьюарта [8, гл. 10]. Используя результаты [40], четвертый момент а2 можно оценить как сг4 + о(1). Обозначим для краткости Здесь учтено, что if,? (С т,2 ) — ф (Сл ) /& Обозначив предельную дисперсию в (1.36) через d2, получим, что Значит, если М имеет порядок роста N, то для оценок а2 и of справедливы теоремы 1.4-1.6. Если к тому же оценки а2 и о\ не зависят от Х у, то справедлива и теорема 1.7. Получаем, что при использовании оценки на основе S2 в теореме 1.7 дисперсия предельного распределения оценки риска будет равна 2. А при использовании оценки на основе интерквартильного размаха дисперсия предельного распределения оценки риска равна Заметим, что (1.37) можно показать, используя одну из теорем непрерывности (см., например, книгу А. А. Боровкова [4, разд. 1.5]): у ( х2) = а2, у (сг) = 2 т, л/Ш (у(а2) — у(сг)) = N (0, (у ((г)) d2). В англоязычной литературе эти теоремы носят название Delta method (см., например, монографию А. В. ван дер Варта [112, гл. 3]). Условию теоремы 1.7 удовлетворяют ряд других робастных оценок, например, абсолютное медианное отклонение от медианы (MAD): и повторная медиана С med med \Z{ — ZA. Известно (см. работы [74, 77], а также [99, 107]), что эти оценки являются асимптотически нормальными и обладают максимально возможными пороговыми точками (см. книгу П. Хьюбера [26]). Константы С\ и Сч выбираются так, чтобы оценки сходились по вероятности к стандартному отклонению [105]. Например, в случае нормального распределения Известно (см. [74]), что семиинтерквартильный размах и абсолютное медианное отклонение от медианы асимптотически эквивалентны, а именно Отсюда получаем, что предельное распределение оценки риска при использовании оценки дисперсии шума на основе абсолютного медианного отклонения от медианы будет таким же, как и в случае использования оценки на основе интерквартильного размаха. Рассмотрим теперь случай, когда дисперсия оценивается по выборке Xw, а точнее по ее части. Обычно для вычисления оценки используются вейвлет-коэффициенты на самом мелком масштабе 2 1\ Можно считать, что на этом масштабе практически не содержится полезный сигнал, а присутствует только шум [60]. Математическим основанием такого предположения являются соотношения (1.5) и (1.6). Число таких коэффициентов равно М = N/2. Теорема 1.8. Пусть f задана на [0,1] и равномерно регулярна с показателем регулярности а . Пусть дисперсия шума оценивается по вейвлет-коэффициептам на последнем уровне разложения (j = J — 1) с помощью оценки а2. Пусть выбран порог Т — ал/2 In N, применяется мягкая или жесткая пороговая обработка и N —У со. Если использована оценка а2 на основе S2, то
Если использована оценка а2 на основе интерквартильного размаха или абсолютного медианного отклонения от медианы, то Доказательство. Доказательство разбито на две части. В первой части утверждение теоремы доказано, исходя из предположения, что вейвлет-коэффициенты на самом мелком масштабе имеют нормальное распределение с нулевым средним и дисперсией а2. Во второй части совершен переход к случаю, когда у каждого коэффициента свое, вообще говоря, не равное нулю математическое ожидание, но для всех математических ожиданий выполнено (1.6).
Асимптотика оценки риска при известной дисперсии шума
Электрокардиограмма (ЭКГ) является важнейшим инструментом диагностики различных сердечно-сосудистых заболеваний. ЭКГ представляется собой график изменения разности потенциалов, возникающих на поверхности тела в результате работы сердца. В структуре ЭКГ выделяют несколько волн: Р, Q, R, S, Т-волны (рисунок 3.1). Эти волны отражают различные состояния работы сердца. Разработан ряд качественных и количественных методик анализа ЭКГ, позволяющих делать выводы о здоровье пациента (см., например, работу А. В. Струтынского [21]). Нередко Q, R, S-волпы рассматривают как единое целое и называют QRS-комилексом.
К качественным критериям относится анализ формы волн, и здесь возникает задача удаления шума из кардиограммы для упрощения такого анализа. Эта задача эффективно решается с помощью вейвлет-разложения и пороговой обработки вейвлет-коэффициен-тов. Существуют сверхбыстрые алгоритмы прямого и обратного ДВП на основе вейвлетов с компактным носителем, требуемое число операций для их выполнения пропорционально числу отсчетов сигнала. Таким образом, одним из главных преимуществ техники вейвлетов является высокая скорость работы. При этом риск такой процедуры удаления шума можно оценить, применив результаты главы 1.
К количественным критериям анализа ЭКГ относится спектральный анализ ритмограммы. Ритмограмма строится по временам появления Д-пиков в ЭКГ. По оси абсцисс откладывают времена появления Л-пиков, а по оси ординат - разности между временами появления соседних і?-пиков (т. н. Ді?-интервальі). Была выявлена зависимость между наличием этих заболеваний и спектральными характеристиками ритмограммы [36, 93]. Для решения задачи построения ритмограммы также можно использовать вейвлеты. Пример ритмограммы приведен на рисунке 3.2. График электрокардиограммы построен для промежутка времени 78.75-125 сек, график ритмограммы - для пятиминутного промежутка 10-310 сек. Часть ритмограммы, соответствующая промежутку 78.75-125 сек, выделена пунктирными линиями.
При спектральном анализе ритмограммы возникает задача отсева паразитных импульсов (т. н. эктопических импульсов). На графике ритмограммы эти импульсы выглядят как резкие скачки вниз или вверх (см. рисунок 3.2). Кроме того, для спектрального анализа необходимо преобразование Фурье, адаптированное для случая неравномерных отсчетов.
Итак, задачи этой главы формулируются следующим образом. Решить задачу удаления шума из ЭКГ с помощью пороговой обработки с универсальным порогом коэффициентов ДВП, вычислить оценки риска пороговой обработки, провести сравнение с теоретическими значениями. По ЭКГ построить ритмограмму, используя НВП. Решить задачу отсева эктопических импульсов из ритмограммы. В подразделе 1.1.2 приведены утверждения 1.1-1.4, связывающие регулярность функции и поведение вейвлет-коэффициентов. Суть их такова: если функция равномерно регулярна на отрезке, то ее коэффициенты убывают к нулю с известной скоростью при уменьшении масштаба, т. е. выполнено (1-5). Если же условие равномерной регулярности нарушается, то неравенство (1.5), вообще говоря, не выполнено. Например, если функция имеет скачок в некоторой точке, то при фиксированном и достаточно малом масштабе s будет наблюдаться рост вейвлет-коэффициентов вблизи этой точки. Д-волну ЭКГ можно рассматривать как скачок. Было предложено множество способов нахождения R-пиков на основе поиска локальных максимумов вейвлет-коэффициентов. Например, в работе [90] были использованы вейвлет-сплайны, в работах [33, 86] использовался вейвлет Хаара. См. также обзорную статью [83]. В настоящей диссертации в качестве вейвлета выбрана «мексиканская шляпа». Такой выбор обусловлен формой этого вейвлета, хорошо повторяющей форму ф/ї5-комплекса. На рисунке 3.3 приведено НВП реальной ЭКГ. На масштабе 5 = 6 (здесь длина отсчета 74ЭКГ (вверху), ее НВП (посередине) и коэффициенты НВП на масштабе 6 (внизу). На верхнем графике по горизонтальной оси идут отсчеты ЭКГ (400 отсчетов в секунду), на двух других графиках - сдвиги НВП. На среднем графике темные области соответствуют малым по модулю коэффициентам, светлые - большим, а по вертикальной оси идут масштабы разложения времени нормирована и равна единице, минимальное значение масштаба s также равно единице) Я-пики абсолютно четко дают большие коэффициенты (см. также рисунок 3.4). Идея метода построения ритмограммы такова: 1. Вычисляются коэффициенты НВП на указанном масштабе. 2. Выбирается временнбе окно такой длины, чтобы в него всегда попадал хотя бы один Д-пик. В настоящей работе взято окно продолжительностью 2.5 сек (400 2.5 — 1000 отсчетов). Другими словами, предполагается, что за 2.5 секунды произойдет хотя бы один удар сердца. 3. В этом окне находится максимальный вейвлет-коэффициент и все локальные макси Коэффициенты НВП с рисунка 3.3 для масштабов s = 6,17 и сдвигов Ь = 1,250. В переднем сечении - первые 250 коэффициентов с нижнего графика рисунка 3.3 мумы, по величине составляющие не менее 50% от этого коэффициента. Считается, что это и есть те коэффициенты, которые дали Я-пики. Значение 50% подобрано эмпирически. 4. Временное окно сдвигается вправо, выполняется возврат к пункту 1, если не достигнут конец сигнала. Подробнее о вычислительных и других аспектах НВП см. в монографии А. А. Коронов-ского и А. Е. Храмова [10, гл. 1 и 2]. Таким образом, ритмограмма построена, пример использования описанного метода приведен на рисунке 3.2). Существует ряд рекомендаций относительно условий получения ритмограммы. Они устанавливают минимальную продолжительность измерений, при которой, во-первых, возможно вычислить спектр для определенного диапазона частот, и, во-вторых, спектральные характеристики будут постоянны (см. [93]). Однако в ритмограмме обычно присутствуют.
Доверительные интервалы для разностей ритмограммы
Теперь, имея оценки всех параметров модели, можно приступать непосредственно к фильтрации эктопических выбросов. Фильтрация производится во временной области на основе (3.2) и (3.3). Допустим, что а = 0.05, то есть доля несинусовых импульсов в сигнале не превышает 5%, что при пульсе 75 ударов в минуту означает не более 20 импульсов для пятиминутных записей. В качестве значения доверительного уровня возьмем 1 — 7.
Схема алгоритма представлена на рисунке 3.7. Первая точка ритмограммы должна относиться к синусовому ритму, это необходимо для правильной работы алгоритма.
Предположим, что до момента времени U-\ включительно ритмограмма отфильтрована, то есть последний из предшествующих синусовых интервалов соответствует моменту времени ti-i. Рассмотрим момент времени ij+fc, к - целое число. Начинаем со значения к = 0. Если разность RR(ti+k) — RR(U-i) попадает в доверительный интервал, построенный по формуле (3.3), то точка RR{ti+ ) соответствует модели (3.1), она объявляется синусовой, обновляются значения і и к: і = г + к + 1, к = 0. Выполняется переход к моменту времени U (і обновленное).
Если же разность в интервал не попала, то точка RR(ti+k) удаляется из ритмограммы как эктопический импульс. Далее А; увеличивается на единицу, и рассматривается момент ti+k (к - обновленное). Число к является счетчиком идущих подряд эктопических импульсов. Необходимо отметить, что обычно к 3, так что существенного увеличения доверительного интервала и, как следствие, ухудшения работы метода ожидать не стоит. Выясним, как робастная регрессия оценивает параметры модельной функции. В качестве таковой использовалась функция где e(t) Л/"(0,0.012), t = 1,2, ...,300. Коэффициенты выбраны близкими к тем, что получаются при анализе реальных данных. К этой функции добавлено 15 паразитных импульсов. Функция и амплитуда частотных компонент, оцененная методом робастной регрессии, приведена на рисунке 3.8. Пики выборочного спектра имеют абсциссы 0.1 Гц и 0.23 Гц, погрешности оценок соответствующих амплитуд равны 1.6% и 0.3%. Теперь рассмотрим результаты оценки спектральных характеристик реальных данных. На рисунке 3.9 приведена ритмограмма с рисунков 3.2 и 3.5, но предварительного ручного удаления эктопических импульсов, как на рисунке 3.5, не проводилось. Рассмотрим, как паразитные импульсы повлияли на оценку методом робастной регрессии. Погрешности оценки амплитуд низкочастотного и высокочастотного пиков составляют соответственно 4.0% и 11.6%. Абсциссы пиков отличаются соответственно на 0% и 1.3% (абсцисса низкочастотного пика равна 0.069 Гц; абсцисса высокочастотного пика равна 0.31 Гц в случае предварительной очистки ритмограммы и 0.306 Гц в случае использования применения робастной процедуры). В принципе, робастная оценка спектра позволяет достаточно точно . Исходная ритмограмма (вверху) и робастная оценка амплитуды частотных компонент (внизу). На верхнем графике по оси абсцисс отложено время в секундах, по оси ординат отложена длина /2Л-интервала в секундах. На нижнем графике ось абсцисс - частота в герцах оценить отношение максимальных амплитуд в НЧ и ВЧ областях и без отсева эктопических импульсов. Но отсеяв эктопические импульсы, можно оценить это отношение ещё более точно, причем без использования робастных процедур. Используя полученные значения частот и амплитуд, проводилась фильтрация ритмограммы путем построения доверительных интервалов для разностей. Доверительный уровень был выбран равным 95%, т.е. у = 0.05. Результаты представлены на рисунке 3.10. Отметим, что хотя границы доверительных интервалов объединены пунктирной линией, эта линия не является границей доверительной области с уровнем доверия не ниже 1 — 7 для кривой разностей ритмограммы. Как видим, все эктопические импульсы успешно удалены. Кроме того, были удалены три точки (56.58 сек, 114.7 сек и 201.2 сек), которые давали разности, немного выходящие за границы доверительного интервала. Такого эффекта можно избежать, уменьшив у, т. е. повысив доверительный уровень. Результаты третьей главы опубликованы в работах [16, 96]. В диссертационной работе получены свойства состоятельности и асимптотической нормальности оценки риска пороговой обработки вейвлет-коэффициентов. На защиту выносятся следующие результаты. 1. Обоснование состоятельности оценки риска в случае использования оценки дисперсии шума при прямом наблюдении объекта. 2. Обоснование асимптотической нормальности оценки риска при оценивании дисперсии шума по независимой выборке и по коэффициентам исследуемого сигнала. 3. Обоснование асимптотических свойств оценки риска пороговой обработки при использовании оценки дисперсии шума в задаче томографии. 4. Применение полученных результатов для оценки рисков при решении задачи очистки ЭКГ от шума. Метод отсева выбросов из ритмограмм на основе робастных процедур и компенсированного преобразования Фурье. Полученные результаты составляют основу для дальнейшей работы в данной области. Во-первых, для практического применения нормальной аппроксимации одного факта асимптотической нормальности оценки, вообще говоря, недостаточно. Необходимо выяснить скорость сходимости к предельному закону, т. е. выяснить порядок скорости и найти или оценить константы, входящие в остаточные члены. Во-вторых, представляет интерес случай негауссовского шума. Нередко на практике ошибки имеют распределение с более тяжелыми, чем у нормального распределения, хвостами, например, распределение Лапласа. Практический интерес представляет и случай зависимых случайных ошибок.