Содержание к диссертации
Введение
Глава I. Использование вейвлет-анализа при обнаружении и классификации некоторых типов событий на сигнале 17
1.1 Выбор вейвлета и нормировки 18
1.2 Вейвлет-образы характерных локальных изменений функции 24
1.3 Преимущества разномасштабного анализа в распознавании событий 27
1.4 Использование разномасштабного анализа при уточнении границ событий 38
Глава II. Решение задач многопараметрической оптимизации при помощи генетического алгоритма 44
2.1 Поиск экстремумов многоэкстремальной функции, заданной на многомерном множестве 44
2.2 Поиск оптимального набора параметров вейвлет-анализа с целью обнаружения событий 58
Глава III. Применение вейвлет-анализа и генетических алгоритмов в системах мониторинга и передачи информации 66
3.1 Архитектура АМФИКОМ: функциональные возможности, конфигурация, методика 66
3.2 Мониторинг волоконно-оптических линий связи на физическом уровне 71
3.3 Предобработка речевого сигнала 77
3.4 Сейсмологические наблюдения 80
Заключение 86
Литература 88
- Вейвлет-образы характерных локальных изменений функции
- Использование разномасштабного анализа при уточнении границ событий
- Поиск оптимального набора параметров вейвлет-анализа с целью обнаружения событий
- Мониторинг волоконно-оптических линий связи на физическом уровне
Введение к работе
Математическая обработка сигналов, получаемых в самых разнообразных формах представления с различного рода устройств — давно исследуемая и не теряющая актуальности задача, касающаяся многих отраслей человеческой деятельности. Несмотря на длительные исследования в этой области и достижение значительных успехов в тех или иных вопросах обработки, всегда существуют связанные с интерпретацией сигналов задачи, решение которых ещё не найдено или существует, но не удовлетворяет каким-либо требованиям. Так, например, при тестировании современными рефлектометрами волоконно-оптических линий связи (ВОЛС) отмечается [1] что:
высокая для человека трудоёмкость радиофизических измерений, особенно при их высокой точности, усложняет работу оператора оборудования;
- непосредственное участие оператора при проведении анализа данных исключает возможность работы в полностью автоматическом режиме без оператора;
- зависимость интерпретации результатов измерений от навыков оператора приводит к неоднозначности в выводах о состоянии линии связи.
Несмотря на значительные усилия со стороны ведущих производителей рефлектометрического оборудования, полностью сделать процесс контроля параметров ВОЛС автоматическим при удовлетворительном качестве обработки сигнала до сих пор не удавалось [2].
-4 Диссертация посвящена изучению возможности применения вейвлет-анализа [3-6] и оптимизационных генетических алгоритмов [7] для создания системы обработки радиофизической информации, способной в полностью автоматическом режиме справляться с задачей анализа некоторых типов сигналов: рефлектометрических, голосовых, сейсмических [8-12].
В настоящее время происходит активное развитее сравнительно нового направления в теории обработки сигналов, именуемое вейвлет-преобразованием [13]. Сам термин «вейвлет» был введён в 80х годах 20-го века в работе Гроссмана и Морле [14], исследовавших свойства акустических и сейсмических сигналов. В дальнейшем ряд учёных, таких как Добеши, Чуй, Мейер и другие, продолжили исследование в этой области [15].
В работе преследуется цель создания алгоритма автоматического выявления на сигнале событий и их последующей локализации с помощью вейвлет-анализа. который позволяет обнаруживать при небольшом числе ошибок в полностью автоматическом режиме своей работы типовые события на сигнале в широком диапазоне допустимых временных и амплитудных масштабов.
В последнее время в России отмечается повышение интереса к вейвлет- преобразованиям, что связано как с переводом большого числа тематической литературы, так и с активным развитием компьютерной техники, позволяющей при небольших материальных затратах проводить зачастую объёмные в вычислительном смысле исследования в данной области.
Являясь мощным и сложным механизмом анализа функций [31-40], вейвлет анализ включает в себя множество параметров, так или иначе влияющих на результат его работы [41]. Таким образом, качество работы вейвлет-анализа функции само является в широком смысле функцией своих параметров. С этой точки зрения можно рассматривать процесс улучшения качества такого анализа как поиск экстремума сложной функции, заданной на многомерном множестве. Точка глобального максимума такой функции будет являться оптимальным набором параметров, при котором вейвлет анализ справляется с поставленной задачей наиболее эффективно. В силу того, что в общем случае эта функция не обладает свойствами, которые обычно используются при поиске экстремумов функций, а также в силу вычислительной сложности этой функции, традиционными средствами такую задачу можно считать неразрешимой.
Однако развитие вычислительной мощности компьютеров, в частности и персональных, сделало возможным переход от чисто теоретических рассуждений к практической реализации такого рода оптимизационных алгоритмов, как генетические. Этот тип алгоритмов зачастую успешно справляется со сложными оптимизационными задачами, решение которых другими методами считается трудноосуществимым или вовсе невозможным [42-46]. К настоящему моменту даже обычный персональный компьютер позволяет при небольших материальных затратах проводить объёмные в вычислительном смысле исследования в данной области.
Идея генетического алгоритма для решения задач впервые была высказана Джоном Голландом из Мичиганского университета в 60-х годах 20-го века и получила признание после выхода в 1975 году в свет книги "Адаптация в естественных и искусственных системах" [43], ставшей классической в этой области. В дальнейшем Д.Голдберг выдвинул ряд идей, помогающих лучше понять природу генетических алгоритмов [42]. Существенный вклад в исследования в этом направлении внесли Дж.Грефенстетт, Г.Сесверда, а также ряд других исследователей.
Генетический алгоритм был получен в процессе обобщения и имитации в искусственных системах таких свойств живой природы, как естественный отбор, приспособляемость к изменяющимся условиям среды и наследование потомками жизненно важных свойств от родителей. Эти алгоритмы в различных формах применялись ко многим научным и техническим проблемам, например, использовались при создании автоматов или сетей сортировки. В машинном обучении они использовались при проектировании нейронных сетей или управлении роботами; применялись при моделировании развития в различных предметных областях, включая биологические (экология, иммунология и популяционная генетика) и социальные (экономические и политические) системы.
Одно из популярных приложений генетических алгоритмов — оптимизация многопараметрических функций. Многие реальные задачи могут быть сформулированы как поиск оптимального значения сложной функции, зависящей от некоторых входных параметров, количество которых зачастую бывает большим. В некоторых реальных постановках задач необходимо найти не точное наилучшее значение функции, а любое значение, которое лучше некоторой заданной величины. В этом случае, генетические алгоритмы - часто наиболее приемлемый метод для поиска значений, удовлетворяющих заданным требованиям. Так как алгоритм в процессе поиска использует некоторую кодировку множества параметров вместо самих параметров, то он может эффективно применяться для решения задач дискретной оптимизации, определённых как на числовых множествах, так и на конечных множествах произвольной природы. Поскольку для работы алгоритма в качестве информации об оптимизируемой функции используются лишь значения этой функции в рассматриваемых точках пространства поиска, и при этом не требуется вычислений ни производных, ни каких-либо других характеристик функции, то генетический алгоритм применим к широкому классу функций, в частности, не имеющих аналитического представления. Важным моментом в работе алгоритма является задание исходного набора начальных точек. Гибкость подхода в этом позволяет применять для формирования начального состояния алгоритма различные способы, учитывающие специфику решаемой задачи. Также возможно задание такого набора непосредственно человеком, который может иметь какие-то априорные денные о поставленной задаче, что обычно существенно ускоряет процесс поиска и способствует нахождению оптимального решения или решения, наиболее приближенного к оптимальному.
Сила генетических алгоритмов в том числе и в их способности манипулировать сразу многими параметрами. Достоинством также является и их гибкость: они могут быть реализованы даже если об оптимизируемой функции нам известен минимум информации.
Однако нередки случаи, когда генетический алгоритм работает не так эффективно, как можно было бы ожидать.
До настоящего времени не существует строгого ответа на вопрос, является ли генетический алгоритм хорошим методом для решения поставленной реальной задачи, сопряженной с поиском оптимального решения. Однако многие исследователи разделяют мнение, что генетический алгоритм будет иметь хорошие шансы стать эффективной процедурой поиска, идя на равных с другими методами [47-49], которые не используют априорные сведения о пространстве поиска, или даже превосходя их, если:
• пространство поиска, которое предстоит исследовать, большое;
• предполагается, что функция на пространстве поиска не является гладкой и унимодальной;
• функция зашумлена; задача не требует нахождения глобального экстремума, но необходимо достаточно быстро найти приемлемое "хорошее" решение (такая ситуация часто имеет место в реальных задачах).
Если же пространство поиска небольшое, то решение может быть найдено методом полного перебора, и можно быть уверенным, что найдено наилучшее решение, в то время как генетический алгоритм может с некоторой, хоть и небольшой, вероятностью сойтись к локальному экстремуму, а не к глобальному. Если функция гладкая и унимодальная, любой градиентный алгоритм, такой как, например, метод скорейшего спуска, будет более эффективен, чем генетический алгоритм. Если о пространстве поиска есть некоторая дополнительная информация, то методы поиска, использующие эти сведения, часто превосходят любой универсальный метод, каким является генетический алгоритм.
При достаточно сложном рельефе функции методы поиска с единственным решением в каждый момент времени, такой как, например, метод спуска, могут останавливаться в локальном решении. Считается, что генетический алгоритм по причине того, что он в каждый момент времени работает с целым набором решений, имеет меньше шансов сойтись к локальному экстремуму и приемлемо функционирует на многоэкстремальном ландшафте оптимизируемой функции [42].
Как показано практикой, генетический алгоритм успешно справляется с широким кругом проблем, особенно в тех задачах, где не существует общеизвестных алгоритмов решения [50]. Всё это делает указанный алгоритм хорошим выбором при поиске методов решений многих задач, в частности оптимизационного характера , которые возникают в широком круге вопросов, в том числе и таких, которые на первый взгляд с оптимизацией напрямую не связаны [51]. Одно из возможных применений генетического алгоритма в задаче оптимизационного характера продемонстрировано в рамках анализа сигналов при поиске наилучшего сочетания параметров вейвлет анализа, который используется для выявления и анализа особенностей в сигнале [52].
В настоящей работе поставлены следующие цели:
1. Разработка метода обработки сигналов с характерными особенностями типа «скачок функции Хэвисайда» для автоматического выявления изменения физических параметров сред распространения сигналов, как, например, деградация оптоволокна, появление в нём микротрещин, обнаружение фактов несанкционированного подключения к оптической линии связи и т.д
2. Оптимизация разработанного метода с целью улучшения качества распознавания и локализации таких особенностей.
3. Адаптация метода к реальным условиям, характеризующимся жёсткими требованиями к точности и скорости автоматической обработки существующих сигналов.
Для достижения этих целей решены следующие задачи:
1. Исследование поведения вейвлет-образов при разных типах вейвлетов и нормировки на сигналах с событиями вида «функция Хэвисайда».
2. Решение задачи выбора оптимальных параметров вейвлет-анализа исходя из априорно поставленных требований.
3. Разработка численного алгоритма оптимизации многопараметрических функций, возникших в ходе выполнения вейвлет-анализа сигналов.
4. Совместное применение разработанного алгоритма оптимизации и вейвлет-анализа для достижения наилучшего качества результата обработки сигналов с особенностями вида «функция Хэвисайда».
Методами исследования, использованными в настоящей работе, являются
1. Сравнение Фурье-спектров различных вейвлетов .
2. Исследование влияния выбранного вида вейвлета и нормировки на вейвлет-образ исследуемого сигнала с помощью аналитических и численных расчётов, проведённых для некоторых характерных видов сигналов.
3. Проведение вычислительного эксперимента с целью создания подходящего алгоритма поиска экстремумов многопараметрической функции.
4. Проведение численной оптимизации параметров вейвлет-анализа на основе базы данных рефлектометрических сигналов, снятых с тестируемых волоконно-оптических линий, посредством разработанного алгоритма поиска экстремумов многопараметрических функций.
В первой главе настоящей диссертационной работы описываются соображения выбора типа вейвлета и нормировки, принципы обнаружения с помощью вейвлетов событий на сигнале, методы автоматического определения их масштаба и максимального уточнения локализации событий.
Во второй главе приведены принципы работы оптимизационного алгоритма, и показан пример его применения для поиска оптимального набора параметров, влияющих на качество вейвлет-анализа.
Третья глава посвящена описанию уже существующего применения разработанной методики анализа сигналов, описаны достоинства, которые свойственны использованию такого подхода. Рассмотрены примеры возможного применения разработанного метода в различных областях науки, где анализ сигналов по схожим критериям является важной составляющей обработки данных.
Научная новизна настоящей работы:
1. Разработан метод численного нахождения амплитуды и точного расположения событий типа «скачок функции Хэвисайда» и его суперпозиции на сигналах с низким значением отношения сигнал-шум, с неизвестными наперёд пространственными и амплитудными масштабами этих событий при помощи вейвлет-анализа.
2. Отработана методика эффективного использования генетического алгоритма в контексте многопараметрической оптимизации анализа для поставленной задачи вейвлет-обработки сигналов.
3. Впервые, насколько известно автору, совместно использованы достоинства вейвлет-анализа и генетического алгоритма для решения поставленной задачи анализа сигналов. Показано, что такое сочетание методов способно в полностью автоматическом режиме при небольших вычислительных затратах давать результат, превышающий по качеству вейвлет-анализ, проводимый человеком в неавтоматическом режиме.
Практическая значимость работы:
Разработанный подход к анализу сигналов может быть использован в различных системах обработки информации, не требуя постоянного присутствия оператора, что позволяет проводить анализ поступающей информации в круглосуточном режиме.
При мониторинге физического состояния среды передачи данных применение подобной методики обработки тестовых сигналов улучшает качество работы служб передачи информации. Проведение анализа тестовых данных в полностью автоматическом режиме способствует также своевременному обнаружению даже некритических отклонений в сетях передачи информации, что позволяет принимать превентивные меры по восстановлению свойств информационной линии до наступления отказа в работе системы передачи данных, повышая её надёжность [53]. Периодическое круглосуточное непрерывное тестирование, интервал и регулярность которого могут быть приемлемыми только при работе в полностью автоматическом режиме, способствует также и оперативному обнаружению попыток несанкционированного доступа в таких сетях, что повышает их общую защищённость и способствует повышению конфиденциальности передаваемых данных.
Реализация и внедрение результатов работы.
Алгоритм автоматического вейвлет-анализа и оптимизационные алгоритмы на основе генетического подхода успешно используются в системе AMFICOM - Автоматизированного Многофункционального Интегрированного Комплекса Объектного Мониторинга - контроля состояния ВОЛС на существующих сетях передачи данных.
Апробация работы.
О результатах работы сообщалось на конференциях в виде трёх докладов [50, 52, 54].
Результаты исследований опубликованы в шести печатных работах, в том числе трёх тезисах. [41, 51, 55].
Разработанная методика анализа радиофизических сигналов используется в системе автоматизированного многофункционального интегрированного комплекса объектного мониторинга АМФИКОМ (акт о внедернии см. в приложении ).
На защиту выносятся следующие положения:
1. Впервые показано, что сочетание метода вейвлет анализа со специальной введённой нормировкой позволяет определить и точно локализовать особенности сигналов типа «функция Хэвисайда» даже в случае низкого значения соотношения сигнал-шум.
2. Алгоритм автоматического обнаружения и локализации событий позволяет точно выявлять типовые события, такие как суперпозиция функций типа функция Хэвисайда, на сигнале в широком диапазоне временных и амплитудных масштабов, что позволяет констатировать факт изменения физических характеристик сред передачи информации.
3. Показана целесообразность использования метода оптимизации на основе генетического алгоритма, который позволяет за небольшое время автоматически настраивать параметры вейвлет анализа, повышая его эффективность. Это делает возможным использование предложенной методики обработки сигналов в полностью автоматическом режиме при высоком качестве анализа и интерпретации данных. Эффективность предложенной методики доказана на примере её внедрения в систему мониторинга на существующих оптоволоконных сетях.
Вейвлет-образы характерных локальных изменений функции
Данное событие названо так в силу того, что оно может рассматриваться в виде следующих друг за другом локального возрастания и убывания функции, позволяя в дальнейшем сосредоточиться на распознавании именно этих особенностей.
Событие такого типа представляет совокупность из трёх следующих друг за другом событий «возрастание-убывание-возрастание» либо «убывание-возрастание-убывание» и поэтому может быть разложено на эти элементарные составляющие. График и вейвлет-образ такого события представлены на рис.9.
Отметим, что на событии «локальное убывание», как и на событии «локальное возрастание», максимальное значение вейвлет-образа зависит от соотношения масштабов, на котором происходит резкое изменение - скачок, и носителя вейвлета. Видно, что сначала при больших масштабах вейвлета максимальное значение вейвлет-образа невелико, затем, при примерном совпадении масштабов вейвлета и события, значение вейвлет-образа достигает максимума, а затем, при дальнейшем уменьшении масштаба вейвлета, опять уменьшается. В экстремуме значение вейвлет-образа в наибольшей степени соответствует величине скачка функции. Такой способ определения величин перепадов во многих случаях является более точным, чем, например, метод, основанный на построении лини по критерию минимизации среднеквадратичного отклонения, так как в этом случае не всегда понятно по какому набору точек можно было бы сделать вывод об изменении значения функции в автоматическом режиме.
На рис.10 хорошо видно, что даже при наличии значительных шумов вейвлет-анализ точно передает величину перепада функции, примерно равную в данном примере 0.25, что в пределах точности измерений совпадает со значением 0.248, полученным с помощью вейвлет-преобразования.Оценим влияние крутизны нарастания функции на вейвлет-образ при описанных выше условиях, принимая, что локальное возрастание функции имеет вид, представленный на рис. 11 сверху.
Для этого рассмотрим, как будет изменяться значение максимума вейвлет-образа от соотношения масштаба области изменения значения функции и масштаба носителя вейвлета.
Введём множитель Ь, показывающий, во сколько раз носитель вейвлета имеет большую длину, чем интервал изменения функции, равный 21. В принятых обозначениях вейвлет будет задаваться функцией \lb j w{b) = sin При Ъ = 1 ширина вейвлета будет совпадать с длиной интервала, на котором происходит изменение значения функции (на рис.11 приведён случай 6 = 1)
В силу симметрии, очевидно, что множество точек, в которых значение вейвлет-образа будет достигать максимум/содержит точку «ноль». При этом возможны два варианта: - ширина вейвлета больше ширины интервала, на котором происходит изменение анализируемой функции; - ширина вейвлета равна или меньше ширины этого интервала. Здесь максимум вейвлет-образа достигается при ширине вейвлета, стремящейся к бесконечности, а половина перепада значения функции - при ширине равной протяжённости интервала, на котором происходит изменение функции. Для остальных типов изменения функции результат незначительно отличается от полученного аналитически. На рис.13 приведены результаты численного интегрирования (нормированной на величину перепада функции вейвлет-образа) трёх различных функций события "локальное возрастание", где: цифрой «1» обозначен функция представленная на рис.13, а именно 1 Из приведённых на рис. 13 графиков видно, что различия во влиянии типа перепада на погрешность определения с помощью вейвлет-образа величины перепада при разных типах перепада небольшие. Это позволяет применять общую методику измерения величины перепада вне зависимости от формы этого перепада.
Очевидно, что в силу возможного присутствия событий, находящихся близко к анализируемой в данный момент особенности, вейвлеты большой ширины не могут быть эффективно использованы.
Поэтому на практике всегда следует искать компромисс между размером области локализации события и размером носителя вейвлета, а значит и значением вейвлет-образа.
Разумным представляется масштаб, равный по ширине размеру интервала, на котором функция меняет своё значение. В этом случае влияние близлежащих особенностей функции на результат анализа функции в выбранной точке минимален. Однако, априорная информация о длине такого интервала, как правило, отсутствует. В связи с этим для нахождения оптимального масштаба вейвлета и выявления протяжённости события следует искать такую функцию р{Ь) от масштабного коэффициента Ъ, которая, во-первых, вблизи нуля и на бесконечности должна расти быстрее, чем функции, 1, Mb) приведенные на рис.13, а во-вторых, максимум отношения —— для нее должен находиться примерно на масштабе искомого события.
Использование разномасштабного анализа при уточнении границ событий
Как видно из представленных в логарифмическом масштабе графиков, на бесконечности, как и следовало ожидать, функции стремятся к нулю, а вблизи нуля растут «почти линейно», достигая максимума на масштабе чблизком к масштабу события. При этом подробное рассмотрение показывает, что максимум для этих функций наиболее ярко в смысле значения второй производной выражен при а « 0.6 (особенно хорошо это заметно на рис.16 по функции типа «1», максимум которой достигается при 1п(6)«0.45, т.е. при b «1.5). А значит, находить этот экстремум численным методом будет легче всего именно при а -0.6.
Таким образом, алгоритм нахождения события — локального возрастания или убывания функции — по изменениям ее вейвлет-образа при многомасштабном анализе формулируется следующим образом:
Изначально выбирается самый мелкий из разумных для рассматриваемых событий масштаб вейвлета, проводится анализ всплесков полученных вейвлет-образов, а затем определяется их расположение, знак и амплитуда. Всплески с амплитудой ниже некоторой пороговой wlhKS, которая устанавливается заранее, не рассматриваются. Всплески на самом мелком масштабе, если только они будут обнаружены, обеспечивают максимальную детализацию событий. Однако не все всплески могут быть обнаружены на самом мелком масштабе. Последнее связано с тем, что, не все всплески, которые обнаруживаются на данном масштабе, могут быть использованы для дальнейшего анализа, так как необоснованно мелкий масштаб ухудшает «распознаваемость» всплесков при определенном соотношении сигнал-шум. С другой стороны, на слишком большом масштабе вейвлета амплитуда вейвлет-образа анализируемой особенности начинает зависеть от граничащих с ней других особенностей функции. Поэтому, при выборе оптимального масштаба для каждого конкретного выявленного всплеска вейвлет-образа следует использовать критерий максимума функции /(6) = 2fLJ.5 Гдер(Ь) = Ьа и а = 0.6. Разумно наложить и условие того, РФ) что всплеск по своему расположению не перекрывает другие всплески, определенные на меньших масштабах. 2. Далее по мере увеличения масштаба вейвлета, производится сравнение списка всплесков JV,., определенных при новом масштабном коэффициенте Ъп, с текущим списком всплесков С. 3. Каждое событие «нового» списка N, сверяется со списком С и если N, не пересекается ни с каким всплеском С, то всплеск N( добавляется в список С. В противном случае: если Nt пересекается более чем с одним всплеском списка С, то считается, что новый масштаб уже слишком груб, и действия по изменению С не предпринимаются; если iV, пересекается ровно с одним всплеском Сj из набора С, а Су пересекается только с N,, то С заменяется на Nn если отношение /(b) = - -, для N, выше, чем для С j; если iV(. пересекает ровно один всплеск Сj, а С; пересекается с несколькими всплесками из JV, то действия по модификации текущего списка С не предпринимаются, т.к. такая ситуация неоднозначна для разрешения. 4. В качестве окончательного списка всплесков вейвлет-образа используется список С, сформированный к моменту окончания обработки всех масштабов, на которых производится анализ. Наличие всплеска констатируется по превышению значения вейвлет-образа некоторого выбранного значения wlhres. То есть при введении с целью поиска событий величины wthres, называемой пороговым значением события, становится возможным констатировать факт наличия события и управлять чувствительностью рассмотренного метода.
Превышение значения вейвлет-образа порогового значения wthHS позволяет судить о положении этого события на графике функции лишь примерно, поэтому, с целью уточнения границ событий, возникает необходимость более детального анализа, посредством разномасштабных вейвлетов.
Для наглядности рассмотрим процесс уточнения границ события с использованием разномасштабного вейвлет-анализа на примере умеренно зашумленного сигнала, принимая во внимание, что последующие рассуждения справедливы и в случаях более высоких уровней шумов.
Выберем для анализа событие «локальное убывание» и рассмотрим его вейвлет-образ (рис.17), где белой линией обозначена изолиния с пороговым значением wlhlvx.
С целью наглядности представления области чувствительности вейвлета к изменению функции в окрестности анализируемой точки, проведём на изображении вейвлет-образа прямые под углом 45 , определяемым из равенства масштабов длины по вертикальной и горизонтальной оси (рис.18).
Поиск оптимального набора параметров вейвлет-анализа с целью обнаружения событий
В качестве примера рассмотрим задачу поиска оптимального набора параметров вейвлет-анализа функциональных зависимостей с целью обнаружения на них локальных особенностей (в терминах [55] — событий). Используемыми при этом параметрами могут быть, например: - пороговое значение, при значении вейвлет-образа сигнала ниже которого констатируется отсутствие каких-либо событий на данном участке сигнала - пороговое значение, определяющее минимальное значение вейвлет-всплеска, при превышении которого вейвлет-образом функции этот участок функции начинает подробно анализироваться на принадлежность к одному из типов событий; - пороговое значение, определяющее минимальное значение вейвлет-всплеска, при превышении которого вейвлет-образом функции сигнал в данном месте начинает подробно анализироваться на принадлежность к событию другого типа (в общем случае типов событий может быть много); - пороговое значение, определяющее минимальное значение амплитуды вейвлет-всплеска, для начала анализа на предмет принадлежности к событию типа «конец функции»; - множитель, определяющий чувствительность метода к случайным отклонениям - «шумам» функции - показатель геометрической прогрессии, членами которой являются характерные масштабы вейвлета при многомасштабном анализе. В зависимости от целей анализа количество параметров может доходить до двузначных значений.
Качество анализа определяется, как мера того, насколько алгоритм максимально правильно распознал события в тестовом сигнале. Мера качества анализа была реализована с помощью штрафов, которые и необходимо минимизировать. Таким образом, функция штрафа и является функцией, у которой и следует искать экстремум генетическим алгоритмом. Штрафы вводятся, например, за то, что событие не было найдено, за ложное обнаружение события, за ошибочное определение типа события, а также за неточности определения границ события. В качестве обучающего примера при сравнении использовался предварительно проведённый и скорректированный человеком анализ сигнала. Ответ на вопрос, как именно должны соотноситься между собой штрафы за каждое из подобных отклонений, зависит от целей анализа, а значения штрафов имеют смысл лишь по порядку величины.
В работе использовалась база данных с реальными тестовыми сигналами, снятыми с более чем шестидесяти оптических линий связи, записи с которых затем были обработаны и проанализированы при участии человека, а затем приняты в качестве эталона распознавания. Входными данными алгоритма, работающего с базой данных, является набор параметров анализа. Результатом работы алгоритма на выходе является число - среднее значение штрафа, которое и является функцией, определяющей качество полученного решения.
Рассмотрим изменение результата при изменении отдельных параметров в области их определения в окрестности точки, которая по результатам анализа с участием человека была взята в качестве оптимальной, а также приведем изменение значение функции штрафа вдоль выделенного направления. Для этого зафиксируем все параметры и будем менять только один, откладывая по горизонтальной оси значение множителя, показывающего во сколько раз изменился параметр, а по вертикальной — среднее значение штрафа (рис.25).
Зависимости функции штрафа при изменении двух других параметров, полученные аналогичным образом, приведены на рис.26.
Из этих графиков, как и следовало ожидать, видно, что штраф минимален при значении множителя, равном единице. Это свидетельствует в пользу предположения о том, что значения параметров, выбранных человеком, по-видимому, оптимальны.
Как уже отмечалось выше, распознавание более чувствительно к изменениям одних параметров в области их определения, и менее чувствительно к изменению других, что также хорошо видно из приведенных графиков. При этом даже если бы функции были гладкими, подобная картина означала бы наличие «оврагов», которые, как известно, является проблемой в задачах поиска экстремумов. Из данных графиков, полученных для первого и для второго параметров, видно также, что функция не является выпуклой и представляет собой немонотонную зависимость значения «качество анализа» от некоторых из своих параметров, а возможно и всех. Третий график содержит большое количество протяжённых «плато» -участков, где значение функции не меняется. Это, как известно, усложняет задачу поиска оптимальных значений параметров в целом и делает невозможным применение, в частности, градиентных методов поиска экстремума для этой зависимости.
Указанные особенности поведения функции качества на множестве своего определения и привели к идее использования генетического алгоритма, который, как было показано выше, успешно справляется с перечисленными трудностями .
Мониторинг волоконно-оптических линий связи на физическом уровне
Одной из задач анализа речевого сигнала на этапе его предобработки является выделение момента начала речи, особенно на фоне значительных шумов. Например, при передаче речевого сигнала по цифровым телефонным сетям необходимо как можно точнее распознать момент возникновения полезного сигнала, который, в отличие от шума, имеет смысл оцифровывать и передавать принимающей стороне. Неточности в решении подобного рода задачи приводят либо к искажению речи при слишком позднем включении АЦП, либо к излишней загрузке линии передачи информации в случае, если шум ошибочно принимается за речевой сигнал и оцифровывается.
Вейвлеты, как средство многомасштабного анализа, позволяют выделять и точно локализовывать одновременно как базовые характеристики такого сигнала (основную гармонику), так и его короткоживущие высокочастотные колебания. Получение дополнительной информации с разных масштабов времени и разных масштабов разрешения сигнала может улучшить точность распознавания речи. Кроме того, считается [15], что человеческое ухо устроено так, что при обработке звукового сигнала, оно передает мозгу именно вейвлет-образ сигнала. Колебания амплитуды давления передаются от барабанных перепонок на мембрану и далее распространяются по всей длине завитка внутреннего уха. При этом можно показать, что результирующее преобразование сигнала будет с точностью до константы совпадать с вейвлет-преобразованием.
Механизм выделения событий на сигнале с помощью вейвлетов, как показала практика, может быть применён и для задач, связанных с обработкой речевых сигналов.
Проведём вейвлет преобразование приведенного фрагмента реального речевого сигнала и применим описанный в данной работе алгоритм выделения начала события для определения момента t0, который следует считать началом речи (рис.34). Белые изолинии на вейвлет-образе соответствуют некоторому выбранному пороговому уровню. Момент времени /0 находится как координата по горизонтальной оси, при которой вейвлет образ на некотором масштабе впервые превышает пороговое значение. Величина порогового значения устанавливается заранее и определяет уровень чувствительности метода.
Параметры вейвлет-анализа, включая и указанный пороговый уровень, как уже отмечалось, могут быть подобраны оптимально в рамках данной задачи с помощью описанной выше процедуры оптимизации.
На рис.34 /-время, /( -функция голосового сигнала, а — ось масштаба, вейвлета, при этом одна клетка вспомогательной сетки оси временисоответствует пяти миллисекундам (50 делений горизонтальной шкалы). Таким образом, точность автоматического распознавания начала информативной составляющей сигнала в приведённом примере соответствует примерно одной миллисекунде, что с большим запасом превышает требования, предъявляемые человеком к речевому сигналу для уверенного распознавания произносимого текста. Следовательно, описанный механизм предобработки сигнала может быть полезен при решении задач повышения качества передачи речевых сообщений.
Сейсмология включает в себя измерения, которые требуют ведения наблюдений различного типа, включая мониторинг состояния земной коры, осуществляемый сейсмическими станциями, которые регистрируют с помощью сейсмографов колебания земной поверхности, вызываемые землетрясениями. Полученные записи (сейсмограммы) проходят первичную обработку на сейсмической станции и затем направляются по каналам связи в соответствующие центры обработки, где служат исходными данными для составления сейсмологических бюллетеней [56].
Сейсмические станции в основном предназначены для регистрации сейсмических сигналов на эпицентральном расстоянии свыше 2000 км, для чего они снабжаются стандартной аппаратурой: короткопериодными сейсмографами высокой чувствительности в полосе пропускания 10—0,7 Гц; широкополосными сейсмографами средней чувствительности с полосой пропускания 10—0,05 Гц; длиннопериодными сейсмографами средней чувствительности с полосой пропускания 0,2—0,015 Гц.
Региональные сейсмические станции предназначены для регистрации близких землетрясений с эпицентральными расстояниями до 2000 км. Эти станции оснащены короткопериодной аппаратурой, а также регистрируют сильные движения в полосе пропускания 10—0,1 Гц.
Все сейсмологические станции мира ведут регистрацию землетрясений по единому средне-гринвичскому времени и проводят первичную обработку сейсмограмм, в которых очень важно точное измерение момента вступлений различных сейсмических волн и их динамических параметров. В связи с этим, точная локализация события «начало сигнала» представляет высокую ценность в этой области измерений.