Содержание к диссертации
Введение
Глава 1 Обзор методов решения обратной задачи спектрометрии 12
1.1 Методы обработки непрерывных спектров 15
1.2 Методы обработки дискретных спектров 18
1.3 Выводы по главе 20
Глава 2 Разработка методики восстановления непрерывных спектров 22
2.1 Отличие измеренных спектров от истинных 22
2.2 Аппаратные функции спектральных приборов 22
2.3 Математическое описание обратной задачи спектрометрии 30
2.4 Метод регуляризации Тихонова 31
2.5 Способ вычислительных экспериментов 35
2.6 Численный алгоритм 39
2.7 Метод регуляризации для уравнения типа свертки 40
2.8 Выводы по главе 43
Глава 3 Разработка методики восстановления дискретных спектров 44
3.1 Математическое описание обратной задачи спектрометрии 44
3.2 Алгоритм интегральной аппроксимации 46
3.3 Выводы по главе 48
Глава 4 Исследование и апробация разработанных методик восстановления непрерывных и дискретных спектров 49
4.1 Исследование разработанной методики восстановления непрерывных спектров с помощью математического моделирования 49
4.2 Апробация разработанной методики восстановления непрерывных спектров на реальном спектре 81
4.3 Апробация разработанной методики восстановления непрерывных спектров в случае разностной аппаратной функции 87
4.4 Апробация разработанной методики восстановления дискретных спектров с помощью математического моделирования 93
4.5 Апробация разработанной методики восстановления дискретных спектров на реальном спектре 102
4.6 Использование интерполяции данных 107
4.7 Выводы по главе 109
Заключение 110
Список литературы 111
- Методы обработки дискретных спектров
- Математическое описание обратной задачи спектрометрии
- Алгоритм интегральной аппроксимации
- Апробация разработанной методики восстановления непрерывных спектров в случае разностной аппаратной функции
Методы обработки дискретных спектров
По результатам теоретического исследования, проведенного в данной главе, разработана методика и программное обеспечение для восстановления непрерывных спектров. Особое внимание в методике уделено способу выбора параметра регуляризации – предложен оригинальный способ модельный, или обучающих, спектров. Для окончательного обоснования методики необходимо выполнить ее исследование и апробацию с помощью математического моделирования и на реальных спектрах.
В данной главе рассматривается случай дискретного (линейчатого) спектра, когда искомый спектр z() состоит из отдельных дискретных (монохроматических) линий, характеризуемых их частотами ,- и амплитудами z, (рисунок 14). К таким спектрам можно отнести спектры вибраций двигателей машин и оборудования. Погрешности изготовления деталей оборудования, температурные изменения, изменения вязкости смазки, нестабильность оборотов вала двигателя приводят к флуктуациям амплитуд и размытию дискретных линий вибрационного спектра [12]. Дискретный спектр также имеют, например, рассеянные межзвездные туманности и низкотемпературная, в частности, газоразрядная плазма и т.д.
В случае дискретного спектра измеренное значение амплитуды (интенсивности) и() при настройке спектрометра на некоторую частоту равно сумме амплитуд (интенсивностей) всех линий с весовой функцией, равной аппаратной функции (АФ) спектрометра (рисунок 14), т.е.
Выражение (49) является математической моделью экспериментального дискретного спектра. Настраивая спектрометр на различные частты и учитывая зашумленность измерений, можно получить математическое описание обратной задачи спектрометрии: где i - дискретный отсчет , т - число таких отсчетов, [с, d] - диапазон настраиваемых частот, u(Vj) = u(Vj) + 5w(vz), и - случайная компонента шума измерений, F - детерминированная компонента шума (фон) (рисунок 14).
В (50) известны (измерены или заданы) (v,-), К(у, v}), ,-, c, d, m, а искомыми являются Zj, /, n, F - амплитуды и частты линий, их число, а также детерминированная компонента шума. Соотношение (50) есть система линейно-нелинейных уравнений (СЛНУ), поскольку часть неизвестных (z, и F) входит линейно, а часть (,-0 - нелинейно.
Такую систему большинство авторов решают известными методами решения систем нелинейных уравнений (СНУ) без ограничений на решение: методом Ньютона-Канторовича, градиента, хорд и др. [31-34] или методами решения СНУ с ограничениями на решение (методами нелинейного программирования): проекций градиента, оврагов и др. [27, 33, 35]. При этом более эффективным является применение методов нелинейного программирования, так как на неизвестные z,, v j и F можно наложить следующие ограничения [36] вида: z 0, v є[а,Ь],
Однако данные методы имеют высокую вероятность появления ложных решений нелинейной системы, требуют много памяти и времени для решения, что ограничивает их использование. Самое главное, эти методы не учитывают специфику системы (50), в которую примерно половина неизвестных входит линейно, а половина - нелинейно. Кроме того, открытым является вопрос о числе линий п.
Поэтому необходимо использование (и развитие) методов решения, учитывающих специфику СЛНУ (50). Для решения такой системы уравнений можно воспользоваться существующими методами решения СЛНУ, например, методом Прони [37], алгоритмами Пиблза-Берковица [38] и Фальковича-Коновалова [39] и др. Однако метод Прони подходит лишь для СЛНУ с матрицей Вандермонда, когда K(Vj,v j) изменяется вдоль строки (т.е. при изменении у при каждом /) по геометрической прогрессии, а матрица в (50) таким свойством, вообще говоря, не обладает. Алгоритм Пиблза-Берковица, основанный на представлении АФ К (у j У у) рядом Тейлора, оказался (как показала проверка) весьма неточным. Алгоритм Фальковича-Коновалова является слишком громоздким.
Можно использовать так называемый метод переменных проекций (the variable projection method) Голуба-Хегланда-Муллена [40], в котором также решается СЛНУ, однако в нем для определения длин волн (или частот) линий используется нелинейный метод (типа Гаусса-Ньютона).
В настоящей диссертации для решения СЛНУ предлагается оригинальный адаптивный алгоритм интегральной аппроксимации. Его главным достоинством является то, что наиболее сложная часть задачи - определение значений нелинейно входящих параметров - решается линейно, причем без потери точности. методом квадратур (или методом преобразования Фурье в случае разностной АФ К(уіУЛ = К(уі - V)) и методом регуляризации Тихонова при заниженном значении параметра регуляризации . При этом необходимо, чтобы число дискретных отсчетов т измеренного спектра было большим (несколько сотен), что позволит разрешить близкие линий. В результате будет получено решение za(v ) с малым шагом дискретизации , в котором разрешатся близкие линии, но воз 47 никнут (из-за занижености ) ложные флуктуации-линии. Погрешность определения частот /(см. далее) будет определяться шагом дискретизации , который может быть взят малым.
Математическое описание обратной задачи спектрометрии
Важным является вопрос о выборе параметра регуляризации и об оценке погрешности регуляризованного решения z. Для выбора обычно используются следующие способы: принцип невязки, обобщенный принцип невязки, критерий L-кривой, метод перекрестной значимости и др. [4, 22, 24, 27-30, 41-43]. Однако в них не делается оценка погрешности решения z при конечных и , даже считается, что такая (эффективная) оценка невозможна в некорректных задачах без использования дополнительной информации о решении (а делается, помимо выбора , лишь асимптотическая оценка при 8, , —» 0); во многих способах не учитывается дополнительная информация о решении (кроме -регуляризации с ограничениями на решение [27], поиска решения на компакте [22, 27] и дескриптивной регуляризации [24]). Для выбора и оценки погрешности решения с учетом дополнительной информации о решении предлагается использовать способ вычислительных экспериментов (другие названия: способ эталонных, модельных, обучающих примеров, способ псевдообратного оператора) [8, 13, 14, 22, 44].
В данной работе находит дальнейшее развитие способ вычислительных экспериментов выбора параметра регуляризации и оценки погрешности восстановления спектра [8, 13-15, 22, 44]. Данный способ учитывает дополнительную (априорную) информацию об искомом спектре (оценку количества спектральных линий, их частот и амплитуд) и в этом отношении напоминает такие методы, как метод -регуляризации Тихонова с ограничениями на решение [27], решение на компакте [22, 27], методы дескриптивной регуляризации [24], также учитывающие априорную информацию о решении (неотрицательность, монотонность, вы 36 пуклость, параметры экстремумов и др.). Однако конкретная реализация способа вычислительных экспериментов отличается от перечисленных методов.
Способ вычислительных экспериментов заключается в следующем (подробнее см. в [3, 45, 46]). Обозначим Aza = za- z - погрешность регуляризованного решения z уравнения (14), а z - точное решение (нормальное псевдорешение [22, 27]). Получена следующая оценка относительной погрешности регуляризованного решения по норме уравнения (19):
Здесь В = АТА, Л = 5отн+ отн, 5отн=5/w, отн= / - относительные погрешности исходных данных. Функция () является верхней огибающей для истинной относительной погрешности отн(). Первое слагаемое в правой части (29) обусловлено погрешностями данных, а второе - регуляризацией.
Однако оценка (31) (а также (29)) на практике может давать значительное завышение по сравнению с отн(), поскольку в случае плохо обусловленных и некорректных задач \imin(B) близко или равно нулю (см. дальше рисунок 13).
Для получения оценки (), приближенной к отн(), воспользуемся понятием псевдообратного оператора, вложив в него, однако, смысл, несколько отличный от псевдообратной матрицы Мура-Пенроуза А+, дающей решение z = А+и [18], и от регуляризованного оператора (матрицы) (аЕ + В) 1 Ат, дающего решение za=(aE + B) lATu (см. (19)). Дело в том, что А+ соответствует случаю ос- 0, \ітіп(В)фО, а регуляризация имеет дело с конечным значением а 0 и
В работах [45, 46] показано, что функция () согласно (32) имеет (единственный) минимум при 11А11 ri/Vg ЗА/3 /4 «1.30.
Согласно соотношениям (28), (32), оценка относительной погрешности 11 A2a 11 /11z 11 регуляризованного решения z зависит от А и (точнее, от произведения 11 А11 г)). Поэтому, если решается несколько примеров (обрабатывается несколько спектров) с одинаковыми А и , то для них оценки погрешности (17), (32) будут одинаковыми (в функции ).
Отсюда следует, что при решении некоторого исходного примера Р (т.е. при обработке исходного спектра мP) с неизвестным решением-спектром ZP можно использовать результаты решения другого, модельного, примера Q с известным (заданным) точным решением-спектром zQ, причем с такими же А и , что и в примере Р. При этом при решении примера Q можно рассчитать функцию aотн(a)Q = AzaQ ІІ/Ц zQ и по ней найти опт Q - оптимальное значение , при котором аотн (a)q = min. Это значение опт Q может быть использовано при решении исходного примера-спектра Р.
При этом необходимо определить параметр g (см. (32)). Оценка g может быть получена графически - путем подбора такого значения g, при котором огибающая () касается кривой (или набора кривых) отн()Q (см. далее рисунок 13). Значение , соответствующее точке касания будет обозначено через g.
Определение g может быть выполнено аналитически. Имеется два неизвестных: и g и два уравнения для их определения: Поскольку функция отн() задается таблично, то задачу удобнее решать графически, выводя на монитор кривые отн() и () при различных g (рисунок 13).
Для повышения эффективности данного способа при составлении модельного примера Q (или нескольких примеров) нужно использовать дополнительную информацию об исходном примере-спектре Р, а именно, оценку количества спектральных линий (максимумов) в искомом спектре zP, соотношений их интенсив
Алгоритм интегральной аппроксимации
При этом более эффективным является применение методов нелинейного программирования, так как на неизвестные Zj, v и F можно наложить следующие ограничения, способствующие повышению точности решения [36]: z- 0, Vj є [a,b], F 0, где [a,b] - некоторый диапазон частот.
Однако данные методы имеют высокую вероятность появления ложных корней нелинейной системы, а кроме того требуют большое количество памяти и компьютерного времени для решения, что ограничивает их использование, например, во встраиваемых системах.
Также для решения такой системы уравнений можно воспользоваться существующими методами, предназначенными для решения СЛНУ, например, мето 20 дом Прони [37], алгоритмами Пиблза-Берковица [38] и Фальковича-Коновалова [39] и др.
Однако метод Прони подходит лишь для решения СЛНУ с матрицей Ван-дермонда (когда K(v,v -) изменяется вдоль строки по геометрической прогрессии), а матрица в (3) таковой, вообще говоря, не является.
Алгоритм Пиблза-Берковица на практике оказывается весьма неточным, а алгоритм Фальковича Коновалова является слишком громоздким, что ограничивает его применение.
Можно использовать так называемый метод переменных проекций (the variable projection method) Голуба-Хегланда-Муллена [40], в котором также решается СЛНУ, однако для определения частот используется нелинейный метод (типа Гаусса-Ньютона).
Для решения СЛНУ предлагается использовать и развить оригинальный адаптивный алгоритм интегральной аппроксимации, который ранее применялся при обработке сигналов. Его главным достоинством является то, что наиболее сложная часть задачи - определение значений нелинейно входящих параметров -решается линейно. Однако применяемый в нем способ фильтрации ложных линий требует знания уровня вероятности ложной тревоги. Усовершенствование данного алгоритма применительно к решению обратной задачи спектрометрии позволит повысить точность решения.
Из приведенного в данной главе краткого анализа способов восстановления непрерывных и дискретных спектров можно заключить, что выбор методики восстановления спектров с целью повышения разрешения спектральных приборов не может опираться только на освещенные в научной литературе методы в «чистом» виде для решения данной конкретной задачи.
Разработка методики восстановления непрерывных спектров и нового способа выбора параметра регуляризации , использующего дополнительную инфор 21 мацию о спектре (оценку количества линий, их длин волн и амплитуд), позволит уменьшить уровень ложных линий (эффект Гиббса) в восстановленном непрерывном спектре и получить более точное решение.
Разработка методики восстановления дискретных спектров и дальнейшее развитие оригинального адаптивный алгоритма интегральной аппроксимации, главным достоинством которого является то, что наиболее сложная часть задачи – определение значений нелинейно входящих параметров – решается линейно, применительно к решению обратной задачи спектрометрии позволит повысить точность восстановления дискретных спектров.
Таким образом, проведенный в данной главе анализ позволил сформулировать задачи исследования: разработку новой методики восстановления непрерывных спектров с использованием дополнительной информации о спектре при выборе параметра регуляризации и новой методики восстановления дискретных спектров на основе алгоритма интегральной аппроксимации. Глава 2 Разработка методики восстановления непрерывных спектров
В данной главе более подробно рассматривается случай непрерывного (сплошного) спектра, когда искомый спектр представляет собой кусочно-заданную непрерывную функцию. Такой спектр характерен, например, для вибрации трансформатора [10], а также такой спектр имеют вещества с повышенной плотностью, например, расплавленный металл в домне, плазма, Солнце, звезды и т.д. Сверхтонкую структуру спектральной линии также можно считать непрерывным спектром.
Измеренный спектрометром спектр и() (где - длина волны) обычно отличается от истинного спектра z() (рисунок 6) [1, 3, 4, 7, 8]. Это проявляется, во-первых, в большей сглаженности спектра и() по сравнению с z() (в спектре и() не разрешены близкие линии, сглажена тонкая структура спектральных линий и т.д.), что является результатом воздействия аппаратной функции спектрального прибора К(Х,Х ) [1, 3-5, 7, 8, 13-15]. Во-вторых, это проявляется в зашумленности спектра и(), а именно, слабые линии «тонут» в шуме, что является результатом погрешностей измерений [1, 3], а также воздействия среды [6].
Возникает обратная задача спектрометрии - задача восстановления истинного спектра z() по измеренному зашумленному спектру и() и аппаратной функции К(Х,Х ) спектрального прибора [1, 3, 4, 7, 8, 13-20].
Апробация разработанной методики восстановления непрерывных спектров в случае разностной аппаратной функции
Полосатый спектр (рисунок 1в) состоит из ряда полос, каждая из которых, в свою очередь, состоит из набора близких дискретных линий. Примерами полосатых спектров являются спектры испускания паров йода, а также спектры веществ, находящихся в неглубоком вакууме, в частности, спектры люминесцентных ламп и ламп «дневного света».
Сложный, или комбинированный, спектр (рисунок 1г) состоит из нескольких типов спектров, например, из непрерывного спектра и ряда дискретных линий. Спектры излучения звёзд, где на сплошной спектр фотосферы накладываются хромосферные линии поглощения, а также большинство звуковых спектров являются комбинированными спектрами. Спектральный анализ можно разделить на широкополосный и узкополосный (рисунок 2).
Широкополосная спектрометрия - это изучение спектра в широкой области частот (рисунок 2а), например, изучение спектра звезды во всем видимом диапазоне (от красного до фиолетового).
Узкополосная спектрометрия - это изучение спектра в узкой полосе частот (рисунок 2б), например, изучение сверхтонкой структуры мессбауэровской линии, обусловленной магнитными или электрическими полями и тепловыми эффектами [5, с. 407].
Измеренный спектрометром спектр и() (где - длина волны) обычно отличается от истинного спектра z() [1, 3, 4, 7, 8, 13-15]. Это проявляется, во-первых, в большей сглаженности спектра и() по сравнению с z() (не разрешены близкие линии, сглажена тонкая структура спектральных линий и т.д.), во-вторых, в зашумленности спектра и() (слабые линии «тонут» в шуме). Возникает задача восстановления истинного спектра z() по измеренному зашумленному спектру и() и аппаратной функции К(ХХ) спектрального прибора [1, 3, 4, 8, 13-21]. Данная задача называется обратной задачей спектрометрии или задачей редукции к идеальному спектру [21].
Поскольку полосатые и комбинированные спектры представляют собой комбинацию (наложение) непрерывных и дискретных спектров, то в настоящей диссертации рассматриваются только последние из них.
В случае непрерывного спектра (рисунок 3) задача восстановления истинного спектра описывается интегральным уравнением Фредгольма I рода относительно истинного спектра z() по известному измеренному спектру и() и аппаратной функции спектрометра К(ХХ) [1, 3,
Задача решения (1) является некорректной, в первую очередь сильно неустойчивой [3, 4, 8, 22]. Так при численном решении ИУ Фредгольма I рода мето 16 дом преобразования Фурье без дополнительного использования какого-либо устойчивого метода решение получается чрезвычайно неустойчивым – в виде так называемой «пилы» (рисунок 4), ничего общего не имеющей с точным решением. 8 6 4 2 1 460 470 480 490 500 510 520 530 540 550 560 570 580 590 600 610 620 630 640
В настоящее время широко известны устойчивые методы решения данной задачи [3, 8, 14, 22-28]: метод регуляризации Тихонова, метод фильтрации Винера, метод итераций Фридмана, метод Калмана-Бьюси, методы статистической регуляризации и т.д.
Решением уравнения (1) при К(Х,Х ) = К(Х-Х ) по методу регуляризации Тихонова (с преобразованием Фурье) является:
Точность решения (1), а значит, и качество восстановления спектра, зависит от выбранного значения параметра регуляризации . Для выбора обычно используются следующие способы: принцип невязки, обобщенный принцип невязки, критерий L-кривой, метод перекрестной значимости и др. [3, 8, 14, 22-30]. Однако в них не делается оценка погрешности решения при конечных погрешностях и , даже считается, что такая (эффективная) оценка невозможна в некорректных задачах без использования дополнительной информации о решении (а делается, помимо выбора , лишь асимптотическая оценка при 8, , —» 0); во многих способах не учитывается дополнительная информация о решении (кроме -регуляризации с ограничениями на решение [27], истокопредставимости решения [28], поиска решения на компакте [22, 27] и дескриптивной регуляризации [24]).
Таким образом, существующие на сегодняшний день способы выбора значения параметра регуляризации , от которого зависит качество восстановления спектра, не всегда учитывают физическую сущность спектра, не используют дополнительную информацию о решении и не позволяют оценить его погрешность.
Для решения (1) методом Калмана-Бьюси необходимо знать матрицу кова-риаций и математическое ожидание ошибок.
Методы статистической регуляризации основаны на статистических оценках. Недостатком этих методов является необходимость знать законы распределения ошибок оператора и правой части уравнения.
Таким образом, наиболее предпочтительным для решения обратной задачи спектрометрии является метод регуляризации Тихонова, поскольку обеспечивает бльшую точность восстановления спектров при относительной простоте программной реализации, при этом возникающий эффект Гиббса минимальный. Поэтому обычно данная задача решается методом квадратур или преобразования Фурье (ПФ) с регуляризацией Тихонова.
Для уменьшения ложных линий (эффекта Гиббса) в восстановленном непрерывном спектре и более точного решения требуется разработка нового способа выбора параметра регуляризации , использующего дополнительную информацию о спектре (оценку количества линий, их длин волн и амплитуд).