Содержание к диссертации
Введение
Глава 1. Основные подходы к решению задач интерпретации данных 18
1.1 Введение 18
1.2 Корректные и некорректные задачи 18
1.3 Метод В.К. Иванова 20
1.4 Метод М.М.Лаврентьева 21
1.5 Метод регуляризации А.Н.Тихонова 22
1.6 Метод С. И. Кабанихина 23
1.7 Метод Ю. П. Пытьева. Теория измерительно-вычислительных
1.7.1 Описание подхода 26
1.7.2 Схема измерения 31
1.7.3 Схема интерпретации 32
1.7.4 Интерпретация измерения с помощью линейных ИВС 32
1.7.5 Теория измерительно-вычислительных систем в гильбертовом пространстве 37
1.7.6 Модель измерения [А,Е] 38
1.8 Заключение 40
Глава 2. Оценивание значения функции в заданных точках ее области определения по измерениям конечного числа ее функционалов 42
2.1 Постановка и решение задачи оценивания элемента бесконечномерного гильбертова пространства по измерению конечного числа функционалов 42
2.2 Оптимальный выбор размерности проекции элемента Uf\ допускающий оценку с заданной погрешностью 47
2.2.1 Оценка функции по измерению ее линейных функционалов с некоррелированной погрешностью одинаковой дисперсии 49
2.2.2 Оценка функции по измерению ее линейных функционалов со случайной погрешностью с заданным корреляционным оператором общего вида 55
2.2.3 Оценка значений функции в заданных точках ее области определения 57
Глава 3. Оценки максимальной возможности прараметров модели измерений 62
3.1 Сведение модели измерения элемента L2(X) к конечномерной модели измерения 63
3.2 Возможностная модель погрешности измерений 65
3.3 Оценки максимальной возможности 66
3.4 Минимаксные оценки координат вектора u 67
Глава 4. Применение разработанных методов к интерпретации данных спектрометрического эксперимента 70
4.1 Общая математическая модель спектрометрического эксперимента 70
4.2 Модель двухщелевого спектрометра 71
4.3 Решение задачи интерпретации данных двухщелевого спектрометра методами редукции измерений 78
4.3.1 Задача редукции измерений. Модельные данные 78
4.3.2 Задача редукции реальных измерений 83
4.4 Метод эффективного ранга для решения задачи интерпретации данных двухщелевого спектрометра 87
4.4.1 Задача редукции для модельных данных 87
4.4.2 Задача редукции для реальных данных 91
4.5 Решение задачи интерпретации данных двухлучевого спектрометра методом построения оценок максимальной возможности и минимаксных оценок 93
4.5.1 Результаты для модельного эксперимента 93
4.5.2 Результаты для реального эксперимента 97
4.6 Математическая модель мессбауэровского спектрометрического эксперимента 101
4.7 Оценки максимальной возможности и минимаксные оценки для измерений на мессбауэровском спектрометре 105
4.8 Исследование вычислительного алгоритма на устойчивость 109
Заключение 118
Список литературы
- Метод Ю. П. Пытьева. Теория измерительно-вычислительных
- Оптимальный выбор размерности проекции элемента Uf\ допускающий оценку с заданной погрешностью
- Возможностная модель погрешности измерений
- Решение задачи интерпретации данных двухщелевого спектрометра методами редукции измерений
Введение к работе
Актуальность темы. Точность и надежность результатов исследования всегда напрямую зависела от точности измерений тех или иных параметров изучаемого объекта. Однако в современных экспериментальных исследованиях значения изучаемых параметров д объектов не удается измерять непосредственно, их приходится оценивать из результатов измерений величин, зависимость которых от д дается некоторой математической моделью. Такие задачи называются задачами интерпретации измерений, они возникают при сейсморазведке, в томографии, астрофизике, оптике, и спектрометрии и др.
При интерпретации экспериментальных данных считается, что они являются результатом измерения выходного сигнала Ад измерительного прибора А, на вход которого поступает сигнал д, интересующий исследователя. Результат измерения сопровождается аддитивной погрешностью v. Задача интерпретации состоит в определении входного сигнала д измерительного прибора А по данным измерения, ее решение опирается на математические модели измерительного прибора А и шумовой погрешности z/, а также на использовании дополнительной (априорной) информации о д. Соотношение
= ^9 + v (1)
при этом называется схемой эксперимента.
Приведем в качестве примера спектрометрический эксперимент, в котором с помощью спектрометра с заданной аппаратной функцией а#(-,-) измеряется спектр электромагнитного излучения д(-) некоторого вещества. В этом случае входным сигналом является спектр излучения (), выходной сигнал q = Ад спектрометра формируется согласно соотношению
q(E) = / a,tf(E,E)g(E)dE, Е<Е [0, оо). (2)
о
Смысл аппаратной функции о#(-,-) спектрометра состоит в том, что при
подаче на вход спектрометра монохроматического потока гамма-квантов
единичной интенсивности энергии Е на выходе спектрометра получим
спектр а$(Е,Е), Е Є [0, оо). Аппаратная функция, возможно, зависит
от неизвестного параметра $ Є G. В задаче интерпретации данных
спектрометрического эксперимента требуется найти оценку спектра д(-) по
данным измерений q(-), выполненным с погрешностью, и на основании
аппаратной функции а#(-,-), зависящей от параметра, значение которого
неизвестно, но задано множество его возможных значений.
Один из широко распространенных подходов к решению задачи интерпретации измерений состоит в решении интегрального уравнения Фредгольма 1 рода (2) с приближенно заданной правой частью, такие задачи относятся к некорректно поставленным и для их решения А.Н.Тихоновым был предложен метод регуляризации.
Основная идея методов регуляризации состояла в таком выборе приближенного решения задачи, который давал бы устойчивое решение, то есть такое решение, которое стремилось бы к точному при стремлении погрешности в задании данных к нулю.
В отличие от методов регуляризации, в теории измерительно-вычислительных систем, разработанной в работах Ю.П.Пытьева. Оценка неизвестных параметров д строится из требования ее максимальной точности. Формально, в этих задачах в (1) интерпретируется как искаженный шумом v результат регистрации выходного сигнала Ад измерительного преобразователя А, на вход которого подан сигнал д от измеряемого объекта. Интерес представляет наиболее точная оценка либо д, либо результата Uд при этом рассматривется как выходной сигнал "идеального" измерительного прибора. В приведенном примере (2) математическая модель измерительного преобразователя А дается интегральным оператором.
Еще один подход к решению задачи интерпретации измерений применяется в случае, когда о параметрах математической модели измерений известно, что они могут принимать любое значение из некоторой области, используются оценки, минимизирующие максимальную ошибку. В этом случае оценки вычисляются при максимально неблагоприятных условиях, и, как правило, их погрешности оказываются неприемлемо велики. Уменьшить ошибки оценок можно учетом дополнительных сведений о модели измерений.
Поскольку качество решения задачи интерпретации
экспериментальных данных определяется подробностью априорных сведений о решении и о модели измерений, актуальным является развитие методов, позволяющих учитывать дополнительную информацию о решении, в частности, методов, позволяющих формализовать опыт исследователя и его априорные представления об объекте исследования и модели измерений.
Один из аспектов, рассмотренных в данной диссертационной работе, состоит в том, что априорные данные о модели измерений формулируются в рамках варианта теории возможностей, разработанных Ю.П. Пытьевым в работе. В этой работе мера возможностей Р{) построена на алгебре Т всех подмножеств пространства элементарных событий Q так, что для каждого А Є J- значение Р(А) определяет относительное предпочтение, шансы на наступление события А: если Р(А) > Р{В), то событие А имеет
больше шансов реализоваться, чем событие В. Содержательными в теории
возможностей являются утверждения "А более возможно (менее возможно),
чем >", "А и В равновозможны", поэтому меры возможностей Р{) и
Р'{) эквивалентны, если существует такая строго монотонно возрастающая
функция 7(*) : 7^-1 —* Т^ъ что для любого А Є Т выполнено равенство
Р(А) = ry(Pf(A)). Фундаментальным понятием в этом варианте теории
возможностей является нечеткий элемент v нормированного пространства 7,
который по аналогии со случайным элементов в теории вероятностей задается
распределением возможностей irv(-): tiv{x) = ро есть возможность равенства
v = х. Если tiv{x) = 0, равенство v = х невозможно, если tiv{x) = 1,
равенство v = х вполне возможно, если tiv{x) > к"(у), равенство v = у
менее возможно, чем V = X.
В настоящей работе считается, что большие значения погрешности
измерения менее возможны, чем малые. Это утверждение формализуется
заданием распределения тг^-), монотонно убывающим при увеличении нормы
погрешности v. Оценка максимальной меры возможности параметров модели
измерения (1) в простейшем случае определяется из следующих соображений.
Пусть д — некоторая оценка входного сигнала д, тогда v = — Ад —
погрешность измерения, которая объясняет отличие результата измерения
от Ад, ее возможность равна tiv{^ — Ад). Оценка д, выбранная из условия д =
argsup7rz/(^ — Ад), называется оценкой максимальной меры возможности. В
д этой работе считается также, что модель измерительного прибора А зависит
от неизвестного параметра $ Є О, где О — заданное ограниченное множество,
и наложены априорные ограничения на значения входного сигнала д.
Второй аспект, обусловивший актуальность данной диссертационной работы, состоит в том, что экспериментальные данные, как правило, состоят из конечного набора чисел, в то время как неизвестные (восстанавливаемые при интерпретации) зависимости являются функциями, заданными на конечном или бесконечном отрезке числовой прямой, на плоскости или ее части и т.п.
В приведенном примере спектрометрического эксперимента (2) спектр д(-) задан на положительной полупрямой, и если считать функции д(-) и а(-,-) непрерывными, то можно записать значение выходного спектра q(-) при заданной энергии Еі в виде линейного функционала q(-):
q(Ei) = / a,tf(Ei,E)g(Ei)dE. (3)
о
Считая, что измерения проводятся в при значениях энергии Е\,... ,ЕП, следует определить, какую «часть» входного сектра можно оценить по значению конечного набора функционалов входного спектра, измеренных с погрешностью, и дать метод вычисления этой «части», а также оценить точность этого оценивания.
В диссертации исследуются ограничения, накладываемые на решения задач интерпретации данных в случае, когда эти данные представляют собой значения конечного числа линейных функционалов неизвестного входного сигнала, разработан вычислительный метод перехода к конечномерной модели (на основе методов дискретизации исходной математической модели, не приводящей к потере точности решения задачи интерпретации данных), созданы методы решения задач интерпретации измерений, результат которых представлен конечным числом линейных функционалов неизвестной функции, даны методы оценивания погрешности решения и проверки адекватности используемых моделей, а также созданы алгоритмы и программное обеспечение, реализующие созданные в диссертации методы.
Цель работы Целью диссертационной работы является развитие методов решения задачи интерпретации экспериментальных данных, обеспечивающие контроль точности решения и контроль адекватности используемой математической модели измерений; дающие способы формализации априорных данных об искомой проекции и математической модели измеряемых линейных функционалов.
Задачи работы Основными задачами данной диссертационной работы являются:
-
Задача интерпретации экспериментальных данных, представленных как конечный набор линейных функционалов неизвестной функции / (элемента гильбертова пространства), измеренных с погрешностью, как задачи наиболее точного оценивания значений конечномерной проекции элемента Uf гильбертова пространства, где U — заданный линейный оператор.
-
Задача выбора проекции элемента Uf максимальной размерности, допускающий оценку с заданной погрешностью.
-
Задача оценивания проекции элемента Uf из принципа максимальной возможности на основе теоретико-возможностной модели погрешности измерения, в которой считается, что большие измерительные погрешности менее возможны, чем малые.
-
Создание вычислительных алгоритмов решения задач интерпретации измерения, выбора оптимальных проекций элемента Uf и решения задачи оценивания проекции элемента Uf из принципа максимальной возможности.
-
Создание программного комплекса, реализующего созданные в диссертационной работе алгоритмы, для решения задач интерпретации данных спектрометрических экспериментов в оптической и мессбауэровской спектрометрии.
Научная новизна
-
Задача интерпретации измерений поставлена, решена и исследована как задача оптимального оценивания конечномерной проекции Рд элемента д бесконечномерного гильбертова пространства по измерению конечного числа его линейных функционалов, оптимальность оценки обеспечивается ее максимальной точностью. Получено семейство линейных подпространств максимальной размерности, проекции элементов на которые допускают оценки с заданной точностью.
-
Предложен метод сведения исходной математической модели измерения к конечномерной модели. Показано, что такой метод дискретизации не приводит к потере точности решения задачи интерпретации данных.
-
Разработаны численные методы и программное обеспечение вычисления оценки проекции Рд элемента д максимальной точности на основе предложенной дискретизации исходной бесконечномерной модели.
-
Дана математическая формализация условия «большие погрешности измерений менее возможны, чем малые». В рамках этой формализации поставлена, решена и исследована задача построения оценок максимальной меры возможности проекции Рд элемента д на конечномерное подпространство, даны методы проверки адекватности используемой математической модели.
Теоретическая и практическая значимость работы
Теоретическая ценность работы состоит в том, что в ней приведена математическая формализация задачи интерпретации измерений, позволяющая строить оптимальные по точности оценки исследуемых параметров и оптимальные оценки, учитывающие качественную информацию о модели измерения (оценки максимальной меры возможности). В диссертации развивается теоретическая основа для данного класса
задач интерпретации данных и анализа адекватности используемых математических моделей.
Практическая ценность работы заключается в построении методов оценивания изучаемых параметров, методов оценки непротиворечивости математической модели и результатов измерений и их применения для решения задач интерпретации данных, состоящей в оценивании входного спектра двухщелевого спектрометра, измеряющего оптические спектры излучения, и мессбауэровского спектрометра, а также задач анализа адекватности математических моделей, используемых для построения этих оценок. Разработанные в диссертации методы могут найти применение при анализе и интерпретации данных измерительных экспериментов в радиофизике, геофизике, при неразрушающем контроле и в других областях.
Методология и методы исследования
Используются методы функционального анализа, теории вероятностей и математической статистики, теории возможностей и теории измерительно-вычислительных систем.
Положения, выносимые на защиту
На защиту выносятся следующие новые научные результаты:
1. Новые математические методы постановки и решения задачи интерпретации данных натурного измерительного эксперимента и проверки адекватности используемых для этого математических моделей эксперимента: метод решения задачи интерпретации данных натурного эксперимента, полученных как результат измерения с погрешностью конечного числа линейных функционалов искомой функции, состоящий в максимально точной оценке значений кусочно непрерывного представителя искомой функции в точках ее непрерывности; метод формализации качественной информации о математической модели натурного эксперимента (формализация утверждения «большие погрешности измерений менее возможны, чем малые, формализации информации о значениях параметров измерительного прибора и др.), основанный на подходах теории возможностей; метод построения оценок максимальной возможности изучаемых параметров на основе данных натурного эксперимента и математической модели измерения, построенной на основе качественной («нечеткой») информации о ее параметрах; метод проверки непротиворечивости результатов измерения и «нечеткой» математической модели измерительного эксперимента.
-
Оптимальный по точности вычислительный метод сведения исходной модели измерения с погрешностью значений конечного числа линейных функционалов элемента гильбертова пространства к модели, в которой используются лишь ортогональная проекция этого элемента на конечномерное подпространство гильбертова пространства; метод не дает потери в точности математического моделирования данных натурного эксперимента.
-
Вычислительные алгоритмы решения задач интерпретации данных измерительного эксперимента на основе его «нечеткой» математической модели, а также вычислительные методы решения задач анализа непротиворечивости этой математической модели и экспериментальных данных.
-
Зависимости максимальной размерности проекции элемента бесконечномерного пространства, оцениваемой в задаче интерпретации данных натурного эксперимента, от точности оценивания для экспенриментов в области оптической и ядерной спектрометрии.
Степень достоверности результатов
Математические утверждения, полученные в рамках
диссертационного исследования, снабжены строгими доказательствами, что обеспечивает достоверность результатов. Теоретические положения подтверждены вычислительными экспериментами, выполненными для данных оптической и ядерной спектрометрии, результаты которых находятся в согласии с известными физическими моделями.
Апробация работы
Основные результаты докладывались и обсуждались на следующих международных и всероссийских научных конференциях: Международная конференция «Математика. Компьютер. Образование». Дубна, 2012г., Дубна, 2014г ; XI Всероссийское совещание-семинар «Инженерно-физические проблемы новой техники». МГТУ им. Н.Э.Баумана, 2014г.; Х Международная конференция «Интеллектуализация обработки информации», Греция, о. Крит, 2014г., а также на на научных семинарах: «Обратные задачи математической физики» в НИВЦ МГУ имени М.В.Ломоносова под руководством проф. Бакушинского А.Б., проф. Тихонравова А.В., проф. Яголы А.Г.; кафедры математического моделирования и информатики физического факультета под руководством проф. Ю.П.Пытьева.
Результаты диссертации опубликованы в 8 научных работах, 4 из
которых изданы в рецензируемых журналах, из них три статьи опубликованы
в журналах, рекомендованных ВАК РФ .
Результаты диссертационной работы получены автором лично. В совместных публикациях автору принадлежат формальные доказательства утверждений лемм и теорем, разработка структуры программного комплекса и его реализация, совместно с соавторами — постановка задач, формализация моделей экспериментов.
Структура и объем работы
Метод Ю. П. Пытьева. Теория измерительно-вычислительных
Схема действия измерительно-вычислительной системы согласно которому измерительный прибор должен как можно меньше возмущать объект и среду. Концепция ИВС как средства измерений основана на новом принципе измерений: в процессе измерения объект и среда могут претерпевать существенные возмущения, но "на выходе" ИВС должны быть максимально точные значения параметров исследуемого объекта, свойственные его естественному состоянию.
Отметим, что при таком подходе, используемом в теории ИВС, понятия "исследуемый (изучаемый) объект" и "измеряемый объект" не совпадают.
Выходной сигнал ИВС следует интерпретировать как максимально точную версию выходного сигнала идеального измерительного прибора.
Найденные значения параметров исследуемого объекта и оценка погрешности в теории измерительно-вычислительных систем называются интерпретаций измерения и ошибкой интерпретации, соответственно [2,19, 37,47, 48].
Измерительно-вычислительная система как средство измерений может быть реализована в двух принципиально различных вариантах. В первом, как было сказано, на измерительно-вычислительной системе можно предельно точно синтезировать выходной сигнал идеального прибора, здесь критерием качества измерительно-вычислительной системы является точность определения параметров объекта в его естественном состоянии. Во втором варианте измерительно-вычислительную систему можно выполнить как максимально точную версию самого идеального прибора при заданных ограничениях, например, на уровень шума, при этом концепция измерительно-вычислительной системы как средства измерения, по существу, совпадает с принятой в приборостроении, с тем лишь отличием, что оптимизируется точность синтеза прибора на измерительно-вычислительной системе, а не точность изготовления прибора как такового. Теория измерительно-вычислительных систем включает новое понятие качества измерительной компоненты, существенно отличающееся от традиционного. Дело в том, что для наиболее качественных измерений измерительный прибор как таковой и как измерительная компонента измерительно-вычислительной системы должны обладать значительно различающимися характеристиками.
Для построения измерительно-вычислительной системы необходима математическая модель системы "объект-среда-прибор", отражающая свойства объекта, среды и прибора с учетом и взаимодействия. Называемая в теории измерительно-вычислительных систем моделью измерения, она позволяет связать сформированный в системе "объект-среда-прибор" сигнал f как с текущими значениями параметров измеряемого объекта, так и с выходным сигналом измерительной компоненты ИВС (см. рис.1). Необходима также математическая модель, связывающая входной сигнал f измерительной компоненты измерительно-вычислительной системы со значениями параметров объекта, свойственными его естественному состоянию. Эта модель называется моделью интерпретации измерения [29,42,57].
Теория измерительно-вычислительных систем позволяет, используя эти модели и выходной сигнал измерительной компоненты ИВС, "вычислить" с помощью ее вычислительной компоненты наиболее точную версию характеристик ненаблюдаемой системы "объект-среда" и оценить сопутствующую погрешность. Иначе можно сказать, что вычислительная компонента измерительно-вычислительной системы решает задачу редукции измерения х = (/) к значению и = u(f) параметров объекта в системе "объект-среда" и оценивает погрешность h [24,49,50,55,78,80].
Поскольку все модели, используемые для редукции измерения, непременно содержат неточности, обусловленные приближенным описанием реальных процессов, теория ИВС как составные части содержит теорию надежности модели измерения и теорию надежности интерпретации измерения. Надежность модели измерения характеризует ее адекватность реальному положению вещей, надежность интерпретации измерения позволяет оценить состоятельность интерпретации измерения, т.е. найденных значений параметров исследуемого объекта и оценки погрешности, и тем самым охарактеризовать возможность использования моделей для определения с гарантированной точностью параметров исследуемого объекта.
Исседование адекватности математических моделей измерения и интерпретации и подбор их характеристик с целью максимизации надежности составляют то, что в теории измерительно-вычислительных систем называется анализом измерения [4,36,39,48,54,82,84,91,99].
Обычно объект исследования и измерительный прибор находятся в некоторой среде, (её могут составлять, в частности, некоторые другие объекты, реальная физическая среда—воздух, жидкость, и пр.). На вход прибора от объекта и среды поступает сигнал, порожденный объектом и средой, возмущенных взаимодействием. Он обозначается в теории ИВС символом /. Прибор обозначается символом А. Символ Af обозначает результат измерения. В процессе измерения и оцифровки обязательно возникают погрешности—ошибки. Они являются случайными сигналами. Мы обозначаем их v. Таким образом, результат измерения можно записать схематично в виде = Af + v- (1.5)
Схему (1.5) интерпретируем следующим образом: сигнал есть искаженный шумом v результат измерения выходного сигнала Af прибора А, на вход которого подан сигнал / от объекта и среды, возмущенных измерением.
Опишем теперь схему идеального измерительного эксперимента, в результате которого мы получили бы значения ровно тех параметров объекта, которыми мы интересуемся, причем в нужном нам состоянии, не возмущенном измерением. Под идеальным прибором здесь понимается такой, на вход которого поступает сигнал / от реального объекта и среды, возмущенных измерением, но на выходе появляются абсолютно точные значения нужных нам параметров. Обозначим его символом U, а параметры объекта в невозмущенном состоянии - символом и. Тогда схема идеального измерения (в теории измерительно-вычислительных систем она называется схемой интерпретации) запишется в виде и = Uf. (1.6) Цель интерпретации измерения состоит в преобразовании сигнал из соотношения (1.5) к виду, наиболее близкому к сигналу и из (1.6). Это проблема интерпретации измерения. Для линейных ИВС, помимо того, что приборы U и А являются линейными, преобразование сигнала , приводящее его к виду, наиболее близкому к выходному сигналу и идеального прибора U, тоже линейно. Обозначим преобразование символом Л, тогда результат интерпретации Щ имеет вид Щ = RAf + Rv = Uf + (RA — U)f + Rv. (1.7) Для того, чтобы обеспечить наиболее точную интерпретацию измерения (1.5), необходимо так подобрать преобразование Л, чтобы сделать слагаемые [RA — U)f (ложный сигнал) и Rv (шум) как можно меньшими по величине. Эта задача решается методами редукции измерений, которые созданы как для ситуации, когда сигналы / и являются элементами конечномерных (евклидовых или нормированных) пространств [44], так и для случая, когда как /, так и являются элементами сепарабельных гильбертовых пространств [42,43].
Рассмотрим сначала конечномерную теорию редукции измерений. Охарактеризуем отличие ИВС от идеального прибора U величиной максимального значения среднего квадрата погрешности интерпретации (далее ее будем называть среднеквадратичной (с.к.) погрешностью интерпретации): h(R, U) = sup{EЩ — Uf\\ \f є T&N С = Af + v\- (1.8) Чтобы получить как можно более точную версию сигнала Uf путем преобразования (1.7) результата измерения , матрицу R определим так, чтобы величина с.к. погрешности интерпретации h(R, U) была как можно меньше, то есть из условия h(R, U) min . (1.9) R согласно которому на ИВС будет синтезирован выходной сигнал Uf идеального прибора U с минимальной с.к. погрешностью. Как говорилось выше, h(R, U) оо лишь при условии RA = U. В этом случае, согласно (1.7), h(R, U) = Еi?z/2, и задачу (1.22) синтеза выходного сигнала Uf идеального прибора U можно записать в виде h(R , U) = mf{E\\RYi \\2\R (J n R-m) RA = U}. (1.10)
Оптимальный выбор размерности проекции элемента Uf\ допускающий оценку с заданной погрешностью
Здесь є = iiUB lYjB lU , а ш 0 - eдинственный корень уравнения tiUB(B2 + 6G S)-1S( 2 + х )_1 ?7 = є. При этом, если 0 є єо, то G(R) = \\RB — иЦ2, = ш2ігU{BT1 lB + UJSI) 2U , а H(R) = ЕЦД Ц2 = є. Первое из этих двух выражений дает оценку близости синтезированного прибора RB к U, а второй — оценку погрешности на его выходе.
На практике следует воспользоваться оперативной характеристикой задачи (2.9), которая дает значение функционалов G(R) и H(R) при R = R(UJ) как функций параметра задачи ш 0: G(u) = UJHY U{B YJ 1B + UJI) 2U , Н{ш) = tr U В [В2 + 6o S)-1S( 2 + шТ,) 1 BU .
Параметр задачи теперь выбирается из соображений компромисса между отличием G{uS) оператора R(UJ)B от U, и величиной погрешности Н(си) на его выходе.
В предыдущем пункте был рассмотрен метод несмещенного оценивания проекции д элемента д Є 2(Х) на конечномерную линейную оболочку элементов (ц Є С2(Х), і = 1,...,п. На практике эта оценка сопровождается большой погрешностью, переход к задаче редукции измерения к виду, свойственному измерению проекции Рд на приборе, наиближайшем к идеальному, приводит также к ошибкам в синтеза прибора, которые не всегда устраивают исследователя. В то же время, как известно [44], сокращение размерности оцениваемой проекции приводят к уменьшению погрешности ее оценки. Поэтому в этой части диссертационной работы предлагается построить семейство Сі,... , Ck = С линейных подпространств размерности 1, 2,... , к, каждое из которых обладает следующим свойством: оценка проекции д Є С2(Х) на подпространство Ст размерности т, 1 т к, обладает минимальной погрешностью среди всех линейных подпространств пространства С2(Х) размерности т. Здесь к п - размерность линейного подпространства С С С2(Х), равная числу линейно независимых элементов СІІ(-) Є С2(Х), і = 1,..., п.
В этой части работы построено такое семейство подпространств, исследованы его свойства путем построения функции, ставящей в соответствие требуемой точности оценивания 6, 5 0, максимальную размерность р(5) проекции д(-) на подпространство Ср ) С С2(Х), допускающую оценку с данной погрешностью. Для этого используются подходы, данные в работе [44]. Функция р(-) носит название эффективного ранга задачи линейного оценивания.
В следующем разделе ставится и решается задача оптимального оценивания проекций функции д Є С2(Х) на линейные подпространства, допускающие оценку с конечной погрешностью, для ситуации, когда измерения линейных функционалов сопровождаются некоррелированными погрешностями одинаковой дисперсии. Далее эти результаты обобщаются на погрешность с произвольными ковариациями. В следующем разделе описано, как эти методы могут быть реализованы на цифровой вычислительной технике. 2.2.1. Оценка функции по измерению ее линейных функционалов с некоррелированной погрешностью одинаковой дисперсии
Модель измерения, постановка задачи оценивания Пусть, как и в предыдущем параграфе, в эксперименте получены данные согласно схеме І = (ai,g) + щ, і = 1,..., n оо, (2.11) здесь /, 2i,...,an — элементы гильбертова пространства С2(Х), щ — погрешность г-го измерения. Будем считать числа i,... ,п и z/i,..., vn координатами векторов и v n-мерного евклидова пространства Rn соответственно, тогда (2.11) можно записать в векторном виде где линейный оператор А : С2(Х) —Rn каждому элементу z Є 2(Х) ставит в соответствие вектор Az Є Rn с координатами (Az)i = (ai,z), і = 1,...,п. Соответственно, сопряженный ему оператор Л : Rn — 2(Х) любому вектору у = (г/і,... ,уп) Є Rn ставит в соответствие элемент: п А у = djyj Є С2(Х). 3=1 Будем считать известными элементы а\,...,ап Є С2(Х), вектор известен как результат измерений (2.11), вектор v является случайным вектором Лп, его математическое ожидание равно нулю, Ez? = 0, а все координаты некоррелированы и имеют одинаковую дисперсию: EZ ZA,- = О, і ф j i,j = 1,...,п, значение которой а2 известно. Элемент о-2, і = j д Є 2(Х) априори произволен. Требуется по результатам измерений (2.11) и заданной математической модели оценить элемент д Є С2(Х). Будем использовать линейные оценки, т.е. такие, которые имеют вид Дэо, где Roc Є Rn — 2(Х) — линейный оператор. Величина погрешности этой оценки определится значением sup {ЕЦДэо — д\\2}. Однако как было /є2(Х) показано в предыдущем пункте при отсутствии априорных данных об элементе д невозможно построить его оценку с конечной погрешностью, поскольку проекция (/ — Р)д элемента д на ортогональное дополнение С1- С 2(Х) не контролируется измерениями (2.11) и при заданном результате i,...,n может принимать любые значения.
Возможностная модель погрешности измерений
Естественно предположить, что в каждом измерительном эксперименте (3.1) малые значения \vi\ более возможны, чем большие. Это утверждение можно формализовать, считая vi,...,vn нечеткими величинами [35], т.е. такими, для которых задано распределение возможностей 7г (-): 1Z\ — [0,1]. Значение ттщ(г) интерпретируется как возможность равенства Vi = z, причем если ттщ(г) = 0, то равенство Vi = z невозможно, а при ттщ(г) = 1 вполне возможно. Абсолютные значения 7ТЩ(-) во внутренних точках отрезка [0,1] используются лишь для упорядочения возможностей значений нечеткой величины Vi: если i[Vi{z\) 77 ( 2), то значение Vi = Z2 более возможно, чем Vi = z\ (имеет больше шансов реализоваться в эксперименте, более предпочтительно), поэтому возможность задана с точностью до монотонного преобразования шкалы ее значений. Совместное распределение возможности независимых нечетких величин определяется формулой [35] 7rz/b " z/n(zi,..., zn) = minJTT Zi),... , 7r2/n(zn)}.
Если TiVi{z) = 0 при \z\ ЄІ, то погрешность Vi измерения в (3.2) по модулю не может быть больше, чем j, і = 1,..., п. Для ограниченных по модулю погрешностей малые значения \vi\ более возможны, чем большие, если распределение возможностей 7Г (-) задано соотношением I 7Го ( — ) , \z\ Є{, KVi (z) = Єі (3.7) І 0, \z\ ЄІ, где 7Го(-) монотонно убывает на интервале [0,1]. Считая координаты вектора v независимыми, запишем их совместное распределение возможностей 7гг/( ) = minfa1 1 (zi),... ,/к1/п(zn)} = 7i o( max —). i=l,...,n l 3.3. Оценки максимальной возможности
Пусть выбрана некоторая оценка #, /і,..., /п значений параметра $ и коэффициентов /і,..., /п в (3.3), тогда, предположив, что #, /і,..., /п есть истинное значение этих параметров, получим, что измерение (3.3) проведено п с погрешностью Vi = i — X}(a$j5 a$A;)/fc. Возможность таких значений к=1 погрешности определяется значением функции TIV {) в точке V = — Bfif. Согласно возможностной модели погрешности измерений (3.7), это значение равно
Естественно так подобрать значения оцениваемых параметров # Є О и / Є J7, чтобы возможность (3.8) соответствующей им погрешности измерений v = — Btff была максимальна. Определение. Оценками # , fl,...,f максимальной возможности назовем значения переменных #, /i,...,/n, доставляющие максимум функционалу (3.8) при # Є в и /і,..., /п, удовлетворяющих (3.6) .
Заметим, что если # , / — оценки максимальной возможности - параметров (#, /), то значения _+ - и = [/# / (3.9) имеют ту же возможность, что и if , / , и тем самым являются оценками максимальной возможности значений искомого вектора и. Утверждение 2. Пусть в схеме измерений (3.2) а#Д-) : X — 7?4, і = 1,...,п — непрерывные функции, квадрат которых интегрируем на X, Vi, і = l,...,n, — независимые нечеткие элементы с распределением возможностей (3.7). Тогда оценками максимальной возможности значений параметра $ и значений ортогональной проекции Р-&9І ) функции д(-) на линейную оболочку (#) функций СЦІ(-) : X — 1Z\, і = 1,..., п в точках {уі,..., у } Є X при условии (3.6) являются $ = $ ; Если значение минимума функционала в (3.10) больше единицы, то математическая модель измерения (3.2) не согласуется с его результатом. Доказательство. Задача максимизации возможности (3.8) при выполнении условий (3.6) эквивалентна задаче (3.10) в силу монотонности функции 7Го(-). Если значение минимума в (3.10) больше единицы, то возможность такой оценки равна нулю, что и означает несогласованность модели и результата измерения (3.2). Если задача (3.10) имеет не единственное решение, то каждое - из них будет оценкой максимальной возможности параметров (#, /), а каждое из значений и = U$ f — искомой оценкой вектора и - максимальной возможности. Для сужения множества оценок вектора и следует воспользоваться дополнительными соображениями. При фиксированном значении $ минимум в задаче (3.10) по /і,..., fn сводится к задаче линейного программирования [18,44]. Минимизация по # Є О далее проводится численно. Заметим, что если значение минимума функционала в (3.10) больше единицы, то возможность такой оценки равна нулю, что свидетельствует о неадекватности используемой математической модели.
Минимаксные оценки координат вектора и Недостатком оценок, предложенных в предыдущем пункте, является то, что погрешность оценивания значений щ = Р д{уі), і = l,...,iV, понимаемая как максимальный модуль разности оценки и оцениваемой величины, не является минимальной, так как эти оценки получены из принципа максимальной возможности, а не из принципа минимизации максимальной погрешности. В связи с этим интерес представляет задача, в которой оценка $ = $ параметра $ модели измерительного преобразователя выбирается из принципа максимальной возможности, а значения Р$ д(уі), і = 1,..., TV, при $ = $ определяются из принципа минимизации максимальной погрешности оценки. При этом считается, что погрешности z/j, і = 1,... ,п в (3.2) удовлетворяют ограничениям
Решение задачи интерпретации данных двухщелевого спектрометра методами редукции измерений
Видно, что результат решения представляет собой входной спектр, искаженный случайной погрешностью Rv и «ложным сигналом» (RB — U)f. Искажения входного спектра, связанные с наличием ложного сигнала, выражается в уширении пиков и в дополнительных пиках положительной и отрицательной амплитуды, однако попытка уменьшения ложного сигнала, согласно оперативной характеристике, приводит к увеличению сигнала случайной погрешности.
На рисунках 4.9 и 4.10 представлены результаты решения задачи интерпретации данных для более мелкого шага длины волны. Задача ставилась и решалась так же, как при получении результатов, представленных на рисунке 4.8, отличие состоит в том, что на рисунке 4.9 вычислялась оценка спектра в точках на интервале длин волн от 588.20 нм. до 590.30 с шагом 0.005 нм. Для результата, представленного на рисунке 4.9, шаг по длинам волн составляет 0.001 нм. Видно, что общий ход зависимости оценки от длины волны на всех рисунках — 4.8, 4.9 и Рис. 4.10. Результат редукции модели выходного спектра , изображенного на рисунке 4.6 (шаг=0.001 нм.) — примерно одинаков, это является следствием того, что оценки во всех трех случаях являются линейными комбинациями одних и тех же 211 непрерывных функций аД-), і = 1,... ,211, только вычисляются значения этих линейных комбинаций на все более мелкой сетке.
В этом параграфе метод, описанный в разделе 2.1, применялся для редукции измерений интенсивности излучения газоразрядной лампы на длинах волн в окрестности эмиссионного спектра D-линии натрия (дублета с положением максимумов Аі = 588.9950 нм. и А2 = 589.5924 нм.). Ширины щелей спектрометра были выбраны так же, как в разделе 4.3.1, аппаратная функция имеет трапецивидную форму, ее график приведен на рисунке 4.5.
Спектр измерялся согласно схеме измерения (4.12), в которой длины волн xi,... , Ж211 изменялись от 588.20 до 590.30 с шагом 0.01 нм. Результат измерения спектра — вектор изображен на рис. 4.11. Рис. 4.11. Результат измерения спектра Na, выполненного на двухлучевом спектрометре физического практикума физического факультета МГУ имени М.В.Ломоносова
Ширина аппаратной функции существенно больше ширины линий дублета, в измеренном спектре они не разрешены. В математической модели спектрометрического эксперимента матричные элементы Bij = (ai,aj) = J а(х — Xi)a(x — Xj)dx матрицы В вычислялись точно по формулам (4.11), а ковариационный оператор погрешности был выбран равным Е = а21, где о-2 = 6.43 (усл.ед)2.
Значение длин волн, в которых оценивалось значение входного спектра, были выбраны на отрезке от 588.86 до 589.63 нм. с шагом 0.01 нм., что соответствует интервалу длин волн, на котором влияние ложного сигнала не приводит к существенным искажениям, не имеющим физического смысла (к отрицательным значениям оценки входного спектра).
Решение задачи (2.7) приводит к неприемлемо большой шумовой погрешности ЕЦД Ц2 на выходе "идеального измерительного прибора" U, поэтому вместо оценки функций в заданных точках проводилась редукция измерения к "идеальному измерительному прибору" U путем решения задачи (2.9).
Для выбора параметра си использовалась оперативная характеристика задачи редукции измерений (2.9), приведенная на рис. 4.12 в виде зависимостей Н(си) и G(UJ) UJ 0. Оперативная характеристика, графики которой приведены на рисунке 4.12, отличается от оперативной характеристики модельной задачи (рисунок 4.7), так как корреляционный оператор погрешности для математической модели измерения отличается значением дисперсии измерительной погрешности и числом точек, в которых вычисляется оценка проекции входного спектра, то есть числом координат вектора и. Было выбрано значение ш = 2-22; как видно из графиков 4.12, это обеспечивает достаточно малое отличие RB от U, и при этом ЕД( х ) Е . Так как число координат вектора Uf примерно в три раза меньше числа экспериментальных точек, это означает, что дисперсия шумовой составляющей оценки R в одной точке примерно в три раза больше экспериментальной погрешности.
На рис. 4.13 показан результат редукции в виде выходного сигнала прибора RB, измеряющего спектр в точках отрезка от 588.86 до 589.63 нм. с шагом 0.01 нм. Видна случайная составляющая в виде коррелированного шума, дающая два ложных максимума между пиками дублета.
На 4.14 приведена оценка спектра в виде графика выходного сигнала спектрометра, измеряющего спектр в точках того же интервала с шагом, равным 0.001 нм., то есть в точках, образующих в десять раз более густую сеть узлов на интервале от 588.86 до 589.63 нм. Видно, что уменьшение шага по длинам волн практически не приводит к изменению графика по сравнению с графиком 4.13, так как информация, представленная оценкой проекции функции д(-) на линейную комбинацию функций ai(x) = а(х -ХІ), і = 1,..., 211, не позволяет передать резкие изменения функции д(-) на