Содержание к диссертации
Введение
Глава 1. Обзор задач цифровой обработки сигналов и изображений и место непараметрических методов среди возможных подходов к их решениям 13
1.1. Задачи непараметрического обнаружения полезного сигнала, наблюдаемого на фоне шума 14
1.2. Непараметрический подход в задачах классификации и сегментации изображений 25
1.3. Непараметрические подходы к оцениванию и фильтрации сигналов и изображений 34
1.4. Выводы к главе 41
Глава 2. Непараметрические критерии обнаружения полезного сигнала, на фоне шума, отличающегося дисперсией 43
2.1. Построение выбеливающего фильтра 52
2.2. Непараметрические статистики масштаба,.основанные на превышающих наблюдениях 69
2.3. Улучшение характеристик критерия превышающих наблюдений с помощью алгоритма группировки исходных наблюдений 81
2.3.1. Использование принципа группировки исходных данных для случая масштабных различий гипотезы и альтернативы 85
2.3.2. Бинарное правило принятия решения, основанное на линейно - взвешенном суммировании Т статистик групп 96
2.4. Выводы к главе 106
Глава 3. Синтез непараметрических статистик на основе проективного подхода 108
3.1. Синтез непараметрической процедуры принятия решения, основанный на методе проекций 110
3.2. Способ измерения проекций по исходным наблюдениям 115
3.3. Алгоритмы принятия решения о различии средних значений и дисперсий наблюдений выборок, основанные на измерении вектора проекций. 117
3.4. Выводы к главе 124
Глава 4. Адаптация ранговых алгоритмов при зависимых наблюдениях ... 126
4.1. Исследование влияния зависимости исходных наблюдений на ранговые распределения с использованием «детерминированной» модели возникновения совпадений 134
4.1.1. Оценка параметра зависимости наблюдений г) для «детерминированной» модели 140
4.2. Исследование влияния зависимости исходных наблюдений на ранговые распределения на основе «стохастической» модели возникновения совпадений 144
4.2.1. Оценивание параметра а модели зависимых наблюдений 160
4.3. Модели зависимости исходных наблюдений, применяемые для двухвыборочных ранговых статистик 161
4.3.1. Исследование влияния зависимости исходных наблюдений на распределения многомерных ранговых статистик с использованием «детерминированной» модели возникновения совпадений на примере статистики Вилкоксона. 163
4.3.2. Исследование влияния зависимости исходных наблюдений на распределения многомерных ранговых статистик с использованием «стохастической» модели возникновения совпадений на примере статистики Вилкоксона. 172
4.4. Выводы к главе 192
Глава 5. Ранговые алгоритмы бинарной сегментации одномерных сигналов и изображений 194 5.1. Постановка задачи ранговой бинарной сегментации одномерных сигналов и изображений 195
5.2. Синтез алгоритма ранговой бинарной сегментации одномерных сигналов 198
5.3. Рабочие характеристики алгоритмов ранговой бинарной сегментации одномерных сигналов и изображений 214
5.4. Сравнение алгоритмов ранговой бинарной сегментации одномерных сигналов и изображений с известными правилами сегментации наблюдений 244
5.5. Одномерные алгоритмы ранговой многоуровневой сегментации 249
5.6. Использование одномерных алгоритмов ранговой бинарной сегментации при решении некоторых задач обработки сигналов и изображений 255
5.6.1. Использование алгоритма ранговой бинарной сегментации для классификации типа нарушения в сейсмической охранной системе 255
5.6.2. Использование алгоритма ранговой бинарной сегментации для выделения последовательностей буквенных и цифровых сим волов, нанесенных на борта железнодорожных вагонов 265
5.7. Выводы к главе 270
Глава 6. Ранговая бинарная сегментация многомерных сигналов и изображений 272
6.1. Постановка задачи ранговой бинарной сегментации многомерных сигналов и изображений 272
6.2. Синтез алгоритма ранговой бинарной сегментации многомерных сигналов 281
6.3. Сравнение результатов бинарной сегментации сигналов и оценивания параметров выборки, получаемых с использованием одномерного и многомерного (двухмерного) ранговых алгоритмов 302
6.4. Ранговая многоуровневая сегментация многомерных сигналов и изображений 313
6.5. Ранговая сегментация векторных изображений 325
6.6. Выводы к главе 342
7. Заключение 344
8. Список использованных источников 347
- Непараметрический подход в задачах классификации и сегментации изображений
- Использование принципа группировки исходных данных для случая масштабных различий гипотезы и альтернативы
- Способ измерения проекций по исходным наблюдениям
- Оценивание параметра а модели зависимых наблюдений
Введение к работе
Актуальность темы. Важной особенностью многих современных систем радиолокации и навигации, связи, робототехники является наличие в их составе блоков или подсистем, предназначенных для цифровой обработки информации. За последние годы круг прикладных задач, решаемых при помощи цифровой обработки сигналов и изображений, существенно расширился и включает в себя области от исследований в медицине, судебной экспертизе, геологии, связи до задач автономного обнаружения, навигации и классификации объектов в военном деле и охране стратегически важных объектов. Развитие цифровых систем обработки информации обусловлено с одной стороны необходимостью автоматизации переработки гигантских объемов информации, а с другой - прогрессом в области вычислительной техники, в частности, связанным с развитием сигнальных процессоров. Последнее обстоятельство обеспечивает базу для создания высокоэффективных информационных систем для широкого круга прикладных задач. Наряду с развитием вычислительных средств и технологий не менее важной составляющей для успешного решения таких задач является разработка эффективных в вычислительном плане алгоритмов обработки данных. Повышение степени автоматизации обработки информации часто требует создание алгоритмов, качественные характеристики которых были бы устойчивы по отношению к неизвестным (либо меняющимся в процессе наблюдений) параметрам и свойствам регистрируемых сигналов. Это свойство является особенно важным для автоматических систем, исключающих присутствие оператора, корректирующего параметры системы. Однако, создание устойчивых алгоритмов актуально и для систем, элементом которых является человек -оператор. Основной задачей здесь является снижение затрат высококвалифицированного, либо утомительного и непроизводительного человеческого труда и затрат на обучение обслуживающего систему персонала. В условиях априорной неопределённости разработчики сложных информационных комплексов достаточно часто идут по пути создания самообучающихся систем, либо систем, использующих обучение с учителем. В ряде случаев использование таких подходов затруднительно из-за значительных временных затрат, связанных с обучением (например, при использовании нейросетевых алгоритмов), либо вследствие значительной сложности алгоритмов самообучения (использующих, например, таксономию).
В работах Н.Винера, А.Н.Колмогорова, Б.Р.Левина, В.И.Тихонова,
Г.Ван-Триса обосновывается статистический подход к синтезу алгоритмов
обработки сигналов. Основные достоинства указанного подхода
заключаются в следующем.
Во-первых, статистический подход выпукло отражает
информационный аспект проблемы, что является весьма важным для решения задач, связанных с обнаружением, классификацией объектов, а также с оцениванием параметров сигналов. Понятия априорной
неопределённости в рамках данного подхода приобретает ясный математический смысл.
Во-вторых, применение данного подхода позволяет использовать соответствующий математический аппарат, разработанный для различных приложений и включающий в себя такие средства как, например, байесовская теория построения оценок и принятия решений, винеровская и калмановская фильтрация, теория непараметрического обнаружения и оценивания сигналов, теория марковских процессов и т.д. Теоретические основы указанных подходов изложены в работах Э.Лемана, Г.Ван-Триса, П.Хьюбера, Б.Р.Левина, Ю.Г.Сосулина, В.И.Тихонова, И.К.Кульмана, Р.Л.Стратановича.
В-третьих, статистический подход является достаточно универсальным средством для создания широкого класса моделей сигналов и изображений.
Одной из основных проблем статистического подхода является синтез алгоритмов обнаружения, оценивания или классификации в условиях априорной неопределенности (неполной информации о вероятностных свойствах модели). В теоретических работах по статистической обработке сигналов П.С.Акимова, В.А.Богдановича, П.А.Бакута, Б.Р.Левина, а также в работах по математической статистике Я.Гаека, Г.Дэйвида, Э.Лемана, П.Хьюбера излагаются способы построения эффективных алгоритмов в условиях априорной неопределённости. Одним из очевидных способов преодоления априорной неопределённости является использование процедуры обучения на основе регистрируемых наблюдений, восполняющей неполноту информации о статистических свойствах модели. Однако использование подобного подхода имеет ряд недостатков, связанных с необходимостью контролировать качество и устойчивость получаемых оценок, проблемой формирования обучающих выборок, возможностью использования подобных алгоритмов в режиме реального времени и увеличение их вычислительной сложности. В статистической теории проверки гипотез существует развитый аппарат, который позволяет синтезировать оптимальные решающие правила в условиях параметрической априорной неопределённости (когда тип распределения считается известным) без использования процедур обучения. Оптимизация при этом осуществляется по критерию Неймана - Пирсона, который обеспечивает максимальную вероятность правильного обнаружения при фиксированной вероятности ложной тревоги для любых значений неизвестных параметров. Правило, удовлетворяющее такому критерию, называется равномерно наиболее мощным (РНМ). Во многих задачах обработки сигналов и изображений (задачах с непараметрической априорной неопределённостью) вид распределения исходных наблюдений не известен, либо может меняться в процессе наблюдения. В этом случае обычно используют статистики, инвариантные к виду распределения исходных данных. Примером таких статистик являются, например, ранговые и знаковые статистики, статистики, основанные на превышающих наблюдениях. Использование подобных статистик применительно к ряду задач обработки сигналов и изображений
Непараметрический подход в задачах классификации и сегментации изображений
Применение параметрических подходов предполагает знание параметрического семейства функций распределения (ФР) наблюдений, все или некоторые характеристики которого неизвестны [15, 22, 51, 111]. Обычно полагают, что многомерная плотность вероятности наблюдений является гауссовской- и ковариационная функция при этом неизвестна. Построение решающих процедур в этом случае может быть основано на получении предварительных оценок неизвестных параметров по обучающим выборкам и использовании этих оценок в оптимальных байесовских алгоритмах для заданного семейства ФР [22, 111, 132]. В статистической теории проверки гипотез существует развитый аппарат, который позволяет синтезировать оптимальные решающие правила в условиях параметрической неопределённости без использования процедур обучения. Оптимизация при этом также осуществляется по критерию Неймана — Пирсона, который обеспечивает максимальную вероятность правильного обнаружения при фиксированной вероятности ложной тревоги для любых значений неизвестных параметров. Правило, удовлетворяющее такому критерию, называется равномерно наиболее мощным (РИМ) [22, 111, 124] и, к сожалению, редко существует в практически важных случаях [71]. Однако, благодаря применению принципов инвариантности, несмещённости и подобия [111] в некоторых задачах удаётся построить РНМ критерий в более узких классах решающих правил: инвариантных, несмещённых, либо подобных.
Математический аппарат, основанный на использовании указанных принципов, развит в [15, 22, 111]. Основной проблемой при использовании параметрического подхода для решения задач обнаружения в сейсмических системах является нестабильность их характеристик обнаружения вследствие возможного изменения ФР наблюдений в процессе регистрации данных. Применение процедуры обучения при этом не всегда возможно из-за дополнительных временных и аппаратурных затрат, связанных с выполнением данной процедуры. Характеристики процедуры обучения, кроме того, зависят от вида исходного распределения наблюдений и легко оцениваются только в частных случаях (обычно связанных с гауссовским распределением исходных наблюдений). При использовании обучения обычно не удаётся жёстко стабилизировать важнейшую характеристику обнаружения критерия - вероятность ложной тревоги. Решая проблему обнаружения как задачу с непараметрической априорной неопределённостью предполагают [71, 73, 124, 126], что вид ФР помехи -FQ(X) и полезного сигнала - Fi(x) неизвестен и при этом в общем случае функции FQ(X) И FI(X) различны: FQ(X) FI(X). В ряде задач допустимо предположение, что распределения наблюдений помехи и полезного сигнала принадлежат одному типу и отличаются каким-либо признаком (например, сдвигом или масштабом в последовательности наблюдений). Различие дисперсий распределений полезного сигнала и помехи в данном контексте может рассматриваться как признак масштабных различий, а различие математических ожиданий как признак сдвига распределений. Процедура принятия решения связана с применением того или иного теста, решающая статистика которого чувствительна к указанным признакам. Алгоритмы обнаружения, используемые в этих случаях, называются непараметрическими, если распределение их решающих статистик не зависит от распределения помехи [32, 33, 71, 73, 124]. Это означает, что такие алгоритмы позволяют стабилизировать вероятность ложной тревоги на заданном уровне независимо от вероятностных свойств помехи.
В основе непараметрического обнаружения лежит процедура проверки статистических гипотез относительно наблюдений выборок. Следует отметить, что строгий синтез непараметрических критериев является сложным и приводит к построению громоздких решающих процедур [124]. При этом задача синтеза решается для асимптотического случая, когда число наблюдений стремится к бесконечности [71], а распределения, соответствующие гипотезам, бесконечно сближаются. На практике же для выборок конечного объёма мощность таких тестов и скорость её сходимости к асимптотическому значению могут оказаться низкими, поэтому для случая конечного числа наблюдений обычно применяются эвристические алгоритмы, основанные на ранговых, знаковых или иных непараметрических статистиках, а также функциях от них [32, 33, 56, 64]. В работах [33, 71, 124, 131] было показано, что в ряде случаев эти статистики обладают высокой асимптотической эффективностью. Кроме того, алгоритмы, построенные на ранговых и знаковых статистиках обладают устойчивостью рабочих характеристик при изменении вида ФР наблюдений, вызванных, например, их монотонным нелинейным преобразованием, т.е. являются робастными в этих условиях, чем выгодно отличаются от параметрических тестов [2, 16, 130]. Обычно непараметрические критерии проверки гипотез строятся по двухвыборочной схеме [33]. В задачах обработки сигналов и изображений [3, 4, 141] одна из выборок, в отношении которой выносится решение (рабочая), формируется из элементов, попавших под некоторую пространственную или временную маску, совпадающую по форме с обнаруживаемым объектом. Другая выборка (опорная) формируется из наблюдений, расположенных в непосредственной близости (пространственной или временной) по отношению к элементам маски.
Использование принципа группировки исходных данных для случая масштабных различий гипотезы и альтернативы
Порог обнаружения Cf2 решающего правила, использующего статистику Г2, рассчитывается по формуле, аналогичной (2.32) при заданном значении вероятности ложной тревоги а. Для того, чтобы - понять, какое место занимает критерий, использующий статистику Т , среди других непараметрических критериев масштаба, и насколько он проигрывает т оптимальному критерию, основанному на статистике Lxi (при i=l гауссовском распределении наблюдений), на рисунке 2.8 приведены зависимости мощности этого критерия D от контраста дисперсии // для нескольких значений а при п = т - 32 и гауссовском распределении исходных наблюдений. Видно, что непараметрический критерий превышающих наблюдений, имеют мощность, сопоставимую с мощностями упомянутых выше критериев Ансари-Брэдли (штриховые линии) и Муда (штрихпунктирные линии). При этом, критерий превышающих наблюдений (как и критерии, основанные на ранговых статистиках), существенно проигрывает оптимальному критерию, основанному на статистике Z (при гауссовском распределении наблюдений). Выше уже говорилось, что этот критерий нельзя рассматривать как реальную альтернативу непараметрическим тестам, поскольку для его работы необходима полная априорная информация о распределении помехи. D(n) Рабочие характеристики критериев масштаба: сплошная линия — статистика 7 ; штрихп у нктирная линия — статистика суммы квадратов рангов Sj; штриховая линия - статистика критерия Ансари-Брэдли Sj; пунктирная линия — статистика суммы квадратов наблюдений Z
Зависимости мощности критериев Неймана — Пирсона, использующих статистики Г2, S\ и $2 от масштабного множителя ft, приведенные на рисунке 2.8, получены в результате численного решения уравнений (2.32), (2.34) с учетом выражения (2.40). 2.3. Улучшение характеристик критерия превышающих наблюдений с помощью алгоритма группировки исходных наблюдений
Ниже предлагается способ увеличения мощности критериев превышающих наблюдений 7 и 7 , основанный на предварительной группировке исходных отсчетов по уровням с помощью специальной пороговой процедуры 0(Z,U), вычислении статистик 7 (72) по соответствующим группам отсчетов и комбинировании статистик групп для принятия окончательного решения [89]. Пороговая процедура задаётся с помощью функции 0{Z,U). Здесь Z ={zi,Z2,....zi} - выборка отсчетов; U = {ui,U2,..-ujc_i} - набор порогов. С помощью пороговой процедуры &{Z;a) со скалярным порогом и исходную выборку Z можно разбить на две группы Zj и Z2. При этом группа Z состоит из элементов Z больших порога и, a Z2 - меньших. В результате такой процедуры формируются группы наблюдений, описываемые плотностями P (z/z u) и P\{zlz u) с ограниченными областями определения (рис. 2.9). В результате группировки наблюдений выборки конечного размера может оказаться, что какая-либо из групп не содержит элементов. Исходная плотность распределения P{z) представляется комбинацией плотностей групп:
Предварительная группировка исходных отсчетов по уровням Если для обнаружения сигнала используется двухвыборочный непараметрический алгоритм, то группировке (с использованием единой процедуры 0(Z;U)) подвергаются наблюдения рабочей и опорной выборок. В результате применения пороговой процедуры с вектором порогов U = {ai,U2,-;Ujc_i} к наблюдениям рабочей X и опорной Y выборок формируются группы Х Хч -уХу- и Y 7Y2,— yYy.. В частности, если вектор порога U состоит из одного элемента U = щ, то получится четыре группы -две из элементов опорной выборки Y- Yi,Y2 (их общий объём равен общему объёму опорной выборки п = пг + п2) и две из элементов рабочей X - Xi,Xo (их общий объём равен общему объёму рабочей выборки т -т- + т )-После группировки непараметрический тест применяется к соответствующим группам наблюдений опорной и рабочей выборок. В общем случае формируются к частичных непараметрических статистик Sbni,nL s2m2,n2— Skmk,nk рассчитанных для выборок XbYx, X2,Y2,...,Xk,Yk. Принятие бинарного решения HQ(H{) может осуществляться на основе одного из следующих способов: состоят из наблюдений, характеризующихся одной и той же плотностью вероятности, поэтому статистики критерия, рассчитанные для каждой из групп наблюдений, обладают непараметрическим свойством (при фиксированных размерах частичных выборок). Так, распределение статистики Sj (условное по отношению к размерам частичных рабочей и опорной выборок т{,п,) при гипотезе P(Sj/Ho,mj,rij), не зависит от вида исходного распределения наблюдений. Что касается размеров получаемых частичных выборок mi,m2,-,fnjc,ni,n2,...,njc, то они, вообще говоря, будут случайными, а их совместное распределение подчиняется полиномиальному закону, параметры которого будут зависеть от размеров исходных выборок X и Y (т и /г, соответственно), порогов группировки U и распределения исходных наблюдений.
Способ измерения проекций по исходным наблюдениям
Поскольку увеличение корреляции исходных наблюдений приводит к уменьшению «эффективного» объема выборки и, как следствие, утяжелению хвостов распределения ранговой статистики, то для стабилизации а в этом случае необходимо изменять порог обнаружения в сторону его повышения [52]. В случае, если многомерное распределение исходных наблюдений отличается от гауссовского, коэффициент корреляции р уже не является исчерпывающей характеристикой зависимости отсчетов выборки и не может быть использован для коррекции порога обнаружения ранговой статистики. Для иллюстрации этого утверждения рассмотрим следующий пример. Сформируем общую выборку X из п коррелированных отсчетов гауссовского марковского процесса в соответствиих правилом: нелинейными функциями типа у = х , где к - нечетное целое число, например, к = 3 и к = 5. Применение такого типа нелинейного преобразования трансформирует гауссовское распределение исходных наблюдений. Если теперь воспользоваться правилом (4.4) для нахождения оценок одношагового коэффициента корреляции исходных наблюдений р, то они окажутся смещенными в область меньших значений этого параметра. Для иллюстрации указанной закономерности после соответствующего нелинейного преобразования исходного марковского гауссовского сигнала (4.5) были получены оценки р в соответствии с правилом (4.4) при различных значениях одношаговой корреляции (объем выборки, по которой проводилась оценка, составлял я = 104 элементов). Результаты этого статистического эксперимента сведены в таблицу 4.1.
Известно, что нелинейное преобразование данных с использованием монотонно возрастающей функции не оказывает никакого влияния на значения рангов элементов выборки и на распределение ранговых статистик. Таким образом, для сохранения вероятности ложной тревоги на заданном-уровне адаптация порога обнаружения при степени нелинейности к=1, а также при 3 и 5, должна осуществляться с применением одного и того же значение р, соответствующего первой строке таблицы. Использование заниженных значений оценок одношаговой корреляции при коррекции порога приведет к увеличению вероятности ложной тревоги. Приведенные выше результаты заставляют искать отличные от р характеристики зависимости негауссовских наблюдений, пригодные к использованию в случае ранговых статистик, а также способы построения их оценок.
Рассмотрим более детально механизм влияния зависимости исходных наблюдений на распределения рангов и статистик, построенных на их основе. Отметим, что базовой операцией при вычислении рангов элементов является сравнение. Пусть имеется выборка X = {xi,X2,—,xn}, состоящая из п отсчетов, распределение которой описывается функцией Р(ХИсследование влияния зависимости исходных наблюдений на ранговые распределения с использованием «детерминированной» модели возникновения совпадений
Приведенный выше механизм поведения условных вероятностей (4.6)...(4.8) можно описать в терминах уменьшения эффективного объема выборки X. Для выборки зависимых наблюдений X, физического размера п отсчетов, можно указать такое эквивалентное значение выборки независимых наблюдений п0ф п, вариационный ряд которой содержит столько же информации о распределении наблюдений, сколько её содержится вариационный ряд из п отсчетов исходной выборки. Величину
Простейший способ моделирования уменьшения эффективного объема выборки по сравнению с исходным объемом состоит в представлении исходной выборки в виде некоторого числа пэф независимых отсчетов, каждый из которых повторяется
В этом случае значение г\ является целым и имеет смысл размера выборки отсчетов, содержащей столько же информации о распределении наблюдений, сколько её содержится в одном отсчете этой выборки. Если все отсчеты сигнала совпадают, то условие (4.8) выполняются для любого размера выборки X, и при этом rj = n. Если сигнал состоит из независимых отсчетов, то равенство (4.8) выполняется лишь для rj =1. Необходимо отметить, что для описанной модели наблюдений функции условных вероятностей Pl (Rj) = Р(у х; I R(XJ )), р2 (Rj ) = P(y xi/ R(x;)) имеют ступенчатый характер (рис. 4.1). Подобные ступенчатые функции плохо согласуется с формой тех же зависимостей, получаемых в результате статистического эксперимента для наиболее часто используемых на практике моделях сигналов. Значение г}, тем не менее, может служить устойчивым и адекватным показателем степени зависимости исходных наблюдений. В отличие от коэффициента корреляции р на этот показатель не оказывают влияние преобразования, которые не приводят к изменению положения наблюдений в вариационном ряду (т.е. монотонные нелинейные преобразования). Можно подобрать такое значение rj, что распределение ранговой статистики, вычисленной по коррелированной исходной выборке, и модели практически совпадают [93]. Оставим пока открытым вопрос получения оценки rj по исходным наблюдениям обучающей выборки и, найдем распределение ранга для предложенной «детерминированной»
Выборка разбивается на группы отсчетов одинакового размера т]. Зависимость отсчетов внутри группы много сильнее чем зависимость отсчетов, принадлежащих разным группам. В предельном случае отсчеты, принадлежащие различным группам независимы, в то же время отсчеты внутри группы совпадают.
Оценивание параметра а модели зависимых наблюдений
Анализируя графики, приведенные на рис. 5.8, 5.11, отметим интересный, но достаточно очевидный факт. Качество оценок I и к улучшается (среднеквадратическое отклонение оценок сг/=д/(/-/) и а і = д/ (& - к) падает), когда количество наблюдений в рабочей выборке Z одного из классов приближается к общему количеству наблюдений этого класса в выборке Q (т.е. к- l). Качество оценок улучшается также когда к приближается к т. Таким образом, мы можем в значительной степени влиять на качество оценок киї (улучшать их), если сможем формировать рабочую выборку Z преимущественно из элементов одного из классов 228 (например X), а опорную V - из другого (соответственно Y). Если бы имелась возможность формировать рабочую и опорную выборку только из элементов «своего» класса, то оценки к и / были бы абсолютно точными. Однако это означает также, что если выборки сформированы указанным способом, то классификация наблюдений Q фактически состоялась на основе «пространственного» признака и нет нужды привлекать какие-либо дополнительные правила, основанные на различии уровней классов. Очевидно, что при постановке большинства задач сегментации предполагается неопределенность в положении отсчетов классов X и Y в выборке Q и невозможность сформировать рабочую и опорную выборки указанным выше способом. Однако можно улучшать характеристики алгоритма оценивания путем подбора положения рабочей выборки Z. Этого можно добиться формируя несколько рабочих выборок
Возможная схема формирования нескольких рабочих выборок включающих различные наблюдения общей выборки Q. Возможные схемы формирования нескольких рабочих выборок из отсчетов реализаций одномерного сигнала и изображения приведены на рис. 5.12.
Минимизация (либо максимизация) по t выражений для вычисления оценок (5.43) означает следующее. Оценки kj,i = l,t - положение минимума (максимума) функции находится для каждой рабочей выборки Zj,i = l,t, при этом также вычисляется значение функции в соответствующей точке к{. В качестве результирующей оценки к используется такое значение kj, которому соответствует минимальное (максимальное) из t полученных для разных выборок Zz- значений функции. Фактически, выполнение дополнительной минимизации (максимизации) по параметру t означает, что мы подбираем такое положение рабочей выборки, при котором в нее попадает максимальное количество точек одного класса и минимальное — другого, т.е. она «собирает» по возможности все отсчеты одного из классов. Из рис. 5.10, 5.11, построенных для различных значений у и /3, следует также, что при уменьшения степени перекрытия распределений наблюдений классов, т.е. при улучшении различимости классов по уровню качество оценок киї улучшается и приближается к предельно достижимому, имеющему место при потенциально безошибочном разделении отсчетов классов Хи Гпоуровню.
Рассмотрим теперь вопрос о характеристиках алгоритма различения гипотез HQ,ffi- Как было отмечено ранее, этот алгоритм, основанный на
обобщенном отношении правдоподобия Л(Ё) (5.17), обладает непараметрическим свойством. Это значит, что распределение решающей статистики этого алгоритма не зависит от распределения исходных наблюдений, а определяется при гипотезе HQ количеством наблюдений класса X в рабочей выборке (параметром к), а при альтернативе Н\, кроме того, количеством наблюдений класса X в общей выборке (т.е. параметрами киї). Таким образом, выбрав заранее порог С в соответствии с выражением (5.18), можно стабилизировать вероятность ложной тревоги a на заданном уровне (при известном или оцениваемом параметре к). Расчет вероятности ложной тревоги (и определение соответствующего порога С) можно произвести на основе выражения (5.35). Поскольку все ранговые траектории равновероятны, а общее количество различных ранговых траекторий при гипотезе Н0 определяется выражением: =С\1г. Imfi n-A-riImV ТО нахожДение вероятности ложной тревоги сводится к подсчету ранговых траекторий N из распределения P(R/ к,Н$), удовлетворяющих определенному условию, задаваемому функцией h(R), и отнесение N к общему числу траекторий при гипотезе TVQ- Необходимо отметить, что поскольку траектории формируются в соответствии с распределением P(R/k,Ho), то границы суммирования в выражении (5.35), найденные для более общего случая, когда к и / не связаны друг с другом, должны быть пересчитаны. Можно показать, что выражение, подобное (5.35), полученное для гипотезы HQ, имеет следующий вид:
Ранговые траектории, которые учитываются с единичным весом при суммировании согласно (5.44) - это такие траектории, которые хотя и формируются в соответствии с распределением P(R/ к,Нд), однако ошибочно рассматриваются алгоритмом различения гипотез A(R) (5.17) как принадлежащие распределению P(R/k,l,Hi). С учетом (5.44) вероятность ложной тревоги вычисляется следующим образом:
Рассчитанная согласно (5.44), (5.45) вероятность ложной тревоги соответствует определенному значению параметра к. От этого значения зависит конкретный вид границ суммирования в (5.44). Таким образом, вычисляемая согласно (5.44), (5.45) вероятность а соответствует заданному значению к. Полная вероятность ложной тревоги вычисляется в результате суммирования частичных вероятностей, рассчитанных для различных значений параметра к из диапазона [0, т\:
В формуле (5.46) Р(к) - априорное распределение параметра. Для расчета вероятности ложной тревоги ак упростим вычисление отношения правдоподобия (5.20). Очевидно, что статистика $ [к-п/т] п-[к-п/т] записанная в знаменателе выражения (5.20) не зависит напрямую от R, а принимает одно из т +1 возможных значений, соответствующее тому из диапазона [0 1, которое минимизирует S. Можно показать, что S(k) S(m/2) = Smin, \ґк =[0,т]. Используя, таким образом, в знаменателе
Применяя правило (5.47) вместо (5.20) мы, тем самым, настраиваемся на заведомо наихудший случай — расчетное значение вероятности ложной тревоги ссг будет завышенным по сравнению со значением а, получаемым в статистических экспериментах. Использование алгоритма (5.44) для вычисления вероятности ложной тревоги связано с довольно значительными временными затратами, что объясняется необходимостью перебора всех возможных ранговых траекторий. Можно предложить правило, существенно упрощающее вычисления. Возможность упрощения связана со следующими соображениями. Допустим, мы установили, что в некоторой точке (i,R )) упорядоченной ранговой выборки Ai(R) C, тогда очевидно, что в точке этой выборки (J,R(J ), доставляющей минимум числителю (5.47), значение Ai(R) тем более будет меньше порога. Кроме того, можно также показать, что для всех значений R , меньших R l\ будет выполняться неравенство Л±(Ё) С. Это означает, что для вычисления вероятности ложной тревоги необходимо для каждого значения параметра k = j найти