Содержание к диссертации
Введение
1. Задача распознавания радиолокационных объектов по поляризационным признакам 10
1.1. Поляризационные признаки радиолокационных объектов 10
1.2. Краткие сведения из теории распознавания и принятия решений 23
1.3. Устройства распознавания радиолокационных объектов по поляризационным признакам 45
1.4. Выводы и постановка задачи 56
2. Численный метод формирования достаточной статистики отношения правдоподобия 60
2.1. Оценки совместных функций распределения вероятности совокупностей поляризационных признаков 60
2.2. Оценки совместных функций плотностей вероятности совокупностей поляризационных признаков 73
2.3. Численный метод формирования достаточной статистики 89
3. Нейросетевое моделирование устройств распознавания радиолокационных объектов 109
3.1. Обоснование структуры искусственной нейронной сети 109
3.2. Алгоритм построения искусственной нейронной сети 118
4. Результаты исследования нейросетевых моделей устройств распознавания радиолокационных объектов 151
4.1. Стохастическое поляризационное моделирование радиолокационных объектов 151
4.2. Исследование численного метода оценки совместных функций плотности вероятности совокупностей поляризационных признаков 154
4.3. Исследование численного метода формирования достаточной статистики 162
4.4. Исследование нейросетевых моделей устройств распознавания радиолокационных объектов 166
Заключение 173
Список литературы
- Краткие сведения из теории распознавания и принятия решений
- Оценки совместных функций плотностей вероятности совокупностей поляризационных признаков
- Алгоритм построения искусственной нейронной сети
- Исследование численного метода оценки совместных функций плотности вероятности совокупностей поляризационных признаков
Введение к работе
Теоретические и экспериментальные исследования последних лет показали, что использование свойства объектов изменять поляризацию отраженной электромагнитной волны позволяет повысить информативность зондирующего сигнала при распознавании целей методами активной радиолокации.
В работах последних лет, посвященных изучению поляризационных свойств радиолокационных объектов, особое внимание уделялось выявлению тех поляризационных характеристик зондирующих сигналов, которые бы являлись наиболее информативными с точки зрения решения задачи распознавания.
Поляризационные свойства объектов обычно представляются в виде совокупности поляризационных признаков, образующих пространство значений поляризационных параметров целей (пространство параметров распознавания).
В ряде работ проводились исследования свойств поляризационных параметров различных радиолокационных объектов, в результате чего было установлено, что поляризационные параметры целей являются случайными величинами, подчиняющиеся различным статистическим законам для разных объектов. Для некоторых случаев было получено аналитическое выражение вероятностных законов распределения значений поляризационных параметров радиолокационных объектов.
В статистической теории распознавания образов правило принятия решения о соответствии наблюдаемого объекта тому или иному классу целей строится на основе отношений правдоподобия, или на основе достаточных статистик, получаемых путем некоторого монотонного преобразования отношений правдоподобия. Достаточная статистика используется для упрощения выражения отношения правдоподобия, т.е. для упрощения правила принятия решения. В конечном итоге это позволяет упростить устройство, реализующее это правило. Сами отношения правдоподобия строятся с использованием совместных функций плотности вероятности значений параметров распознавания, полученных для тех радиолокационных объектов, которые выступают в качестве альтернативных объектов распознавания.
Для реализации подобного способа создания устройств распознавания (обнаружителей) необходимо предварительно получить аналитическое выражение функции плотности вероятности, что само по себе представляет определенную проблему, поскольку исходными данными для решения этой задачи являются случайные значения поляризационных параметров целей. В связи с этим возникает необходимость, во-первых, тем или иным способом подобрать аналитическое выражение для функции плотности вероятности, а во-вторых, оценить параметры полученного закона. Как первый, так и второй этапы допускают возможность возникновения ошибки. Причем выявить такую ошибку достаточно сложно, особенно в случае многопараметрического распознавания.
Даже при условии правильного определения аналитического выражения для статистического закона получение простого выражения достаточной статистики может оказаться невозможным в силу потенциально различных законов для функций плотности вероятности разных радиолокационных объектов. В этом случае аналитическое выражение достаточной статистики может оказаться представленным в таком виде, в котором его будет трудно реализовать на практике.
С другой стороны, из теории обнаружения и оценок известно, что для решения задачи распознавания радиолокационных объектов, достаточно лишь правильно разбить пространство значений поляризационных признаков на области, соответствующие тому или иному классу целей. А решение о принадлежности наблюдаемого объекта какому-либо классу принимать путем определения той области, в которую попадает вектор, соответствующий входной совокупности значений поляризационных параметров цели.
Другими словами, получение аналитического выражения для функции плотности вероятности не является принципиально необходимым, при условии, что задача разбиения пространства признаков будет решена каким-либо иным путем. В этом случае задача распознавания радиолокационных объектов формулируется как задача распознавания образов, решаемая в условиях непараметрической априорной неопределенности.
В последнее время для решения подобных плохо формализуемых задач широко применяются искусственные нейронные сети. Искусственная нейронная сеть представляет собой сеть {реализованную в виде некоторого устройства или программы), состоящую из элементарных ячеек (формальных нейронов), объединяемых в слои с помощью однонаправленных связей. Количество слоев в сети, количество нейронов в слое, а также иерархия связей определяются сложностью задачи, решаемой нейронной сетью.
Особенностью нейронных сетей является то, что перед своей работой они должны проходить этап обучения, что приводит к необходимости использования специальных алгоритмов их настройки. Важным преимуществом искусственных нейронных сетей является высокая степень распараллеливания решения поставленной задачи, из чего следует высокая скорость получения решения.
Анализ работ, посвященных созданию искусственных нейронных сетей, показал, что нейронные сети достаточно успешно применяются, в частности, и для решения задач многоальтернативного распознавания образов в многомерном пространстве признаков.
Однако в этих работах отсутствует анализ соответствия реализуемых нейронными сетями решающих правил какому-либо критерию качества, определяемому в теории статистических решений. Это, в свою очередь, не позволяет производить оценку априорной вероятности правильного принятия решения о наличии или отсутствии обнаруживаемой радиолокационной цели в соответствии с выбранным критерием качества.
Отсюда следует, что в настоящее время существует актуальная научно-техническая задача разработки метода построения искусственных нейронных сетей, используемых для распознавания радиолокационных объектов в многомерном пространстве поляризационных признаков в условиях непараметрической априорной неопределенности, и реализующих решающее правило, которое бы удовлетворяло выбранному критерию качества принятия решения.
Решение данной проблемы позволит улучшить селектирующие способности поляризационных РЛС.
Целью настоящей диссертационной работы является:
1. Разработка метода формирования достаточной статистики, реализующей такое правило принятия решения, которое бы удовлетворяло выбранному критерию качества, в случае многоальтернативного многопараметрического распознавания радиолокационных объектов по поляризационным признакам в условиях непараметрической априорной неопределенности.
2. Разработка метода построения искусственных нейронных сетей, предназначенных для распознавания радиолокационных объектов в условиях непараметрической априорной неопределенности и реализующих предложенное правило принятия решения.
3. Программная реализация разработанного метода формирования достаточной статистики и метода построения искусственных нейронных сетей, а также экспериментальное исследование распознающих способностей этих нейронных сетей с использованием математических моделей реальных радиолокационных объектов и нейросетевых моделей устройств распознавания.
Научная новизна работы состоит в следующем.
Осуществлена оптимизация численного метода операторной аппроксимации оценки совместных функций плотности вероятности значений поляризационных параметров, в результате чего удалось уменьшить количество независимых параметров оценки. Для других независимых параметров оценки предложены критерии определения их значений.
Разработан метод разбиения пространства признаков на области, принадлежащие различным классам радиолокационных объектов на основе совокупностей значений поляризационных параметров, соответствующих этим классам с использованием численного метода оценки совместных функций плотности вероятности.
3. Предложено правило принятия решения о принадлежности входного вектора значений поляризационных параметров тому или иному классу радиолокационных объектов на основе разработанного метода разбиения пространства значений поляризационных параметров на области, принадлежащие разным классам целей.
Разработан алгоритм формирования достаточной статистики, реализующей правило принятия решения при распознавании радиолокационных объектов для случаев одно и двухпараметрического многоальтернативаного распознавания на основе совокупностей значений поляризационных параметров, соответствующих этим объектам.
Разработан метод построения искусственных нейронных сетей, решающих задачу многоальтернативного распознавания радиолокационных объектов в многомерном пространстве поляризационных признаков, и удовлетворяющих критерию максимального правдоподобия качества принятия решения.
Практическая значимость работы заключается в следующем:
Разработанный метод формирования достаточной статистики и метод построения искусственных нейронных сетей позволяют создавать устройства распознавания радиолокационных объектов по поляризационным признакам в условиях непараметрической априорной неопределенности, реализующих решающее правило, которое удовлетворяет критерию качества максимального правдоподобия.
Устройства распознавания, разрабатываемые на основе предложенного метода построения искусственных нейронных сетей, позволяют повысить селектирующие способности радиолокационных систем.
3. Разработанное программное обеспечение осуществляет формирование нейросетевых моделей устройств распознавания радиолокационных объектов для случаев одно и двухпараметрического многоальтернативного распознавания, и позволяет определять влияние различных поляризационных параметров, а также размеров совокупностей значений этих параметров радиолокационных объектов, на вероятность ошибки принятия решения в условиях непараметрической априорной неопределенности. На публичную защиту выносится:
Предложенная оптимизация численного метода операторной аппроксимации оценки позволяет уменьшить сложность вычислений при получении операторных оценок совместных функций плотности вероятности.
Предложенный критерий оптимизации независимых параметров оценки позволяет реализовать численный метод операторной аппроксимации на практике.
Оптимизированный численный метод операторной аппроксимации оценки позволяет вычислять несмещенные и состоятельные операторные оценки совместных функций плотности вероятности совокупностей поляризационных параметров радиолокационных объектов.
4. Получаемые операторные оценки функций плотности вероятности позволяют использовать отношения правдоподобия при разработке алгоритмов принятия решения в условиях иепараметрической априорной неопределенности.
Использование операторных оценок функций плотности вероятности и применение критерия качества принятия решения максимального правдоподобия позволяет разбить пространство значений параметров распознавания на непересекающиеся области, соответствующие различным радиолокационным объектам, а также получить оценку вероятности ошибочных решений при распознавании целей.
Представление границ областей целей прямыми при двухпараметрическом и точками при однопараметрическом распознавании позволяет сформировать достаточную статистику в виде наборов логических условий (предикатов), объединяемых операциями конъюнкции и дизъюнкции.
7. Формирование достаточной статистики в виде набора предикатов позволяет построить искусственную нейронную сеть, осуществляющую распознавание радиолокационных объектов по поляризационным признакам.
Краткие сведения из теории распознавания и принятия решений
Таким образом, поляризационные признаки радиолокационных объектов могут быть использованы для решения задач распознавания радиолокационных целей, т.е. для решения задач принятия решений о соответствии наблюдаемого объекта тому или иному классу s„i=ui.
При использовании понятийного аппарата теории распознавания образов проблема распознавания радиолокационных объектов по поляризационным признакам может быть сформулирована следующим образом [10, 66,71 - 74 и др.].
В общем случае информация о наблюдаемой цели поступает на вход устройства распознавания, включающего Т измерительных каналов (ИК). Измерительным каналом в общем случае может быть как отдельный распознающий автомат (РА), объединенный вместе с другими автоматами и пунктом обработки информации в единую систему, так и схема, оценивающая значение конкретного поляризационного признака.
Каждый t-й ИК, t = I,T, анализирует значение одного признака х, или множества X, признаков цели. Объединение подмножеств X,, измеренных всеми ИК, составляет признак X цели; X = {Xt},t = l,T. Общее количество первичных признаков, используемых для решения задач распознавания, обозначим через п.
Результатом обработки признака X, в t-м ИК является величина (множество) у, = у, (X,). В простейшем случае у, = X,, хотя возможны и более сложные преобразования, например, принятие частных решений: _ _ [ 1, если в t - м ИК цель отнесена к классу SL; [О, в противном случае; или расчет вероятностей гипотез: X(P(Sm)-w(XJSm)) m-l где P(Sj)- вероятность появления цели, соответствующей классу Sis w(XtjSj) — значение условной, в общем случае многомерной, функции плотности вероятности для совокупности значений X, параметров цели, при условии, что совокупность значений X, отнесена к классу целей S;.
Признаки Xt могут измеряться разными ИК одновременно или последовательно. Последнему предположению с математической точки зрения эквивалентно многократное измерение одного и того же признака X в моменты t = 1, Т.
Множество результатов измерений всех ИК Y = yt} подается на устройство принятия общих решений. По отношению к нему множество Y служит вторичным признаком цели. Общее решение принимается после анализа множества Y и состоит в отнесении цели к одному из классов заданного алфавита Si или (и) расчете М апостериорных вероятностей гипотез: MY)- м Ц) , (1.21) где wY(YSj)— значение условной функции плотности вероятности совокупности вторичных признаков цели Y, при условии отнесения этой совокупности признаков к классу целей S
Наивысшую достоверность распознавания можно обеспечить при использовании совместных функций плотности вероятности w(X Si) или достаточных статистик признаков цели [73]. Для этого необходимо оценивать значения функций w(XSj) или достаточных статистик путем анализа множества Y = {yJ. Так, если возможны взаимно однозначные преобразования у, =yt(X,) и X, =Х((у,), то указанную задачу можно решить известными способами нахождения функций плотности вероятности функции случайной величины [65, 69].
В противном случае неизбежна потеря информации о цели. И тогда основной задачей становится задача минимизации таких потерь. Потери могут соответствовать и преобразованию вида yt = {hrt}, затрудняющему учет статистических связей между элементами множества X. Здесь пй - вероятности гипотез, рассчитанные в t-м ИК.
Если избежать потерь информации в ИК невозможно, то общее решение лучше всего принимать путем расчета и анализа совместных функций плотности вероятности вторичных признаков w(y, S;).
В общем случае определение выражений совместных функций плотности вероятности признаков цели затрудняется наличием статистических связей между этими признаками.
Выходом из ситуации является использование декоррелирующего преобразования суть которого заключается в следующем [10,64, 85].
Рассмотрим случайный вектор X, компоненты которого статистически зависимы. Причем будем учитывать только парные корреляционные связи между этими компонентами. Требуется определить совместную плотность распределения компонентов этого вектора. Допустим, что существует такое преобразование Y = G(X), при котором компоненты Ур j = l, L вектора Y - статистически независимы. Здесь L - общее количество вторичных признаков, используемых для решения задач селекции радиолокационных объектов.
Оценки совместных функций плотностей вероятности совокупностей поляризационных признаков
Используя метод, описанный в разделе 1.2 настоящей работы, выведем выражения для операторной оценки одномерной функции плотности вероятности с учетом введенного ранее определения оценки функции распределения вероятности (2.1).
Как уже указывалось ранее, оценка функция плотности вероятности й(х8() может быть аппроксимирована с помощью конечных разностей вида: Р(х,ы +f-( -h)ISg)-F(xMi, + -(2 )1) 2-И -0 " (2.25) _F(xm,n-bt--(2.h)lS,)-F(xm,n+t .(2h)Si) 2-h-k t ,t = ...,-1,0,1,...,t t", в точках ...,xmin-2-h,xmin-h,xmin,xmin+h,xmin+2-h,..., где h определяется выражением (2.2). Для определения оценки функции плотности вероятности в точках отличных от —.xlljll-2-h,x.h,-h,x11i1,xBil+h,xllil+2-h,... целесообразно использовать средневзвешенную оценку плотности для крайних точек отрезка группирования, в который попадает значение случайного параметра х.
Оценка функции распределения F(xS;) представляет собой эмпирическую функцию, определенную на конечном числе отрезков группирования размером h, границы которых представляют собой совокупность x,1j,...,x,1j,...,x,Nj = XyN}. Значения функции F(xS;) в точках, соответствующих этим границам известны и определяются соотношением (2.12), причем во всех точках X,N. значение функции F(xJSj) отлично от нуля. При х х()=хшіп, значение функции F(xISf) принимает нулевое значение, а при хx(N, = х значение этой функции равно единице.
В формулах (2.28)-(2.31) (x) и .2(x)-непрерывные функции, для которых должно выполняться условие нормировки: Х(х)+Х2(х) = 1 для всякого х, вытекающее из (1.34). В качестве X, (х) и 7 (х) могут быть использованы самые разные функции, их выбор зависит от априорной информации о поведении плотности распределения. В самом простом случае Xt (х) и (х) являются постоянными величинами. Такое допущение можно использовать, если априорная плотность распределения вероятности w(xSj) непрерывна и ограниченна в каждой точке х є (-со,+со).
Обозначим т = Х2(х), тогда Х(х) = 1-т, где м - неотрицательное число, называемое весовым коэффициентом операторной аппроксимации, 0 rj l [65]. Переменная к называется полуразмахом аппроксимации.
Таким образом, выражения (2.28) - (2.31) позволяют получить оценку одномерной функции плотности вероятности, т.е. функцию плотности вероятности одного из параметров обнаруживаемой радиолокационной цели.
Покажем, что операторная оценка вида (2.28) — (2.31) является состоятельной и несмещенной.
Предположим, что совокупность Xi l выборочных значений параметра х цели Sf представляет собой совокупность выборок случайного эргодического процесса J; = y(t), который характеризуется функцией плотности вероятности w(y).
Тогда математическое ожидание оценки (2.28) в соответствии с известной формулой для среднего значения функции случайной величины [65] будет определяться как: +00 {л \ m ,[w(xsO] = ]w(y)jpTiJ .(F(x(№l_,))Si)-F(x(! 1,))Si)) + +-4. = z -i W-f(IW I )- -pT -JwW- (IW4»l )-dy+ В формуле (2.32) каждый из интегралов представляет собой среднее значение оценки функции распределения вероятности F(xSt) в точках, соответствугощих границам отрезков группирования (см. (2.6)). И как уже было показано выше (см. (2.7) и (2.8)), в этих точках средние значения оценок равны функциям распределения вероятности. Таким образом, получаем: " [ ( s,)]=(2.k1_7).2-h-(F(x —» s-)-F(xp - is0)+ + (F(X « »IS )-F(X«-» IS ))- 2-33
В силу непрерывности априорной функции распределения вероятности F(xS;) в каждой точке х при h- 0 выражение (2.33) стремится к w(xS;), что дает основания утверждать, что тГтЦх8;)] = \у(х8;). Таким образом, условием несмещенности оценки (2.28) является условие стремления h — 0 при увеличении размера выборки Р.
В общем случае, выполнение условия h- О при Р—»оо, при определении h в соответствии с (2.2), не может быть гарантированно. Поскольку при увеличении Р будет происходить и расширение отрезка (х .х ), включающего все возможные значения случайного параметра целей, вплоть до бесконечности. Однако, в случае, если скорость расширения отрезка (хти,х1піп) будет меньше скорости увеличения Р, величина h будет уменьшаться при увеличении Р и оценка (2.28) будет являться несмещенной оценкой функции плотности вероятности параметра распознавания цели. В практических приложениях границы отрезка (хтаі,х1ПІ!1) всегда будут ограничены возможностями аппаратуры, осуществляющей измерение значений поляризационных параметров целей. Поэтому отрезок (х .х, ) всегда будет конечен. А это означает, что на практике при Р-»да= п-»0.
Для доказательства состоятельности оценки (2.28) проанализируем это выражение. Очевидно, что отклонение значения оценки w (х Sj) будет определяться отклонениями оценок F(xSj) в точках x,2,I(k),, x,2,ttk4)1 и х(г.(_1),. Наибольшее отклонение будет тогда, когда в точках xf2,l(l., и x,2,Ht ,., отклонение имеет один знак, а в точке х,2 1., - другой. В этом случае отклонения суммируются. И если известны отклонения оценок F(xS;), то по формуле (2.28) можно определить и отклонение оценки w (х S,).
Алгоритм построения искусственной нейронной сети
Работа алгоритма начинается с формирования совокупностей выборочных значений Х;л, где і = (1... М) - количество классов объектов распознавания, а Р - размер выборки.
Совокупность х[л представляет собой совокупность векторов, определенных в іі-мерном пространстве поляризационных признаков. В настоящей работе используются выборки, получаемые не для реальных объектов, а для их моделей. Модели формируются с использованием методов, описанных в разделе 2.1 настоящей работы. При этом предполагается статистическая независимость параметров распознавания. Параметры распознавания могут подчиняться одному из девяти статистических законов, описанных в Таблице 1.1. Для формирования случайных величин используется программный генератор случайных чисел, формирующий случайные числа с разными законами распределения.
На втором этапе осуществляется предварительное формирование областей Qj, соответствующих разным классам радиолокационных объектов по имеющимся совокупностям выборочных значений Х)Ч.
Алгоритм формирования областей Qf в случае одно и двухпараметрического распознавания представлен на рис. 3.4.
В случае, когда п — 1, т.е. когда осуществляется однопараметрическое распознавание, каждая из областей Q, (i=l...M), ограничивается двумя точками с координатами xmin и х . Поиск совокупностей {GPj в этом случае не представляет больших трудностей, поскольку достаточно найти минимальное и максимальное значение параметра распознавания х в совокупности X) l.
В случае двухпараметрического распознавания работа алгоритма начинается с поиска для кажцой совокупности XJ A, (i = l...M), четырех крайних вершин, представленных точками с координатами: Рі =(хіик,х2), Р2 =(xpx2ma;(), Р3 =(xlmaj(,x2), Р4 = (х„х2ш1п). (О (р) После их нахождения эти вершины должны быть помещены в начало совокупности X]
Первоначально осуществляется формирование совокупности вершин if; , содержащей Jt элементов. Вершины, входящие в эту совокупность - упорядочены по очереди их попадания в эту совокупность. Последовательность включения вершин в эту совокупность определяет те отрезки, которые будут использоваться в качестве границ областей Qt, т.е. входить в совокупности {GP;}.
При поиске очередной точки Р с координатами /х, , х2 ) совокупности Х;Ч, которая должна быть включена в совокупность Т; , осуществляется проверка следующего условия: при j = 1, npHJ = 2, npnj = 3, npHJ = 4, Дх, Дх, Дх, Дх, Дх, Дх, Дх, Дх, должно быть максимально, (Дх2 0), (Дх, 0); должно быть минимально, (Дх2 йО),(Дх, 0); должно быть максимально, (Дх2 0),(Дх, 0); должно быть минимально, (Дх2 0), (Дх, 0), (3.15) где Дх, =(xix-x,i.), Дх2 = x2l-x2t], (xlk,x2fc) - координаты вершины PJ, являющейся предыдущей для вершины Pj в совокупности тЛ .
Преобразование совокупности [тЛ в совокупность {GPJ осуществляется путем вычисления коэффициентов отрезков по формулам: a,= X1b X2b где вершина с координатами (хЬ,х2Ь) в совокупности JTjJ располагается перед вершиной с координатами (х1е, х2е).
Последняя вершина считается расположенной перед первой вершиной совокупности тД . Наличие условий выражения (3.16) обуславливается выражением (2.60), используемым для проверки попадания произвольной точки в область Qf, соответствующей і-ой цели.
Совокупности {GPj представляются в виде матриц коэффициентов и смещений вида: где \/ = (l...(z"+1)), z определяется выражением (2.63). При \j/ = l zv=z[,npn \у 1 zv = Sv (CM- (2.63)). Коэффициенты матриц A}1 и B; J должны формироваться с учетом того, что они являются коэффициентами предикатов (2.63). Матрицы А{ И В[ при VJ/ 1 представляют вогнутости совокупности {GPj}, а при \\ =l - совокупность отрезков, представляющих собой вьтуклую совокупность линий, ограничивающих область Q-. Совокупность всех матриц (AJ H и JBJJ} для всех целей образуют матрицы А, и В,. Алгоритм подпрограммы формирующей совокупность {GPf} представлен нарис. 3.5.
Работа алгоритма начинается с поиска вершины совокупности тЛ, которая являлась бы вершиной любой выпуклости области Qj.
Поскольку область Qf ограничивается замкнутой совокупностью отрезков {GPi}, то такая вершина обязательно будет присутствовать в \ТЛ Поиск вершины выпуклости может быть осуществлен по трем последовательно расположенным вершинам совокупности Т( . При этом берутся первая и вторая вершины и для них по формуле (3.16) вычисляются коэффициенты а1( а2 и Ь. Далее осуществляется проверка условия (а,-х,+а2-х2+Ь)0, где (х,,х2) - координаты третьей вершины. Если условие выполняется, то вторая вершина — вершина выпуклости. Если условие не выполняется, то необходимо перейти к следующей тройке вершин и повторить выполнение этих действий.
Исследование численного метода оценки совместных функций плотности вероятности совокупностей поляризационных признаков
В процессе вычисления по выражению (3.21) суммирование ведется только по тем точкам, которые попадают в области Хы или Х . При этом для проверки попадания очередной точки в эти области используется подпрограмма Find, алгоритм которой представлен на рис.3.6.
После вычисления значения Е , осуществляется запоминание совокупностей Tf и Тш для того, чтобы в случае неудачной попытки уменьшить значение Ejml путем введения новой вершины в эти совокупности, можно было бы вернуться к исходным совокупностям, соответствующим меньшему значению Е , или содержащим меньшее количество вершин.
На следующем этапе работы алгоритма рис.3.13 осуществляется введение новых вершин в совокупности Tf и Тш. Новые вершины вводится между вершинами tl? и t2, с 144 первоначальными координатами, соответствующими серединам отрезков, соединяющих уже существующие между вершинами tl/ и t2j другие вершины. Причем для реализации процедуры градиентного поиска им задается первоначальное смещение по каждой из координат на величину шага h, равного максимальному из шагов по этой координате для і-ой и m-ой целей. После этого все вновь введенные вершины проверяются на попадание их в область Qim, представленной массивами вида (3.17) и (3.18), которые были предварительно получены с помощью подпрограммы GPi_Form для совокупности Т , путем вызова функции Find для каждой из них.
Если какая-либо из вершин не попала в область Qira, то осуществляется ее смещение вдоль перпендикуляра к отрезку, на котором она располагалась до этого, в соответствии со следующим правилом.
Уравнение прямой, перпендикулярной этому отрезку выглядит следующим образом: а;-Хі+а 2-х2+Ь = 0, (3.22) коэффициенты этого уравнения определяются как: а\ =а2;а 2 = at;b = агх 2-а2-х[, (3.23) где а, и а2 - коэффициенты прямой, соединяющей вершины рассматриваемого отрезка с координатами (х1Ь,х2Ь) и (х1е,х2е), вычисляемые по правилу вычисления коэффициентов уравнения (2.75).
Вершина с координатами (xj,x2) располагается на середине рассматриваемого отрезка, причем: х, = ъ +х}н =(?ьч± +Хл { 2 V I 2
Далее организуется перемещение вдоль найденной прямой по координате х, с шагом hj в одну и в другую сторону от вершины (х;,х2) двух вершин VI и V2. При этом вычисляется значение координаты х2 и осуществляется проверка попадания этих вершин в область Qim. Та из вершин, которая первой достигнет области Q и принимается в качестве вершины, расположенной между вершинами рассматриваемого отрезка.
После введения всех новых вершин осуществляется перегруппирование всех вершин, расположенных между вершинами tl) и t2- с целью получения наименьшей длины границы, разделяющей область Qim.
Перегруппировка осуществляется по следующему правилу. Первоначально выбирается вершина tl) и из всех вершин, расположенных между вершинами tl) и t2) выбирается ближайшая к ней вершина. Она принимается в качестве второй вершины в последовательности вершин от tl) к t2). После этого осуществляется поиск третьей вершины, ближайшей ко второй, и так далее до те пор, пока не будет достигнута вершина t2). При формировании последовательности Т; вершины расположенные между tl) и t2) записываются в нее в порядке движения от tl- к t2). А при формировании Тт - в порядке движения от t2) к tl).
Преобразование совокупностей вершин Т; и Ттв совокупности отрезков GP; и GPm , а также вычисление вероятности ошибки Е осуществляется точно также, как это бьшо описано выше.
На следующем этапе организуется цикл градиентной оптимизации положения вершин, меняют. На первом шаге итерации значение каждой из координат всех вершин, расположенных между вершинами tl) и t2), изменяется на величину максимального расположенных между вершинами tl) и t2). Причем сами вершины tl) и t2/ своего положения не шага по каждой из координат. В дальнейшем изменение значений координат вершин осуществляется с помощью правила, представленного выражением (2.78).
После изменения положения всех вершин, но перед вычислением вероятности ошибки Е з, происходит повторная перегруппировка вершин, расположенных между вершинами tlj и t2/ и преобразование совокупностей Т; и Тш в совокупности отрезков GP; и GPm , как это было описано выше. Запоминание положения вершин перед их перемещением осуществляется с целью возможности возврата к более оптимальному их расположению, после того как цикл градиентной оптимизации будет завершен.
На последнем этапе работы алгоритма рис.3.13 осуществляется запись совокупности Tf в совокупность її]}. Осуществляется это с целью исключения из дальнейшего рассмотрения той части области Q , которая была отнесена к m-ой цели.
Следующим этапом работы алгоритма рис.3.3 является формирование областей Q; и Qm с учетом разделения области Q .
В случае однопараметрического распознавания, при условии унимодальности априорных функций распределения вероятности, формирование областей Qf и Qm осуществляется в процессе разделения области Qim с применением выражений (2.66), (2.68) -(2.73).
Алгоритм подпрограммы Conn, осуществляющей формирование областей Q; и Qm в случае двухпараметрического распознавания, представлен на рис.3.14. Входными данными подпрограммы Conn являются; - Т - совокупность вершин, сформированная подпрограммой DivQim (рис.3.13); — совокупность вершин области Q;, с которых начинается замена границ этой области (формируется подпрограммой Gi_Form (рис.3.8));