Содержание к диссертации
Введение
1. Анализ методов диагностики приемного тракта радиотехнической системы 14
1.1 Методы диагностики состояния радиотехнического тракта, оценка эффективных параметров 14
1.2 Модели сигналов, используемые для обучения системы диагностики 18
1.3 Методы классификации, основанные на теории статистических решений... 26
1.4 Параметрические и непараметрические методы классификации сигнал. 34
Выводы по материалам первой главы 37
2. Постановка задачи диагностики и анализ структуры приемного тракта радиотехнической системы 39
2.1 Постановка задачи диагностики 39
2.2 Анализ структуры приемного тракта с учетом системы диагностики ее состояния 44
2.3 Оценка параметров системы диагностики 62
2.4 Оптимизация временных и пространственных параметров системы диагностики 70
Выводы по материалам второй главы 84
3. Разработка параметрических и непараметрических алгоритмов распознавания состояния приемного тракта радиотехнической системы 86
3.1 Синтез решающего правила в условиях априорной неопределенности 86
3.2 Формирование моделей сигналов различных классов состояний приемного тракта .102
3.3 Сравнительный анализ решающих правил принятия решений 105
3.4 Исследование влияния размерности вектора признаков на эффективность работы классификатора состояний 109
Выводы по материалам третьей главы 113
4. Исследование алгоритмов параметрической и непараметрической классификации с целью диагностики состояния приемного тракта радиотехнической системы 115
4.1 Моделирование работы системы диагностики 115
4.2 Моделирование алгоритмов параметрического и непараметрического распознавания состояния приемного тракта 124
4.3 Сравнительный анализ эффективности параметрических и непараметрических алгоритмов классификации 132
4.4 Определение вероятности ошибок по классам и оценка статистической погрешности результатов моделирования 135
Выводы по материалам четвертой главы 141
Заключение 142
Литература
- Методы классификации, основанные на теории статистических решений...
- Оценка параметров системы диагностики
- Сравнительный анализ решающих правил принятия решений
- Сравнительный анализ эффективности параметрических и непараметрических алгоритмов классификации
Введение к работе
Актуальность темы:
В связи со стремительным развитием электроники, все чаще ставится задача проектирования систем диагностики технического состояния аппаратуры различного назначения. Создание сложных радиотехнических систем накладывает жесткие требования на характеристики их надежности. Для выявления неисправностей и повышения отказоустойчивости таких систем применяют встроенные системы технической диагностики.
Для обеспечения высоких оперативности и достоверности радиоконтроля все более широкое применение находят методы пространственно-временной обработки информации при решении таких задач как поиск, обнаружение, разрешение, пеленгование, определение местоположения источников радиоизлучений (ИРИ).
Для решения большинства из перечисленных задач радиоконтроля возникает необходимость в использовании многоканальных технических средств. К числу основных устройств, определяющих основные характеристики многоканальных технических средств, следует отнести фазированные антенные решетки (ФАР) и многоканальные супергетеродинные приемные устройства (МСПУ). При этом одной из наиболее актуальных проблем является задача устранения неидентичности характеристик каналов МСПУ за счет неидеальности аппаратурной реализации и влияния климатических и механических воздействий.
Широко используемые в настоящее время пути решения данной задачи связаны: с использованием схемотехнических приемов и с использованием методов диагностики состояния радиотехнической системы (РТС) в рабочем режиме.
Первый из вышеперечисленных путей является малоперспективным, поскольку требует создания прецизионной аппаратуры. Второй путь широко используется и приводит к решению поставленной задачи, но только в условиях стационарной радиообстановки при невысоких требованиях к пропускной способности комплекса радиоконтроля.
Среди известных работ, посвященных данной тематике, можно выделить направления, использующие принцип разделения во времени режимов работы и контроля, отражённые в работах В.А. Долгова, А.С. Касаткина, В.Н. Сретенского, В.Д. Кудрицкого и других. Существенным недостатками разделения во времени режима работы и контроля параметров является снижение готовности комплекса радиоконтроля, потеря информации о радиообстановке на период проведения контроля, уменьшение достоверности контроля из-за получения оценок в диагностической системе эпизодически.
Вопросам построения алгоритмов, позволяющих контролировать параметры РТС в рабочем режиме, посвящены работы А.П. Дятлова, однако недостаточно внимания уделено автоматизированному распознаванию состояния исследуемых систем. Данные обстоятельства указывают на необходимость разработки и анализа моделей систем диагностики состояния РТС без использования режимов разделения во времени.
Таким образом, тема диссертации, посвященная анализу алгоритмов диагностики состояния линейных трактов радиотехнических систем без их отключения из рабочего режима, является достаточно актуальной.
Целью работы является:
Разработка алгоритма диагностики состояния линейного приемного тракта радиотехнической системы в рабочем режиме и анализ структуры приемного тракта с учетом системы диагностики.
Основные задачи диссертации:
-
Выбор и обоснование алгоритма диагностики состояния приемного тракта радиотехнической системы.
-
Определение условий использования алгоритма диагностики.
-
Формирование моделей сигналов различных классов состояний приемного тракта.
-
Синтез и обоснование решающего правила для классификатора состояния линейной системы.
-
Оптимизация временных и пространственных параметров системы диагностики.
-
Моделирование работы системы диагностики.
-
Определение суммарных вероятностей ошибок по классам и оценка статистической погрешности результатов моделирования.
Решение поставленной задачи проводится в несколько этапов:
1. Анализ методов диагностики приемного тракта радиотехнической системы.
2. Постановка задачи диагностики и анализ структуры приемного тракта радиотехнической системы.
3. Разработка параметрических и непараметрических алгоритмов распознавания состояния приемного тракта радиотехнической системы.
4. Исследование алгоритмов параметрической и непараметрической классификации с целью диагностики состояния приемного тракта радиотехнической системы.
Научная новизна.
В работе получен ряд новых результатов:
1. Разработана методика формирования системы признаков на основе корреляционного метода измерения импульсной характеристики модели линейного приемного тракта радиотехнической системы.
2. Предложен алгоритм диагностики состояния модели приемного тракта радиотехнической системы без отключения его из рабочего режима.
3. Определены условия использования предложенных алгоритмов в автоматизированных системах диагностики состояния приемного тракта.
3. Разработаны и исследованы алгоритмы математического моделирования процесса диагностики состояния приемного тракта радиотехнической системы в рабочем режиме.
4. Выявлены закономерности изменения показателей эффективности классификатора от времени обучения и размерности признакового пространства.
Практическая ценность состоит в следующем:
– повышение вероятности достоверной диагностики состояния линейных трактов приемных устройств в рабочем режиме до 85 % при использовании предложенного параметрического алгоритма классификации;
– снижение размерности вектора эффективных признаков, позволяющее диагностировать состояние линейных трактов радиотехнической системы по выборке длительностью до 20 мс.
Реализация результатов работы. Результаты, полученные в работе, были использованы в учебном процессе при проведении лабораторных работ, курсовом проектировании по дисциплинам: “Устройства приёма и преобразования сигналов”, “Радиоприёмные устройства сверхвысоких частот”, “Основы компьютерного проектирования” на кафедре Радиоприёмных Устройств и Телевидения Технологического Института Южного Федерального Университета.
Результаты, полученные в кандидатской диссертации, реализованы в разработках отдела 24 НКБ «Моделирующих и Управляющих Систем» ЮФУ (г. Таганрог) в рамках х/д 324057 «Разработка и изготовление опытного образца радиолокационного измерителя статистических характеристик волнения моря РИВ 200» при создании радиолокационного измерителя характеристик морского волнения, предназначенного для гидросамолёта Бе-200. Также полученные алгоритмы используются в разработках особого конструкторского бюро «Ритм» ЮФУ и внедрены в изделии «Водолей» при построении автоматизированной диагностической системы, где объектом исследований являются шумоподобные сигналы с нормальным законом распределения.
Методы исследования основаны на использовании численных методов, методов теории вероятности и математической статистики, статистической теории распознавания образов, функционального анализа.
Основные положения, выносимые на защиту, следующие:
– алгоритм формирования системы эффективных признаков на основе корреляционного метода измерения импульсной характеристики линейной системы;
– результаты исследования влияния уровня тестового шума на изменение реальной полезной чувствительности приемных устройств;
– зависимости оценок ошибки распознавания от времени обучения и размерности признакового пространства;
– результаты математического моделирования разработанных алгоритмов диагностики состояния линейных трактов без отключения их из рабочего режима.
Апробация работы. Основные положения диссертационной работы обсуждались и докладывались:
– на LIII научно-технической конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ (Таганрог, ТТИ ЮФУ, 2008 г.);
– на Всероссийской научно-технической конференции с международным участием: “Компьютерные и информационные технологии в науке, инженерии и управлении” (Таганрог, ТТИ ЮФУ, 2008 г.);
– на 6-й Всероссийской научно-практической конференции студентов, аспирантов и молодых учёных «Молодёжь XXI века – будущее Российской науки» (Ростов-на-Дону, ЮФУ, 2008г.);
– на IX Всероссийской научной конференции «Техническая кибернетика, радиоэлектроника и системы управления» (Таганрог, ТТИ ЮФУ, 2008 г.);
– на международной научной конференции «Инновации в обществе, технике и культуре» (Таганрог, ТТИ ЮФУ, 2008 г.);
– на LVI научно-технической конференции профессорско-преподавательского состава, аспирантов и сотрудников ТТИ ЮФУ (Таганрог, ТТИ ЮФУ, 2009 г.).
Публикации. Основные научные результаты диссертации опубликованы в 2-х монографиях, 4-х статьях, 4-х тезисах докладов, в том числе 4 работах, опубликованных в изданиях, рецензируемых ВАК.
Структура диссертации. Диссертационная работа состоит из введения, четырёх разделов, заключения и приложения.
Работа изложена на 150 стр. текста, 36 рисунках, 4 таблицах, списка литературы из 115 наименований и приложения.
Методы классификации, основанные на теории статистических решений...
Развитие средств автоматики и автоматизации сложных технологических процессов, переход к новым методам управления производством выдвинули целый ряд новых задач, успешное решение которых требует и новых методов обработки информационных потоков, которые учитывали бы свойства, законы и динамику процессов, протекающих в информационных системах.
Развитие науки и техники происходит по пути усложнения процессов и систем. В связи с этим усложняются естественные и искусственные сигналы как переносчики информации о процессах в системах. Особенно резко возрастает сложность человеко-машинных информационных и управляющих систем, играющих все более важную роль в производстве, разработках и исследованиях. Следует отметить, что усложнение функций информационных и управляющих систем, улучшение их качественных характеристик должно производиться наиболее экономным образом, в соответствии с общим направлением развития общества [1]. В связи с этим все более актуальной становится задача оптимизации систем управления и информационных систем и, следовательно, задача оптимального построения моделей управляющих сигналов в системах.
В частности, возникает необходимость в разработке простых, эффективных и достаточно надежных методов классификации и распознавания объектов и систем по текущей информации о выходных сигналах. Это сводится к выбору определяющих параметров - признаков, подлежащих измерению и контролю, и методов обработки полученной информации. Обзор имеющейся литературы показывает, что к настоящему времени предложено довольно большое число методов диагностики сигналов и образов. Однако практическая реализация их наталкивается на значительные трудности, суть которых в следующем.
Определение текущих значений параметров объектов требует в большинстве случаев множества косвенных измерений и последующей их обработки. При достаточно большом числе параметров объем вычислений настолько велик, а сам процесс обработки настолько громоздок, что даже применение средств вычислительной техники редко позволяет существенно уменьшить неизбежные потери времени на обработку исходной информации, исключая тем самым возможность получения результатов контроля в реальном масштабе времени.
При разработке диагностических систем указанное затруднение стараются обойти путем упрощения вычислительных операций, либо ограничением числа контролируемых параметров, либо использованием для вычислений приближенных зависимостей вместо точных математических выражений, связывающих величины косвенных измерений с параметрами объекта. И в том и в другом случаях вносится элемент неопределенности в процесс диагностирования, что снижает достоверность диагностики и приводит к существенным экономическим потерям.
Из сказанного следует, что при решении задач диагностирования выходных сигналов радиотехнических систем основной задачей является выбор такого метода диагностики, который позволил бы получать достоверные результаты при достаточно простой технической реализации.
Несмотря на несомненную актуальность проблемы диагностирования (распознавания) сигналов, имеется относительно небольшое (по сравнению с распознаванием геометрических фигур) число работ, посвященных этому вопросу. В основу большинства известных исследований положены методы теории статистических решений при изучении многомерных векторов преобразованных сигналов. Отличаясь стройностью и законченностью теоретических результатов, эти методы обладают и рядом неудобств практического характера, в частности, они требуют обработки большого объема выборок реализаций при эмпирическом определении законов распределения признаков диагностируемых процессов.
Из анализа литературных источников можно сделать заключение о том, что рассмотренные непараметрические методы (гистограммный, К-ближайших соседей, полигональный, Парзеновского ядра и другие) являются асимптотическими, то есть обеспечивают достаточную точность оценивания только лишь при неограниченном увеличении объема обучающих выборок.
При произвольных (в том числе и малых) размерах выборок эта точность (достоверность диагностирования) становится недопустимо низкой. Учитывая, что оценки вероятностей ошибок диагностирования для непараметрических методов, как правило, отсутствуют, следует заключить, что непараметрическое диагностирование (распознавание) находится еще в начале своего развития [2, 3, 4, 5].
Значительно дальше продвинулось параметрическое диагностирование, где разработаны процедуры обучения, принятия решения и понижения размерности признакового пространства. Однако оценки вероятностей ошибок, получающихся при параметрическом диагностировании, являются асимптотическими, то есть справедливыми в редко встречающихся случаях неограниченного возрастания объема обучающих выборок. Подавляющее большинство результатов получено только для двухальтернативного диагностирования, тогда как многие практические задачи принципиально являются многоальтернативными.
Из-за отсутствия оценок вероятностей ошибок или их асимптотического характера в существующих работах мало внимания уделено важной проблеме построения систем статистического диагностирования, а именно, проблеме оптимизации временных и пространственных параметров систем при заданном уровне достоверности диагностирования. Последнее обстоятельство, по-видимому, явилось основной причиной того, что вопросы практических приложений статистического диагностирования в большинстве работ не рассмотрены, либо рассмотрены только лишь в постановочном плане [2, 6, 7, 8].
В то же время стремительно растущие запросы практики ставят новые задачи, которые не могут быть решены на основе традиционных методов и средств либо принципиально, либо вследствие технических и экономических ограничений.
Широкий класс новых задач, порожденных тенденцией усложнения и повышения информационной производительности систем обработки сигналов, связан с переходом от простых сигналов, с базой порядка единицы, к сложным - с базой от десяти до десятков тысяч.
В [54] показано, что при распознавании случайных (приблизительно случайных) процессов (сигналов) наиболее эффективными признаками являются признаки, полученные в виде моментных функций различных порядков распознаваемых сигналов.
Оценка параметров системы диагностики
Нетрудно увидеть, что весовое суммирование результатов междуканальной обработки обеспечивает увеличение амплитуды полезного сигнала в п раз, так как векторный СВЧ-радиосигнал поступает с выходов п-канальной ФАР, приемные элементы которой характеризуются единичной амплитудной направленностью для всех углов прихода электромагнитной волны. Заметим, что в п раз в данном случае увеличится так же и энергетическое отношение сигнал-шум на выходе весового сумматора.
Структура многоканального приёмного устройства, синтезированная по алгоритму (2.3), представляет собой структуру оптимального пространственно-временного фильтра корреляционного типа [38]. Каждый парциальный канал такого фильтра - приемное устройство, осуществляющее корреляционную обработку временных СВЧ-сигналов и последующую пространственную, которая при отсутствии помех в данной структуре сводится к выравниванию фазовых сдвигов напряжений парциальных сигнальных составляющих, поступающих с выходов парциальных каналов временной корреляционной обработки. Последующее весовое суммирование когерентных парциальных сигнальных составляющих приводит к формированию выходного эффекта Z, который, например, при решении задачи обнаружения подвергается испытанию на порог с целью принятия решения - обнаружен полезный радиосигнал или нет.
Для случая, когда первой осуществляется пространственная обработка пространственно-временной интеграл (2.1) преобразуется к виду Выражение (2.5) с учетом (2.6) и есть оптимальный алгоритм пространственно-временной обработки СВЧ-радиосигнала при отсутствии помех с первоначально выполняемой пространственной обработкой. Структурная схема алгоритма (2.5) представлена на рисунке 2.3.
ВесовоеСуммирование Вычисление Междуканальная обработка временногокорреляционногоинтегралаz = jz„(/)s(()//0 Г2(0 ; F„«) W„ і Рисунок 2.3 Структура алгоритма пространственно-временной обработки с нспервоначально выполняемой пространственной обработкой В отличие от алгоритма на рисунке 2.2 в данном случае смысл операций междуканальной обработки - суть умножение каждого парциального радиосигнала V,(t) на конкретный ;"-й комплексный весовой коэффициент Wm, заключается в выравнивании фаз напряжений полезных парциальных радиосигналов. Междуканальная обработка в соответствии с данным алгоритмом может выполняться как на несущей частоте сформированных многоканальной ФАР парциальных СВЧ-радиосигналов, так и на промежуточных частотах. Суть от этого не меняется, так как используемое для изменения несущих частот радиосигналов, гетеродинное преобразование частоты хотя и является, временной обработкой радиосигналов, осуществляет безинформационное преобразование их функциональной структуры.
Сказанное можно подтвердить следующим. Выходное напряжение г -го парциального канала междуканальной обработки формируется в виде
Если междуканальная обработка производится на несущей частоте векторного СВЧ-радиосигнала V(7) , то в отсутствии помех весовой вектор Wm = F(0J и результат будет определяться как
В инженерной практике принято считать, что устройства, осуществляющие техническую реализацию операций первоначально выполняемой пространственной обработки, образуют оптимальный пространственный фильтр (ОПФ), и эту совокупность устройств зачастую называют пространственным трактом. Если пространственная обработка осуществляется на несущей частоте векторного СВЧ-радиосигнала \J(t), то принято считать, что пространственный тракт выполнен по типу согласованного фильтра, в котором выравнивание фаз напряжений парциальных СВЧ-радиосигналов обеспечивается фазосдвигающими устройствами - фазовращателями.
При выполнении операции пространственной обработки на промежуточной частоте значение аргументов парциальных комплексных весовых коэффициентов Wml задают значениями начальных фаз парциальных гетеродинных напряжений, подаваемых на парциальные гетеродинные преобразователи частоты. ОПФ, в которых пространственная обработка осуществляется на промежуточной частоте, относят к пространственным трактам корреляционного типа, и такие ОПФ зачастую называют пространственными корреляторами.
Вычислитель временного корреляционного интеграла в рассматриваемой структуре алгоритма - обычное одноканальное приёмное устройство, которое может осуществлять и фильтрационную обработку полезного радиосигнала.
Таким образом, в соответствии с алгоритмами, структуры которых представлены на рисунках 2.2 и 2.3 можно разработать различные варианты многоканальных приёмных устройств, учитывающих специфику, как используемых ФАР, так и способов реализации междуканальной обработки, а также специфику режимов обзора углового сектора пространства.
Итак, при оговоренных условиях, модель приемного тракта радиотехнической системы можно считать линейной моделью и строить систему ее диагностики, исходя из этих соображений.
Ограничимся рассмотрением одного из подходов к реализации метода встроенного контроля параметров линейных трактов приёмных устройств с целью диагностики их состояния без отключения из рабочего режима [103, 104]. В основу положен корреляционный метод измерения импульсной характеристики линейной (или примерно линейной) системы.
Импульсную характеристику h(X) можно использовать для непосредственного определения амплитудной характеристики, затухания и критических частот, кроме того, методами анализа Фурье с ее помощью получают частотные характеристики. Импульсную характеристику целесообразно получать по реакции исследуемой линейной системы на стационарный широкополосный шум n(t) (рисунок 2.4) [103, 104].
Структурная схема измерителя (рисунок 2.4) содержит генератор шума x(t), линию регулируемой задержки, перемножитель и интегратор. Исследуемая линейная система не выключается из работы, поэтому на её входе кроме напряжения x(t) будет присутствовать также информационный сигнал sj(t). При соответствующем выборе x(t) напряжение на выходе интегратора воспроизводит импульсную характеристику исследуемой системы. Выходное напряжение пропорционально взаимно корреляционной функции напряжений, поступающих на вход перемножителя: \ Т/2 где S2(t) - информационный сигнал на выходе системы (может содержать шумы среды распространения радиосигнала и собственные шумы исследуемой системы); Go - коэффициент пропорциональности; y(t) - напряжение шума x(t), преобразованное исследуемой системой.
Так как напряжения x(t) и s2(t) статистически независимы (некоррелированы), первый интеграл будет равен нулю. Отсутствие влияния информационного сигнала на результат измерения позволяет выбирать x(t) достаточно малым (в сотни раз меньше уровня информационного сигнала). Напряжение y(t) связано с напряжением x(t) интегралом свёртки:
Сравнительный анализ решающих правил принятия решений
Анализируя полученные зависимости, можно сделать вывод, что при слабой корреляции признаков, дисперсиях признаков отличающихся не более чем в 2 раза и при достаточно сильном перекрытии собственных областей классов целесообразно решающее правило строить по критерию минимума расстояния, при этом достоверность классификации уменьшается в среднем на 3%, в то время как значительно упрощаются процедура обучения, алгоритм классификации и уменьшается объем памяти необходимый для хранения информации о распознаваемых классах. При неперекрытии или незначительном перекрытии собственных областей классов рекомендуется использовать решающее правило (3.26) (метод гиперсфер). Если дисперсии признаков значительно отличаются, то решающее правило рекомендуется строить на основе алгоритма (3.2).
Так как в качестве признаков используются отсчётные значения автокорреляционной функции нормального случайного процесса, прошедшего узкополосную линейную систему, то согласно теории статистических решений область выбора решающего правила сужается до решающего правила, построенного на основе алгоритма оптимального байесовского классификатора (3.11).
Известно [19], что с повышением размерности признакового пространства (при условии использования эффективных признаков, с точки зрения заданного критерия) качество работы классификатора улучшается. Однако значительное увеличение количества признаков ведет к необоснованному усложнению аппаратуры распознавания и, в конечном счете, потере рентабельности разрабатываемого оборудования. Поэтому остается открытым вопрос, какое количество и, самое главное, какие признаки должны использоваться при классификации процессов, то есть стоит задача оптимизации размерности признакового пространства.
Говоря об эффективных признаках, имеют в виду признаки, использование которых максимизирует некоторый заданный критерий. В нашем случае таким критерием является, как уже указывалось, достоверность распознавания.
Возвращаясь к вопросу о количестве используемых признаков, то есть о размерности признакового пространства, можно сказать следующее.
Задача оптимизации размерности признакового пространства должна, очевидно, включать в себя как составную часть задачу оптимизации суммарного объема р = (2т + п) (при количестве классов, равном 2) обучающих и контрольной выборок, то есть представлять собой обобщение этой задачи на случай минимизации суммарного количества измерений по всем Р признакам р = р(2т + п), обеспечивающего достоверность распознавания не хуже заданного значения СУ =amm,j3 =/?max.
Ограниченные возможности реальных распознающих систем по обработке результатов измерений по каждому из р признаков позволяют всегда считать число признаков р ограниченным некоторой величиной р(р Р) . Кроме того, максимально возможные значения объемов обучающих m и контрольной п выборок, как правило, ограничены некоторыми предельными значениями М и N {т М,п N) , причем здесь помимо соображений, связанных с ограниченностью сил и средств на проведение необходимых обучающих и контрольных наблюдений (в общем, аналогичных тем, которые ограничивают размерность р признакового пространства), на первый план выступают жесткие требования по ограниченности времени обучения и принятия решения, которые часто с требуемой достоверностью распознавания являются определяющими факторами при построении распознающей системы.
Необходимо решить задачу оптимизации размерности признакового пространства, а так же объёмов обучающей и контрольной выборок. Для начала необходимо задаться значением 5 — точностью измерения признаков в реальных системах. В 2.4 было предложены теоретические соображения по выбору оптимальных значений ропт, попт и топт при 5=0.1 и 1-а =0.9. Попытаемся определить оптимальные значения размерности признакового пространства и оптимальные объёмы обучающей и контрольной выборок.
Для определения оптимальных параметров зафиксируем б 0.15. Как уже отмечалось ранее, в качестве эффективных признаков будем использовать вектор отсчётных значений корреляционной характеристики линейной системы. Методика получения вектора эффективных признаков, обладает статистической погрешностью непосредственно связанной cm- объемом обучающей выборки. Таким образом, фиксируем значение объёма контрольной выборки, а варьируемыми параметрами остаются: т — длина обучающей выборки и р - размерность признакового пространства.
Для определения зависимостей достоверности классификации от ш и р проведём моделирование в среде MATLAB 7.5. В качестве примера рассмотрим случайный процесс на выходе линейной системы с импульсной характеристикой, соответствующей второму классу. Частота дискретизации импульсной характеристики Ffl=25 МГц, длина обучающей выборки т=50 точек, что соответствует времени обучения tOG=50 мкс 100 реализаций=5 мс.
Из рисунка 3.11 видно, что для заданной достоверности классификации 1-а =0.85, для данного примера, будет достаточным в качестве вектора признаков взять 50 отсчётных значений автокорреляционной функции процесса, прошедшего линейную систему, что приблизительно соответствует интервалу времени 0,5 мкс.
Проследим влияние размерности вектора обучающей выборки на эффективность классификации. Для этого, в качестве оптимальной размерности вектора признаков возьмем ропт=50 и определим зависимость достоверности классификации от т.
Уменьшение длины обучающей выборки повлечёт за собой увеличение статистической погрешности оценки вектора признаков, что в свою очередь негативным образом скажется на достоверности классификации. Проанализировав зависимость на рисунке 3.12 можно сделать вывод, что для данного примера р=50 — является оптимальным значением. Увеличение размерности р свыше 100 не является целесообразным, так как повлечет за собой значительное увеличение вычислительных затрат при незначительном улучшении достоверности классификации.
Сравнительный анализ эффективности параметрических и непараметрических алгоритмов классификации
Целью данного подраздела является сравнение характеристик предлагаемых алгоритмов параметрической (оптимальный классификатор Байеса) и непараметрической классификации (метод гиперсфер).
В главе 3 было показано: так как в качестве признаков используются отсчётные значения автокорреляционной функции нормального случайного процесса, прошедшего узкополосную линейную систему, то согласно теории статистических решений область выбора решающего правила сужается до решающего правила, построенного на основе алгоритма оптимального байесовского классификатора (3.11). Однако, при неперекрытии или незначительном перекрытии собственных областей классов рекомендуется использовать решающее правило (3.26) (метод гиперсфер). Сравним эффективность алгоритмов классификации, построенных на основе этих двух правил.
Как было показано, в качестве вариьруемого параметра линейного тракта целесообразно принять эквивалентную добротность. Принимаем в качестве анализируемого тракта полосовой фильтр Чебышева I рода 6 порядка, настроенный на частоту 10 МГц (принята для удобства представления результатов). Результаты анализа такой цепи могут быть транспонированы в любую область частот. Отклонение эквивалентной добротности на 10 % для каждого класса возможно определять с вероятностями правильной классификации, представленными на рисунках 4.12 и 4.13.
Оценки вероятностей правильной классификации по классам: а) 1-й класс(ОлсВ=50), б) 2-й классССЬкіг З), в) 3-й KHacc(QDKB=40), г) 4-й класс(0_э, )=35). Из анализа гистограмм 4.13 возможно сделать вывод о величинах оценок суммарных вероятностей ошибочной классификации состояния л х л л л системы по методу гиперсфер: Рт,\ =19%, Раш2=29%, Рош.г =28 %, Рт.л =17%. По величинам оценок вероятностей ошибочной классификации можно судить о лучших результатах работы классификатора по методу Байеса, по сравнению работой классификатора по методу гиперсфер при всех равных условиях.
Определение вероятности ошибок по классам и оценка статистической погрешности результатов моделирования.
Показателем качества алгоритмов является суммарная вероятность ошибки классификации одного объекта исследования Рош . Так как имеется случайная погрешность в определении Рош, под ошибкой моделирования будем понимать эту случайную погрешность.
Оценка ошибок статистического моделирования сводится к задаче анализа вероятности ложной классификации [6]. Рассмотрим два класса а 1 и
При выборе двоичной функции потерь (0 - правильное решение, 1 -ошибка) условие, определяющее принадлежность образа х классу 00- по критерию минимизации вероятности ошибки классификации, принимает вид образа, принадлежащего классу О),, есть. р(и0 a\60t) . Так как логарифм отношения правдоподобия utj(x) является линейной комбинацией компонент образа х, подчиняющихся нормальному распределению, то также описывается нормальным распределением. Поэтому математическое ожидание логарифма отношения правдоподобия иДх) для класса СО можно записать как [б]:
Функция, связывающая расстояние Махаланобиса с вероятностью ошибки, является плотностью одномерного нормального распределения с нулевым средним и единичной дисперсией. График зависимости вероятности ошибки классификации р(е) от величины расстояния Махаланобиса приведен на рис. 4.10. Очевидно, что вероятность ошибки р(е) представляет собой монотонно убывающую функцию расстояния Махаланобиса.
Воспользуемся методикой оценивания вероятности ошибки для заданного классификатора, приведенной в [62]. Когда неизвестны априорные вероятности классов Р(а ,), і = 1,2, то можно случайно извлечь N объектов и проверить, дает ли данный классификатор правильные решения для этих объектов. Такие объекты называют случайной выборкой.
Пусть Т - число объектов, неправильно классифицированных в результате этого эксперимента. Величина т является дискретной случайной величиной. Обозначим истинную вероятность ошибки через є . Вследствие дискретности Т при фиксированном Є рассмотрим вероятность Рг{т = г/Є], которая задается биномиальным распределением:
В результате моделирования работы классификаторов, при классификации случайных процессов с нормальными одномерными плотностями распределения вероятностей и различными корреляционными функциями определены значения суммарных вероятностей ошибок классификации при различных объемах обучающих и контрольных выборок, различных размеров признакового пространства и различном количестве объектов обучения.
Осуществлено моделирование корреляционного метода измерения импульсной характеристики линейной системы. Установлено, что методическая погрешность измерения нормированной импульсной характеристики не превышает 3 % (8 %). Измерения импульсной характеристики производилось по 500 реализациям по 100 (50) точек каждая, частота дискретизации 25 МГц.
Произведен сравнительный анализ показателей качества предложенного параметрического и непараметрического алгоритма классификации. Были установлены теоретические пределы вероятности ошибки решающего правила по методу гиперсфер в сравнении с вероятностью ошибки Байесовского правила. Байесовская вероятность ошибки - наименьшая. Практическим неудобством в реализации Байесовского правила является то, что для достижения заданной точности классификации необходимо сохранять в памяти достаточно объемную корреляционную матрицу, что существенно сказывается на вычислительных затратах времени классификации.
Определены понятия и численные значения статистической погрешности моделирования работы диагностической системы при решении задачи классификации объектов наблюдения.