Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах Шабанов Дмитрий Валерьевич

Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах
<
Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Шабанов Дмитрий Валерьевич. Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах : диссертация ... кандидата технических наук : 05.11.17 / Шабанов Дмитрий Валерьевич; [Место защиты: Юж. федер. ун-т].- Таганрог, 2007.- 204 с.: ил. РГБ ОД, 61 07-5/3924

Содержание к диссертации

Введение

Глава 1 Обзор и анализ известных методов диагностики 16

1.1. Биопотенциалы мозга: механизмы возникновения и основные характеристики 16

1.2. Электроэнцефалография как метод исследования электрической активности головного мозга 19

1.3. Постановка задачи повышения эффективности диагностики в реальных условиях конечной выборки 24

1.4. Постановка задачи выбора модели сигналов, получаемых при функционально-диагностических исследованиях для предварительного обучения диагностической системы 27

Глава 2: Постановка задачи диагностики и анализ прогнозных моделей для сегментации ЭЭГ реализаций. анализ моделей ЭЭГ сигналов 38

2.1. Постановка задачи диагностики 38

2.2. Рассмотрение методик прогнозных моделей ЭЭГ сигнала 63

2.3. Рассмотрение методики сегментации ЭЭГ сигналов с использованием выбранной параметрической модели 72

2.4. Рассмотрение моделей ЭЭГ сигналов 76

Глава 3: Разработка алгоритмов непараметрического распознавания патологий 82

3.1 Модели ЭЭГ сигналов различных классов для оценки признаков патологий в каждом классе 82

3.2 Выбор признаков для распознавания 84

3.3 Выбор разделяющих поверхностей и решающих правил 92

3.4 Исследование влияния размерности вектора признаков на эффективность классификации 95

Глава 4: Исследование алгоритмов непараметрической классификации 105

4.1. Методы моделирования устройств обработки сигналов 105

4.2. Моделирование алгоритмов непараметрического распознавания 109

4.3. Сравнительный анализ показателей качества предложенного и известного алгоритмов непараметрической классификации 113

4.4. Разработка структурной схемы экспериментальной установки. Объект исследования 118

4.5. Оценка статической погрешности результатов моделирования 129

4.6. Определение вероятностей ошибок по классам 131

Заключение 136

Список литературы 138

Приложения 148

Введение к работе

Актуальность темы. Среди множества видов диагностики заболеваний одним из главных является функциональная диагностика, основанная на определение параметров функционирования различных систем организма. Методы функциональной диагностики являются наиболее сложными, с точки зрения технической реализации, но в тоже время дают наиболее объективные результаты.

Из всех существующих методов функциональной диагностики в настоящее время наиболее широкое развитие получают методы, позволяющие оценивать состояние сердечно-сосудистой и центральной нервной систем человека, в связи с тем, что в значительной степени увеличилось количество летальных исходов из-за инфарктов и эпилепсий. Это обусловлено усложнением технических систем, используемых в процессе производства, а также использования их в быту, в состав которых входит человек как неотъемлемый элемент. При этом значительно возрос уровень воздействия окружающих человека систем. Наиболее чувствительными к этим воздействиям является центральная нервная система и сердечно-сосудистая система, контроль и анализ параметров которых позволяет предупредить ситуации, которые могли бы привести к опасным изменениям в организме.

Так как в состав современных диагностических систем входят устройства, осуществляющие цифровую обработку сигналов в том числе и в реальном масштабе времени, то возникает проблема создания и исследования алгоритмов работы этих устройств (их цифровых моделей), позволяющих определить показатели эффективности и сложности системы. Развитие компьютерных технологий способствовало тому, что цифровое моделирование стало одним из этапов процессе анализа и синтеза систем обработки информационных потоков, в том числе цифровых систем диагностики медико-биологических сигналов (МБС). При этом эффективность цифрового моделирования, определяется, во-первых, наличием развитого математического аппарата и алгоритмов, направленных на предметную область, во-вторых, широкими инструментальными возможностями, что обусловлено как наличием математического аппарата, отличающегося стройностью и законченностью теоретических результатов, позволяющего производить моделирование сложных радиотехнических сигналов и систем, так и доступность мощных пакетов программ для математического моделирования, обеспечивающих высокую точность, наглядность, удобство в использовании при достаточно высокой скорости работы.

При построении новых систем диагностики, предназначенных для работы с данными клинических функциональных исследований, в частности таких, как электрокардиография (ЭКГ), электроэнцефалография (ЭЭГ), электромиография (ЭМГ), возникает задача синтеза алгоритмов, позволяющих автоматизировать процесс принятия решения о принадлежности совокупности измеряемых сигналов тому или иному семейству (классу) сигналов, соответствующему тем или иным состояниям исследуемой внутренней системы человека. При этом проблемой является обеспечение устойчивости показателей качества принятия решений в условиях априорной неопределённости относительно параметров входных сигналов. Такую устойчивость могут обеспечить непараметрические алгоритмы распознавания. Преодоление трудностей, связанных с отсутствием статистических характеристик входных сигналов, возможно путём разработки алгоритмов, требующих для работы лишь протяжённой кластеризованной выборки (обучающих последовательностей). В ряде случаев применение известных непараметрических методов распознавания может быть затруднено из-за значительной технической сложности их реализации на ЭВМ. Поэтому возникает необходимость разработки приближённых непараметрических методов обучения и распознавания, несколько уступающих известным непараметрическим алгоритмам, но при этом существенно превосходящих их по простоте технической реализации. Однако следует уточнить, что данные системы носят вспомогательный и уточняющий характер т.е. последнее слово остаётся за врачом.

С точки зрения распознавания данных ЭКГ, ЭЭГ, ЭМГ, являющихся шумо-подобными сигналами, наибольший интерес представляют алгоритмы, предназначенные для распознавания случайных процессов. Несмотря на несомненную актуальность проблемы классификации сигналов, имеется относительно небольшое число опубликованных работ, посвященных этому вопросу. Методы, положенные в основу большинства этих исследований, отличаются от общепринятых статистико-вероятностных методов распознавания, а именно методов теории статистических решений при изучении многомерного вектора признаков. Это позволяет избежать обработки большого объема выборок реализаций при эмпирическом определении законов распределения признаков классифицируемых процессов. Так, в частности, в работах предлагается использовать методы нелинейного преобразования входных сигналов. Сущность методов заключается в том, что при формировании признакового пространства осуществляется переход от пространства значений входных сигналов к пространству функционалов, предварительно подвергнутых нелинейному преобразованию.

Основная идея такого подхода состоит в увеличении компактности сигналов каждого класса путем соответствующего выбора вида нелинейного преобразования или функционала. Такое контрастирование исходной информации облегчает установление соответствия величины номеру класса, к которому принадлежит анализируемый сигнал.

Данные методы при произвольных распределениях не претендуют на строгую оптимальность. Вместе с тем существует возможность построить алгоритмы инженерной реализации, близкие к оптимальным. При этом оптимизации подвергаются временные и пространственные параметры системы распознавания, определяющие такие показатели качества, как достоверность распознавания, быстрота принятия решений и величина затрат на оборудование.

Основной преградой на пути развития алгоритмов классификации случайных процессов является сложность создания моделей источников сигналов (в том числе и медико-биологических), устройств передачи и обработки этих сигналов. Появление мощных вычислительных средств привело к развитию цифровых моделей этих объектов.

Отмеченные сложности определяют необходимость анализа методов классификации случайных процессов с целью синтеза непараметрических алгоритмов распознавания медико-биологических сигналов, обладающих возможностью инженерной реализации, близкой к оптимальной, и гарантирующих заданные показатели качества в связи с чем разработка таких алгоритмов считается актуальной. Все это и явилось причиной появления настоящей работы.

Цель и задачи работы. Разработка методов обработки сигналов в медицинских диагностических системах. Исследовать возможности оптимизации временных и пространственных параметров классификаторов МБС, на основе разработанных признаков.

Решение поставленной задачи проводится в несколько этапов.

1. Определение моделей электоэнцефалографических сигналов.

2. Стационаризация фоновой ЭЭГ.

3. Разработка алгоритма формирования классификационных признаков.

4. Исследование влияния времени обучения и времени распознавания, а также размерности признакового пространства на показатели эффективности классификатора.

5. Экспериментальное исследование показателей качества разработанных алгоритмов при классификации сигналов ЭЭГ.

Научная новизна. В работе получен ряд новых результатов, которые сводятся к следующему:

1. Предложен метод стационаризации фоновой ЭЭГ на основе её сегментации.

2. Разработан способ формирования признаков с использованием метода стохастического кодирования электоэнцефалографических сигналов, обеспечивающих минимум ошибки распознавания (максимум достоверности) в условиях большого количества диагностируемых классов.

3. Выявлены закономерности показателей эффективности классификатора ЭЭГ сигналов от времени обучения и распознавания, от вида опорных распределений и размерности признакового пространства.

Практическая ценность.

Состоит в возможности использования результатов работы для решения практических задач техники и науки:

-определены условия целесообразности использования предложенных алгоритмов в компьютерных системах диагностики ЭЭГ;

-обеспечение улучшенных точностных характеристик при использовании программ непараметрической классификации шумоподобных сигналов.

Реализация результатов работы. Результаты полученные в работе, были использованы при разработке гидроакустических систем конструкторского бюро "Ритм" (г. Таганрог). Научные и практические результаты были использованы при разработке НКБ "Миус" ЮФУ(г. Таганрог) в рамках договора 313135 по теме: «Исследование и разработка системы ультразвуковой эхоскопии головного мозга человека». Результаты исследований были использованы при постановке курса специализации "Автоматизированная обработка данных и аппаратура медицинских диагностических систем" на кафедре РПрУ и ТВ Технологического института Южного Федерального университета в городе Таганроге .

Достоверность изложенного подтверждается результатами экспериментальных исследований характеристик предлагаемых алгоритмов при классификации электроэнцефалограмм и случайных процессов с заданными статистическими характеристиками, апробацией на научных семинарах, конференциях, симпозиумах, актами внедрения.

Методы исследования основаны на использовании методов теории вероятности и математической статистики, статистической теории распознавания образов, функционального анализа.

Основные положения, выносимые на защиту, следующие:

- математические модели ЭЭГ;

- алгоритм сегментации ЭЭГ сигналов на основе линейного предсказывающего фильтра и пороговой обработки;

- алгоритм формирования признаков отличающийся использованием оператора нелинейного преобразования;

- зависимости дисперсий оценок признаков и ошибки распознавания от времени обучения, вида опорных распределений, размерности признакового пространства;

- результаты экспериментальных исследований предложенных алгоритмов в компьютерных системах диагностики МБС.

Апробация работы. Основные положения диссертационной работы обсуждались и докладывались:

-на ХL1Х научно-технической конференции ТРТУ (Таганрог, 2004);

-Международной научной конференции «Техническая кибернетика, радиоэлектроника и системы управления» (Таганрог, 2005);

-Всероссийской научной конференции «Оптимальные методы решения научных и практических задач» (Таганрог, 2006);

-Международная научная конференция «Проблемы развития естественных, технических и социальных систем» (Таганрог, 2007).

Публикации. Основные научные результаты диссертации опубликованы в 4-х статьях, 3-ми тезисах докладов.

Электроэнцефалография как метод исследования электрической активности головного мозга

Уместно рассмотреть разбиение ритмов ЭЭГ по уровням диагностической значимости и соответствия состоянию головного мозга. Используя энцефалографическую семиотику и сужая круг рассмотрения соответствий до взрослых пациентов в состоянии бодрствования, рассмотрим ритмы, характерные для взрослых людей без видимых признаков патологий [57].

Альфа (а) -ритм. Частота 8-13 Гц, амплитуда до 100 мкВ (рисунок-1.2). Регистрируется у 85-95% здоровых взрослых. Наибольшую амплитуду а -ритм имеет в состоянии спокойного расслабленного бодрствования. Его амплитуда, хотя и является в среднем относительно постоянным параметром для данного индивидуума, весьма существенно колеблется во времени. Помимо изменений амплитуды, связанных с функциональным состоянием мозга, в большинстве случаев достаточно регулярно наблюдаются спонтанные изменения амплитуды, так называемые модуляции а -ритма, выражающиеся в чередующемся нарастании и снижении амплитуды волн с образованием характерных "веретен" (рисунок-1.2), длительность которых чаще всего колеблется от 2 до 8 секунд.

При повышении уровня функциональной активности мозга (напряженное внимание, интенсивная психическая работа, чувство страха, беспокойство) амплитуда а -ритма уменьшается, и часто он полностью исчезает. На ЭЭГ появляется высокочастотная нерегулярная активность.

Бета (Р) -ритм. Частота 14-40 Гц, амплитуда до 15 мкВ (рисунок-1.3). На ЭЭГ, отведенной от скальпа, в норме он весьма слабо выражен и в большинстве случаев имеет амплитуду 3-7 мкВ, т.е. всего в 2-3 раза превышает относительный уровень собственных шумов усилителя электроэнцефалографа.р -ритм связан с соматическими, сенсорными и двигательными корковыми механизмами и дает реакцию на двигательную активацию или тактильную стимуляцию. При выполнении или даже умственном представлении движения р -ритм исчезает в зоне соответствующей корковой проекции.

Активность с частотой 40-70 Гц и амплитудой 5-7 мкВ иногда называют у - ритмом. Поскольку столь быстрые колебания при весьма низкой амплитуде не могли быть достаточно эффективно воспроизведены электроэнцефалографами, использующие механические системы регистрации, этот ритм существенного клинического значения не имел. Международная электроэнцефалографическая классификация рекомендует исключить понятие у -ритма и употребления и использовать вместо этого выражение "высокочастотный р -ритм ".(включить статью о исследовании гамма ритма - психомотрная реакция на стимул)

Мю (ц) -ритм. Частота 8-13 Гц, амплитуда до 50 мкВ. Как видно ц-ритм, называемый также аркообразный ритм, имеет параметры, совпадающие с параметрами нормального а -ритма, и отличается от него некоторыми физиологическими свойствами и топографией. Активируется \а -ритм во время умственной нагрузки и психического напряжения. Аналогично Р-ритму, ц -ритм снижается (или в небольшом случае нарастает) по амплитуде при двигательной активации или соматосенсорной стимуляции. Поскольку он обычно имеет низкую амплитуду и при визуальном анализе в большинстве случаев не отличим от а -ритма, принято считать он не имеет большого клинического значения.

Рассмотрим виды активности патологические для взрослого бодрствующего человека [57].

Тета (0) -активность. Частота 4-6 Гц, амплитуда патологического 0 -ритма превосходит 40 мкВ и чаще всего превышает амплитуду нормальной электрической активности мозга, достигая при некоторых патологических состояниях 300 мкВ и более.

Дельта (5) -активность. Частота 0,5-3 Гц, амплитуда такая же, как у 0-ритма. 0- и 8-колебания могут в небольшом количестве и при амплитуде, не превышающей амплитуду а -ритма, встречаться на ЭЭГ взрослого бодрствующего человека. В этом случае они указывают на определенное снижение уровня функциональной активности мозга. Патологическими считают ЭЭГ, содержащие 0- и 5 -колебания, превышающие по амплитуде 40 мкВ и занимающие более 15% от общего времени регистрации.

Нестабильные составляющие ЭЭГ в основном характеризуют эпилептиформную активность. Она включает в себя следующие типы колебаний и графо-элементы [53]: спайки, острые волны, спайк-волна, острая-волна-медленная-волна (рисунок-1.3). Так же к патологическим относят такой вид активности, как периодические комплексы (рисунок-1.4).

Спайк (остриё). Соответственно названию этот потенциал имеет острую форму. Длительность его 5-50 мс. Амплитуда, как правило, превосходит амплитуду фоновой активности и может достигать сотен или даже тысяч микровольт. Спайки могут иметь и меньшие амплитуды, что зависит от размера и глубины залегания источника этих колебаний по отношению к регистрирующим электродам.

Острая волна. Данный феномен близок по происхождению к спайку. Внешне она напоминает спайк и отличается от него только растянутостью во времени. Длительность острой волны больше 50 мс. Амплитуда может достигать тех же значений, что и амплитуда спайков.

Спайк-волна. Комплекс, возникающий от комбинации спайка с медленной волной. Как правило, эти комплексы имеют высокую амплитуду, причем амплитуды спайка и волны, входящих в комплекс, обычно коррелируют, хотя часто спайк или волна оказывается ниже или выше по амплитуде. Комплексы спайк-волна обычно следуют сериями повторяющихся феноменов, причем комплексы в серии бывают иногда столь стереотипны, что при наложении почти точно совпадают. Часто несколько спайков комбинируются с одной волной. Такой комплекс называется "множественные-спайки-волна".

Рассмотрение методик прогнозных моделей ЭЭГ сигнала

В нашем случае временные ряды представляют реализацию ЭЭГ сигнала. Временные ряды можно рассматривать как случайные стационарные или нестационарные дискретные процессы. Основу статистических прогнозирующих математических моделей составляют различные модели временных рядов: модель скользящего среднего (СС или МА) и взвешенного скользящего среднего (ВСС), модель экспоненциального сглаживания Брауна (ЭС), авторегрессионная модель (АР или AR), совмещенная модель авторегрессии скользящего среднего (АРСС или ARMA), совмещенная модель авторегрессии интегрированного скользящего среднего или Бокса-Дженкинса (АРИСС или ARIMA) и т.п . Классификация основных из статистических прогнозирующих математических моделей приведена на рис.2.1.

Статистические модели в зависимости от учета в них в качестве входных параметров внешних влияющих факторов делят на: однофакторные и многофакторные. В первом типе моделей учет внешних факторов не осуществляется, а строится замкнутая динамическая модель самой выходной величины. Во втором типе - динамическая модель включает один или несколько внешних влияющих факторов. Если модель временного ряда многофакторная, то этот факт может отмечаться буквой "X" в сокращении ее названия (ARX-модель, ARMAX-модель и т.д.).

Помимо моделей временных рядов при статистическом прогнозировании используются модели, основанные на [2,5,6,11]: фильтрах Калмана и Винера (модель Заде-Рагаззини); спектральных ортогональных разложениях, в том числе, Карунена-Лоэва; каноническом разложении случайного процесса; многомерной регрессии; теории кластерного анализа; теории распознавания образов.

Все перечисленные статистические модели могут использоваться при моделировании как отдельно, но чаще всего в составе комбинированных вероятностно-детерминированных моделей.

При статистической параметрической идентификации важен вопрос определения характеристик точности, полученных оценок параметров модели и их зависимость от объема предыстории. Эта информация необходима, например, для принятия решения об окончании идентификации объекта, а также выборе той или иной модели. Проведем краткое описание некоторых видов моделей, перечисленных на (рис. 2.1)

Регрессионные статистические модели временных рядов (AR-, ARI-, ARX-, ARMAX-, ARMA-, ARIMA-, ARIMAX- модели).

Приведем краткую классификацию и описание регрессионных моделей временных рядов, используемых для моделирования стационарных и нестационарных процессов[2,5,6,17,27,61,68,69,99]: - АК(АК1)-модель или авторегрессионная модель (с интегрированием или разностным оператором); - ARX-модель или авторегрессионная с учетом влияния внешних факторов (включает Х-составляющую); - ARMA-модель или авторегрессионная модель со скользящей средней; - ARIMA-модель или авторегрессионная интегрированная со скользящей средней модель (АРИСС), иногда ее называют моделью Бокса-Дженкинса [68,70]; - ARMAX-модель или обобщенная линейная полиномиальная модель типа «черный ящик» (black box model); - ARIMAX-модель или обобщенная линейная полиномиальная модель типа «черный ящик» с интегрирование

Авторегрессионая модель AR используется для моделирования стационарных случайных процессов, а для моделирования нестационарных процессов используется совместно с интегральной составляющей (ARJ, где I - интегральная составляющая). Введение интегральной составляющей требует взятия от моделируемого процесса конечных разностей того или иного порядка d, что, по мнению некоторых авторов [68,70,71] позволяет нестационарный процесс свести к стационарному. Все перечисленные регрессионные модели временных рядов (AR-, ARI-, ARMA и т.п.) при построении используют понятия теории вероятности математической статистики, такие, как АКФ, частная автоковариационная функция (ЧАКФ), автокорреляционная и ковариационная матрицы; стационарность случайного процесса и другие.

Поэтому при их использовании моделируемому процессу предъявляются требования выполнения статистических критериев, в частности, критерий стационарности и случайности временного ряда (критерий серий) [56,113]; критерий значимости ковариационных и корреляционных матриц [60,114,115] и т.п. Все перечисленное усложняет применение перечисленных методов к различным типам процессов. Кроме того, следует отметить, что применение этих методов адекватно ситуации, если моделируемый процесс практически стационарный или приводится к стационарному взятием однократных разностей. В иных случаях нестационарных процессов со значимым детерминированным трендом использование этих моделей часто дает неудовлетворительный по точности результат.

Модели экспоненциального сглаживания Брауна, взвешенного среднего, Холта-Уинтерса и подобные

Выбор разделяющих поверхностей и решающих правил

В [19, 90] уже обсуждался вопрос выбора критерия оптимизации, и был предложен следующий подход к рассмотрению задачи построения разделяющей поверхности.

Как уже отмечалось ранее в теории распознавания сигналов в отношении процессов (сигналов), принадлежащих одному классу, высказывается гипотеза компактности, т.е. включение всех объектов каждого класса в одно подмножество, состоящее из конечного числа связанных областей. Другими словами, гипотеза компактности предполагает адекватность понятий "сходства" процессов одного класса и их геометрической "близости", проявляющейся в объединении их в одно связанное подмножество в пространстве признаков.

Поскольку распознаваемый класс сигналов является случайным процессом, N -мерный вектор его признаков у заключен в некоторой области G, причем эта область может быть бесконечной. Так для нормального процесса вероятность попадания его значений в любую произвольную область отлична от нуля. Однако практически удается выделить такую ограниченную область признакового пространства, вероятность попадания в которую признаков данного класса весьма высока, в то же время для других ничтожно мала.

Разделяющая поверхность в нашем случае задается выражением она охватывает замкнутую область фиксированного объема, вероятность попадания в которую признаков данного класса максимальна. Необходимо найти эту поверхность. При этом, если собственную область G пространства признаков определенного класса (например класса А) задавать исходя из условия максимума вероятности правильной классификации при фиксированном объеме выделенного пространства то максимизируемый функционал I принимает вид [77] где X - множитель Лагранжа.

В [77] показано, что искомая граница Г выделенной области G должна удовлетворять условию а поверхность (3.50) будет представлять собой контур равновероятной плотности. Если эта поверхность определена, процедура распознавания сводится к вычислению функции плотности вероятности со(уА) при наблюдаемом значении у и сравнению ее с порогом X. Решающее правило в этом случае будет иметь вид

Умение достаточно точно и сравнительно просто восстановить функцию плотности вероятности или выделить контур, на котором она постоянна, в значительной степени определяет практическую возможность решения задачи распознавания.

Если контур равновероятной плотности является разделяющей поверхностью, то сформировать его можно используя алгоритмы обучения, описанные в [95]. Использование алгоритмов обучения предполагает, что контур равновероятной плотности или разделяющая поверхность аппроксимируются рядом

Во многих практических ситуациях более предпочтительно формировать разделяющую поверхность как огибающую элементарных фигур - гиперсфер, гиперкубов [41]. Уравнение каждой такой поверхности или

Центр фигуры естественно совмещается с математическим ожиданием m распределения вектора признаков у. При этом для сферически симметричного распределения уравнение (3.36) является также контуром равновероятной плотности и достаточно компактно выделяет собственную область каждого класса. В качестве критерия оптимальности можно использовать функционал, минимизирующий объем собственной области при фиксированной вероятности правильного распознавания PG [77] где X - множитель Лагранжа.

Если область G замыкается единственной сферой, то функционал можно представить в виде где Г (n / 2) - гамма-функция.

Необходимыми параметрами для формирования области G являются здесь координаты центра сферы mG и величина радиуса R

Известно [85], что с повышением размерности признакового пространства (при условии использования эффективных признаков, с точки зрения заданного критерия) качество работы классификатора улучшается. Однако значительное увеличение количества признаков ведет к необоснованному усложнению аппаратуры распознавания и, в конечном счете, потере рентабельности разрабатываемого оборудования. Поэтому остается открытым вопрос, какое количество и, самое главное, какие признаки должны использоваться при классификации процессов, то есть стоит задача оптимизации размерности признакового пространства.

Рассмотренные в п. 2.1 методы оптимизации количества используемых признаков применимы только в случаях, когда известны хотя бы оценочные зависимости ошибок первого и второго рода от времени обучения и распознавания. Однако для случая использования признаков, сформированных с применением метода стохастического кодирования, такие зависимости не получены.

Так как методика получения признаков для распознавания уже определена, то, говоря о виде признаков, имеем в виду вид плотности распределения вероятности опорного процесса. Решение задачи выбора опорного распределения (или опорных распределений) в данном случае не может быть формализовано. Здесь многое зависит от опыта и интуиции разработчика.

Говоря об .эффективных признаках, имеют в виду признаки, использование которых максимизирует некоторый заданный критерий. В нашем случае таким критерием является, как уже указывалось, достоверность распознавания.

Моделирование алгоритмов непараметрического распознавания

Из представленного в п. 3.3 описания алгоритмов работы НКСП следует, что их показатели качества - вероятности суммарных ошибок по классам Роші, і = 1, К зависят от многих параметров: 1) длительности интервала наблюдения или количества отсчетов входного сигнала, необходимых для формирования одного признака; 2) размерности вектора признаков р; 3) продолжительности процедур обучения и распознавания или объемов обучающих и контрольной выборок п и т; 4) вида опорных распределений процессов, используемых при формировании вектора признаков. Моделирование работы алгоритмов непараметрической обработки с целью получения зависимостей показателей качества от этих параметров представляет сложную задачу как в отношении вычислительной сложности алгоритмов моделирования, так и в отношении интерпретации результатов моделирования и оценки погрешностей полученных результатов. Поэтому в данной работе представлены результаты анализа поведения оценок Роші в зависимости от объемов обучающих выборок (количество

объектов обучения), размерности вектора признаков, при постоянных значениях длительности интервала наблюдения, продолжительности процедуры классификации и для определенных опорных распределений. Данные зависимости вычислены с использованием двух алгоритмов НКСП -с некоррелированными и коррелированными отсчетами опорных случайных процессов.

Случай с различными опорными распределениями и интервалами наблюдения рассматривался в п. 3.4-3.5, где определялись зависимости МО и СКО признаков от этих параметров.

Таким образом, в результате моделирования определяются значения параметров системы распознавания, при которых использование разработанных алгоритмов практически целесообразно.

В соответствии со структурной схемой устройства НКСП (см. рис. 3.3) моделирование его работы проводится в два этапа: 1) моделирование в режиме обучения; 2) моделирование в режиме классификации. Структурные схемы алгоритмов программ моделирования, соответствующих этим этапам, представлены в приложении 4 Рис.П 4.1 и Рис.П 4.2.

Листинг программы представлен в приложении 3, который содержит также результаты моделирования.

Моделирование проводилось для четырех классов случайных процессов, имеющих одинаковые одномерные плотности распределения вероятностей и корреляционные функции экспоненциального вида с различными интервалами корреляции. Примеры реализаций исследуемых случайных процессов представлены на рис. 4.1. На основе полученных результатов были построены графики на рис. 4.2,4.3.

На рис. 4.2, 4.3 представлены графики зависимости суммарных вероятностей ошибок от количества объектов обучения для случая двухальтернативного распознавания. На входе системы те же сигналы, но выбранные парами соответствующими увеличению расстояния между классами в признаковом пространстве

Анализ полученных результатов приводит к следующим выводам. 1) Минимум вероятности ошибки классификации достигается при росте объема обучающей выборки; 2) Применение алгоритма классификации с коррелированными опорными процессами целесообразно только в случае критически малых объемов обучающих и контрольных выборок. При увеличении времени обучения и распознавания предпочтительно использование алгоритма классификации с некоррелированными опорными процессами, требующего меньших временных затрат на формирование отсчетов признаков при той же вероятности ошибки классификации; 3) Коэффициент сжатия информации о процессе для графиков на рис. 4.2, 4.3 равен к =1000, количеству точек, по которым строится оценка признака.

Похожие диссертации на Исследование методов обработки электроэнцефалографических сигналов с целью решения задач классификации в медицинских диагностических системах