Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Шаталова Ольга Владимировна

Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости
<
Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Шаталова Ольга Владимировна. Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости : дис. ... канд. техн. наук : 05.13.01 Курск, 2006 152 с. РГБ ОД, 61:07-5/312

Содержание к диссертации

Введение

ГЛАВА 1. МЕТОДЫ ФОРМИРОВАНИЯ И КЛАССИФИКАЦИИ ИНФОРМАТИВНЫХ ПРИЗНАКОВ В СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ, ОСНОВАННЫХ НА АНАЛИЗЕ СИГНАЛА ГОЛОСА 12

1.1. Основные принципы классификации заболеваний гортани и их диагностики 12

1.1.1. Воспалительные заболевания гортани 16

1.1.2. Двигательные расстройства гортани 18

1 1.3. Новообразования гортани 21

1.1.4. Функциональные дисфонии 22

1.2. Частотно-временные представления сигнала голоса 25

1.3. Модели систем обработки и классификации данных при диагностике, прогнозировании и дифференцировании заболеваний 35

1.4. Цель и задачи исследования 53

ГЛАВА 2. СИНТЕЗ ПРИЗНАКОВОГО ПРОСТРАНСТВА ДЛЯ ДИАГНОСТИКИ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ГОЛОСОВОГО АППАРАТА 55

2.1. Выбор тестовых голосовых сигналов и их метода анализа для дифференциальной диагностики функционального состояния голосового аппарата 55

2.2. Разработка способа сегментации тестовых сигналов 60

2.3. Сегментация вейвлет-плоскости тестового сигнала 67

2.4. Выбор информативных признаков на вейвлет-плоскости тестового сигнала 76

2 4.1 Выбор первого информативного признака 76

2. 4 2 Выбор и вычисление второго и третьего информативных признаков 79

2.4 3. Выбор четвертого и пятого информативных признаков 80

2.5. Выводы второй главы... 82

ГЛАВА 3. РАЗРАБОТКА МЕТОДОВ И СРЕДСТВ ДЛЯ АВТОМАТИЗИРОВАННОЙ ДИАГНОСТИКИ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ГОРТАНИ 84

3.1. Нечеткий решающий модуль с трехстабильным выходом в инструментарии для исследований функционального состояния гортани 84

3.2. Выбор целевой функции и разработка алгоритмов обучения для нечеткого решающего модуля с трехстабильным выходом 93

3.3. Разработка и исследование автоматизированной системы для поддержки принятия решений по диагностике функциональных состояний гортани 100

3.4. Разработка способа формирования функций принадлежности для фуззификатора решающего модуля 104

3.5. Выводы третьей главы 112

ГЛАВА 4. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ РЕШАЮЩЕГО МОДУЛЯ С ТРЕХСТАБИЛЬНЫМ ВЫХОДОМ В ЗАДАЧАХ ДИАГНОСТИКИ ФУНКЦИОНАЛЬНОГО СОСТОЯНИЯ ГОЛОСОВЫХ СКЛАДОК 114

4.1. Объект, методы и средства исследования 114

4.2. Синтез нечетких решающих правил для диагностики заболеваний гортани на основе информативных признаков, полученных по вейвлет-плоскости тестовых фонем 118

4.3. Разработка алгоритмов для дифференциальной диагностики функционального состояния гортани 123

4.4. Экспериментальные исследования качества диагностики функционального состояния гортани по вей влет-плоскостям сигнала голоса 130

4.5. Выводы четвертой главы 132

ЗАКЛЮЧЕНИЕ 134

БИБЛИОГРАФИЧЕСКИЙ СПИСОК 137

Введение к работе

Расстройство голосового аппарата является наиболее распространенным заболеванием среди школьников, студентов и преподавателей. Многие хронические заболевания органов и систем, не входящих в состав голосового аппарата, могут обуславливать неполноценность его функции даже в случае отсутствия каких-либо изменений в гортани. Сюда относятся заболевания легких, сердечнососудистой, нервной и эндокринной систем. Установлена тесная связь между голосовыми расстройствами и нарушениями функции щитовидной железы.

Проведенные исследования показали, что в большинстве случаев оценка голоса пациента осуществляется оториноларингологом или фониатром субъективно, т.е. на слух, и присутствие человеческого фактора при этом неизбежно. Поэтому в практике фониатров используются компьютерные технологии, которые позволяют определить некоторые акустические параметры голоса, на основе которых может быть объективно определено состояние голосового тракта, например, путем балльных оценок. При этом используются различные методы компьютерного анализа сигнала голоса, ориентированные как на пространство сигналов, так и на пространство частот. Однако в настоящий момент они не могут удовлетворить специалистов, как по достоверности, так и по оперативности диагностики, так как в результате размытости границ классов обладают низкой специфичностью и требуют высокой квалификации эксперта для принятия решения о наличии или отсутствии патологии голосового аппарата.

Многочисленные исследования показали, что основой существования любой сложной биологической системы являются ритмические процессы (Глас Л., Скляров О., Чижевский А). Каждой биологической системе, находящейся в состоянии гомеостатического равновесия, соответствует ритм определенной сложности. Причем отклонение от этого состояния может сопровождаться как усложнением ритма (до хаотического ритма), так и упрощением его (метрономный режим) (БаевскиЙ Р.). Поэтому для исследования функционального состояния голосового аппарата и распознавания речи широко используют спектральные методы (Гоулд Б., Рабинер Л.).

Однако на спектральный состав сигнала голоса влияет множество системных факторов, не связанных с функциональным состоянием голосового аппарата (Василенко Ю.С., Васильев Ю.М.), поэтому использование классических спектральных методов анализа в этом случае затруднительно и для его анализа предпочтительно использовать частотно-временные преобразования (Макс Ж.).

Таким образом, разработка методов и средств диагностики функционального состояния голосового аппарата, позволяющих вести анализ нестационарных сигналов и обеспечивающих поддержку принятия решений в условиях нечетко выраженных границ классов, является акіуальной задачей.

Работа выполнена в соответствие с научно-технической программой «Научные исследования высшей,, школы по приоритетным направлениям науки и техники», подпрограмма 204 «Технология живых систем» 2002-2004 гг. и в соответствии с научным направлением Курского государственного технического университета «Разработка медико-экологических информационных технологий».

Цель работы. Целью данной работы является повышение диагностической эффективности классификации функционального состояния голосового аппарата посредством частотно-временного анализа тестовых сигналов голоса и нечеткой логики принятия решений.

Для достижения поставленной цели необходимо решить следующие основные задачи:

7 разработать метод синтеза пространства информативных признаков, выделяемых из кода тестового сигнала; разработать модель модуля нечеткого вывода, предназначенного для использования в системах поддержки принятия решений при диагностике функционального состояния голосового аппарата; предложить структуру системы поддержки принятия решений для врача-фониатра; разработать способ формирования функций принадлежности для классификации функциональных состояний голосовых складок; - провести апробацию предложенных методов и средств на репрезентативных контрольных выборках.

Методы исследований. , Для решения поставленных задач использовались методы системного анализа, спектрального анализа, вейвлет-анализа, математической статистики, теории нечетких нейронных сетей и распознавания образов, экспертного оценивания и принятия решений. При разработке модуля нечеткого вывода в качестве инструментария использовался Matlab 6.0 с графическим интерфейсом пользователя для NN - NNTool и со встроенным пакетом Fuzzy Logic Toolbox.

Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной: метод синтеза признакового пространства по вейвлет-плоскости тестовой фонемы, отличающийся способами выделения тестовой фонемы из тестового сигнала, сегментации вейвлет-плоскости тестовой фонемы и процедурами определения статистических характеристик выделенных сегментов вейвлет-плоскости тестовой фонемы; способ выделения тестовой фонемы из тестового сигнала, основанный на анализе числа пересечений нулевого уровня тестовым сигналом в скользящем частотно-временном окне; - способ сегментации вейвлет-плоскости тестовой фонемы, отличающийся анализом частотных компонент модулей вейвлет-коэффициентов и их нисходящих разностей в окнах, ширина которых равна длине строки вейвлет-плоскости; - модель модуля нечеткого вывода, предназначенная для использования в системах поддержки принятия решений при диагностике функционального состояния голосовых складок, отличающаяся правилами вывода в агрегаторе и дефуззификаторе и алгоритмом уточнения настраиваемых параметров, основанном на итерационной процедуре минимизации числа объектов обучающей выборки, для которых не могут быть приняты ни нулевая, ни альтернативная гипотезы; способ формирования функций принадлежности для классификации функциональных состояний голосовых складок, заключающийся в сортировке р полигонов обучающих выборок двух разделяемых классов, с последующим применением к полученные полигонам процедур обработки гистограмм, определяемым относительной дислокацией полигонов выбранных классов; - алгоритмы классификации функциональных состояний голосовых складок, отличающиеся наличием детектора ошибок, позволяющие контролировать достоверность полученных результатов при выделении подклассов функциональных состояний голосовых складок и при ситуациях, когда нечеткий решающий модуль не выдает конкретного диагностического заключения.

Практическая значимость и результаты внедрения. Разработанные методы, способы и алгоритмы составили основу построения автоматизированной системы поддержки принятия решения по управлению процессами диагностики и коррекции функционального состояния голосовых складок, практические испытания которой показали ее высокую диагностическую эффективность и приемлемое качество рекомендаций по реабилитации голосового аппарата.

Программные средства ориентированы на практическое здравоохранение и реализуют алгоритмы диагностики, способствующие ускорению процессов реабилитации больных с функциональными нарушениями голосовых складок.

Результаты работ используются при проведении научно-исследовательских работ в ГУП НИИ Новых Медицинских Технологий и используются в учебном процессе Курского государственного технического университета при подготовке специалистов по направлению 200300.68 - «Биомедицинская инженерия».

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих .научно-технических конференциях: Всероссийской научно-технической конференции студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы» (Биомедсистемы-2001) (Рязань, 2001); VI, VII, VIII и IX Международных научно-технических конференциях «Медико-экологические информационные технологии» (Курск, 2003, 2004, 2005, 2006); 6-й Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации» (Распознавание-2003) (Курск, 2003); X Юбилейной и XI Российских научно-технических конференциях с международным участием «Материалы и упрочняющие технологии» (Курск, 2003, 2004); XXXI вузовской научно-технической конференции студентов и аспирантов в области научных исследований «Молодежь и XXI век» (Курск, 2003); Всероссийской научно-технической конференции «Биотехнические системы в XXI веке» (С.-Петербург, 2004); научной конференции «Интеграция медицины и образования» (Курск, 2006).

Публикации. Самостоятельно и в соавторстве по теме диссертации опубликовано 9 печатных работ.

10 Личный вклад автора. В работах, опубликованных в соавторстве и приведенных в конце автореферата, в [1] автором предложена модификация нечеткой нейронной сети Ванга-Менделя, в [2] автором предложена структура модуля нечеткого вывода с трехстабильным выходом; в [4] соискателем предложен способ получения «картины» голоса, в [5] соискатель предложил способ сегментации сигнала голоса, в [б] автор исследовал структуру пятислойного нечеткого решающего модуля, в [8] и [9] соискателем предложены способы сегментации вей влет-плоскостей тестовых сигналов и выделения информативных признаков из полученных сегментов.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и библиографического списка, включающего 116 отечественных и 22 зарубежных наименования. Работа изложена на 152 страницах машинописного текста, содержит 49 рисунков и 6 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

В первой главе исследуется современное состояние вопроса и показывается, что повышение качества диагностики функционального состояния голосовых складок может быть достигнуто посредством выделения и анализа информативных признаков из вейвлет-плоскости сигнала голоса с последующим использованием нейроподобных сетевых моделей и нечеткой логики принятия решений.

Во второй главе предлагается метод формирования признакового пространства из цифровых отсчетов сигнала голоса, обсуждаются требования к тестовым фразам для диагностики заболеваний гортани и предлагаются способы выделения информативных признаков из вейвлет-плоскости тестового сигнала.

В третьей главе разрабатываются модели нечетких решающих модулей с трехстабильным состоянием выходов и алгоритмы их обучения в системе поддержки принятия решений врача-фониатра.

В четвертой главе были получены функции принадлежности для некоторых патологий голосовых складок по информативным признакам,

определенным на вейвлет-плоскости тестового сигнала, разработаны алгоритмы дифференциальной диагностики заболеваний гортани, для системы поддержки принятия решений с нечетким решающим модулем, предназначенной для врача-фониатра, и приведены результаты экспериментальных исследований.

В заключении сформулированы научные и практические результаты исследования.

title1 Основные принципы классификации заболеваний гортани и их диагностики title1

Расстройство голосового аппарата относится к наиболее распространенным заболеваниям. На рис. 1.1 представлены некоторые виды расстройств голосового аппарата, связанных с заболеванием гортани. Анализ интенсивности этих заболеваний показал, что наиболее распространенными из них являются дисфонии, причинами которых могут быть функциональные, органические пли воспалительные заболевания гортани.

Голосовой аппарат представляет собой сложную систему, у которой функции составляющих частей взаимосвязаны и контролируются центральной нервной системой. Он состоит из первичного генератора звука - гортани, энергетического отдела - легких, резонаторов - полости носа и носоглотки, околоносовых пазух, глотки, трахеи, бронхов и артикуляционного отдела - мышцы шеи, язык, мягкое небо, зубы, нижняя челюсть. Нарушение нормальной морфо-функциональной структуры каждого из этих отделов отрицательно сказывается на процессе голосообразования и голосоведения, приводит к развитию функциональных и органических дисфонии. Многие хронические заболевания органов и систем, не входящих в состав голосового аппарата, могут, обуславливать неполноценность его функции даже в случае отсутствия каких-либо изменений в гортани. Сюда относятся заболевания легких, сердечно-сосудистой, нервной и эндокринной систем. Так, хронические заболевания органов грудной и брюшной полости отрицательно сказываются на голосе из-за нарушения способности диафрагмы нормально двигаться. При появлении даже небольших участков воспаления в легких уменьшается подвижность диафрагмы, в результате чего изменяется тембр голоса, появляется его быстрая утомляемость, возникают боли в гортани, даже при незначительной голосовой нагрузке. Поэтому нарушения голоса нередко являются только симптомом какого-либо заболевания. Для оценки фонаторных колебаний голосовых складок используют способ, в котором на основе экспертной балльной оценки пяти качественных характеристик колебаний голосовых складок определяется индекс вибраторных нарушений, по величине которого делается заключение о наличие голосовых нарушений [40].

Однако этот способ диагностики недостаточно эффективен в силу интегрального характера индекса вибраторных нарушений, что не позволяет дифференцировать голосовые нарушения; ограниченности динамического диапазона экспертной оценки (от одного до трех баллов), что снижает как чувствительность, так и специфичность способа; частого отсутствия возможности определения индекса вибраторных нарушений на основании всех пяти характеристик и отсутствие полной идентичности условий при постановке эксперимента, что затрудняет сопоставимость типа голосовых нарушений и численного значения индексов вибраторных нарушений; и отсутствие возможности ретроспективного анализа.

Выбор тестовых голосовых сигналов и их метода анализа для дифференциальной диагностики функционального состояния голосового аппарата

Для объективной оценки функционального состояния голосового аппарата человека используются различные методы компьютерного анализа сигнала голоса, ориентированные как на пространство сигналов, так и на пространство частот [13, 16, 77, 105, 109, 113]. Так как сигнал голоса относится к нестационарным сигналам, то для его анализа предпочтительно использовать частотно-временные представления.

В разделе 1.2 было показано, что в качестве частотно-временного представления при анализе сигнала голоса целесообразно использовать вей влет-преобразование.

Вейвлет-преобразование представляет сигнал голоса в виде «картины», определяемой, в основном, формантным составом тестового сигнала.

Проведенные нами экспериментальные исследования показали, что могут быть подобраны тестовые слова и тестовые фонемы, которые отражают характер и стадии заболевания голосового аппарата. При диагностике функциональных расстройств голосового аппарата к тестовому сигналу не предъявляется требований по семантической нагрузке, но он должен отражать все характерные дефекты голосовых складок. В то же время структура сигнала должна быть такой, чтобы его спектральное разложение было слабо подвержено влиянию факторов, не связанных с функциональным состоянием голосового аппарата.

Проведенные нами исследования спектров Фурье тестовых фонем [109] показали, что с точки зрения этих требований наиболее подходящими являются фонемы «Е» и «И». В результате проведенных исследований было отдано предпочтение фонеме «Е» по той причине, что в ее спектре Фурье обертоны более выражены, чем в спектре фонемы «И». Практика диагностики заболеваний гортани показала, что зона обертонов является наиболее информативной [105]. В процессе исследования было предложено два варианта записи фонемы «Е»: в процессе непрерывной фонации в течение 5 с и фонации слов, в которых фонема «Е» была расположена между двумя согласными (использовалось слово «СПЕКТР») с последующим выделением сегмента записи, соответствующего фонеме «Е».

В результате исследования предпочтение отдано второму способу. Это обусловлено тем, что для спектральных исследований необходимо выбрать фрагмент сигнала, который в случае использования первого способа фонации будет сильно зависеть от того, где будут поставлены маркеры, ограничивающие анализируемый сегмент, так как испытуемому весьма трудно поддерживать постоянный уровень силы голоса (амплитуды колебаний голосовых складок) (рис, 2.1, а).

Следовательно, второй способ позволяет получить высокую стабильность амплитудных характеристик сигнала во временном пространстве.

Нечеткий решающий модуль с трехстабильным выходом в инструментарии для исследований функционального состояния гортани

При диагностике функциональных состояний гортани используются разнообразные тесты, среди которых широко известны тесты, основанные на частотно-временном представлении сигналов тестовых фонем [101]. Результаты тестирования при этом могут быть представлены пяти компонентным вектором X [105].

Несмотря на многолетний опыт использования этих тестов, фониатры не могут предложить даже набор импликаций, не говоря уже о самом виде четкой функции заключения, поэтому решение о принадлежности тестируемого к,тому или иному классу принимается на основе логических рассуждений.

Для построения автоматизированных систем классификации заболеваний гортани на основе частотно-временного анализа сигнала голоса, целесообразно использовать нечеткие нейронные сети [71, 79], которые являются наиболее адаптированными к методикам тестирования, основанного на бинарном выборе [108].

Анализ моделей нечетких нейронных сетей TSK и Ванга-Менделя позволил нам получить трехслойную модель нечеткого решающего модуля для такого тестирования, структура которого показана на рис. 3.1.

На входе сети присутствуют векторы признаков двух классов: «здоров»/«болен», поэтому структура сети включает только два параллельных канала, в состав которых входят фуззификатор и агрегатор.

Эта структура принятия решений аналогична модели принятой в дискриминантом анализе, основная идея которого заключается в том, чтобы определить, отличается ли совокупность по среднему какого-нибудь информативного признака или линейной комбинации этих признаков, а затем использовать этот признак или линейную комбинацию признаков для классификации новых объектов [12]. Отличие от модели рис. 3.1 состоит лишь в способе определения коэффициентов линейных функций классификации.

Синтез нечетких решающих правил для диагностики заболеваний гортани на основе информативных признаков, полученных по вейвлет-плоскости тестовых фонем

Второй информативный признак Х2 получаем в первой формантной зоне фонемы «Е». Количественно Х2 определяет энергетические характеристики первой форманты. Так как мы условились, что в процессе синтеза признакового пространства не принимается в расчет такая характеристика голосового аппарата, как сила голоса, то второй информативный признак должен быть нормирован таким образом, чтобы исключить влияние этого параметра. Так как в процессе патологических отклонений происходит «перекачка» энергий из одной формантной зоны в другую, то таким нормирующим коэффициентом может быть среднее значение модуля вейвлет-коэффициентов, которое определяется согласно выражению.

Похожие диссертации на Нечеткие сетевые модели и алгоритмы для диагностики состояния голосового аппарата на основе анализа фонем на вейвлет-плоскости