Содержание к диссертации
Введение
Глава 1. Аналитический обзор. Современное состояние вопроса . 8
1.1. Основные положения. 8
1.1.1. Ввод сигнала и цифровая обработка 8
1.1.2. Предварительная обработка и выделение первичных признаков 9
1.1.3. Выделение примитивов речи 10
1.1.4. Распознавание сложных звуков, слов, фраз 11
1.2. Обработка сигнала нервной системой 12
1.2.1. Кодирование сигналов в нервной системе 14
1.2.3. Нейронные сети 17
1.2.3.1 Обучение нейронной сети с учителем 21
1.2.3.2. Обучение без учителя 28
1.3. Постановка задачи исследований 33
Глава 2. Анализ методов восприятия информационных сигналов биологическими системами 34
2.1. Акустоэлектрическое преобразование сигнала 34
2.1.1. Трансформация звукового давления 34
2.1.2. Преобразование перемещения барабанной перепонки в сжатие жидкости внутреннего уха 35
2.1.3. Механоэлектрическое преобразование сигнала 35
2.1.4 Разработка системы контроля параметров информационных сигналов 40
2.2. Исследование обработки сигналов нервной системой 43
2.2.1 Структура и функции синапсов 43
2.2.2. Механизмы возбуждения и торможения 47
2.2.3. Моделирование механизмов возбуждения и торможения синапсов 48
2.3 Синапс - нейронные структуры обработки информационных сигналов 56
Выводы 64
Глава 3. Разработка методов контроля информационных сигналов 65
3.1. Полосовые шаговые фильтры 65
3.2. Анализ информационных сигналов методом динамического сдвига 74
3.3 Экспериментальное исследование разрешающей способности системы контроля параметров информационных сигналов 87
Выводы 93
Глава 4. Разработка синапс-нейронных структур контроля и идентификации информационных сигналов 99
4.1 Синапс-нейронные структуры контроля динамики изменения спектра информационных сигналов 99
4.2. Синапс - нейронная ячейка распознавания
4.3 Общая структура системы идентификации информационных сигналов 109
Выводы 111
Заключение 112
Литература
- Предварительная обработка и выделение первичных признаков
- Преобразование перемещения барабанной перепонки в сжатие жидкости внутреннего уха
- Экспериментальное исследование разрешающей способности системы контроля параметров информационных сигналов
- Синапс - нейронная ячейка распознавания
Введение к работе
Современные цифровые вычислительные машины намного превосходят человека по способности производить числовые и символьные вычисления, однако отличаются крайне низкой эффективностью в задачах, связанных с обработкой данных, представленных большим количеством нечеткой и неполной информации (например, распознавания образов), тогда как мозг живых существ, каждый элемент которого обладает сравнительно низким быстродействием, справляется с такими задачами за доли секунды.
В последние десятилетия в мире бурно развивается новая прикладная область математики, специализирующаяся на искусственных нейронных сетях (НС). Актуальность исследований в этом направлении подтверждается массой различных применений НС. Это автоматизация процессов распознавания образов, адаптивное управление, аппроксимация функционалов, прогнозирование, создание экспертных систем, организация ассоциативной памяти и многие другие приложения. С помощью НС можно, например, предсказывать показатели биржевого рынка, выполнять распознавание оптических или звуковых сигналов, создавать самообучающиеся системы, способные управлять автомашиной при парковке или синтезировать речь по тексту. В то время как на западе применение НС уже достаточно обширно, у нас это еще в некоторой степени экзотика -российские фирмы, использующие НС в практических целях, наперечет [1].
Исследование нейросетей обусловлено также потребностью в увеличении роста производительности вычислительных систем. Увеличение сложности и быстродействия современных последовательных процессоров скоро упрется в границы, обусловленные физическими законами (предел интеграции и тактовой частоты). Выход - использовать параллельные вычислительные системы, но при этом возникает другая проблема -сложность написания эффективных алгоритмов для параллельной обработки
5 без излишнего дублирования действий. Нейросетевая обработка информации, одним из принципов которой является массовый параллелизм, позволяет решить эту проблему. Возможно, теория нейронных сетей позволит не только разрабатывать алгоритмы для таких узких систем, как нейроподобные сети, но и позволит перенести результаты на более широкий класс параллельных вычислительных систем при большом числе составляющих их элементов.
Исходя из проведённого анализа можно заключить, что во многих объектах инженерной техники, например, в технической и медицинской диагностики, сигналы, несущие информацию о состоянии диагностируемого объекта (информационные сигналы), имеют как правило, очень сложную форму, достаточно широкий спектр, не стационарны и т.п. Задачи обработки, оценки параметров и представления результатов обработки сложных информационных сигналов диагностирующих систему в реальном масштабе времени достаточно сложны. Для создания эффективных систем обработки сложных информационных сигналов в реальном масштабе времени необходимо:
1) разработать систему контроля параметров информационных сигналов и систему представления их результатов; создать систему спектрального анализа информационных сигналов в реальном режиме времени на основе синапс-нейронных структур; создать систему идентификации на основе получаемых параметров сигналов, осуществляющей параллельную обработку всей поступающей информации, для работы в реальном режиме времени.
Поэтому задачи обработки, оценки параметров и представления результатов обработки сложных информационных сигналов диагностирующих систему в реальном масштабе времени являются актуальной задачей.
Цель и задачи исследования. Целью диссертационной работы является создание системы контроля и идентификации информационных сигналов на основе их частотно-временного анализа.
Научная новизна заключается в следующем: на основе исследований механизмов работы синапсов, предложены новые логические модели синапс-нейронных взаимодействий; предложена методика преобразования сигнала многомерным шаговым фильтром, для получения частотных параметров сигнала; впервые предложена методология визуализации динамики изменения спектра сигнала; предложен метод контроля динамики изменения частот, входящих в состав сигнала; предложены новые синапс-нейронные структуры, осуществляющие контроль изменения частотных параметров сигнала.
Практическая ценность работы состоит в том, что созданы алгоритмы, расчетные формулы, программные средства, позволяющие осуществлять контроль и идентификацию информационных сигналов. Основываясь на данной методике были созданы синапс-нейронные структуры, осуществляющие качественный контроль амплитудно-частотных параметров информационных сигналов и их идентификацию.
Реализация научно-технических результатов. Основные результаты теоретических и экспериментальных исследований использованы для создания компьютерной системы контроля и идентификации звуковых сигналов, лежащих в диапазоне частот от 100 Гц до 6000 Гц, и идентификации электрокардиограмм в диапазоне от 1 Гц до 100 Гц, о чем имеется соответствующий акт испытания.
Материалы диссертационной работы используются в учебных курсах и научно-исследовательской практике Новомосковского института РХТУ.
Достоверность работы. Разработанные методики были подвергнуты экспериментальной проверке, которая подтвердила высокое качество контроля параметров информационных сигналов.
7 Автор выносит на защиту: синапс-нейронные модели обработки информационных сигналов; методику многомерной фильтрации сигнала; метод контроля динамики изменения амплитуд сложных колебаний; методология визуализации динамики изменения спектра сигналов; - синапс-нейронные структуры, позволяющие осуществлять контроль информационных сигналов и идентификацию их источников;
Апробация работы. Основные результаты диссертационной работы доложены на международных конференциях: «Математические методы в технике и технологиях» (ММТТТ-13) (г. Санкт-Петербург, 2000), ММТТТ-2001 (г. Смоленск, 2001), а также на научных конференциях Российского химико-технологического университета (РХТУ) (г. Москва, 1999-2001) и Новомосковского института РХТУ (г. Новомосковск, 1999-2001).
Публикации. Тема диссертации представлена в 8 публикациях. Научным руководителем работы является: доктор технических наук, профессор Беляев Ю.И.
Выражаю особую благодарность за большое внимание к работе оказанное научным консультантом профессором, д.т.н Кораблёвым Игорем Васильевичем.
Предварительная обработка и выделение первичных признаков
Информационный сигнал, поступающий в систему распознавания, подвергается предварительной обработке с целью компенсации погрешностей ввода и учета специфики сигнала. Как правило, такая обработка заключается в очистке сигнала от шума (например, отсечением неинформативных участков спектра), фильтрации, нормализацией до некоторого установленного уровня.
Затем необходимо выделить информативные признаки информационного сигнала, т.е. те, которые наиболее полно описывают сигнал в наиболее краткой форме. Очевидно, эффективность этого этапа определяет эффективность дальнейшей обработки сигнала и его распознавание. Понятно, что временное представление сигнала является довольно неэффективным, т.к. во-первых, не учитывает периодичности сигнала, во-вторых, из-за большой его изменчивости даже один и тот же сигнал, исходящий от разных источников, сильно варьируется в его временном представлении.
Гораздо более информативно спектральное представление. Для получения спектра используют набор полосовых фильтров, настроенных на выделение различных частот, или дискретное преобразование Фурье. Затем полученный спектр подвергается различным преобразованиям, например, логарифмическое изменение масштаба (как в пространстве амплитуд, так и в пространстве частот), сглаживание спектра с целью выделения его огибающей, кепстральному анализу (обратное преобразование Фурье от логарифма прямого преобразования). Это позволяет учесть некоторые особенности речевого сигнала - понижение информативности высокочастотных участков спектра, логарифмическую чувствительность человеческого уха, и т.д.
Как правило, полное описание информационного сигнала только его спектром невозможно. Наряду со спектральной информацией, необходима ещё и информация о динамике сигнала. Для её получения используют дельта-параметры, представляющие собой производные по времени от основных параметров.
Полученные таким образом параметры сигнала считаются его первичными признаками и представляют сигнал на дальнейших уровнях его обработки.
Под примитивами речи понимается неделимые звуки речи - фонемы, из которых и образуется сложная речь (относительно количества фонем идут постоянные споры: по некоторым данным, в русском языке 43 фонемы, по другим - 64, по третьим - более 100). Выделение и распознавание этих примитивов - первый этап распознавания в большинстве существующих систем. От его эффективности во многом зависит дальнейший ход распознавания на последующих этапах.
В случае применения нейросетей обучение выделению примитивов речи может заключаться в формировании нейронных ансамблей, ядра которых соответствуют наиболее частой форме каждого примитива [6]. Формирование нейронных ансамблей - это процесс обучения без учителя, при котором происходит статистическая обработка всех поступающих сигналов на вход нейросети. При этом формируются ансамбли, соответствующие наиболее часто встречающимся сигналам. Запоминание редких сигналов происходит позже и требует подключения механизма внимания или иного контроля с высших уровней.
Для распознавания слитной речи наиболее простой и понятной является построение системы в виде иерархии уровней, на каждом из которых распознаются звуки все большей сложности: на первом - фонемы, на втором - слоги, затем слова, фразы, и т.д. На каждом уровне сигнал кодируется представителями предыдущих уровней. При переходе с уровня на уровень помимо представителей сигналов передаются и некоторые дополнительные признаки, временные зависимости и отношения между сигналами. Собирая сигналы с предыдущих уровней, высшие уровни располагают большим объемом информации (или её другим представлением), и могут осуществлять управление процессами на низших уровнях, например, с привлечением механизма внимания.
Преобразование перемещения барабанной перепонки в сжатие жидкости внутреннего уха
Трансформация звукового давления выполняется наружным ухом (рис. 2.1), конкретно - ушной раковиной (аурикулой) 1. Кроме того, на этом этапе осуществляется акустическая пространственная обработка сигнала. В зависимости от направления прихода волны в спектре сигнала формируются характерные зоны подъема и спада АЧХ, получившие название пеленговых зон. полукружные кольца; 10 - основная мембран 10; 11 - мембрана Рейснера; 12- лестница преддверия; 13 - лестница барабана; 14 - перилимфа; 15 -эндолимфа; 16 - кортиев орган; 17 - покровная мембрана; 18 - слуховой нерв.
Выполняется это преобразование в среднем ухе. При этом происходит также дальнейшая трансформация звукового давления.
Барабанная перепонка вогнута внутрь и натянута. Ее перемещение воздействует на систему рычагов, состоящих из трех слуховых косточек: молоточка 4, наковальни 5 и стремени 6, шарнирно соединенных между собой суставами и оснащенными мышечным аппаратом из двух мышц 7. Рукоятка молоточка прикреплена к барабанной перепонке, основание стремени закрывает собой овальное окно, за которым находится внутреннее ухо. Стремя в овальном окне может совершать возвратно-поступательные движения. Коэффициент трансформации давления от барабанной перепонки к овальному окну 1:100. С целью защиты барабанной перепонки от повреждения, полость внутреннего уха соединена евстахиевой трубой с носоглоткой. Это обеспечивает выравнивание статического давления по обе стороны ее.
Необходимость предварительного функционального преобразования связана с тем, что скорость обработки сигнала центральной нервной системой значительно ниже скорости изменения звукового сигнала (частота а-ритма головного мозга около 7 Гц). Осуществляется механоэлектрическое преобразование во внутреннем ухе, точнее в улитке. Расположена улитка в височной кости. Там же расположены элементы вестибулярного аппарата органа определения пространственного положения. Совмещение уха и вестибулярного аппарата способствует более точному отслеживанию перемещений ушей с целью выделения пространственных характеристик источника звука из изменений ушных сигналов при перемещении головы. На рис. 2.1 улитка показана спрямленной, фактически же она свернута в спираль наподобие настоящей улитки. Длина канала улитки составляет 35 мм.
Пространство улитки разделено двумя мембранами (основной мембраной 10 и мембраной Рейснера 11) на три заполненных жидкостями спиральных канала: 1) лестницу преддверия 12 (заполнена перилимфой); 2) серединную лестницу (заполнена эндолимфой); 3) лестницу барабана 13 (заполнена перилимфой).
Овальное окно является входом в лестницу преддверия. Лестница барабана также соединена со средним ухом упругой мембраной. Перилимфатические полости соединены между собой через отверстие в вершине улитки - геликотерму. Эндолимфа и перилимфа имеют разные вязкость и плотность. Основная мембрана представляет собой аморфную ненатянутую перепонку, закрепленную по краям. Длина ее около 32 мм, ширина у овального окна около 0,1 мм и вблизи геликотермы 0,5 мм. Со стороны эндолимфы на основной мембране расположен кортиев орган 16, покрытый покровной мембраной 17. Кортиев орган содержит множество волосковых клеток, чувствительных к давлению и деформациям основной мембраны. С волосковыми клетками контактируют окончания нервных волокон. В кортиевом органе производится преобразование давления в электрические импульсы. Кроме того, некоторые волосковые клетки (называемые "наружными") получают команды от мозга: при больших уровнях сигнала они удлиняются и снижают амплитуду колебаний основной мембраны, а при очень малых уровнях сигнала дополнительно раскачивают мембрану. Таким образом, в улитке протекают следующие динамические процессы:
1. В жидкостях внутреннего уха волновые процессы отсутствуют, т.к. во всем слышимом диапазоне длина волны в них больше длины мембраны, поэтому к мембране по всей ее длине приложено одно и то же давление.
2. Т.к. мембрана закреплена по краям, избыточное давление вызывает прогиб мембраны. Мембрана колеблется в режиме бегущей волны. Стоячие волны не возникают потому, что отражение от вершины улитки практически отсутствует. Это утверждение выдвинуто Георгом Бекеши.
3. Направление распространения волны зависит не от точки возбуждения (давление со стороны жидкости на все точки мембраны одинаковое), а от распределения жесткости мембраны. Волна распространяется от более жесткого конца (овального окна) к менее жесткому (геликотерме).
4. Зависимость прогиба основной мембраны у от удаления от овального окна х и частоты может быть описана следующей функцией (рис. 2.2): y{x,t) = ут {& х) cos(arf - kx) (2.1) .Умах - функция с одним максимумом по х. Расположение максимума на оси х однозначно связано с частотой, что позволяет приписать основной мембране шкалу частот.
Экспериментальное исследование разрешающей способности системы контроля параметров информационных сигналов
Исходный сигнал qBX поступает на элемент задержки. Получаемый на его выходе задержанный на время т сигнал qT и исходный сигнал qBX поступают на элементы сравнения ЭС1 и ЭС2, роль которых выполняют синапсы. На положительный (возбуждающий) вход ЭС1 поступает исходный сигнал qBX, а на отрицательный (тормозящий) вход — задержанный сигнал qT. В тоже время на положительный вход ЭС2 поступает задержанный сигнал qT, а на отрицательный - исходный сигнал qBX. ЭС1 генерирует на своем выходе импульс в тот момент, когда исходный сигнал qBX становиться больше задержанного сигнала qT. В свою очередь ЭС2 генерирует на своем выходе импульс, если задержанный сигнал qT становиться больше qBX.
Получаемые таким образом последовательности импульсов поступают на нейрон, который выполняет роль сумматора. Он формирует на своем выходе импульс qBbIX в том случае если на хотя бы один из его входов поступает импульс с выхода ЭС1 или ЭС2. Получаемая в результате последовательность импульсов qBbIX представляет собой исходный сигнал, преобразованный с помощью метода динамического сдвига в последовательный код. С помощью системы визуализации параметров информационного сигнала можно определить: 1) интервал повторяемости сигнала 2) диапазоны частот сигнала (частоты, входящие в состав сигнала) 3) параметры изменения каждой полосы частот сигнала во времени.
Таким образом, анализируя однотипные сигналы различных источников можно определить их общие параметры, характерные для данного типа сигнала и позволяющие его идентифицировать, или их различия, позволяющие идентифицировать источник сигнала. То есть, сравнивая данные визуализации одних и тех же букв, произнесёнными различными людьми, можно определить параметры определённых букв или характеристики идентифицирующие людей.
Для этого необходимо определить насколько хорошо система визуализации позволяет различать частоты, входящие в состав сигнала и их амплитудную модуляцию.
Разрешающую способность системы определим при помощи модельных примеров. В качестве примера возьмём амплитудно модулированный сигнал следующего вида: (2.3. y{i) = (l + cos t)) - cos(coH ) Здесь y(t) — модельный сигнал; coA - частота амплитудной модуляции; ОУН - частота несущей; В этом случае должны фиксироваться не только несущая частота, но и боковые частоты равные сон -соА и й)н +а А рис. 3.16
Как видно из рисунка влияние амплитудной модуляции выражается не только в периодическом исчезновении частоты, но и в изменении диапазона частот сигнала.
Необходимо определить, будет ли фиксироваться системой визуализации изменение параметров амплитудной модуляции. Поэтому исследуем сигнал с той же частотой 600 Гц и с амплитудной модуляцией частотой 100 Гц (рис 3.19,3.20).
Как видно из рисунка боковые частоты исказили общую картину сигнала. Увеличился диапазон частот отображаемых системой. Периодичность сигнала позволяет определить частоту амплитудной модуляции.
Из данных модельных примеров можно сделать вывод, что полученные визуализации позволяют однозначно отличать сигналы с различной амплитудной модуляцией. Для иллюстрации данной способности визуализации показана её работа на примере сигнала частотой 500 Гц, промоделированного смесью частотам 100 Гц и 200 Гц (рис. 3.23, 3.24).
Полученная визуализация явно отличается от предыдущих визуализаций. Диапазон частот, периодичность и формы визуализации позволяют определить изменения амплитудно-частотных параметров анализируемого сигнала.
Синапс - нейронная ячейка распознавания
Для создания системы идентификации информационных сигналов была разработана обучаемая синапс-нейронная ячейка распознавания (рис. 4.17).
При прохождении сигнала через ячейку она идентифицирует сигнал только в том случае, если на положительные входы нейрона поступят сигналы, а на отрицательные - нет.
Обучение синапс-нейронной ячейки происходит следующим образом. При прохождении сигнала через синаптическую цепочку подаётся сигнал запоминания (q3an)» в результате этого синаптический переключатель(СП), на которые в данный момент поступал сигнала с синапса (С), переключаются на положительный вход нейрона (Н), а остальные СП останутся переключенными на отрицательные входы нейрона. Ячейка становится настроенной на данный сигнал. При прохождении через ячейку такого же сигнала она выдает сигнал идентификации, то есть распознаёт анализируемый сигнал.
Стирание настроек структуры осуществляется подачей сигнала стирания (Ястир), который переключает все СП на отрицательные входы нейрона.
Система состоит из следующих основных блоков: блока преобразования сигнала, блока обучения, блока распознавания и блока управления.
Блок преобразования сигнала осуществляет трансформацию сигнала в удобную для обучения и распознавания форму. Полученный таким образом сигнал в зависимости от режима работы схемы поступает на блоки обучения и/или распознавания.
Система может работать в следующих режимах, задаваемых блоком управления: обучение - процесс анализа исследуемого сигнала, создание новых и модификация имеющихся образов на основании данных анализа; распознавание - процесс непосредственной идентификации звукового сигнала. Система может работать в этих режимах, как по отдельности, так и в обоих одновременно.
Блок обучения состоит из блока анализа, блока создания образа и блока памяти, разделенного на ячейки. В режиме обучения блок анализа осуществляет определение характерных параметров исследуемого сигнала. Затем в блоке создания образа на основании информации, полученной из блока анализа и блока управления, а так же образа, хранящегося в соответствующей ячейке памяти, происходит создание нового образа, который помещается в ячейку памяти, замещая предыдущий.
В режиме распознавания сигнал поступает непосредственно на блок распознавания, состоящий из множества ячеек. Каждая ячейка настроена распознавание конкретного звукового сигнала с помощью соответствующего образа, хранящегося в ячейке памяти. При поступлении на вход ячейки сигнала, совпадающего с образом, она формирует на своем выходе сигнал соответствия. Результатом работы всей системы является идентификация информационного сигнала. Разработана методика регистрации динамики изменения частотных параметров информационных сигналов во времени. Разработана синапс-нейронная системы анализа и контроля параметров информационных сигналов. Разработана обучаемая синапс-нейронная ячейка распознавания, способная изменять свою структуру для идентификации различных сигналов. Разработана общая структура синапс-нейронной системы идентификации информационных сигналов.