Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Во Ван Кханг

Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом
<
Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Во Ван Кханг. Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом : диссертация ... кандидата технических наук : 05.13.06, 05.13.19.- Москва, 2001.- 182 с.: ил. РГБ ОД, 61 02-5/202-3

Содержание к диссертации

Введение

1. Современное состояние и тенденции развития автомати зированных интегрированных систем обеспечения безопасности информационных ресурсов и объектов 12

1.1 Особенности построения и функционирование современных автоматизированных интегральных систем обеспечения безопас ности 12

1.1.1. Структура автоматизированных интегральных систем обеспечения безопасности 12

1.1.2. Анализ работы автоматизированных систем управления доступом 17

1.1.3. Анализ работы современных систем идентификации 20

1.1.4. Биометрические системы идентификации, преимущества инедостатки 27

1.2. Исследование возможности использования голосовых признаков в речевых системах управления доступом 33

1.2.1. Преимущества речевых систем управления доступом с использованием голосовых признаков 33

1.2.2. Голосовые признаки на основе основного тона 36

1.2.3. Голосовые признаки на основе формантного анализа 38

1.2.4. Использование голосовых признаков на основе других характеристик речи. 42

1.2.5. Роль вокализма в исследовании речи 45

1.2.6. Особенности вьетнамского языка для голосовой идентификации и верификации 47

1.3. Постановка задачи исследования 50

1.4. Выводы з

2. Разработка и исследование методов выявления параметров речевых вокализмов для использования в системах управле ния доступом 56

2.1. Выбор и исследование математической модели речевого сигнала для поиска индивидуальных характеристик на участках речевых вокализмов 56

2.1.1. Анализ математических моделей речевого сигнала 56

2.1.2. Исследование методов получения первичных параметрических описаний речевого сигнала на вокализованных участках 67

2.1.3. Представление речевого сигнала в виде суммы узкополосных сигналов 71

2.2. Разработка и исследование методов анализа и выявления

комплекса признаков индивидуальной информативности речевого сигнала на участках речевого вокализма 75

2.2.1. Нормализация и выделение вокализованных участков речевого сигнала

2.2.2. Определение частоты основного тона 85

2.2.3. Определение фазовых параметров речевого сигнала, представляемого в виде суммы узкополосных сигналов 89

2.2.4. Определение дополнительных индивидуальных признаков речевого сигнала ЮО

2.3. Выводы 102

3. Особенности технической реализации методов выявления индивидуальных голосовых признаков в компьютерных системах 103

3.1. Анализ погрешности дискретизации речевого сигнала и ошибок, возникающих в процессе цифровой обработки сигналов

3.2. Разработка методов высокоскоростного динамического спектрального анализа и получение описаний речевого сигнала на стандартных компьютерных системах 108

3.3. Методы выделения вокализованных участков на сонограммах 114

3.4. Выбор оптимального алгоритма вычисления информативных индивидуальных речевых признаков 117

3.5. Математическое моделирование правил принятия решений для использования в речевых системах управления доступом 126

3.6. Разработка обобщенного алгоритма использования новых фазовых признаков речевого сигнала в системах управления доступом 131

3.7. Выводы 134

4. Экспериментальная оценка разработанных методов выявления индивидуальных признаков голоса на участках речевого вокализма 137

4.1. Разработка требований к экспериментальной системе 137

4.2. Оценка работоспособности предложенных методов при их реализации в стандартных компьютерных системах в реальном времени 141

4.3. Анализ полученных результатов 145

4.4. Разработка рекомендаций по практическому использованию предложенных методов 153

4.5. Выводы 157

Заключение 160

Список использованной литературы 162

Анализ работы современных систем идентификации

Известно, что любой важный объект независимо от форм собственности должен защищаться так, чтобы его ценность и назначение не терялись и не нарушились /1,55/.

Вследствие того, что с развитием науки и техники открываются новые возможности для различного рода нарушений и несанкционированного доступа к конфиденциальной информации требуемой защите следует быть адекватной к этому, поэтому современным системами безопасности сегодня предъявляются все более жесткие требования. Среди наиболее значимых следует отметить следующие: - адекватность потенциальным угрозам: противодействие системы обеспечения безопасности (СОБ) должно быть эффективнее возможных несанкционированных вторжений и нарушений; - системность: работа системы обеспечения безопасности должна быть непрерывной во времени, устойчивой и согласованной с другими системами; - полнота контроля: включает в себя фиксирование всех событиях в системе, оповещение о нестандартных ситуациях, обеспечение их анализа, а также устранение последствий неполадок, несанкционированного вторжения; - минимизация человеческого фактора; - адаптируемость и развиваемость - система должна обладать возможностью настраиваться под конкретные объекты и организации. Система, удовлетворяющая приведенным требованиям, называется автоматизированной интегральной системой обеспечения безопасности (АИСОБ). В состав современной интегральной системы безопасности обычно входят такие подсистемы:

К этому комплексу в ряде случаев могут быть еще добавлены: подсистема структурированной кабельной сети, подсистема связи, тревожного оповещения, аварийного освещения (СОП) и др. В настоящее время в АИСОБ наиболее важным компонентом является подсистема управления доступом к объекту и информационным ресурсам. Именно вокруг СУД сегодня строится вся интегральная система обеспечения безопасности /2,25/. Как отмечалось в 121 подсистема управления доступом - это самая современная ветвь развития АИСОБ, именно она наиболее тесно переплелась с компьютерными технологиями. Контролеры СУД имеют встроенные микропроцессоры, и, по сути, являются гибкими специализированными высоконадежными компьютерами, которые обмениваются информацией с периферийными устройствами по различного рода протоколам. Именно поэтому, подсистемы управления доступом к объекту и информационным ресурсам служат основой для дальнейшей интеграции с другими подсистемами обеспечения безопасности объекта.

По сравнению с обычной системой безопасности АИСОБ более универсальна и способна бороться не только с внешними, но и с внутренними угрозами. Согласно /3,25/ сегодня на практике существуют два вида интеграции.

Первый вид - это объединение конечных устройств теленаблюдения, пожарной, охранной сигнализации и СУД на низком физическом уровне (рис. 1.1). Подобная интеграция применяется в основном на малых объектах, где количество взаимодействий между подсистемами невелико. Такой уровень интеграции является самым простым и универсальным, и, соответственно, наиболее употребляемым.

Второй наиболее эффективный вид интеграции - это объединение различных подсистем на основе единой программно-аппаратной платформы, с единым коммуникационным протоколом и общей базой данных, пример такой системы представлен на рис. 1.2. Этот вид интеграции обладает более гибкими и взаимосвязанными свойствами, но и у этой системы существует немало уязвимых мест. Одно из них, невысокая степень живучести, так как работа системы требует синхронности и зависимости между подсистемами.

Охранные сигнализации бывают самыми разнообразными, но чаще всего используют следующие /17,55/: При подборе состава подсистемы охранной сигнализации требуется тщательное изучение защищаемого объекта, так как применение любой из перечисленных выше систем будет наиболее эффективно только при определенных условиях. На важных объектах обычно применяются одновременно несколько различных систем сигнализации. В современных АИСОБ, построенных по первому принципу интегрирования, необходимо учитывать фактор технической (аппаратной) совместимости с другими подсистемами. Это является основным сдерживающим фактором для их скорейшего распространения. Говоря о системах АИСОБ высокого уровня интеграции, следует отметить, что ядром управления такого рода программно-аппаратных комплексов часто выбирается одна из главных подсистем ТН или СУД.

Анализ математических моделей речевого сигнала

В основе работы СУД заложен принцип сравнения тех или иных идентификационных признаков, поэтому надежность систем управления доступом зависит от точности и устойчивости идентификации. На практике используются разные способы идентификации, каждый из которых имеет свои достоинства и недостатки. При выборе способа идентификации или их сочетания исходят из особенностей и специфики объекта защиты.

Самый традиционный - это пропуск с фотографией. Сейчас он используется в сочетании с более современными методами (например, метод магнитных карточек). По-прежнему имеют широкое применение различные кодонаборные устройства, которые часто дополняют считыватели для других идентификаторов или дверных замков. При работе с такими устройствами надо учитывать, что наиболее употребляемые клавиши в ульт 21 рафиолетовой подсветке дают характерное свечение и считается, что набираемую на клавиатуре комбинацию можно определить визуально.

Наиболее распространенные способы идентификации на обычных объектах основываются на применении магнитных карточек (пример такого способа - карточка в метро). Она представляет собой пластиковую карточку, на одной стороне которой нанесен специальный магнитный слой, состоящий из намагниченных участков различной полярности, которые в совокупности определяют кодовую информацию о правах владельца. Применение магнитных карточек часто встречаются в системах, где по условиям эксплуатации происходит частая замена карточек. Срок их службы обычно не превышает 1-2 лет. Среди существенных недостатков магнитных карточек можно выделить /1,2,25,67/: - легко подделываются; - незащищенность от электромагнитных воздействий - информация повреждается или стирается простейшими бытовыми источниками электромагнитных излучений; - незащищенность от механических воздействий - карточки легко повреждаются, происходит быстрый износ от частых контактов со считывающей головкой.

Карточки с памятью или так называемые "Touch Memory" представляют собой микросхему в герметичной упаковке, в ПЗУ которой записывается уникальная кодовая комбинация длиной 64 бит, заносимая производителем методом лазерной записи на кремниевом кристалле. Бывают модели, в которых, кроме ПЗУ, имеется еще ОЗУ с многократным перепрограммированием, куда может заноситься, например, информация о пользователе (Ф.И.О, должность, подразделение). Для идентификации необходимо непосредственное соприкосновение карточки со считывающим устройством, которое имеет два контакта. Один используется для передачи данных, дру 22 гой - заземление. Скорость считывания информации достаточно велика около 0,1 с.

"Touch Memory" были созданы впервые американской компанией "Dallas Semiconductor". Первоначально они задумывались как электронные ключи для ограничения доступа к компьютеру, а также для автономных однодверных замков. Поэтому в системах с повышенными требованиями к безопасности "Touch Memory" либо не принимаются вовсе, либо используются в сочетании с другими способами идентификации. В настоящее время появилась новая модель DS1954 со встроенным криптографическим ключом длиной 1054 бит, что достаточно для того, чтобы повысить защищенность системы. "Touch Memory" - компактны, имеют высокую стойкость к механическим повреждениям, коррозии и перепадам температуры, но в то же время имеют такие недостатки, как: наличие контакта с гальванической связью, с микроконтроллером, а отсюда низкая стойкость к вандализму.

На сегодняшний момент существуют такие системы идентификации, как штриховой и оптический коды, виганд-карты. Но все они из-за ряда существенных недостатков не нашли распространения в серьезных СУД.

Бесконтактные идентификаторы "Proximity" предназначены для дистанционного считывания кодовой информации. Они обеспечивают возможность информационного обмена со считывателем на расстоянии от нескольких сантиметров до десятка метров. Proxirnity-считыватель постоянно посылает радиосигнал. При попадании в зону действия считывателя карточка принимает запрос, а в ответ посылает записанный на карточке код зашифрованном виде. Все Proximity-карточки делятся на активные и пассивные. Питание в активных карточках осуществляется за счет встроенной батарейки. Пассивные же накапливают энергию электромагнитного поля считывателя, а затем посылают ответ на запрос. Пассивные Proximity-карточки обычно используются как временные пропуска в связи с тем, что расстояние приема у них меньше, и в отличие от активных они не поддаются перепрограммированию.

Кроме этого все Proximity-карточка можно разделить на: низкочастотные, работающие в диапазоне от ЗЗкГц до 500кГц, и высокочастотные - от 2,5 МГц до ЮгГц.

В качестве примера системы Proximity-идентификации можно привести систему TIRIS (Texas Instruments Registration and Identification system). TIRIS является радиочастотной системой идентификации, основывающейся на передаче частотно-модулированного сигнала низкой частоты 123,2кГц-134,2кГц, повышающей помехозащищенность передаваемого радиосигнала. Система состоит из трех частей: транспондер, антенна и считыватель. Транспондеры изготавливаются двух видов: Основными производителями систем Proximity-идентификации являются американские фирмы НШ Corporation и Indaba Corporation.

В отличие от магнитных карточек и карточек с памятью, Смарт-карта представляет собой пластиковую карточку со встроенной микросхемой, в которой расположено не только запоминающее устройство, но и микропроцессор с собственной операционной системой и устройством ввода/вывода. Карта может не только хранить данные, но и манипулировать ими согласно заложенным алгоритмам.

Микропроцессор (CPU) с операционной системой используется для обработки данных, кроме этого, он позволяет различными способами шифровать информацию. Оперативная память (RAM) необходима для временного хранения данных, например, для хранения результатов вычислений, произведенных CPU. Постоянная память (ROM), предназначена для хранения неизменяемой информации, такой как инструкций карты, а также другие данные. Информация на карту в данном случае заносится в процессе производства и больше не меняется.

Разработка методов высокоскоростного динамического спектрального анализа и получение описаний речевого сигнала на стандартных компьютерных системах

Для измерения этих показателей пользователь должен поместить руку на специальную панель так, чтобы рука занимала правильное положение. Операция снятия, кодирования информации, а также сверки с банком данных в среднем занимает 1-2 секунды. Снятие изображения руки осуществляется с помощью ПЗС-камеры и двух боковых зеркал. Полученное таким образом отображение оцифровывается по специальному алгоритму, а затем реализуется процедура сравнения с данными, хранящимися в банке данных.

Так в банке данных можно хранить информацию примерно о 10000 пользователях. Занесение информации о пользователе начинается с трехразового сканирования и усреднения полученных параметров.

По результатам испытаний подобного устройства, проведенных Американской лабораторией Scandia National Laboratories, частоту ошибки первого рода (ложный отказ) можно снизить до 0,03%, а ошибки второго рода (ложный допуск) до 0,1%. В России устройства идентификации по параметрам речи стоят в среднем около 3000$.

В криминалистике давно используются отпечатки пальцев для установления личности. Данный метод называется дактилоскопией. До сих пор она считается одним их наиболее надежных способов распознавания индивидуальных характеристик человека.

Капиллярные узоры пальцев формируются в утробе матери и остаются неизменными на протяжении всей жизни. Одну из самых надежных дактилоскопических идентификационных систем создала американская компания IdentixouchLock /2,30/. При работе с системой необходимо набрать свой код на клавиатуре и приложить палец к сканеру. Процесс считывания и проверки занимает около 7с. Вероятность ошибки первого рода составляет примерно 2% а второго рода 0,0001%. Терминал TouchLock может об 31 служивать в сети до 32 считывателей. Недостатком системы опять же является стоимость - ориентировочно 5800$.

В последнее время дактилоскопию начали применять для контроля доступа к информационным ресурсам. Среди мини-считывателей существуют и не очень дорогие, подсоединяющиеся к компьютеру. Среди них: BioMouse (American Biometric), SecureTouch (Biometric Access), Secure KeyBoard Scanner (National Registry), Fingersprint Identification Unit (Sony).

Использование почерка в качестве идентификационной характеристики существует уже десятки лет. На первый взгляд, казалось бы, почерк можно легко подделать, но в настоящее время появились все более совершенные алгоритмы определения и сравнения человеческих почерков. Практика показала, что для каждого человека почерк и процесс подписания обладают уникальными и повторяющимися характеристиками, которые могут использоваться для идентификации. Такие характеристики можно измерить. Сравнение происходит не только по изображению почерка, но и по динамическим характеристикам самого процесса подписания. Среди разработанных алгоритмов подтверждения почерка существуют измеряющие характеристики движения руки при подписании (скорость, ускорение, и усилие нажатия на перо) /38/.

Одной из последних моделей приборов, использующих для идентификации почерк человека, является "умная" ручка SmartPen. Она может снимать трехмерные динамические параметры подписывающего с помощью встроенных микродатчиков, обрабатывать полученную информацию и передать ее в защищенном криптографическом виде в банк данных для хранения или сравнения. Стоимость таких "умных" ручек составляет в зависимости от конфигурации примерно 50$-250$ 121.

Инфракрасная карта лица тоже может использовать для формирования идентификационных признаков. В этом случае лицо каждого человека представляется в виде индивидуальной тепловой карты, которая зависит от сосудистой системы человека и ряда других физиологических факторов, а также, что самое главное, не меняется с возрастом и не зависит от состояния здоровья. Тепловые карты лица отличаются даже у близнецов. Более того, доказано, что тепловая карта остается неизменной и после пластической операции. В настоящее время существует возможность производить пассивное, не зависящее от освещенности и небольших вариаций температуры окружающей среды, распознавание пользователей системы на основе инфракрасных характеристик их лиц. Эта возможность успешно реализована американской компанией Technology Recognition Systems. В основе разработанной системы лежат ИК-камеры, которые снимают тепловую карту лица.

Ученые доказали, что глаза человека уникальны и могут использоваться при идентификации. Рисунок сетчатки сканируется неполяризо-ванным светом, испускаемым инфракрасным светодиодом. Полученное от сканирования изображение отражает индивидуальное расположение кровеносных сосудов сетчатки глаза. Устройство идентификации по рисунку сетчатки глаза создано компанией Eyeidentify Inc. Процесс сканирования и проверки занимает около 7с, а скорость сличения -100 эталонов в секунду. Вероятность ошибки первого рода составляет 0,4%, ошибок второго рода очень мало. Стоимость таких устройств достаточно высока около 4000$.

Компания rriscan Inc. разработала устройство идентификации, основанное на анализе радужной оболочки глаза. Радужная оболочка глаза состоит из трабекулярной сетки, состоящей из различных бороздок, колец, ореола, маленьких точек и т.д. Вероятность ошибки в таких устройствах мала, около 0,001%. Сейчас стоимость таких устройств на рынке свыше 4000$.

Оценка работоспособности предложенных методов при их реализации в стандартных компьютерных системах в реальном времени

Заметим, что L(co) представляет собой сумму L сжатых по частоте логарифмов спектра log\S(a )\. Введение Р(со) и Цсо) мотивируется тем, что в вокализованной речи сжатие частотной шкалы в целый ряд должно привести к совпадению гармоник основной частоты с ней самой. В складывании этих сжатий усиление всегда происходит на частоте, кратной частоте основной гармоники (см. рис 2.4). Достоинство этого метода состоит в том, что некоторые пики (локальные максимумы) спектра могут отсутствовать, а при оценке частоты основного тона по пикам логарифма спектра g\S(o))\ они проявляются на графике функции Цсо). Отметим, что этот метод обладает устойчивостью к шумам.

Говоря о методах определения ЧОТ или ПОТ во временной области, отметим, что суть автокорреляционных методов заключается в том, что если s(t) периодическая функция с периодом Т0 тогда ее автокорреляционная функция (см. 2.15) имеет максимумы на местах кратных периодам Т0. А s(t) и S(1±KT0) будут полностью совпадать по фазе.

Пример использования метода для показан на рис 2.5. Применение методов этого класса позволяет сократить время решения задачи определения ЧОТ и с приемлемой точностью получить оценки основного тона. LogS(co)i І

Произведение гармоник спектра Поэтому автокорреляционные методы обычно используются на начальном этапе определения оценки периода основного тона. Для уменьшения ошибки корреляционный анализ проводится после выравнивания (нормализации) исходного PC /41/.

В период развития аналоговых методов обработки сигналов были разработаны различные схемы определения основного тона, которые базировались на использовании гребенок фильтров. Принципы работы большинства из них сейчас уже реализованы в цифровых фильтрах и обычно переходят в спектральные методы.

В настоящее время существуют и другие методы определения частоты основного тона, но те или иные недостатки препятствуют их широкому использованию, особенно в составе речевых СУД.

Определение фазовых параметров речевого сигнала представляемого в виде суммы узкополосных сигналов

Как уже отмечалось в 2.1.3, для оценки фазовых параметров речевого сигнала мы будем представлять речевой сигнал в виде суперпозиции акустических узкополосных сигналов по Гильберту /24,27,29/ (см. 2.42). В результате такого представления получаем формулу описания полной фазы (2.46), которая имеет вид:

Автокорреляционное вычисление периода ОТ вьетнамского слова "hai" (два) Приступим к рассмотрению отдельного обертона в (2.60), который мы можем получить с помощью фильтрации. Для упрощения опустим индекс и будем считать, что мы решаем задачу с одной модой речевого сигнала на его вокализованном участке:

Представление фазовых параметров во временной области приведено в (2.43) и (2.44) в 2.1.3. Остановимся на вычислении фазовых параметров в частотной области. Проведем преобразование Фурье функции s(t) после умножения ее на окно Гаусса. Причем окно Гаусса будем выбирать не произвольным, а удовлетворяющим некоторым условиям. Во-первых, в случае параболического вида моделирования нелинейной фазы типа (2.62), окно Гаусса с аналогичным видом ведет к усилению нелинейного параметра 8. Во-вторых, оно удовлетворяет условию минимизации боковых лепестков, так как в Фурье-образе окна Гаусса есть только один максимум на нулевой частоте.

Наконец, данное окно дает большую возможность вычисления неопределенного интеграла, что очень удобно при теоретической математической обработке /34,33/. Для спектра PC взвешенного окна Гаусса получим: Сравнивая эти две компоненты, мы видим, что для реальной вокализованной речи, где соо 2ти[отіп 2хЗ, 14x80=502, и 8«1 1ЪА,А\1 при правильном выборе физической ширины окна Гаусса отрицательной компонентой можно пренебречь, так как она незначительна сама по себе и тем более по сравнению с положительной компонентой.

Если co 6,28 (эквивалентно частоте / 1гц), то результаты вычислений получаются с погрешностью 0,1x10"500 (очень мала). Очевидно, что все сделанные нами выводы для абсолютной погрешности также справедливы и для относительной погрешности.

Результаты вычислений не достигают требуемой точности только в том случае, когда со«1 (вычисление происходят в окрестностях нулевой точки). В этом случае из (2.73) видно, что относительная погрешность стремится к бесконечности. Однако на практике можно избежать этого, отфильтровав PC в области низких частот ( 50 Гц).

При отсутствии отрицательной компоненты S(co,a) мы можем исследовать амплитудные и фазовые спектры, используя (2.66) и (2.67). Вычисляя логарифм от (2.65), мы получим комплексные спектры, в которых действительная часть - это амплитудные спектры в логарифмическом виде, а мнимая часть - фазовые спектры:

Похожие диссертации на Выявление голосовых признаков индивидуальной информативности для использования в речевых системах управления доступом