Содержание к диссертации
Введение
1. Идентификация пользователей ЭВМ: состояние вопроса, задачи исследований 13
1.1. Методы автоматической идентификации личности: выбор признаков 15
1.2. Признаки динамики двигательных навыков человека 19
1.3. Алгоритмы принятия решений 27
1.4. Задачи исследований 34
2. Формирование пространства признаков при идентификации личности по динамике написания слов 35
2.1. Постановка задачи исследований 35
2.2. Информативность функции колебаний пера в плоскости графического планшета 39
2.3. Метод масштабирования функций 42
2.4. Эффективность применения алгоритма масштабирования функций 47
2.5. Другие признаки подписи 52
Выводы 55
3. Метод идентификации личности по динамике написания слов 56
3.1. Постановка задачи 56
3.2. Алгоритм формирования эталона рукописного слова 56
3.3. Алгоритм идентификации пользователя 59
3.4. Обнаружение «чужого» 63
3.5. Увеличение количества «своих» пользователей 67
3.6. Рекомендации пользователям 68
Выводы 69
4. Программно-аналитический комплекс для скрытой идентификации (пакси) пользователей информа ционной сети 71
4.1. Структурная схема ПАКСИ 71
4.2. Организация интерфейса ПАКСИ 76
4.3. Структура базы данных 80
4.4. Функции модуля анализа биометрических данных 84
4.5. Структура модуля обмена данными (МОД) при работе в компьютерной сети 85
4.6. Организация безопасной передачи данных в открытом канале связи 88
Выводы 89
Заключение 90
Список литературы 91
- Методы автоматической идентификации личности: выбор признаков
- Информативность функции колебаний пера в плоскости графического планшета
- Алгоритм формирования эталона рукописного слова
- Организация интерфейса ПАКСИ
Введение к работе
В начале XXI века в сфере информационно-коммуникационных технологий обозначились новые проблемы.
Темп внедрения компьютерных технологий в экономику достиг рекордных размеров более 100% в год. Создается все больше интернет-магазинов, «виртуальных» филиалов банков, электронных фондовых и валютных бирж. Электронный бизнес перемещается в глобальную сеть Internet. Обмен информацией в Internet свободен и неконтролируем. Сохранить конфиденциальность транзакций и целостность данных становится проблемой. Эта проблема из чисто технической перешла в категорию ключевых проблем бизнеса и по важности сравнялась с разработкой стратегии бизнеса в Internet. И дело здесь вот в чем.
Тенденция расширения операций купли-продажи в распределенных сетях проявляется достаточно отчетливо и нет предпосылок к смене её характера в будущем. Специальная литература наполнена прогнозами о сроках, когда все дееспособные члены общества столкнутся с необходимостью применения технологий криптографической защиты информации, безопасностью хранения и уничтожения криптографических ключей. Оппоненты такого направления развития тотальной информатизации общества доказывают отсутствие надежд на переход общества в состояние, когда каждый его член будет корректно выполнять все усложняющееся операции по защите информации в процессе обеспечения своей жизнедеятельности. Последняя точка зрения послужила катализатором развития технологий по автоматическому распознаванию (идентификации) дееспособных субъектов на основе анализа их биометрических признаков (отпечатков пальцев, структуры ладони и т.д.).
Другая проблема: со временем все чаще приходится иметь дело с виртуальным образом человека, с которым не было встреч в реальном пространстве. В традиционном магазине покупатели отличаются по своему внешнему виду, в сети Internet все выглядят одинаково. В реальной жизни можно выдать себя за другого, в сети Internet это делается намного проще и без дополнительной проверки нельзя идентифицировать виртуального партнера. Однако если идентификация оказалась успешной, часто этого недостаточно. Для заключения сделки требуются подпись и гарантии её достоверности.
Перечень проблем, решение которых сводится к созданию систем автоматической идентификации личности по ее биометрическим признакам, можно продолжать достаточно долго. Однако пути их решения должны выбираться с учетом состояния российской экономики в ближайшей перспективе.
Ориентация на массовое применение систем автоматической идентификации личности (человека) приводит к необходимости решать задачу по минимизации их стоимости. В силу текущего экономического состояния России все исследования, проводимые в стране по обсуждаемому вопросу, исключают применение специализированных дорогостоящих устройств. В обобщающих публикациях российских ученых по «биометрической идентификации» предлагается вообще отказаться от специализированной аппаратной поддержки и ориентироваться на стандартные устройства ввода информации, придаваемые к ПЭВМ: клавиатуру, звуковую карту, сканер, графический планшет, мышь [27]. В России накоплен опыт по созданию технологий автоматической идентификации пользователей, работающих в распределенных сетях, терминалы которых оснащены перечисленными устройствами.
Применяемые на сегодняшний день способы распознавания пользователей ПЭВМ основаны на использовании паролей и (или) специализированных устройств (смарт-карт, «электронных ключей»). Эксплуатация таких систем безопасности выявила их недостатки. Зачастую пароли перехватываются, специализированные устройства похищаются или подделываются. Наблюдаются ситуации, когда один из пользователей сознательно передает свой пароль постороннему лицу. Например, в дистанционном образовании при тестировании студенты готовы заменить себя более осведомленным в изучаемом предмете лицом. Аналогичных примеров из других областей можно привести множество.
Таким образом, существуют актуальные задачи как повышения надежности автоматической идентификации зарегистрированных пользователей, так и обнаружения незарегистрированных лиц, которым представилась возможность взаимодействовать с мобильными терминалами распределенных сетей. Требование «Обнаружение чужого» вносит ограничения в выбор подходов для решения этой задачи. В рамках новых технологий идентификации лиц по отпечаткам пальцев, изображению сетчатки глаза и др. не решается проблема скрытности процесса идентификации. Процедуры съема информации настораживают (отпугивают) «чужого» и вызывают неоднозначное отношение у «своих». Выход из подобной ситуации просматривается в использовании для идентификации динамических характеристик человека, к которым относят особенности произношения и написания паролей, ввод их с клавиатуры и др. Во всяком случае этот путь позволяет реализовать отмеченную выше необходимость избежать применения дорогостоящих (и «настораживающих» идентифицируемого) устройств. Вопрос в другом: достаточную ли информацию дают динамические характеристики, чтобы выйти на приемлемые уровни надежности идентификации лиц.
Существующие сегодня системы идентификации личности, основанные на анализе динамики воспроизведения подписи, характеризуются следующими (приводимыми в рекламных материалах) показателями. Однокоординатные, использующие изменение координаты x(t) при написании пароля, позволяют обеспечить вероятности ошибок первого и второго рода на уровне 10%. В двухкоординатных [решение принимается на основе анализа двух кривых x(t) и y(t)\ вероятность ошибок снижена до 1 %. Принципиально это возможно, если кривые x(t) и y(t) слабокоррелированны. Поиск информации на заданную тему не дал ответа на поставленный вопрос. Но вопрос есть. Опыт показывает, что в системах данного класса приходится использовать множество «плохих» и очень «плохих» параметров, заменяя качество данных их количеством. Если часть данных высококоррелированна, надежда на улучшение показателей идентификации отсутствует, а усложнение алгоритма становится бессмысленным. Интерес к затронутому вопросу обусловлен следующим обстоятельством.
В обстоятельном обзоре систем биометрической идентификации А.И. Иванова [27] утверждается, что «... нет соответствующих стандартов и общепринятых методик измерений, существуют значительные возможности по искажению реальной статистики и использованию искаженных данных в недобросовестной рекламе... То, что сегодня производители биометрических систем могут указать и указывают параметры системы только для некоторого абстрактного пользователя, является элементом их произвола и диктата». Отсюда следует вывод, что приводимые цифры по вероятностям ошибок первого и второго рода нельзя считать достоверными.
Наши попытки прояснить ситуацию с «достоверностью цифр» через изучение алгоритмов идентификации не привели к конкретному результату. Алгоритмы не описываются и относятся к категории конфиденциальной информации. Показателен в связи с этим следующий пример.
В 1962 г. была опубликована книга проф. М. Сапожкова «Речевой сигнал в кибернетике и связи». В ней был дан детальный анализ использования огибающей спектральной плотности нестационарного речевого сигнала для целей автоматического распознавания говорящего. Приводимые в книге результаты не впечатляют, интегрирование спектра на участках более 200 Гц не дает шансов построения автоматов с удовлетворительными характеристиками.
В опубликованной в 2000 г. монографии А.И. Иванова для систем аналогичной структуры приводятся цифры ошибок первого и второго рода оті до 2%.
В фундаментальном труде 2000 г. издания «Специальная техника и информационная безопасность» [51] утверждается: «Задача диагностики личности по речи в настоящее время корректно существует только в постановочной части... На настоящем этапе развития криминалистической фоноскопии надежды на эффективное решение диагностических задач почти призрачны».
Налицо следующая ситуация. Есть потребность в системах идентификации личности по динамике формирования подсознательных движений (клавиатурному почерку, особенностям произношения речевых сигналов, динамике написания паролей, тремору двигательных органов). Предлагаемые Западом программные продукты дороги, методика оценки их параметров неизвестна и не оговаривается международными стандартами, алгоритмы функционирования известны узкому кругу производителей систем. В этих условиях формируется и находит поддержку следующая точка зрения: «Если необходимо решение актуальной задачи с достоверно установленными параметрами, привлекай российских исследователей — затраты будут меньше, а риск неэффективного вложения средств, минимальным». В рамках этой идеологии в настоящей работе сформулирована и решена следующая задача — создан метод идентификации пользователей ПЭВМ по динамике написания слов с приемлемыми для потребителей вероятностями ошибок первого и второго рода (2 %; 1 %), не требующий применения дорогостоящих специализированных устройств ввода информации в ПЭВМ.
Для решения задачи потребовалось:
- провести детальный анализ идей и полученных результатов в области идентификации пользователей по динамике написания слов;
- разработать метод формирования пространства признаков, инвариантных к изменениям амплитуды и длительности сигналов, формируемых подписантами;
- создать технологию принятия решения в условиях изменения количества признаков как при транслировании одним подписантом своей подписи, так и случайном колебании размерности пространства признаков любого подписанта;
- разработать программно-аналитический комплекс для скрытой идентификации удаленных пользователей, в основу которого положены полученные результаты исследований.
Основные положения и результаты работы докладывались на Научно-методической конференции «Совершенствование форм и методов управления качеством учебного процесса» (Омск, 2001); IV Международной конференции «Цифровая обработка сигналов и её применение» (Москва, 2002); Межрегиональной научно-технической конференции «БРОНЯ-2002» (Омск, 2002); Международном форуме по проблемам науки, техники и образования (Москва, 2002); II Международной биометрической конференции разработчиков «BIOMETRICS 2003 RUII AIA» (Москва, 2003); V Международной конференции «Цифровая обработка сигналов и её применение» (Москва, 2003); Международной научно-практической конференции «Дорожно-транспортный комплекс; экономика; экология, строительство и архитектура» (Омск, 2003); Научно-технической конференции «Развитие оборонно-промышленного комплекса на современном этапе» (Омск, 2003); V Всероссийской научно-практической конференции «Проблемы информационной безопасности государства, общества и личности» (Томск, 2003); Международной научной конференции «Современные проблемы информатизации в непромышленной сфере и экономике» (Воронеж, 2004); X юбилейной Международной научно-практической конференции «Современные техника и технологии» (Томск, 2004); III Всероссийской научно-практической конференции-выставке «Единая образовательная информационная среда: проблемы и пути развития» (Омск, 2004).
По теме диссертации опубликовано 16 печатных работ.
Диссертация состоит из введения, четырех глав, заключения, изложенных на 97 страницах машинописного текста, содержащих 27 рисунков, 10 таблиц, список литературы из 70 наименований и приложений на двух страницах.
В первой главе представлены аналитический обзор и анализ существующих биометрических технологий идентификации личности, приведены показатели надежности различных биометрических методов, а также постановка задачи исследований. Показана целесообразность и необходимость разработки метода идентификации личности по динамике написания слов (паролей).
Вторая глава содержит анализ пространства признаков, используемого для идентификации личности по динамике написания слова. Приводятся результаты эксперимента по стабильности написания слов. Также представлен разработанный автором алгоритм амплитудно временного масштабирования поступающих для идентификации сигналов.
В третьей главе описан разработанный метод идентификации личности по динамике написания слов (паролей). Приведены результаты распознавания пользователей с помощью данного метода. Также сформулирована и обоснована модель нарушителя, пытающегося подделывать рукописное слово. Описывается методика, предложенная автором для обнаружения злоумышленников. Представлены результаты распознавания «чужого» при различных стратегиях подделки рукописных слов.
В четвертой главе предложена структура программно-аналитического комплекса для скрытой идентификации удаленных пользователей по динамике написания рукописных слов. Также описаны функции и назначения основных элементов структурной схемы,
В приложениях приведены акт о внедрении результатов диссертации в учебный процесс и акт использования результатов работы в ООО «Гранд-спорт».
Основные результаты работы, выносимые на защиту:
1. Способ формирования пространства признаков в задачах автоматической идентификации подписантов, основанный на учете их особенностей при формировании эталонов рукописных паролей и использовании прямого и обратного преобразований Фурье поступающих для идентификации сигналов с нахождением корректирующего коэффициента нормирования параметров сигналов, позволяющий сжать собственные области классов в среднем на 60 %.
2. Способ формирования эталонов подписи идентифицируемых лиц, заключающийся в построении плотностей распределения вероятностей амплитуд сигнала для последовательных фрагментов подписи парольного нормированного слова, ранжировании их по риску принятия решений и выборе описаний тех фрагментов в качестве эталонных, которые обеспечивают принятие правильных решений на установленном уровне для заданного числа распознаваемых классов.
3. Метод идентификации пользователей по динамике написания слов, основанный на последовательном применении стратегии выбора гипотез Байеса при сопоставлении выделенных фрагментов поступающих сигналов с эталонами с использованием в качестве априорных вероятностей вычисленных на предыдущем шаге апостериорных вероятностей и обеспечивающий уровень ошибок первого и второго рода 2% при идентификации 200 пользователей.
4. Программно-аналитический комплекс для идентификации пользователей ПЭВМ по динамике написания слов, позволяющий обеспечить «скрытость» процесса автоматической идентификации.
Методы автоматической идентификации личности: выбор признаков
Известные на сегодняшний день биометрические технологии описания личности базируются в основном на анализе изображения лица, ладони, сетчатки и радужной оболочки глаза, отпечатков пальцев. Изображения указанных органов человека могут быть получены в разных диапазонах электромагнитного спектра: видимом, ближнем инфракрасном, в диапазоне 8-14 мкм (тепловом) и т.д. Выбор системы признаков в значительной мере определяет надежность идентификации, сложность дополнительного оборудования и программного обеспечения, скрытость от окружающих и идентифицируемого проведения самой процедуры распознавания.
Биометрические системы идентификации личностей по изображениям отпечатков пальцев характеризуются наиболее низкими ошибками первого и второго рода [16, 28, 29, 35, 40, 49, 59]. По результатам независимого тестирования ошибки первого рода для систем этого класса составили от 10 до 20% [55]. Производители же систем в рекламе своей продукции приводят оценки ошибок первого рода на уровне 2%, а второго рода - на уровне 0,0001 %. Последняя цифра вызывает сомнение. Даже примитивные технологии изготовления муляжей позволили «взломать» две системы из шести тестируемых [55]. Тем не менее опознание личности по отпечаткам пальцев занимает первое место по распространенности среди биометрических технологий идентификации личности. Примером может служить база данных отпечатков пальцев граждан мира, созданная Федеральным бюро расследования США (содержит более 40 млн зарегистрированных эталонов). В настоящее время около двухсот фирм во всем мире предлагают свои дактилоскопические системы в коммерческих вариантах исполнения. Их стоимость колеблется то 150 до 600 долл., и для ряда приложений подобная цена приемлема. Вопрос в другом. Каким образом использовать подобные системы, чтобы не отпугнуть злоумышленника от прохождения стандартной процедуры идентификации и не направить его на путь использования поддельных отпечатков? Существующие технологии подделки «пальцев» из желатина и пластика позволяют без особых усилий создать «образцы-пароли», успешно проходящие через известные системы в 80% случаев [20]. На сегодняшний день отсутствуют продуктивные идеи, позволяющие решать проблему скрытой идентификации лиц с помощью описанной технологии и с должными параметрами в части «пропуска ложной цели».
Аналогичные ограничения существуют при использовании других технологий, основанных на анализе геометрических параметров различных органов человека. Публикуется много предложений применить для решения задачи идентификации личности устройство измерения параметров кисти руки: ширины ладони, длины и толщины пальцев и т.д. [40]. По данным американской лаборатории Sandia National Laboratories, использование этих устройств в специально поставленных экспериментах позволило достичь уровня частоты ошибки первого рода 0,03 %, а частоты ошибки второго рода - 0,1% [49]. При сравнительно высокой стоимости сенсорной части таких систем (600-3000 долл. [27]) масштаб их применения достаточно большой. В США устройства для измерения параметров ладоней установлены более чем на 8 тыс. объектах [62]. Что касается вопроса по обеспечению скрытости проведения идентификации пользователей по данной технологии, на сегодняшний день нет понятных предложений по его решению. После 11 сентября 2001 г. резко возрос интерес к работам по распознаванию субъектов, находящихся на значительном расстоянии от приемника информации. В качестве признаков субъектов выбраны геометрические параметры лица [15]. Уже к настоящему времени предлагается несколько коммерческих систем автоматического распознавания интересующих лиц в толпе [67]. При использовании фронтальных изображений лица в течение дня достигнутая вероятность распознавания составила 0,95. Для изображений, полученных при разном освещении, этот показатель снижается до 0,8. Если изображения субъектов регистрируются через год, вероятность распознавания становится неприемлемой (« 0,5) [66]. Несмотря на интенсивные исследования по ослаблению влияния «дестабилизирующих факторов» на результаты распознавания субъектов, в классе данных технологий биометрической идентификации (изменение освещенности, старение, смена выражения лица, изменение внешнего облика), достичь продвижения по улучшению основных показателей систем не удалось [68]. Тем не менее это направление представляет интерес в силу простоты обеспечения скрытности процесса идентификации по отношению к испытуемым. На современном этапе понимания проблемы представляется, что прорыв в этой области возможен на пути создания комплексированных систем. В какой-то степени подобное положение наблюдалось в области космической разведки на начальном этапе ее развития. Изображения в видимом диапазоне длин волн не давали достаточной информации для получения приемлемых показателей надежности распознавания объектов разведки. Использование многоспектральных систем получения первичных данных позволило снять обозначенный вопрос с повестки дня. Справедливости ради следует отметить, что операция комплексирования в оптическом диапазоне длин волн приводит к дорогостоящим системам.
Информативность функции колебаний пера в плоскости графического планшета
Пространство признаков в данной системе формируется также из трех функций времени колебания и давления пера x(t), y(t), z(t), по которым составляется математическое описание формы подписи в виде упорядоченного набора примитивов (углы и отрезки), получаемых при кусочно-линейной аппроксимации контура подписи по точкам максимального изменения кривизны контура (рис. 2.1). Формируются так называемые ориентационные признаки, в дальнейшем участвующие в поиске среди имеющихся эталонов подписей таких, которые дают максимальное число сопоставляемых групп примитивов. Решение о результате идентификации пользователя принимается на основе интегральной оценки по всем анализируемым признакам: - по степени соответствия изображений анализируемой подписи и эталона; - по распределению мгновенной скорости и давления по длине подписи; - по распределению ориентации вектора градиента скорости в каждой точке подписи; - по времени написания подписи, - по среднему давлению по длине подписи и средней скорости. Из перечисленных признаков наибольший интерес представляет количественная оценка «степени соответствия...», которая оценивается как среднеквадратическое расстояние, образующееся из величин евклидовых расстояний между несовпадающими точками максимального изменения кривизны контура при наложении эталонного и нормализованного текущего изображения подписей. Остальным признакам, характеризующим динамику и индивидуальные особенности написания символов, присваивается статус дополнительных информативных признаков. В большинстве зарубежных систем идентификации по динамике подписи [30,70] используются подобные признаки. Встречаются материалы рекламного характера, утверждающие об использовании в своих разработках новых признаков, позволяющих существенно повысить надежность идентификации. Тщательный анализ имеющейся рекламной информации позволил сделать вывод, что речь идет об искусственном наращивании числа используемых сигналов - производных от первичных сигналов. Помимо применения отмеченных функций x(t), y(t), z(t) используются также их первые и вторые производные. Авторы не учитывают фундаментальное положение теории информации: сигналы, полученные путем линейного преобразования исходных данных, не несут новой информации. Более того, они характеризуются меньшим объемом полезной информации ввиду её маскировки «шумами преобразования».
В результате анализа открытой информации по обозначенной проблеме можно сделать вывод, что вопрос с формированием пространства признаков не проработан в должной мере, чтобы говорить о создании оптимальных (по надежности распознавания и стоимости) систем. Стремительный рост объемов электронной коммерции в информационных сетях, возрастание масштаба и роли дистанционного образования, нарастание глобализации так называемой «цифровой экономики» резко обострили интерес к созданию биометрических систем. Уже сейчас намечается жесткая конкуренция среди производителей этих систем, и именно производители ставят задачу о повышении надежности идентификации виртуальных субъектов и снижении стоимости своей продукции. Однако решение такой задачи невозможно без углубленного анализа признаков подписи. Цель настоящего раздела - снять поставленный вопрос.
Алгоритм формирования эталона рукописного слова
Основной характеристикой любого алгоритма идентификации является вид решающего правила, которое представляет собой принцип сравнения наборов признаков выдвигаемых гипотез и вынесения суждений о предпочтительности одних из них по отношению к другим. Динамика написания заученного слова обладает определенной изменчивостью. Даже два раза подряд невозможно одинаково с точностью до пикселя и миллисекунды написать слово. Возникают отклонения по траектории колебания пера, продолжительности и скорости написания рукописного слова. Это говорит о том, что формируемое пространство признаков с использованием данных о динамике написания слов может быть оценено только вероятностной мерой. Принятие решений при этом может опираться на стратегии Байеса, Неймана-Пирсона, Вальда и др. [10, 11, 12, 13, 53, 63]. Выбор той или иной стратегии зависит от преследуемой конечной цели, степени полноты информации для принятия решения и возможности получения этой информации.
Задача данной главы заключается в разработке метода идентификации пользователей по динамике написания слов. Проведенный в гл. 2 анализ сконструированного пространства признаков показал, что поставленная задача разрешима.
Идея создания эталона заключается в том, что пользователь пишет слово (расписывается) К раз. К введенным (в разное время) реализациям слова применяется операция масштабирования, описанная выше. Таким образом, получаем наборы нормированных временных функций изменения положения пера Uix(t)...UfCx(t), V\y(t)...VKy(t) и z\(t)... zrft), которые целесообразно хранить в виде совокупности моментов распределения для каждой точки траектории: vm(t), vHy(t), zH(t).
Применив критерий согласия для проверки гипотезы о виде распределения вероятностей амплитуд сигнала для последовательных фрагментов подписи парольного нормированного слова, сделан вывод о «нормальности» этих распределений. Поэтому описание каждого фрагмента было ограничено двумя моментами: математическим ожиданием и среднеквадратичным отклонением (табл. 3.1).
Ячейки массива структуры эталона, содержащие оценки математических ожиданий, характеризуют информацию о направлении и средней скорости перемещения кончика пера в определенной точке траектории. Ячейки, в которых записаны оценки средних квадратичных отклонений, несут информацию о разбросе показателей скорости в соответствующей точке траектории. Они являются показателем «стабильности» навыков написания слов. При проведении процедуры идентификации целесообразно отсеять неинформативные фрагменты траектории (ячейки) эталонов для сокращения вычислительных затрат при отнесении поступающих реализаций слова к соответствующему классу. С этой целью ранжируем все п фрагментов по риску принятия решений Q pn.
Упорядочить признаки по их «информативности» во всех трех парах строк массива эталона т(х),а(х); т(у),а(у); m(z),cr(z) можно, лишь сопоставив фрагменты траекторий всех зарегистрированных п эталонов по ячейкам в одинаковые моменты времени. Рис. 3.1 иллюстрирует плотности распределения вероятностей амплитуд сигналов трех эталонов на одном из фрагментов их траекторий в одинаковый момент времени. Далее выполняются следующие вычисления:
Организация интерфейса ПАКСИ
В представленном алгоритме остается открытым вопрос о максимально возможном количестве числа зарегистрированных эталонов в БД. Экспериментально установлено, что алгоритм идентификации может идентифицировать с уровнем ошибок первого и второго рода около 2%, если зарегистрировано до 30-ти эталонов пользователей.
Если ставится задача увеличения числа зарегистрированных («своих») пользователей без снижения надежности, то решение возможно за счет увеличения информации для принятия решения и снижения скорости распознавания. Отличия заключаются в следующем: 1. Для каждого пользователя регистрируется несколько эталонов разных рукописных слов в зависимости от желаемого общего числа зарегистрированных «своих» пользователей. 2. Вероятность распознавания Pj пользователя с п зарегистрированными эталонами рассчитывается: гдр рід - итоговые апостериорные вероятности &-го эталона пользователя. Экспериментально доказано, что при п=Ъ общее количество зарегистрированных пользователей, идентифицировать которых необходимо с вероятностью Pj =0,98, может достигать 200. Эксперимент. Предпринимались попытки подделать десятерых авторов двух рукописных слов. Вероятность распознавания автора двух рукописных слов PJt которая была достигнута испытуемыми при хорошей подделке, максимум составила 0,43. Под хорошей подделкой понимается, что испытуемые внимательно наблюдали, как автор создавал эталоны двух рукописных слов. То есть повторить динамику на некоторых участках траектории они могли.
Предварительные испытания программного комплекса, в основу работы которого положен метод идентификации пользователей по динамике написания слов, позволяют сформулировать рекомендации для пользователей.
Привыкание к графическому планшету (дигитайзеру) со световым пером происходит достаточно быстро. Для этого необходимо 5-10 минут поработать со световым пером в программных приложениях, желательно графических, используя его вместо компьютерной мышки. У пользователя световое перо не вызывает дискомфорта, и он подсознательно ассоциирует его с обычной ручкой для письма.
Динамика рукописных слов, которые пользователи выбирают в качестве паролей для идентификации, должна быть хорошо заучена. Поэтому рекомендуется выбрать слово и повторить его ввод до 20 раз, перед тем как регистрировать эталон. При проведении эксперимента была создана специальная утилита, которая показывала испытуемым коэффициент корреляции между последними введенными 10-ю его функциями vx(t) и z(t). Начиная с одиннадцатой реализации данные коэффициенты корреляции vx(t) и z(t) начинают увеличиваться, так как отбрасываются первые введенные слова. После 20-ти реализаций уже не наблюдалось значительного увеличения коэффициентов корреляции.
Для описанных алгоритмов масштабирования и метода идентификации оптимальными являются рукописные слова, время написания которых составляет от 1 до 2 с, что соответствует длине слова от четырех до шести букв. За 1 с с учетом шага дискретизации 30 мс в эталон запишется более 30-ти фрагментов для каждой составляющей.
Воспроизводить «парольные» слова следует с обычными скоростью и почерком, которые привычны для пользователя. Не рекомендуется использовать различные завитки в рукописных словах. Как показывает практика; стечением времени они забываются или видоизменяются.
После регистрации эталона рукописного слова в момент идентификации желательно воспроизводить его приблизительно в том же масштабе и под тем же углом наклона относительно специальной прямоугольной области для ввода графического планшета. Алгоритм масштабирования и метод идентификации не чувствительны к повороту рукописного слова в пределах 10.
Непосредственно в момент ввода рукописного слова желательно не смотреть за движением пера, в таком случае не возникает чувства неуверенности. В противном случае идентифицируемый человек начинает задумываться над правильностью повторения траектории своего рукописного пароля, что может привести к потере скорости и изменению давления на перо.
Оценить влияние на изменение динамики пера эмоциональных нагрузок, воздействия алкоголя, психотропных материалов практически сложно. Естественно, в значительных дозах они влияют на динамику движения пера, так как сознание человека при этом не находится в нормальном состоянии. Однако во многом воздействие таких факторов определяется психической устойчивостью самого человека. Существуют люди, способные при умеренных дозах воздействия нагрузок на мгновение отбросить посторонние мысли и правильно воспроизвести свой рукописный пароль.
Разработанный метод идентификации пользователей по динамике написания слов, основанный на последовательном применении стратегии выбора гипотез Байеса при сопоставлении выделенных участков поступающих сигналов с эталонами с использованием в качестве априорных вероятностей вычисленных на предыдущем шаге апостериорных вероятностей, в процессе экспериментов позволил идентифицировать 200 пользователей с уровнем ошибок первого и второго рода около 2 %. Разработанный метод идентификации пользователей по динамике написания слов позволяет реализовать скрытый мониторинг пользователей.