Содержание к диссертации
Введение
ГЛАВА 1. Состояние вопроса и задачи исследования 9
1.1 Обзор существующих разработок 9
1.2 О мониторинге пользователя в режиме «on-line» 12
1.3 Предлагаемый подход 27
ГЛАВА 2. Компьютерная модель динамики системы «пользователь-мышь» 30
2.1 Постановка задачи 30
2.2 Проблема отображения динамики траекторий указателя 31
2.3 Исходное множество параметров системы «пользователь-мышь» 32
2.4 Информативные параметры системы «пользователь-мышь» 34
2.5 О прогнозировании значений параметров 40
Выводы по Главе 2 48
ГЛАВА 3. Метод мониторинга информационного почерка .49
3.1 Постановка задачи 49
3.2 Обсуждение методов распознавания образов 50
3.3 Обоснование выбора нейросетевого подхода 54
3.4 Образ информационно7 почерка 55
3.5 Формирование комп^ « його образа ИПП 56
3.6 Архитектура нейронное сети для мониторинга ИПП 57
3.7 Методика проведения эксперимента 68
3.8 Результаты экспериментальных исследований 71
Выводы по Главе 3 73
ГЛАВА 4. Описание системы мониторинга динамики мыши 74
4.1 Концепция системы 74
4.2 Клиентская часть системы 76
4.3 Серверная часть системы 76
Заключение 79
Список литературы
- О мониторинге пользователя в режиме «on-line»
- Проблема отображения динамики траекторий указателя
- Обоснование выбора нейросетевого подхода
- Клиентская часть системы
Введение к работе
Одной из очевидных тенденций развития информационных технологий является их антропоцентричность или персонификация. Недоиспользуемая растущая производительность компьютера должна быть направлена на более эффективную поддержку деятельности конкретного пользователя. В связи с этим актуальной становится задача мониторинга деятельности пользователя, его личности и состояния. Потребность в таком мониторинге ощущается, в частности, в компьютерных средствах тестирования обучаемых, оценки степени их натренированности в тренажерных комплексах, стимулирования высокой готовности операторов и т.п. Значительная часть результатов, полезных в этом контексте, получена в области средств идентификации пользователей открытых систем.
Информатизация общества является причиной все большей
виртуализации образа жизни человека. Это объясняется ростом количества
операций, производимых с использованием компьютерных сетей;
увеличением процента использования сетевых ресурсов, с целью проведения
различных операций (передача информации, торговля, обучение,
тестирование, анкетирование). Развитие информационных,
телекоммуникационных технологий является причиной возникновения новых подходов в области образования. Одним из основных подходов является дистанционное обучение. Через 10-15 лет подавляющее большинство услуг высшего образования будет реализовываться дистанционно [48].
Идентификация пользователя на входе в некоторых системах является недостаточной процедурой по причине того, что во время работы пользователь может быть подменен. Применяемые на сегодняшний день способы распознавания пользователей основаны на использовании паролей и (или) специализированных устройств (смарт-карт, «электронных ключей»). Эксплуатация таких систем безопасности выявила их недостатки. Зачастую
пароли перехватываются. Специализированные устройства похищаются или подделываются. Наблюдаются ситуации, когда один из пользователей сознательно передает свой пароль постороннему лицу. Например, в дистанционном образовании при тестировании студенты готовы заменить себя более осведомленным в изучаемом предмете лицом. Аналогичных примеров из других областей можно привести множество.
Преимущество биометрических систем идентификации по сравнению с традиционными (например, PIN-кодовыми системами или системами доступа по паролю) заключается в том, что идентифицируется собственно человек. Используемая в этих системах характеристика является неотъемлемой частью личности, ее невозможно потерять, передать, забыть. Поскольку биометрические характеристики каждого индивидуума уникальны, они могут использоваться для предотвращения воровства или мошенничества.
В последнее время большое внимание уделяется методам биометрической идентификации личности по динамике подсознательных движений рук [2,3,4]. Речь идет о выявленной стабильности отработанных двигательных навыков человека и возможностях его распознавания по этому признаку. При ориентации на стандартные устройства ввода информации исчезают дополнительные затраты на специализированную аппаратную поддержку, которые в ряде случаев могут существенно превышать стоимость программного обеспечения биометрии. Достаточно новым способом биометрической верификации по поведенческим признакам является исследование характера взаимодействия человека с ЭВМ посредствам различных манипуляторов, например световых перьев, манипуляторов типа «мышь». Это направление является новым. И пока не создано коммерческих систем верификации или идентификации личности, основанных на анализе взаимодействия с ЭВМ посредствам манипуляторов.
Актуальность задачи повышения надежности идентификации пользователей, обнаружения незарегистрированных пользователей и в целом мониторинга системы «пользователь-устройства ввода» имеет место быть.
В настоящей работе сформулирована и решена следующая задача -разработана математическая и компьютерная модели информационного почерка как параметрический образ динамики системы «пользователь-мышь»; исследован методов ее мониторинга.
Полученные результаты позволяют создавать средства автоматического оценивания компьютерной грамотности пользователя, степени освоения им навыков посредством компьютерного тренажера, повышения надежности идентификации и прогнозирования состояния пользователя в режиме реального времени непосредственно в процессе его работы с системой.
Объектом исследования в настоящей работе является параметрическое описание совокупной динамики «мыши». Новым при этом является исследование адекватности модели работы пользователя с манипулятором «мышь» (системы «пользователь-мышь»).
Формулировка научной проблемы: отсутствие адекватной модели динамики устройств ввода, создаваемой конкретным пользователем, и программы формирования в компьютере ее образа.
Цель диссертационной работы - разработка математической модели манипулятора «мышь», отражающего специфику динамики манипулятора «мышь», создаваемую конкретным пользователем компьютера; оценка адекватности компьютерной модели этой динамики - информационного почерка пользователя.
Признаки предмета исследования: 1) создание информационных систем, ориентированных на специфику работы пользователя как личность и специалиста в определенной сфере, требует мониторинга его работы с компьютером; 2) ускорение формализации требований к проектируемой
системе возможно созданием средств автоформализации модели профессиональной деятельности пользователя; 3) наличие «компьютерных болезней» требует создания ИТ, поддерживающих баланс труду и отдыха пользователя компьютерными средствами мониторинга его состояния; 4) несовершенство современных средств аутентификации пользователей в открытых системах является причиной поиска новых, дополнительных возможностей. Информационный почерк пользователя является одним из дополнительных механизмов мониторинга пользователя компьютера и повышения защищенности открытых систем.
Предмет исследования: математическая модель динамики манипулятора мышь, метод отображения в компьютере информационного почерка, т.е. системы «пользователь-мышь».
Задачи исследования
Анализ состояния вопроса о моделировании динамики устройств ввода по научным публикациям.
Разработка математической модели динамики устройств ввода. Ее экспериментальное исследование.
Разработка метода и программы отображения модели в компьютере.
Выбор или разработка способа распознавания для оценки эффективности распознавания информационного почерка.
Проведение экспериментов.
Основные результаты исследований доложены на международной научно-методической конференции «Новые информационные технологии в университетском образовании» (Новосибирск, 2003); международной научно-практической конференции «Новые информационные технологии в нефтегазовой отрасли и образовании» (Тюмень, 2003); международной научно-практической конференции «Модернизация образования в условиях глобализации» (Тюмень, 2005); Второй международной научно-практической конференции «Исследование, разработка и применение высоких технологий
в промышленности» (Санкт-Петербург, 2006); заседаниях городского научно-практического семинара «Интеллектуальные информационные системы» (Тюмень, 2003-2006).
По теме диссертации опубликовано 7 печатных работ.
Диссертация состоит из введения, четырех глав, заключения, двух приложений, изложенных на 95 страницах машинописного текста, содержащих 21 рисунок, 12 таблиц, список литературы из 78 наименований.
В первой главе диссертационной работы приведен обзор существующих средств биометрической аутентификации. Выполнен анализ используемых средств распознавания отечественного и зарубежного производства. Значительное место уделено рассмотрению существующих моделей и способов распознавания по ИПП при работе в системах с ограниченным доступом. В заключение главы сформулированы задачи исследования.
Вторая глава посвящена разработке математической модели и уточнению информативных параметров динамики манипулятора мышь в системе «пользователь-мышь», численному исследованию влияния времени и интенсивности работы пользователя на значения этих параметров.
Третья глава содержит описание разработанной методики формирования образа ИПП в компьютере, обоснование выбора решающего правила распознавания. Приведены результаты экспериментов по распознаванию ИПП.
В заключении приведены результаты исследований и рекомендации по их практическому использованию.
На защиту выносятся следующие научные положения 1. Адекватной компьютерной моделью информационного почерка пользователя (на базе манипулятора мышь) является совокупность нейронных сетей, отображающих специфику приложений, с которыми
работает пользователь, и параметры динамики системы «пользователь-мышь».
2. Информативным множеством параметров системы «пользователь-
мышь» являются: T,L,Vmax,tvl),S,a (п.2.3).
Распознавание состояния системы «пользователь-мышь» посредством выявленных информативных параметров и нейронной сети радиального типа обеспечивается с вероятностью 0,9-0,95.
Разработанный программный комплекс является прототипом одного из компонентов средства адекватного мониторинга пользователя по совокупности информативных параметров динамики мыши.
О мониторинге пользователя в режиме «on-line»
При наличии большого количества способов обойти систему безопасности в информационных системах, растет количество различных способов идентификации пользователей, работающих в этих системах. Использование статических биометрических признаков (отпечаток пальца, геометрия ладони, сетчатка и радужная оболочка глаза) в задачах автоматической идентификации личностей не дает оснований для оптимизма решить аналогичные задачи в скрытном от идентифицируемого лица режиме при наличии ограничений на расходы по проведению исследований и разработок [2]. В моделях обеспечения информационной безопасности «человеческий фактор» не только учитывается, но и берется за основу. Совсем недавно казалось, что биометрическая аутентификация на основе статических признаков (отпечатки пальцев, геометрия рук, рисунок оболочки глаза и т.н.) ставит точку в совершенствовании системы защиты от несанкционированного доступа (НСД).
Однако как свидетельствуют последние отчеты о нарушениях одноразовая биометрическая аутентификация пользователя при входе в систему не является панацеей. Необходим способ непрерывной аутентификации (мониторинга) пользователей информационных систем. В настоящее время непрерывная аутентификация осуществляется с помощью организационных мероприятий. Например, выделенные для этого сотрудники следят за тем, чтобы после входа в систему и аутентификации одного пользователя на каком-либо рабочем месте на его месте не работал другой. Недостатки такого решения очевидны: наблюдающий персонал должен отвечать жестким требованиям и его также необходимо контролировать. Общим решением этой проблемы, заключающейся в больших расходах на осуществление непрерывной аутентификации пользователя организационными методами, является автоматизация процесса с помощью регулярной биометрической аутентификации (мониторинга).
Под регулярной биометрической аутентификацией понимается проверка подлинности пользователя на основе биометрических признаков, называемых обобщенно «динамика подсознательных движений». Множество этих признаков, проявляющихся при работе пользователя со средствами автоматизации, назвали информационным почерком пользователя (ИПП) [3].
Отсутствие универсальных средств аутентификации объясняется следующими причинами.
1. Большинство средств, осуществляющих распознавание личности пользователя (по отпечаткам пальцев, сетчатке глаза, голосу), работают только в при входе в систему.
2. Средства биометрических аутентификации дороги.
В нашем исследовании рассматривается метод мониторинга пользователя по стилю его работы с манипулятором «мышь» (мониторинг системы «пользователь-мышь»). Стоит отметить, что речь идет об автоматизированных системах, в участие которых человека осуществляется посредством персонального компьютера.
Еще в конце 19-го века психологи и математики занимались исследованием движений, производимых человеком. Психологами было установлено, что в часто повторяющихся и типичных движениях человека проявляются индивидуальные признаки. В 1895 году наблюдение за телеграфистами показало, что каждый из них имеет индивидуальную манеру набора сообщений, передаваемых через телеграф. Кроме того, телеграфисты часто сами опознавали, кто телеграфирует сообщение, просто слушая последовательность точек и тире. Сегодня телеграф уступил место другим устройствам ввода информации: клавиатуре и манипулятору «мышь». Исследования «клавиатурного почерка» является перспективными в плане отображения индивидуальных характеристик печатающего. Можно заметить, находясь рядом с человеком, печатающим на клавиатуре, особый стиль его работы.
Проблема отображения динамики траекторий указателя
Каждая траектория в компьютере представлена множеством двумерных координат Т = {(хпУ;)} пикселей. Это множество точек достаточно точно отображает непрерывную траекторию на основании того, что тактовая частота современных компьютеров высока (удовлетворены условия теоремы Котельникова об отсчетах), а разрешение современных мониторов позволяет иметь погрешность квантования траекторий в пределах, не превышающих 1/600 = 0,17%.
В результате предварительного экспертного анализа и с учетом работ [6,76] в качестве исходной совокупности параметров динамики системы «пользователь-мышь» выбраны следующие.
1) Г- время движения манипулятора до остановки. Дело в том, что время движения курсора к заданной точке, может меняться в зависимости от степени усталости пользователя. 2)L - длина (погонная) траектории: L = Z V( «-- M У+(УІ - Уі-\ У где xt и у І - координаты, а п - количество точек разрыва первого рода, включая конец траектории; 3) У ср.- средняя скорость движения указателя: У = 1 у У( ,-- мУ (У, Уі-\) Ср /_j г. 1 где 8,- шаг по временной оси, с которым берутся отсчеты траектории. В работе принято минимальное значение для ПК 8, = \5 мсек. 4) У„ - начальная скорость движения манипулятора, скорость прохождения первых 10% длины траектории: Wi-xif+iyi-yj v = p t,-u где і - номер вершины, для которой выполнено условие: 5) / - длина начального участка траектории: 1р =0,11; 6) tyd - время удержания кнопки на мыши; 7) тПу - максимальная скорость движения указателя по траектории: V =maxF. max " 8) 8 - время между остановкой указателя и подтверждающим нажатием кнопки манипулятора: 8 = t2, где t2 - промежуток времени от начала движения указателя до нажатия кнопки манипулятора.
9) от-угол между направлением начального движения (до 3-й вершины траектории) и линией, связывающей начальную и конечную точки траектории: \Х3 Х0) \Хп Х0) 10) О" - среднее квадратичное отклонение траектории от кратчайшего пути следования указателя: d, = (х,-х„)+(У, Уо), где di - расстояние от і-й точки траектории до прямой наикратчайшего пути, (х;,.у,-)- координаты 1-й точки траектории, (х0,уо)- точка пересечения перпендикуляра опущенного из і-й точки траектории с прямой кратчайшего пути траектории. Кратчайшим путем является отрезок, соединяющий первую и последнюю точки траектории.
Таким образом, в каждый момент времени систему «пользователь-мышь» предлагается отображать вектором: P = {pl,p2,.--Pl0) = {T,L,lp,Vp,Vcp,Vm:iX,tyd,S,a,(7).
В процессе последовательных измерений множества траекторий в этом случае имеем векторную функцию p{t) дискретного аргумента, так как t = kT,k=\,2,...,K.
Для получения экспериментальных данных в течение двух рабочих недель производилась запись данных о системе «пользователь-мышь» у 20 пользователей, интенсивно использующих компьютер. Наблюдения проведены в течение всего рабочего дня. При этом фиксировались только те траектории указателя, которые заканчивались нажатием кнопки манипулятора мышь, что обеспечивало получение полной совокупности данных согласно выбранной модели (п. 2.1). Каждая траектория запоминается путем считывания плоских координат, взятых через т = 15 мсек. Фиксировалось также время считывания каждой локальной вершины траектории для более точного вычисления ее параметров. Всего было записано 670 000 состояний. При этом общее количество зафиксированных состояний у одного пользователя составило от 1000 до 7000.
Обоснование выбора нейросетевого подхода
При разработке математической модели ИПП одной из задач является выбор формы образа ИПП. Выбор формы влияет на точность распознавания (идентификации) и затраты машинного времени.
Естественно представить ИПП как гиперсферу в многомерном пространстве. В гиперсферу попадает некоторое множество реализаций вектора параметров, относящихся к одной системе «пользователь-мышь». Часть таких реализаций может быть использована в качестве обучающей выборки. В случае с компьютерной мышью каждый вектор отражает отдельное состояние системы «пользователь-мышь». В случае с клавиатурой каждый вектор является вектором средних значений скоростных характеристик набора слов или комбинаций клавиш.
Образ ИПП формируется на этапе обучения для каждого из пользователей. Он используется в последующем для идентификации системы «пользователь-мышь». Совокупность образов ИИП (систем «пользователь-мышь») формируется для всех зарегистрированных пользователей. Экспериментальным путем показано, что объект в виде точки пространства параметров ИПП, имеющей в качестве координат усреднённые по обучающей выборке значения параметров, не может быть использован в качестве компьютерного образа ИПП: получены неудовлетворительные результаты распознавания.
Образ ИПП в компьютере (компьютерная модель ИПП) - это файл-матрица (Nx7), содержащая значения элементов информативного подмножества (координат вектора) М. - {N, /, L,Vcp,(X, о,tу0);. параметров динамики мыши. Здесь добавлен параметр N - номер приложения, с которым работает пользователь. Значение одного параметра (координаты) представляет собой среднеарифметическое измерений (не более 100), полученнымх в і-ом интервале Ті (в нашем случае 5 мин.).
В общем случае число областей для биометрического вектора М должно быть равно (П+\): по числу П зарегистрированных («своих») пользователей и одна область (класс векторов) для любых других, не зарегистрированных пользователей («чужих»).
Проектирование искусственной нейросети состоит в подборе количества слоев, нейронов в каждом слое и связей между ними.
Искусственная нейронная сеть— это математическая модель и схема параллельных вычислений, представляющие собой систему из соединенных и взаимодействующих между собой простых процессоров (искусственных нейронов). Такие процессоры обычно исключительно просты особенно в сравнении с процессорами, используемыми в персональных компьютерах. Каждый процессор подобной сети имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам. И тем не менее, будучи соединёнными в достаточно большую сеть с управляемым взаимодействием, такие локально простые процессоры вместе способны выполнять довольно сложные задачи.
Нейронные сети не программируются в привычном смысле этого слова, они обучаются. Возможность обучения - одно из главных преимуществ нейронных сетей перед традиционными алгоритмами. Технически обучение заключается в нахождении коэффициентов связей между нейронами [28].
Многослойные нейронные сети с точки зрения математики выполняют аппроксимацию стохастической функции нескольких переменных путем преобразования множества входных переменных xeRN во множество выходных переменных yeR". Вследствие сигмоидального характера функции активации осуществляется аппроксимация глобального типа. В результате нее нейрон, который был однажды включен (после превышения суммарным сигналом н(. определенного порогового значения), остается в этом состоянии при любом значении ип превышающем этот порог. Поэтому
всякий раз преобразование значения функции в произвольной точке пространства выполняется объединенными усилиями многих нейронов, что и объясняет название «глобальная аппроксимация».
Другой способ отображения входного множества в выходное заключается в преобразовании путем настройки нескольких одиночных аппроксимирующих функций на ожидаемые значения. Такая адаптация проводится только в ограниченной области многомерного пространства. При таком подходе отображение всего множества данных представляет собой сумму локальных преобразований. С учетом роли, которую играют скрытые нейроны, они составляют множество базисных функций локального типа. Выполнение одиночных функций (при ненулевых значениях) регистрируется только в ограниченной области пространства данных. Отсюда и название -локальная аппроксимация.
Особое семейство образуют сети с радиальной базисной функцией, в которых скрытые нейроны реализуют функции, радиально изменяющиеся вокруг выбранного центра Я и принимающие ненулевые значения только в окрестности этого центра. Подобные функции, определяемые в виде (х) = ([х-с), будем называть радиальными базисными функциями. В таких сетях роль скрытого нейрона заключается в отображении радиального пространства вокруг одиночной заданной точки либо вокруг группы таких точек, образующих кластер. Суперпозиция сигналов, поступающих от всех скрытых нейронов, которая выполняется выходным нейроном, позволяет получить отображение всего многомерного пространства.
Клиентская часть системы
Эта часть системы представляет собой приложение, работающее на стороне клиента. В задачи клиентской компоненты «Пользователь» входит: 1. Получение образа ИПП; 2. Инициирование процесса наблюдения за работой пользователя с устройствами ввода; 3. Мониторинг устройств ввода при работе пользователя; 4. Распознавание пользователя на основе достаточного количества собранных данных об ИПП; 5. Получение результата верификации пользователя; 6. Завершение сеанса пользователя; 7. Передача на сервер обучающих данных, собранных за последний сеанс работы пользователя.
Основным модулем здесь является модуль наблюдения. При использовании данного модуля осуществляется считывание и фиксирование в отдельные файлы всех первичных данных поступающих в виде отдельных событий с устройств ввода, а также предварительная обработка данных. Обработка данных заключается в выбраковке аномальных данных, например, аномально больших интервалов между нажатиями на клавиши манипулятора, если пользователь отвлекся, или если, например, одна из клавиш манипулятора была постоянно нажата.
Компонент системы, работающий на сервере, выполняет следующие функции: 1. Открытие и закрытие пользовательских сеансов по запросу пользователя; 2. Ведение журнала пользовательских сеансов; 3. Получение параметров об ИПП от клиентских приложений и расчет параметров образа на основе поступивших обучающих данных, с учетом ограничивающих условий обучения (предотвращающих «переобучение системы»); 4. Обеспечение хранения обучающих данных и образов ИПП; 5. Поддержка интерфейса администрирования системы, включающего такие средства как работа с пользователями, настройка системы, администрирование хранилищ данных; 6. Сбор информации о производительности системы; 7. Ведение журнала событий о производительности системы; 8. Поддержка интерфейса мониторинга работы системы.
Основными модулями серверной части программного комплекса являются следующие. Модуль расчета параметров Данный модуль предназначен для анализа первичных данных и расчета параметров ИПП. Присутствует как в клиентской, так и серверной частях программного комплекса. Модуль формирования образа пользователя
Данный модуль организует процедуру формирования образа ИПП на основе обучения нейронной сети и формирования ее матрицы весов.
В результате проведенных в диссертационной работе исследований и разработок получены следующие основные результаты.
1. Впервые поставлена задача компьютерного мониторинга системы «пользователь-мышь». Проведен системный анализ проблемы мониторинга «информационного почерка», отражающего специфику динамики устройств ввода компьютера формируемую работой пользователя. Произведена классификация подходов и методов решения проблемы мониторинга системы «пользователь-устройства ввода», позволившая уточнить задачи настоящего исследования.
2. Экспериментально показана невозможность единообразного аналитического представления траекторий указателя монитора, отображающих динамику манипулятора мышь, ввиду чрезмерного разнообразия их конфигураций. Предложено в дополнение к «клавиатурному почерку» мониторировать параметры динамики системы «пользователь-мышь».
3. Определено множество информативных параметров системы «пользователь-мышь».
4. Разработаны алгоритмы и программы измерения и вычисления параметров динамики системы «пользователь-мышь», ставшие инструментом проведенных исследований.
5. Разработан метод идентификации состояния системы «пользователь-мышь» по динамике движения манипулятора «мышь» и соответствующим траекториям указателя, основанный на использовании пространства информативных параметров системы и трех нейронных сетей радиального типа, обеспечивающий вероятность ошибки первого рода не более 0,1, второго рода - не более 0,2.
6. Создан и внедрен программный комплекс, позволяющий отслеживать характер работы пользователя посредством мониторинга параметров динамики манипулятора мышь и соответствующих траекторий указателя, проводить идентификацию состояния системы «пользователь-мышь» на этой основе в процессе работы пользователя с ПЭВМ.
Теоретическая и практическая значимость результатов диссертационной работы заключается в следующем.
1. Разработанные в диссертационной работе новые подходы позволяют повысить эффективность проведения разработок по созданию новых образцов, в частности, системы компьютерного мониторинга работы пользователя, и модернизации известных систем аутентификации и тестирования.
2. Разработанные математическая модель ИПП и способ распознавания состояний системы «пользователь-мышь» позволяют поднять качественные показатели аутентификации в открытых системах при совместном использовании с другими средствами.
3. Результаты экспериментальных исследований представляют интерес в проектировании новых и модернизации известных систем распознавания, развивают знания об информационном почерке пользователя в целом.
4. Программный комплекс, состоящий из средств измерения и накопления данных о динамике устройств ввода, с одной стороны; программы формирования компьютерного образа информационного почерка и программы распознавания информационного почерка по совокупности информативных параметров динамики мыши, с другой, - с учетом особенности взаимодействия пользователя с операционной средой компьютера является прототипом системы мониторинга работы пользователя по информационному почерку.