Содержание к диссертации
Введение
1. Анализ существующих методов защиты цифровых мультимедийных данных и идентификации аппаратуры по цифровому образу данных 7
1.1. Идентификации устройств цифровой записи по аппаратурно-уникальным признакам 16
1.1.1. Методы формирования изображений из данных матрицы в цифровых фотоаппаратах 18
1.1.2. Идентификация камер на основе артефактов цветовой интерполяции 23
1.1.3. Идентификация камер на основе дефектов матриц 29
1.1.4 Требования к структуре системы идентификации аудиозаписывающей аппаратуры. 36
1.2. Выводы 37
2. Методика идентификации цифровых визуальных устройств записи 39
2.1. Получение изображений в цифровых фотокамерах 39
2.2. Получение изображений в сканерах 42
2.3. Выбор входного формата системы идентификации цифровых фотокамер и сканеров по цифровому образу 52
2.4. Формирование вектора признаков для идентификации цифровых фотокамер 54 Фильтрация цифрового образа данных для выделения ВЧ-составляющих 54
2.4.2. Обнаружение поворота изображения на основе преобразования Радона . 60
2.5. Этапы идентификации фотокамер 70
2.6. Формирование вектора признаков для идентификации сканеров 71
2.7. Этапы идентификации сканеров 75
2.8. Выводы 78
3. Методика идентификации устройств цифровой аудиозаписи 80
3.1. Структура системы записи аудиоданных цифровых микрофонов и звуковых плат 80
3.1.1. Анализ погрешностей канала записи звука 80
3.1.2. Погрешности сигма-дельта АЦП 85
3.2. Структура системы идентификации цифровых устройств аудиозаписи по их цифровому образу 93
3.3. Выбор методик для получения векторов признаков для идентификации цифровых устройств аудиозаписи 94
3.4. Методика идентификация на основе стационарных составляющих канала записи 94
3.4.1. Преобразование Габора 95
3.4.2. Методика идентификации звуковых плат, основанная на стационарных составляющих 108
3.5. Выбор методики представления акустического сигнала для подсистемы аутентификации звуковых плат 113
3.6. Вычисление кепстра на основе коэффициентов линейного предсказания 115
3.7. Методики идентификации звуковых плат 117
3.7.1 .Методика, основанная на гауссовских смешанных моделях 117
3.7.2.Методика идентификации основанная на нейронных сетях 121
3.8. Выводы 123
4. Экспериментальные исследование разработанных методов идентификации цифровых устройств записи по создаваемому ими цифровому образу - 125
4.1. Выбор методик идентификации для подсистемы аутентификации звуковых плат 125
4.2. Экспериментальные исследования задачи идентификации звуковых плат методом выделения стационарных составляющих 129
4.3. Экспериментальные исследования задачи идентификации цифровых микрофонов методом выделения стационарных составляющих 130
4.4. Экспериментальные исследования задачи идентификации цифровых фотокамер 131
4.5 Эспериментальные исследования задачи идентификации сканеров 135
4.6. Выводы по четвертой главе 136
Заключение 139
- Методы формирования изображений из данных матрицы в цифровых фотоаппаратах
- Обнаружение поворота изображения на основе преобразования Радона
- Методика идентификации звуковых плат, основанная на стационарных составляющих
- Экспериментальные исследования задачи идентификации цифровых фотокамер
Введение к работе
Актуальность. Особенность проблемы защиты информации состоит в ее многогранности. Распространение цифрового представления медиа-контента и устройств для его воспроизведения привели к практически полному вытеснению аналоговой техники записи. Однако вместе с тем стало ясно, что в связи с простотой копирования информации в цифровом представлении и отсутствием деградации качества при её копировании, а также возможностью копирования медиа-информации из аналогового представления (analog-hole), неустранимой принципиально, актуальной является задача разработки новых методов как защиты медийных данных от несанкционированного копирования, так и средств встроенной защиты звукозаписывающей аппаратуры от использования в целях производства контрафактной продукции. Другой не менее актуальной задачей является задача установления происхождения цифровых образов, в частности, сложности с установлением авторства и подлинности цифровых фотографий, т. к. создание и манипуляция цифровыми образами аналоговых сигналов, в частности фотографическими изображениями, аудио- и видеозаписями при помощи широко доступного специализированного программного обеспечения достаточно просты. Проблемы, которые встают при установлении подлинности цифровых изображений включают установление фактов: действительно ли образ - оригинальный, либо он подвергался монтажу, был ли получен анализируемый образ при помощи устройства записи, предъявленного на экспертизу, модифицировались ли данные на носителе либо область данных файла образа после его создания? При этом отдельно следует отметить, что вопросы, связанные с возможностью идентификации цифровых устройств записи, по созданным ими цифровым образам, имеют очень большое значение при проведении сотрудниками правоохранительного блока оперативно-розыскной деятельности (ОРД). Так как установление фактов принадлежности между изъятыми в ходе ОРД цифровыми образами и конкретными образцам цифровых устройств записи позволило бы не только сузить круг подозреваемых, но и возможно выйти на лицо, совершившее преступление.
Наиболее распространенным методом защиты от несанкционированного копирования и обнаружения изменений является использование цифровых водяных знаков (ЦВЗ) - трудноудалимых меток, встраиваемых в защищаемый объект. В отличие от обычных водяных знаков, ЦВЗ могут быть не только видимыми, но и, как правило, - невидимыми. Однако, во многих случаях при создании цифровых мультимедийных данных, встраивание ЦВЗ средствами устройства записи реализовать невозможно. В качестве такого примера можно привести получение фотоснимка при помощи серийной фотокамеры, запись звука на цифровой диктофон, когда цифровой образ аналогового сигнала не
содержит ЦВЗ. Применение ЦВЗ подразумевает использование вычислительных устройств и специального программного обеспечения для их встраивания и анализа. Таким образом, несмотря на то, что ЦВЗ были предложены как инструмент, призванный обеспечить подлинность фотографий, большинство существующих фотографий их не содержит; такая ситуация сохранится и в обозримом будущем. Сами методы встраивания ЦВЗ начали разрабатываться сравнительно недавно, т. к. сама цифровая стеганография, как наука родилась буквально в последние годы, в связи с чем до настоящего времени имеется много неясных проблем, требующих своего разрешения. Следовательно, при отсутствии широко распространённого встраивания цифровых водяных знаков в цифровые контейнеры необходимо разработать алгоритмы, которые могут помочь в установлении подлинности цифровых фотографий. Аналогичные проблемы возникают и при анализе других цифровых мультимедийных данных, в частности, аудиофайлов, поэтому необходимы методики идентификации цифровых данных по особенностям, возникающим при их создании.
Целью работы диссертационной работы является разработка и исследование алгоритмов и методик идентификации цифровых мультимедийных данных, полученных с цифровых устройств записи, для установления происхождения цифровых данных и исследования их аутентичности.
Исходя из поставленной цели, определяется перечень задач исследования:
выработка требования к системе аутентификации, эффективно решающей задачу распознавания предъявленных цифровых мультимедийных данных с целью установления их авторства и происхождения;
разработка алгоритмов и методик выделения признаков, обусловленных программно-аппаратными решениями устройств, в частности, типами используемых сенсоров, модификациями алгоритмов постобработки данных при их преобразованиях в форматы представления;
разработка алгоритмов и методик идентификации цифровых систем записи;
проведение экспериментальных исследований оценки точности идентификации устройств записи аудио и визуальных данных.
Объектом исследования диссертации являются средства цифровой обработки сигналов, их анализа, заключающегося в усовершенствовании методик идентификации устройств цифровой записи в интересах обеспечения информационной безопасности объектов, в части - систем установления происхождения цифровых мультимедийных данных.
Методы исследования. В работе использованы основные положения теории цифровой обработки сигналов, спектрального анализа, теории цифровой фильтрации, а также методы распознавания образов, с использованием аппарата искусственных нейронных сетей.
Научная новизна. Разработаны алгоритмы и методики автоматизированной идентификации цифровой визуальной и аудио записи по создаваемым устройствами цифровым образам с учетом возможных искажений изображений и нестабильности частоты дискретизации аудиосигнала.
Практическая ценность работы. Разработанные алгоритмы и методики идентификации могут быть использованы при создании автоматизированных систем классификации цифровых изображений и звуковых данных по устройствам-источникам. На основе разработанных алгоритмов возможна идентификация устройств фото и аудиозаписи, а также отслеживание попыток нарушения авторских прав на медиа-произведения.
Достоверность полученных результатов подтверждается полнотой и корректностью теоретических обоснований и результатами проведённых экспериментов действующих моделей.
Основные научные результаты, выносимые на защиту:
Алгоритм и методики идентификации аппаратуры визуальной записи, позволяющей учитывать углы поворота изображения.
Алгоритм и методики идентификации цифровой аппаратуры, позволяющие учитывать нестабильность частоты дискретизации аудиосигнала.
Экспериментальные оценки основных характеристик разработанных и реализованных средств идентификации цифровых устройств записи.
Использование результатов. Полученные в ходе работы над диссертацией результаты были использованы:
при проведении исследований по гранту РФФИ 08-07-00253-а «Разработка методов идентификации цифровых аудио и визуальных устройств записи по цифровому образу данных»;
подразделениями Министерства внутренних дел по Республике Дагестан;
подразделениями Управления ФСБ России по Республике Дагестан;
войсковой частью 43573-Р (г. Москва).
Апробация. Полученные при работе над диссертацией результаты были представлены на:
Девятой международной научно-практической конференции «ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ - 2007», г. Таганрог.
Десятой международной научно-практической конференции «ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ - 2008», г. Таганрог.
Третьей Международной научно-технической конференции «Инфокоммуникационные технологии в науке, производстве и образовании» с целью выработки научно-практических рекомендаций по проблеме «Математическое моделирование в управлении, науке и технике», г. Ставрополь (2008).
Всероссийской конференции (с международным участием) «Проблемы информатизации общества», г. Нальчик (2009).
Публикации. По теме диссертации опубликовано 10 статей и тезисов докладов, из них 1 статья опубликована в журнале «Известия Таганрогского государственного радиотехнического университета (ТРТУ)», входящего в перечень, рекомендованный ВАК РФ для публикации результатов диссертационных работ.
Объём и структура диссертации. Диссертация состоит из введения, 4-х глав, заключения и списка литературы. Основной текст диссертации состоит из 150 страниц и включает 51 рисунок и 9 таблиц.
Методы формирования изображений из данных матрицы в цифровых фотоаппаратах
Разработка средств для подтверждения, авторских прав и выявления контрафактной продукции требует разработки новых методов защиты интеллектуальной собственности. Специфика проведения подобного анализа существенно зависит от типа носителя — вещественного (материального) или невещественного (энергетического) и устройства записи (аналогового или цифрового). На настоящий момент вопросы идентификации аналоговых устройств звуко- и видеозаписи, в частности идентификации диктофонов, магнитофонов являются хорошо исследованными и основываются на признаках, которые устройство записи оставляет на носителе в процессе записи при изменении его1 физических свойств. Ввиду непосредственной зависимости особенностей процедуры идентификации от природы носителей, для анализа возможностей идентификации целесообразно выделить следующие группы носителей: вещественные (физические тела) и энергетические (физические и звуковые поля, электрические токи). Общим свойством физических и звуковых полей является их волновой характер, поэтому их можно еще назвать носителями волнового типа. Электрический ток также осуществляет перенос энергии и является носителем информации в форме токов низкой или высокой частоты в кабельных сетях связи и коммуникации. Закрепление информации на носителях вещественного типа знаковыми системами осуществляется за счет изменения образа физических тел. Перенос информации носителями вещественного типа осуществляется за счет переноса массы вещества. Закрепление информации носителями волнового типа осуществляется за счет изменения состояния среды. Перенос информации носителями волнового типа осуществляется за счет переноса электромагнитной или звуковой энергии. Непосредственная практическая задача идентификации может ставиться в различных вариантах. Наиболее распространёнными являются следующие из них: 2. Идентификации подвергается запись на исходном носителе. 3. Идентификации подвергается запись, скопированная на другой носитель (возможно с автоматической конвертацией формата, компрессией динамического диапазона). 4. Идентификации подвергается запись, сконвертированная в другой формат. В частности, идентификация устройств аналоговой звукозаписи производится на основе анализа импульсных сигналов включения и выключения режима записи магнитофонов, шума паузы, шума размагниченной ленты (т.е. шум, оставшийся после стирания), частоты тока высокочастотного подмагничивания, скоростных параметров лентопротяжного механизма, т.е. особенностей, присущих устройству, содержащихся на носителе-оригинале. Известны аналогичные методы идентификации плёночных фотокамер на основе особенностей границ кадрового окна, механизма перемотки плёнки и оптической системы), принтеров по особенностям методов и алгоритмов формирования изображений (растрирования), и различий в реализации струйно-капельных и лазерных методов печати. Идентифицированы могут быть также и устройства записи, использующие энергетические носители, например, устройства связи, в частности радиопередающие, по особенностям переходных процессов.
С распространением цифровых средств звуко- и видеозаписи произошло резкое увеличение плотности записи ввиду введения избыточности, связанной с необходимостью обнаружения и исправления ошибок. На практике при идентификации цифровых аудиозаписей и изображений наиболее частым является вариант предоставления идентифицируемых цифровых образов в файлах на внешних, по отношению к идентифицируемому устройству, носителях. Это приводит к полному отсутствию информации о физическом состоянии исходного носителя "оригинала" и сведений о файловой системе, и единственно возможными способами идентификации являются идентификация на основе особенностей форматов файлов (необходимо учитывать возможную автоматическую аппаратную либо- программную конвертацию данных при перезаписи из. устройства) и идентификация по отличительным признакам тракта записи и обработки.
В задаче защиты авторских прав, сигнал также имеет перечисленные особенности и, помимо этого, как правило хранится конвертированным в другой формат. Таким образом, в качестве идентифицирующих в данном случае доступны признаки, также содержащиеся только в цифровом потоке.
Самым известным аналогом такой защиты, в частности прав на медийную информацию, представленную в цифровом виде, является применение цифровых водяных знаков (ЦВЗ). Стойкие ЦВЗ представляют собой некоторую информацию встроенную в отсчёты маркируемого ими сигнала. ЦВЗ как правило содержат некоторый аутентичный код, информацию о собственнике либо управляющую информацию для средств воспроизведения и копирования. В отличие от обычных водяных знаков, ЦВЗ могут быть не только видимыми, но и (как правило) невидимыми, что объясняется тем, что по своей природе ЦВЗ являются искажением сигнала, который предназначен для восприятия человеком, и, следовательно, для сохранения потребительских качеств защищаемой аудиовизуальной продукции должны быть как можно менее заметны. "Невидимые" ЦВЗ анализируются специальным декодером, который выносит решение об их наличии, и при необходимости, извлекает скрытое сообщение. Наиболее подходящими объектами защиты при помощи ЦВЗ являются статичные изображения, файлы аудио- и видеоданных [1-3].
Обнаружение поворота изображения на основе преобразования Радона
На основе вышеизложенного- можно сформулировать следующую? последовательность этапов, выполняемых при формировании; очередного образа идентифицируемой, фотокамеры; и проведении; идентификации-изображений.
Получение; множества; изображений: с фотокамеры; формирующих выборку для- построения; отпечаткаі камеры. При этом должен соблюдаться принцип; равнозначности, т.еі-..если идентификации. будет подвергаться" изображение; полученное при;; пониженном разрешении,, то ис дляд формирования;, выборки необходимо использовать также: изображения-, полученные при пониженном? разрешении; При; невозможности выбора разрешений изображений;, с камеры либо при? формировании отпечатка, камеры, для-s учёта изображений; созданных с её: помощью, следует. использовать, изображения;в максимально- возможном, (нативном— native)» разрешении; Для формирования матрицы следует отдавать предпочтение; изображениям, содержащим минимальную площадь с ВЧ-составляющими; Наиболее подходящим вариантом являются«т.н; "серые кадры" — снимки равномерно освещенной однородной і, бёлот поверхности выполненные приёмамирепродукционной фотосъёмки. Все изображения после перевода во , входной формат должныиметь совпадающую;ориентацию.
Этап получения; отпечатка камеры, на; основе множества изображений с идентифицируемой фотокамеры отпечатка фотокамеры, пригодного для дальнейшей работы. Этап заключается в выделении из отпечатка ВЧ-составляющей при помощи НЧ-фильтра и её усреднении; по? всем отпечаткам из выборки, предназначенной для.формирования вектора: признаков;
Этап идентификации изображения по отпечатку камеры. На данном этапе выносится решение о единстве происхождения сформированного отпечатка; и камеры, с которой было получено анализируемое изображение. Формирование идентифицирующего, сканер набора признаков отличается- от формирования признаков для- идентификации цифровою фотокамеры. В- фотокамерах применяется двумерная светочувствительная , матрица, в. то время как в наиболее распространённых планшетных сканерах — линейка- светочувствительных элементов, механически перемещаемая вдоль изображения: Планшетные сканеры построены по принципу плоской развертки, при которой считываемый оригинал располагается1 на- плоском подвижном или неподвижном держателе и при сканировании осуществляется построчное считывание изображения. В качестве приемников в большинстве сканеров используются линейные ПЗС, на. которые объектив или линза проецирует изображение строки. Наиболее распространена схема, в. которой чувствительные к каждой цветовой компоненте элементы формируют три светочувствительные линейки. Таким образом, несмотря на то, что идентификация как сканеров, так и фотокамер производится на основе двумерных матриц яркости, идентифицирующие признаки сканера и фотокамеры существенно отличаются. Как показали проведённые исследования, построение образа неоднородностей аналогично применяемому для идентификации камер в целом неэффективно. Причиной этого является намного меньший уровень шумов в сигналах, снимаемых с ПЗС-линеек по сравнению с таковыми для ПЗС и КМОП матриц цифровых камер. Это объясняется тем, что практически всеми, моделями сканеров, перед сканированием, а зачастую и перед каждым черновым сканированием для просмотра изображения и выделения границ сканирования выполняется аппаратная калибровка светочувствительной линейки по калибровочной мишени. При помощи данной калибровки эффективно устраняются смещения точек черного и белого, подавляется виньетирование оптической системы сканера, неравномерность засветки лампой оригинала. Основной источник коррелированного шума, вносимого сканером в направлении движения сканирующей каретки — неоднородность элементов ПЗС- либо CIS-линейки, выражающиеся в повышенном уровне шума, отклонении цветового оттенка и т.д. В эту же категорию попадают искажения, вносимые неравномерностью засветки оригинала. Данные неоднородности проявляются в виде вертикальных линий, областей и т.д., соответствующих отдельным пикселям светочувствительной линейки. Источниками шума, вносимого сканером в направлении перпендикулярном движению сканирующей каретки, являются нестабильная интенсивность света лампы, неплотное прижатие оригинала к стеклу, наводки на электронные компоненты. Предъявляемым к идентификации требованиям, а именно идентификация, конкретного экземпляра сканера, удовлетворяет анализ неоднородностей светочувствительных линеек, т.е. анализ по первому классу признаков. Для сканеров изображений таковыми являются дефекты и неоднородности светочувствительных элементов линейки сканера, отклонения перемещения каретки сканера от линейного, неравномерность засветки и прижатия к стеклу оригинала и т.д.
Модель изображения, полученного при помощи сканера, таким образом можно представить в следующей форме. Пусть абсолютное количество фотонов, попадающее на площадь сенсора (пикселя) светочувствительной линейки в каждый момент времени соответствует X,, где / = 1../77, т — разрешение светочувствительной линейки в пикселях. Обозначив дробовой шум как r/l, аддитивный шум вследствие шумов чтения и т.д. как -,, темновые токи как с;. Тогда выходное значение сенсора уг может быть выражено в следующем виде: Значения ft очень близки к 1 и являются мультипликативным PRNU-"niyMOM", который в сканерах подавляется при калибровке, проходящей как во время включения, так и перед сканированием. Ввиду того, что светочувствительная линейка одномерна, а двумерное изображение восстанавливается при перемещении данной линейки вдоль направления сканирования, значения f. будут близки для пикселей одного и того же столбца (вдоль направления сканирования). Основное влияние не точность измерения оказывают непостоянство светового потока от лампы, работа механической части сканера, электромагнитные наводки. Таким образом, пиксельный столбец одного из основных цветов изображения несет информацию о светочувствительности соответствующего элемента линейки. Для формирования- оценки светочувствительности из каждого полноцветного немасштабированного изображения, полученного с идентифицируемого сканера, производилось выделение высокочастотной составляющей цветовых компонент при помощи фильтра Винера, аналогично фильтрации изображений с цифровых камер (п. 2.4.1.) с последующим усреднением по всем изображениям выборки, на которой строится отпечаток сканера:
Методика идентификации звуковых плат, основанная на стационарных составляющих
Для распознавания звуковых плат по их цифровому образу были использованы нейронные сети, а именно, многослойные персептроны [70-72]. Такой выбор обусловлен их универсальностью и высокой эффективностью при вычислениях. Персептроны решают, как и гауссовские смешанные модели, задачу аппроксимации многомерных функций, т.е. производят отображение F: х— у , для заданного набора векторов {х , у }. В зависимости от задачи, аппроксимация функций может принимать вид или классификации, шли регрессии [72]. Так, нейронные сети успешно применяют в задачах речевой обработки [73-75], в частности идентификации диктора [76-79, 87-92]. При разработке методики идентификации звуковой платы, нейронная сеть после обучения хранит параметры соответствующие данной звуковой платы, являясь, таким образом, ее моделью.
Использование персептронов позволяет разделить точки в многомерном пространстве на классы с помощью гиперплоскостей. Для создания нейронной сети использовался пакет MATLAB, позволяющий легко осуществить выбор архитектуры нейронной сети. Предварительно, до обучения сети необходимо произвести обычную в таких случаях предобработку входных данных, заключающаяся в нормировке входных данных с использованием операций, входящих в состав пакета. Данный пакет позволяет производить выбор не только архитектуры сети, но и выбирать функции активации нейронов, а также методов обучения сети. Основной проблемой является выбор числа нейронов в скрытых слоях персептрона. Согласно эмпирическим правилам, число нейронов в скрытых слоях сети должно быть соизмеримо с длиной входных векторов. Однако, оптимальное число нейронов подбирается экспериментально. Эксперименты, проведенные с нейронной сетью показали, что наилучшие результаты могут быть достигнуты при двух скрытых слоях с 50 нейронами в каждом слое. Выбор числа нейронов связан с тем обстоятельством, что при небольшом количестве нейронов ошибка обучения может быть недопустимо большой, а при чрезмерном количестве нейронов может наступить переобучение сети. Результатом такого переобучения может оказаться неспособность сети к обобщениям, т.е., при подаче на сеть векторов, не участвовавших в обучении, сеть их воспримет как ошибочные. Для эффективного распознавания было проведено экспериментальное исследование выбора оптимальной функции активации и функции обучения. На рисунке 3.23 показана структурная схема системы идентификации звуковых плат с использованием нейронных сетей.
В главе проведен анализ структуры цифровых микрофонов и звуковых плат. Анализ показал, что в качестве аналого-цифровых преобразователей используются сигма-дельта АЦП. Основными элементами, вносящими неоднородности в создаваемые цифровые данные, являются микрофонный усилитель и АЦП. Проведен анализ погрешностей элементов входящих в структуру АЦП. Были разработаны методы идентификации, цифровых микрофонов и плат.
В данной главе были решены следующие задачи: - проведен выбор окна для наилучшего спектрального разрешения записанного речевого сигнала; - проведен выбор методов обработки амплитудного спектра сигнала; - проведен анализ фазового спектра сигнала; - на основе анализа амплитудной и фазовой составляющих спектра проведен корреляционный анализ записанных сигналов от разных звукозаписывающих устройств и показана их зависимость от данных устройств; - проведен выбор устойчивых признаков для системы идентификации звуковых устройств в качестве которых были использован вектор, состоящий из кепстра и дельта-кепстра, длина вектора была выбрана равной 50, - предложены методики идентификации звуковых карт на основе нейронных сетей и смешанных гауссовских моделей; - определено число скрытых слоев нейронов в сети и выбрано их число; - для устранения изменения частоты дискретизации проводилось выравнивание по общим максимумам частотных элементов профилей микрофона и профиля, восстановленного из анализируемой записи, выравнивание производилось при помощи сдвига на величину смещения пика корреляционной функции профилей. В главах 2 и 3 было показано, что.между признаками, получаемыми при обработке цифровых данных изображения и акустического сигнала для данного устройства записи, как изображений (в данном случае фотоаппаратов и сканеров), так и звуковых данных (звуковых плат) имеется корреляция, что означает возможность идентификации устройств по полученным цифровым данным. Целью данной главы является проведение экспериментальных исследований с целью определения наиболее эффективных параметров данных моделей, позволяющих понизить процент ошибок при решении задачи идентификации. Для экспериментальных исследований? была выбрана среда вычислений MATLAB. Платформой для проведения исследования являлся IBM-совместимый компьютер со стандартной аппаратной конфигурацией на базе операционной системы Windows ХР.
Экспериментальные исследования задачи идентификации цифровых фотокамер
В главе была проведена разработка подсистемы идентификации звуковых карт по создаваемым ими цифровым данным. С этой целью были проведены экспериментальные исследования параметров данных моделей систем идентификации на основе гауссовской смешанной модели и нейросетевых методов для эффективного решения задачи их распознавания.
Для построения систем распознавания гауссовские смеси хорошо себя зарекомендовали в качестве стохастической модели. Во-первых, модели очень удобны для моделирования не только статистических характеристик голоса диктора, но и окружающей среды, канала звукозаписи. Во-вторых, смеси гауссовых моделей представляют собой удобный способ представления и интерпретации акустических событий речевого сигнала.
Альтернативной моделью является использование нейронных сетей. Преимуществом данного метода распознавания является их гибкость в настройке для данного типа звуковой платы, при этом позволяют в автоматическом режиме формировать разделяющие гиперплоскости; благодаря -использованию нелинейных активационных функций и при наличии достаточного количества скрытых слоев, они позволяют формировать, области решений более сложной формы, чем при использовании методов гауссовских смешанных моделей.
Кроме того, ответы системы построенные на основе гауссовских смешанных моделей дают, менее достоверные результаты-при тестировании и требуют большего числа контрпримеров чем нейронные сети, что важно, при-небольшом- количестве экспериментальных данных. Так, для методики идентификации, основанной на гауссовских смешанных моделях, средняя ошибка первого, рода составляет 0,14, а второго рода - 0,18, для методики идентификации, основанной на нейронных сетях, 0,0543- и 0,085, соответственно. Таким образом, выбор был сделан в пользу нейронных сетей, хотя в- некоторых случаях возможно использование гауссовских смешанных моделей.
При анализе результатов можно сделать следующие выводы. 1. Как показали, результаты тестирования длина анализируемых участков аудиоданных, используемых для вычисления векторов признаков слабо влияет на точность идентификации звуковых плат. Заметное снижение точности результатов наблюдается при длине анализируемого участка равном -25 мсек. 2. Длительность собственно звучания аудиоданных не должна быть меньше 7,5 сек. Таким образом, на основе полученных экспериментальных данных можно сделать заключение, что, наилучшая идентификация звуковых плат может быть достигнута при величине анализируемого участка равном 50-100 мсек и длительности звучания аудиосигнала не менее 10 сек. При этом средняя величина ошибки первого рода составила --5,4%, а второго рода -8,5%. Следует отметить полное отсутствие в открытой печати данных по идентификации звуковых плат. Предлагаемый способ определения угла поворота изображения на основе преобразования Радона позволяет установить неизвестный угол поворота в общем случае с точностью до 90, таким образом, для идентификации устройства по изображению с неизвестным углом поворота необходимо проведение идентификации по 4 вариантам изображения. Проведено экспериментальное исследование системы распознавания цифровых фотографических камер и сканеров на основе коррелированности пиксельных неоднородностей матрицы, одинаковых для всех считанных с неё кадров. Исследование показало, что можно по произвольным цифровым фотографическим изображениям и файлам с графической информацией проводить идентификацию камер и сканеров. В соответствии с поставленными целями и задачами, в результате проведенных исследований и разработок были получены следующие результаты. 1. Проведен обзор методов защиты авторских прав на основе цифровых водяных знаков. Применение ЦВЗ подразумевает использование вычислительных устройств- и специального программного обеспечения для встраивания и анализа. Во многих случаях, при создании цифровых мультимедийных данных встраивание ЦВЗ , средствами устройства реализовать невозможно, примерами таких устройств являются цифровые фотоаппараты и цифровые диктофоны. Метод водяных знаков также не позволяет идентифицировать устройство, на котором были созданы мультимедийные данные. Альтернативным методом является установление авторства путем анализа статистических закономерностей в цифровых данных, полученных с данного устройства. 2. Проанализирован подход к установлению авторства цифровых фотографий на основе статистических методов, проведен анализ получения цифровых образов аналоговых изображений при помощи цифровых фотокамер и сканеров. Показана необходимость модификации методик идентификации изображений для возможности идентификации сканеров. Для идентификации цифровых фотокамер была выбрана методика, опирающаяся на статистический метод, основанный на выделении ВЧ-структуры постоянных шумов матрицы при помощи фильтра Винера и усреднения множества изображений, заведомо полученных с идентифицируемой матрицы. Для идентификации цифровых сканеров предложенный статистический метод был модифицирован с учетом специфики процесса формирования изображений в сканерах. Обеспечение стойкости к атакам, заключающихся в повороте исходного изображения на малый угол достигается предложенным методом обнаружения угла поворота на основе преобразования Радона по максимумам проекций. 3. Разработаны- методики идентификации цифровых устройств записи аудиоинформации, а именно, цифровых микрофонов и звуковых плат персональных ЭВМ. Бьши проведены экспериментальные исследования параметров данных моделей для эффективного решения задачи их распознавания. Для устранения- изменения частоты дискретизации проводилось выравнивание по общим максимумам частотных элементов профилей микрофона Их профиля, восстановленного из анализируемой записи, выравнивание производилось при помощи сдвига на величину смещения пика корреляционной функции профилей. Проведен статистический анализ полученных данных и рассмотрены модели систем идентификации звуковых устройств записи.
Для создания методик идентификации звуковых карт были рассмотрены гауссовские смешанные модели, нейронные сети и стационарные спектральные составляющие. Для построения систем распознавания модели гауссовых смесей хорошо себя зарекомендовали в качестве стохастической модели. Во-первых, модели очень удобны для моделирования не только статистических характеристик голоса диктора, но и окружающей среды, канала звукозаписи. Во-вторых, смеси гауссовых моделей представляют собой удобный способ представления и интерпретации акустических событий речевого сигнала.