Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Экспертиза подлинности документов на основе компьютерных методов обработки информации Шарипов, Руслан Радикович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Шарипов, Руслан Радикович. Экспертиза подлинности документов на основе компьютерных методов обработки информации : диссертация ... кандидата технических наук : 05.13.01 / Шарипов Руслан Радикович; [Место защиты: Волгогр. гос. техн. ун-т].- Волгоград, 2011.- 215 с.: ил. РГБ ОД, 61 12-5/2803

Содержание к диссертации

Введение

Глава 1. Современные методы программного вмешательства в цифровые изображения 1п

1.1. Цифровая обработка сигналов 13

1.2. Распознавание текста 15

1.3. Применение Фурье и вейвлет-анализа в различных областях обработки сигналов 20

1.4. JPEG-компрессия и её отличительные особенности 34

1.5. Распознавание модифицированных цифровых изображений 37

1.6. Выводы -40

Глава 2. Методика выявления модифицированных изображений с помощью вейвлет-анализа 41

2.1. Обоснование необходимости разработки методики 41

2.1.1. JPEG-компрессия и JPEG-структура 41

2.1.2. Практическое использование JPG-формата и явление JPEG-структуры 43

2.2. Выявление JPEG-структуры и описание методики выявления 48

2.2.1. Структура вейвлет-разложения сигнала 48

2.2.2. Вейвлет-преобразования дискретных сигналов 50

2.2.3. Вейвлет-преобразования конечных сигналов 52

2.2.4. Вейвлет-преобразования двумерных сигналов 53

2.2.5. Преобразование Хаара и его оригинальная модификация..54

2.3. Алгоритм определения аутентичности изображения с помощью вейвлет-преобразования 59

2.4. Выводы 66

Глава 3. Разработка методики идентификации целостности цифровых изображений с использованием Фурье-анализа 67

3.1. Обоснование необходимости разработки методики 67

3.2. Описание методики 71

3.3. Алгоритм определения аутентичности изображения с помощью преобразования Фурье 75

3.4. Выводы 85

Глава 4. Методики определения подлинности изображения с помощью цветоанализа и особенностей программного пакета Photoshop 86

4.1. Обоснование необходимости разработки методики на основе цветоанализа и описание этой методики 86

4.2. Алгоритм определения аутентичности изображения с помощью цветоанализа "

4.3. Обоснование необходимости разработки методики на основе особенностей программного пакета Photoshop и описание этой методики 4

4.4. Выводы -102

Основные результаты работы i"- Библиографический список

Введение к работе

Актуальность. Ещё в середине XX века обработка изображений была по большей части аналоговой и выполнялась оптическими устройствами. В связи с появлением компьютеров и резким ростом их производительности, эти методы вытеснялись методами цифровой обработки изображений. Цифровое изображение представляет собой числовую матрицу, набор кодов, которые можно хранить, передавать и обрабатывать самыми различными способами. Вмешательство в эти матрицы производятся с самыми разнообразными целями, как научными и практически значимыми, так и незаконными. Имея коды пикселей изображения можно решать проблемы восстановления информации, стеганографии, и т.д. Также можно решать задачу установления достоверности графической информации. С развитием цифровых технологий, а также благодаря разнообразному инструментарию программ, предназначенных для обработки цифровых изображений, осуществлять графическую фальсификацию стало гораздо проще. А это, в свою очередь, порождает необходимость в разработке новых методик выявления изменений, искусственно вносимых в изображения, с применением цифровой обработки информации. Задача выявления модифицированных изображений все явственнее переходит из категории перспективных в категорию актуальных, в первую очередь, для экспертной и оперативно-розыскной деятельности. Многие современные разработки, касающиеся подлинности документов, связаны с использованием электронной подписи документов при организации системы электронного документооборота и повышением эффективности работы хранилищ электронных документов. Такими разработками занимались В. Столлингс, Л. Клейнрок, Я.А. Коган, Н. Томас, В.М. Вишневский, Г.П. Башарин, Б.Я. Советов, B.C. Лукьянов, и др. Специалистами компании Xerox и Университета Рочестера разработан метод незаметной вставки информации без повреждения оригинала, названный обратимым сокрытием данных, предназначенный для защиты подлинности документов, позволяющий

впоследствии отследить, было ли изображение отредактировано. Однако данные методы предназначены для того, чтобы заранее обезопасить документы, и не могут быть использованы для определения подлинности документов, не имеющих электронной подписи и не защищенных с помощью обратимого сокрытия данных. Существуют методы выявления подделок, основанные на анализе EXIF-данных. Однако у этих методов есть два существенных недостатка. Первый - данные методы позволяют сделать вывод лишь о том, что изображение редактировалось, не имея возможности определить область редактирования и характер модификации изображения. Второй недостаток - доступность программного обеспечения для редактирования EXIF-данных с целью исправления автоматически изменённой в процессе обработки изображения информации. Существуют также методы, основанные на анализе матрицы числовых значений яркостей пикселей цифрового изображения. Подобными разработками занимались А.С. Попеску, X. Фарид, М.К. Джонсон, их исследования базируются на анализе освещённости объектов на цифровом изображении и на анализе результатов передискретизации изображения, что ограничивает область применения методов. Также отсутствует возможность при обнаружении фальсификации локализовать ее область. Возможностью локализации области модификации обладают методы, основанные на выявлении результатов элементарных операций обработки изображения, используемых при его фальсификации, таких как клонирование, масштабирование, поворот, сглаживание и т.д. (С. Брайам, Б. Санкур, Н. Мемон, Е.Ю. Лебедева, Ю.Ф. Лебедев). Недостатки этих методов очевидны - узкая область применения каждого из них, и невозможность определения одного из самых распространённых способов модификации - вставки в цифровое изображение объекта из стороннего цифрового изображения. Таким образом, решаемые в диссертационной работе задачи разработки новых методик установления подлинности цифровых изображений документов при проведении их экспертизы являются важными и актуальными.

Цель: повышение точности при оценке подлинности документов путём компьютерного анализа их цифрового изображения.

Для достижения поставленной цели необходимо решить следующие основные задачи:

1. Проанализировать существующие способы программного
вмешательства в цифровое изображение и известные пути выявления
программного вмешательства в цифровое изображение, связанные с
установлением его подлинности и достоверности.

2. Разработать новые методики установления подлинности и
достоверности изображений при проведении их компьютерной экспертизы.

3. Разработать алгоритмы и программное обеспечение для реализации
разработанных методик экспертизы цифровых изображений документов.

Объектом исследования является цифровое изображение документа.

Предметом исследования являются свойства цифровых фотографических изображений документов, конкретно - их целостность.

Методы исследования. Проведённые теоретические и прикладные исследования базируются на известных современных математических аппаратах, таких как вейвлет-анализ и Фурье-анализ, модифицированные автором для решения поставленных задач. Также в работе используются математические подходы использования цветоанализа и особенности обработки и компрессии графической информации.

Научная новизна.

Предложен новый подход выявления искусственного искажения документов, включающий в себя:

методику выявления искусственного искажения (подделки) документов для случая вставки большого размера (больше периода JPEG-структуры) с применением вейвлет - преобразования и алгоритм его реализации;

методику идентификации целостности цифрового изображения для случая вставки малого размера (соизмеримой или меньше периода

JPEG-структуры) с применением преобразования Фурье, и алгоритм его реализации;

методику использования цветоанализа, позволяющую выявить вставки в цифровое изображение, с отличными от общего фона коэффициентами сжатия на цветном изображении и алгоритм его реализации;

методику использования особенностей программного пакета Photoshop для установления целостности цифрового изображения.

Практическая значимость результатов диссертационной работы обусловлена созданием новых методик определения аутентичности цифровых изображений разных типов. Разработанные методики программно реализованы и позволяют пользователю производить экспертизу цифровых изображений, используя только персональный компьютер и установленное на нём разработанное программное обеспечение.

Полученные в диссертационной работе результаты внедрены в учебный процесс физико-технического института ВолГУ для обучения студентов по специальности 350600 «Судебная экспертиза» по дисциплине «Спецпрактикум» с 01.09.2008. Они также используется в производственном процессе группы кадров ФБУ МЦИТО ФСИН России (г. Волгоград) с 01.10.2009 г. при установлении целостности цифровых фотографических изображений. Полученные результаты приняты для использования в служебной деятельности ЭКЦ ГУВД по Волгоградской области при проведении компьютерных экспертиз, для установления подлинности цифровых графических изображений с 20.08.2010 г., что подтверждено актами внедрения.

Достоверность. Достоверность научных положений и теоретических выводов, полученных в диссертации, подтверждена результатами практического использования разработанных в диссертации математических, алгоритмических и программных средств. Также достоверность полученных результатов подтверждается тем, что успешно применялись две и более

разработанных методики для выявления модификаций одного и того же цифрового изображения.

Основные положения, выносимые на защиту.

1. Методика выявления искусственной модификации (подделки)
цифровых изображений документов с применением вейвлет-преобразования
и алгоритм его реализации.

2. Методика идентификации целостности цифрового изображения с
применением преобразования Фурье и алгоритм его реализации.

3. Методики цветоанализа и использования особенностей
программного пакета Photoshop для установления целостности цифровых
изображений.

Апробация работы. Основные результаты работы докладывались и обсуждались на следующих симпозиумах, форумах, конференциях и семинарах: 15-й Всероссийской межвузовской научно-технической конференции студентов и аспирантов «Микроэлектроника и информатика -2008» (Зеленоград-2008), XV международной конференции «Математика. Компьютер. Образование» (Дубна-2008), XVII международной научной конференции «Лазерно-информационные технологии в медицине, биологии и геоэкологии - 2009» (Новороссийск-2009), 19-й международной конференции «Лазеры. Измерения. Информация - 2009» (Санкт-Петербург-2009), Международной конференции «Информационные технологии в образовании, технике и медицине» (Волгоград-2009), Международной научной конференции с элементами научной школы для молодёжи «Электронная культура. Информационные технологии будущего и современное электронное обучение Modern IT & (Е-) Learning» (Астрахань-2009), XIV региональной конференции молодых исследователей Волгоградской области (Волгоград-2009), Международной научной конференции «Инновационные технологии в управлении, образовании, промышленности «АСТИНТЕХ-2010» (Астрахань-2010), IX международной конференции «Оптико-электронные приборы и устройства в системах

распознавания образов, обработки изображений и символьной информации. Распознавание - 2010» (Курск-2010), на семинарах кафедр электротехники и экспериментальной физики ВолгГТУ, кафедры судебной экспертизы и физического материаловедения ВолГУ.

Публикации. По теме диссертации автором опубликована 21 работа, из них 2 в журналах, рекомендуемых ВАК, и 4 свидетельства о государственной регистрации.

Применение Фурье и вейвлет-анализа в различных областях обработки сигналов

Реализованные компанией Cognitive Technologies в системе CuneiForm самообучающиеся алгоритмы представляют собой метод, основанный на комбинации двух видов алгоритмов распознавания печатных символов: шрифтового (multifont) и шрифтонезависимого (omnifont). Система способна самостоятельно обучаться и распознавать плохо пропечатанные символы с помощью шрифта, созданного на основе достаточно хорошо пропечатанных символов. Если при распознавании низкокачественных документов традиционными методами система оптического распознавания символов дает ПРОЦЄНТ ошибок больше порогового, то производится дораспознавание текста с использованием адаптивных алгоритмов.

Для распознавания текстов низкого качества компанией ABBYY были разработаны структурные алгоритмы распознавания, которые подразумевают, что программа хранит информацию не о поточечном написании символа, а о наличии в нем структурных элементов (колец, дуг, отрезков и точек). Изображение символа приводится к контуру, на котором анализируются наличия пересечений линий, вычисляются углы, размеры дуг и т.д. Этот метод позволяет выделять элементы на искаженных изображениях, то есть осуществлять распознавание при практически неограниченной изменчивости символа [43].

Обычно разработчики OCR-программ, используемых для распознавания текста, используют в качестве основного только один алгоритм распознавания. Применение нескольких алгоритмов одновременно значительно увеличивает время распознавания и создает ряд других сложностей. Однако следует учитывать, что на текстах хорошего качества лучше работают одни алгоритмы, а на текстах плохого качества — другие. Для распознавания же табличных форм удобнее использовать третьи и т.д.

В OCR CuneiForm 2000 впервые удалось использовать совокупность алгоритмов, значительно повышающих точность и скорость распознавания. Экспертная система, встроенная внутрь ядра распознавания, сама выбирает оптимальный для данного текста алгоритм (метод «когнитивного анализа») [44, 89, 145]. Для обеспечения высокой точности распознавания документа от программного обеспечения (ПО) требуется «распознавание с пониманием», то есть программа должна не только учитывать то, что показано на изображении, но и то, что от изображения ожидается. Вслед за задачей распознавания текста возникает задача распознавания форматирования документа. Программа должна «понимать», что текст может быть расположен в несколько колонок, снабжен иллюстрациями и т.д. Например, человек, просматривающий таблицу, в которой даже не проведены границы и не обозначены ячейки, все равно читает ее текст как табличный. Для программы же все эти правила должны быть формализованы.

Отдельной задачей является распознавание форм. Ее решение позволяет оптимизировать ввод текста с форм с так называемым рукопечатным заполнением. Здесь перед программой возникают две дополнительные задачи: первая — распознать рукопечатный символ (символ, написанный от руки печатными буквами), а это значит, что необходимо «узнать» символ, несмотря на возможные его отклонения, присущие почерку человека; вторая — распознать, к какому полю относится данная запись, то есть где, например, имя платилыцика, где номер его банковского счета и т.д. Обычно результатом распознавания такой программы становится не текст, а определенная запись в соответствующем поле базы данных. Данная технология позволяет оптимизировать ввод сотен и тысяч бюллетеней и бланков и существенно сэкономить время [45, 58].

Точное распознавание латинских символов в печатном тексте в настоящее время возможно только если доступны чёткие изображения, такие как сканированные печатные документы. Точность при такой постановке задачи превышает 99%, абсолютная точность может быть достигнута только путем последующего редактирования человеком. Проблемы распознавания рукописного «печатного» и стандартного рукописного текста, а также печатных текстов других форматов (особенно с очень большим числом символов) в настоящее время являются предметом активных исследований [44].

Распознавание символов он-лайн иногда путают с оптическим распознавания символов. Последний — это офф-лайн метод, работающий со статической формой представления текста, в то время как он-лайн распознавание символов учитывает движения во время письма. Например, в он-лайн распознавании, использующем РenPoint OS или планшетный ПК, можно определить, с какой стороны пишется строка: справа налево или слева направо [44-45]. Он-лайн системы для распознавания рукописного текста «на лету» в последнее время стали широко известны в качестве коммерческих ШЭОДVKTOB. Алгоритмы таких устройств используют тот факт, что порядок, скорость и направление отдельных участков линий ввода известны. Кроме того, пользователь научится использовать только конкретные формы письма. Эти методы не могут быть использованы в программном обеспечении, которое использует сканированные бумажные документы, поэтому проблема распознавания и экспертизы рукописного «печатного» текста по-прежнему остается открытой. На изображениях с рукописным «печатным» текстом без артефактов может быть достигнута точность в 80% - 90%, но с такой точностью изображение будет преобразовано с десятками ошибок на странице. Такая технология может быть полезна лишь в очень ограниченном числе приложений [45].

JPEG-компрессия и JPEG-структура

Идея JPEG-компрессии проста: изображение по специальному алгоритму разбивается на блоки, к которым в дальнейшем применяется дискретное косинусное преобразование. При этом в зависимости от выбранного качества наименее значимые с точки зрения алгоритма цвета убираются (или подменяются более значимыми в этом блоке), что позволяет значительно уменьшить объем хранимой информации. Данный алгоритм ХОРОШО себя проявляет на красочных, многоцветных фотографиях, и отвратительно на рисунках, использующих небольшой набор цветов, так как в последнем случае даже при малом коэффициенте сжатия имеет место пренебрежение значимыми (различимыми глазом) цветами и подмена их другими цветами, а, следовательно, сильно ухудшается качество. Практически вся современная фотоаппаратура сохраняет изображения в этом формате, так как при фиксировании изображения матрицей фотоаппарата получается большой набор цветов, а затем к этому набору применяется JPEG-компрессия (наименее значимые цвета подменяются более значимыми, что практически не влияет на визуальное восприятие). Следовательно, JPG-формат выгоден для хранения реальных снимков.

При вейвлет - анализе изображения, когда-либо кодированного в JPG-формате, проявляется так называемая JPEG-структура. JPEG-структура возникает вследствие особенностей JPEG-компрессии. Она образована разностями значений яркости соседних пикселей. Имеет клеточную

Период JPEG-структуры (размеры клеток) величина не постоянная и зависит от конкретного изображения. JPEG-структура - это абсолютно новое понятие, поэтому ниже прилагается ее подробное описание. При сохранении изображения в JPG-формате, оно обрабатывается по блокам. Естественно предположить, что при определённой обработке изображения эти блоки можно выявить. В некоторых изображениях, содержащих до JPEG-компрессии плавные переходы яркости и цвета, и сохранённых в плохом качестве с высоким коэффициентом сжатия, эти блоки можно увидеть невооружённым глазом. Пример такого изображения представлен на рисунке 10.

Эти блоки могут быть выявлены при помощи каких-либо методов обработки изображения. На рисунках 11 и 12 представлены фотографии самолета над лесом, которая в своё время была подвергнута JPEG-компрессии и результат программной обработки этого изображения, случайно выявившей блоки изображения, показанные на рисунке 12 квадратиками.

В данной работе эти блоки выявляются при помощи модифицированного вейвлет-преобразования с использованием вейвлета Хаара. При вейвлет-анализе изображения, когда-либо кодированного в JPG-формат, проявляется JPEG-структура. Рисунок 13. Синтезированное изображение, не подвергавшееся JPEG-компрессии (слева) и его JPEG-структура (справа)

На рисунках приведены исходные синтезированные изображения и их JPEG-структуры, проявившиеся в ходе работы разработанной и программно реализованной в данной главе методики. Свидетельство о государственной регистрации и акт о внедрении представлен в Приложении I.

JPEG-структура - характеристика дифференциальная, поскольку определяется не самими яркостями элементов изображения, а их перепадами. В исходном изображении она присутствует, но неявно. У всех изображений JPEG-структуры в той или иной степени различны (если не рассматривать малоинформативные однотонные поля, у которых все перепады яркости нулевые и она просто вырождается). Эта неповторимость свидетельствует в целесообразности использования JPEG-структур на предмет идентификации, как самого цифрового изображения, так и его целостности. Составляющие ее клетки могут быть в той или иной мере заполнены, могут быть совсем пусты, а могут быть даже и не до конца прорисованы (в пределе, при вьгоождении JPEG-структуры ее клетки вообще не прорисовываются). Степень заполнения и прорисовки клеток сильно зависит от показателя качества, выбранного при первичном преобразовании файла с изображением в формат JPG. Линии, образующие JPEG-структуру, пронизывают все поле изображения без изгибов и смещений. Единственное их искажение, проявляющееся в виде разрывов, при конечности последних не мешает визуальному восприятию связности JPEG-структуры. Нарушение связности JPEG-структуры позволяет сделать категорический вывод об имевшем место вмешательстве в изображения.

Если рассматривать изображение, как систему, то JPEG-структура является неотъемлемым составным элементом этой системы - изображение без нее не побывало в формате JPG. В размерном плане клетки, образующие JPEG-структуру, несоизмеримы с изображением, и в то же время сама JPEG-структура порождается свойствами пикселей - элементов еще более мелкомасштабных по отношению к ее клеткам.

JPEG-структура, однажды обретенная изображением, не может ни потеряться ни исказиться при переводе файла из JPG в любой другой графический формат. Её можно каким либо образом изменить или уничтожить только вместе с самим изображением.

Алгоритм определения аутентичности изображения с помощью преобразования Фурье

Как видим, для изображений с модификацией такого рода использование методики, описанной в первой главе, не приводит к положительному результату. Для этих целей необходима разработка другой, принципиально отличающейся методики, которая позволит определить изменение даже одного пикселя.

Как правило, подделки такого рода встречаются среди отсканированных документов, которые всё чаще пересылают по электронной почте для подтверждения каких-либо действий, возможно связанных с финансовыми расчётами. В подтверждение особой актуальности данного направления уместно привести весьма компактный, но ёмкий тезис из работы известного криминалиста «Зачем взламывать сейф, когда можно получить его содержимое одним грамотным росчерком пера» [112].

Данная методика основана на различии числовой записи фрагментов изображения, сохраненных в формате JPG с разным уровнем компрессии, или вообще в разных форматах программной графики. Пример изображения, большей частью подвергнутого JPEG-компрессии, представлен на рисунке

При JPEG-компрессии изображение обрабатывается по блокам 8x8 пикселей. Каждый блок изображения сжимается отдельно. В процессе JPEG-компрессии каждый блок изображения подвергается преобразованию Фурье, результатом которого является матрица коэффициентов. Пример матриц коэффициентов нескольких блоков изображения представлен на табл. 1.

В получившейся матрице коэффициентов низкочастотные компоненты расположены ближе к левому верхнему углу, а высокочастотные - справа и внизу [113, 122, 124]. Это важно потому, что большинство графических образов на экране компьютера состоит из низкочастотной информации. Высокочастотными компонентами жертвуют при передаче изображения. В этой матрице коэффициентов (в зависимости от выбранного коэффициента сжатия) часть коэффициентов зануляется. Таким образом, при использовании дискретного косинусного преобразования мо жно определить, какую часть информации можно безболезненно выбросить, не внося серьезных искажений в картинку. Тем самым, за счёт потери незначительной информации, достигается высокий коэффициент сжатия изображения [82, 85 88,113,144].

Выделенный на рисунке 28 фрагмент состоит из 9 блоков, часть из которых была подвержены JPEG-компрессии. Правые верхние 4 блока не подвергались JPEG-компрессии, в отличие от остальных блоков в рассматриваемом фрагменте изображения. Ниже приведена таблица, на которой показаны матрицы коэффициентов для данных блоков [113-117].

Как видно из таблицы, в матрицах коэффициентов тех блоков, которые подвергались JPEG-компрессии, намного больше нулей (среди тех значений, которые соответствуют высоким частотам). Именно это (количество нулей в блоке) и служит идентификационным признаком наличия в одном и том же изображении блоков, сохранённых в JPEG-формате (больше нулей) и блоков, которые в этом формате не сохранялись (меньше нулей) [127-128]. Последовательное считывание и сравнение числовых записей по полю исследуемого изображения позволяет судить о наличии вставки [114, 116].

Конечно, блок изображения может оказатьея таким, что и без JPEG-компрессии будет еодержать в еебе такое количеетво нулевых коэффициентов, которое еодержитея в первом етолбце и первой етроке табл. 1. Однако, в еоответетвии е теорией вероятноети (учитывая количеетво значений, которые может принимать один элемент матрицы и количеетво таких элементов), вероятноеть этого много меньше еотой доли.

На риеунке 23 было предетавлено изображение еканированного документа, к которому не удалоеь уепешно применить методику, реализующую вейвлет-анализ. Применяя к этому же изображению методику Фурье-анализа, получаем еледующие результаты (риеунок 29).

Обоснование необходимости разработки методики на основе особенностей программного пакета Photoshop и описание этой методики

В процессе обработки изображение: редактировалось; редактировалось и возвращалось к исходному виду; не редактировалось. Таким образом, под обработкой понималась, как минимум, пара процедур - открытие и сохранение файла. При обработке исходный PNG-формат файла: не менялся; менялся, например, на RAW, TIF, PDF, PSD, ..., одним словом, на все возможные, которые имеются в распоряжении пользователя Photoshop. В этом случае последнее в череде преобразований сохранение файла возвращало его в исходный формат.

Оригинальной программой файл PNG-формата из первой или второй группы конвертировался в числовые матрицы (R-матрица, G-матрица и В-матрица). Пример этого преобразования показан на рисунках 38 и 39. По очевидным соображениям пример здесь, естественно, модельный. Изображение выбрано черно-белое, а для такового RGB-матрицы идентичны, и нет смысла приводить здесь все три. Цифры в первой строке матрицы -ширина и высота изображения, выраженные в пикселях, - информация служебная (упомянутый конвертер в составе многофункционального пакета программных модулей был написан задолго до постановки задачи настоящего исследования и сейчас используется в учебном процессе физического факультета ВолГУ при подготовке экспертов-криминалистов по специальности 030502).

Далее использовался простейший инструмент Windows, Total или Norton Commander или специальная программа. Объектом исследования являлся массив цветовых координат в числовых матрицах. В процессе исследования было выявлено, что любая обработка исходного файла в Photoshop привносит в изображение следующий артефакт. Цветовые координаты, не превышающие середину динамического диапазона (32767), округляются до ближайших четных значений. Цветовые координаты, превышающие это значение - до ближайших нечетных. Установленный артефакт иллюстрируется сравнением матриц на рисунках 39 и 40.

Этот артефакт невозможно заметить, рассматривая обработанное изображение невооружённым глазом (человеческий глаз позволяет различить в лучшем случае в 200-300 раз большие изменения), он может быть выявлен только при анализе числовой матрицы. Поэтому на рисунках приведена только матрица, а не само обработанное в Photoshop изображение. Таким образом, обнаружение данного артефакта в любой из матриц цифрового фотографического изображения даёт основание полагать, что оно подвергалось воздействию средств Photoshop, и наоборот.

Необходимо особо подчеркнуть, что при проведении исследования изображения по описанному выше алгоритму рассматривается только графическое наполнение файла, а не его служебные (EXIF) данные. Последних, вообще говоря, у файла может и не оказаться, особенно в тех случаях, когда: 1) цифровая фотография сделана, к примеру, случайным свидетелем, а не профессиональным экспертом; 2) ее происхождение не установлено. Выявленный артефакт имеет объективный характер, так как изученный признак воздействия на файл необратим, и достоверен, ибо не связан с широко доступной возможностью редактирования EXIF. Цифровое фотографическое изображение по своей природе стохастично. Это значит, что теоретически такая ситуация, когда и без вмешательства Photoshop все малые цветовые координаты - четные, а большие - нечетные, не может быть исключена. Как следствие, чтобы иметь право использовать найденный артефакт, требуется оценить его неоднозначность. Мы посчитали ее, как вероятность сфотографировать такой объект, изображение которого и без какой либо обработки удовлетворяет артефакту. По теории вероятности такая вероятность определяется выражением; где Уг - вероятность того, что цветовая координата любого пикселя примет четное/нечетное значение, 3 - число цветовых координат, N - число пикселей в исследуемом изображении. Очевидно, что уже при 100 пикселях (это много меньше размера ПЗС-матрицы в камере самого дешевого мобильного телефона и намного ниже наихудших характеристик простейшего сканера) вероятность ошибки идентификации артефакта пренебрежимо мала.

Исследуя происхождение артефакта, мы пришли к заключению, что следует говорить не об особенностях формата PNG, как такового, а об особенностях функционирования программного пакета Photoshop в целом. Таким образом, мы имеем веские основания полагать, что выявленный артефакт отнюдь не ограничен предметной областью цифровых изображений в формате PNG, а распространяется на все 48-битные форматы растровой графики. Но чтобы избежать обвинений в покушении на патентованные форматы, мы декодировали только открытый формат PNG (для последующего построения программы идентификации Photoshop-воздействия на файл). Как проведенные числовые оценки, так и изложенные соображения позволяют сделать однозначный вывод об устойчивости выявленного артефакта. Упомянутая выше специальная программа, изначально разработанная для решения сугубо исследовательской задачи, была позднее трансформирована в оригинальный программный продукт, сориентированный на уровень подготовки штатного эксперта. Он реализован в среде Microsoft Visual Studio. Имеется возможность обрабатывать изображения размерами 10000x10000 пикселей, - исследование такого файла занимает менее 2 мин. Инсталляция пяти-мегабайтного программного продукта (Windows ХР, Windows Vista, Windows 7) занимает 30 сек, -остальные системные требования несущественны. Особая функциональная возможность программы - оценка вероятности неоднозначности вывода применительно к исследуемому изображению [119].

Похожие диссертации на Экспертиза подлинности документов на основе компьютерных методов обработки информации