Содержание к диссертации
Введение
1. Исследование и анализ существующих методов стеганографии 11
1.1 Терминология современной стеганографии 12
1.2 Модели стеганографических систем 14
1.3 Методы стеганографии 23
1.3.1 Методы замены наименее значимых бит (НЗБ) 23
1.3.2 Методы расширения спектра 27
1.4 Классификация методов стеганографии 28
1.5 Методы стегоанализа 30
1.5.1 Стегоанализ на основе классификации статистик 31
1.5.2 Стегоанализ на основе классификации распределений 35
1.5.3 Стегоанализ на основе статистик бинарного представления 35
1.5.4 Разностный стегоанализ на основе палитры 38
1.5.5 Разностный стегоанализ на основе двойной статистики (RS-стегоанализ) 40
1.5.6 Стегоанализ модифицированного НЗБ-метода встраивания 42
1.5.7 Стегоанализ на основе восстановленной гистограммы 43
1.5.8 Стегоанализ как задача оценки артефактов компрессии 44
1.6 Недостатки методов специализированного стегоанализа 46
1.7 Выводы 47
2. Разработка модели стегоконтейнера на основе кратномасштабного представления
49
2.1 Структура системы универсального стегоанализа 49
2.2 Необходимые свойства псевдометрик контейнера в задачах стегоанализа 53
2.3 Выбор преобразования для построения псевдометрик контейнера 59
2.4 Формирование векторов признаков на основе вейвлет-преобразования 68
2.5 Выбор базисного вейвлета при формировании вектора признаков 78
2.6 Выбор дерева вейвлет-декомпозиции при формировании вектора признаков 81
2.7 Обработка признаков в методах универсального стегоанализа 85
2.7.1 Понижение размерности векторов признаков 86
2.7.2 Методы классификации векторов признаков 87
2.7.3 Классификатор на основе линейной регрессии 89
2.7.4 Классификатор на основе нейросетей радиальных базисных функций (RBF) 90
2.7.5 Классификатор на основе нейросетей прямого распространения 94
2.8 Выводы 94
3. Разработка методов универсального стегоанализа 96
3.1 Обобщённая структура универсального стеганографического метода 96
3.2 Выбор унифицированного формата контейнеров стегосистемы 99
3.3 Метод порогового стегоанализа контейнеров-изображений 102
3.4 Метод количественного стегоанализа контейнеров-изображений 111
3.5 Метод порогового стегоанализа контейнеров-аудиосигналов 113
3.6 Выводы 115
4. Разработка и экспериментальное исследование системы обнаружения встроенных сообщений на основе разработанных методов стегоанализа 116
4.1 Разработка программной модели универсального метода стегоанализа 116
4.2 Экспериментальные исследования универсальных стеганографических методов 119
4.2.1 Метод порогового стегоанализа контейнеров аудиосигналов 119
4.2.2 Метод порогового стегоанализа контейнеров изображений 122
4.2.3 Метод количественного стегоанализа изображений 127
4.3 Выводы 128
Заключение 129
Список использованных источников
- Методы замены наименее значимых бит (НЗБ)
- Необходимые свойства псевдометрик контейнера в задачах стегоанализа
- Выбор унифицированного формата контейнеров стегосистемы
- Экспериментальные исследования универсальных стеганографических методов
Введение к работе
Актуальность.
С развитием информационных технологий и переводом основных потоков информации, в цифровую форму приобрела актуальность проблема обеспечения информационной безопасности. При этом единственным выходом для сохранения конфиденциальности и целостности информации является создание комплексной системы защиты информации. Важную роль в обеспечении информационной безопасности играет подсистема управления доступом. Однако стандартные методы и средства контроля информации на настоящий момент ориентированы на проверку лишь ограниченного числа явных атрибутов и современные средства сокрытия информации — цифровой стеганографии позволяют преодолевать существующие системы контроля доступа к сетевым ресурсам. Скрытые каналы передачи информации позволяют преодолеть ограничения стандартных средств контроля трафика. Информация может быть скрыта в любом формате данных, который разрешён к передаче данным пользователем во внешнюю сеть, в том числе в определённых полях сетевых пакетов, запрашиваемых ссылках и иных объектах. В качестве носителя скрытой информации в цифровой стеганографии могут быть использованы оцифрованные аналоговые сигналы, тексты документов, исполнимый код, пакеты сетевого трафика и т.д. с сохранением семантики. Таким образом, принципиально возможна организация скрытых каналов утечки при наличии любой избыточности в исходящем трафике. Применение стеганографических средств для сокрытия информации в файлах, передаваемых затем на сайты мультимедиа-контента и файлообменные серверы позволяет скрытно организовывать и координировать проведение различного рода противоправных действий. При получении доступа организованными преступными группировками к передающим средствам сотовой и
стационарной телефонной связи, спутниковым каналам связи, телевидения и радиовещания возможна организация скрытых каналов передачи информации глобальных масштабов. В этих условиях особенно актуальной становится задача обнаружения скрытой информации, её извлечения и уничтожения, а также анализ стойкости существующих стеганографических алгоритмов, и разработка новых методов выявления скрытой информации — стегоанализ.
В зависимости от поставленных при разработке стегоаналитической системы задач и имеющихся ресурсов могут быть использованы методы как пассивного (анализ на наличие скрытой информации), так и активного (изменение потенциальных контейнеров с целью модификации либо уничтожения скрытой информации) стегоанализа. Применение методов активного стегоанализа в большинстве случаев нежелательно, вследствие тривиальности выявления их использования и возможности разработки мер адаптивного противодействия.
Большинство широко известных на настоящий момент пассивных методов стегоанализа можно разделить на два класса — методы статистического стегоанализа и методы так называемого универсального или "слепого" стегоанализа. Методы статистического стегоанализа ориентированы на работу в области цифрового представления данных и, при условии принадлежности анализируемых контейнеров к классу, для которого была построена модель, являются априорно надёжными. Главным преимуществом стегоаналитического подхода на основе анализа статистик является низкая требовательность к вычислительным ресурсам и простота предварительного обучения, сводящегося обычно к определению пороговой величины на репрезентативной выборке контейнеров. Однако практическое применение методов ограничивается средней и низкой чувствительностью (для порога обнаружения типичны значения 30-50% от максимальной степени заполнения контейнера). Существенными недостатками методов данной группы являются зависимость от формата представления контейнера,
что при отсутствии спецификации формата делает их применение малоэффективным, так как искажения, возникшие вследствие встраивания информации с сжатые форматы, расположены на макроуровне и распределены по частотным диапазонам, в то время как пространственно-временная область является их суперпозицией и не обнаруживает значимых отклонений. К числу существенных недостатков методов относится также малая стойкость к атакам противодействия вследствие существования аналитического описания. В частности, возможна разработка метода стеганографии, ориентированного на эффективное преодоление конкретного метода либо группы методов стегоанализа.
Для преодоления вышеперечисленных недостатков
специализированных методов в настоящее время ведутся интенсивные разработки в области универсальных методов стегоанализа, основанных на многокритериальном анализе метрик. Основу методов универсального стегоанализа составляет нахождение для анализируемого контейнера значений набора метрик разной контекстной зависимости, формирование многомерного вектор признаков и последующая его классификация. Различают две группы методов универсального стегоанализа: пороговый и количественный. При проведении порогового стегоанализа классификатором определяется принадлежность вектора признаков к одному из классов контейнеров соответственно наличию скрытой информации в то время как результатом количественного стегоанализа является оценка объёма скрытой информации. Главным преимуществом универсальных методов стегоанализа является возможность простой адаптации, основанной на переобучении классификатора на новые алгоритмы встраивания и форматы контейнеров без необходимости разработки их явных моделей. При этом особенностью методов универсального стегоанализа является их адаптируемость к методам
Для охвата максимального количества признаков в число метрик могут быть включены как инструментальные метрики, так и метрики, построенные с учётом психофизиологических особенностей восприятия человека. Анализ
изменений метрик производится в частотных субполосах на основе преобразований пространственно-временного представления контейнера в ортогональный базис, как правило, косинусного или вейвлет-преобразований, преобразования Фурье.
Подходы, используемые при анализе вектора признаков, могут успешно использоваться и для создания специализированных адаптируемых методов статистического анализа срезов. Однако у методов универсального стегоанализа имеются и недостатки. Перед применением метода универсального стегоанализа необходимо предварительное обучение на представительной выборке контейнеров. Существенной проблемой при обработке многомерных векторов является их высокая размерность. Линейная классификация, применяющаяся во многих методах, в силу исходной нелинейности проблемы зачастую не в состоянии обеспечить приемлемых уровней ошибок на множестве возможных контейнеров, что нивелирует одно из главных преимуществ универсального стегоанализа.
Традиционные подходы в задачах универсального стегоанализа не обеспечивают приемлемого уровня чувствительности и для успешного решения данных проблем очевидна необходимость в исследовании новых подходов, их всестороннем анализе и установлении границ оптимальности применения. При этом основные задачи универсального стегоанализа — идентификация и кластеризация являются традиционными задачами, при решении которых успешно применяются искусственные нейронные сети (ИНС). ИНС также могут использоваться и для снижения избыточности и сокращения размерности векторов признаков. От традиционных методов анализа неиросетевои подход отличает принципиальная возможность нелинейной классификации. На основе искусственных нейронных сетей реализуются также процедуры сжатия и классификации данных с итеративным обновлением, что особенно важно при использовании стегоаналитических методов в составе систем, работающих в реальном масштабе времени. Эффективное создание мер противодействия
нейросетевому представлению классов возможно лишь при всестороннем изучении используемых метрик, и анализе весов обученной нейросети, что является вычислительно сложной задачей.Проведённый анализ публикаций открытой печати показал, что нейросетевой подход к задачам стегоанализа практически не исследован. Исходя из этого, особенно актуальными на настоящий момент являются задачи исследования возможностей открывающихся при применении нейросетевого подхода в разработке новых методов стегоанализа, оценке стойкости методов стеганографии, разработанных на основе традиционных подходов, к новым методам стегоанализа, разработке специализированных и универсальных методов стегоанализа с использованием искусственных нейронных сетей, позволяющих установить факт наличия встроенной информации, оценить её объём, и при возможности осуществить извлечение.
Целью работы является разработка и исследование высокочувствительных методов обнаружения стеганографических сообщений в контейнерах-изображениях и звуковых файлах, определение оптимальных процедур формирования векторов признаков, их постобработки и классификации для минимизации ошибок первого и второго рода.
Исходя из поставленной цели, определяется перечень задач исследования:
Исследование и анализ методов стеганографического встраивания и обнаружения встроенных сообщений, разработка структуры системы стегоанализа на основе векторов признаков.
Разработка модели стегоконтейнера с целью выделения векторов признаков, а также методов обработки векторов для решения задач порогового и количественного стегоанализа.
Разработка методов высокочувствительного порогового и количественного стегоанализа на основе вейвлет-преобразования и нейросетевой классификации.
4. Проведение экспериментальных исследований разработанных методов, сравнение с аналогами.
Методы исследования данной работы основаны на использовании теории вероятности и математической статистики, теории кратномасштабного анализа, аппарате искусственных нейронных сетей.
Научная новизна диссертационной работы заключается в следующем
Разработан метод формирования признаков области кратномасштабного представления сигналов, позволяющие проводить анализ стегоконтейнеров вне зависимости от исходного формата представления на множестве масштабов.
Разработаны высокочувствительные методы порогового стегоанализа области битового представления контейнера, позволяющие при малой длине встроенного сообщения достичь высокой точности стегоанализа.
Разработан высокочувствительный метод количественного стегоанализа области восстановленного стегоконтеинера, позволяющий производить стегоанализ в отсутствие доступа к описанию формата компрессии.
Практическая ценность работы
Разработанные методы могут быть использованы при создании многоуровневых автоматизированных систем универсального стегоанализа, проверке анализируемых метрик на значимость в задачах стегоанализа. Методы стегоанализа области битового представления позволяют создавать адаптируемые системы обнаружения сообщений, скрытых методами изменения НЗБ. Метод универсального стегоанализа области восстановленного стегоконтеинера предназначен для анализа закрытых форматов контейнеров при условии доступности декодера формата.
Достоверность
Достоверность полученных результатов подтверждается полнотой и корректностью теоретических обоснований, а также результатами
проведённых экспериментов действующих моделей. Основные положения, выносимые на защиту
Высокочувствительные методы порогового и количественного стегоанализа области битового представления контейнера, позволяющие обнаружить встроенные сообщения при объёмах порядка 1,5-2% от максимальной ёмкости.
Высокочувствительные методы порогового и количественного стегоанализа области восстановленного стегоконтейнера, которые позволяют обнаруживать стеганографические сообщения при объёмах заполнения 2-5% в полноцветных изображениях и до 0,2% от максимального, в контейнерах, полученных из формата JPEG.
Экспериментальные оценки основных характеристик разработанных методов универсального стегоанализа на основе нейросетевого подхода.
Использование результатов
Результаты, полученные в ходе работы над диссертацией, были использованы при проведении хоздоговорной работы шифр "КАРТИНА", исследованиях по гранту РФФИ 05-07-90372-в "Исследование и разработка высокоточных методов и средств стегоанализа".
Апробация
Полученные при работе над темой диссертации результаты были представлены на:
VI Всероссийской научной конференции студентов и аспирантов "техническая кибернетика, радиоэлектроника и системы управления", Таганрог, 2002.
VII Всероссийской научно-технической конференции «Повышение эффективности средств обработки информации на базе математического и машинного моделирования», Тамбов, 2004.
VII Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления», Таганрог, 2004
VI Международной научно-практической конференции «Информационная безопасность», Таганрог, 2004.
VII Международной научно-практической конференции "Информационная безопасность"-2005.
III Международной конференции «Информационные системы и технологии» (IST'2006), Минск, 2006г.
Публикации
По теме диссертации опубликовано 16 статей и тезисов докладов, из них 2 статьи опубликованы: в журнале «Известия Таганрогского государственного радиотехнического университета (ТРТУ)» за 2003 год и Трудах Седьмого Международного симпозиума "Интеллектуальные системы" за 2006 год из перечня, рекомендованного ВАК РФ для публикации результатов диссертационных работ.
Объём и структура диссертации
Диссертация состоит из введения, 4-х глав, заключения, списка литературы и приложения. Основной текст диссертации состоит из 136 страниц и включает 59 рисунков и 5 таблиц.
Методы замены наименее значимых бит (НЗБ)
Цифровые фотографии, цифровая музыка, цифровое видео непосредственно после создания представляются матрицами чисел, которые кодируют интенсивность в дискретные моменты в пространстве или во времени. Все эти числа не точны, т.к. не точны устройства оцифровки аналоговых сигналов. Младшие разряды цифровых отсчетов содержат очень мало полезной информации и их изменение ощутимо не влияет на качество восприятия, что и дает возможность скрытия дополнительной информации. На практике часто используют замену более одного бита. Пример применения метода НЗБ-замены в отсчётах разрядностью " бит приведён на рисунке 1.3.
Повышение стойкости к стегоанализу при сохранении метода может быть достигнуто двумя способами — изменением алгоритма выбора элементов пространства встраивания — стегопути, либо коррекцией искажений контейнера. Модификация метода встраивания введением псевдослучайного распределения позиций встраивания позволяет при малой относительной длине встраиваемого сообщения резко повысить скрытность. Позиция для встраивания определяется следующим образом: do pos =rand(maxj)os); while in(U,pos)=0 U[i+l]=pos; i-i+I; где in возвращает принадлежность элемента pos множеству U. Для генерации псевдослучайно последовательности, используемой при выборе позиций встраивания, целесообразно применения криптографически стойких генераторов ПСП. При доступности защищенного канала малой пропускной способности возможно применение алгоритма из метода встраивания, предложенного в [10]. Суть данного метода состоит в изменении параметров стегопреобразования с целью уменьшения побитовой разности (расстояния Хемминга) информационных битов и НЗБ-битов контейнера. Из исходной последовательности НЗБ-битов контейнера формируются подпоследовательности, которые затем проверяются на максимум возможных совпадений со скрываемой информационной последовательностью. После нахождения оптимальной подпоследовательности каждый информационный бит в соответствии со своим порядковым номером замещает НЗБ-бит контейнера в позиции i =Ai+B, где А и В — подобранные коэффициенты (рисунок 1.4). Блок-схема алгоритмов встраивания и извлечения информации с минимизацией ошибки линейной функцией представлены на рисунках 1.5 и 1.6. При очевидных достоинствах метод обладает и существенным недостатком — большой объём служебных данных (коэффициентов выбранной зависимости), требуемых для встраивании сообщения. При встраивании сообщений малой длины количество служебных данных соизмеримо с длиной сообщения.
Увеличение длины сообщения приводит к резкому снижению эффективности метода ввиду снижения количества совпадающих битовых позиций.
Другим способом снижения вносимых НЗБ-заменой искажений является минимизации вносимой при замене ошибки.
При встраивании сообщений методом замены НЗБ максимально возможная ошибка равна 2к -1, где к — количество замещаемых бит на отсчёт. Метод минимизации ошибки основан на уменьшении данной ошибки при помощи изменения к + 1-го разряда [11]. При замене к НЗБ-битов и отсутствии коррекции максимальная ошибка составляет: к-\ в то время как при замене к НЗБ-битов и последующей коррекции к + \ бита ошибка составит:
Стойкость методов замены НЗБ снижается с увеличением длины скрываемого сообщения и количества заменяемых наименее значимых битов в очередном отсчёте.
Основой стеганографических методов расширения спектра является внесение в стегоконтейнер псевдослучайного сигнала, модулированного скрываемым сообщением [12, 13]. После распределения по спектру энергия исходного информационного сигнала в каждом отдельно взятом узкополосном диапазоне мала и, следовательно, труднообнаружима, в том числе и программными средствами стегоанализа [12]. Структурные схемы стеганографических кодера и декодера кодера приведены на рисунках 1.7 и 1.8.
Необходимые свойства псевдометрик контейнера в задачах стегоанализа
В специализированных методах стегонализа этап предобработки стегоконтейнера отсутствует. Модель стегоконтейнера задана в явном виде в самом алгоритме вычисления статистических характеристик стегоконтейнера и диапазонах их значений для каждой из групп (незаполненных, заполненных) стегоконтейнеров. В отличие от специализированных методов, в универсальных методах стегоанализа предобработка и получение векторов признаков является одним из основных этапов. При этом к выбранных методам предобработки контейнеров предъявляются требования по формированию разделимых, репрезентативных и многомасштабных векторов признаков.
1. Разделимость векторов признаков является основным требованием. Основная цель при разработке методов формирования векторов признаков состоит в следующем. Пусть С — стегоконтейнер; Т — метод отображения стегоконтейнера в пространство векторов признаков F" = {f",f2",—,fm"}, где f" — «-мерный вектор признаков, m — количество векторов признаков; D = {dl,d2,...,dr} — множество распознаваемых степеней заполнения (классов образов). Обозначим через FJ є F" подмножество векторов признаков, принадлежащих классу dt. Тогда цель преобразования r(C)= F" можно представить в виде:
Другими словами необходимо найти такое преобразование T(C) F", что пересечение любых двух подмножеств векторов признаков F l и F" было минимальным. Рассмотрим вышесказанное на примере задачи обработки стегоконтейнера-изображения. На рисунке 2.1 представлены два варианта преобразования T{S) = F" и проекции F" на плоскость. При этом на рисунке 2.2(a) с помощью данного преобразования получено такое отображение, что векторы признаков стегоконтейнеров образуют выраженные кластеры. В таком случае для разделения множества незаполненных и заполненных стегоконтейнеров могут использоваться простые методы классификации. В случае, приведённом на рисунке 2.2(6) однозначное разделение стегоконтейнеров при помощи линейной классификации невозможно и при отсутствии возможности выбора иного распределения необходимо применение нелинейных методов и анализ контекстной зависимости.
2. Репрезентативность. Главной задачей на данном этапе является получение репрезентативного вектора признаков стегоконтеинера. Под репрезентативностью в данном контексте понимается отраженность в векторе факта наличия в контейнере скрытого сообщения. При этом, в зависимости от метода универсального стегоанализа в состав вектора признаков могут входить как признаки стегоконтеинера, поступившего на вход системы (рисунок 2.3а), так и признаки последовательности модифицированных стегоконтейнеров (рисунок 2.36).
3. Многомасштабность представления. В первых стеганографических методах встраивание битовой последовательности производилось участками одинаковой длины в каждый отсчёт оцифрованного сигнала без какого-либо учёта свойств контейнера и человеческого восприятия. Большинство современных методов стеганографического встраивания являются адаптивными, что позволяет эффективно использовать как особенности контейнера, так и свойства человеческого восприятия для маскирования искажений, вносимых сокрытием сообщения. Помимо этого, наряду со встраиванием в пространственно-временную область в стеганографических методах может быть произведено встраивание в той или иной области преобразования, в частности, Фурье, дискретного косинус-, вейвлет-преобразований. Современные методы стеганографии могут использовать для сокрытия информации как области отображения стандартных методов компрессии с потерей качества, являясь в этом случае надстройкой над кодеком, так и оригинальные области встраивания, адаптированные под обработку контейнеров определённого класса. Например, входящая в большинство методов компрессии блочная обработка, может быть модифицирована, в таком случае параметры блоков, как и сам факт применения обработки априори неизвестны. Более того, при встраивании цифровых водяных знаков (ЦВЗ) широко используются многомасштабные вейвлет-преобразования, позволяющие адаптивно распределить энергию встраиваемого сообщения по частотным субполосам. Таким образом, для учёта искажений, вносимых современными методами стеганографии необходимо использование метрик, отражающих изменения множества субполос и масштабов изображения.
Впервые такой подход к решению задачи стегоанализа был предложен в [39]. Исходя из того, что любой стегоконтейнер при модификации подвергается изменениям, а без знания области встраивания создание метрики для данных изменений невозможно, было предложено получить значения множества распространённых метрик подобия сигналов. Было отмечено, что стеганографическое встраивание приводит к появлению разности в метриках вычисленных для пар "исходное изображение — изображение, подвергнутое НЧ фильтрации фильтром Гаусса". В рассмотрение были включены классы метрик, построенные на основе: - пиксельной разности (среднеквадратичное отклонение); - коэффициенте корреляции (корреляция скалярных и векторных величин); - границах, их положении и непрерывности в различных масштабах; - спектрального расстояния (разность амплитуд и фаз блочного преобразования Фурье); - контекстной зависимости с оценкой по функционалам многомерной вероятности; - характеристик зрительной системы человека (спектральных искажений в цветовом пространстве модели HSV ("цвет-насыщенность-значение")).
Выбор унифицированного формата контейнеров стегосистемы
Одним из основных требований, предъявляемых к универсальным методам стегоанализа является возможность анализа контейнера произвольного формата (BMP, JPEG, TIFF, GIF) в пределах заданного класса контейнеров (изображения, звуковые сигналы). Для выполнения данного требования необходимо, чтобы поступающие на вход системы контейнеры, представленные в произвольных форматах преобразовывались в некоторое единое представление — внутренний формат контейнеров. В настоящее время наиболее часто встречающимся при передаче и хранении изображений форматами хранения как правило являются форматы подмножества стандарта JPEG. Однако стандарт JPEG создавался разработчиками с целью компактного хранения данных и предназначен для достижения максимально возможной степени сжатия при заданном субъективном уровне искажений. В файлах данного формата хранится не развёртка изображения по строкам, а сжатый результат квантованных поблочных дискретных косинус-преобразований яркостной и цветоразностных составляющих изображения и для воспроизведения изображения хранимого в данном формате необходим его перевод (декомпрессия) в пространство RGB.
Формат PNG (Portable Network Graphics) оптимизирован для сетевых приложений и является некоммерческой альтернативой формату GIF. Формат PNG позволяет сохранять изображения с глубиной цвета до 48 бит на пиксель. В данном формате также реализовано сжатие без потерь качества, что при воспроизведении также требует преобразования в пространство RGB.
Формат JPEG 2000 в настоящее время не столь распространён по сравнению с JPEG, PNG и GIF и применяется лишь в отдельных областях, предъявляющих повышенные требования к искажениям при высоких степенях компрессии. В данном формате для компрессии изображения используется многоуровневая вейвлет-декомпозиция, т.е. для проведения стегоанализа хранимые данные также необходимо восстанавливать в пространственную область.
Таким образом, для сохранения основных преимуществ методов универсального стегоанализа изображений предпочтительным является входной формат, включающий представление в цветовом пространстве RGB. При реализации системы данному требованию наиболее полно соответствует формат BMP, включающий вариант полно. Одной из его особенностей является представление информации о пикселях непосредственно в виде RGB-триад. В формат BMP без потерь информации может быть переведён любой другой существующий растровый формат изображений, что позволяет разделить модуль преобразования анализируемого формата во входной формат системы (декодер) и непосредственно метод стегоанализа, что даёт возможность расширения списка входных форматов системы. Последовательность предобработки контейнера-изображения перед проведением стегоанализа представлена на рисунке 3.3.
Аналогичными свойствами при проведении стегоанализа звуковых файлов обладает представление сигнала в виде импульсно-кодовой модуляции, в который преобразуются перед выводом на звуковую карту все аудиосигналы. В качестве входного формата представления в системе стегоанализа, наиболее приближенного к внутреннему представлению метода является и формат ИКМ WAV (несжатые отсчёты звукового сигнала в целочисленном представлении).
Метод порогового стегоанализа контейнеров предназначен для проведения стегоанализа контейнеров-изображений, содержащих скрытые методом замены наименее значимых битов сообщения. Перед проведением стегоанализа контейнера, хранящегося в формате с компрессией (т.е. практически в любом современном формате хранения графических данных) производится перевод изображения в цветовое пространство RGB, представляющее изображение в виде трёх двумерных матриц интенсивности (блок 1, рисунок 3.1). После предобработки контейнера на вход метода поступает изображение С в цветовом пространстве RGB и целочисленном представлении: C= R,G,B , Ry є {0,...,255), Gy. є (0,...,255), B9 є (0,...,255), і = 1..height, j = 1 ..width где J J J — матрицы цветовых каналов, — высота изображения в пикселях, Width — ширина изображения в пикселях. Метод порогового стегоанализа включает следующие этапы [47].
1. Этап предобработки контейнера. Так как метод стегоанализа ориентирован на обнаружение данных, скрытых путём модификации наименее значимых бит и, следовательно, известна область хранения сообщения, можно повысить отношение сигнал-шум исключением из анализируемого сигнала незначимых разрядов двоичного представления отсчётов в соответствии с рисунком 3.5, где приведён пример для одномерного сигнала (аудиосигнал).
Экспериментальные исследования универсальных стеганографических методов
Тестирование метода порогового стегоанализа проводилось на базе речевых сигналов, содержащей записи голоса 40 дикторов в формате Microsoft WAV PCM при частоте оцифровки 8 кГц и разрядности отсчётов 16 бит. Из исходных файлов были сформированы подмножества контейнеров, содержащих встроенную информацию для степеней заполнения НЗБ-битов встроенной информацией на 1, 2, 5, 10, 25, 50, 75 и 100% максимальной ёмкости. Для формирования вектора признаков файлов, входящих в подмножества выполнялось разбиение на неперекрывающиеся окна длиной по 1024 отсчёта, для каждого из которых производилось нахождение вектора признаков, формирующего множество векторов данной степени заполнения НЗБ-слоя. Целевая выборка формировалась векторами {0,1} и {1,0} для изображений, содержащих и не содержащих встроенные данные соответственно. Для классификации векторов признаков в методе стегоанализа звуковых файлов использовалась сеть с обратным распространением ошибок с одним скрытым слоем. Число нейронов во входном слое равнялось числу признаков — 32. В скрытом и выходном слое содержалось по 32 и 2 нейрона соответственно. Функция активации нейронов скрытого слоя — сигмоидальные, выходного — линейная.
На первом этапе производилось обучение и тестирование нейронной сети на выборках, сформированных векторами контейнеров одной степени заполнения. Число эпох обучения — 3000.
Графическое представление уровней выходов нейронной сети при стегоанализе контейнеров с 1% степенью заполнения приведено на рисунке 4.3(a) и 4.3(6).
В результате проведённых экспериментов было установлено, что верно классифицируются контейнеры при степени заполнения до 2%. Точность классификации при этом составила 87% при равных уровнях ошибок первого и второго рода. Обучение системы на выборке контейнеров с определённой степенью заполнения контейнера и последующая классификация контейнеров всех степеней заполнения выявили существенные различия в обобщающей способности нейронной сети, обученной на выборках с разными степенями заполнения НЗБ-слоя. Установлена целесообразность применения для классификации векторов двух нейросетевых классификаторов, обученных на выборках с 25% и 1% заполнения соответственно с приоритетом классификатора, обученного на 1% заполнения (каскадная схема включения). Все результаты экспериментов, соответствуют двухэтапной классификации при помощи классификаторов, обученных на выборках с заполнением 25% и 1%. Для оценки влияния числа эпох обучения проверка нейросетевого классификатора производилась после каждых 100 эпох обучения из интервала 120 - 1000.
Обучение нейросети метода порогового стегоанализа изображений производилось на основе базы, содержащей 150 растровых 24-битных изображений формата BMP 256x256 пикселей, имеющих аналоговую природу. Формирование стегоконтейнеров производилось из изображений встраиванием псевдослучайной битовой последовательности в НЗБ-плоскости цветовых каналов. Для оценки чувствительности метода были получены векторы признаков, из которых были сформированы обучающее множество (по 100 векторов) и тестовое множество (50 векторов). Обучение завершилось за 1000 эпох. В процессе обучения на вход нейросети последовательно предъявлялись векторы, соответствующие заполненным и незаполненным стегоконтейнерам. Векторы h целевого множества были определены в соответствии с условием: /= {0,1} xteCe [{1,0} x,eCk где xt — вектор признаков изображения из обучающего множества, предъявляемый нейросети; е — класс векторов-признаков изображений, не содержащих встроенных данных; h — класс векторов-признаков изображений, содержащих встроенные данные.