Введение к работе
Актуальность проблемы
В настоящее время сжатие цифровых данных используются повсеместно. Развитие интернет-технологий, распространение широкополосного доступа в Интернет и создание мобильных цифровых устройств для записи, передачи, хранения и воспроизведения текстовой и аудиовизуальной информации привело к тому, что количество информации, хранимой на устройствах памяти, увеличивается быстрее, чем происходит совершенствование этих устройств, и, как следствие, потребовало дальнейшего развития методов компрессии.
Цифровые изображения, как и другие хранимые данные (текст, звукозапись, видеозапись), почти всегда обладают избыточностью. Для устранения межэлементной избыточности (коррелированности соседних пикселов) в методах сжатия изображений с потерями, как правило, применяются специальные преобразования, концентрирующие энергию в относительно небольшом количестве коэффициентов. При этом компоненты полученного спектра либо являются слабо коррелированными, что дает возможность обрабатывать их независимо, либо статистические связи между ними существуют, но являются более упорядоченными и предсказуемыми, чем в исходном изображении. К тому же особенности восприятия изображений человеческим глазом позволяют закодировать грубо значительную часть спектра без ущерба для воспринимаемого качества восстановленного изображения и таким образом устранить визуальную избыточность.
В качестве подходящих для сжатия изображений рассматривались различные преобразования, однако в итоге наибольшее распространение получили дискретное косинусное преобразование (ДКП), используемое в методе JPEG1, и дискретное вейвлет-преобразование (ДВП), лежащее в основе JPEG-20002. В силу своих свойств ДКП обычно применяется к небольшим участкам изображения, тогда как ДВП, благодаря локализации базисных функций как в пространственной, так и в частотной областях, может выполняться сразу над всем изображением, а не над его отдельными блоками.
Несмотря на то, что сжатые с помощью JPEG-2000 изображения, как правило, обладают лучшим качеством по сравнению с JPEG, новый стандарт так и не смог вытеснить свою предыдущую версию по причине значительной сложности реализации и повышенных требований к про-
1 Стандарт ISO/ШС 10918-1
2 Стандарт ISO/ШС 15444-1
изводительности оборудования, которые в большинстве случаев не оправдывались некоторым увеличением качества сжатия и функциональными улучшениями.
Поэтому даже при использовании современных методов сжатия по-прежнему актуальными являются исследования, результаты которых позволяют как повысить эффективность известных методов компрессии цифровых изображений, так и получить новые алгоритмы кодирования, которые могут быть успешно использованы в различных мультимедийных программных и аппаратных комплексах.
Одним из способов совершенствования методов сжатия изображений, основанных на применении декоррелирующих преобразований, является использование остаточной корреляции между коэффициентами спектра. Векторное квантование (ВК) — это перспективный, но недостаточно исследованный инструмент, позволяющий учесть межкомпонентные зависимости в спектре изображения. Известно, что при определенных условиях ВК может обеспечить более высокую эффективность представления данных по сравнению со скалярным квантованием. Однако существуют ограничения, которые затрудняют практическое применение ВК, поэтому этот метод не получил большого распространения. В литературе были предложены методы сжатия изображений с применением ВК, однако стандартных и широко применяемых методов на его основе не существует. В настоящее время ВК нашлось лишь ни-шевое применение в аудиокодеках, а также в семействе голосовых CELP-кодеков.
Другим способом учета остаточной корреляции является контекстное кодирование. Быстрое увеличение доступных вычислительных мощностей позволило существенно усложнить применяемые в методах сжатия изображений контекстные модели и повысить степень сжатия данных без ухудшения качества. В настоящее время разработано большое количество методов контекстного моделирования для применения с различными преобразованиями в различных условиях, способных полностью загрузить процессор любой мощности, однако данное направление продолжает быстро развиваться, и исследования в этой области по-прежнему актуальны.
Цель и задачи диссертационной работы
Целью работы является разработка новых и совершенствование существующих методов компрессии цифровых изображений на основе контекстного кодирования и векторного квантования в области дискретного косинусного преобразования и дискретного вейвлет-преобразования.
Основные задачи, решение которых требуется для достижения поставленной цели, следующие:
исследование существующих подходов к сжатию цифровых изображений в области дискретных декоррелирующих преобразований;
разработка и оптимизация методов и алгоритмов сжатия изображений на основе ДЬШ и ДВП, применяющих векторное квантование и контекстное кодирование в целях использования остаточной корреляции между коэффициентами указанных преобразований;
разработка программных инструментов для тестирования, подбор оптимальных параметров, имеющих эмпирический характер, оценка характеристик созданных методов на примере стандартных тестовых изображений.
Методы исследования
В ходе работы над диссертацией в качестве методов исследования использовались методы теории вероятностей и математической статистики, теории цифровой обработки и кодирования данных, линейной алгебры. Экспериментальные исследования были проведены путем численного моделирования на персональном компьютере с помощью написанных на языках С и C++ специальных библиотек и пакета MATLAB.
Достоверность результатов
Достоверность научных положений, результатов и выводов подтверждается использованием для их получения общепринятых научных подходов и методов разработки, а также результатами экспериментальных исследований, проведенных с использованием стандартных тестовых изображений и подтверждающих эффективность созданных методов и алгоритмов.
Личный вклад автора
Разработка, реализация и тестирование метода на основе векторного квантования коэффициентов ДЬШ были проведены лично автором. Прочие методы были созданы, реализованы и экспериментально проанализированы коллективом исследователей при непосредственном участии автора в качестве ведущего разработчика.
Научная новизна диссертации
Научная новизна диссертации заключается в создании новых и модификации существующих методов и алгоритмов компрессии цифровых изображений на основе адаптивного векторного квантования коэффициентов ДЬШ, а также контекстного векторного квантования и контекстного скалярного кодирования коэффициентов ДВП.
Практическая значимость
Практическая значимость полученных в диссертационной работе результатов заключается в том, что разработанные методы компрессии цифровых изображений позволяют повысить эффективность сжатия данных и, следовательно, удешевить их обработку, хранение и передачу в мультимедийных системах.
Предложенные методы внедрены в системе видеонаблюдения «Focus», о чем составлен соответствующий акт.
Основные положения, выносимые на защиту
Предложенный метод компрессии цифровых изображений на основе адаптивного векторного квантования коэффициентов ДКП позволяет сократить битовые затраты на кодирование изображения на 6-22 % по сравнению со стандартным методом JPEG.
Модифицированный алгоритм компрессии цифровых изображений на основе контекстного кодирования коэффициентов ДВП позволяет сократить битовые затраты на кодирование изображения на 3-11 % по сравнению со стандартным методом JPEG-2000.
Предложенный метод компрессии цифровых изображений на основе контекстного адаптивного векторного квантования и контекстного скалярного кодирования коэффициентов ДВП требует существенно более низких вычислительных затрат по сравнению с модифицированным алгоритмом на основе контекстного кодирования коэффициентов ДВП и показывает результаты на уровне JPEG-2000.
Апробация работы
Основные результаты диссертационной работы докладывались и обсуждались на 11-й, 12-й, 13-й и 14-й Всероссийских межвузовских научно-технических конференциях студентов и аспирантов «Микроэлектроника и информатика» (Москва, МИЭТ, 2004, 2005, 2006 и 2007 гг.), на Всероссийской научно-технической конференции «Информационно-телекоммуникационные технологии» (Сочи, 2004 г.), 8-й и 11-й Международных конференциях «Цифровая обработка сигналов и ее применение» (Москва, 2006 и 2009 гг.) а также на 3-й и 4-й Российско-Баварских конференциях по биомедицинской инженерии (Германия, Эрланген, 2007 г.; Москва, МИЭТ, 2008 г.).
Публикации
По теме диссертации опубликовано четырнадцать работ, среди которых три статьи в ведущих рецензируемых журналах, четыре доклада в трудах международных конференций, из которых два — на английском
языке. Без соавторов опубликованы три работы. Получено два свидетельства о государственной регистрации программы для ЭВМ.
Структура и объем диссертации