Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Вероятностные методы экономного кодирования видеоинформации Семенюк Владимир Витальевич

Вероятностные методы экономного кодирования видеоинформации
<
Вероятностные методы экономного кодирования видеоинформации Вероятностные методы экономного кодирования видеоинформации Вероятностные методы экономного кодирования видеоинформации Вероятностные методы экономного кодирования видеоинформации Вероятностные методы экономного кодирования видеоинформации Вероятностные методы экономного кодирования видеоинформации Вероятностные методы экономного кодирования видеоинформации Вероятностные методы экономного кодирования видеоинформации Вероятностные методы экономного кодирования видеоинформации
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Семенюк Владимир Витальевич. Вероятностные методы экономного кодирования видеоинформации : Дис. ... канд. техн. наук : 05.13.13 : СПб., 2004 99 c. РГБ ОД, 61:05-5/963

Содержание к диссертации

Введение

1 Вероятностный подход в теории экономного кодирования 11

1.1. Информационное описание 11

1.2. Вероятностный подход 13

1.2.1. Энтропия 13

1.2.2. Дешифруемые коды 17

1.2.3. Оптимальная длина кода 19

1.3. Методы генерации кода 23

1.3.1. Префиксное кодирование 23

1.3.2. Алгоритм Шеннона 25

1.3.3. Алгоритм Хаффмана 26

1.3.4. Статические системы префиксных кодов 31

1.3.5. Арифметическое кодирование 31

1.4. Контекстно-зависимое моделирование 36

1.4.1. Проблема идентификации состояний 36

1.4.2. Контекстно-зависимые модели 37

1.4.3. Метод вложенных разбиений 41

1.5. Получение вероятностных оценок на основе статистического анализа информационной выборки 46

1.5.1. Метод получения неадаптивных оценок 46

1.5.2. Метод получения адаптивных оценок с использованием скользящего окна 50

1.5.3. Метод получения адаптивных оценок с периодическим масштабированием значений счетчиков частот появления символов 51

1.5.4. Метод получения адаптивных оценок с множителем 53

1.6. Основные результаты и выводы 58

2 Применение вероятностных методов для повышения эффективности экономного кодирования видеоинформации 59

2.1. Кодирование видеоинформации без искажений 59

2.1.1. Контекстно-зависимые методы 59

2.1.2. Методы с предсказаниями 61

2.1.3. Методы прогрессивного кодирования 63

2.2. Кодирование видеоинформации с искажениями 64

2.2.1. Квантование 64

2.2.2. Экономное кодирование видеоизображений на основе дискретного косинусного преобразования 67

2.2.3. Экономное кодирование видеоизображений на основе дискретного вейвлет-преобразования 76

2.3. Основные результаты и выводы 90

Заключение 91

Литература 92

Введение к работе

На сегодняшний день актуальна проблема хранения и передачи информации в цифровом виде. Для получения компактных информационных представлений применяются технологии экономного кодирования. Использование этих технологий позволяет существенно снизить требования, предъявляемые к объему информационных носителей, а также ощутимо увеличивает скорость передачи информации по каналам связи.

Передача информации является основной областью применения экономного кодирования. На данный момент первоочередная задача -организация эффективного телевизионного и мультимедийного вещания. Как известно, видеоинформация представляет собой наиболее объемный тип информации. С учетом ограниченной пропускной способности цифровых каналов, чтобы гарантировать высокое качество передачи изображений, необходимо обеспечить их достаточно эффективное представление (качество передачи напрямую зависит от объема информации, передаваемого в единицу времени). Как следствие, на протяжении уже более 15 лет значительные усилия направляются на разработку технологий эффективного представления изображений. Этой проблеме посвящена и данная диссертационная работа.

Основная цель работы - анализ существующих технологий получения компактных представлений видеоинформации с точки зрения способа организации кодирования1 и поиск возможных путей повышения их эффективности.

Выбор направления исследования основан на результатах сравнительного анализа существующих алгоритмов экономного кодирования. Алгоритм экономного кодирования представляет собой определенный способ генерации экономного кода на основе приближенной модели порождения кодируемой информации. С целью снижения вычислительной сложности на практике долгое время применялись упрощенные методы

1 Объектом изучения являются методы кодирования, а не сопутствующие им способы преобразования информации.

информационного моделирования и генерации кода. В качестве моделей брались простейшие комбинаторные модели, а генерация кода осуществлялась с использованием наиболее быстрых реализаций префиксного кодирования. В настоящее время постановка задачи изменилась: на первый план стала все чаще выходить эффективность кодирования. Сегодня становится целесообразным применение более сложных технологий кодирования, которые позволяют достичь максимально компактного информационного представления.

Одним из наиболее эффективных методов информационного моделирования является вероятностное контекстно-зависимое моделирование. При использовании данного метода выбор информационной модели в каждый момент времени осуществляется на основе значения некоторого контекста, который формируется из элементов уже обработанной информационной выборки. Вводя контексты, мы фактически решаем задачу идентификации состояний информационного источника. Для каждой модели хранится статистическая информация о появлении различных символов информационного алфавита в контексте, соответствующем данной модели. На основе этой информации формируется распределение вероятностных оценок появления символов на выходе источника, которое служит основой для генерации кода.

Арифметическое кодирование представляет собой наиболее эффективный метод генерации кода по заданному вероятностному распределению. Использование этого метода позволяет получать коды, длины которых мало отличаются от теоретически оптимальных значений.

Таким образом, сочетание контекстно-зависимого вероятностного моделирования и арифметического кодирования наиболее выгодно с точки зрения эффективности. Данный подход к организации кодирования взят за основу в представленном диссертационном исследовании.

Задачи исследования. В рамках диссертационного исследования решались следующие задачи:

1. Подробный анализ существующих методов контекстно-зависимого вероятностного кодирования.

  1. Повышение эффективности широко распространенных стандартных схем кодирования JPEG и MPEG за счет использования контекстно-зависимых вероятностных методов.

  2. Разработка эффективного алгоритма получения компактных представлений изображений на основе дискретного вейвлет-преобразования с применением методов контекстно-зависимого вероятностного кодирования.

При решении указанных задач были выделены и отдельно рассмотрены две подзадачи:

  1. Создание строгого формального описания контекстно-зависимых вероятностных моделей.

  2. Разработка эффективного метода получения адаптивных вероятностных оценок для случая двоичной информационной выборки.

Методы исследования. Диссертационное исследование осуществляется путем теоретического и экспериментального анализа различных методов и алгоритмов. Теоретический анализ основан на результатах теории информации, теории кодирования, теории вероятностей и теории множеств. Экспериментальное исследование подразумевает программную реализацию алгоритмов с последующей оценкой их практической эффективности применительно к общепринятым экспериментальным данным.

На защиту выносятся следующие результаты:

  1. Формулировка и доказательство неравенства Макмиллана для случая неразделимых кодов. Вычисление величины оптимального вклада символа в результирующую длину кода.

  2. Алгебраическое доказательство оптимальности алгоритма Хаффма-на для системы представления информации с произвольным основанием.

7 Формализация контекстно-зависимых вероятностных моделей.

Обобщение метода PPM (Prediction by Partial String Matching) -метод вложенных разбиений.

Метод получения адаптивной вероятностной оценки на основе статистики появления символов.

Алгоритм экономного кодирования коэффициентов дискретного косинусного преобразования.

Алгоритм экономного кодирования изображений на основе дискретного вейвлет-преобразования.

Научная новизна работы:

Произведено обобщение неравенства Макмиллана на случай вкладов символов в результирующую длину кода сообщения для случая неразделимого кодирования. Вычислена оптимальная длина вклада.

Предложено ранее не фигурировавшее в литературе строгое алгебраическое доказательство оптимальности алгоритма Хаффмана для системы представления информации с произвольным основанием.

Предложена строгая формализация контекстно-зависимых моделей.

Проведено обобщение метода РРМ

Предложен новый метод получения адаптивных вероятностных оценок.

Разработан новый высокоэффективный алгоритм экономного кодирования коэффициентов дискретного косинусного преобразования.

Разработан новый высокоэффективный алгоритм экономного кодирования изображений на основе дискретного вейвлет-преобразования.

8 Практическая ценность работы:

  1. Разработанный алгоритм экономного кодирования коэффициентов дискретного косинусного преобразования позволяет в среднем на 10% повысить эффективность общепринятых стандартных схем JPEG и MPEG.

  2. Разработанный алгоритм экономного кодирования изображений на основе дискретного вейвлет-преобразования является наиболее эффективным алгоритмом в своем классе. При фиксированном размере выходного кода эффективность алгоритма на 0.05-0.2 dB выше эффективности аналогичных решений. Алгоритм может быть успешно применен на практике для получения экономных представлений неподвижных изображений и видеопотоков.

  3. Предложенный метод получения адаптивных вероятностных оценок является эффективной заменой методу, наиболее часто используемому на практике. В частности, применение разработанного метода в алгоритме кодирования изображений на основе дискретного вейвлет-преобразования в среднем позволило на 0.5% повысить эффективность кодирования и на 10% увеличить его производительность.

Внедрение результатов работы. Разработанные алгоритмы экономного кодирования являются основой нескольких программных продуктов компании ООО «Авансофт» (Санкт-Петербург), занимающей лидирующее положение в сегменте рынка программного обеспечения, связанного с технологиями компактного представления потоковой видеоинформации.

Результаты диссертационной работы используются в учебном процессе на кафедре компьютерных технологий факультета информационных технологий и программирования Санкт-Петербургского государственного университета информационных технологий, механики и оптики. В частности, автором диссертации самостоятельно разработан и

в течение трех лет преподается на кафедре курс лекций «Экономное кодирование дискретной информации».

Апробация результатов работы. Результаты диссертационного исследования были представлены на ХІ-й всероссийской научно-методической конференции «Телематика'2004», а также на 1-й конференции молодых ученых Санкт-Петербургского государственного университета информационных технологий, механики и оптики.

Публикации. Основные результаты диссертационного исследования опубликованы в 5 работах общим объемом 137 страниц: 3 статьи [6, 7, 8], 1 тезис [9] и 1 монография [10]. Все работы написаны без соавторов.

Структура диссертационной работы выглядит следующим образом. Работа состоит из введения, основной части и заключения. Основная часть включает в себя 2 главы.

В главе 1 рассматриваются общие вопросы, посвященные различным аспектам теории экономного кодирования в рамках выбранной темы исследования.

В разделах 1.1 и 1.2 дается теоретическое введение в проблему, определяются некоторые фундаментальные понятия вероятностной теории информации и теории кодирования, приводятся теоретические факты, наиболее важные для дальнейшего изложения. В частности, впервые четко формулируются и доказываются некоторые результаты, касающиеся неразделимых кодов (раздел 1.2.3).

Дешифруемые коды

Теория экономного кодирования занимается проблемой создания эффективных представлений информационной выборки. Речь в большинстве случаев идет о выборке источников дискретной информации с конечным алфавитом. Эффективное кодирование становится возможным благодаря наличию у информации определенных особенностей, поэтому одной из наиболее важных задач является получение как можно более точного описания свойств информационных источников.

Существует несколько подходов к такого рода описанию. Наиболее часто используемые - комбинаторный и вероятностный.

В рамках комбинаторного подхода символы рассматриваются не обособленно, а группами, именуемыми информационными сообщениями. Полагается, что с выхода источника информации могут поступать не все возможные сообщения, а только сообщения из некоторого выделенного множества. При этом сообщения, принадлежащие данному множеству, считаются совершенно равнозначными, то есть их появление полагается равновероятным. Конкретный выбор множества допустимых сообщений выполняет роль информационного описания.

Комбинаторный подход получил довольно широкое распространение на практике (см. работу [10]). Основным его достоинством является простота описания информационных особенностей, поэтому практические реализации методов экономного кодирования, в основе которых лежит данный подход, имеют низкую вычислительную сложность. Недостаток заключается в том, что точность описания подчас напрямую зависит мощности множества допустимых сообщений - для получения достаточно точного описания может потребоваться рассмотреть очень большое количество сообщений. Комбинаторный подход также не позволяет получать информационные характеристики для отдельных символов внутри сообщения.

Суть вероятностного подхода заключается в использовании вероятностных оценок фактов появления различных символов на выходе источника информации. По сравнению с комбинаторным подходом вероятностный подход является более точным способом описания свойств информационных источников. В то же время вероятностный подход менее выгоден с вычислительной точки зрения, так как его применение сопряжено с вычислением сложных вероятностных оценок. Таким образом, с одной стороны, вероятностное описание, как правило, более эффективно по сравнению с комбинаторным описанием, с другой стороны, вероятностное описание не всегда можно использовать на практике из-за существующих вычислительных ограничений. Постоянное увеличение производительности вычислительных систем делает последний фактор менее значимым, вследствие чего вероятностный подход в последнее время все чаще и чаще берется за основу при разработке алгоритмов экономного кодирования.

Арифметическое кодирование

Проблема создания эффективной системы генерации кода актуальна только в том случае, когда по каким-то причинам информационная выборка обрабатывается небольшими порциями. Как было показано выше, если объем единовременно кодируемой информации практически не ограничен, код может генерироваться почти оптимальным образом.

Одан из простейших способов установления такого соответствия был предложен в работе [4]. Единственное затруднение, которое при этом возникает, - практическая реализация алгоритма. Если необходимо воспользоваться одним из описанных выше алгоритмов построения систем префиксных кодов, остро встает проблема нехватки вычислительных ресурсов (так как количество сообщений растет с увеличением их длины по экспоненциальному закону, количество кодов в префиксной системе может оказаться настолько большим, что для работы с ней не хватит ни памяти, ни производительности). Другой недостаток подобного способа кодирования заключается в наличии существенной задержки при генерации кода: код генерируется только после обработки всего объема информации.

Избежать указанные проблемы позволил бы метод последовательной генерации кода в процессе получения вероятностных оценок для символов, входящих в сообщение. О возможном существовании такого метода косвенно свидетельствует доказанное в разделе 1.2.3 утверждение об оптимальных вкладах символа в результирующую длину кода сообщения. Как было показано, длина кода может быть вычислена в процессе последовательного получения оценок вероятностей появления символов. Все, что требуется, - указать метод, позволяющий непосредственно получать дешифруемый код данной длины. Такой метод существует и носит название арифметическое кодирование.

Основой арифметического кодирования является алгоритм последовательного деления интервала Элайеса1. Рассмотрим интервальное разбиение, фигурирующее в геометрической трактовке агоритма Шеннона. Будем считать, что сообщения состоят из одного символа. В качестве вероятностного распределения возьмем распределение вероятностей появления символов в состоянии si - {р\ } =i- Любое число в интервале [0,1) принадлежит некоторому интервалу [о,-, Ь,). Можно сказать, что это число определяет символ с индексом і. Пусть в сообщении встретился символ с индексом «і. Множество определяющих его чисел представляет собой интервал [0 ,6). Построим на этом интервале интервальное разбиение, подобное интервальному разбиению интервала [0,1) для со 1 Появленню метода арифметического кодирования в той форме, в которой он существует сегодня, мы обязаны работам [25, 40, 43, 44, 45, 46, 49, 53]. стояния S2 (соответствующее вероятностное распределение - {pi JiLl)-Другими словами, разобьем интервал [0 ,6, ) на более мелкие интервалы, сохраняя пропорции разбиения интервала [0,1) для состояния «2- (Данную процедуру будем называть интервальным проектированием.) Можно сказать, что интервал [в , ) выступает теперь в роли исходного интервала [0,1). Пусть вслед за символом с индексом i\ встретился символ с индексом «2. Через [ 1 ,12, 2,12) обозначим интервал, определяющий данный символ относительно интервала [сц Ь ). Заметим, что любое число, принадлежащее интервалу {(Ч Ьцм)-» однозначно определяет не только символ с индексом г г, но и символ с индексом г ь так как данный интервал является частью определяющего интервала [aj bjj: [0 ,13,6 ,12) С [a l),-,). Аналогичным образом можно построить определяющий интервал для произвольной последовательности будет определяющим, а значит, m-ичная запись его дробной части можно рассматривать в качестве кода символьной последовательности. Опираясь на рассуждение, использованное для обоснования алгоритма Шеннона, делаем заключение, что существует определяющее число, для записи дробной части которого достаточно ("— logm/f единиц информации, где р - длина определяющего интервала. Остается заметить, что по построению длина определяющего интервала равна произведению вероятностей появления символов, входящих в кодируемую последовательность: р — р\ pf2 ---Pi Таким образом, описанная процедура последовательного формирования определяющего интервала для последовательности символов есть ни что иное как метод генерации кода, эффективность которого отличается от эффективности оптимального кодирования не более чем на одну информационную единицу.

Код, генерируемый при арифметическом кодировании, является неразделимым: символам, входящим в сообщение, нельзя поставить в соответствие отдельные кодовые комбинации. (Понятие «код» применимо только для сообщения в целом.) Вследствие этого, по отдельной части арифметического кода (за исключением начала) нельзя восстановить соответствующую часть закодированного сообщения. Это делает невозможным случайный доступ к информации и существенно снижает помехоустойчивость. В приложениях, где требуется обеспечить случайный доступ к информации, и в приложениях, где возможны информационные потери (они могут возникнуть из-за помех при передаче или из-за повреждения информационного носителя), генерацию арифметического кода следует осуществлять не для всего сообщения, а для отдельных его частей (блоков)1. Такой подход, безусловно, приведет к небольшому снижению эффективности кодирования, однако будет обеспечена возможность декодирования отдельных частей информации без декодирования всего кода, а в случае возникновения искажений длина невосстанавливаемого участка кода будет ограничена длиной соответствующего закодированного информационного блока.

Методы с предсказаниями

Видеоинформация представляет собой достаточно специфический тип информации - она двухмерна по своей природе. В связи с тем, что современные вычислительные алгоритмы являются в большинстве своем алгоритмами последовательной обработки, их применение к информации такого рода затруднено. При работе с видеоданными за основу, как правило, выбирается некоторая одномерная модель. Изображение рассматривается как выборка источника последовательной дискретной информации (модель такого источника подробно рассмотрена в предыдущем изложении). Эта выборка обладает рядом особых свойств, отражающих реальную природу информационного источника.

В данном разделе речь пойдет о применении контекстно-зависимого вероятностного моделирования в методах экономного кодирования видеоинформации. В рамках контекстно-зависимого моделирования специфические особенности видеоданных являются основой для выработки критериев формирования факторных векторов и разбиения их множества на подмножества (см. раздел 1.4.2). Определяющую роль здесь играет пространственное расположение элементов изображения и их близость. Исходным дискретным представлением изображения являются цветовые компоненты в матричной форме. Проблема экономного кодирования видеоинформации, таким образом, сводится к проблеме получения эффективных представлений матриц натуральных чисел. Специфика этих матриц заключается в наличии сильной вероятностной взаимосвязи между соседними значениями матрицы. Для учета этой взаимосвязи при кодировании идеально подходит двухмерная контекстно-зависимая модель, в которой факторный вектор формируется из уже закодированных значений двухмерного контекстного окружения кодируемой позиции матрицы.

Кодирование значений матрицы может осуществляться последовательно, в соответствии с некоторым заранее выбранным порядком обхода позиций. Формирование факторного вектора напрямую зависит от этого порядка. Если, к примеру, матрица кодируется построчно, потенциальными составляющими факторного вектора являются уже закодированные значения кодируемой строки, а также значения всех ранее закодированных строк, находящихся при построчном кодировании над кодируемой строкой (см. рис. 2.1).

Существует альтернативный способ кодирования. Он подразумевает многопроходную обработку информации. При использовании многопроходного кодирования во время очередного кодового прохода значения матрицы кодируются не полностью (например, кодируются отдельные биты). Незакодированная часть кодируется во время последующих проходов. При таком способе организации кодирования в качестве составляющих факторного вектора можно брать только уже закодированные части значений. Получение оценок вероятностей появления символов при использовании описанного метода построения контекстно-зависимой модели нередко затруднено следующим обстоятельством: количество всевозможных значений может оказаться настолько большим, что собираемая статистика станет адекватной только после обработки значительного объема информационной выборки. Выход из данной ситуации - применение моделирования, при котором моделируются не конкретные значения, а группы или интервалы значений. Появление значений, принадлежащих одной и той же группе (интервалу), считается равновероятным, поэтому вводить дополнительные модели для их обработки не требуется. Описанный прием позволяет повысить эффективность кодирования за счет повышения адекватности вероятностных оценок (оценка для группы (интервала) оказывается более точной за счет большего объема статистики). Для достижения оптимального результата следует очень тщательно подходить к подбору групп (интервалов) значений. К примеру, наиболее часто встречающиеся значения нецелесообразно объединять со значениями встречающимися значительно реже, так как для последних объективность оценки несравнимо ниже, чем для первых.

Кардинально иной метод учета особенностей реальных изображений при кодировании базируется на предсказаниях1. Кодируемое значение ячейки матрицы предсказывается на основе информации о соседних значениях. (Предсказание выступает как функция от этих значений. Как правило, используется среднее значений или их линейная комбинация.) В качестве объекта кодирования выступает не само значение, а разность между этим значением и предсказанием - так называемая ошибка предсказания. Ошибки предсказания распределены далеко не случайным образом: маленькие по абсолютному значению ошибки встречаются значительно чаще больших ошибок, а кроме того, существует вероятностная зависимость между ошибкой и контекстом для обрабатываемой позиции. Данный метод чаще всего используется на практике (см. [26, 36, 51, 54, 59, 62, 66]). Поэтому ошибки предсказания могут быть очень эффективно закодированы.

Для моделирования ошибок применима описанная выше двухмерная контекстно-зависимая модель. При этом остается актуальной проблема получения адекватных оценок для очень большого количества различных значений. Для ее решения используется подход, отличный от описанного ранее (см. работы [26, 51, 54]). В основе данного подхода предположение о том, что значения ошибок предсказания распределены по некоторому параметрическому закону, параметры которого изначально не известны, но могут быть оценены в процессе кодирования. Оценка всего нескольких параметров позволяет вычислять вероятности появления для фактически неограниченного количества значений ошибок предсказания, что при правильном выборе распределения гарантирует высокую эффективность кодирования.

Экономное кодирование видеоизображений на основе дискретного косинусного преобразования

Эффективность экономного кодирования естественного полутонового изображения (например, фотографического) методами, описанными в предыдущем разделе, в среднем составляет несколько битов на одно закодированное значение цветовой матрицы. Применительно к синтезированным изображениям (такие изображения могут содержать текст, рисунки, графические объекты и т.п.) эффективность оказывается несколько выше и иногда составляет менее одного бита на закодированное значение. Однако существуют технологии кодирования, позволяющие добиться существенно большего результата. Высокая эффективность достигается за счет того, что при кодировании становятся допустимыми некоторые информационные искажения. Чтобы искажения были как можно менее заметны, их характеристики выбираются с учетом особенностей психовизуального восприятия изображения человеком.

Искажения чаще всего возникают вследствие квантования значений информационной выборки. В разделе 2.1.1 был рассмотрен метод эффективного моделирования большого количества различных значений цветовой матрицы путем объединения их в группы (интервалы). Идея квантования заключается в замене всех значений из группы (интервала) некоторым единым значением. Данный прием позволяет уменьшить количество различных значений, встречающихся в матрице, что позволяет кодировать ее более эффективно. Информационные искажения, очевидно, возникают из-за несовпадения группируемых значений со значением, полученным в процессе их квантования1. Полное восстановление информации становится, таким образом, невозможным.

Развитием указанного подхода является метод в котором группируются не отдельные значения, а целые вектора, составленные из значений, находящихся на близких позициях в матрице. Квантованное значение в

Такое значение называется квантованным. данном случае соответствует некоторому множеству векторов значений. Такое решение представляет значительно больше возможностей для информационного описания. Оно носит название векторное квантование, а рассмотренный ранее упрощенный вариант называется скалярным квантованием.

Как нетрудно заметить, векторное квантование частично выполняет функции контекстно-зависимого моделирования: объединение векторов значений, находящихся на близких позициях, позволяет учесть возможные вероятностные взаимосвязи между ними. Поэтому векторное квантование, как альтернативный метод учета информационных закономерностей, является предметом для отдельного рассмотрения, и будет оставлен за рамками данной работы. В дальнейшем речь пойдет только о тех методах кодирования, в которых используется скалярное квантование.

Остановимся более подробно на некоторых деталях практической реализации скалярного квантования. Как уже отмечалось выше, объединение значений в группы должно производиться с учетом требований конкретной задачи. В тех случаях, когда специфика обрабатываемой информации не позволяет однозначно выбрать способ группирования значений, используется наиболее простое решение - квантуемые значения разбиваются на равные по длине интервалы. Данный метод квантования называется равномерным.

Обозначим через Д длину интервала при равномерном квантовании (параметр квантования). Совокупность интервалов представима в виде [хо+А-г, #о+Д ( +!)) Значение XQ принадлежит вещественному интервалу [—Д/2, Д/2) и задает базовое смещение интервалов при квантовании, і принимает произвольные целочисленные значения и представляет собой номер интервала.

Номер интервала выступает в роли кодируемого объекта. В процессе декодирования по нему восстанавливается искомый интервал значений (деквантование). Так как конкретные значения восстановлению не подлежат, при деквантовании они заменяются некоторым фиксированным числом. Оптимально использовать в качестве данного числа математи 66

ческое ожидание значений интервала. В случае, когда значения распределены равномерно, математическое ожидание соответствует середине интервала - XQ + А г + Д/2.

Квантуемая информационная выборка часто представлена числами со знаком, симметрично распределенными относительно нуля. Маленькие по абсолютной величине значения обычно не играют определяющей роли - их искажение остается практически незаметным для нашего восприятия. В подобных ситуациях базовое смещение интервала XQ имеет смысл выбирать равным — Д/2. При таком выборе значения в окрестности [—А/2, Д/2) будут заменяться нулями (так называемая мертвая зона). С целью улучшения схемы квантования размер мертвой зоны увеличивают, оставляя неизменными размеры других интервалов. Помимо повышения эффективности это позволяет упростить процедуру квантования: если выбрать размер мертвой зоны равным 2Д, определение номера интервала при квантовании сведется к делению квантуемого значения на параметр квантования. Данное решение используется во многих практических приложениях, в частности, в стандартах кодирования видеоинформации JPEG [59], JPEG2000 [59], MPEG [60, 61, 63]), Н.261 [67], Н.263 [68].

Информационные искажения, возникающие в результате скалярного квантования, обычно заметно ухудшают качество изображения, делая его ступенчатым. В идеале искажения не должны приводить к существенному изменению основного рисунка, изображения и не должны вносить в изображение новые, ранее не существовавшие детали. По этой причине целесообразно квантовать не сами значения цветовой матрицы, а некоторые их обобщенные характеристики, изменение которых не ведет к кардинальному изменению рельефа изображения. Как показывает практика, наибольшей эффективностью обладают методы, в которых в качестве объекта квантования выступают параметры двухмерных интерполяционных функций, используемых для приближенного описания изображений.

Похожие диссертации на Вероятностные методы экономного кодирования видеоинформации