Разработка алгоритмов вычисления параметров глобального движения в видеопоследовательностях для реализации в системах на кристалле Миргородский Александр Юрьевич

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Миргородский Александр Юрьевич. Разработка алгоритмов вычисления параметров глобального движения в видеопоследовательностях для реализации в системах на кристалле : дис. ... канд. физ.-мат. наук : 05.27.01 Москва, 2006 131 с. РГБ ОД, 61:07-1/445

Введение к работе

Актуальность проблемы

В конце 20-го - начале 21-го века средства телекоммуникации и портативные'"устройства цифровой фото-видео съемки развивались чрезвычайно быстрыми темпами. В нашу жизнь прочно вошли такие понятия, как мобильная связь, интернет, цифровая фото и видео камеры, и т.п. Реализация таких устройств требует не только увеличения степени интеграции используемых микросхем, но и повышения эффективности алгоритмов обработки данных.

В связи с тем, что современные каналы связи и хранилища данных не позволяют передавать и хранить большие объемы информации, одной из актуальных задач средств телекоммуникации и портативных фотовидео устройств является передача и хранение сжатых данных. Так например, видеоинформация, генерируемая видеокамерой, состоит из последовательности изображений - кадров. Обычно кадры генерируются с частотой 24, 25 или 30 раз в секунду. В результате получается большое количество данных, для эффективной передачи и хранения которых необходимо использовать сжатие.

Существуют различные подходы к компрессии видеопоследовательностей. Один из вариантов обработки видеоинформации - это последовательное сжатие каждого кадра, используя такие алгоритмы, как JPEG, JPEG2000 [1,2]. Фактически такое внутрикадровое сжатие сейчас широко используется как метод кодирования видеоинформации в системах качественного видеомонтажа, которые требуют быстрого доступа . к любому кадру видеопоследовательности. При отсутствии видимых искажений типичный коэффициент покадрового сжатия равен 8-9.

Однако значительно более высокий уровень сжатия может быть достигнут за счет исключения временной избыточности в видеопотоке (т.е. в

последовательности кадров). Коэффициент сжатия при отсутствии или малозаметных визуальных искажениях в этом случае увеличивается на порядок. Если сцена по существу просто повторяется кадр за кадром без какого-либо существенного изменения, то в таком случае значительно более эффективно кодировать разницу между кадрами, а не каждый кадр видеопотока.

Метод повышения степени компрессии путем кодирования только изменений в видеосцене, называемый условным замещением (УЗ), был использован в первом стандарте цифрового видео кодирования, ITU-T Rec. Н.120 [3]. Кодирование с УЗ состоит из передачи сигналов для индикации того, какая область изображения может быть повторена, и передачи закодированной информации об изменившихся областях. Также данный метод можно развить путем добавления метода компенсации движения (КД) . Суть метода заключается в том, что в некоторой окрестности исходной области одного кадра ищется наиболее похожая область из другого кадра. Разница в координатах между исходной и целевой областью называется вектором движения. В результате вместо кодирования целой области, кодируется только вектор движения и поправки к целевой области (разность между целевой и исходной областью). Размер области поиска движения выбирается исходя из предположения о максимальном смещении объектов внутри кадра. Зачастую используется квадрат размером 16x16 пикселей. Эффективность данных методов зависит от ряда предположений о виде движения в кадре, а именно:

Объекты перемещаются в плоскости, параллельной плоскости камеры. Таким образом, не рассматриваются, например, эффекты масштабирования и вращения.

Появление и исчезновение объектов не рассматриваются. Таким образом, не рассматриваются, например, эффекты вращения и сдвига.

Однако данные ограничения зачастую снижают качество выходных изображений и накладывают ограничения на максимальный коэффициент сжатия в системах кодирования видеоинформации. К тому же эффекты, которые возникают вследствие движения видеокамеры (т.е. эффекты глобального движения), приводят к ухудшению качества закодированных изображений при том же коэффициенте сжатия, либо к уменьшению коэффициента сжатия при сохранении качества закодированных изображений. Таким образом, для повышения качества закодированных изображений и увеличения коэффициента сжатия в системах кодирования видеопоследовательностей необходимо использовать методы, позволяющие устранять описанные выше ограничения.

Известные алгоритмы, которые позволяют определять параметры глобального движения, являются крайне ресурсоемкими, что ограничивает возможность их использования в системах кодирования в реальном времени. Таким образом, на разработку новых алгоритмов накладываются ограничения по вычислительным затратам. Как правило, системы кодирования в реальном времени имеют аппаратную реализацию либо в виде специальной микросхемы, либо в виде программы, реализованной с использованием специального процессора. Одним из возможных вариантов применения алгоритмов вычисления параметров глобального движения, который одновременно позволит повысить общую производительность систем кодирования видеоинформации, является реализация их в виде отдельной микросхемы, либо IP-блока для систем, реализованных на кристалле. Поэтому разработка алгоритмов вычисления ' параметров глобального движения, которые не предъявляют высоких требований к вычислительным ресурсам и имеют эффективную аппаратную реализацию, является актуальной задачей.

Цель работы

Целью работы является разработка эффективного метода вычисления параметров глобального движения сцены в видеопоследовательностях. Для достижения поставленной цели необходимо решить следующие задачи:

Исследовать существующие методы вычисления параметров глобального движения сцены с целью выявления их достоинств и недостатков.

Разработать компактное представление изображений для использования в алгоритмах вычисления параметров глобального движения.

Разработать алгоритмы вычисления параметров глобального движения сцены с использованием компактного представления изображений.

Создать экспериментальный программно-аппаратный комплекс для проведения экспериментов по вычислению параметров глобального движения сцены.

Провести эксперименты по сравнению и показать преимущества разработанных алгоритмов по сравнению с широко распространенными методами.

Выработать требования к элементной базе, реализующей разработанные алгоритмы.

Научная новизна

Разработан новый способ вычисления параметров глобального движения в видеопоследовательностях, основанный на использовании интегральных характеристик бинаризованных изображений.
Разработан новый алгоритм вычисления параметров глобального движения, включающий:

процедуру выделения и совмещения «крупномасштабных» пиков интегральных характеристик;

итерационный алгоритм оценки комбинированных трансформаций.

3. Разработан новый способ вычисления параметров
глобального движения сцены, основанный на
использовании объектов бинаризованных изображений.

4. Разработан новый алгоритм вычисления параметров глобального движения, включающий:

процедуру вычисления интегральных параметров объектов бинаризованных изображений;

алгоритм установления соответствий между объектами бинаризованных изображений.

Практическая значимость работы

Разработанные алгоритмы вычисления параметров глобального движения повышают производительность систем кодирования видеопоследовательностей.
Предложенные алгоритмы вычисления параметров глобального движения применяются в разработанном в 000 «Юник Ай Сиз» устройстве видеосъемки -камкордер.
Результаты работы могут найти применение при создании различных систем сжатия видеопоследовательностей реального времени, а также в автоматизированных системах детектирования изменения сцены.
Проведенные теоретические оценки элементной базы могут быть применены при создании систем кодирования на кристалле.

Внедрение результатов работы

С использованием полученных в работе результатов разработано устройство видеосъемки -камкордер. Работа выполнена в рамках плана работ 000 «Юник Ай Сиз» на 2006г. Разработанные методы внедрены в учебный процесс кафедры ПКИМС МИЭТ(ТУ).

На защиту выносится:

1. Способ вычисления параметров глобального движения сцены, основанный на использовании интегральных . характеристик бинаризованных изображений. Данный способ позволяет снизить вычислительные затраты по сравнению с аналогами.

Алгоритм вычисления параметров глобального движения сцены, включающий процедуру выделения и совмещения «крупномасштабных» пиков интегральных характеристик, а также итерационный алгоритм оценки комбинированных трансформаций. Данный алгоритм позволяет снизить вычислительные затраты по сравнению с аналогами.
Способ вычисления параметров глобального движения сцены, основанный на использовании объектов бинаризованных изображений. Данный способ позволяет снизить вычислительные затраты по сравнению с аналогами.
Алгоритм вычисления параметров глобального движения сцены с использованием объектов бинаризованных изображений, включающий процедуру вычисления интегральных параметров объектов бинаризованных изображений, а также алгоритм установления соответствий между объектами бинаризованных изображений. Данный алгоритм позволяет снизить вычислительные затраты по сравнению с аналогами.
Разработанное математическое и алгоритмическое обеспечение устройства вычисления параметров глобального движения, реализуемое в системах на кристалле.

Апробация работы

Результаты диссертационной работы докладывались и обсуждались на международных и всероссийских научно-технических конференциях:

9-я всероссийская межвузовская научно-техническая конференция студентов и аспирантов «Микроэлектроника и информатика-2002», Москва, 2002;

7-я международная конференция «Распознавание образов и анализ изображений: новые информационные технологии», Санкт-Петербург, 2004;

12-я всероссийская межвузовская научно-техническая конференция студентов и аспирантов

«Микроэлектроника и информатика-2005», Москва, 2005;

XLVIII научная конференция МФТИ, Москва, 2005;

13-я всероссийская межвузовская научно-техническая конференция студентов и аспирантов «Микроэлектроника и информатика-2006», Москва, 2006.

Публикации

Основные результаты диссертационной работы опубликованы в 8 печатных работах.

Структура и объем диссертации

Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений.

Похожие диссертации на Разработка алгоритмов вычисления параметров глобального движения в видеопоследовательностях для реализации в системах на кристалле