Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Бабаян Александр Вигенович

Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах
<
Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бабаян Александр Вигенович. Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах : диссертация ... кандидата технических наук : 05.11.18 / Бабаян Александр Вигенович; [Место защиты: С.-Петерб. гос. ун-т кино и телевидения].- Санкт-Петербург, 2008.- 142 с.: ил. РГБ ОД, 61 09-5/1131

Содержание к диссертации

Введение

1. Обзор методов видеокомпрессии и оценки качества изображения в цифровых телевизионных системах 9

1.1 .Методы видеокомпрессии в цифровых телевизионных системах 9

1.2. Стандарты компрессии на базе дискретного косинусного преобразования 19

1.3.Искажения изображений в цифровых телевизионных системах с видеокомпрессией MPEG-2 25

1.4.Методы оценки качества изображения в цифровых телевизионных системах с видеокомпрессией MPEG-2 33

Выводы по главе 1 55

2. Исследование корреляционных взаимосвязей между представительными искажениями компрессии MPEG-2 и устойчивости D-изображения на шкале качества 58

2.1 .Постановка задачи 58

2.2. Исследование взаимосвязи проявлений представительных искажений изображений, кодированных по стандарту MPEG

2.2.1. Постановка эксперимента Q

2.2.2. Обработка и анализ результатов

2.3.Исследование устойчивости D-изображения

2.3.1. Постановка эксперимента

2.3.2. Обработка и анализ результатов fiq Выводы по главе 2

3. Разработка метода сегментации изображения

3.1 .Постановка задачи

3.2. Экспериментальное исследование заметности блочной структуры на различных участках компрессированного изображения

3.2.1. Постановка эксперимента

3.2.2. Обработка и анализ результатов 76

3.3.Поиск критерия сегментации компрессированного изображения

3.4.Разработка и проверка алгоритма сегментации

Выводы по главе 3 Q7

4. Разработка и исследование метода оценки заметности артефактов видеокомпрессии на базе ДОТ 99

4.1. Постановка задачи gQ

4.2. Разработка алгоритма измерения заметности блочной структуры .

4.3.Экспериментальное исследование метода оценки заметности блочной структуры на основе вычисления корреляционно- энергетического отношения

Выводы по главе 4 115

Заключение 128

Список использованных источников 130

Введение к работе

Развитие средств массовой информации, большую часть которых составляют средства передачи изображения - кинематографические и телевизионные системы, на современном этапе целиком связывается с внедрением цифровых технологий. Внедрение цифровых методов началось 20 лет назад с появления дорогих студийных устройств формирования и обработки телевизионных сигналов. В настоящее, время практически вся аппаратура формирования, обработки, кодирования и записи телевизионных сигналов является цифровой. Следующим шагом внедрения цифровых методов является переход на цифровое телевизионное вещание. В 2002 году Министерством Российской Федерации по связи и информатизации выпущено постановление «О внедрении наземного цифрового телевизионного вещания в России», принимающее за основу отечественного стандарта на цифровое телевизионное вещание стандарт DVB (Digital Video Broadcasting). Основной способ кодирования и представления изображения, предусматриваемый этим стандартом, - MPEG-2 [128]. Этот способ предусматривает устранение статистической и психофизической избыточности, присущей телевизионным изображениям, - видеокомпрессию.

Устранение психофизической избыточности изображения приводит к появлению искажений, при этом степень компрессии определяет их заметность. Характер, условия возникновения, пространственные и временные характеристики искажений в аналоговых и цифровых системах с компрессией существенно различаются. Неадекватность результатов, получаемых при объективных измерениях по старым методикам, субъективному качеству воспроизводимого изображения обуславливает необходимость поиска новых подходов к решению задач оценивания и контроля качества изображения.

Существенный вклад в развитие метрологической науки цифрового телевидения внесли М.И.Кривошеев [55-58], К.Ф.Гласман [19-25,57], В.П.Дворкович [38]. Большое значение при разработке методов интегральной оценки качества изображения в цифровых телевизионных системах получили принципы, изложенные в трудах М.В.Антипина [1-4], В.И.Белицкого [7-8], О.В.Гофайзена [32-34], Б.М.Певзнера [34,70], Н.Н.Коломенского [47-51], В.Г.Комара [52], Л.Л.Полосина [71].

К основным требованиям, предъявляемым к новым методам измерения качества изображения в цифровых системах, относятся:

• высокие точность и воспроизводимость результатов измерений в области порога допустимых ухудшений изображения

• возможность проведения измерений без перерыва в сетке вещания,

• простота аппаратной реализации.

Большинство разработанных к настоящему моменту методов этим требованиям не удовлетворяют. Методы, обеспечивающие высокую точность, сложны, дороги и, вследствие необходимости использования опорного изображения, требуют прерывания вещания для проведения измерений. Методы, основанные на анализе декодированного изображения, не учитывают особенностей зрительного восприятия искажений. Методы, основанные на анализе компрессированного цифрового потока, предполагают прямой доступ к нему, что не всегда возможно.

В работе М.И.Кривошеева и К.Ф.Гласмана [57] был предложен оригинальный подход к оценке качества изображения, прошедшего систему компрессии на базе дискретного косинусного преобразования (ДКП). Этот подход основан на использовании D-изображения в качестве опорного при оценке заметности искажений видеокомпрессии на основе оценки заметности наиболее представительного из них — блочной структуры. В отличие от оригинала, D-изображение может быть получено на приёмной стороне путём максимальной компрессии и является изображением, блочная структура в котором наиболее выражена. D-изображение - это прошедшее систему сжатия на базе ДКП изображение, при восстановлении которого все коэффициенты ДКП, кроме передающих средние в блоке ДКП значения яркости и цвета, принимались равными нулю. В качестве меры заметности блочной структуры предлагалось использовать яркостно-цветовой контраст на границах блоков ДКП. На основе этого подхода в работе [62] был предложен алгоритм оценки качества неподвижных изображений, компрессированных по стандарту MPEG-1, продемонстировавший потенциальные возможности использования D-изображения в качестве опорного.

Применение этого подхода к оценке качества изображения в системах телевизионного вещания по стандарту DVB, в которых используется видеокомпрессия класса MPEG-2, требует проведения дополнительных исследований. В частности, требуется экспериментально показать, что D-изображение имеет устойчивую с точки зрения эксперта оценку качества. Также необходимо научно обосновать допустимость оценки заметности всех искажений компрессии на основе оценки только одного искажения. Поэтому задача разработки метода объективных измерений качества динамических изображений в цифровых телевизионных системах является актуальной для современного этапа развития цифрового телевидения, основанного на широком применении кодеков компрессии на базе ДКП.

Однако, некоторые вопросы получения и использования D-изображения в качестве опорного не были проработаны. В частности, не было экспериментально показано, что D-изображение имеет устойчивую с точки зрения эксперта оценку качества. Также не была обоснована допустимость оценки заметности всех искажений компрессии на основе оценки только одного искажения - блочной структуры. При расчёте рейтинга заметности искажений не было учтено маскирующее влияние структуры самого изображения на заметность искажений видеокомпрессии.

Поэтому задача разработки и исследования методов объективных измерений качества динамических изображений в цифровых телевизионных системах с видеокомпрессией MPEG-2 является актуальной для современного этапа развития цифрового телевидения, основанного на широком применении кодеков видеокомпрессии на базе ДКП. В диссертации поставлены и решены следующие задачи:

1. Классификация искажений изображения в телевизионных системах с видеокомпрессией MPEG-2 по причинам появления и формирование перечня представительных искажений.

2. Экспериментальное исследование корреляционных взаимосвязей между визуальными проявлениями представительных искажений видеокомпрессии MPEG-2 и обоснование оценки заметности всей совокупности искажений видеокомпрессии MPEG-2 по проявлениям одного из представительных искажений.

3. Экспериментальное исследование устойчивости D-изображения на шкале качества, обладающей свойствами шкалы интервалов, относительно некомпрессированного изображения.

4. Экспериментальное исследование заметности блочной структуры на участках изображения с различным уровнем межэлементного яркостно-цветового контраста. Разработка и исследование метода сегментации компрессированного изображения для учёта маскирующего воздействия структуры изображения при оценке заметности искажений.

5. Разработка метода оценки заметности искажений изображения в телевизионных системах с видеокомпрессией MPEG-2 на основе корреляционно-энерегетического критерия, характеризующего заметно сть представительного искажения - блочной структуры.

6. Экспериментальная проверка и оптимизация разработанного метода для оценки качества типичных телевизионных изображений в телевизионных системах с видеокомпрессией MPEG-2 MP@ML в диапазоне скоростей цифрового потока от 2 до 10 Мбит/с.

В ходе решения поставленных задач были разработаны следующие научные положения, которые и выносятся на защиту:

1. Классифицировать искажения изображения в телевизионных системах с видеокомпрессией MPEG-2 следует по причинам возникновения. Такая классификация позволяет выделить представительные искажения, имеющие наиболее высокий экспертный рейтинг заметности.

2. При разработке эффективного метода оценки заметности искажений видеокомпрессии MPEG-2 необходимо учитывать существование сильной корреляционной взаимосвязи между проявлениями представительных искажений.

3. При оценке качества компрессированного изображения необходимо учитывать, что заметность искажений компрессии существенно зависит от локальных пространственных характеристик изображения. Поэтому эффективный метод оценки заметности искажений видеокомпрессии должен включать алгоритм адаптивной сегментации изображения, выделяющий сегменты высокой заметности искажений.

4. При оценке локальной заметности блочной структуры следует учитывать яркостно-цветовой контраст границ блоков ДКП и маскирующее воздействие объектов компрессированного изображения. Одновременный учёт этих факторов обеспечивает корреляционно-энерегетическое отношение, рассчитываемое для каждого блока ДКП.

5. Для достижения максимальной точности оценки качества последовательности изображений в телевизионных системах с видеокомпрессией MPEG-2 следует использовать алгоритм усреднения скользящего минимума временного ряда значений корреляционно-энергетического критерия.

Стандарты компрессии на базе дискретного косинусного преобразования

Требование дешевизны накладывает ограничение на сложность аппаратуры кодирования. Поэтому описанные методы кодирования призваны устранять только пространственную избыточность, и, следовательно, существенной характеристикой, ограничивающей их применение сферой подготовки (съёмка, монтаж) телевизионного материала, является высокая скорость цифрового потока, необходимая для обеспечения вещательного качества изображения, но неприемлемая при передаче и распределении телевизионных программ. Решению этой проблемы послужило создание семейства стандартов MPEG. MPEG (Moving Picture Experts Group) - общее название стандартов, определяющих компрессию последовательностей динамических изображений для различных областей применения [128]. Кодеры MPEG устраняют пространственную, временную и психофизическую избыточность изображений. Ключевые компоненты системы сокращения пространственной избыточности совпадают с JPEG - дискретное косинусное преобразование, квантование, кодирование с переменной длиной слова. Сокращение временной избыточности выполняется с использованием дифференциальной импульсно-кодовой модуляции, дополненной оценкой вектора движения и компенсацией движения при предсказании. Система MPEG асимметрична, ее кодеры гораздо сложнее декодеров, поскольку в их задачи входит оценка вектора движения и выбор оптимальной стратегии кодирования, что требует значительных вычислительных мощностей.

Кодеки MPEG-1 предназначены для компрессии потока видеоданных в системах мультимедиа. В типичном варианте они используют построчно разлагаемые изображения формата CIF и осуществляют компрессию видеоданных до 1,2 Мбит/с при сохранении качества на уровне домашнего видео (VHS).

Наиболее значительное усовершенствование второго стандарта MPEG-2 - обеспечение работы с чересстрочными изображениями, расширение возможностей оценки вектора движения и режимов предсказания. MPEG-2 поддерживает два масштабируемых профиля, предполагающих разделение цифрового потока на слои при кодировании. Базовый слой может декодироваться сам по себе, независимо от высших слоев. Декодирование базового слоя обеспечивает приемлемое качество изображения. Декодирование всех слоев позволяет уменьшить шумы квантования и улучшить пространственное разрешение. Масштабируемые профили удобны при передаче видеоданных в пакетной форме. MPEG-2 поддерживает и широкий диапазон значений качества - от уровня "видео для дома" до телевидения высокой четкости.

Сфера применения MPEG-2 резко расширилась в сравнении с MPEG-1. MPEG-2 охватывает производство телевизионных программ, распределение программ с использованием наземных и спутниковых линий коммуникации, системы мультимедиа. Поэтому в рамках стандарта MPEG-2 была разработана система профилей и уровней. Профиль - это подмножество стандарта для специализированного применения, задающее алгоритмы и средства компрессии. Уровни внутри каждого профиля связаны с параметрами компрессируемого изображения. Профили MPEG-2: - Simple - простой профиль. Он использует только I и Р изображения, в нем невозможно двунаправленное предсказание. - Main - основной профиль. Он поддерживает I, Р и В изображения. Использование В изображений связано с дополнительной задержкой из-за необходимости изменения порядка следования кадров. - SNR - профиль с масштабируемым квантованием (SNR - Signalo-Noise-Ratio - отношение сигнал/шум). Профиль поддерживает все типы изображений. На базовом уровне кодера используется обычное кодирование на основе предсказания с компенсацией движения, дискретного косинусного преобразования и квантования ошибки предсказания. Выходные данные этого кодера образуют нижний или базовый слой цифрового потока данных. Ошибка квантования, обусловленная квантователем, кодируется (с использованием второго квантователя и кодера с переменной длиной слова) и передается в качестве верхнего слоя цифрового потока. На приемной стороне производится либо декодирование одного базового слоя, что обеспечивает приемлемое качество, либо обоих слоев, что позволяет уменьшить шумы квантования. - Spatial - профиль с масштабируемым пространственным разрешением (spatial - пространственный). Использует все виды изображений. Цифровой поток структурирован и имеет базовый и дополнительные слои. Профиль позволяет иметь наряду с базовым пространственным разрешением и более высокие значения, если декодировать все слои цифрового потока. - High - высокий профиль. Коэффициент компрессии минимален, качество изображения наивысшее. - Studio - студийный профиль. Он обеспечивает полное разрешение, монтаж с точностью до кадра, допускает многократные перезаписи. Уровни MPEG-2: - Low - нижний уровень. Поддерживает изображения с разрешением 360x288 (360 элементов в строке, 288 строк). - Main - основной уровень. Поддерживает изображения с разрешением 720x576. - High-1440 - высокий уровень-1440. Поддерживает телевизионные изображения высокой четкости с разрешением 1440x1152. - High - высокий уровень. Поддерживает телевизионные изображения высокой четкости широкого формата с разрешением 1920x1152 (HDTV-plus).

К настоящему времени лишь часть из возможных сочетаний профилей и уровней достаточно разработана и принята в качестве стандарта. Для основного профиля установленные цифровые потоки ограничиваются следующими величинами: 80 Мбит/с (высокий уровень), 60 Мбит/с (высокий уровень-1440), 15 Мбит/с (основной уровень), 4 Мбит/с (нижний уровень). Студийному, или 422-профилю соответствует величина потока до 50 Мбит/с. Большинство выпускаемых в настоящее время декодеров в интегральном исполнении относятся к основному профилю и основному уровню (MP@ML).

Стандарт кодирования MPEG допускает работу, как в режиме постоянного качества, так и в режиме постоянной скорости цифрового потока, за счёт устранения временной избыточности позволяет получать высокое качество изображения при невысоких скоростях цифрового потока. Вследствие асимметричности кодека MPEG абонентское оборудование удовлетворяет требованию дешевизны, а кодер может быть достаточно сложен и обеспечивать высокое качество изображения. Благодаря высокой гибкости стандарт находит применение в аппаратуре подготовки программ - системах нелинейного монтажа и магнитной видеозаписи; например, в магнитофонах формата IMX применяется внутрикадровая компрессия со скоростью цифрового потока 50 Мбит/с, в магнитофонах Betacam SX - межкадровая компрессия с двунаправленным предсказанием и открытой группой изображений. Недостатком MPEG является невозможность монтажа (коммутации) потоков MPEG без декодирования в случае, если исходный материал закодирован с предсказанием.

Таким образом, имеющиеся на данный момент стандарт видеокомпрессии MPEG-2 полностью удовлетворяет потребностям современной телевизионной отрасли от записи исходного материала до распределения готовых программ.

Исследование взаимосвязи проявлений представительных искажений изображений, кодированных по стандарту MPEG

При планировании эксперимента решались следующие задачи: выбор шкалы, выбор экспертов, инструкция для экспертов, выбор тестовых изображений, выбор диапазона изменения параметров кодирования MPEG-2.

При выборе шкалы учитывался характер даваемых экспертами оценок. В данном эксперименте необходимо оценивать заметность искажений, поэтому применялась шкала ухудшений с двойным стимулом. Эта шкала оперирует оценками «незаметно», «заметно, но не мешает», «заметно, несколько мешает», «мешает», «очень мешает» [31,115]. Эта шкала обладает свойствами шкалы интервалов, как было показано в [19].

При выборе экспертов необходимо учитывать сложность стоящей перед ними задачи. В данном случае от эксперта требовалось оценить заметность каждого искажения из списка представительных искажений в отдельности, не обращая внимания на остальные. Поэтому к эксперименту были привлечены 10 экспертов в области обработки и сжатия изображений - инженеров и научных сотрудников СПбГУКиТ и МГНПП «ДИП».

В качестве тестовых изображений были выбраны 6 динамических сюжетов из тестовых последовательностей, рекомендованных группой экспертов по качеству изображения (VQEG) для исследования систем с видеокомпрессией [111,113]. Стоп-кадры из этих последовательностей приведены на рисунке 12.

Тестовые последовательности кодировались кодером MPEG-2 MPEG Software Group MPEG-2 MP@ML Video Encoder [112] со скоростями цифрового потока 3 Мбит/с, 4 Мбит/с, 5 Мбит/с, 6 Мбит/с, 8 Мбит/с, 10 Мбит/с.

Для проведения экспериментального исследования была разработана и собрана видеокомпьютерная установка, обеспечивающая сжатие тестовых видеопоследовательностей с заданными параметрами и воспроизведение их на внешнем воспроизводящем устройстве -профессиональном видеомониторе с компонентными входами (рисунок 13). Экран установки был окружён световым полем, определяющим уровень адаптации зрительного анализатора. Условия наблюдения были установлены в соответствии с требованиями рекомендации ITU-R ВТ.500-12 [115]. Расстояние наблюдения было принято равным 4Н (Н - высота экрана видеомонитора). Эксперту давалась следующая инструкция: «пользуясь шкалой ухудшений, оцените заметность и мешающее воздействие только блочной структуры (только размытия изображения, только шума базовых функций, только разрушения границ)».

В течение одной серии эксперимента эксперт давал оценки заметности одного из представительных искажений для тестового сюжета, кодированного с разными скоростями цифрового потока. В пределах одной серии менялась только скорость цифрового потока, а тестовый сюжет и вид оцениваемого искажения фиксировались. Порядок следования элементов серии был принят случайным во избежание монотонного нарастания (убывания) заметности искажения от начала к концу серии. Элементарное оценивание представляло собой следующую последовательность предъявлений: 8 секунд - некомпрессированное изображение, 3 секунды - серое поле, 8 секунд - оцениваемое изображение, 10 секунд - принятие решения. Длительность элементарного оценивания составляла 30 секунд. Одна серия эксперимента содержала по 6 элементарных оцениваний и длилась 3 минуты. В следующей серии менялся тестовый сюжет и/или вид оцениваемого искажения. Каждый эксперт проходил 36 серий экспериментов (6 тестовых сюжетов X 6 степеней компрессии). В течение каждой серии эксперт самостоятельно фиксировал оценки в предварительно заготовленном типовом бумажном бланке. Каждая серия экспериментов предварялась короткой тренировочной серией. Оценки, полученные в ходе тренировочной серии, при обработке результатов не учитывались.

Экспериментальное исследование заметности блочной структуры на различных участках компрессированного изображения

Для проведения эксперимента использовалась экспериментальная установка, структурная схема которой приведена на рисунке 16. Для проведения данного эксперимента была использована следующая процедура: эксперт, самостоятельно увеличивая степень компрессии путём изменения фактора квантования, находил такое его значение q3aM, при котором на одном или нескольких участках изображения становилась заметной блочная структура. Заметность искажения при этом должна была соответствовать оценкам шкалы ухудшений «заметно, но не мешает» или «заметно, немного мешает» [31]. Время поиска не ограничивалось, фиксировались только условия наблюдения экранного изображения (расстояние наблюдения, яркость экрана, яркость поля адаптации) в соответствии с требованиями рекомендации ITU-R ВТ.500. После того, как блочная структура была обнаружена, эксперт фиксировал значение фактора квантования и с помощью манипулятора «мышь» помечал участок изображения, на котором замечал проявления блочной структуры. Помеченные блоки получили название сегмента наибольшей заметности блочной структуры. Доля помеченных блоков ДКП при этом ограничивалась снизу и должна была превышать 10% от общего количества блоков в изображении. Для фиксации значения q3aM использовался бумажный бланк, а пространственные координаты помеченных блоков запоминались программным обеспечением видеокомпьютерной установки для дальнейшей статистической обработки.

В качестве тестовых изображений было выбрано по 13 стоп-кадров из 6 динамических тестовых сюжетов, рекомендованных группой экспертов по качеству изображения VQEG для исследования систем с видеокомпрессией [111,113]. Тренировочная серия не предусматривалась.

К эксперименту были привлечены 3 эксперта, являющихся специалистами в области обработки и сжатия изображений - инженеров и научных сотрудников СПбГУКиТ и МГНПП «ДИП».

Как было сформулировано выше, заметность блочной структуры в существенной степени зависит от пространственных характеристик распределения яркости и цветности изображения. Карта градиентов фактически представляет собой массив значений модуля производной по пространственным координатам х и у, взятой от дискретной функции, каковой является оцифрованное изображение, в равноконтрастном цветовом пространстве LUV [40]. Значение градиента характеризует межэлементную активность яркости и цветности в данной точке изображения.

Для выявления отличительных особенностей сегмента наибольшей заметности блочной структуры были построены взвешенные гистограммы градиентов помеченных блоков и гистограммы градиентов всех блоков изображения (значения градиента на границах блоков при этом исключались).

Из этих рисунков видно, что диапазон значений градиента, в котором расположена гистограмма градиентов помеченных экспертами блоков, заметно меньше диапазона значений градиентов всех блоков изображения. Полученные результаты демонстрируют возможность использования градиента, вычисляемого по формуле (20), для выделения сегментов изображения, на которых заметность блочной структуры максимальна.

Экспериментальное исследование с последующей обработкой результатов показало, что градиент как характеристика межэлементной активности яркости и цветности компрессированного изображения может использоваться в качестве пространственной характеристики маскирующей способности изображения по отношению к артефактам видеокомпрессии на базе ДКТТ.

Предлагается алгоритм сегментации компрессированного изображения, блок-схема которого приведена на рисунке 30. Процесс сегментации заключается в назначении каждому блоку компрессированного изображения атрибута, определяющего принадлежность блока к одному из сегментов: ? сегмента «0» (сегмент наибольшей заметности блочной структуры) - участки изображения, на которых блочность наиболее заметна и проявляется в виде регулярной структуры из ложных контуров, ? сегмента «1» - участки изображения, где блочная структура визуально не проявляется или проявляется слабо в виде отдельных горизонтальных или вертикальных ложных контуров.

Разработка алгоритма измерения заметности блочной структуры

Концепция оценки качества компрессированного изображения с привлечением D-изображения в роли опорного подразумевает вычисление некоторой меры PR (picture rating), минимальное значение которой PRmin = 0, соответствует отсутствию заметных различий между проявлениями блочной структуры в оцениваемом и D-изображении, то есть их визуальное совпадение. Значение PRmjn = PRD = 0 соответствует вербальной оценке «хуже не бывает», при этом подразумевается наихудшее качество в рамках системы компрессии на базе ДКП при отсутствии ошибок в декодированных видеоданных.

Сопоставление инструментально полученного значения PR с результатами субъективных экспертиз качества изображения возможно, если максимальное значение PRmax будет нормировано. Например, PRmax соответствующее вербальной оценке «лучше не бывает» и получаемое при обработке некомпрессированного оригинального изображения, может быть установлено PRmax = PRoriginai = 1 Это значение соответствует максимальным различиям в заметности блочной структуры между оцениваемым и D-изображением, то есть отсутствию заметной блочной структуры.

Предлагается следующая последовательность вычисления PR. 1) Обработка принятого изображения с целью получения D-изображения. Для этого каждый блок изображения размером 8x8 отсчётов подвергается прямому ДКП, принудительному обнулению всех коэффициентов ДКП, кроме постоянной составляющей, и обратному ДКП. Постоянные составляющие яркости и цветности в стандарте MPEG-2 представляются с высокой точностью и не искажаются даже при сильной компрессии. Это означает, что D-изображения, получаемые из одного и того же сюжета, будут практически одинаковы независимо от степени сжатия оцениваемого изображения. 2) Линейное преобразование оцениваемого и D-изображения в равноконтрастное цветовое пространство LUV - пространство, где приращение стимула вызывает пропорциональное приращение ощущения. Это позволяет отказаться от параллельного анализа искажений яркости и цветности и оперировать для каждого отсчёта одним числом.

Для проверки предложенного алгоритма оценки, полученные с его помощью, сопоставлялись с оценками, полученными при субъективных измерениях. Целью проведения экспериментального исследования являлось сопоставление субъективных оценок с результатами объективных измерений с помощью предложенного алгоритма.

Для проведения эксперимента была использована видеокомпьютерная установка и программное обеспечение, разработанная для исследований, описанных в главе 2 (см. рисунок 13). Экран установки был окружён световым полем, определяющим уровень адаптации зрительного анализатора, в соответствии с рекомендацией ITU-RBT.500 -12[115].

Программное обеспечение предназначалось для подготовки тестового материала и его предъявления в соответствии с планом эксперимента. Тестовый материал представляет собой 5 динамических тестовых сюжетов с различным сюжетным наполнением, рекомендованных группой экспертов по качеству изображения VQEG для исследования систем с видеокомпрессией [111,113]. Длительность каждого тестового сюжета составляла 8-10 секунд. Тестовые последовательности кодировались кодером MPEG-2 MPEG Software Group MPEG-2 MP@ML Video Encoder [112] со скоростями цифрового потока 2 Мбит/с, 2,5 Мбит/с 3 Мбит/с, 4 Мбит/с, 5 Мбит/с, 6 Мбит/с, 7 Мбит/с, 8 Мбит/с, 10 Мбит/с.

Эксперимент проводился по процедуре с двумя стимулами и шкалой ухудшений [31,115]. Эксперту предъявлялся оригинал изображения, а затем тестовое изображение, компрессированное кодеком на базе ДЕЛ - MPEG-2 MP@ML, с разной скоростью сжатия цифрового потока. Временные параметры предъявления соответствовали рекомендациям ITU-R ВТ.500-12 [115]. Оценки эксперта фиксировались на специальном бланке с надписями, соответствующими категориям шкалы ухудшений («незаметно»-5 баллов, «заметно, но не мешает»-4, «немного мешает»-3, «мешает, раздражает»-2, «сильно мешает»-1).

Эксперимент проводился на LCD мониторе диагональю 21", при максимальной яркости экрана 100 Кд/м2 и на расстоянии наблюдения 4Н, где Н- высота экрана. К экспертизам были привлечены 25 экспертов - студенты Санкт-Петербургского государственного университета кино и телевидения. Каждой серии экспериментов предшествовала тренировочная серия, результаты которой при последующей обработке не учитывались.

Похожие диссертации на Исследование и разработка методов контроля качества изображения в цифровых телевизионных вещательных системах