Содержание к диссертации
Введение
1. Оценка качества сжатых изображений на основе традиционных эталонных критериев 17
1.1. Стандарт JPEG 17
1.1.1. Алгоритм сжатия - Baseline JPEG 18
1.1.2. Основные характеристики стандарта JPEG 18
1.2. Стандарт JPEG2000 21
1.2.1. Основные характеристики стандарта JPEG2000 21
1.3. Алгоритм SPIHT 24
1.3.1. Прогрессивная передача в алгоритме SPIHT 26
1.3.2. Основные характеристики алгоритма SPIHT 27
1.4. Субъективные критерии качества 28
1.5. Объективные критерии качества 30
1.5.1. Пиковое отношение сигнал/шум 31
1.5.2. Недостатки объективных критериев оценки качества изображений, базирующихся на среднеквадратичной ошибке 32
1.5.3. Модификация ПОСЛІ с учетом характеристик зрительной системы человека 34
1.5.4. Универсальный индекс качества 35
1.6. Сравнительный анализ алгоритмов сжатия изображений относительно критериев ПОСШ и УИК 39
1.7. Краткие выводы 46
2. Неэталонные алгоритмы оценки качества jpeg - изображений 47
2.1. Вводные замечания 47
2.2. Неэталонный индекс качества 49
2.2.1. Расчет неэталонного индекса качества 49
2.2.2. Нормализация оценки НИК 51
2.2.3. Результаты тестирования НИК 54
2.3. Нейросетевой неэталонный индекс качества 57
2.3.1. Расчет нейросетевого неэталонного индекса качества 57
2.3.2. Обучение и работа нейронной сети 65
2.3.3. Результаты тестирования ННИК 71
2.4. Неэталонный индекс блочности 73
2.4.1. Математическая модель блочности 73
2.4.2. Представление модели блочности в пространстве ДКП 76
2.4.3. Измерение артефактов блочности с учетом характеристик зрительной системы человека 77
2.4.4. Результаты тестирования НИБ 79
2.5. Сравнительный анализ предложенных неэталонных алгоритмов оценки качества n>EG - изображений 81
2.6. Краткие выводы 85
3. Неэталонный алгоритм оценки качества изображений, сжатых на основе вейвлет - преобразования 86
3.1. Вводные замечания 86
3.2. Статистическая модель изображения в вейвлет-области 89
3.3. Алгоритм неэталонной оценки качества изображений стандарта №02000 ... 93
3.3.1. Расчет неэталонного индекса качества 93
3.3.2. Вычисление значений порогов 94
3.3.3. Упрощение модели 98
3.3.4. Оптимизация параметров НИК2000 99
3.4. Результаты тестирования НИК2000 101
3.5. Краткие выводы 105
4. Улучшение изображений на основе алгоритма удаления блочности 107
4.1. Вводные замечания 107
4.2. Алгоритм уменьшения артефактов блочности 109
4.2.1. Нахождение краев объектов на изображении 111
4.2.2. Алгоритм постобработки для границ второго типа 113
4.2.3. Алгоритм постфильтрации в пространстве ДКП границ второго и третьего типа 115
4.2.4. Ограничение коэффициентов ДКП после процедуры постфильтрации 117
4.3. Настройка параметров алгоритма удаления блочности 118
4.4. Анализ работы алгоритма удаления блочности 124
4.4.1. Анализ ПОСШ обработанного изображения 124
4.4.2. Анализ НИБ обработанного изображения 126
4.4.3. Визуальный анализ работы алгоритма 127
4.4.4. Сравнение времени работы различных алгоритмов улучшения JPEG - изображений 129
4.5. Краткие выводы 130
Заключение 132
Список литературы
- Основные характеристики стандарта JPEG
- Расчет неэталонного индекса качества
- Алгоритм неэталонной оценки качества изображений стандарта №02000
- Алгоритм постобработки для границ второго типа
Введение к работе
Актуальность работы. Подписание Российской Федерацией Болонских соглашений, направленных на согласование систем образования европейских стран, потребовало проведения различных мероприятий по модернизации и реорганизации российской системы образования. Планируемые мероприятия объединены в рамках «Федеральной целевой программы развития образования» (ФЦПРО) [83], одной из задач .которой определено «...повысить качество образования на основе обновления его структуры, содержания и технологий обучения».
Сущность Болонских соглашений и ФЦПРО состоит в разработке согласованных стандартов образования, определяющих состав требований к выпускнику вуза, которые дают возможность к самообразованию в течение всей жизни на основании приобретенных в процессе обучения компетенций.
Кроме того, в ФЦПРО указано, что необходимо «...внедрение новых образовательных технологий и принципов организации учебного процесса, обеспечивающих эффективную реализацию новых моделей непрерывного образования, в том числе с использованием современных информационных и коммуникационных технологий».
На основании этих требований в каждом вузе должна быть разработана и введена в действие корпоративная информационная система учебного заведения (КИС УЗ).
В науке и промышленности всех стран идет процесс внедрения новых информационных технологий (CALS-технологий), основанных на понятии электронной модели изделия (ЭМИ), в которой накапливаются и используются данные об изделии на всех этапах жизненного цикла (ЖЦИ) от маркетинга до утилизации.
Учитывая тот факт, что между промышленным предприятием и учебным заведением можно провести аналогию по различным критериям, то идеология CALS, се методы и средства, принципы организации и применения, могут быть использованы для учебного процесса.
В число информационных технологий, составляющих сущность CALS [52, 64,], помимо систем автоматизации проектирования, создающих основную часть (до 80-85 %) ЭМИ, входят системы управления производством (ERP), и ряд других. Разработке и проблемам внедрения таких систем посвящено значительное число работ [52, 16, 11, 78]. Стали появляться разработки корпоративных систем для управления вузами [3, 62, 82]. Разработаны требования по функциональным возможностям [30] и базовому программному обеспечению ERP-системы вуза. Имеются разработки отдельных функциональных блоков систем оперативного управления учебным процессом конкретной дисциплины на конкретной кафедре, реализующие отдельные решения, связанные с учебным процессом, но нет системы, охватывающей все аспекты учебного процесса на уровне «преподаватель - студент». В любом вузе кафедра, обучающая или выпускающая, является основным структурным подразделением, ведущем, помимо научно-исследовательской работы, основную учебную и воспитательную работу со студентом по целому спектру дисциплин. Кроме того, кафедра, как низовое производственное звено в структуре вуза, обязана предоставлять оперативную и достоверную информацию для ERP - систем более высокого уровня (деканат, ректорат и т.п.).
Существующая в вузах в настоящий момент организация учебного процесса, основанная на использовании частных методик преподавания учебных дисциплин [10, 56, 95], не ориентирована на использование информационных технологий в управлении. Персональные компьютеры и различное программное обеспечение широко применяются в учебном процессе преподавателями чаще всего в качестве технических средств обучения [ 16, 34, 93].
В ведущих" зарубежных вузах [63] осуществлен переход к использованию информационных технологий в управлении учебным процессом, что повлекло за собой изменения в организации всего учебного процесса, связанных с разработкой технологий обучения [87].
Можно сделать вывод, что технология обучения в высшей школе должна иметь направленность на использование в учебном процессе ERP -системы оперативного управления, что также делает актуальной данную работу.
Объектом исследования является Интегрированная
Информационная Среда предприятия (вуза) как совокупность распределённых баз данных.
Предметом исследования является система оперативного управления учебным процессом кафедры, содержащая сведения о студенте, производственной среде, ресурсах и процессах кафедры.
Цель работы - разработка системы оперативного управления учебным процессом кафедры технического вуза и ее применение на примере преподавания геометро-графических дисциплин. Для достижения поставленной цели требуется решение следующих задач: исследование существующих корпоративных систем управления вузами; выявление и исследование моделей, составляющих основу системы оперативного управления учебным процессом кафедры технического вуза; выявление возникающих в ходе реализации учебного процесса на кафедре технического вуза информационных потоков и анализ их взаимосвязей; разработка структуры системы оперативного управления учебным процессом кафедры технического вуза; разработка алгоритмов и программной реализации системы оперативного управления учебным процессом кафедры технического вуза; - применение разработанной системы оперативного управления учебным процессом кафедры технического вуза.
Методы исследования. Теоретические исследования выполнены с использованием методов системного анализа, методов аналогий, теории графов и математической логики. Исследования базируются на всестороннем анализе отечественных и зарубежных источников, сравнительном анализе известных программных продуктов корпоративных информационных систем учебных заведений.
Экспериментальные исследования выполнены с помощью разработанной системы оперативного управления учебным процессом кафедры технического вуза.
Достоверность и обоснованность полученных в работе результатов и выводов подтверждается положительными результатами проведенных экспериментальных исследований и опытом практической эксплуатации разработанной системы оперативного управления учебным процессом кафедры технического вуза.
Научная новизна диссертационного исследования состоит в том, что: осуществлено преобразование вербального описания технологической модели обучения в алгоритм действий преподавателя по формированию основной образовательной программы; разработанный алгоритм представлен в виде набора функциональных схем, показывающих связи между составными частями технологической модели обучения и созданных в соответствии с методологией международного стандарта функционального моделирования IDEF0; разработана структура системы оперативного управления учебным процессом кафедры технического вуза; разработана структура и осуществлена программная реализация составных . частей автоматизированного рабочего места преподавателя.
На защиту выносятся: результаты анализа существующих корпоративных систем управления вузами;
IDEF-схемы технологической модели учебного процесса; структура системы оперативного управления учебным процессом кафедры .технического вуза; результаты применения в процессе обучения разработанной системы оперативного управления учебным процессом кафедры технического вуза.
Практическая значимость.
Работа выполнена в рамках ведомственной научной программы «Развитие научного потенциала высшей школы», тема «Совершенствование структуры, содержания и методологии разработки государственных образовательных стандартов многоуровневого высшего профессионального образования на примере архитектурно-строительного профиля» (№ ГР 0120050003784).
Разработанное программное обеспечение информационной системы управления и контроля учебным процессом зарегистрировано в Федеральном институте промышленной собственности как «Система оперативного управления учебным процессом кафедры вуза». Получено свидетельство № 2008612957 (Приложение 5) [67].
Материалы диссертации использованы в Федеральном государственном учреждении «Национальное аккредитационное агентство в сфере образования» (Росаккредагентство), в г. Йошкар-
Ола, при подготовке аттестационных педагогических измерительных материалов (АПИМ) по блоку геометро- графических дисциплин для проведения централизованного ИНТЕРНЕТ-тестирования вузов Российской Федерации. Акты об использовании приведены в приложении 6. Реализация результатов работы. Результаты диссертационной работы внедрены в учебный процесс на кафедре «Начертательная геометрия, машинная графика и теоретические основы САПР» Нижегородского государственного архитектурно-строительного университета по дисциплинам «Начертательная геометрия» и «Компьютерная графика».
Апробация работы. Материалы диссертации докладывались на следующих конференциях:
Украино-Российская научно-практическая конференция «Современные проблемы геометрического моделирования» (г. Харьков, ХГУПТ, 2005 г.);
Всероссийские семинары-совещания заведующих кафедрами графических дисциплин вузов РФ (г. Саратов, СГТУ, 2004 г., г. Пермь, ПГТУ, 2005 г., г. Казань, КГТУ, 2006 г., ЮУрГУ, г. Челябинск, 2007 г.);
Поволжская региональная научно-методическая конференция «Компьютерная графика и мультимедийные технологии в задачах конструирования и проектирования», г. Саратов, СГТУ, 2006 г., 2007 г.
Международная конференция «Интеллектуальные информационные системы», г. Геленджик, НИИМВС, 2007 г.
Публикации. По материалам диссертации опубликовано 14 статей, в том числе 3 в ведущих изданиях, рекомендованных ВАК РФ.
Структура и объем работы. Диссертационная работа состоит из введения, трёх глав, заключения и приложений. Основной текст изложен на 134 машинописных страницах с иллюстрациями. Список литературы включает 98 наименований.
Основные характеристики стандарта JPEG
Существует 4 режима работы стандарта JPEG [17]:
1. Режим без потери качества (Lossless). Кодирование осуществляется в один проход, и восстановленное изображение является точной копией оригинала.
2. Последовательный режим с применением дискретного косинусного преобразования (Sequential). Сжатие с потерями осуществляется в один проход с применением дискретного косинусного преобразования (ДКП). Восстановленное изображение является приближенной копией оригинала.
3. Прогрессивный режим с применением дискретного косинусного преобразования (Progressive). Изображение кодируется и декодируется в несколько проходов. Каждый следующий проход улучшает качество восстановленного изображения по сравнению с предыдущим.
4. Иерархический реэюим (Hierarchical). Сжатие изображения с несколькими разрешениями для отображения на различных устройствах.
Последние три режима стандарта JPEG являются методами сжатия изображений с потерями качества, поскольку существует ограничение точности вычисления прямого и обратного ДКП, а также искажения, вызванные квантованием коэффициентов. В случае применения последовательного режима без потерь, вместо ДКП используется кодирование, основанное на предсказании, а также отсутствует операция квантования. Иерархический режим использует как кодирование с использованием ДКП, так и метод кодирования, основанный на предсказании. Простейшей формой последовательного режима с применением ДКП является алгоритм — JPEG Baseline, использующий в качестве энтропийного кодера алгоритм Хаффмана [17,22-23,26]. Другим вариантом последовательного режима с применением ДКП является алгоритм, основанный на арифметическом кодировании. Алгоритм Baseline JPEG получил наиболее широкое распространение на практике и будет подробно рассмотрен ниже [17,23,40].
Алгоритм сжатия Baseline JPEG наиболее часто используется среди всех четырех режимов стандарта JPEG. Он определен для сжатия полутоновых и полноцветных изображений, представленных в цветовых системах RGB или CMYK. Baseline JPEG позволяет использовать только 8 бит для представления каждой цветовой компоненты. Следует отметить, что в типичном цветном изображении существует значительная пространственная корреляция между цветовыми компонентами. Для достижения наилучшего сжатия корреляция между компонентами цветности уменьшается за счет преобразования трех компонент RGB изображения в цветовое пространство YCbCr [26,29]. При таком представлении, цвета яркостная и цветоразностная компоненты изображения мало коррелированы между собой и содержат значительную часть избыточной информации. Они могут быть сокращены без заметной потери визуального качества восстановленного изображения.
Этапы работы алгоритма Baseline JPEG приведены на рис. 1.1. и более подробно описаны в приложении 1.
Существенными положительными качествами алгоритма JPEG являются [36, 40]: — возможность гибкого задания коэффициента сжатия изображения; — широкая поддержка стандарта во всевозможных графических и других приложениях; — эффективная реализация стандарта на интегральных микросхемах, что обусловило его широкое распространение в цифровой технике. Входное изображение ,г Преобразование цветового пространства т Разбиение на блоки 8x8 пикселей і г Дискретное косинусное преобразование Квантование «- Спецификации таблиц квантования Зигзагообразное сканирование і Энтропийное кодирование - Спецификации энтропийных кодов
Сжатое изображение Рис. 1.1. Схема кодирования для алгоритма Baseline JPEG Стандарт JPEG предусматривает ряд специальных режимов сжатия [17, 124]. Режим без потерь (JPEG-LS) предназначен для применения в случаях, когда требуется идентичное восстановление сжатого изображения. В этом режиме величина каждого пикселя предсказывается в виде отличий от соседних с ним пикселей. Эта величина кодируется с использованием кодов переменной длины. Не используется субдискретизация и преобразование цветов. JPEG-LS, как и любой другой алгоритм сжатия без потерь, обеспечивает существенно худшее сжатие, чем соответствующие алгоритмы с потерями. При кодировании реальных изображений он может обеспечить коэффициент сжатия порядка двух [25, 40, 54].
Прогрессивный режим может быть использован при передаче изображения по каналу связи с низкой пропускной способностью. В этом случае пользователь может прервать оказавшуюся ненужной передачу данных. Различают два прогрессивных метода [17, 124]: - режим спектрального выбора, при котором сначала пересылаются компоненты нижних частот каждого из блоков, а затем компоненты более высоких частот (пространственная масштабируемость); - режим последовательной аппроксимации, при котором сначала пересылается некоторое число старших бит каждой закодированной величины, а затем - ее младших бит.
В иерархическом режиме изображение хранится в нескольких версиях с различной разрешающей способностью. Например, изображение размером 1000x1000 пикселей может храниться в виде версий размером ,10x10, 100x100 и в полном разрешении. Каждое изображение при этом сохраняет отличия от предыдущей «уменьшенной» версии. Этот режим удобен для быстрого просмотра изображений [23, 77].
Расчет неэталонного индекса качества
Идея нейросетевого неэталонного индекса качества (ННИК) основывается на том, что основные искажения, возникающие на подвергшемся JPEG-сжатию изображении, концентрируются вблизи границ блоков размерами 8x8 пикселей [86-88]. Так как требуется приблизить результаты оценки качества изображений данным алгоритмом к результатам визуальной оценки, необходимо учесть факторы, влияющие на восприятие наблюдателем указанных эффектов (маскирующие факторы). Наиболее значимые из таких факторов [26, 29, 40]: 1. Амплитуда перепадов яркости на границе блока. 2. Протяженность границы блока. 3. Яркость фона изображения вблизи границы блока. 4. Детализированность изображения (количество мелких деталей на единице площади изображения).
В процессе работы алгоритма вычисляются оценки для перечисленных параметров, и полученные величины используются для получения итогового индекса качества изображения. Для этого на основании оценки данных параметров для входного изображения формируется вектор, элементы которого характеризуют воздействие перечисленных факторов на визуальную оценку качества изображения. Полученный вектор является входным вектором предварительно обученной многослойной нейронной сети, на выходе которой формируется итоговое значение индекса качества изображения.
Общая схема разработанного алгоритма представлена на рис. 2.7. Рассмотрим изображение размером MxN пикселей. Яркость пикселя изображения с координатами (i,J) обозначим как I(i,j). Расчет ННИК состоит из следующих этапов [174]: 1. Оценка артефактов сжатия: - выделение границ блоков. 2. Оценка маскирующих факторов: - оценка количества деталей (детализированности) изображения; - оценка яркости фона изображения. 3. Комбинирование полученных параметров для получения итогового инварианта- дифференциального профиля изображения. 4. Построение на основе дифференциального профиля изображения входного вектора нейронной сети. 5. Нейросетевая оценка качества изображения. Рассмотрим далее эти этапы более подробно.
Выделение границ блоков. Для выделения границ блоков на изображении используем горизонтальный фильтр Превитта [16, 20, 29]: ( ) Eh(i,j)- F — I Р Eh (i,j), если Eh (i,j) Te, 0, вдругихслучаях, где Ph - горизонтальный фильтр Превитта [13,20], Те - порог, Eh{i,j) -матрица, на которой выделены перепады яркости на границах блоков. Порог используется для того, чтобы отделить перепады яркости, вызванные эффектами блочности, от перепадов яркости на границах естественных объектов изображения. Обычно перепады яркости на границе блока имеют меньшую амплитуду, чем перепады на границах объектов изображения. Как показывают результаты экспериментов, выбранная величина порога Те = 35 позволяет в большинстве случаев отличить описанные два вида перепадов яркости друг от друга.
Полученные числовые оценки свидетельствуют о том, что яркость фона в области 1 ниже, чем в области 2. Данное обстоятельство согласуется с визуальными данными.
Аналогично вычисляются три перечисленные характеристики изображения для вертикального направления. Далее, используя полученные три матрицы параметров, вычислим итоговую взвешенную матрицу перепадов яркости изображения по следующей формуле: где знак x означает поэлементное произведение матриц. Вычисляем вертикальный профиль матрицы Eh по формуле: 7=1 Далее получим горизонтальный дифференциальный профиль вектора К где Pv =Ру(8и), Р"(/і) = (8и), Pv= median (Pv). Аналогично получаем все перечисленные величины для вертикального направления и вычисляем вертикальный дифференциальный профиль:
Далее объединяем оба профиля Dv и Dh в один вектор D- {Dh,DV}. Пусть Min и Мах будут обозначать соответственно минимальное и максимальное значения среди элементов вектора D. Разобьем область значений элементов итогового вектора D на интервалы: [Min, — 1), [—1, - 0.6), [-0.6,-0.3), [-0.3,-0.1), [-0.1,0.1], (0.1,0.3], (0.3,0.6], (0.6,1], (1,1.5], (1.5,2], (2,2.5], (2.5,3.5], (3.5,5], (5,Мах]. Рассмотрим 14-элементный вектор X, элемент которого с номером к представляет долю отсчетов вектора D, попадающих в к-и интервал из перечисленного выше набора. Этот вектор и будет являться входным вектором нейронной сети, с помощью которой выносится итоговая оценка визуального качества изображения. Обучение и работа нейронной сети При расчете ННИК используется нейронная сеть типа многослойный персептрон [59-61]. Сеть содержит 3 скрытых слоя по 7 нейронов в каждом и один нейрон в выходном слое (рис. 2.10). Входной слой Скрытые слои Выходной слой Рис. 2.10. Схема нейронной сети Функция активации всех нейронов - сигмоидальная [61]. 1 + е Выходным значением сети является величина ННИК, лежащая в интервале [0,10]. Полученная величина является искомым индексом качества.
Алгоритм неэталонной оценки качества изображений стандарта №02000
Стандарт сжатия изображений JPEG, основанный на блочном ДКП, является одним из основных алгоритмов сжатия статических изображений, с которым мы сталкиваемся ежедневно. Однако в 90-е годы XX века было выявлено, что большего коэффициента сжатия при том же визуальном качестве изображения можно достичь, заменив ДКП дискретным вейвлет— преобразованием (ДВП) [51,52]. Результатом многочисленных теоретических исследований явился стандарт сжатия ISO/IEC - JPEG2000 [103].
Алгоритм JPEG2000 сжимает изображение с потерями, используя разложение по биортогональному 9/7 вейвлет-базису [103,34, 122-123]. Коэффициенты ДВП квантуются с помощью скалярного квантователя, с возможностью адаптивной настройки размера шага для каждого поддиапазона. Операция квантования зануляет большое количество небольших по величине ДВП-коэффициентов. В результате восстановленное из квантованных ДВП-коэффициентов изображение содержит такие искажения, как размытые границы и дрожание (ringing) [104-105].
Главной отличительной особенностью между искажениями, вносимыми алгоритмами JPEG2000 и JPEG, является то, что в случае использования алгоритма JPEG2000 искажения не являются регулярными, т.е. не имеют периодическую структуру (блочность в JPEG проявляется как горизонтальные/вертикальные границы через каждые 8 пикселов) [121]. В значительной степени искажения зависят от структуры изображения, появляясь, в основном, в сильно детализированных областях или вокруг резких границ. Другим фактором, влияющим на искажения, является коэффициент сжатия изображения [118]. Указанные особенности существенно усложняют задачу неэталонной оценки качества сжатых изображений. В связи с расширяющимся ростом приложений, использующих стандарт JPEG2000, вопросы оценки искажений, вносимых при вейвлет-сжатии изображений, широко освещаются в современной англоязычной литературе в области ЦОИ [101-102].
Так, например, Огуз (Oguz) предложил метрику оценки видимых искажений около границ (Visible Ringing Measure, VRM) [108]. Алгоритм основан на создании маски, которая показывает только те области изображения, которые находятся в окрестности четко различимых границ. Метрика рассчитывается как изменение яркости пикселей вблизи границ в маскированном изображении. Сначала используются бинарные морфологические операторы для того, чтобы выделить области изображения, у которых искажения границ наиболее заметны для зрительной системы человека. Затем к немаскируемой области изображения применяется морфологический нелинейный сглаживающий фильтр для устранения искажений в окрестностях границ изображения (эффекта дрожания). К сожалению, автор не рассматривает вопрос соответствия предложенной метрики VRM с субъективными визуальными оценками.
Марзилино (Marzilino) предложил эталонные и неэталонные метрики размытия границ и искажений в их локальной окрестности [109]. Эти метрики основаны на анализе границ и их окрестностей в изображении и имеют малую вычислительную сложность. Метрика размытия границ основана на измерении средней величины перемещения границы. Метрика искажений оценивает колебания около границ. Эксперименты, проведенные Марзилино, показывают, что предложенные критерии дают хорошие результаты для различных типов тестовых изображений и степеней сжатия при использовании стандарта JPEG2000.
Ли (Li) разработал алгоритм, целью которого является неэталонное измерение нескольких искажений, представленных в изображении: общей размытости (основано на Гауссовых размытиях на границах резких переходов), реакции на воздействие аддитивных белого и импульсного шума (основано на нарушении локальной гладкости), блочности (основано на обнаружении границ блоков) и дрожании (основано на анизотропном рассеивании) [НО]. Главная причина, по которой рассматриваются именно эти факторы, - их практическая реализуемость и популярность соответствующих моделей в приложениях обработки изображений. Измерение искажений приводится только для одного изображения, сравнения с субъективными оценками в работе Ли не представлены.
В данном разделе предлагается новый способ оценки качества изображений стандарта JPEG2000, подверженных дрожанию и размытию. Алгоритм использует статистическую модель изображения (СМИ) [111-113] в роли эталона, с которым можно сопоставить оцениваемое изображение. Это относительно новый подход к неэталонной оценке изображений, сжатых при помощи стандарта JPEG2000 (или любым другим алгоритмом сжатия, основанном на вейвлет-разложении).
Ниже рассматриваются следующие основные вопросы: - рассматривается статистическая модель изображений в вейвлет-области; - предлагается алгоритм неэталонной оценки качества изображений, сжатых на основе вейвлет-преобразования; - рассматривается возможность применения упрощенной версии алгоритма; - рассматриваются вопросы выбора параметров алгоритма с целью улучшения предсказания качества; - проводится сравнение работы алгоритма с субъективными визуальными оценками.
Алгоритм постобработки для границ второго типа
На протяжении последних 10-15 лет был проведен ряд исследований по проблеме уменьшения эффектов блочности в изображениях, сжатых алгоритмом JPEG [124, 125]. На кодирующей стороне были предложены различные схемы преобразований, такие как чересстрочное преобразование блоков [128], комбинированное преобразование [129] и т. д. Однако ни одна из этих схем не соответствует существующим стандартам кодирования изображений и видео, таким как JPEG или MPEG, и интегрирование этих схем в существующие стандарты — это сложная, подчас невыполнимая, задача.
Другой возможный подход — это уменьшение артефактов блочности на декодирующей стороне с помощью алгоритмов постобработки. Этот подход представляет практический интерес, поскольку требует наличия только декодированного изображения, вследствие чего он полностью совместим со стандартами кодирования. Обычно технологии постобработки включают в себя технологии фильтрации на границах блоков [126, 127, 130], методы на базе теории проекций [131, 132], методы на базе максимума апостериорной вероятности [133]. К сожалению, методы на базе теории проекций обычно имеют высокую вычислительную сложность. Поэтому их тяжело адаптировать для приложений обработки изображений и видео в режиме реального времени. Простейший метод - низкочастотная фильтрация - имеет явный недостаток в том, что он приводит к размытию деталей изображения. Чтобы уменьшать артефакты блочности без значительного ухудшения полезной высокочастотной информации, были предложены несколько методов пространственно-адаптивной фильтрации [134].
Известно, что артефакты блочности возникают в процессе квантования ДКП коэффициентов каждого блока. В то время как большинство технологий постобработки, представленных в литературе, подавляют артефакты блочности путем изменения значений пикселей около границ блоков, некоторые алгоритмы постфильтрации на базе пространства ДКП уменьшают артефакты блочности, непосредственно манипулируя значениями коэффициентов ДКП. В [135] предлагается метод постобработки, с помощью которого можно минимизировать разность значений пикселей на границах блоков посредством компенсации потери точности коэффициентов ДКП. Чтобы оценить артефакты блочности, их величина определяется как сумма квадратов разностей значений пикселей на четырех границах блока. В зависимости от полученной оценки блочности выбирается одно из 28 различных компенсационных преобразований, причем критерием выбора служит минимизация разностей значений пикселей на границах блока. В [136] предложен простой метод на базе пространства ДКП для уменьшения блочности. Он заключается в применении ноль-маскировки к коэффициентам ДКП нескольких смещенных блоков изображения. Однако это приводит к заметной потере краевой информации.
Недавно был предложен метод постфильтрации на базе пространства ДКП для уменьшения артефактов блочности, в котором фильтруютсяг коэффициенты ДКП смещенных блоков для того, чтобы получить значительную корреляцию ДКП коэффициентов одинаковой частоты между собой [137]. Фильтрация адаптируется согласно локальной детализации каждого блока для достижения большего уменьшения артефактов блочности и для сохранения деталей изображения. Для каждого блока в однородных областях изображения применяется 24 смещенных блока, а для каждого блока в других областях изображения используется 8 смещенных блоков. В связи с этим вычислительная сложность метода довольно высока [138, 139].
С целью улучшения характеристик методов удаления блочности из JPEG - изображений на базе пространства ДКП в настоящем разделе рассматриваются следующие основные задачи: — предлагается алгоритм удаления артефактов блочности (АУБ) из декодированных изображений с детектором границ на основе рассмотренного в разделе 2 неэталонного индекса блочности; — рассматриваются вопросы оптимизации параметров АУБ с целью минимизации среднеквадратичной ошибки восстановленного изображения; — проводится сравнение работы алгоритма с известными алгоритмами путем оценки качества обработанных и необработанных сжатых изображений.
Рассмотрим границу между двумя соседними блоками. С помощью индекса НИБ, описанного выше, вычислим значение блочности на границе двух соседних блоков. Если значение блочности rj для этой границы меньше определенного порога т, то преобразование этой границы не требуется. Если же порог превышен: г\ т, то уменьшение артефактов блочности необходимо. Порог т определяется эмпирически. Для того чтобы предотвратить размытие краев объектов на исходном изображении, формируется инвариантное изображение, состоящее из блоков, в которых все ДКП-коэффициенты приравниваются нулю, кроме первого коэффициента. Это изображение используется для нахождения краев объектов на исходном изображении. Блоки, которые соприкасаются с найденными краями объектов, будем называть краевыми блоками. Далее, исходя из измеренной ранее локальной видимости артефактов блочности на каждой границе каждого блока и информации о краях объектов, все границы блоков исходного изображения делятся на три следующих типа [183]: Тип 1: г] т , дальнейшее преобразование не требуется. Тип 2: г/ т , и ни один из двух блоков, составляющих данную границу, не является краевым. Тип 3: rj т , и хотя бы один из двух блоков, составляющих данную границу, является краевым блоком.