Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Гриненко Евгения Николаевна

Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных
<
Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гриненко Евгения Николаевна. Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных: диссертация ... кандидата технических наук: 05.11.18 / Гриненко Евгения Николаевна;[Место защиты: Санкт-Петербургский государственный университет кино и телевидения].- Санкт-Петербург, 2015.- 199 с.

Содержание к диссертации

Введение

1 Телевизионные системы: тенденции развития и актуальные задачи в области оценки качества 16

1.1 Телевизионные системы на современном этапе 16

1.1.1 Системы цифрового телевизионного вещания 16

1.1.2 Мобильное телевидение 18

1.1.3 От доставки контента к доставке впечатления 21

1.1.4 Компрессия данных в телевидении 22

1.2 Восприятие аудиовизуальной информации и оценка качества 30

1.2.1 Аудиовизуальная информация 30

1.2.2 Межсенсорное взаимодействие при восприятии аудиовизуальной информации 32

1.2.3 Оценка качественных показателей аудиовизуальных систем с компрессией 34

1.3 Обзор методов оценки качества 40

1.3.1 Стандартизованные методы оценки качества изображения и звука 40

1.3.2 Актуальные задачи оценки качества 43

1.3.3 Методы и модели оценки качества 46

1.3.4 Методы объективного измерения качества 50

1.3.5 Методы субъективного измерения качества 51

1.3.6 Общие принципы исследований по оценке качества впечатления 56

Выводы 60

2 Исследование кросс-модального взаимодействия компонентов аудиовизуальной программы в телевизионных системах с компрессией данных 64

2.1 Постановка задачи 64

2.2 Интегральные объективные показатели систем компрессии аудио и видеоданных 66

2.3 Разработка методики интегральной оценки качества 70

2.4 Разработка шкалы оценки искажений 75

2.5 Интегральная оценка качества аудиовизуальных материалов различного содержания при внесении искажений путем компрессии видео и аудио сигналов

2.5.1 Тестовые материалы и условия проведения эксперимента 91

2.5.2 Представление результатов: выбор доверительной вероятности и уровня значимости 93

2.5.3 Результаты экспериментальных исследований 95

2.5.4 Анализ экспериментальных результатов 99

Выводы: 102

3 Разработка математической модели субъективного восприятия, позволяющей предсказывать интегральную оценку качества мультимедийных программ, прошедших цикл компрессии-декомпрессии 107

3.1 Постановка задачи 107

3.2 Разработка модели субъективного восприятия первого уровня, позволяющей предсказывать оценку качества изображения и звука 108

3.2.1 Методика проведения экспериментальных исследований 108

3.2.2 Результаты экспериментальных исследований 110

3.2.3 Определение параметров модели первого уровня, описывающей влияние скорости потоков видеоданных и аудиоданных на уровень качества изображения и звука 112

3.3 Разработка модели субъективного восприятия второго уровня, позволяющей предсказывать интегральную

мультимодальную оценку аудиовизуальных программ 114

3.3.1 Результаты экспериментальных исследований 114

3.3.2 Определение параметров модели субъективного восприятия второго уровня, описывающей зависимость между значениями мономодального качества и уровнем мультимодального качества 116

3.4 Оценка адекватности модели с использованием критериев группы VQEG 129

Выводы 134

4 Оптимизация параметров кодеков компрессии в цифровых телевизионных системах с малой скоростью потока передаваемых данных 137

4.1 Постановка задачи 137

4.2 Кросс-модальное взаимодействие компонентов аудиовизуальной программы

4.2.1 Обменные соотношения между качеством изображения и звука 138

4.2.2 Влияние жанра и содержания аудиовизуальных материалов на восприятие качества

4.3 Адаптивное распределение пропускной способности канала связи между потоками видео и аудио данных в соответствии с содержанием мультимедийной программы 149

4.4 Сокращение пропускной способности канала связи в соответствии с содержанием мультимедийной программы 160

Выводы 169

Заключение 173

Список литературы: 176

Компрессия данных в телевидении

Телевизионное вещание претерпевает сегодня радикальные трансформации. Аналоговое вещание повсеместно заменяется цифровым [6, 7, 11, 41, 44, 54-57, 61, 86, 91]. Еще не все страны перешли на использование цифровых технологий, а системы цифрового вещания второго поколения (DVB2, DVB-S2, DVB-C2) уже вытесняют системы первого поколения (DVB, DVB-S, DVB-C) [27, 89, 119, 126-129, 132-134]. На смену телевидению стандартной четкости приходит телевидение высокой четкости (HDTV) [8, 20, 55, 57, 60].

Еще более принципиальная трансформация технической базы телевизионного вещания связана с переходом от аппаратных решений к программным [99, 116, 120]. Требование сокращения капитальных и эксплуатационных расходов неизбежно ведет тому, что телевизионные устройства должны строиться на стандартных компьютерных платформах со специализированным программным обеспечением, а телевизионные системы должны основываться на инфраструктуре информационных систем [30, 31, 52, 57, 65, 75, 90, 97].

Сети наземного, кабельного и спутникового вещания перестают быть единственным средством доставки программ. Все более распространенной становится доставка контента с использованием Интернета и широкополосных сетей, работающих на основе Интернет-протокола IP. Реальностью становится Интернет-телевидение IPTV [49-51, 104, 111, 143, 150, 166, 271]. В реализации новой концепции вещания важную роль должен сыграть файловый способ передачи контента [121, 123, 165, 264]. Современный этап эволюции телевидения связан с увеличением четкости. Устремление в будущее можно увидеть в системах сверхвысокой четкости. Например, разработан формат телевидения ультравысокой четкости Ultra HDTV, который позиционируется как телевидение 2025 года [8, 47, 55]. Но когда в процессе увеличения числа строк наступит насыщение, тогда будет просто необходим переход к объемному телевидению. Объемное (3D) телевидение существует в разных формах. Обычное стереоскопическое телевидение является весьма несовершенным. На повестке дня разработка систем объемного телевидения второго и третьего поколений [10, 13, 14, 17, 42, 58, 59, 92, 137-139].

Для достижения наибольшего удовольствия от просмотра аудиовизуальных программ необходимо, чтобы качество звука и изображения максимально соответствовали друг другу, особенно это соображение актуально для систем, обеспечивающих изображение ультравысокой четкости Ultra HDTV. Поэтому прогресс в видеотехнологиях сопровождается разработкой принципиально новых систем многоканального звука Dolby AC-4 и DTS-UHD [9].Эти системы предназначены для видеофайлов ультравысокой четкости. В новых системах используется объектное описание звуковой сцены, когда каждому из объектов на экране (звуковых источников) соответствует отдельный файл. Файл содержит информацию о параметрах звука виртуального источника и о его положении на звуковой сцене, включая информацию о высоте текущего положения объекта на экране. Наличие в цифровом потоке вертикальных данных позволяют получить полноценный 3D звук.

Телевизионное вещание — мощная индустрия, но оно сталкивается с проблемами и возросшей конкуренцией со стороны новых средств массовой информации, прежде всего - Интернета. Эта конкуренция становится все более острой благодаря увеличению мощности вычислительных ресурсов и расширению пропускной способности линий связи. Влияние мирового экономического кризиса затрудняет решение финансово-экономических проблем телевизионного вещания. Один из способов, который позволяет снизить расходы на телевизионное производство, - это использование контента, создаваемого пользователями [24]. Под пользователями понимаются обычные люди, зафиксировавшие на видеокамеру какое-либо событие. Любой человек может снять интересный сюжет с помощью бытовой видеокамеры или камеры мобильного телефона, выполнить монтаж с использованием персонального компьютера, а затем продать его какой-нибудь телекомпании или разместить смонтированный сюжет на сайте, например, YouTube. Пользовательский контент пользуется сегодня чрезвычайно высоким спросом. Многие телевизионные вещательные компании показывают фрагменты пользовательского контента в программах новостей [82, 113, 224, 279].

Телевизор перестает быть единственным устройством воспроизведения аудиовизуальных материалов. Телевизионные программы могут быть воспроизведены на экране стационарного компьютера, ноутбука, карманного компьютера, мобильного телефона. В последние годы в технике мобильной телефонной связи произошли огромные трансформации, основанные на серьезных технических усовершенствованиях [20, 22, 33, 34]. Основы рыночного успеха сегодняшней мобильной телефонии – не только в самой телефонной связи, но и в обеспечении передачи текстов и загрузки мелодий звонков, в играх, обмене фотографиями и мультимедийными сообщениями.

Целью разработки систем мобильного телевидения было обеспечение приема сигнала цифрового наземного телевидения с использованием таких приборов, как мобильный телефон, карманный компьютер, планшетный компьютер и других малогабаритных переносных коммуникационных и игровых устройств [48]. Теперь новые технологии мобильной связи позволяют принимать настоящие телевизионные материалы, и наблюдение программ больше не связано со стационарным телевизором. Мобильные телефоны, способные воспроизводить видеоинформацию, становятся наиболее модными и популярными.

Разработка методики интегральной оценки качества

Современный мир - это мир медиа, или расширяющейся системы массовых коммуникаций. Телевидение, кино, радио, газеты, Интернет осуществляют серьезное информационное воздействие на общество, его состояние и развитие [70]. От количества органов восприятия, задействованных в процессе получения информации, зависит объем сведений, усвоенных человеком. Успех кино и телевидения до некоторой степени связан с тем, что в процесс восприятия оказались вовлеченными и органы слуха и органы зрения, через которые человек получает львиную долю информации. Именно телевидение явилось самым популярным средством овладения информацией и именно с его появлением сформировалось информационное общество - общество, управляемое посредством информации. Возможности этого технического явления позволяют передать максимальное количество информации в том виде, в котором она предельно легко усваивается, и, следовательно, оказывает наибольшее воздействие [64].

Быстрый прогресс в создании эффективных систем управления, связи и медиакоммуникаций настоятельно требует учета параметров человека как важнейшего звена в таких системах. Это порождает необходимость рассмотрения семантической стороны информации, когда эта информация должна послужить основой для определенных практических действий. Но кино, телевидение и другие медиасистемы – это не только средства массовой информации. Кино и телевидение – это также области культуры и искусства. Поэтому методы теории информации должны быть распространены и на сферу эстетического восприятия явлений и объектов искусства [71].

Семантическая информация допускает точное представление, она переводима на другие языки, правила обращения с нею и символы, в ней фигурирующие, являются общепринятыми. Эстетическая информация - это персонализированная информация, она почти полностью непредсказуема, она непереводима, потому что другого языка для передачи этой информации попросту не существует.

Сообщения, содержащие чисто семантическую или чисто эстетическую информацию, - это всего лишь предельные случаи. Каждое реальное сообщение всегда содержит сильно перемешанные части того и другого. Когда мы слушаем последние известия по радио, некоторые сообщения несут семантическую информацию: например, прогноз погоды, курс ценных бумаг, если мы держатели акций; административные распоряжения, если они к нам относятся. Такие сообщения определяют реакции большинства или, во всяком случае, каждый раз логически определимой группы слушателей. Остальная часть сообщений для нас по существу бесполезна, она информирует нас, вызывает в нас негодование или удовлетворение, но никак не определяет наших действий ни в настоящем, ни в будущем.

Эстетическая информация, исходящая от средств массовой информации, не столько отражает реальное положение вещей, сколько вызывает у аудитории определенные душевные состояния, реакции и эмоции. Информация, переданная таким образом, становится более устойчивой для аудитории, чем факты и доводы, излагаемые в форме семантической информации. Объектом эстетической информации являются те ценности людей, на которых базируются их убеждения. Эти ценности зачастую основываются не на каких-то фактах и доказательствах, а создаются коллективным опытом. При этом они, как правило, четко не осознаются самим человеком [83].

Каждое реальное сообщение в кино и телевидении содержит как семантическую, так и эстетическую информацию, однако эти виды информации существуют в сообщении раздельно. В некоторых сообщениях может преобладать семантическая или эстетическая информация.

В художественных произведениях важнейшее значение имеет именно эстетическая информация. Например, очень велика доля эстетической информации в музыкальных произведениях - это проистекает от вариаций оркестровки, различий в конструкциях инструментов одного и того же вида, особенностей интерпретации и т. д. В эстетической информации находят отражение специфические особенности различных видов искусства.

Восприятие - это формирование целостного образа предмета, возникающего в результате воздействия объективного мира на органы чувств. Восприятие отражает внешние стороны предметов. К его основным формам относятся зрительное и слуховое восприятие. Оно формируется из ощущений в процессе взаимодействия человека с предметами окружающей среды. При этом взаимодействии контуры предмета определяют, например траекторию движения руки, ощупывающей предмет, а траектория движения руки, в свою очередь, определяет структуру зрительного образа. Восприятие принадлежит индивидууму и представляет собой модель внешних предметов и нашего тела. Из восприятия строятся представления. Восприятие играет в процессе познания следующую роль: выполняет функцию сигнала; служит исходным материалом для абстрагирования от них отдельных связей и отношений, выступающих в качестве основы для первичных элементов теорий. Восприятие как представление может служить моделью структур, не данных в чувственном опыте [73].

Можно сказать, что восприятие - это первый момент встречи человека и мира, в который закладываются основы будущих познавательных стратегий и интеллектуальных интуиций. В современном мире наблюдается усиление визуальных коммуникаций, текстуальное восприятие смысла уступает место визуально активному его пониманию (компьютерная графика, гипертексты электронных пособий [63]). Восприятие информации характеризуется полисенсорной природой. Одной из важнейших особенностей является участие в восприятии разных сенсорных систем: слуха, зрения, кожно-тактильного чувства, хеморецепции (обоняние, вкус), терморецепции (чувство тепла - холода). Каждая из этих сенсорных систем, или анализаторов информации внешнего мира состоит из периферической (рецепторной), проводниковой (чувствительный нерв) и центральной части, т.е. соответствующих областей мозга, где информация внешнего мира, воспринятая рецепторами, преобразуется (декодируется) в зрительные, слуховые, кожно-тактильные, обонятельные, тепловые ощущения и представления. Полисенсорная природа обеспечивает возможность восприятия человеком практически всех биологически и социально значимых видов информации внешнего мира [71, 72, 93].

Информация, передаваемая в кинематографических и телевизионных системах, представляет собой мультимедийные сообщения, основными компонентами которых являются изображение и звук. Эти компоненты передаются по разным сенсорным каналам человека, но они синтезируются при восприятии мультимедийных сообщений, что отвечает принципу целостности восприятия. Существование феномена межсенсорного восприятия исследовалось на протяжении многих лет учеными различных областей: психоакустики, психологии, физиологии, неврологии, философии, музыковедения, экологии. В настоящее время эта проблема стала рассматриваться специалистами сферы взаимодействия человека и компьютера.

Разработка модели субъективного восприятия первого уровня, позволяющей предсказывать оценку качества изображения и звука

Для воспроизведения изображения использовался видеомонитор Sony PVM 14L2, для воспроизведения стереофонического звукового сопровождения – акустические системы M-Audio Studiophile BX-5. Воспроизведение аудиовизуальных последовательностей осуществлялось в автоматическом режиме с дискового массива видеосервера по заранее подготовленному плей-листу. Эксперимент по субъективной оценке качества проводился в исследовательской лаборатории Санкт-Петербургского государственного университета кино и телевидения. Порядок предъявления последовательностей, временные интервалы и другие условия проведения эксперимента соответствовали Рекомендации ITU-R BT.500-13 [238]. Осуществлялся контроль освещенности в помещении; расстояние наблюдения изображения составляло 4 … 6 высот экрана (4 … 6 H). Максимальная яркость изображения на экране – около 80 кд/м2, яркость внешней засветки составляла приблизительно 10 % от максимальной яркости экрана. В качестве экспертов-наблюдателей в эксперименте участвовало около 60 студентов СПбГУКиТ.

В ходе проведения субъективных экспертиз может быть получен большой объем экспериментальных данных, часто представляющих собой бланки экспертных оценок, которые должны быть обработаны и обобщены для получения результатов в форме графиков, числового выражения/формулы/алгоритма. Стохастический характер отклика зрительного и слухового анализаторов человека приводит к тому, что оценки качества объектов (видеопоследовательностей и звуковых клипов) является по существу случайными величинами, представляющими собой набор целых чисел в диапазоне от 0 до 5 на предложенной в работе шкале ухудшений.

Экспериментальные исследования показали, предложенная модифицированная шкала ухудшений обладает свойствами шкалы отношений, что позволяет использовать обычные статистические процедуры, рекомендованные в Рекомендации ITU-R BT.500-13 [238] для оценки по выборочным (эмпирическим) данным характеристик распределения (оценка среднего значения, среднеквадратичного значения, доверительного интервала для среднего значения) [16; 32]. В Рекомендации ITU-R BT.500-13 [238] предлагается рассчитывать доверительные интервалы при довольно большом для сферы психофизических экспертиз значении доверительной вероятности, равном 0,95. Рекомендация ITU-R BT.500-13 [238] является основополагающим документом, которым руководствуются исследователи закономерностей субъективной оценки качества наблюдателем. Для обеспечения возможностей сравнения результатов разных экспериментов, конечно, целесообразно пользоваться единым значением доверительной вероятности. Статистическая проверка гипотез является вторым после статистического оценивания параметров распределения и в то же время важнейшим разделом математической статистики. Статистическая гипотеза - это предположение о законе распределения случайной величины или о параметрах этого закона. Это может быть, например, предположение о соответствии параметра заданному значению, предположение об отсутствии взаимосвязи между изучаемыми явлениями и т.д. Гипотезы бывают двух видов: нулевая (гипотеза Н0) и альтернативная, или конкурирующая (гипотеза Н1). Предполагается, что либо верна гипотеза Н0 при ложной гипотезе Н1, либо верна Н1 при ложной гипотезе Н0.

Уровень значимости при обработке результатов эксперимента и статистических тестах — это допустимая для данной задачи вероятность ошибки первого рода, то есть вероятность отклонить нулевую гипотезу, когда на самом деле она верна.

Вопрос выбора уровня значимости и доверительной вероятности является очень важным. Кажется, что уровень значимости должен быть очень малым. Однако чрезмерное уменьшение уровня значимости может привести к увеличению вероятности принять нулевую гипотезу, когда на самом деле она не верна. Окончательный выбор уровня значимости связан с риском, который наступает с выбором решения принимать или отвергать проверяемую гипотезу. Следует также оценивать практическую значимость, или последствия ошибок принятия и отклонения гипотез в конкретной сфере деятельности.

Однако при исследовании стохастического характера отклика зрительного анализатора изображение признается лучшим, если оно оценивается средним наблюдателем как лучшее (в сравнении с эталоном) с вероятностью, равной 0,75 [2]. Это может также означать, что в среднем 75% наблюдателей оценивают это изображение как лучшее. Подобный подход используется и в работе [150] при введении единицы измерения качества как едва заметной разности [JND]. Но при установлении стандарта и определении допуска на отклонение качества изображения от стандарта предлагается считать изображения эквивалентными, если отклонения в уровне качества не замечают 90% зрителей [2]. Таким образом, уровень значимости в задачах оценки качества допустимо задавать в пределах от 0,25 до 0,05.

Необходимо также учитывать состав группы наблюдателей. При обработке результатов экспериментов с группой обычных наблюдателей «зрителей/слушателей» целесообразно выбирать уровень значимости, равный 0,25. При статистическом анализе экспериментов, имеющих целью установление количественных оценок оптимальных показателей оборудования и проводимых с группой наблюдателей-«экспертов», уровень значимости следует выбирать не ниже 0,90-0,95.

Результаты экспериментальных исследований В рамках эксперимента проводилась оценка интегрального качества компрессированных телевизионных материалов, представленных тестовыми последовательностями различного содержания. Цель проводимой серии психофизических экспериментов - определить интегральное восприятие качества аудиовизуальной программы при внесении искажений в видео и аудиосигналы путем их компрессии с целью уменьшения объема передаваемых данных и обнаружить и доказать существование эффекта кросс-модального взаимодействия.

Первой задачей настоящей работы является изучение влияния частных параметров видео- и аудиоряда (скоростей видео- и аудиопотоков, четкости (пространственного разрешения изображения), геометрических размеров на субъективное восприятие интегрального качества. Вторая задача – исследование влияния содержания аудиовизуального произведения на восприятие интегрального качества.

В эксперименте варьировались следующие параметры видеоряда: степень видеокомпрессии (скорость видеопотока изменялась в диапазоне от 8 кбит/с до 3500 кбит/с); пространственное разрешение (720576, 320240, 220176 элементов), размеры (диагональ 33 см при разрешении 720576 элементов, 16 см при разрешении 320240, 11.5 см при 220176). Также изменялись параметры звукового сопровождения: степень аудиокомпрессии (изменение скорости аудиопотока в диапазоне 32 … 256 кбит/с.

Ниже представлены результаты экспериментальных исследований. На рисунке 2 представлена зависимость оценки Qav аудиовизуального качества музыкального клипа по разработанной шкале ухудшений от скорости видеопотока при различных значениях скорости аудиопотока (разрешение изображения 720576). Показаны доверительные интервалы, соответствующие уровню доверительной вероятности 0,95.

Влияние жанра и содержания аудиовизуальных материалов на восприятие качества

В главе 2 данной работы было доказано существование кросс-модального взаимодействия в процессе формирования у зрителя интегрального впечатления от просмотренных аудиовизуальных программ. Было показано, что кросс-модальное взаимодействие существует при просмотре программ различного содержания и в большом диапазоне скоростей потоков компрессированных данных изображения и звука. Обе модальности (визуальная и аудиальная) влияют на восприятие качества, но одна из модальностей может иметь преобладающее значение в зависимости от содержания программы. В главе 3, для возможности предсказывать найденные закономерности, на основании данных экспериментального исследования была разработана математическая модель субъективного восприятия. С её использованием становится возможным выполнить количественное описание процессов кросс-модального взаимодействия компонентов аудиовизуальной программы – взаимной компенсации качества модальностей (изображения и звука) при их совместном восприятии, когда один из компонентов дополняет и изменяет субъективное ощущение, формируемое другим компонентом.

В телевизионных системах с компрессией данных, в том числе в системах мобильного телевидения, в которых используются наименее широкополосные каналы связи и целевая скорость потока компрессированных данных падает до мегабита в секунду и даже до меньших значений, к производству (доставке) мультимедийной продукции предъявляются особые требования. Основная задача – обеспечить приемлемый уровень качества в условиях жёстких технических ограничений на доставку аудиовизуальных материалов. Для выбора оптимальных значений параметров кодирования изображения и звука важно проанализировать требования к качеству на основе человеческого восприятия. Анализ экспериментальных данных, представленных выше, позволяет предположить, что рассмотрение аудиовизуальной программы как единого целого и учёт восприятия её интегрального качества позволит решить поставленную задачу.

В работе предлагается решить две важных для практики задачи оптимизации. Первая задача оптимизации может быть сформулирована следующим образом: получить максимальное интегральное качество впечатления при фиксированной полосе пропускания канала связи. Математическая модель субъективного восприятия может быть применена для динамического, адаптивного к содержанию транслируемых материалов, распределения полосы канала между видео- и аудиопотоками, что позволяет максимизировать уровень интегрального качества впечатления воспроизведения мультимедийных программ [219, 220], в условиях жёстких технических ограничений на доставку телевизионных материалов, когда имеется ограниченная фиксированная полоса пропускания канала связи.

Разработанная математическая модель может быть применена для решения задачи минимизации необходимой пропускной способности канала связи, при условии, что интегральное качество впечатления будет не ниже заданного уровня. Таким образом, может быть сформулирована вторая задача оптимизации, которая решается в рамках данной работы: получить минимальную полосу пропускания канала связи при фиксированном значении уровня интегрального качества впечатления.

В известной работе [269] сформулирован важный для практики вопрос о взаимодействии, взаимном влиянии друг на друга видео- и аудиокомпонентов в процессе формирования ощущения интегрального качества: является ли высокое/низкое качество звукового сопровождения причиной возрастания/снижения 139 воспринимаемого уровня качества изображения (по отношению к уровню мономодального качества изображения, воспроизводимого без звука)? И наоборот: вызывает ли изображение, воспроизводимое со звуковым сопровождением, изменение восприятия мономодального качества звука? Автором работы были проведены экспериментальные исследования, результаты которых дают

График на рисунке 18 иллюстрирует зависимость предсказанного по модели уровня интегрального качества и мономодальных показателей качества изображения и звука для трех экспериментальных сюжетов. Качество звука выбрано в качестве параметра. Анализ представленных характеристик позволяет сделать вывод о существовании так называемых точек нейтральности. В данных точках не наблюдается ни уменьшения, ни увеличения уровня субъективно воспринимаемого интегрального качества по сравнению с мономодальными оценками показателей качества изображения. Рассмотрим рисунок 18б представляющий зависимость предсказанного по модели уровня интегрального качества и мономодальных показателей качества изображения и звука для музыкального клипа. Например, если значения показателей качества изображения и звука будут равны Q V= 4 и Q A=4,5, то уровень интегрального качества будет соответствовать оценке «4», т.е. равняться качеству изображения. Все точки нейтральности лежат на прямой Q AV=Q V [35, 77, 222]. Для низкого качества изображения (т.е. для низких скоростей потока видеоданных) уровень восприятия интегрального качества будет всегда выше, чем уровень восприятия качества только изображения для всех трех сюжетов. Однако для средних и высоких значений показателей качества изображения ситуация не столь однозначна и зависит от уровня качества звука.

Похожие диссертации на Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных