Содержание к диссертации
Введение
Глава 1. Современные системы кодирования и передачи видео- и аудиоинформации 16
1.1. Стандарты кодирования видеоинформации 17
1.2. Стандарты кодирования речи и звука 63
1.3. Стандарты передачи видео и аудиоинформации 88
Глава 2. Разработка и исследования аудиовизуальной информационной системы АВИС 114
2.1. Спецификация параметров OFDM-модуляции сигнала 115
2.2. Звуковой кодек реального времени на основе стандарта ААС 118
2.3. Синхронизация OFDM-модулированного сигнала 133
2.4. Система канального кодирования и OFDM-модуляции 140
2.5. Система канального декодирования и OFDM-демодуляции. 175
Глава 3. Анализ методов метрологического обеспечения систем передачи аудиоинформации 191
3.1. Структура системы анализа параметров звукового канала... 191
3.2. Специфические особенности алгоритмов измерения параметров звукового канала 192
3.3. Оценка частоты и уровня синусоидального сигнала 196
3.4. Оценка погрешности измерения частоты и амплитуды синусоидальных сигналов при воздействии флуктуационных помех 198
3.5. Методика оценки параметров звукового канала 205
3.6. Допусковый контроль параметров многоканальных звуковых сигналов в процессе их передачи по каналам связи 218
3.7. Выводы 219
Глава 4. Практическая реализация результатов исследований системы АВИС и метрологии систем формирования и передачи аудиоинформации 221
4.1. Лабораторные испытания системы АВИС 221
4.2. Моделирование искажений 227
4.3. Полевые испытания системы АВИС 232
4.4. Основные положения вкладов России в МСЭ по созданию системы АВИС 239
4.5. Аудиоанализатор компьютерный АК-1 244
4.6. Результаты разработки звукового кодек реального времени на основе стандарта ААС 297
4.7. Устройство допускового контроля звуковых каналов ИУЗК-32. 300
4.8. Выводы 302
Заключение 304
Библиографический список 310
Приложения 323
- Стандарты передачи видео и аудиоинформации
- Звуковой кодек реального времени на основе стандарта ААС
- Специфические особенности алгоритмов измерения параметров звукового канала
- Основные положения вкладов России в МСЭ по созданию системы АВИС
Введение к работе
Актуальность научно-технической проблемы
Новые технологии, возникшие на стыке электросвязи и компьютерной техники, становятся основой современных локальных и глобальных коммуникационных систем. В настоящее время во всем мире осуществляется переход на цифровые методы передачи информации в телевидении, радиовещании. В связи с этим разработаны новые, цифровые, стандарты систем телевизионного и звукового вещания. Эти стандарты приняты к разработке и реализованы практически всеми развитыми странами мирового сообщества. К созданию этих стандартов были привлечены ведущие исследовательские центры и фирмы-производители радио и телекоммуникационного оборудования.
Так, в США была создана группа Grand Allianse (GA), которая в 1995 году разработала стандарт цифрового телевизионного вещания ATSC А/53, переход от аналогового вещания к которому практически уже завершается.
Стандарт европейского эфирного телевидения DVB-T был создан в 1997 году так называемой Европейской Группой Запуска (ELG), его внедрение активно осуществляется практически во всех странах Европы. К этому стандарту присоединилась и Россия, его внедрение согласно планам Правительства завершится в 2015 году.
При поддержке японской организации по стандартизации ARIB в 1999 году был создан стандарт телевизионного вещания ISDB-T, в ближайшие несколько лет завершится переход на этот стандарт.
В 2004 году европейский проект DVB дополнен стандартом DVB-H, предусматривающим возможность приема малоформатного телевизионного вещания на малые переносные приемные устройства.
В 2006 году в Китае разработан стандарт цифрового телевидения DMB-Т/Н, а в Бразилии - стандарт SBTD-T.
Все приведенные выше стандарты предусматривают передачу эфирного цифрового телевидения преимущественно в дециметровом диапазоне
7 радиоволн (выше 300 МГц) без нарушения стандартизованных частотных планов при полосе пропускания каждого из каналов 6, 7 или 8 МГц.
Исследования проблем цифрового звукового вещания, проводимые Европейским союзом вещателей (EBU) завершились в 1995 году разработкой стандарта DAB, который в 2006 году был дополнен функциями мультимедийного вещания и переименован в T-DMB. Радиовещание с применением этого стандарта предусматривается в верхней части диапазона метровых волн (в области 174-240 МГц) и в децеметровом диапазоне (1452-1492 МГц).
Для разработки цифрового стандарта звукового вещания в диапазонах длинных, средних и коротких волн (до 30 МГц) в 1998 году радиовещателями Европы и Америки был создан консорциум DRM, усилиями которого в 2001 году был создан соответствующий стандарт, внедряемый во многих странах мира, в том числе и в России.
Представляется странным, что до 2000 года исследовательские и вещательные организации не озаботились проблемами цифровизации каналов стереозвукового радиовещания (диапазон частот 87.5 - 108 МГц используется для FM-вещания, а в диапазоне частот 66-74 МГц в России и странах СНГ применяется разработанная в СССР система УКВ-ЧМ вещания). При этом решение вопроса эффективной передачи цифровых потоков в узкой полосе частот (200-250 кГц) при мобильном приеме в условиях многолучевого распространения стоит остро до сих пор. Необходимость создания цифровых систем передачи аудио- и видеоинформации мобильным потребителям связана не только с возрастающей потребностью в доставке новых видов информационного контента, но и с экономической целесообразностью более эффективного использования полос частотного спектра. Кроме этого, остро стоит вопрос удовлетворения возросших запросов на получение различных видов информации в городском наземном транспорте в условиях плотной городской застройки и, как следствие, многолучевым распространением
8 сигнала и отсутствием прямой видимости антенны передатчика, а также в районах со сложным рельефом, в горной местности и в густых лесных массивах, где в указанных условиях с использованием известных на сегодня систем невозможно обеспечить удовлетворительное качество приема сигнала.
Необходимость перехода к цифровым системам доставки аудио- и видеоинформации мобильным потребителям связана не только с реализацией возможности передачи и приема новых видов информации, но и с экономической целесообразностью более эффективного использования полос частотного спектра.
В этих обстоятельствах установка на развертывание цифровых систем передачи видеоинформации цветных динамических изображений различного разрешения совместно с высококачественным стереофоническим звуковым сопровождением представляется наиболее целесообразной. Решение этих проблем, по сути, может вывести Россию на передовые позиции в развитии информационных технологий.
Как следует из вышеизложенного, разработка принципов построения новой Российской аудиовизуальной информационной системы, приспособленной для работы в условиях многолучевого распространения при мобильном приеме сигнала, а также исследования в данной области являются весьма актуальными.
Цели и задачи диссертационной работы
Основной целью настоящей работы является разработка и создание высокоэффективной принципиально новой аудиовизуальной узкополосной цифровой информационной системы, ориентированной на мобильного абонента. Для этого должны быть решены следующие основные задачи:
— исследование существующих систем цифрового телерадиовещания и выбор эффективных методов кодирования аудио и видеоинформации;
разработка принципов построения аудиовизуальной информационной системы АВИС;
разработка алгоритмов и соответствующего программного обеспечения, реализующего элементы системы АВИС, в том числе алгоритмов канального кодирования, модуляции, синхронизации и
др.;
разработка аппаратно-программного комплекса системы АВИС;
разработка эффективной системы кодирования стереозвуковой информации;
разработка эффективных методов контроля и измерения звуковых каналов;
проведение лабораторных и натурных испытаний модели системы АВИС;
практическая реализация принципов построения системы АВИС и метрологического обеспечения систем формирования и передачи звуковой информации.
Методы исследования
В качестве основного теоретического инструмента исследований использовались методы математического анализа, линейной алгебры, теории вероятностей и математической статистики, теории цифровой обработки одномерных и многомерных сигналов, теории статистической радиотехники, теории информации, теории помехоустойчивого кодирования, комбинаторики. При построении математических моделей каналов распространения сигнала в диссертационной работе использовались математические модели помехи, распределенной по законам Гаусса, Релея и Раиса. Проведенные эксперименты обеспечили практическое подтверждение теоретических решений и эффективности разработанных методик.
Теоретической и методологической основой исследований являются труды отечественных и зарубежных ученых по теории цифровой обработки
10 сигналов, статистической радиотехнике, звуковой метрологии, теории информации.
В процессе решения поставленных в диссертационной работе задач были использованы результаты трудов таких выдающихся ученых как Котельников В.А., Дворкович В.П., Новаковский СВ., Игнатьев Н.К., Цукерман И.И., Антипин М.В., Кривошеев М.И., Зубарев Ю.Б., Левин Б.Р., Певзнер Б.М., Дьяконов В.П., Харкевич А.А., Тихонов В.И., Вентцель Е.С., Shannon С.Е., Blahut R.E., Prett W.K., Netravali A.N., Haskell B.G., Max J., Haffman D.F., Langdon G., Karhunen H., Loeve M., Gonzalez R.C., Woods R.E. и др.
Для создания и отладки программного и аппаратного обеспечения исследований и разработок при руководстве и активном участии автора использовались системы символьной математики «Mathematica» 2-5, MATLAB, язык программирования C++, среда разработки 'Microsoft-Developer Studio.
Научная новизна
К числу существенных результатов выполнения диссертационной работы, полученных автором и обладающих научной новизной, относятся нижеследующие :
разработана модель новой цифровой узкополосной аудиовизуальной системы для мобильного абонента в ОВЧ-диапазоне;
в рамках создания указанной системы предложены новые варианты использования OFDM-модулированного сигнала, адаптированные к требованиям к разрабатываемой системе, в том числе - к ее использованию в ОВЧ-диапазоне;
предложены новые, устойчивые к шуму канала передачи методы синхронизации OFDM-модулированного сигнала;
разработан программный звуковой кодек стандарта ААС;
разработаны эффективные методы и устройства анализа качества каналов звукового вещания;
разработан прибор АК-1 и организован его серийный выпуск;
разработан многоканальный программно-аппартаный комплекс контроля каналов звукового вещания ИУЗК-32, и организован его серийный выпуск.
Личное участие автора в разработках по теме диссертационной работы
Во всех разработках по теме диссертации автор являлся ответственным исполнителем. Все приведенные в диссертационной работе результаты исследований получены лично автором диссертации. Идея построения системы, а также выбор определяющих направлений исследований высокоэффективных систем цифровой передачи аудиовизуальной информации и оценки их качества принадлежит проф. Дворковичу В.П. Исследования и разработка проводились при непосредственной, значимой и надежной поддержке члена-корреспондента РАН, проф. Зубарева Ю.Б.
На защиту диссертации выносятся следующие основные результаты:
методика построения узкополосной аудиовизуальной информационной цифровой системы в ОВЧ-диапазоне в условиях многолучевого распространения сигнала для мобильного абонента;
принципы построения аудиовизуальной информационной системы АВИС;
алгоритмы и соответствующее программное обеспечение, реализующее элементы системы АВИС, в том числе - алгоритмы канального кодирования, модуляции, синхронизации и др.;
аппаратно-программный комплекс системы АВИС;
эффективная система кодирования стереозвуковой информации;
эффективные методы контроля и измерения звуковых каналов;
результаты лабораторных и натурных испытаний модели системы АВИС;
практическая реализация принципов построения системы АВИС и метрологического обеспечения систем формирования и передачи звуковой информации;
вклады России в МСЭ по эффективному использованию ОВЧ-диапазона частот.
Теоретическая и практическая значимость результатов диссертационной работы
Разработаны принципы создания новой аудиовизуальной информационной системы и построения соответствующей аппаратуры на основе использования современной элементной базы и высокопроизводительных программируемых процессорных систем обработки информации. Помимо этого, результаты работы позволяют создать условия для реализации программируемых устройств студийного и связного применения, систем передачи аудиовизуальной информации в узкополосных каналах связи, например, в ОВЧ-диапазоне частот, аппаратуры приема в мобильных устройствах городского транспорта и частных автомашинах.
Применение результатов проведенных работ позволяет перейти на совершенно новую технологию информационных систем, включая создание:
систем и сетей многопрограммного стерео звукового вещания с передачей нескольких программ в одном стандартном ОВЧ-ЧМ канале;
систем и сетей мобильного видеовещания со стереозвуковым сопровождением при сохранении действующих частотных планов;
компьютерных сервисных сетей обслуживания мобильных абонентов;
систем автоматического многоканального метрологического контроля качества каналов звукового вещания.
Исследования и разработки, проведенные в рамках настоящей диссертационной работы, позволяют создать базу для дальнейшего развития отечественных конкурентоспособных цифровых вещательных технологий с целью обеспечения информационной безопасности России.
Реализация и внедрение результатов работы
На базе теоретических исследований и разработанных принципов и алгоритмов внедрены следующие системы:
модель новой аудиовизуальной узкополосной мобильной системы, результаты разработки отражены во вкладах России в Международный союз электросвязи;
программный аудиокодек стандарта ААС;
система метрологического контроля каналов звукового вещания АК-1, внесенная в Государственный реестр средств измерения, кроме того данная система входит в состав аппаратуры цифрового телевидения в составе системы спутниковой связи «Приморка» (внедрение отмечено премией Правительства РФ);
система многоканального динамического контроля звуковых трактов ИУЗК-32, входящая в состав штатного оборудования телевизионного технического центра "Останкино".
Проведены успешные испытания модели новой аудиовизуальной узкополосной системы для мобильного абонента АВИС.
Работа поддержана грантом Российского фонда фундаментальных исследований (РФФИ) № 04-07-90055 «Разработка и исследование системы передачи видео- и стереозвуковой информации по узкополосным каналам мобильной связи», а так же грантом Российского фонда технологического развития (РТФР) «Разработка аудиовизуальной информационной системы с использованием узкополосного канала связи для мобильных абонентов», шифр «Видео-М».
На основе проведенных исследований разработаны вклады России в МСЭ:
ITU-R Document 6E/336-E, 6M/133-E, 3 March 2006. «Increase of the Band 8 (VHF) Utilization Efficiency» [25];
ITU-R Document 6M/150-E, 14 August 2006. Technical Report «Digital Mobile Narrowband Multimedia Broadcasting System AVTS» [27].
Достоверность материалов диссертационной работы
Достоверность подтверждена результатами компьютерного моделирования процессов обработки различных видов информации, созданием действующих систем и устройств и их эксплуатацией в телекоммуникационных системах.
Апробация работы
Результаты, полученные в работе, докладывались и обсуждались на научных семинарах во ФГУП НИИРадио, на заседании кафедры РЛ-1 МГТУ им. Н.Э. Баумана, Российских и международных научных конференциях и семинарах, в том числе:
на Международных конференциях «Цифровая обработка сигналов и ее применение», 2004, 2005 гг.;
на научно-технической конференции «Прогрессивные радиотехнологии для инфокоммуникаций России. НИИР-55 -новые перспективы», 2004 г.;
на 12-ой Всерооссийская межвузовская научно-техническая конференции студентов и аспирантов "Микроэлектроника и информатика", 2005 г.;
на Научно-техническая конференция "Студенческая весна - 2005" МГТУ им. Н.Э. Баумана, 2005 г..
Публикации
По теме диссертации опубликовано 13 научных работ, из них 6 статей, 5 докладов на научных конференциях, 2 вклада в МСЭ-Р; 1 статья в журнале, рекомендованным ВАК (ЦОС); 2 научных работы выполнены без соавторства. Результаты работы отражены также в 4 научных отчетах.
15 Структура и объем диссертации
Диссертационная работа содержит 323 страницы и состоит из введения, четырех глав, заключения и общих выводов. Библиографический список включает в себя 125 наименований. В Приложении приведены копии 3 актов о внедрении результатов диссертационной работы, копия протокола полевых испытаний системы АВИС и копии вкладов России в МСЭ, подтверждающие результаты внедрения диссертационной работы.
Автор выражает глубокую благодарность научному руководителю доктору технических наук, профессору Дворковичу Виктору Павловичу за создание условий для плодотворного развития и научного роста автора работы, а также за оказание непосредственно научной поддержки при проведении исследований и доведения результатов работы до состояния, пригодного для защиты диссертационной работы. Кроме того, автор выражает глубокую признательность члену-корреспонденту РАН, доктору технических наук, профессору Юрию Борисовичу Зубареву за безусловную, надежную и необходимую поддержку работы именно в то время, когда без этого было невозможно ее дальнейшее продвижение. Также автор выражает признательность доктору технических наук, профессору Марку Иосифовичу Кривошееву и доктору технических наук Дворковичу Александру Викторовичу за непосредственную помощь в представлении результатов разработки системы АВИС в качестве вклада России в Международный союз электросвязи.
Хочу также поблагодарить своих коллег за эффективную помощь в проведении и реализации результатов исследований.
Стандарты передачи видео и аудиоинформации
Система DVB (Digital Video Broadcasting Terrestrial) [12] представляет собой систему цифрового наземного телевизионного вещания. Стандарт данной системы определяет алгоритмы кодирования и модуляции цифрового сигнала, начиная с транспортного потока MPEG-2/MPEG-4 и заканчивая цифровым модулированным сигналом на входе ЦАП.
Система DVB предназначена для вещания в сложных условиях городской застройки, а также в условиях горного и лесного ландшафта. Вещание в городе характеризуется наличием большого количества отраженных эхо-сигналов (многолучевое распространение), вызывающих фазовые, амплитудные и частотные искажения спектральных компонент сигнала. DVB позиционируется главным образом как система для стационарного приема сигнала. Также при наложении соответствующих ограничений на скорость транспортного средства, плотность городской застройки, мощность передатчика, режимы модуляции возможен вариант использования сигнала DVB при мобильном приеме. Мобильный прием сигнала влечет за собой доплеровские сдвиги частотных компонент передаваемого сигнала. Также к характерным особенностям предполагаемой среды распространения (особенно в городских условиях) относятся импульсные помехи и шумы, вызываемые, во-первых, наводками от различных высокочастотных медиа-сервисов и средств связи, и, во-вторых, сложной динамичной структурой среды распространения радиосигнала.
Для удовлетворения требования устойчивого приема сигнала, а следовательно, для борьбы с вышеуказанными искажениями, в системе DVB-Т используются следующие методы преобразования сигнала: битовая рандомизация; кодирование Рида-Соломона; байтовое перемежение; сверточное кодирование; битовое перемежение; частотное перемежение; QAM-отображение; OFDM-модуляция; введение защитного интервала; введение дополнительных управляющих частотных компонент. Отдельно нужно отметить введенный в стандарт механизм иерархической передачи битового потока.
Важной характерной чертой стандарта DVB является возможность иерархического построения системы. Этот сервис позволяет осуществлять одновременную передачу потоков низкого и высокого приоритетов.
QAM-модуляция (иногда именуемая QAM-манипуляция; слово "манипуляция" вводится для того, чтобы оставить слово "модуляция" для ортоганльного частотного разделения несущих - OFDM) OFDM-модуляция сигнала (с введением межсимвольных защитных интервалов), а также предусмотрены помехозащищающие алгоритмы канального кодирования: битовая рандомизация, частотное перемежение, кодек Рида-Соломона, сверточное кодирование с декодированием Витерби.
При реализации системы DVB ширина полосы сигнала выбирается в зависимости от национальных требований вещателя и может составлять 5, 6, 7 и 8 МГц. Диапазон предназначенных для вещания радиочастот составляет 470-862 МГц (UHF-диапазон).
Отличительной особенностью стандарта DVB является отсутствие описания работы приемного устройства. Отсутствие жесткого стандарта на приемное устройство должно стимулировать разработчиков к созданию высококачественных телевизионных приемников.
Система определяется как функциональный блок оборудования, выполняющий адаптацию ТВ сигналов от выхода транспортного мультиплексора MPEG-2 к наземным характеристикам канала. К потоку данных должны быть применены следующие процессы: адаптивное мультиплексирование транспортных потоков и рандомизация распределения энергии; внешнее кодирование (код Рида-Соломона); внешняя компоновка; внутреннее кодирование (сверточный код переменной длины); внутренняя компоновка; отображение и модуляция; передача OFDM.
Система непосредственно совместима с MPEG-2 кодированными ТВ сигналами КОЯЕС 13 818.
Поскольку система разрабатывалась для цифровых наземных телевизионных служб, которые должны будут работать в диапазоне частот (см. примечание), используемых для аналоговых передач, система должна обеспечивать достаточную защиту от высоких уровней интерференции от зеркального канала (CCI) и соседнего канала (АСІ) при работе существующих служб PAL/SECAM. Кроме того, система должна давать возможность достижения максимальной эффективности спектра при использовании в пределах УВЧ-диапазона; это требование может быть выполнено путем применения принципов одночастотной сети (SFN).
Данная спецификация может быть адаптирована к каналам 7 МГц путем пересчета всех параметров системы согласно изменению частоты системного генератора с 64/7 МГц на 8,0 МГц. Кадровая структура и правила кодирования, отображения и компоновки остаются прежними, только пропускная способность системы уменьшается в 7/8 раза вследствие соответствующего уменьшения полосы частот сигнала.
Для того чтобы удовлетворить этим условиям, описана система OFDM с последовательно присоединенным кодированием с коррекцией ошибок. Для достижения максимальной совместимости с основной спецификацией спутникового вещания и основными спецификациями кабельного вещания их внешнее кодирование и внешняя компоновка являются общими, а также внутреннее кодирование является общим с основной спецификацией спутникового вещания. Для оптимального согласования топологии сети и частотной эффективности определен гибкий защитный интервал. Это позволит системе поддерживать различные конфигурации сети, такие как одночастотные сети (SFN) большой площади с одним передатчиком при сохранении максимальной частотной эффективности.
Определены два режима работы: "режим 2к" и "режим 8к". "Режим 2к" предназначен для работы одного передатчика и для малых одночастотных сетей (SFN) с передатчиком ограниченного радиуса действия. "Режим 8к " может использоваться как для работы одного передатчика, так и для малых и больших одночастотных сетей (SFN).
Звуковой кодек реального времени на основе стандарта ААС
В первой главе приведен сравнительный анализ стандартов звукового кодирования. Из этого анализа следует, что на настоящий момент наиболее эффективным является стандарт звукового кодирования ААС [97]. Построение системы АВИС, представленной в настоящей работе, подразумевает, кроме прочего, разработку эффективного звукого кодера реального времени.
К кодеку реального времени помимо эффективности, обусловленной качеством декодируемого звука при заданной скорости потока на выходе кодера, предъявляются также требования эффективной реализации. Последнее требование связано прежде всего с требованиями максимально возможной простоты и - как следствие - дешевезны и низкого потребления приемных устройств.
Структура кодирующего устройства На Рис. 2.1 приведена структурная схема кодера ААС. Отметим, что здесь и далее под понятиями «звуковой сигнал» и «спектр звукового сигнала» подразумеваются соответственно дискретизированныи звуковой сигнал и дискретный спектр дискретизированного звукового сигнала.
Регулировка усиления (Gain control). Данный модуль не является обязательным в структуре кодека и предназначен для регулировки уровней звукового сигнала. На стороне кодера происходит поблочная регулировка уровня звукового сигнала и передача декодеру информации, необходимой для восстановления исходного соотношения. В состав данного модуля входит 4 полифазных квадратурных фильтра (PQF), обеспечивающих четырехполосное разделение спектра сигнала с последующим контролем уровня в каждой из четырех полос во временной области.
Психоакустическая модель вычисляет максимальные значения ошибок, маскируемых (то есть незаметных для человеческого уха) основным сигналом. Это так называемые пороги ошибок, превышение которых будут заметны при воспроизведении декодированного звукового сигнала. В приведены таблицы (табл. С.1-С.24 в информационном Приложении С), в соответствии с которыми производятся вычисления указанных порогов. Кроме этого в блоке психоакустической модели осуществляется выбор типа и длины взвешивающего окна, используемого в дальнейшем непосредственно перед МДКП-преобразованием (см. ниже). Отметим, что выбор осуществляется между двумя типами окон - Кайзера-Бесселя и синусным. Выбор длины взвешивающего окна и, соответственно, длины МДКП для одного кадра осуществляется исходя из следующих альтернатив: 2048 либо 256 при длине кадра 1024 отсчета или 1920 либо 240 при длине кадра 960 отсчетов. Короткие преобразования (256 и 240) осуществляются на том же интервале кадра 8 раз подряд, при этом используются соответствующие короткие взвешивающие окна. При обнаружении участка резкого изменения уровня сигнала с целью локализации этой динамической особенности данный блок выносит решение о применении коротких взвешивающих окон. Здесь же происходит оценка количества бит, необходимых для кодирования очередного анализируемого кадра.
МДКП — метод модифицированного косинусного преобразования (MDCT - Modified Discrete Cosine Transform). МДКП осуществляет преобразование временного звукового сигнала в частотную область. Формула преобразования выглядит следующим образом:
Здесь размерность входного сигнала в два раза больше размерности выходного. Это связано с тем, что МДКП в отличие, например, от обычного косинусного преобразования работает с перекрывающимися (на 50%) областями сигнала. Этим решается или, по крайней мере, ослабляется проблема блочности, то есть, появления немаскируемых артефактов на границах преобразования при последовательной обработке сигнала, длительность которого больше, чем длина окна используемого преобразования. Кроме этого, для предотвращения разрывов фазы на границах окна преобразования и, как следствие, появления мешающих артефактов в этих областях, в алгоритм ААС вводятся взвешивающие временные окна. Решение о длине окна и типе окна, как уже было сказано, принимается в блоке психоакустической модели кодека.
Метод временного преобразования формы шума квантования (TNS emporal Noise Shaping). Данный модуль служит для борьбы с последствиями процедуры квантования сигнала, что проявляется, например, в частом появлении немаскируемых, то есть различимых человеческим ухом, пре-эхо сигналов при наличии в сигнале резких фронтов, особенно характерных для речевых сигналов. Суть метода состоит в том, чтобы на основе спектрального анализа звукового сигнала предсказать ошибку квантования (forward prediction или опережающее предсказание) и ввести ее в сигнал ("вычесть" ее). Таким образом, при восстановлении сигнала немаскируемые артефакты, вызванные квантованием, будут частично подавлены.
Совмещенное стерео (Joint stereo): Intensity-стерео или M/S-стерео. Данный модуль служит для сокращения информационной избыточности, обусловленной высокой корреляцией между левым и правым каналами стереосигнала. При этом метод Intensity-стерео является алгоритмом сжатия с потерей информации, a M/S - алгоритмом без её потери. Соответствующему блоку декодера передается информация о выбранном типе стереокодирования. Алгоритм Intensity использует корреляционную зависимость между верхними частями спектров стереопары звукового сигнала. При этом в выходной поток передаются нижние части спектров левого и правого каналов в полосе до 6 кГц, а оставшаяся верхняя часть полосы передается в виде масштабированной невосстанавливаемой на стороне декодера суммы спектров левого и правого каналов. Алгоритм M/S (middle/side = среднее/разность) анализирует возможность передачи вместо сигналов левого (L) и правого (R) каналов пары M=(L+R)/2 и S=(L-R)/2 с точки зрения минимизации выходного битового потока. При этом оцениваются распределения мощностей для обоих вариантов и выносится решение о передаче пары L/R либо M/S.
Специфические особенности алгоритмов измерения параметров звукового канала
Одним из важнейших вопросов при разработке данной измерительной методики является проблема выбора взвешивающего окна. Использование прямоугольного окна неприемлемо ввиду большого уровня боковых лепестков модуля спектра этого окна: наибольший боковой лепесток имеет уровень -13 дБ относительно уровня главного лепестка, а скорость спада боковых лепестков составляет 6 дБ на октаву. Это приводит к так называемому "растеканию" спектра анализируемого сигнала. Растекание спектра является следствием частотной дискретности ДПФ. В частном случае, когда на конечном временном интервале укладывается целое число периодов анализируемого синусоидального сигнала, растекания спектра не происходит. Однако для синусоидального сигнала, имеющего частоту, не совпадающую ни с одним дискретным отсчетом ДПФ, а также при наличии между генератором и измерителем тракта передачи информации, в том числе преобразователей ЦАП и АЦП, такое допущение является неприемлемым. В связи с этим для оценки параметров анализируемого сигнала (частоты, уровня и др.) необходимо анализировать большое количество спектральных отсчетов. Для обеспечения высокой точности оценки параметров звукового сигнала предложено использовать специальное взвешивающее окно, обладающее низким уровнем боковых лепестков (менее 60 дБ). Платой за это является расширение центрального лепестка, аккумулирующего в себе большую часть энергии сигнала. Расширение центрального лепестка ведет к ухудшению разрешающей способности спектрального анализатора, построенного с использованием этого окна, однако существует возможность получения любого наперед заданного разрешения для данного взвешивающего окна путем увеличения длительности анализируемого сигнала при сохранении частоты дискретизации. С другой стороны оконная функция повышает точность оценки параметров одночастотных сигналов. В связи с этим оценка параметров канала производится с помощью однотональных сигналов, либо двутональных сигналов (при оценке коэффициента разностного тона), в которых частоты синусоидальных сигналов отстоят друг от друга на величину, большую ширины центрального лепестка модуля спектра оконной функции.
Одна из идей построения оконной функции, используемой при построении звукового анализатора, состоит в том, чтобы обеспечить близость формы взвешивающей функции и(х) к форме модуля спектра этой оконной функции F(y) [69, 71]. Представим оконную функцию в виде: получаем задачу условной оптимизации функции Зх переменных. В силу большой размерности функции поиск решения в аналитическом виде является проблематичным. Поэтому для решения задачи были использован численный метод наискорейшего (градиентного) спуска.
Метод градиентного спуска основан на вычислении частных производных по каждой независимой переменной исследуемой функции. Обозначим:
Этот вектор указывает направление наибольшего локального возрастания функции в каждой исследуемой точке. Соответственно, направление антиградиента указывает направление локального убывания функции в исследуемой точке. Модуль этого вектора определяет скорость возрастания (или убывания при поиске минимума):
Если по предположению исследуемая функция имеет несколько локальных экстремумов (либо экстремумов на границах при условной оптимизации), начальную точку поиска следует выбрать несколько раз (например, равномерно на всем исследуемом диапазоне изменения аргумента функции).
Известно, что сходимость метода градиентного спуска к оптимальному решению заметно ухудшается, когда в оптимизируемой функции есть операция взятия модуля, потому что в этом случае, вообще говоря, нарушается гладкость функции. В связи с этим задача (3.21) была разделена на две: поиск соответствующих максимума и минимума функции, исключая операцию взятия модуля: Численный анализ задачи (3.26, 3.27, 3.22) при любом фиксированном значении Дтах дает 4 оптимальные точки, расположенные на границах областей определения переменных оптимизации. Например, при Amax = 0.01 для задачи (3.26, 3.22) имеем
Основные положения вкладов России в МСЭ по созданию системы АВИС
Дальнейшее развитие этой системы отражено во вкладе России, представленном на рабочей группе 6М (документ 6М/150) на конференции 6й группы изучения МСЭ-Р в Сеуле (Южная Корея) в августе 2006 г. Рис. 4.17: Первая страница вклада на конференции МСЭ в Сеуле На этой конференции был принят связующий документ для рабочей группы 6Е (документ 6Е/430 [26]), в котором указано, что эта система является кандидатом для включения в Отчет МСЭ-Р ВТ.2049 и в проект новой рекомендации «Вещание мультимедиа и данных для мобильного приема на наладонные устройства». Аудиоанализатор компьютерный АК-1 [79,110] предназначен для: - цифрового формирования специальных измерительных сигналов для измерений и контроля основных параметров трактов звукового моно- и стереовещания; - анализа искажений основных параметров трактов звукового моно- и стереовещания; - визуального контроля звуковых сигналов в реальном времени (индикатор уровня, гониометр, коррелограф); - использования в качестве цифрового осциллографа; - использования в качестве анализатора спектра; - сохранения результатов измерений в файл. Аудиоанализатор устанавливается в каналах формирования и распределения звуковых программ и сигналов звукового сопровождения телевизионных программ в аппаратно-студийных комплексах ТВ центров, радиорелейных и спутниковых системах передачи телевидения, ТВ радиопередающих и ретрансляционных станциях, системах кабельного телевидения в соответствии с ГОСТ 7845-92, ГОСТ 11515-91, ГОСТ 28324-89, ГОСТ Р 50890-96, ГОСТ Р 50822-95, Нормами на электрические параметры каналов звукового вещания, организованных в радиорелейных системах передачи на поднесущих частотах и в спутниковых системах передачи, Правилами технической эксплуатации средств ТВ вещания, Рекомендациями МСЭ. Внешний вид аудиоанализатора представлен на Рис. 4.18.
Аудиоанализатор допускает работу в высокочастотных полях с напряженностью поля в соответствии с "Санитарными нормами и правилами при работе с источниками электромагнитных полей высоких, ультравысоких и сверхвысоких частот". Нормальные условия применения: (25 + 5) С, относительная влажность от 30 до 80 %, атмосферное давление от 84 до 106 кПа (630 - 795 мм рт.ст.). Плата аудиоанализатора устанавливается в свободный слот шины PCI материнской платы компьютера. Питание платы аудиоанализатора осуществляется от внутреннего источника питания компьютера через разъем шины PCI. Потребляемый ток от источника «+5 В» - не более 0.6 А; от источника «+12 В» - не более 0.9 А. Потребляемая мощность не превышает 15Вт. Плата аудиоанализатора сохраняет работоспособное состояние при следующих отклонениях питающих напряжений от их номинального значения: (5.00 ± 0.25) В и (12.0 ± 1.2) В. Характеристики входных и выходных сопротивлений аудиоанализатора. Сопротивление по постоянному току каждого из измерительных входов аудиоанализатора составляет (10000,000 ± 0.375)
Ом при коэффициенте асимметрии не менее 46 дБ в полосе частот до 20 кГц. Сопротивление по постоянному току каждого из выходов аудиоанализатора составляет (50,000 ± 0,375) Ом при коэффициенте асимметрии не менее 46 дБ в полосе частот до 20 кГц. Аудиоанализатор обеспечивает все виды измерений трактов звукового моно- и стереовещания по низкой частоте в соответствии с ГОСТ 11515-91. Анализатор прибора имеет режимы: - анализатора спектра в диапазоне частот от 5 до 20000 Гц с дискретностью 1 Гц; - цифрового осциллографа с воспроизведением формы измерительных сигналов. Анализатор обладает следующими техническими характеристиками: - диапазон частот входных сигналов от 5 до 20 000 Гц; - входное сопротивление (балансный вход) (10 000 ± 6) Ом; - коэффициент асимметрии входа - не менее 46 дБ; - диапазон изменения уровней входных сигналов от 9 до -40 дБ; - погрешность измерения эффективного переменного напряжения синусоидальной формы в диапазоне от -46 дБ до 9 дБ - не более 0,1 дБ; - максимальное входное напряжение не должно быть больше + 25 В (постоянное напряжение) или ± 200 В (импульсное напряжение); - погрешность измерения частоты — не более 0,05 Гц. Номенклатура и погрешность измерения основных параметров и характеристик канала звукового вещания приведены в Табл. 4.1: