Содержание к диссертации
Введение 3
Глава 1. Хранение и передача музыкальных файлов в информационно - телекоммуникационных системах 13
1.1 Создание музыкальных файлов 13
1.2 Хранение и передача музыкальных файлов 21
1.3 Основные подходы к сжатию музыкальных файлов 29
1.4 Задачи исследования 36
Глава 2. Субполосное кодирование музыкальных сигналов 38
2.1 Основные элементы психоакустической модели восприятия звука 38
2.2 Субполосное преобразование музыкальных сигналов с помощью цифровых фильтров...42
2.3 Разработка новой обратимой процедуры субполосного преобразования музыкальных сигналов 50
2.4 Вычислительные эксперименты 60
2.5 Основные результаты и выводы главы 65
Глава 3. Квантование данных по уровню при сжатии музыкальных файлов 67
3.1 Методы квантования по уровню 67
3.2 Квантование по уровню при субполосном кодировании 74
3.3 Разработка метода субоптимального адаптивного квантования по уровню 90
3.4 Основные результаты и выводы главы 97
Глава 4. Разработка новой процедуры обработки данных при сжатии-восстановлении музыкальных файлов 98
4.1 Выбор основных параметров и методов обработки данных.; 98
4.2 Разработка процедуры сжатия 101
4.3 Программно-алгоритмическая поддержка обработки данных 108
4.4 Вычислительные эксперименты 119
4.5 Основные результаты и выводы главы... 122
Заключение 124
Литература 125
Приложение. Документы по апробации и внедрению результатов работы 133
Введение к работе
В настоящее время во всем мире получила значительное распространение процедура передачи и хранения сжатых музыкальных файлов. Их используют в своей работе владельцы студий звукозаписи, музыкальных сайтов, профессиональные музыканты и звукорежиссеры, а также пользователи, использующие музыкальные композиции для частного прослушивания.
Музыкальные файлы представляют собой результаты регистрации колебаний электрического тока на выходе микрофона, на мембрану которого воздействует музыкальная композиция. Частота дискретизации для файлов подобного типа не может быть менее 44100 Гц, что соответствует спектру от 0 до 22050 Гц. Для кодирования каждого отсчета дискретного сигнала используется от 16 до 24 бит. Учитывая, что среднее время исполнения музыкальной композиции равно 3 мин, то несложно подсчитать ее объем - 30 Мб. Принимая во внимание тот факт, что скорость передачи данных по сети Интернет редко превышает 20 кб в секунду, то время скачивания одной песни может составлять 1500 с. или 25 минут. Таким образом, возникает проблема уменьшения объема битового представления подобных файлов для снижения сетевого трафика при передаче и объема дискового пространства необходимого для хранения последних. Над уменьшением битового представления музыкальных данных долгое время работает несколько групп исследователей, в результате чего был создан ряд стандартов. Наиболее известными из них являются стандарты MPEG, АС-3, WMA и т.д.
Данные стандарты предполагают уменьшение объема битового представления исходных данных за счет более грубого квантования по уровню и статистического (энтропийного) сжатия.
Квантование по уровню является необратимой операцией, т.е. будут потери, следовательно, нужно аккуратно подойти к выбору процедуры квантования (включая шаг квантования). Следует иметь в виду, что при выборе процедуры квантования целесообразно достигать меньшей энтропии полученной последовательности, т.к. от этого зависит эффективность статистического кодирования. Существующие стандарты при выборе шага квантования основываются на так называемой психоакустической модели, а именно учитывается избирательность человеческого слуха к различным частотным диапазонам и явление маскировок более сильным звуком более слабого и частотной составляющей с большей интенсивностью частотной составляющей с меньшей интенсивностью, если они попадают в один и тот же частотный диапазон.
В связи с этим, основным элементом процедуры сжатия является разделение исходного сигнала на составляющие спектры которых сосредоточены в разных интервалах оси частот. Для реализации этого используются цифровые КИХ-фильтры. При этом для уменьшения количества обрабатываемых в дальнейшем данных осуществляется прореживание выходной последовательности фильтров, так что при ширина подполосы равной А/, остается каждый М-й отсчет М = /д/Af. В стандарте МРЗ выделяют субполосы, так что остается каждый 32-й элемент.
Отметим, что в виду неидеальной прямоугольности КИХ-фильтра, при прореживании возникает искажение обусловленное наложением частот (элайсинг). В существующей теории частотного анализа-синтеза показано, что совместная обработка специального вида выходных прореженных данных всех полос позволяет в восстановленном сигнале компенсировать элайсинг. Однако, в каждой из полос сохраняется погрешность вызванная им, а квантование данных по уровню исключает возможность компенсировать элайсинг даже при совместной обработке.
Таким образом, представляется целесообразным разработка метода субполосного представления в меньшей степени подверженного влиянию элайсинга и исключающего другие трудности применения КИХ-фильтров, как то необходимость дополнения обрабатываемого интервала, просачивание из др. интервалов и т.д.
Квантование данных по уровню в существующих системах сжатия применяется либо непосредственно к выходным прореженным последовательностям фильтров, либо к результатам их МДКП. Применяется равномерное квантование, шаг которого определяется частотной полосой. В любом случае при выборе шага квантования предварительно рассчитываются так называемые кривые маскировки с учетом разделения звуков на тональные и шумоподобные.
Отметим, что эти расчеты носят эвристический характер то же самое можно говорить и о выборе порогов для процедуры принятия решений. Иными словами, не ясно какова степень доверия к результатам решающих процедур. При этом некоторые значения отсчетов, признаваемые слишком малыми, могут подвергнуться обнулению, что может привести к необоснованной потере информации.
Таким образом, представляется целесообразным разработка метода квантования по уровню, в котором при выборе уровней и шагов квантования не используется эвристические расчеты на основе психоакустической модели, но гарантируется погрешность цифрового представления данных.
Кроме того, очевидно, что отказ от использования психоакустической модели позволяет отказаться от процедуры частотного разделения.
Основным способом статистического кодирования в существующих процедурах сжатия является код Хаффмана. Вместе с тем известен так называемый метод арифметического кодирования, который теоретически является наилучшим с точки зрения адаптируемости к энтропийным характеристикам кодируемых последовательностей.
Целью работы является повышение эффективности использования информационно-телекоммуникационных систем для хранения и передачи файлов с музыкальными данными за счет разработки более совершенных процедур их обработки.
Для достижения этой цели на основе анализа состояния вопроса были сформулированы и решены следующие задачи:
1. Разработка новой обратимой процедуры получения субполосного представления конечных отрезков отсчетов (блоков) музыкальных сигналов на основе вычислений для каждой из заданных частотных полос соответствующей последовательности чисел, спектр которой наилучшим в смысле минимума евклидовой нормы погрешности образом аппроксимирует в этой полосе отрезок спектра исходных данных.
2. Разработка субоптимального метода неравномерного квантования отсчетов по уровню, позволяющего при заданной среднеквадратической относительной погрешности представления исходных данных получить наименьшее количество уровней квантования.
3. Разработка и исследование новой процедуры сжатия-восстановления файлов музыкальных данных с применением арифметического кодирования, без использования эвристических психоакустических моделей.
4. Разработка программно-алгоритмической поддержки новой информационной технологии сжатия-восстановления музыкальных файлов.
Методы исследований:
• Методы системного анализа и синтеза на основе использования вариационных принципов.
• Методы цифровой обработки сигналов.
• Вероятностно-статистическое моделирование.
• Вычислительный эксперимент.
СОДЕРЖАНИЕ РАБОТЫ
Диссертация состоит из Введения, четырех глав, Заключения и Приложения, в котором приведены документы, подтверждающие внедрение результатов работы.