Введение к работе
Актуальность темы. Массовая компьютеризация и информатизация всех отраслей знаний стимулировали разработку новых математических моделей исследуемых объектов в различных предметных областях. К числу таких объектов относятся изображения, предоставляющие большое количество информации об изображенных объектах в наглядной и образной форме. В то же время возможности извлечения полезной информации из изображений определяются их пространственной структурой. Поэтому задачи моделирования и анализа структуры изображений возникают в различных прикладных областях при решении самых разнообразных задач.
Графические изображения (карты, схемы, планы, чертежи и т.д.), для которых характерно априорное их структурирование, образуя обширный подкласс всего многообразия изображений, не слишком эффективно обрабатываются существующими методами кодирования изображений. Причина этого в том, что присущие им внутренние корреляции чрезвычайно сильно и избирательно связаны с их упорядоченной и организованной структурой. Поэтому отсутствие учета этой структуры приводит к существенному снижению показателей сжатия графической информации, определяющих эффективную пропускную способность каналов связи телекоммуникационных систем, а также к снижению производительности процедур кодирования и декодирования, либо к возрастанию их ресурсозатратности.
Весьма важной и актуальной в данной ситуации является проблема эффективной компрессии цифровых изображений. Необходимо развивать сферу сжатия данных и изображений в нескольких направлениях. Такой подход диверсификации путей развития, безусловно, позволит достичь высоких результатов не только по решению основной задачи сжатия данных, но и многих других смежных задач.
Разработке эффективных представлений и моделей изображений, методов их обработки и кодирования уделено большое внимание в работах отечественных и зарубежных ученых: Бонгарда М.М., Вудса Р.Е., Гонсалеса Р.С., Журавлева Ю.И., Ковалевского В.А., Лебедева Д.С., Файна В.С., Цуккермана И.И., Ярославского Л.П., Нарасимхана Р., Павлидиса Т., Прэтта У., Розенфельда А., Стокхэма Т., Сэломона Д., Фримена Х., Фу К., Харалика Р.М., Эддинса С.Л. и др.
На сегодняшний день в области сжатия изображений существует ряд проблем. При высокой степени компрессии изображений современными наиболее мощными и популярными стандартами компрессии наблюдается значительное ухудшение визуального качества изображения, которое проявляется либо в виде «блочности» изображения и эффекта ореола вокруг контурных линий (JPEG), либо в виде сильного размытия контуров изображения (JPEG2000). Сохранение качественного отображения контуров на изображении имеет важное значение практически для всех типов изображений, в особенности для изображений, используемых при цифровой обработке геологических карт, геофизических и гидродинамических моделей месторождений полезных ископаемых.
Поэтому актуальной является задача поиска эффективных методов и алгоритмов сжатия изображений, позволяющих сохранять без изменений или с малыми искажениями в первую очередь именно контурную информацию изображения.
Область исследования. Диссертационная работа выполнена в соответствии с пунктами «4. Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации», «5. Разработка специального математического и программного обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации», «12. Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации» паспорта специальности 05.13.01 – «Системный анализ, управление и обработка информации (в науке и технике)» и пунктами «2. Исследование процессов генерации, представления, передачи, хранения и отображения аналоговой, цифровой, видео-, аудио- и мультимедиаинформации; разработка рекомендаций по совершенствованию и созданию новых соответствующих алгоритмов и процедур», «12. Разработка методов эффективного использования сетей, систем и устройств телекоммуникаций в различных отраслях народного хозяйства» паспорта специальности 05.12.13 – «Системы, сети и устройства телекоммуникаций».
Объектом исследования являются свойства и характеристики цифровых полутоновых изображений, системы их сжатия и передачи по цифровым каналам связи телекоммуникационных сетей.
Предметом исследования являются формы представления, обработка изображений, контурная интерполяция изображений, метод сжатия изображений, основанный на дискретном вейвлет-преобразовании.
Цель работы состоит в получении научно-обоснованных методических и технических решений, основанных на анализе свойств, характеристик и схем взаимного согласования процедур сжатия графической информации, направленных на разработку методик и алгоритмов эффективного кодирования полутоновых изображений, обеспечивающих сохранение контурной информации при высокой степени компрессии данных, применение которых повысит качественные характеристики систем передачи графической информации по цифровым каналам связи телекоммуникационных систем.
Для достижения поставленной цели необходимо решить следующие задачи:
– провести анализ универсальных методов сжатия данных, методов сжатия полутоновых изображений, а также анализ характера избыточности данных в изображениях с целью разработки методик и алгоритмов эффективного кодирования полутоновых изображений, учитывающих структурный характер изображения;
– исследовать алгоритмы нахождения и утолщения контурных линий на полутоновом изображении для разработки методики контурного кодирования полутонового изображения;
– разработать эффективный алгоритм контурной интерполяции, обеспечивающий восстановление отсутствующей неконтурной информации изображения;
– выполнить сравнительный анализ методов компрессии двухуровневых изображений с целью определения эффективного метода компрессии контурного изображения;
–исследовать возможность применения дискретного вейвлет-преобразования (ДВП) для компрессии контурной информации полутонового изображения и определить оптимальные параметры ДВП для решения данной задачи;
– провести экспериментальные исследования, направленные на определение наиболее эффективного метода компрессии коэффициентов ДВП контурной информации изображения;
– оценить эффективность компрессии и визуальное качество изображений, сжатых с помощью существующих методов сжатия и с помощью разработанного метода контурного сжатия полутоновых изображений (МКСИ).
Методы исследования. В диссертационной работе применялись теоретические и экспериментальные методы исследования.
При контурном кодировании исходных полутоновых изображений использовались детекторы выделения контуров (Собела, Превитта, Канни и т.д.). Для утолщения контурного изображения использовался метод дилатации двухуровневых изображений. Наложение контурной маски на исходное полутоновое изображение осуществлялось с помощью операции умножения. Преобразование маскированного изображения в одномерный массив осуществлялось с помощью метода построчного сканирования двумерного массива пикселей изображения. Компрессия полученного одномерного массива данных осуществлялось с помощью одномерного ДВП в совокупности со стандартными методами сжатия данных.
В экспериментальных исследованиях разработанных методик и алгоритмов использовались методы системного анализа, сегментации изображений, морфологической обработки изображений, ДВП данных, методы интерполяции двумерных сигналов, методы компрессии данных, методы сжатия двухуровневых изображений и основы системного программирования.
Достоверность и обоснованность полученных в работе результатов и выводов подтверждается сопоставительным анализом разработанных и существующих методик и алгоритмов, а также итогами проведения вычислительного эксперимента и компьютерного моделирования.
Теоретические положения, полученные в работе, обосновываются последовательным и корректным применением математического аппарата при выводе аналитических выражений. Методики, алгоритмы и прикладные программы, используемые в работе, основаны на положениях теории вероятностей, теории информации и сжатия данных, теории математической логики, теории кодирования источника, математической статистики, методов обработки и анализа изображений, теории вейвлет-преобразования.
Достоверность результатов экспериментального исследования обеспечена большим объемом экспериментального материала, который соответствует прогнозируемым данным, а также выбором надежных критериев при построении алгоритмов обработки информации и наглядностью интерпретации полученных практических результатов.
В программной среде Matlab была осуществлена проверка разработанных теоретических положений, реализация разработанных алгоритмов и методик, их сравнение с существующими методами.
На защиту выносятся результаты разработки метода контурного сжатия полутоновых изображений, в том числе:
– метод компрессии полутоновых изображений, основанный на контурном кодировании изображения и сжатия контурных данных с помощью одномерного ДВП; метод декомпрессии, осуществляемый с помощью обратного ДВП и контурной билинейной интерполяции;
– методика контурного кодирования полутоновых изображений, основанная на детекторе контуров, утолщении контурных линий и маскировании исходного изображения;
– метод и алгоритм контурной билинейной интерполяции, осуществляющий восстановление неконтурной информации на полутоновом изображении;
– определение параметров ДВП, оптимальных для компрессии контурной информации изображения: тип вейвлета, глубина разложения, уровень квантования и порог обнуления;
– технологическая схема обработки информации при использовании метода контурного сжатия изображений, обеспечивающая эффективность использования разработанных средств и методов в интеллектуальных системах телекоммуникаций;
– экспериментальные исследования разработанных средств и методов, а также сравнение эффективности МКСИ и JPEG2000 при сжатии полутоновых изображений.
Научная новизна результатов диссертационного исследования, полученных лично автором, заключается в следующем:
– разработан метод контурного сжатия полутоновых изображений, позволяющий сохранить контурную составляющую изображения при высокой степени компрессии, что достигается за счет контурного кодирования и сжатия контурной информации с помощью одномерного дискретного вейвлет-преобразования;
– предложена методика контурного кодирования полутоновых изображений, позволяющая с высокой надежностью выделить контурную информацию изображения за счет комплексного использования детектора контуров Канни, дилатации контурных линий и выделения контурной информации изображения за счет наложения контурной маски;
– разработаны метод контурной билинейной интерполяции полутоновых изображений и реализующий его алгоритм, позволяющие эффективно восстанавливать отсутствующую неконтурную информацию изображения, что достигается за счет учета значений яркости околоконтурных пикселей, использования методики двунаправленного взвешивания опорных точек и интерполяции значений яркости пикселей «пустых» областей на маскированном изображении;
– установлены оптимальные параметры одномерного ДВП для эффективной компрессии имеющей выраженный высокочастотный характер контурной информации полутонового изображения: тип вейвлета – биортогональный вейвлет 8-4, лучше других концентрирующий энергию данных такого рода; число уровней субполосной схемы вейвлет-разложения – четыре, увеличение глубины преобразования только лишь технически усложняет операцию, не увеличивая его эффективности; использование квантования высокочастотных коэффициентов вейвлет-преобразования без использования порога обнуления, так как при квантовании потенциал сжатия данных выше, чем при установке порога обнуления, а ошибки восстановления не больше, чем при использовании обнуления;
– определено, что для компрессии коэффициентов одномерного ДВП контурной информации полутонового изображения является неэффективным использование общепринятой методики, основанной на совместном применении кодирования длин серий и арифметического сжатия, в результате того, что высокочастотные коэффициенты ДВП контурной информации, в отличие от коэффициентов ДВП данных целого изображения, не будут содержать длинных серий нулей (наблюдаются постоянно чередующиеся числа, лежащие вблизи нуля); оптимальным методом является метод контекстного сжатия, который с большей степенью компрессии сжимает данные такого рода;
– предложена технологическая схема обработки информации для метода контурного сжатия изображений, обеспечивающая получение на выходе восстановленного полутонового изображения в приемлемом визуальном качестве с четкой контурной составляющей при высоких степенях компрессии, что является результатом эффективного комплексного использования разработанных инструментальных средств и методов.
Практическая полезность работы заключается в применении нового подхода к сжатию изображений, который основывается на контурном кодировании изображения и дальнейшей компрессии контурной информации в процессе сжатия и контурной интерполяции изображений в процессе декомпрессии. Контурное кодирование осуществляется на основе детектора контуров Канни, который лучше других выделяет основные контурные линии на изображении, что доказано экспериментальным исследованием. При компрессии контурной информации предлагается использовать ДВП, оптимальные параметры которого по отношению к таким специфическим данным подобраны в работе на основе экспериментального исследования.
Предложенные новые методические и алгоритмические решения позволяют сохранить очень важную для восприятия человеческим зрением контурную информацию при высоком уровне сжатия полутонового изображения в отличие от самых популярных на сегодняшний день стандартов сжатия изображений, которые при высоком уровне компрессии приводят к значительному «размазыванию» контуров на изображении. Разработанные методики и алгоритмы позволят увеличить возможности архивирования графической информации, а также улучшить качественные характеристики процесса передачи графических данных по цифровым каналам связи телекоммуникационных систем.
Реализация и использование результатов работы. Полученные результаты использованы и апробированы при обработке изображений геологических разрезов продуктивных отложений, карт эффективных нефтенасыщенных толщин по пласту, карт по проницаемой части пласта, карт приведенных изобар, трехмерных распределений литологии и пористости, а также структурных моделей месторождений для повышения коммуникативных возможностей телекоммуникационных систем в ООО «ТНГ-Ижгеофизсервис» (г. Ижевск).
Полученные результаты использованы в учебном процессе ГОУ ВПО «ИжГТУ» при изучении дисциплин «Компьютерная графика», «Интерактивные графические системы», «Кодирование и цифровая обработка информации».
Апробация работы. Основные положения и результаты диссертации докладывались на российских и международных научно-технических конференциях и симпозиумах: Российской научно-технической конференции «Приборостроение в XXI веке. Интеграция науки, образования и производства» (Ижевск, 2006); Международной научно-технической конференции «Интеллектуальные и многопроцессорные системы» (Таганрог, 2007); Международной научно-технической конференции «Информационные технологии в инновационных проектах» (Ижевск, 2007); 34-й и 35-й Международной конференции «Информационные технологии в науке, образовании, телекоммуникации и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2007, 2008); Международном симпозиуме «Надежность и качество» (Пенза, 2008); IX Международной научно-технической конференции «Искусственный интеллект – 2008; Интеллектуальные системы – 2008» (пос. Кацивели, АР Крым, Украина, 2008).
Публикации. Основные научные результаты по теме диссертации опубликованы в 14 научных работах в региональных журналах, сборниках научных трудов и материалов конференций. Автор имеет 4 научных труда в изданиях, выпускаемых в РФ и рекомендуемых ВАКом для публикации основных результатов диссертаций.
Структура диссертационной работы. Диссертация содержит введение, 4 главы и заключение, изложенные на 165 стр. машинописного текста. В работу включены 68 рис., 11 табл., список литературы из 129 наименований. В приложении представлен акт об использовании результатов работы.