Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Пивоваров Илья Валерьевич

Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи
<
Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Пивоваров Илья Валерьевич. Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи : диссертация ... кандидата технических наук : 05.12.13, 05.13.18.- Ижевск, 2005.- 163 с.: ил. РГБ ОД, 61 06-5/1076

Содержание к диссертации

Введение

Глава 1. Анализ представления, кодирования и технологий обработки графической информации 15

1.1. Структурно-графические свойства изображений 15

1.2. Обзор основных цветовых моделей и цветовых координатных систем 19

1.3. Представление графической информации в телекоммуникационных системах 36

1.3.1. Основные типы данных изображений 39

1.3.2. Основные типы файловых изображений 41

1.4. Методы обработки цифровых изображений 46

1.5. Постановка цели и задач исследований 51

Глава 2. Интеллектуальная информационная технология для обработки цветных графических изображений 53

2.1. Описание системы адаптивного цветотонового преобразования изображений 53

2.2. Проекционный кластерный анализ цветовых компонент изображений 57

2.2.1. Математическое описание кластеров 59

2.2.2. Классификация точек изображения по кластерам . 61

2.2.3. Выделение габаритных контейнеров цветовых кластеров по их проекциям 64

2.3. Преобразование и цветокоррекция графических изображений 67

2.4. Возможности структурного анализа изображений 76

2.4.1. Стягивание цветовых кластеров изображения с помощью центроидного фильтра 78

2.4.2. Влияние стохастических искажений на характеристики кластеров цветовых компонент 82

2.4.3. Возможности структурного анализа изображений . 94

2.5. Полученные результаты и выводы 96

Глава 3. Математические модели сигналов, отображающих графические изображения, и получение статистических характеристик оценок потерь их записи и считывания 99

3.1. Анализ средств оценки потерь записи-считывания графиче ских изображений 99

3.2. Математические модели непрерывного и дискретного сигналов, отображающих графические изображения 101

3.3. Среднее и дисперсия оценок потерь записи и считывания графических изображений 109

3.4. Получение оценок распределения оценок потерь записи и считывания графических изображений 113

3.5. Изучение асимптотики оценок распределения оценок потерь записи и считывания графических изображений 118

3.6. Полученные результаты и выводы

Глава 4. Программно-алгоритмические средства и интеллекту альные технологии для обработки графической инфор мации 125

4.1. Алгоритмы, программное обеспечение и технология обработки графической информации 125

4.2. Сжатие графической информации 129

4.3. Экспериментальные данные и результаты 140

4.4. Полученные результаты и выводы 144

Заключение 145

Литература

Введение к работе

Актуальность темы. Состояние современного мирового сообщества можно определить как стадию перехода от индустриальной фазы эволюции к информационной постиндустриальной фазе, для которой характерны процессы экономической и информационной интеграции. Эти глобальные процессы стимулируют бурное развитие и внедрение инфокоммуникационных технологий во все сферы человеческой деятельности.

В настоящее время общепризнанным фактом является то, что электросвязь во всем мире находится на этапе интенсивного развития. Одним из глобальных процессов стала эволюция сетей, служб и терминального оборудования в направлении конвергенции, определяемая, с одной стороны, прогрессом в ключевых технологиях и, с другой, - новыми требованиями и растущими ожиданиями пользователей. В связи с этим наметилась тенденция создания универсальных систем комплексного представления информации типа мультимедиа (multimedia), в которых в пределах одной технологии, технических и программных средств возможен интерактивный доступ к различным видам информации и комбинированное воспроизведение текста, иллюстраций, графики, видеоинформации и звука. При этом информация может воспроизводиться как по оригиналам или записям различных документов, так и по данным ЭВМ или компьютерных сетей различного типа: начиная от локальных сетей типа LAN, заканчивая всемирной цифровой сетью интегрированных услуг (Integrated Service Digital Network—ISDN) или Internet.

Визуальное представление данных обладает чрезвычайно высокой информативностью, поскольку подавляющая часть информации о внешнем мире, а это более 80 % объема, воспринимается с помощью зрительного аппарата. Поэтому проблема эффективного представления и кодирования видеоинформации и, в частности изображений или графических образов, остается на сегодняшний день крайне актуальной, поскольку информационная емкость изобра-

жений накладывает значительные ограничения на использование каналов связи (КС) для передачи видеоинформации.

Развитие интеллектуальных телекоммуникационных систем породило новую проблему. Вместе с наблюдающимся интенсивным ростом применения алгоритмов цифровой обработки графической информации в телекоммуникациях, актуальной остается разработка когнитивных моделей данных, позволяющих автоматически анализировать содержание этой информации с помощью современных компьютерных технологий и при этом сразу и непосредственно использовать результаты анализа при решении различных практических задач.

Масштабные исследования и разработки в области разработки эффективных моделей представления структурно-цветовой информации в графических изображениях (ГИ) и их использования в телекоммуникационных системах, выполняемые как в работах отечественных, так и зарубежных ученых и инженеров, ведутся уже на протяжении нескольких десятилетий. Однако опережающий рост потребностей не позволяет снять проблему с повестки дня.

Таким образом, актуальной является задача обеспечения оперативной передачи по КС больших объемов эффективно воспринимаемой информации в виде графических и динамических изображений, в наибольшей мере удовлетворяющих коммуникативным потребностям пользователей.

Объектом исследования являются ГИ, характеризующие различные реальные физические и абстрактные объекты, обладающие свойством графической определенности и отчетливо выраженным структурным характером их построения, подверженные воздействию искажающих факторов их воспроизведения, формирования и регистрации; свойства и характеристики ГИ, способы их получения, интеллектуальные платформы телекоммуникационных систем.

Предметом исследования являются формы представления и кодирования ГИ; адаптивное цветотоновое преобразование изображений (АЦТП); структурно-цветовой анализ (СЦА) изображений; кластерные модели цветовых компонент изображений; программно-инструментальные средства обработки ГИ;

7 программно- аппаратные средства интеллектуальных платформ телекоммуникационных систем распознавания и передачи ГИ.

Цель работы состоит в проведении комплексных исследований для получения научно-обоснованных методических и технических решений, направленных на достижение более высокого быстродействия передачи по цифровым каналам связи ГИ путем построения кластерной модели цветовых компонент изображений, применения АЦП 1, стратификации изображений и выделения их элементов, что будет способствовать снижению нагрузки на телекоммуникационные системы за счет обеспечения возможности более эффективных кодирования и сжатия информации.

Для реализации поставленной цели необходимо решить следующие задачи:

разработка алгоритма АЦТП, позволяющего за приемлемое время выделять кластеры в цветовом пространстве изображения;

проведение анализа, выбора и реализации оптимальной разделяющей функции критерия Байеса для АЦТП для увеличения точности преобразования; создание программного обеспечения, реализующего АЦТП; создание программно-алгоритмических средств достижения значительного понижения уровня шумов и искажений в изображении;

определение коэффициентов детерминации, отражающих степень адекватности искомых зависимостей изменения объема экстентов кластеров в процессе обработки кластеризующим фильтром от величины порога реальным процессам;

разработка методики СНА изображений на основе их адаптивного цве-тотонового и центроидного преобразований, обеспечивающей высокую достоверность предварительной обработки изображений;

- построение математических моделей многомерного непрерывного и
дискретного сигналов, отображающих ГИ, подверженных в процессе записи-
считывания воздействию аддитивных многомерных случайных помех;

- определение количественной оценки потерь записи, считывания и запи
си-считывания ГИ, представляемых непрерывным и дискретным сигналами при
воздействии в КС шумов, идентифицирующихся гауссовским процессом или

8 ограниченным случайным шумом с конечным временем перемешивания;

получение формул для среднего оценок потерь записи и считывания, определение точных и асимптотических выражений для дисперсии потерь. Установление сравнительно точных и удобных для построения доверительных интервалов экспоненциальных оценок сверху для вероятности, что оценки потерь записи и считывания превысят заданный уровень

создание программного обеспечения, реализующего алгоритмы анализа и синтеза дискретных представлений и методов кодирования ГИ для применения в телекоммуникационных системах; разработка методики улучшения качества изображения за счет устранения помех, а также повышение степени сжатия ГИ.

Методы исследования. В работе применялись теоретические и экспериментальные методы исследования.

Теоретические исследования основаны на использовании функционального анализа, теории вероятностей и математической статистики, методов машинной графики, методов обработки, анализа и кодирования изображений, методов распознавания образов.

В экспериментальных исследованиях разработанных моделей и алгоритмов использовались методы моделирования пространственных структур, основы цифровой обработки изображений и системного программирования, методы кодирования и передачи информации по цифровым КС телекоммуникационных систем.

Достоверность и обоснованность полученных в работе результатов и выводов подтверждается результатами обеспечения широкого практического использования аппаратно-программного комплекса, методик и технологий обработки ГИ, научными трудами и апробациями созданного научно-технического продукта на представительных научных форумах. Достоверность и обоснованность полученных в работе результатов и выводов подтверждена сопоставительным анализом разработанных и существующих математических моделей и методов.

Теоретические положения, выведенные в работе, обосновываются строгостью исходных посылок и корректным применением использованного мате-

9 матического аппарата при выводах аналитических выражений.

Достоверность экспериментальных результатов обеспечена их хорошей согласованностью с теоретически предсказанными характеристиками, а также выбором надежных критериев при построении алгоритмов обработки информации. Исходные данные при выполнении вычислительного эксперимента были тщательно верифицированы и дали хорошую воспроизводимость результатов на больших объемах экспериментального материала.

На защиту выносятся результаты разработки методики СЦА изображений на основе их адаптивного цветотонового и центроидного преобразований, обеспечивающей высокую достоверность предварительной обработки изображений для локализации и оценки их структурных элементов (СЭ) и высокую степень сжатия изображений, в том числе:

методика обработки ГИ алгоритмом АЦТП позволяющая снизить количество используемых цветов до минимума без потери цветоразличения, что обеспечивает редукцию тоно-цветовой шкалы с достаточной степенью точности;

обнаружение нового эффекта работы центроидного фильтра, заключающегося в том, что при обработке исходного изображения и помещении ее результатов на чистый белый растр происходит выделение только тех точек изображения, которые удовлетворяют некоему порогу, которому дано определение;

методика обработки ГИ фильтром, кластеризующим значения цветовых компонент, выделение кластеров этих компонент, распознавание цвета пикселей изображения по выделенным кластерам, формирование слоев (стратификацию) изображения, соответствующих выделенным кластерам, и распознавание в этих слоях СЭ изображения с помощью центроидного преобразования;

формулирование на математическом языке достаточных условий для случайных помех, при которых возможно удовлетворительно описать вероятностные свойства оценок потерь записи и считывания непрерывного и дискретного сигналов, отображающих ГИ;

рассмотрение двух вполне реальных случаев стационарного процесса, а

10 именно, когда помехи представляют собой гауссовский процесс или ограниченный случайный процесс с конечным временем перемешивания при изучении оценок распределения потерь записи и считывания;

методика, основанная на сочетании алгоритмов АЦТП и метода Барроуза-Уилера сжатия информации, позволяющая добиваться улучшения качества ГИ за счет устранения помех, вызванных переносами документа на материальные носители с последующей повторной оцифровкой, и степени сжатия ГИ с ограниченным количеством цветов, превосходящую основные графические форматы;

разработка модуля расширения к библиотеке для работы с растровыми изображениями Freelmage, который предназначен для сохранения и загрузки изображений.

Научная новизна полученных результатов определяется проведенными комплексными исследованиями, в результате которых разработан и реализован алгоритм АЦТП, как интеллектуальная информационная технология, позволяющая автоматически выделять кластеры в цветовом пространстве изображения посредством проекционного кластерного анализа цветовых компонент изображений, обеспечивающая преимущества автоматизированного анализа перед ручным выделением цветовых кластеров по ключевым участкам исходного изображения, в ходе которых:

установлено, что в результате обработки изображений при увеличении радиуса апертуры гауссовского фильтра кластеризующим фильтром наблюдается эффект расплывания кластеров цветовых компонент изображения с повышением порога, поскольку в процессе гауссовского размытия цвет каждого пикселя распространяется среди соседних, что приводит к размытию границ кластеров цветового пространства и делает практически труднореализуемой задачу выделения цветовых компонент;

определено, что наложение гауссовского шума на исходное изображение придает ему некоторую зернистость, т.е. воздействие шума в изображении приводит к случайному изменению цвета пикселей. С увеличением уровня за-

шумленности работа центроидного фильтра по обнаружению цветовых кластеров становится малоэффективной;

в качестве количественной оценки потерь записи или считывания ГИ, представляемого непрерывным сигналом, принята случайная величина, представляющая собой среднее во времени значение интеграла от взвешенной суммы квадратов разностей между значениями соответствующих координат многомерного сигнала на входе и выходе КС в текущий момент времени, исчисляемый от начала сигнала, и среднее по количеству отсчетов значение интеграла от суммы квадратов разностей между дискретизированными значениями соответствующих координат многомерного сигнала на входе и выходе КС в текущий отсчет времени, начиная от начала сигнала, - для дискретного КС;

из полученных оценок для вероятности видно, что оценки потерь записи и считывания при увеличении длительности передаваемых сигналов, отображающих ГИ, с экспоненциальной скоростью сходятся по вероятности к их дисперсиям. Полученные оценки вероятностей удобны тем, что в правые части неравенства вместо дисперсий и интервалов корреляции помех можно подставлять их оценки сверху. Это обстоятельство существенно расширяет возможно-сти применения установленных оценок;

проведены экспериментальные исследования разработанных средств и методов, подтвердившие их эффективность и возможности использования в интеллектуальных телекоммуникационных системах. В экспериментах анализировались возможности адаптивного цветотонового и центроидного преобразований изображений для реализации методики СЦА, эффективность процессов синтеза и распознавания изображений, оценивались показатели кодирования и сжатия ГИ и производительности процедур их обработки.

Практическая полезность работы. Создано программное обеспечение, реализующее алгоритмы анализа и синтеза дискретных представлений и методов кодирования ГИ для применения в телекоммуникационных системах. Разработанные для используемых процедур обработки информации программы по-

12 строены таким образом, что допускают возможность их реализации как в автономном, так и в интегрированном режимах обработки данных.

Предложена технологическая схема обработки ГИ, обеспечивающая эффективность использования разработанных средств и методов в интеллектуальных системах телекоммуникаций. Технология обработки данных предполагает выполнение всех необходимых процедур анализа изображений, кодирование и передачу по КС результатов этого анализа и выполнение процедур декодирования, синтеза изображений и их когнитивных моделей данных.

Установлены сравнительно точные и удобные для построения доверительных интервалов экспоненциальные оценки сверху для вероятности, что оценки потерь записи и считывания превысят заданный уровень. Аргументами в этих неравенствах служат простые и наглядные характеристики случайных помех, такие как ограничивающие их константы, интервалы корреляции, спектральная плотность и ковариационная функция.

Реализация работы в производственных условиях. Полученные результаты использованы и апробированы для опытно-производственной эксплуатации системы обработки ГИ в Тульском филиале ОАО «ЦентрТелеком».

Созданные программные средства обработки ГИ позволили повысить эффективность функционирования цифровых КС телекоммуникационных систем при передаче этой информации, обеспечили сокращение объемов памяти для цифрового представления ГИ и увеличение скорости передачи информации.

Апробация работы. Результаты работы докладывались на российских и международных научно-технических конференциях и конгрессах: VII Всероссийской НТК «Повышение эффективности средств обработки информации на базе математического моделирования» (Тамбов, 2004); XXXI Международной конференции «Информационные технологии в науке, образовании, телекоммуникациях и бизнесе» (Украина, Крым, Ялта - Гурзуф, 2004); Международном симпозиуме «Надежность и качество» (Пенза, 2004-2005); VI Международном конгрессе по математическому моделированию (Нижний Новгород, 2004);

13 XXXI Международной конференции «Информационные технологии в науке, социологии, экономике и бизнесе» (Украина, Крым, Ялта - Гурзуф, 2004); V Международной НТК «Проблемы техники и технологии телекоммуникаций» (Самара, 2004); VII Молодежной НТК «Наукоемкие технологии и интеллектуальные системы» (Москва, 2005); Всероссийской НТК «Компьютерные и информационные технологии в науке, инженерии и управлении» (Таганрог, 2005); Международной НТК «Искусственный интеллект-2005» (п. Дивноморское, 2005); Международной НТК «Интеллектуальные и многопроцессорные систе-мы-2005» (Таганрог, 2005).

Публикации. Основные научные результаты по теме диссертации опубликованы в 22 научных работах, в том числе: 21 статья в научно-технических журналах и сборниках; 1 тезис доклада на научно-технической конференции.

Структура диссертационной работы определяется общими замыслом и логикой проведения исследований.

Диссертация содержит введение, 4 главы и заключение, изложенные на 163 с. машинописного текста. В работу включены 58 рис., 7 табл., список литературы из 117 наименований и приложение, в котором представлен акт об использовании результатов работы.

СОДЕРЖАНИЕ РАБОТЫ

Введение содержит обоснование актуальности темы, формулировку цели и задач работы, основные положения, выносимые на защиту, и определяет содержание и методы выполнения работы.

В первой главе проведен анализ представления, кодирования и технологий обработки графической информации, рассмотрены структурно-графические свойства изображений, приведен обзор основных цветовых моделей и цветовых координатных систем, а также рассмотрено представление графической информации в телекоммуникационных системах и методы обработки цифровых изображений.

Во второй главе предложена интеллектуальная информационная технология для обработки цветных графических изображений, в том числе описана система АЦТП, разработаны проекционный кластерный анализ цветовых компонент изображений, алгоритмы преобразования и коррекции графических изображений и показаны возможности структурного анализа изображений.

В третьей главе представлены математические модели непрерывного и дискретного сигналов, отображающих графические изображения, при их записи и считывании, подверженных воздействию аддитивных многомерных случайных помех, в том числе проведен анализ средств оценки потерь записи-считывания графических изображений, определены математические модели непрерывного и дискретного сигналов, отображающих графические изображения, вычислены среднее и дисперсия оценок потерь записи и считывания графических изображений, а также изучены асимптотики оценок распределения оценок потерь записи и считывания графических изображений.

В четвертой главе описаны разработанные алгоритмы, программное обеспечение и технология обработки графической информации, а также результаты экспериментальных исследований разработанных средств и методов.

В заключении сделаны выводы о проделанной работе.

Обзор основных цветовых моделей и цветовых координатных систем

Цвет - одно из свойств объектов материального мира, воспринимаемое как осознанное зрительное ощущение. Тот или иной цвет «присваивается» человеком объектам в процессе их зрительного восприятия [5].

В подавляющем большинстве случаев цветовое ощущение возникает в результате воздействия на глаз потоков электромагнитного излучения из диапазона длин волн, в котором это излучение воспринимается глазом (видимый диапазон - длины волн от 380 до 760 нм). Иногда цветовое ощущение возникает без воздействия лучистого потока на глаз - при давлении на глазное яблоко, ударе, электрическом раздражении и др., а также по мысленной ассоциации с др. ощущениями - звука, тепла и т.д., и в результате работы воображения. Различные цветовые ощущения вызывают разноокрашенные предметы, их разно-освещенкые участки, а также источники света и создаваемое ими освещение. При этом восприятия цветов могут различаться (даже при одинаковом относительном спектральном составе потоков излучения) в зависимости от того, попадает ли в глаз излучение от источников света или от несамосветящихся объектов. Однако в человеческом языке используются одни и те же термины для обозначения цвета этих двух разных типов объектов. Основную долю предметов, вызывающих цветовые ощущения, составляют несамосветящиеся тела, ко торые лишь отражают или пропускают свет, излучаемый источниками. В общем случае цвет предмета обусловлен следующими факторами: его окраской и свойствами его поверхности; оптическими свойствами источников света и среды, через которую свет распространяется; свойствами зрительного анализатора и особенностями еще недостаточно изученного психофизиологического процесса переработки зрительных впечатлений в мозговых центрах.

Один и тот же цвет может вызывать противоречивые ассоциации. В таблице 1.1 представлены данные по восприятию цвета в зависимости от страны и нации [84].

Восприятие цвета может частично меняться в зависимости от психофизиологического состояния наблюдателя, например усиливаться в опасных ситуациях, уменьшаться при усталости и т.д. Несмотря на адаптацию глаза к условиям освещения, оно может довольно заметно отличаться от обычного при изменении интенсивности излучения (того же относительного спектрального состава) - явление, открытое немецкими учеными В. Бецольдом и Э. Брюкке в 1870-х гг. Оно наглядно демонстрируется в т. н. бинокулярной колориметрии, основанной на независимой адаптации одного глаза от другого. Все это указывает на ведущую роль мозговых центров, ответственных за восприятие цветов, и степени их «тренированности» (при неизменном фотохимическом аппарате цветового зрения) [5,38].

Развитие способности к ощущению цветов эволюционно обеспечивалось формированием специальной системы цветового зрения, состоящей из трех типов цветочувствительных фоторецепторов в центральном участке сетчатки глаза (т. н. колбочек) с максимумами спектральной чувствительности в трех разных спектральных участках: красном, зеленом и синем, а также четвертого типа рецепторов (палочек), не обладающих преимущественной чувствительностью к какому-либо одному спектральному цвету, расположенных по периферии сетчатки и играющих главную роль в создании ахроматических зрительных образов. Суммарная спектральная чувствительность глаза, обусловленная действием фоторецепторов всех типов, максимальна в «зеленой» области (длина волны около 555 нм), а при понижении освещенности смещается в «сине-зеленую» область. Предполагавшаяся ранее сводимость всех цветовых ощущений к сочетаниям различных раздражений только трех типов цветочувствительных элементов послужила основой для разработки способов количественного выражения цветов в виде набора трех чисел. Подобный подход имеет рациональную основу, однако при разработке таких способов не могли быть учтены влияние вариаций освещенности и интенсивности излучения, роль (весьма значительная) зрительных мозговых центров и общего психофизиологического состояния наблюдателя.

В качестве примера, иллюстрирующего данный подход, можно привести цветовые системы Манселла и Оствальда [83].

В 1905 г. американским ученым Манселлом {A.HMunsell) была предложена система (рис. 1.1), пересмотренная в 1943г. Она определяет три атрибута цвета: Н {hue- цветовой тон), С {chroma- цветность) и V {value- величина = яркость). Цветовой тон делится на пять основных цветов: красный (R), желтый (У ), зеленый ( С ), синий (В), и пурпурный (Р ). Кроме того, каждый цвет имеет 10 градаций. Величина, т.е. мера яркости или темноты цвета, определяется в 11 шагов от белого до черного. Цветность, т.е. мера насыщенности (или чистоты) разбита на 15 степеней. Видимость света в системе Манселла описывается набором из трех компонент: цветовой тон/ яркость/ цветность. Например, у ярко-красного цвета будет формула 5Я/4/14, где 5R означает цветовой тон, 4 - яркость и 14 - цветность.

Немецкий ученый Оствальд предложил свою систему (рис. 1.2), предполагающую 8 цветовых тонов с четырьмя базовыми цветами: желтый, ультрамариновый синий, красный и цвет морской волны (зеленый). Эти цвета далее делятся, образуя цветовой круг из 24 цветов.

Проекционный кластерный анализ цветовых компонент изображений

Представим растровое цветное изображение размера NxM в виде трех матриц R, G и В (2.1), содержащих, соответственно, красный, зеленый и синий компоненты каждого пикселя: R = rU rU ГМ,\ rM,2 l,N M,N ,G= Sl,l S\,2 SM,\ SM,I SIN SM,N ,B = Ьм,і bMt2 ... bMN ,(2.1) где rtj, gjj, by (iel,M, jel,N) - красный, зеленый и синий компоненты цвета точки растра, целые числа, величина которых ограничена количеством бит, выделенных на компоненту. Обычно Гу, gy, by є [0;255], что составляет 8 бит.

Фактически изображение состоит из 3-х независимых растров, что усложняет его структурный анализ. АЦТП состоит в том, что каждая из точек растра относится к определенному классу. Обозначим множество классов: С = (Cj, с2,...,с }, где с,- - один из классов (ie\,K).

Каждый класс точек представляет собой определенный цвет, сопостави мый исходному изображению. Таким образом, задача АЦТП может быть разбита на несколько подзадач: - формирование непересекающихся областей классов в пространстве RGB, куда входит нахождение и разработка алгоритма, позволяющего автоматически выделить габаритные контейнеры, содержащие классы в цветовом пространстве изображения; - определение статистических характеристик выделенных классов: средние значения и среднеквадратические отклонения по каждой из осей R, G и В, ковариации между цветовыми составляющими, тон цветозамены; - нахождение однозначного соответствия между каждой точкой исход ного растра и классом, включающее разработку метрики, позволяющей изме рить расстояние в цветовом пространстве между точкой изображения и каждым из найденных классов.

Метрика позволит разбить пространство RGB на области, каждая из которых будет относиться к одному из классов. Будем называть каждый из классов точек цветовым кластером.

Варианты трехмерной визуализации цветовых кластеров - эллипсоидами и параллелепипедами - представлены на рис.2.2 и рис.2.3 соответственно. Кластеры ограничиваются этими фигурами разной степени прозрачности на уровнях a, la и За.

. Математическое описание кластеров В пространстве RGB /-точке с координатами (r g ty) соответствует вполне определенный цвет. Получить представление о распределении точек по цветам можно по проекциям этого пространства на плоскостях RG, RB и GB (рис.2.4). Чем больше точек исходного изображения приходится на точку проекции, тем более насыщенный цвет она имеет (по аналогии с легендой физической карты).

Скопления точек в пространстве RGB образуют цветовые кластеры. Как видно из рис.2.4, пространство между кластерами заполнено достаточно сильно разряженным шумом - межкластерным газом, наличие которого мешает четкому различению кластеров.

Шумы, приводящие к искажениям цветов, имеют естественную природу, связанную с погрешностями полиграфии, фактурой бумаги, неточностями и аппроксимациями, возникающими при сканировании. Поэтому логично будет сделать предположение о том, что распределение точек в каждом кластере имеет нормальный характер (2.2): где f(r), f(g), f(6) - плотности распределения оттенков красного, зеленого и синего цвета соответственно в кластере; /лг, jug, jub - мат. ожидания по ЦК R, G и В; ar, ag, ть - дисперсии по ЦК R, G и В. Таким образом, каждый кластер характеризуется средними значениями по 3-м ЦК и среднеквадратическими отклонениями по каждой из ЦК (2.3): Ci = {firifigifibiCTriag,cTb}. (2.3) Математическое описание статистических характеристик цветового кластера приводится ниже.

Пусть имеется дискретная случайная величина X с возможными значениями xl,x2,...,xk. Каждое из значений xl,x2,..-,xk наблюдается некоторое чис к ло раз. Обозначим эти числа через nlfn2,...,nk, при этом л,- = п. Таким обра зом, имеется п наблюдений за случайной величиной X, т.е. выборка объема п. Тогда среднее арифметическое X вычисляется по формуле (2.4):

Располагая информацией о значениях статистических величин цветовых кластеров изображения (мат. ожидания, среднеквадратические отклонения по компонентам цвета), можно принять решение о классификации каждой точки исходного изображения. Задача однозначного отнесения объектов к одному из классов, заданных вероятностно, эффективно решается на основе Байесовской теории решений.

Рассмотрим сначала одномерный случай. Обозначим символом а состояние классификации, причем x -(oi - отнесение точки к і -му кластеру. Существует некоторая априорная вероятность Р( ) того, что точка исходного зашумленного изображения принадлежит к /-му цветовому кластеру. Эти априорные вероятности отражают исходное знание о том, с какой степенью уверенности можно предсказать принадлежность точки изображения к тому или к иному цвету. Предполагается, что ]Р((У/) = 1. /=1 Если решение о классификации требуется принять, исходя лишь из этой информации, то разумно воспользоваться решающим правилом (2.8): принять решение со{, если у/ = 1,К, j i:Р( У,) P(tf?,-) (2.8)

В большинстве случаев при выборе решения не ограничиваются столь малой информацией. На результат оказывает влияние цвет х рассматриваемой точки, так что естественно выразить это с помощью вероятностных законов, а х рассматривать как случайную величину, распределение которой зависит от состояния классификации.

Пусть Р(хбУ/) - условная плотность распределения величины х в состоянии а і, т.е. функция плотности распределения случайной величины х при условии, что состояние классификации есть coi. Ответ на вопрос, в какой мере цвет х рассматриваемой точки повлияет на наше представление о состоянии ее классификации, дает правило Байеса (2.9):

Математические модели непрерывного и дискретного сигналов, отображающих графические изображения

На вход аппарата для отображения информации поступает сигнал: p(0 = k(0],=l- = i(0" ! ,0 t T, (3.1) представляющий собой г-мерную, г = 1,2,..., действительную функцию времени t. Этот сигнал требуется зарегистрировать на бумажном носителе записи. Если, например, сигнал необходимо визуализировать, то q\ {t) - абсцисса, ср2 (/) - ордината, ръ (t) - параметр яркости и так далее.

Для случая сигналов, отображающих ГИ, размеренность сигналов имеет 5 для цветных изображений и размерность 3 для черно-белых изображений. В обоих случаях первые две размерности определяют строчную и кадровую развертки. В случае цветных изображений 3 координаты характеризуют насыщенность красного, зеленого и синего цветов. В черно-белом изображении третьей координатой является яркость. При записи сигнала (3.1) на него действуют и случайные возмущения, в результате которых зарегистрированный сигнал описывается функцией [54]: q3(t) = q)(t) + E(t),0 t T, (3.2) где s(t) = s{t;(p{s)), Q t T = \sj{t)\ (3.3) - случайное слагаемое, в общем случае зависящее от момента /, и от значений прошедшего до этого момента реализации сигнала q {t), 0 t T.

Возможные графики сигнала (3.1) и зарегистрированного сигнала (3.2) в случае г = 2, проиллюстрированы на рис.3.1.

Мерный случайный процесс (3.3) мы будем называть процессом помех, или просто помехами. Мы предполагаем, что помехи зависят и от вида регистрируемого сигнала (p(t). Следовательно, количественные характеристики помех также будут зависеть от класса регистрируемых изображений, что является вполне реальным. Чем шире этот класс, тем больше требований должно предъявляться к качеству отображения графической информации. Л Р В случае установившегося режима работы устройства регистрации изображений (мы рассмотрим только этот случай), можно предположить, что помехи (3.3) являются реализацией случайного процесса s(t) = m(t) + X(t), -ao t co, (3.4) где m{t) = [my(0] - некоторая неслучайная функция, имеющая вид: к mj(0 = jLij + YuRjkcos( V + Pjk), j = l2,...,r, k=\ (3.5) X(t) = [Xj(t)\_- - среднеквадратически непрерывный стационарный в узком смысле действительный случайный процесс со средним EX(t) 0 и достаточно хорошим перемешиванием.

Здесь jUj, RJk 0, o)k 0 и -тг pJk тс - некоторые константы; jUjj средние, a Rjk и pjk - амплитуды и фазы колебаний с частотой сок. На процесс записи ГИ могут оказывать влияние как мощные электрогенераторные установки, так и случайные излучатели сигналов. Поэтому такая структура помех s[t) кажется вполне естественной. Слагаемые в формуле (3.5) следует трактовать как незатухающие колебания, вызванные основными независимыми источниками колебаний, а стационарный процесс X(t) - как влияние большого числа второстепенных источников помех, которые начинают действовать в случайные моменты времени и влияние которых со временем быстро затухает. Вполне понятно, что для устройств отображения ГИ хорошего качества должно быть m(t) = 0.

В качестве количественной интегральной оценки потерь записи целесо 105 образно принять случайную величину: 1 т QT=-_atf{t) + ... + ars2r{t))lt, (3.11) о представляющую собой среднее во времени значение интеграла от взвешенной суммы квадратов всех разностей между г-той координатой сигнала на входе регистратора и полученным ГИ. Величина помех (3.11) характеризует качество работы устройства отображения информации в текущий момент записываемого сигнала. Коэффициенты а. здесь служат для сравнения размерностей сигнала и для взвешивания ошибок Sj (t) согласно их влияния на качество КС. Их можно интерпретировать как цены штрафа за ошибки \ (?).

Поскольку мы не определили размерностей сигнала (p{f), то, не ограничивая общности, можем считать, что коэффициенты cij = l, у = 1,2,...,г. Т.е. мы предполагаем, что cij уже участвует в определении сигнала q (t) и помех є if). Это предположение позволит нам существенно упростить приводимые ниже формулы.

Сжатие графической информации

Как уже отмечалось в разделе 3.1, полную характеристику потерь дает только функция их распределения, точный теоретический подсчет которой обычно бывает крайне затруднен. Поэтому большой интерес представляет асимптотическое поведение распределения потерь достоверности при неограниченно возрастающем времени передачи сигнала в КС, т.е. при Т —» со. Естественно ожидать, что при весьма неограничительных условиях на помехи в КС распределение оценок потерь достоверности сигнала будет асимптотически нормальным. Настоящий раздел как раз и посвящен точной формулировке и обсуждению этой асимптотической нормальности. Всюду в этом разделе будем предполагать, что функция m{t) = [my.(/)l __, -со t оо, ограничена, т.е. что для всех t уп.(щ Су со, j = 1,2,...,г

Это предположение является вполне приемлемым, поскольку ограничиваемся изучением только установившегося режима работы КС.

Все пределы в этом разделе понимаются при Т - со (или N — оо ). Запись a-o{fi) означает, что «//?-»О, а запись аг = 0(/?) - что при всех достаточно больших Т а Ср, где 0 С оо. Мы пишем ахр, если ос и р имеют один и тот же порядок, т. к. если существуют такие 0 С, С2 со, что при всех достаточно больших Т Сф а С2Р. Запись а р, означает, что а и /? эквивалентны, т.е. что аїр -И.

Сначала рассмотрим случай, когда помехи X(t) являются ограниченными и имеют конечное время перемешивания (интервал корреляции). При этих предположениях и при дополнительном условии, что DQT - Г-1, случайная величина

Здесь, совершенно аналогично, как в случае записи (или считывания), при дополнительном условии, что DQ3C(T) - Т \ случайная величина [Q3C(T)-EQ3C(T)] I DQ3C{T) (3.53) при Т —» оо асимптотически нормальна со средним 0 и дисперсией 1. Если m3(t) = mc(t) = и со р23/с= \cov[ \X3(t) + Xc(t)\\\X3(0) + Xc(0)\2} dt 0, то условие DQ3C(T) У- Т х выполняется, и DQ3C{T) = p23CT l + о(Т 1).

Рассмотрим случай, когда случайный процесс X(t) является гауссовским со средним EX(t) = 0, и ковариационная функция (3.7), которая удовлетворяет условию (3.8). В этом случае, если только а1 О, то DQT(T) - Т \ и случайная величина (3.44) при Т -» оо асимптотически нормальна со средним 0 и дисперсией 1. При этом среднее EQT подсчитывается по формуле (3.45), а дисперсия DQT - по формуле: DQT =\ (іДС(02 + г ]У ft)C(/, 2)m{t2)dtxdt2, 7 \ \ Т Т J(i-a)c(Of лЛ 1 -Г 1 0 0 где знак Т у функции mT(tx) означает транспортирование.

Рассмотрим случай гауссовских помех, когда m(t) = 0. В этом случае можно указать более точную аппроксимацию распределения случайной величины г. А именно, если а2 О, то равномерно по -со х оо имеем:

Совершенно аналогичные утверждения справедливы и об асимптотическом распределении случайной величины (3.53) при условии, что гауссовские помехи s3(t) и єс(г) независимы, и каждая из них удовлетворяет условию (3.8).

Чтобы получить эти утверждения, достаточно всюду вместо R(t) и /(Я) подставить C3/c(t) = C3(t) + Cc(t) и f3lc{X) = f3{X) + fc{X).

Аналогичные результаты справедливы и в случае дискретизированного сигнала (3.46), и оценок потерь достоверности сигнала (3.47) и (3.52). Чтобы сформулировать их, достаточно в установленных в этом разделе формулах сим И л=0 волы Т, t, tj, \ dt и J dt заменить, соответственно, на N, пА, и,А, ]ГД

1. Предложены математические модели многомерного непрерывного и дискретного сигналов, отображающих ГИ, подверженных в процессе записи-считывания воздействию аддитивных многомерных случайных помех, представляющих собой сумму нескольких неслучайных и не затухающих во времени колебаний и сравнительно хорошо перемешанного во времени стационарного случайного процесса.

2. Сформулированы на математическом языке достаточные условия для случайных помех, при которых возможно удовлетворительно описать вероятностные свойства оценок потерь записи и считывания непрерывного и дискретного сигналов, отображающих ГИ. Рассмотренный в работе процесс помех идентифицируется среднеквадратически непрерывным стационарным в узком смысле действительным случайным процессом с нулевым средним и достаточно хорошим перемешиванием.

3. Установлено, что для оценки качества регистрации изображений необходимо знать распределения для нескольких функций, достаточно хорошо описывающих класс всех регистрируемых ГИ.

Похожие диссертации на Интеллектуальные технологии обработки цветных графических изображений для повышения эффективности передачи их по цифровым каналам связи