Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Распознавание изображений в ассоциативной осцилляторной среде Сидорова Надежда Андреевна

Распознавание изображений в ассоциативной осцилляторной среде
<
Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде Распознавание изображений в ассоциативной осцилляторной среде
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Сидорова Надежда Андреевна. Распознавание изображений в ассоциативной осцилляторной среде : диссертация ... кандидата технических наук : 05.13.05 / Сидорова Надежда Андреевна; [Место защиты: Моск. энергет. ин-т].- Москва, 2010.- 188 с.: ил. РГБ ОД, 61 10-5/2551

Содержание к диссертации

Введение

1. Ассоциативные среды. Выбор типа ассоциативной среды для решения задачи предварительной обработки и распознавания изображений 11

1.1. Однородные среды 11

1.2. Ассоциативные среды и ассоциативная обработка информации 12

1.3. Обзор ассоциативных сред 20

1.3.1. Многокоординатные ассоциативные среды 20

1.3.2. Ассоциативная среда с локальными связями 24

1.3.3. Ассоциативная среда с командным управлением 26

1.3.4. Ассоциативная осцилляторная среда 28

1.4. Выбор типа ассоциативной среды для решения задач предварительной обработки и распознавания изображений 33

1.5. Выводы 36

2. Предварительная обработка изображений в ассоциативной осцилляторной среде 37

2.1. Выбор метода предварительной обработки изображений 37

2.2. Виды предварительной обработки изображений 39

2.3. Математическая морфология 41

2.3.1. Морфологические операции 43

2.4. Использование механизма ассоциации 50

2.5. Морфологическая обработка одного пикселя изображения в АОС 51

2.6. Морфологическая обработка полутоновых изображений в АОС 60

2.7. Алгоритмы морфологической обработки изображений в АОС 67

2.8. Выводы 81

3. Распознавание изображений в ассоциативной осцилляторной среде 82

3.1. Обзор методов распознавания в ассоциативных средах 82

3.2. Метод секущих функций в теории распознавания изображений 89

3.3. Построение дерева в ассоциативной осцилляторной среде 96

3.4. Система распознавания изображений в ассоциативной осцилляторной среде 99

3.5. Программный комплекс для моделирования распознавания изображений в ассоциативной осцилляторной среде 103

3.5.1. Массивы с заданным законом распределения 103

3.5.2. Энциклопедический словарь Брокгауза и Ефрона 107

3.5.3. Китайские иероглифы 109

3.5.4. Рукописные символы 113

3.6. Выводы 115

4. Аппаратная реализация на ПЛИС ассоциативной осцилляторной среды предварительной обработки и распознавания изображений 116

4.1. Обзор ПЛИС. Выбор ПЛИС для моделирования 116

4.2. Методика аппаратной реализации дерева секущих с использованием встроенной памяти ПЛИС 124

4.3. Аппаратная реализация базовых клеточных ансамблей ассоциативной осцилляторной среды 128

4.4. Аппаратная реализация на ПЛИС ассоциативной осцилляторной среды предварительной морфологической обработки изображений 131

4.5. Аппаратная реализация на ПЛИС ассоциативной осцилляторной среды распознавания изображений методом секущих функций 140

4.6. Выводы 143

Заключение 144

Список литературы 146

Приложение 153

Введение к работе

Актуальность темы.

Темп прогресса вычислительной техники много выше, нежели в других технических областях. Однако, повышению производительности вычислительных устройств препятствует несколько проблем [1,2].

Рост производительности ЭВМ в настоящее время осуществляется в основном за счет совершенствования интегральных полупроводниковых технологий, возможности которых рано или поздно будут исчерпаны.

Архитектура современных ЭВМ определяется предложенными фон Нейманом принципами двоичной системы исчисления, программного управления, совместного хранения программ и данных в одной памяти, иерархической организации памяти, наличия команд условного перехода. Такая архитектура приводит к возникновению разрыва между быстродействием процессора и памяти. Это явление зафиксировано в законе Мура, который гласит: «в то время, как быстродействие процессоров возрастает на 60% ежегодно, время доступа к памяти сокращается менее, чем на 7% в год».

Перечисленные проблемы заставляют искать новые архитектурные решения, разрабатывать качественно новые вычислительные средства. В связи с этим, наблюдается возрастающий интерес к клеточным автоматам и однородным средам. Их используют и как способ моделирования разнообразных процессов, и как инструмент для вычислений. Исследования в области нейробиологии формируют предпосылки для моделирования информационных процессов нейронной памяти с помощью клеточных автоматов [2, 3, 4].

Одним из перспективных направлений, реализующих логику клеточных автоматов, является ассоциативная осцилляторная среда. Эта однородная среда совмещает функции хранения и обработки информации и обеспечивает ассоциативный способ доступа к информации.

Ассоциативный способ доступа основан на установлении соответствия, ассоциации между хранимой в среде информацией и поисковыми аргументами. Ассоциативный способ доступа к информации обеспечивает:

практически одновременный доступ ко всей хранящейся в среде информации;

относительную независимость времени поиска информации от емкости памяти;

внесение элементов обработки информации непосредственно в процесс самого доступа;

обработку информации непосредственно в среде ее хранения.

Эти, а также ряд других отличительных особенностей ассоциативного способа доступа к информации делают его чрезвычайно перспективным в системах обработки данных.

В ассоциативной осцилляторной среде данные обрабатываются непосредственно в логико-запоминающей среде и обеспечивается потоковая обработка информации.

На кафедре Вычислительной техники Московского энергетического института под руководством д.т.н., профессора Огнева И.В. более 25 лет ведутся исследования и разработка новых ассоциативных сред и методов ассоциативной обработки информации [2, 5, 6, 7].

Разработка новых ассоциативных осцилляторных сред (АОС) [3, 4], успехи электронных технологий открыли принципиально новые возможности для решения интеллектуальных задач. Одной из важнейших задач в области искусственного интеллекта является задача распознавания изображений.

Распознавание изображений - научное направление, связанное с разработкой принципов и построением систем, предназначенных для определения принадлежности данного объекта к одному из заранее выделенных классов

объектов. Под объектами в распознавании изображений понимают различные предметы, явления, процессы, ситуации, сигналы.

Цель работы состоит в исследовании и разработке ассоциативных сред и методов предварительной обработки и распознавания изображений в этих средах.

Для достижения поставленных целей в диссертации решаются следующие основные задачи:

выбор ассоциативной среды для решения задач предварительной обработки и распознавания изображений;

выбор метода предварительной обработки изображений;

разработка и моделирование аппаратной реализации предварительной обработки изображений в ассоциативной осцилляторной среде;

выбор метода распознавания изображений;

разработка программного комплекса для исследования алгоритма распознавания изображений;

оценка количества операций и точности работы алгоритма распознавания на примерах задач распознавания слов из энциклопедического словаря, изображений китайских иероглифов, изображений рукописных символов;

разработка и моделирование аппаратной реализации системы распознавания изображений в ассоциативной осцилляторной среде;

выбор ПЛИС для аппаратной реализации ассоциативной осцилляторной среды предварительной обработки и распознавания изображений;

оценка временных и ресурсных затрат аппаратной реализации предварительной обработки и распознавания изображений в ассоциативной осцилляторной среде.

Объектом исследований являются ассоциативные осцилляторные среды, средства описания этих сред, а также методы и алгоритмы обработки информации, построенные на их основе.

Методы исследования базируются на теориях арифметических и логических операций, теории системного анализа, теории оптимальных ассоциативных преобразований, функционального анализа, математического анализа, методах клеточной логики. Экспериментальные исследования для подтверждения полученных в ходе диссертационной работы результатов проводились на основе имитационного моделирования на ЭВМ.

Научная новизна работы заключается в следующем:

разработаны методы и алгоритмы решения задач предварительной обработки и распознавания изображений в ассоциативных средах;

впервые новый метод секущих функций для распознавания изображений применен в ассоциативной осцилляторнои среде, что позволило увеличить скорость распознавания изображений;

впервые в сочетании с методом секущих функций применены операции морфологической обработки искаженных шумами изображений на этапе предварительной обработки изображений в ассоциативной осцилляторнои среде;

разработана методика использования встроенной памяти программируемых логических интегральных схем для аппаратной реализации предварительной обработки и распознавания изображений в ассоциативной осцилляторнои среде.

Практическая ценность работы состоит в следующем

разработан программный комплекс для исследования и апробации метода секущих функций в задачах распознавания изображений.

рассмотрено практическое применение ассоциативной осцилляторнои среды предварительной обработки и распознавания изображений на примерах решения задач распознавания (случайных массивов, слов из словаря Брокгауза и Ефрона, китайских иероглифов, рукописных символов);

разработана реализация базовых клеточных ансамблей ассоциативной осцилляторной среды на ПЛИС, которая может быть использована для исследования и разработки новых ассоциативных сред.

разработана аппаратная реализация на ПЛИС системы предварительной обработки и распознавания изображений в ассоциативной осцилляторной среде.

Достоверность научных положений, выводов и практических рекомендаций, сформулированных в диссертации, подтверждается вычислительными экспериментами и данными, полученными при имитационном моделировании, апробацией работы на международных и региональных конференциях.

Реализация результатов работы

Разработанная программная модель ассоциативной осцилляторной среды предварительной обработки и распознавания изображений использована при создании модельного и алгоритмического обеспечения ассоциативных сетей обработки знаний в рамках МИР ООО «НПП «Этна - Информационные технологии».

Научные и практические результаты работы включены в курс лекций «Организация ЭВМ и систем» на кафедре вычислительной техники ГОУ ВПО «МЭИ(ТУ)», используются в лабораторной работе «Ассоциативные запоминающие устройства», в дипломном проектировании студентов.

Апробация работы. Основные результаты работы докладывались на международных научно-технических конференциях «Информационные средства и технологии» 2005, 2007 гг., на 8-ой международной научно-технической конференции «Информационные технологии и системы» 2008 г.; на 16 международной научно-технической конференции студентов и аспирантов «Радиоэлектроника, электротехника и энергетика» в 2010 г.

Публикации. Основные результаты диссертации опубликованы в 6 печатных работах.

Структура и объем диссертационной работы. Диссертационная работа изложена на 188 страницах, из них 152 страницы основного текста, 65 рисунков, 10 таблиц и состоит из введения, четырех глав, заключения, списка литературы из 70 наименований на 8 страницах и приложений на 36 страницах.

Основные положения, выносимые на защиту

  1. Ассоциативная осцилляторная среда предварительной морфологической обработки изображений; универсальный элемент среды, выполняющий операции математической морфологии; алгоритмы морфологической обработки изображений в ассоциативной осцилляторной среде на базе матрицы универсальных элементов.

  2. Система распознавания изображений методом секущих функций в ассоциативной осцилляторной среде. Реализация дерева распознавания в ассоциативной осцилляторной среде.

  3. Программный комплекс для исследования и апробации нового метода распознавания изображений на различных примерах реальных данных.

  4. Аппаратная реализация ассоциативной осцилляторной среды предварительной обработки и распознавания изображений на ПЛИС.

1. Ассоциативные среды. Выбор типа ассоциативной среды для решения задачи предварительной обработки и распознавания изображений

Выбор типа ассоциативной среды для решения задач предварительной обработки и распознавания изображений

В данном разделе рассмотрены ассоциативные среды, разработанные на кафедре Вычислительной техники МЭИ(ТУ). 1.3.1. Многокоординатные ассоциативные среды Продолжением однокоординатных (классическая ассоциативная память) стали многокоординатные АЗУ (МКАЗУ) с параллельной ассоциативной обработкой информации по всем направлениям доступа и настройкой логико-запоминающей среды АЗУ на одновременное выполнение нескольких операций [8, 9, 10, 11, 12, 13, 14, 15, 16, 17]. Многокоординатные ассоциативные запоминающие устройства (МКАЗУ) совмещают функции ассоциативного коллективного доступа к информации с возможностью ее распределенного хранения и параллельной обработки. Основными принципами организации и функционирования МКАЗУ являются: многокоординатный ассоциативный доступ к информации в АЗУ; параллельная ассоциативная обработка информации одновременно по всем реализованным направлениям ассоциативного доступа непосредственно в логико-запоминающей среде АЗУ; маскирование выполнения различных операций до глубины ассоциативных ячеек и их отдельных функциональных узлов; бесконфликтный коллективный доступ к ассоциативным ячейкам и к отдельным их функциональным узлам; реконфигурация функциональных узлов внутри ассоциативных ячеек для их переназначения по направлениям доступа; фиксация в ассоциативных ячейках результатов обработки без их пересылки через регистры АЗУ; использование ассоциативных ячеек в качестве источников поисковых аргументов без перезаписи через регистры АЗУ; функциональное переназначение регистров АЗУ; настройка логико-запоминающей среды АЗУ на одновременное выполнение нескольких операций; симметричность реализации всех функциональных признаков относительно каждого из направлений доступа; высокая степень параллелизма доступа к ассоциативным ячейкам; многопортовый доступ к ассоциативным ячейкам; многоформатный доступ к ассоциативным ячейкам; многомерность логико-запоминающей среды АЗУ. Организация ортокоординатного ЗУ (ОКАЗУ), представленная на рис. 2 включает следующие основные функциональные блоки: матричный 2-портовый ассоциативный накопитель, дешифратор адреса (ДША), каналы строчного и столбцового ассоциативного поиска, каждый из которых состоит из блока регистров опроса и маскирования данных (БР1 и БР2), регистра фиксации реакции (РФ1 и РФ2), анализатора многократных совпадений (АМС1 и АМС2) и шифратора адреса (ША1 и ША2). Дешифратор адреса (ДША) определяет адрес слова (строки) ассоциативного накопителя в режимах записи и считывания. Ассоциативный накопитель состоит из ассоциативных ячеек и служит для записи, считывания и ассоциативного поиска данных по строкам и/или столбцам. Регистры опроса и маскирования блоков БР1 и БР2 используются для формирования, хранения и сдвига соответственно строчного и столбцового поисковых аргументов. Регистры фиксации реакции РФ 1 и РФ2 служат для фиксации результатов операций. Этим результатом может быть либо считываемое из ассоциативного накопителя слово, либо результат ассоциативного маскируемого поиска, либо информация о наличии данных в накопителе. В зависимости от типа задачи данные в РФ 1 и РФ2 могут быть обработанными либо будучи поданными на внутренние шины данных ОКАЗУ и затем на системный интерфейс, либо на соответствующий анализатор многократного совпадения. Организация ортокоординатного ассоциативного ЗУ Анализаторы многократного совпадения АМС1 и АМС2 служат для приоритетной выборки одной из активных линий соответствующих этим анализаторам регистров фиксации реакции. Адрес активной линии, выбранной одним из анализаторов многократного совпадения кодируется соответствующим шифратором (ША1 или ША2). Ортокоординатное АЗУ обеспечивает выполнение следующих операций: запись: строчная маскируемая запись, строчная маскируемая мультиза-пись, столбцовая маскируемая запись, столбцовая маскируемая мультиза-пись; чтение: строчное чтение, строчное инверсное чтение, строчное конъюнктивное чтение (с выполнением операции конъюнкции над выделенными строками в прямом или инверсном коде), столбцовое чтение, столбцовое инверсное чтение, столбцовое конъюнктивное чтение (с выполнением операции конъюнкции над выделенными сюлбцами в прямом или инверсном коде); ассоциативный поиск: ассоциативный параллельный маскируемый поиск по строкам, столбцам и одновременно по строкам и столбцам ассоциативного накопителя по критерию «равно»; строчное и столбцовое сравнение поисковых признаков, записанных в ассоциативный накопитель с поступающими непосредственно с шин ортокоординатного АЗУ данными в ритме их подачи («на лету»); анализ информации о наличии данных в ассоциативном накопителе.

Осуществление независимых сдвигов поисковых аргументов и масок в регистрах блоков БР1 и БР2 дает возможность выполнять высокоскоростные алгоритмы обработки информации в ассоциативном накопителе орткоорди-натного АЗУ двумерным скользящим окном. Что позволяет сделать вывод об эффективности анализа и обработки в ортокоординатном АЗУ растрово представленной информации.

Добавление в среду дополнительных направлений ассоциативного поиска в занесенной в среду информации позволило реализовать в среде более сложные алгоритмы обработки информации [18, 19, 20]. В многокоординатных ассоциативных запоминающих средах (МКАЗС) выполняются ассоциативный иерархический поиск, ассоциативный иерархический опрос и ассоциативное иерархическое проецирование [2, 5].

Морфологическая обработка полутоновых изображений в АОС

Цифровая обработка изображений играет всё более важную роль в связи с распространением мультимедийных возможностей персональных компьютеров. Она также широко используется в медицине, инженерной деятельности и других областях.

Изображение является простым и в то же время наглядным представлением объекта. Информация, содержащаяся в изображении, представлена в наиболее концентрированной форме.

Наряду со значительным повышением уровня развития техники, существенными становятся методы обработки изображений. Они обеспечивают улучшение изображений для их наилучшего визуального восприятия человеком, сжатие для хранения и передачи по каналам связи, а также анализ, распознавание и интерпретацию зрительных образов для принятия решения и управления поведением автономных технических систем [23, 24].

Изображение можно определить как двумерную функцию f(x,y), где х и у - координаты в пространстве (на плоскости), и значение f которой в любой точке, задаваемой парой координат (х,у), называется интенсивностью изображения в этой точке [23]. Если величины х, у и f принимают конечное число дискретных значений, то говорят о цифровом изображении. Цифровой обработкой изображений называется обработка цифровых изображений с помощью цифровых вычислительных устройств.

Цифровое изображение состоит из конечного числа элементов, каждый из которых расположен в конкретном месте и принимает определённое значение. Эти элементы называются элементами изображения или пикселями. У элемента изображения р с координатами (х, у) имеются четыре соседа по вертикали и горизонтали, координаты которых задаются выражениями (х+1, у), (х-1, у), (х, у+1), (х, у-1). Это множество пикселей называется четверкой соседей р и обозначается NA(p). Каждый его элемент находится на единичном расстоянии от (х, у); если же точка (х, у) лежит на краю изображения, то некоторые из соседей оказываются за пределами изображения. Четыре соседа р по диагонали имеют координаты (х+1, у+1), (х+1, у-1), (х-1, у+1), (х-1, у-1) и обозначаются Nn(p). Вместе с четверкой соседей эти точки образуют так называемую восьмерку соседей, обозначаемую -Vg(/?). Как и выше, некоторые точки множеств Nn(p) и /V8(/?) могут оказаться за пределами изображения, если точка (х, у) лежит на его краю. Чтобы установить, что два элемента изображения являются смежными, необходимо, чтобы они были соседями и их уровни яркости удовлетворяли заданному критерию сходства (например, были равны друг другу). В бинарном изображении, яркость элементов которого может принимать только два значения 0 и 1, два пикселя могут входить в четверку соседей друг друга, но считаются смежными только в том случае, если их значения совпадают. После регистрации, т.е. собственно формирования f(x,y), цифровое изображение, как правило, подвергается ряду предварительных преобразований. Предварительная обработка изображений включает в себя: градационные преобразования, геометрические преобразования, подавление шумов (фильтрацию), переход между цветовыми моделями. После предварительной обработки изображения приступают непосредственно к этапу обработки, включающей в себя: выделение характерных признаков изображения, классификацию изображений, распознавание и понимание изображений. К выделению характерных признаков изображения относят нахождение границ (контура), скелетизацию, сегментацию и др. Распознавание изображений представляет собой процесс, который присваивает некоторому объекту идентификатор на основании его описателей [23]. При этом зачастую возникает необходимость предварительной обработки изображения (фильтрации и др.) для повышения точности распознавания [23, 25]. Также во многих методах распознавания используется выделение характерных признаков изображения [19, 21, 23]. Таким образом, в данной диссертации для улучшения качества распознавания изображений, метод распознавания сопровождается методом предварительной обработки изображений. Методы и алгоритмы предварительной обработки изображений разнообразны [23]. В диссертации для предварительной обработки изображений был выбран метод математической морфологии, потому что: 1) метод не содержит сложных математических вычислений, которые потребовали бы внесения изменений в среду; 2) основная операция метода - операция сравнения, которая является также базовой операцией обработки данных в ассоциативных средах; 3) метод математической морфологии позволяет осуществлять не только предварительную обработку, но и выделение характерных признаков изображения, что можно использовать в дальнейшем при распознавании. Геометрические преобразования. К предварительной обработке изображений можно отнести различные виды геометрической обработки: увеличение, уменьшение изображений, утолщение и утоньшение изображений, а также ряд других операций. Утоньшение и утолщение как правило применяют к изображением, содержащим линии, например, к изображениям символов какого-либо алфавита. Утоньшение предназначено для получения из графического рисунка с линиями шириной в несколько элементов изображения графического рисун 40 ка с линиями шириной в один элемент изображения. Типичный метод утоньшения - это поочерёдное отбрасывание пикселей слева, справа, сверху и снизу при сохранении непрерывности линии. Утолщение можно применять для укрупнения объектов на изображении, что способствует лучшему восприятию. Также утолщение объединяет ранее изолированные объекты, т.е. с его помощью можно устранять разрывы в изображении символов. Такая предварительная обработка требуется для более сложных алгоритмов структурного анализа, классификации и распознавания изображений. Фильтрация. Во входных данных изображения могут содержаться шумы, основными источниками которых являются сам процесс его оцифровки и процесс передачи. Работа устройств, регистрирующих изображение, зависит от различных факторов, таких как внешние условия и качество сенсоров. В процессе передачи изображения могут искажаться помехами, возникающими в каналах связи. Типичные шумы: зернистый шум, пятна на изображении, обрывки линий, гауссов шум, равномерный шум и др. [23].

Система распознавания изображений в ассоциативной осцилляторной среде

Входной сигнал F и выходной Fout используются для буферизованного вывода результатов морфологических операций через последовательность универсальных элементов. Буферизация записи и считывания изображения требуется из-за ограниченного числа выводов. Чтобы вывести параллельно значения всех пикселей относительно небольшого изображения, например 32x32=1024 пикселя, понадобится 1024 вывода. Также требуются выводы для ввода изображения и управления. Поэтому изображение записывается и счи-тывается следующим образом: разбивается на группы пикселей (по строкам, по столбцам и т.д.). Размеры и количество групп определяются размерами зображення и количеством выводов. Изображение вводится и выводится параллельно по группам и последовательно внутри групп.

Все ячейки ассоциативной осцилляторной среды, входящие в состав универсальных элементов, синхронизируются общим сигналом CLK. Максимально возможная частота синхронизации зависит от времени выполнения ячейкой ее логической функции. Это время, в свою очередь, зависит от конкретной аппаратной реализации универсальных элементов на базе современных ПЛИС. Более подробно этот вопрос освещен в главе 4. 2.6 Морфологическая обработка полутоновых изображений в АОС

Различимые зрением человека цвета предметов определяются характером света, отраженного от этих предметов. Тело, которое отражает свет приблизительно одинаково во всем диапазоне волн, представляется наблюдателю белым, тогда как тело, почти не отражающее, а только поглощающее свет - черным. Тело, отражающее свет в каком-то ограниченном диапазоне волн, воспринимается с некоторым цветовым оттенком, например, зеленый предмет в основном отражает свет с длинами волн 500-570 нм, поглощая большинство энергии в других интервалах длин волн.

Помимо цветовой окраски есть другой параметр освещения - его интенсивность или яркость. Для описания и представления монохроматических изображений, элементы которых различаются только яркостью, используются уровни серого. Элементам изображения соответствуют значения яркости, которые изменяются от черного до белого с промежуточными серыми оттенками. Для обозначения таких изображений используется термин «полутоновые изображения» [23].

Морфологические операции дилатации, эрозии, размыкания, замыкания и др. могут быть применены для обработки полутоновых изображений. Цифровые изображения задаются функциями f(x,y) и Ь(х,у), где f(x,y) - исходное изображение, а функция Ь(х,у) задает примитив, который сам является изображением с меньшими размерами. Эти функции являются дискретными в том смысле, как это определялось в разделе 2.1, т.е. пары координат (х,у) берутся из множества ZxZ (где Z - множество целых чисел), и функции f и b сопоставляют каждой паре координат значения яркости в соответствующей точке.

Полутоновая дилатация f по b обозначается /Ь и определяется как где D/ и Dh - области определения изображений f и b соответственно. Здесь f и b - функции, а не множества, как в случае черно-белых изображений. Условие, что координаты (s-x) и (t-y) должны находиться в области определения f, а х и у - в области определения Ь, является аналогом условия в определении двоичной дилатации, которое требует, чтобы два множества пересекались хотя бы в одном элементе. В каждом положении примитива значение дилатации в этой точке есть максимум суммы f и b в интервале, охватываемом функцией Ь. Применение дилатации к полутоновому изображению приводит в целом к двоякому эффекту: (1) если все значения примитива положительные, то результирующее изображение становится ярче исходного; (2) темные детали ослабляются или вообще пропадают, в зависимости от соотношения их размеров и яркостей с параметрами используемого при дилатации примитива. Условия, что координаты (s+x) и (t+y) должны находиться в области определения f, а х и у - в области определения Ь, является аналогом условия в определении двоичной эрозии, где примитив должен полностью находиться внутри исходного множества. В основе операции эрозии лежит выбор минимального значения (f-b) на интервале, определяемом формой примитива. Применение эрозии к полутоновому изображению приводит в целом к двоякому эффекту: (1) если все значения примитива положительные, то результирующее изображение становится темнее исходного; (2) яркие детали исходного изображения, площадь которых меньше площади примитива, ослабляются, причем степень этого ослабления зависит от значений яркости элементов изображения вокруг этих деталей, а также от формы и амплитудных значений самого примитива. Выражения для операций размыкания, замыкания в случае полутоновых изображений имеют такую же форму, как и в двоичном случае. Размыкание приводит к уменьшению размеров небольших ярких деталей при отсутствии ощутимого влияния на более темные области. При замыкании уменьшаются размеры небольших темных деталей, в то время как яркие участки изображения почти не изменяются. Вместо описанных в разделе 2.3теоретико-множественных операций вычитания, пересечения, объединения бинарных изображений, для обработки полутоновых изображений используют арифметические операции сложения и вычитания яркостей. На рис. 25 изображен универсальный элемент ассоциативной осцилля-торной среды для морфологической обработки полутоновых изображений [28, 29].

Аппаратная реализация на ПЛИС ассоциативной осцилляторной среды предварительной морфологической обработки изображений

Схема реализации универсального элемента морфологической обработки полутоновых изображений в АОС (окончание) Вместо одиночных спайков, представляющих пиксели черно-белого изображения, при обработке в АОС полутоновых изображений используются потоки спайков, интенсивность которых (количество в единицу времени) соответствует яркости (уровню серого) пикселя. Обозначения на рис. 25 схожи с аналогичными на рис. 24: А(1)...А(9) - окрестность 3x3 пикселя на обрабатываемом изображении А, включая обрабатываемый данным универсальным элементом пиксель А(9), В(1)...В(9) - значения яркости пикселей структурного элемента. Рис. 25 иллюстрирует сложение и вычитание потоков спайков, т.е. яркостей пикселей изображения и примитива, а также балансировку потоков сумм и разностей. Изначально яркость представлена некоторым количеством подряд идущих спайков и последующей паузой. Однако, после сложения и вычитания таких потоков в АОС получаются результирующие потоки, спайки в которых распределены нерегулярно. Это можно пояснить на примере: Складывая потоки спайков Р1=0...011 и Р2=0...0111 получим погок РЗ=Р1+Р2=0...0110...0111, где 1 обозначает наличие спайка, 0 - его отсутствие. Интенсивность потока РЗ равна сумме интенсивностей потоков Р1 и Р2, но вот представление яркости несколько изменилось. Блок балансировки предназначен для приведения потока спайков к изначальному виду. В рассмотренном выше примере блок балансировки сформирует поток J=0...011111.

Размерность потоков спайков, представляющих яркость пикселей изображения, определяется числом уровней (градаций) яркости L, разрешенных для каждого пикселя. По соображениям удобства, L обычно выбирают равным целочисленной степени двойки: L=2,4,8,16,...,256, среди которых 256 -наиболее часто использующееся значение [23].

Для выполнения морфологических операций дилатации и эрозии полутоновых изображений необходимо определять минимальную и максимальную яркость. В ассоциативной осцилляторной среде это реализуется с помощью клеточных ансамблей дифференциалов (рис. 25). Хранения яркости пикселя, обрабатываемого данным УЭ, и яркости, вычисленной в результате применения морфологических операций осуществляется с помощью замкнутых накапливающих осцилляторов, в состав которых входят L клеточных ансамблей АОС.

Управление и режимы работы УЭ для полутоновых изображений схожи с управлением и режимами работы УЭ, обрабатывающего черно-белые изображения. Различие заключается в меньшем количестве морфологических операции и их комбинаций, что связано с недостаточным количеством разработок по применению математической морфологии к полутоновым изображениям. В табл. 2 представлены основные режимы работы и значения управляющих сигналов УЭ обработки полутоновых изображений. Табл. 2. Управляющие сигналы универсального элемента, обрабатывающего

Реализация в ассоциативной осцилляторной среде универсального элемента для обработки полутоновых изображений требует больших аппаратных затрат, нежели для обработки черно-белых изображений. Это естественно, поскольку полутоновое изображение несет в себе больше информации. Время обработки в АОС полутонового изображения также больше, чем черно-белого. Обе эти величины зависят от выбранного числа уровней (градаций) яркости L.

Оконтуривание. Граница множества А, обозначаемая Р(Л), может быть выделена путем выполнения сначала операции эрозии А по В, а затем получения разностного множества между А и результатом эрозии, т.е. где В - примитив, все пиксели которого окрашены в цвет объекта (в рассматриваемом примере- черный).

Рис. 26 иллюстрирует морфологический метод выделения границы в сравнении с другими методами. Изображение рис. 26 и) получено с помощью ассоциативной осцилляторноп среды, где были выполнены команды запись, контурі, считывание. Нахождение контура изображения размером 221x269 пикселей (рис. 26 а)) осуществляется в аппаратной реализации ассоциативной осцилляторной среды за 2264 не.

На рис. 26 также приведены примеры результатов оконтуривания черно-белого изображения с помощью методов Собеля, Превитта, Робертса, га-уссиана, пересечения по нулям, Канни [23, 26, 28, 29].

Рис. 27 иллюстрирует аналогичные действия, проделанные над полутоновым изображением. Для получения результатов оконтуривания рис. 26 а) - з) и рис. 27 а) - з) использовалась MATLAB 7.4.1 (R2007a), которая является одной из самых крупных и мощных систем компьютерной математики [30]. Расширение Image Processing Toolbox, обеспечивающее представление и обработку изображений, содержит функции, выполняющие все морфологические операции, а также функции выделения границ различными методами и многое другое. Результаты рис. 26 и) и рис. 27 и) получены в аппаратной реализации морфологической обработки изображений в ассоциативной ос-цилляторной среде.

Для оконтуривания именно черно-белых изображений математическая морфология является наиболее простым и эффективным методом. Градиентные методы (Собеля, Превитта и т.п.) как правило приводят к вынужденному переходу от черно-белого изображения к изображению в тонах серого и затем снова к черно-белому. Эти методы используют различные операторы, что дает несколько различающиеся результаты.

Похожие диссертации на Распознавание изображений в ассоциативной осцилляторной среде