Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Аль-Рашайда Хасан Хусейн

Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля
<
Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Аль-Рашайда Хасан Хусейн. Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля : диссертация ... кандидата технических наук : 05.13.01 / Аль-Рашайда Хасан Хусейн; [Место защиты: С.-Петерб. гос. электротехн. ун-т (ЛЭТИ)].- Санкт-Петербург, 2008.- 131 с.: ил. РГБ ОД, 61 09-5/389

Содержание к диссертации

Введение

ГЛАВА 1. Анализ предметной области и постановка задачи исследования 9

1.1. Исторический обзор 9

1.2. Арабские символы 10

1.2.1. Характеристики симвочов арабского языка 11

1.3. Арабско-индийские цифры 12

1.4. Краткий обзор распознавания символов 12

1.4.1. Распознавание символов в режиме on-line 15

1.4.2. Распознавание символов в режиме off-line 18

1.5. Типовая модель системы распознавания символов 19

1.5.1. Стадия предварительной обработки 21

1.5.2. Стадия сегментации 22

1.5.3. Стадия выделения признаков 24

1.5.4. Стадия обучения и распознавания 29

1.5.5. Стадия постобработки 35

1.6. Выводы по первой главе 37

ГЛАВА 2. Предобработка для представления символов арабского языка 38

2.1. Введение 38

2.2. Система распознавания 39

2.3. Набор данных 40

2.4. Фаза предварительной обработки 41

2.4.1. Обнаружение скелета посредством утончения 41

2.4.2. Базисная линия идентифицирования 44

2.5. Выводы поетод распознавания арабско-индииских цифр второй главе 47

ГЛАВА 3. Метод распознавания арабско-индииских цифр

3.1. Введение 48

3.2. Набор данных 52

3.3. Система Распознавания 52

3.3.1. Предварительная обработка 52

3.3.1.1. Коррекция наклона цифры 53

3.3.2. Выделение признаков 56

3.3.3. Классификация и распознавание 64

3.3.4. Критерии качества распознавания 66

3.3.5. Интеграция результатов нескольких классификаторов 69

3.3.5.1. Модель принципа мажоритарного голосования 70

3.3.5.1.1. Простое мажоритарное голосование 70

3.3.5.1.2. ранжированное голосование (рані овые классификаторы) 72

3.3.5.2. Модель вероятностных интеграторов 74

3.3.5.2.1. Байесовский интегратор 75

3.4. Оценка полученных результатов 78

3.5. Выводы по третье главе 83

ГЛАВА 4. Локализация и распознавание номерного знака 85

4.1. Введение 85

4.2. Подходы к решению задачи 87

4.3. Разработанный подход к решению задачи 90

4.4. Стадия предварительная обработка изображения 91

4.5. Стадия локализации номерного знака 92

4.5.1. Преобразования в черно-белое изображение 94

4.5.1.1. Глобальные методы 95

4.5.1.2. Локальный метод (адаптивный метод) 97

4.5.2. Маркировка связных компонентов 100

4.5.3. Классификация выделенных связных компонентов 101

4.6. Выводы по четвертой главе 106

Заключение 108

Список использованной литературы

Введение к работе

Актуальность темы. Развитие компьютерных технологий обеспечивает их применение в широком диапазоне областей, в том числе в области автоматического распознавания символов. Известны автоматизированные системы распознавания символов английского, японского и китайского языков, в то время как для внедрения подобных систем на других языках, например, на арабском, необходимы дополнительные исследования. Простое применение уже разработанных алгоритмов во многих случаях невозможно из-за наличия в каждом языке своих специфических символов, знаков и лингвистики построения текстов.

Проблема автоматизированного ввода в компьютер текстовой информации также не потеряла своей актуальности. Более того, она приобретает все большую остроту в связи с массовой информатизацией всех сторон жизни.

Вследствие доступности и относительной дешевизны мощных микропроцессоров, в настоящее время появляется возможность реализации современных специализированных систем, например видео контроль автомобильного движения. Это комплексная проблема поиска, локализации и идентификации номерного знака в реальном масштабе времени при движении объектов.

В данной диссертационной работе рассматривается разработка автоматизированной системы распознавания арабско-индийских цифр и символов арабского языка, что важно для многих предметных областей, в том числе и в области локализации и распознавания номерных знаков, в которых содержатся арабско-индийские цифры и символы арабского и английского языков. Это связано с тем, что в последнее время возросла интенсивность движения и количество автомобильных аварий.

Разрабатываемая система автоматически отслеживает нарушителей дорожного движения и записывает автомобильные номера нарушителей в базу данных. Такой автоматический контроль позволяет ощутимо снизить количество нарушений и аварийность на дорогах Иордании.

Анализ известных систем показал, что они, во-первых, дают неудовлетворительные результаты на изображениях низкого качества (которые обычно как раз и получают с видеокамер), во-вторых, не работают на сложных (разноплановых) изображениях, так как на них трудно локализовать требуемую область распознавания, а в-третьих, все они ориентированы на строго определенные условия (освещенность, угол поворота камеры, яркость и т.д.).

Поиск эффективного решения описанной задачи локализации и распознавания номерного знака (арабского) составляет суть диссертационной работы.

Объектом исследования являются компьютерные методы обработки изображений, иерархические и статистические методы классификации, а также ранговые оценки семантического содержания.

Предметом исследования являются инструментально-технические средства обработки изображений: видеокамера, процессор и программы экспериментальной оценки качества распознавания арабско-индийских цифр, слов и номерных знаков.

Целью работы является исследование и разработка метода, алгоритма и программ распознавания знаков, символов, цифр и букв арабского языка, обеспечивающих анализ и обработку информации на изображении с целью обнаружения, локализации и идентификации автомобильного номерного знака. Для достижения поставленной цели в диссертационной работе решаются следующие задачи:

  1. Выделение специфических особенностей символов, знаков, букв и цифр арабского языка;

  2. Исследование основных подходов к системам распознавания символов арабского языка и арабско-индийских цифр;

  3. Разработка алгоритма выделения специфических признаков арабского языка (выделение скелета слов, обнаружение базисной линии слов);

  4. Разработка метода оценки качества признаков для распознавания арабско-индийских цифр;

  5. Разработка метода повышения надежности распознавания арабско-индийских цифр на основе использования комплексного вектора идентификационных признаков и интеграции различных классификаторов;

  6. Разработка программы локализации и идентификации автомобильных номерных знаков и ее экспериментальная апробация;

  7. Исследование надежности распознавания автомобильных номерных знаков, снятых видеокамерой под разными углами.

Основные методы исследования. В качестве методов исследования использовались цифровые методы обработки изображений, корреляционные и нейронные классификаторы, морфологические методы селекции элементов изображения.

Научная новизна. В диссертации предложены и решены следующие задачи:

  1. Разработан алгоритм обнаружения базисной линии слова арабского языка;

  2. Разработан алгоритм и программа распознания арабско-индийских цифр с использованием нескольких методов выделения признаков;

  3. Для повышения надежности системы распознавания используются обучаемые матрицы как мажоритарные классификаторы;

  4. Локализация и распознавание автомобильного номерного (арабского) знака при наличии помех на изображении и при разных углах съемки;

Положения, выносимые на защиту. На основе проведенной теоретической работы и экспериментальной апробации разработанных методов на защиту выносятся следующие положения:

  1. Алгоритм обнаружения базисной линии слов арабского языка.

  2. Система распознавания арабско-индийских цифр с использованием комбинаций векторов и интеграции различных классификаторов.

  3. Алгоритм локализации номерного знака с использованием нейро-сетевого классификатора и маркировка значимых (черных) пикселов.

Теоретическая значимость работы заключается в разработке системы распознавания арабско-индийских цифр и символов арабского языка, алгоритма обнаружения базисной линии слов арабского языка, и алгоритма локализации и распознавания номерного знака.

Практическая ценность. Заключается в создании системы автоматизированного ввода и обработки текстов на арабском языке, что позволяет реализовать: распознавание и идентификацию номерного знака, считывающие устройства для банковских чеков, почтовые системы считывания, автоматизацию делопроизводства, распознавание и аутентификацию подписи.

Апробация работы. Научные результаты и основные положения работы представлялись на конференции: II Иорданская международная конференция по вычислительной технике "JICCSE-2006 " (Амман, Иордания, 2006), X Санкт-Петербургская международная конференция «Региональная информатика-2006» (Санкт-Петербург, Россия, 2006).

Реализация и внедрение. Полученные результаты реализованы в виде ряда программных систем на различных языках программирования (Java, Matlab). Данные программные системы используются для тестирования и в качестве системы локализации и распознавания номерного знака.

Публикации. Основные теоретические и практические результаты диссертации опубликованы в 5 работах, среди которых публикации в ведущих рецензируемых изданиях, рекомендованных в действующем перечне ВАК 2 работы, а также материалы научно-технических и всероссийских конференций в количестве трех.

Структура и объем диссертационной работы. Диссертация состоит из введения, 4 глав, заключения, излагается на 131 странице, включая перечень используемой литературы из 75 наименований, 40 рисунков и 4 таблицы. Кроме того, в диссертации имеется приложение на 28 листах, содержащие в себе примеры работы разработанных программ, реализующих алгоритмы, описанные в диссертации.

Характеристики симвочов арабского языка

Распознавание символов - отрасль распознавания образов, которая имеет дело с распознаванием оптических символов. Теоретическая база распознавания символов была заложена еще 1929 году[6], а использоваться в действительности стала 1950-ых, в связи с развитием компьютерной техники. Коммерческие машины оптического распознавания символов и пакеты были доступны с середины 1950-ых.

Оптическое распознавание символов имеет широкое применение в современном обществе, например: чтение и распознавание документа и сортировка, распознавание почтового адреса, распознавание банковского чека, распознавание рукописных символов в анкетах, проверка подписи, устройство считывания штрихового кода, интерпретация карты, проектирование и распознавание рисунка, распознавание и выделение номерного знака, и другие промышленные и коммерческие применения.

Первые разработки в 1980-ых по автоматическому распознаванию символов были сконцентрированы на машинописном тексте и на небольшом количестве хорошо видного рукописного текста и символов. Напечатанные системы распознавания символов в этот период вообще использовали подход сравнения с шаблонами, в котором изображение сравнивается с шаблонами символов. Способы обработки изображения низкого качества использовались на двухуровневом изображении для рукописного текста, чтобы извлечь векторы признаков, поступают на статистический классификатор. Алгоритмы с ограниченными возможностями были осуществлены главным образом для латинских букв, символов и цифр.

Значительное развитие в системах распознавания символов достигнуто в 1990 годах и продолжает развиваться в настоящее время, используются новые средства разработки и методологии, которые успешно усиливают нарастания информационной технологии.

В начале 1990-ых, обработки изображения и методы распознавания образов были эффективно объединены с методологиями искусственного ИНТЄЛ; лекта. Были разработаны сложные алгоритмы распознавания символов получающие входные данные с высоким разрешением и требующие мощные компьютеры в стадии выполнения.

В дополнение к более мощным компьютерам и более точному электронному оборудованию, например сканеры, камеры, и планшетный компьютер, появились эффективные новые методологии, например нейронные сети, скрытая марковская модель, и семантика с помощью обработки естественного языка.

Арабские символы (рис. 1.1) используются в письменной форме многих языков не только в арабских странах, но и в языках урду, фарси и других языках тех стран, где Ислам - основная религия (например, Иран, Пакистан и Малайзия). Специальные характеристики написания арабских слов и символов не позволяют использовать напрямую приложение этого алгоритма для других языков.

Многие символы арабского алфавита имеют точки (.) выше или ниже символьного тела (например, ц; _ _ о) а некоторые символы имеют Гамзу (зигзаг формируют ), и Мадда ( ) (например, V Ы с$ J S! V) и Шадда(-1) .

Арабско-индийские цифры (также называемые восточно-арабскими цифрами), которые используются до сегодняшнего дня в большинстве восточных арабских стран (Иордания, Сирия, Саудовская Аравия и т.д.) также используются в некоторых других странах (например, Иран и Пакистан).

Эти цифры написанные слева направо. (Рис. 1.4) показывает напечатанные и рукописные арабско-индийские цифры от нуля до десяти и Иорданские автомобильные номерные знаки, содержащие цифры и арабские символы.

Системы распознавания символов могут внести вклад в продвижение автоматизации процесса, который может улучшить взаимодействие между человеком и машиной [7-9] и между машиной и ее средой во многих приложениях.

Разнообразные потребности, связанные с задачами распознавания символов, возникают во многих приложениях. Сюда входит как собственно чтение содержимого изображения.

В последние годы увеличился интерес к распознаванию символов. С появлением идеи пен-технологий (вместо клавиатуры, в распоряжении пользователя лишь "световое" перо, которым он пишет на экране или на специальной панели), целиком работающей на этом принципе, ведущие производители вычислительной техники стали выделять крупные средства на исследования по распознаванию символов. Задачи распознавания символов весьма разнообразны и различны по степени сложности. Классификация этих задач может быть проведена по параметрам, в основном отражающим особенности исходных данных.

Прежде всего, различным может быть объект распознавания. В большинстве приложений требуется распознавать собственно содержание изображения. Так же существует и класс задач, где рассматриваемым объектом является местонахождения символов и слов, например выделение и распознавание автомобильного номерного знака. Однако существует и класс задач, где рассматриваемым объектом является не сам текст, а его автор, т. е. написавший его человек. При этом могут стоять задачи узнавания личности, идентификации личности (проверка подлинности подписи).

Обнаружение скелета посредством утончения

Утончение - процесс уменьшения исходного размера до компактного и нахождения средней оси, которая определяется как группа пикселей в месте, где эти пиксели имеют равное расстояние от пограничных пикселей вокруг них [37]. В результате этого процесса и будет получен контур написанного слова. Этот процесс должен сохранить геометрию и связи между символами, а также их первоначальную позицию и основан на рекурсивном удалении пограничных пикселей с учетом сохранения геометрии, расположения символов и их связей.

Преимущества скелетного представления: Это является хорошим методом для представления структурных отношений между компонентами в образце. Широкое применение для систем распознавания символа, слова и подписи. Мы использовали алгоритм, основанный на операции Hit-Miss «попал -не попал» обработки изображения, которая удаляет только пиксели, соответствующие шаблону и сохраняет другие как показано на (рис. 2.3). Повторять шаги 1, 2, пока не обнаружены конечные пиксели или пока есть связи между ними.

Шаг 1. Для каждого пикселя повторять слева направо: если шаблон не содержится ни в одном из наборов связанных шаблонов и шаблонов конечных точек использовать операцию Hit-Miss для шаблонов 2, 4. Шаг 2. Для каждого пикселя сверху вниз: если шаблон не содержится ни в одном из наборов связанных шаблонов и шаблонов конечных точек, использовать операцию Hit-Miss для шаблонов 1,3.

Большинство символов в арабских словах связано с другими символами в зависимости от позиции символа (начало, середина, конец) в слове, как показано в табл. 2.1. Эти связи базируются на линии вдоль слова, которая называется базисной линией. Существуют исключения, когда некоторые символы в арабском языке не соединяются со следующим символом, а занимают любую позицию в пределах слова (Рис. 2.5, а, б). Шаг 1. Изображение вращается влево с некоторым шагом, и от вращаемого изображения вычисляется пик горизонтальной гистограммы. Шаг 2. Изображение вращается вправо с некоторым шагом, и от вращаемого изображения вычисляется пик горизонтальной гистограммы. Шаг 3. Сравниваем результат шага 1 с результатом шага 2, что дает указание направления базисной линии. Шаг 4. Повторяем: вращение изображения с некоторым увеличением порога по направлению, полученному в шаге 3; вычисление предельной величины пика горизонтальной гистограммы; если предельная величина Н0Вая предельной величины предыдущей то: - обновляем предельную величину; - сохраняем новое изображение; - сохраняем новое значение угла; Иначе: - увеличиваем счетчик ошибок на единицу; - продолжаем, пока счетчик ошибок меньше неко торого порога;

В данной главе рассмотрен принцип распознавания образов, его важность и использование. Также перечислены характеристики написания слов на арабском языке. Внимание заостряется на таком важном этапе системы распознавания, как предварительная обработка. Был описан и реализован скелетный алгоритм и алгоритм для определения базисной линии арабских слов. Эти алгоритмы протестированы с использованием базы данных рукописных названий Тунисских городов IFN/ENIT.

Представлена система распознавания арабско-индийских цифр с использованием метода классификации и комбинирования векторов признаков. Описаны методы классификации цифр, основанные на различных способах выделения характерных признаков.

Также исследованы индивидуальные классификаторы, основанные на каждом методе выделения признака. Рассматривается эффективность интеграции различных классификаторов и комбинаций векторов, основанных на каждом методе выделения признаков. Показаны лучшие результаты по сравнению с индивидуальными классификаторами. Также проведен ряд экспериментов на основе базы данных, состоящей из 4176 цифр. Эксперименты показали улучшение точности распознавания до 99.5%.

Развитие компьютерных технологий становится более гибким и применимым в широком диапазоне областей. Многие компании перешли на более автоматизированную работу.

Распознавание символов - это главный компонент во многих системах, например: считывающие устройства для банковских чеков [38], почтовые системы считывания, системы распознавания номерного знака для управления трафиком [39], автоматизация делопроизводства, подтверждение и распознавание подписи и много другое.

Новые технологии для автоматизированных систем, переведенных на английский, русский, японский и китайский языки достигла больших успехов, и широко применяются повседневной жизни общества, в то время как исследования для других языков все еще актуальны, например для арабского языка. Алгоритмы для распознавания символов из других языков не могут быть напрямую применены к арабским цифрам, поэтому нами был разработан алгоритм, учитывающий особенности формы арабских цифр [40],[41]..

Арабский язык — это рукописный язык с направлением письма справа налево, он используется как письменный в странах арабского мира и в некоторых языках ряда исламских государств. Арабско-индийские (арабские) цифры используются в настоящее время в большинстве восточных арабских стран (Иордании, Сирии, Саудовской Аравии и др.). На рис. 1.4, а представлены примеры печатных и рукописных арабско-индийских цифр от нуля до девяти, а на рис. 1,6 — примеры иорданских автомобильных номерных знаков, для распознавания которых были разработаны представленные методы.

Для решения задачи распознавания арабских символов было предложено много способов, например, сравнение с шаблонами, статистические и структурные методы, методы, использующие нейронные сети (НС) и др. [42]. Так, в работе [6] подробно рассмотрены этапы разработки систем распознавания символов, а в [43] - описаны методы выделения характерных признаков символов.

Коррекция наклона цифры

Системы распознавания символов типично состоят из следующих стадий: преобразование в цифровую форму, предварительная обработка, сегментация в единичных символах или долях, связанных с символом, выделение признаков, распознавание с использованием классификатора и постобработка для проверки и тестирования. В данной разработке используются глобальные и локальные методы выделения признаков. Разработанная система распознавания показана на (рис. 3.1).

Предварительная обработка. Эта стадия включает в себя нормализацию и приведение изображения к стандартному размеру, сглаживание и фильтрацию, коррекцию наклона символов. Приведение всех изображений, находящихся в базе данных, к стандартному размеру производится следующим образом: определяется(подбирается)прямоугольник минимальных размеров, ограничивающий цифру, полученный прямоугольник масштабируется до размеров 60x40 пикселов. На следующем этапе для повышения качества изо бражения(путем удаления шумов, улучшения границ и контуров изображения) применяется круговой сглаживающий фильтр радиуса 3 (рис. 3.2).

Одной из существенных особенностей рукописных цифр является их наклон. Эксперименты показывают, что без коррекции наклона векторы признаков образцов внутри одного класса могут сильно варьироваться. Чтобы минимизировать внутриклассовую изменчивость признаков, необходимо фиксировать наклон символов. Коррекция наклона символов цифр играет важную роль в некоторых методах выделения характерных признаков символов. Существуют методы, например метод геометрических моментов, инвариантные к наклону.

Угол наклона арабских цифр задается самым длинным штрихом в цифре или углом между двумя такими штрихами. Из рис. 1.4, а видно, что цифры 1,2,3,6,9 содержат один вертикальный основной штрих, а 7 и 8-.два основных штриха, образующих острый угол.

Алгоритмы для коррекции наклона символов из других языков не могут быть напрямую применены к арабским цифрам, поэтому нами был разработан алгоритм, учитывающий особенности формы арабских цифр.

Вертикальные гистограммы проекции используются, чтобы найти угол наклона цифры следующими шагами: вращение изображения от угла -62 к 62. Все максимальные значения вертикальной гистограммы каждого вращения сохранены в списке максимальных значений. Потом основной штрих определяется местонахождением по максимальному значению списка (рис. 3.3).

Общее наибольшее значение найден из списки максимальных значения. Если индекс общего наибольшего значения является в одной стороне, тогда искать локальный максимум в другой стороне.

Локальный минимум найден между общем наибольшем значением и локальным максимумом. Следующие значения вычислены: Разностное отношение между общем наибольшем значением и локальным максимумом. Абсолютный угол между общем наибольшем значением и локальным минимумом. Следующие условия проверены, чтобы найти угол наклона: Если разностное отношение больше чем 0.9 и меньше чем 1.1, и абсолютный угол является остром углом. Тогда угол наклона, равный общему наибольшему значению угла плюс абсолютное различие между углом общего наибольшего значения и углом локального максимума. Иначе угол наклона равный углу общего наибольшего значения, (рис. 3.4)

Стадия выделения признаков считается ядром любой системы распознавания, и должна быть проанализирована и спроектирована тщательно, чтобы получить высокий уровень точности распознавания.

Измерения извлечены из входного изображения цифры, чтобы сформировать вектор признаков. Чтобы получить лучшую точность распознавания систем распознавания, вектор признаков должен быть в состоянии различить классы, и он приближается к классу образца.

В работе [43] были рассмотрены разнообразные методы выделения характерных признаков: структурные, морфологические, преобразования Га бор, Радон и Фурье и др. Каждый из этих методов в отдельности имеет свои преимущества, недостатки, особенности и свой уровень ошибок классификации. В работе были реализованы шесть методов для исследования точности распознавания каждого из них, а также при комбинировании векторов признаков и составном (комплексном) классификаторе.

Каждый метод имеет преимущества, недостатки, различные действия и эффективности и ошибочную продукцию. При экспериментах ошибки могут появляться при использовании одного метода, но их не будет при применении других.

В данной разработке были осуществлены шесть методов для создания высокой надежной системой распознавания, необходимо оценивать методы выделения признаков, и минимизировать ошибки с помощью комбинаций векторов и интеграции результатов нескольких классификаторов.

Стадия предварительная обработка изображения

Предполагается, что система локализации и распознавания номерного знака включена в сенсорную систему обнаружения объекта (например, датчик транспортного средства или система применения правил уличного движения). На рис. 4.2 представлена предложенная система локализации и распознавания номерного знака. Как только сенсорная система обнаруживает искомый объект, активизируется видеокамера. Изображение, зафиксированное видеокамерой, посылается системе локализации и распознавания номерного знака, в которой потенциальные номерные знаки извлекаются из изображения. Если номерной знак не найден, система возвращается в состояние ожидания изображения. Если найдено потенциальное местонахождение номерных знаков, то производится коррекция наклона номерного знака.

Затем в системе активизируется этап сегментации номерного знака на символы, на данном этапе номерной знак разделяется на символы и слова. После завершения процесса сегментации система переходит к этапу распознавания символов. Эти два этапа повторяются до достижения оптимальных результатов и для сегментации и для распознавания. Символы, распознанные на данном этапе как элементы номерного знака, затем проверяются на этапе проверки номерного знака, и производится поиск вариантов возможных значений этого элемента. Данная процедура повторяется для всех потенциальных местоположений номерного знака на исходном изображении.

Предварительная обработка изображения осуществляется с целью устранения различного рода помех, неоднородностей фона на изображении номерного знака, подлежащего распознаванию.

Стадия предварительной обработки состоит из следующих некоторых стандартных этапов обработки изображения (рис. 4.3): видеокадр преобразуется в форме полутонового изображения, контрастирование и фильтрование изображения, чтобы расширить качество изображения.

Стадия предварительной обработки состоит из следующих некоторых стандартных этапов обработки изображения (рис. 4.3): видеокадр преобразуется в форме полутонового изображения, производится контрастирование и фильтрование изображения, чтобы улучшить качество изображения.

Контрастирование связано с улучшением динамического диапазона изображения, на котором выполняется визуализация. Если минимальная и максимальная яркости исходного изображения существенно отличаются от граничных значений яркостного диапазона (например, если на представления каждого пикселя изображения отводится 1 байт, то диапазон 0..255), то визуализированное изображение выглядит как нерезкое и некачественное.

Для вычисления контрастирования используется следующее выражение: ) = -/ (2 -1), (4.1) high — low где G(i,j)- выходное изображение, a I(i,j)- исходное изображение, low— минимальная яркость, high— максимальная яркости, bit— количество бита представления пикселя. Фильтрование изображения с использованием медианного фильтра, является простым и эффективным методом удаления помех. Для определения нового значения, фильтр использует значения пикселей, содержащихся в области интереса. Элементы в области интереса располагаются в порядке, после чего отбирается среднее значение. Результатом использования фильтра является то, что любой шум будет устранен. Ґ Исходное "\ V_ изображение _J видеокадр преобразоваться в форме полутоновое изображения Контрастирование изображения Jj Филирование изображения с использованием медианного фильтра Выходное Л у изображение J Рис. 4.3. стадии предварительная обработка. 4.5. СТАДИЯ ЛОКАЛИЗАЦИИ НОМЕРНОГО ЗНАКА Входной информацией для подсистемы локализации номерного знака является оцифрованное изображение автомобиля, получаемое с видеокамеры.

Локализация номерного знака от изображения автомобиля является самым критическим шагом в системе распознавания, которая сильно влияет на полную точность и скорость обработки данных целой системы.

Цель первого шага обработки этого этапа состоит в том, чтобы выделить информацию о номерном знаке, отделив ее от остальной части изображения, а затем очистить выделенные кандидатские местоположение номерного знака от шума и других нетекстовых объектов.

Проблема локализации номерного знака усложняется низким качеством изображений, получаемых с видеокамеры. В связи с этим часто трудно

Похожие диссертации на Исследование и разработка методов локализации, идентификации и распознавания арабских символов : на примере номерного знака автомобиля