Содержание к диссертации
Введение
Глава 1. Анализ теоретических и практических разработок в области получения, анализа и использования графической информации 14
1.1. Структура системы управления многостадийными производствами в металлургической промышленности 14
1.2. Использование графической информации в системах управления металлургического предприятия 19
1.3. Характеристика исследований в области анализа графической информации 26
1.4. Анализ процессов сбора и подготовки экспертной информации о качестве непрерывнолитой заготовки в условиях металлургического производства 31
1.5. Структура информации для идентификации объектов нерегулярной формы на изображениях серных отпечатков и показатель эффективности функционирования системы получения информации о качестве заготовки
1.5.1. Структура информации для идентификации дефектов на изображении серного отпечатка 39
1.5.2. Структурированный показатель эффективности функционирования системы получения информации о качестве непрерывнолитой заготовки 41
1.6. Цель, задачи и концепция диссертационной работы 44
Глава 2. Математическое обеспечение для классификации графической информации о качестве заготовки на основе формообразующих характеристикгистограммы изображения 47
2.1. Описание и характеристика графической информации о качестве заготовки 47
2.2. Алгоритм построения эталонных гистограмм яркости изображений 54
2.3. Алгоритм классификации изображений серного отпечатка на основе формообразующих характеристик гистограммы яркости 58
2.3.1. Формообразующие характеристики гистограммы яркости для изображения серного отпечатка 58
2.3.2. Алгоритм принятия решений о классификации изображения по формообразующим характеристикам гистограммы яркости изображения серного отпечатка на основе адаптивной функции принадлежности 62
2.4. Кластерный анализ изображений серных отпечатков на основе расстояния до эталонной гистограммы 68
2.5. Выводы по главе 2 74
Глава 3. Специальное математическое обеспечение метода каскадной классификации изображений серных отпечатков темплетов 76
3.1. Адаптивный метод каскадной классификации графической информации о качестве непрерывнолитой заготовки 76
3.2. Термы и функции принадлежности для устранения неоднозначной идентификации изображений
3.2.1. Вид функции принадлежности для областей однозначной идентификации по формообразующим характеристикам гистограммы 81
3.2.2. Вид функции принадлежности для области неоднозначной идентификации по формообразующим характеристикам гистограммы 81
3.2.3. Вид функции принадлежности для области «пустого множества» по формообразующим характеристикам гистограммы 85
3.2.4. Вид функции принадлежности для области «полного поглощения» по формообразующим характеристикам гистограммы 88
3.3. Аналитическое представление функций принадлежности изображений классам по эталонным гистограммам 89
3.3.1. Равновесная функция принадлежности при неоднозначной классификации между классами А и С 90
3.3.2. Равновесная функция принадлежности при неоднозначной классификации между классами B и C
3.4. Определение правил принадлежности изображений заданным классам 95
3.5. Алгоритмы обучения и функционирования модуля системы принятия решений о классификации изображений
3.5.1. Алгоритм обучения модуля системы принятия решений на основе функций принадлежности 98
3.5.2. Алгоритм классификации изображения из нового потока информации на основе функции принадлежности 101
3.6. Выводы по главе 3 103
Глава 4. Результаты вычислительного эксперимента и опытной эксплуатации системы получения и анализа информации о качестве заготовки 105
4.1 Порядок проведения вычислительного эксперимента по оценке качества непрерывнолитой заготовки на основе изображений серногоотпечатка 105
4.2. Адаптивная траектория обработки изображений серных отпечатков после применения методики каскадной классификации 106
4.3. Компьютерные технологии системы идентификации объектов нерегулярной формы на изображении серных отпечатков темплетов
4.3.1. Функциональная схема работы программного продукта «Metal Rater» 109
4.3.2. Технология использования программного продукта «Metal Rater» 111
4.3.3. Примеры эксплуатации программного обеспечения и анализ результатов 115
4.4. Результаты вычислительного эксперимента по классификации
изображений серного отпечатка на основе компьютерных технологий 116
4.4.1. Определение показателей эффективности для изображения класса А 118
4.4.2. Определение показателей эффективности для изображения класса В 119
4.4.3. Определение показателей эффективности для изображения класса С
4.5. Интеграция показателей качества непрерывнолитой заготовки в систему управления многостадийным производством 122
4.6. Оценка экономической эффективности внедрения математического и алгоритмического обеспечения системы получения информации о качестве заготовки на основе изображений серных отпечатков 127
4.7. Выводы по главе 4 132
Заключение 134
Библиографический список 136
- Анализ процессов сбора и подготовки экспертной информации о качестве непрерывнолитой заготовки в условиях металлургического производства
- Алгоритм классификации изображений серного отпечатка на основе формообразующих характеристик гистограммы яркости
- Вид функции принадлежности для областей однозначной идентификации по формообразующим характеристикам гистограммы
- Компьютерные технологии системы идентификации объектов нерегулярной формы на изображении серных отпечатков темплетов
Введение к работе
Актуальность темы. В настоящее время наблюдается устойчивая возрастающая тенденция по объему выпуска продукции металлургических предприятий. Прирост в мировом объеме выпуска непрерывнолитой заготовки за период с 2006 по 2015 год составил 35%, в том числе в Российской Федерации 19,5% (по данным World Steel Association 2016). Рост производства непрерыв-нолитых заготовок неизбежно приводит к повышению объема выпуска продукции пониженного качества, в то время как возрастают требования к качеству готовой продукции. Основа качества готовой продукции закладывается на каждом из этапов металлургического передела, в том числе и на этапе непрерывной разливки стали. Современные крупные металлургические предприятия, такие как ОАО «Магнитогорский металлургический комбинат», используют в системе управления производством информацию о качестве получаемого полупродукта. Одним из видов информации, используемой в системах управления, являются изображения, на основе которых принимается решение о качестве готовой продукции. В технологической цепочке получения металлургической продукции представлено несколько точек, в которых происходит сбор и обработка графической информации: участок подготовки шихтовых материалов, участок разливки стали и участок получения холоднокатаного листа. Все точки контроля образуют сложную систему, работающую в непрерывном цикле. Сложность алгоритмов, используемых при получении и обработке графической информации, ограничивает диапазон ее применения, и до настоящего времени для принятия решений привлекаются эксперты. Традиционная технология принятия решений на основе визуальной оценки вносит ошибки, обусловленные влиянием человеческого фактора, и в частности, квалификацией эксперта.
Для металлургической промышленности проводятся активные исследования в области влияния технологических параметров процессов на качество полуфабриката и готовой продукции. В частности, известно множество исследований о причинах формирования внутренних дефектов непрерывнолитой заготовки. В работах Мовчан Б.В., Rogberg, G., Irwing W. R., Моисеева Б. П. и др. рассмотрены закономерности развития внутренних дефектов заготовки в зависимости от содержания химических элементов в стали, в работах Самой-ловича Ю.А., Шестакова Н.И., Девятова Д.Х., Борисова В.Т. – от параметров теплового состояния заготовки в зонах вторичного охлаждения, в работах Лукьянова С.И., Селиванова И.А., Швидченко Д.Н. – от стабильности работы электропривода роликовой проводки машины непрерывного литья заготовок. В области теории и практики получения, анализа, обработки информации и принятия решений на основе изображений накоплен значительный опыт в работах российских и зарубежных ученых. Вопросы теоретического исследования, связанные с разработкой специального математического обеспечения для обработки графической информации, представлены в трудах Вудса Р., Гонса-леса Р., Varma V., Zisserman A., Прэтта У., Шапиро Л. Труды Cannon R., Dave
J., Визильтера Ю., Афанасьева А., Чинаева В. и определяют алгоритмы сегментации изображений для принятия решений в картографии, медицине, биологии и других областях. Широкий круг работ, в том числе труды Vapnik V., Chapeiie O., Foddy G., Bar-Hen A., Кузьмицкого Н., посвящен развитию методов и алгоритмов классификации изображений и объектов регулярной формы. Проведенный теоретико-информационный анализ показал, что до настоящего времени остаются актуальными проблемы в области обработки графической информации и принятия решений:
-
в промышленных условиях обработка и использование графической информации затруднены в условиях принятия решений на основе уникального квалификационного опыта экспертов;
-
исследования в области обработки информации в узкоспециализированных областях не рассматривают применимость традиционных методов обработки графической информации в зависимости от параметров изображения.
Кроме указанных проблем существует противоречие, состоящее в том, что при наличии мощного теоретического аппарата и современных технических средств для обработки графической информации процессы сбора информации и ее последующего использования ограничиваются решением отдельных узкоспециализированных задач для промышленных условий.
В этой связи разработка метода и алгоритмов обработки изображений серных отпечатков в системе оценки качества непрерывнолитой заготовки является актуальной научно-технической задачей. Учитывая отраслевые особенности графической информации, получаемой при оценке качества непре-рывнолитой заготовки, и существующие проблемы в области получения, обработки и использования этой информации в системах управления, автором определена цель диссертационной работы: повышение эффективности функционирования системы оценки качества непрерывнолитой заготовки на основе использования современных машинных методов и алгоритмов обработки и анализа изображений серных отпечатков.
Для достижения поставленной цели автором в работе решены задачи:
-
анализ традиционных способов получения информации о качестве непре-рывнолитой заготовки для выявления их достоинств и недостатков, а также обоснование разработки системы получения информации на основе обработки изображений серных отпечатков;
-
обоснование и разработка структурированного показателя эффективности функционирования системы оценки качества непрерывнолитой заготовки;
-
разработка специального математического обеспечения для классификации изображений серных отпечатков, включающего алгоритмы построения эталонных гистограмм яркости, классификации изображений на основе формообразующих характеристик гистограммы и анализа расстояния до эталонных гистограмм;
4) разработка специального математического обеспечения для метода каскад
ной классификации изображений серных отпечатков с использованием струк
турированной лингвистической переменной и правил логического вывода;
5) проведение вычислительного эксперимента для оценки эффективности
применения каскадного метода классификации изображений в системе оценки
качества непрерывнолитой заготовки.
Объектом исследования в работе является система оценки качества, используемой на стадии контроля качества непрерывнолитой заготовки при ее переходе от стадии непрерывной разливки к стадии обработки давлением.
Предметом исследования является специальное математическое обеспечение для классификации изображений серных отпечатков системы оценки качества заготовки.
Методы исследования. В диссертационной работе проведены исследования с использованием методов: системного анализа при изучении способов обработки информации о качестве непрерывнолитой заготовки и декомпозиции процессов сбора графической информации в технологической цепочке металлургического производства; обработки и классификации изображений трех уровней контрастности для выбора траектории предварительной подготовки изображения к сегментации; морфологической обработки изображения для выделения области темплета и объектов нерегулярной формы на его поверхности; теории нечетких множеств для принятия решений о принадлежности изображения к заданным классам.
Научная новизна и основные положения, выносимые на защиту: – математическая модель изображения серного отпечатка, отличающаяся представлением графической информации в виде вектора со структурированными координатами, включающего характеристики гистограммы изображения, пространственные координаты и геометрические свойства объектов нерегулярной формы;
– структурированный показатель для определения эффективности функционирования системы оценки качества непрерывнолитой заготовки, отличающийся использованием относительных характеристик, описывающих степень развития объектов нерегулярной формы;
– метод каскадной классификации изображений серных отпечатков, включающий формообразующие характеристики гистограммы яркости, нормализированные метрики расстояния до эталонных гистограмм, лингвистические переменные и функции принадлежности; позволяющий однозначно определить отношение изображения к классу и отличающийся от ранее известных последовательным наращиванием классификационных признаков; – комплекс алгоритмов для построения эталонных гистограмм яркости изображений, классификации изображений по формообразующим характеристикам, классификации изображений по расстоянию до эталонной гистограммы, классификации изображений с использованием структурированной лингвистической переменной, обучения и функционирования модуля принятия реше-5
ний о классификации изображений, отличающийся строгой последовательностью исполнения алгоритмов и использованием формообразующих характеристик гистограммы яркости.
Практическая значимость работы заключается в использовании разработанного программного обеспечения для классификации изображений серных отпечатков, а также выделения объектов нерегулярной формы по индивидуальной траектории обработки изображения, в лабораториях тонко- и толстолистового проката, функционирующих в условиях крупных металлургических предприятий, таких как ОАО «Магнитогорский металлургический комбинат», ОАО «Северсталь» и др. Интеграция программных модулей в действующую систему оценки качества непрерывнолитых заготовок позволяет увеличить долю продукции обычного качества на 0,03%.
Реализация результатов работы. Работа выполнена в рамках Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009 – 2012 гг. по государственному контракту П2402 от 18.11.2009 г. Результаты работы использованы в учебном процессе ФГБОУ ВО «Магнитогорский государственный технический университет им. Г.И. Носова». Алгоритмы и программное обеспечение для каскадной классификации изображений проверены и испытаны в ЗАО «КонсОМ» и ИТЦ «Аусферр».
Апробация работы. Основные положения и результаты диссертации докладывались и получили положительную оценку на международных научных конференциях: «Кибернетика и высокие технологии XXI века» (Воронеж, 2010); «Перспективы развития информационных технологий» (Новосибирск, 2011); «Математическое и программное обеспечение систем в промышленной и социальной сферах» (Магнитогорск, 2011); «ГрафиКон’2012» (Москва, 2012); «Проблеми iнформа-тики i моделювання» (Украина, Харьков, 2013, 2015); «Инновация-2013» (Ташкент, 2013); «Analysis of Images, Social Networks and Texts (AIST'2014, 2015, 2016)» (Екатеринбург, 2014, 2015, 2016), «WIT Transactions on Information and Communication Technologies» (Los Angeles, 2014).
Публикации. По теме диссертации опубликованы четыре научные статьи в изданиях из Перечня ВАК, три научные статьи проиндексированы в наукометрических системах Web of Science и Scopus, одна монография, пять статей в зарубежных изданиях, 9 статей в сборниках научных трудов и материалах международных и региональной научных конференций, получены два свидетельства о государственной регистрации программ для ЭВМ.
Структура и объем работы. Диссертационная работа состоит из введения, четырех разделов, заключения, списка литературы и приложений. Работа изложена на 159 страницах, в том числе: основной текст на 135 страницах, 29 таблиц, 78 рисунков, библиографический список из 104 наименований на 11 страницах, приложения на 12 страницах.
Анализ процессов сбора и подготовки экспертной информации о качестве непрерывнолитой заготовки в условиях металлургического производства
Управление объектами и процессами в современных условиях характеризуется быстрым изменением условий внешней среды, включая экономическую, социальную, научную и промышленную сферы. Инновационные технологии требуют повышения оперативности и качества принимаемых решений о возможных вариантах создания и модификации систем в условиях определенной и неопределенной информации [1].
Широкое распространение сложных объектов со сложными информационными взаимосвязями вызвало лавину определений понятия «Система». В трудах [2-7] определяется понятие «Система». Однако все это множество определений можно привести к более общему виду [8], который использован в работе: «Под системой понимают совокупность связанных между собой и с внешней средой элементов или частей, функционирование которых направлено на получение конкретного полезного результата».
Согласно существующим классификациям системы подразделяются на большие и сложные. Большие системы – это системы, содержащие множество составных частей (компонент), причем количество элементов, переводящих систему в класс больших, определяется конкретной ситуацией и областью применения. Например, пассажирский самолет Boeing 737-800 является большой системой, которая состоит из 4-5 миллионов элементов [9]. Другим примером большой системы может служить автоматизированная система управления, которая включает в себя от десятков до тысяч элементов [10].
Как правило, в ходе декомпозиции большая система сводится к более простой с меньшим количеством элементов. Например, грузовик можно представить в виде совокупности подсистем: рама, кабина водителя, кузов, двигатель, трансмиссия, система управления [11]. Более сложным примером деком 15 позиции большой системы является архитектура автоматизированной информационной системы технического обслуживания и управления доменного цеха, состоящая из: – распределенной подсистемы контроля, сигнализации и локального управления; – диспетчерской подсистемы технологического персонала печи; – агрегатной подсистемы; – диспетчерской подсистемы цеха; – инженерной подсистемы; – подсистем управления информационной системой [12].
Сложность системы определяется достаточностью ресурсов для эффективного описания или управления этой системой. Чаще всего понятие сложности системы возникает в результате недостаточности вычислительных или информационных ресурсов.
Рассмотрим с точки зрения сложной большой системы предприятие металлургической промышленности в области черной металлургии. На рисунке 1.1 приведена укрупненная схема металлургического предприятия, предлагаемого в работе [13]. Основными частями системы, приведенной на рисунке 1.1, являются объекты: подготовительное производство, группа цехов производства стали, группа цехов прокатного передела, управление экономики, управление производством и службы контроля. Объектами внешнего мира в составе системы можно считать поставщиков материалов, сырья и ресурсов, потребителей готовой продукции и полуфабрикатов. Связи между элементами системы и объектами внешнего мира осуществляются на основе передачи материальных и информационных потоков в следующем порядке: – от поставщиков материалов, сырья и ресурсов передаются материалы для всех основных переделов предприятия (1); – от подготовительного производства передаются шихтовые материалы для выплавки стали (2); – полупродукт (непрерывнолитая заготовка) передается как прокатному переделу (3), так и внешним потребителям в различные страны (5); – в службы контроля одновременно передаются технологические пробы химического состава и образцы для контроля качества (4); – цеха листопрокатного передела передают готовую продукцию потребителям (7) и образцы для контроля качества в службу контроля (6).
Все указанные материальные потоки сопровождаются экономической или технологической информацией: 1 – информация о требованиях к заказу по производству металлопродукции; 2 – нормы расходных материалов на производство продукции; 3 – технологические инструкции о ведении металлургических процессов; 4 – информация о нормах расхода материалов и требованиях к технологии производства; 5 – информация о качестве шихтовых материалов для выплавки стали; 6 – информация о марке стали и технологических режимах производства; 7, 8 – информация о качестве готовой продукции; 9 – информация о выполнении заказов на производство продукции.
Полезным результатом функционирования системы является готовая металлургическая продукция (сортовой прокат, плоский прокат, прокат с покры 17 тием, метизы и т.д.) или полуфабрикат (заготовка квадратная и прямоугольная для переката, слябы).
Каждый из приведенных объектов этой системы может быть представлен в виде более простых подсистем. На рисунке 1.2 приведена схема металлургического предприятия как большой системы. В структуре электросталеплавильного цеха (ЭСПЦ) выделены основные этапы производства стали – выплавка, доводка и непрерывная разливка.
На рисунке 1.2 введены обозначения: ДСП – дуговая сталеплавильная печь; ДСА – двухванный сталеплавильный агрегат; АПК – агрегат печь-ковш; АДС – агрегат доводки стали; УУПС – установка усреднительной продувки стали; МНЛЗ – машина непрерывного литья заготовок.
Информационные потоки 7 – 9 на рисунке 1.2 определяют технологию производства и нормы расходов материалов. Информационный поток 6, который формируется в службах контроля (центральная лаборатория контроля и отдел технического контроля), определяет информацию о качестве готовой продукции по отобранным технологическим пробам химического состава (до 12 штук от плавки на различных этапах выплавки и доводки стали) и образцам, по которым выполняется оценка развития внутренних и внешних дефектов непре-рывнолитых заготовок. Все материальные потоки между подразделениями цеха сопровождаются соответствующей информацией (таблица 1.1).
Алгоритм классификации изображений серного отпечатка на основе формообразующих характеристик гистограммы яркости
Достаточно много работ посвящается распознаванию лица человека и его элементов. Для этого предлагается использовать автоматическую классификацию на основе карты характерных точек. Например, в работе [31] предлагается использование двухмерного вейвлет-преобразования на основе огибающей волны для выделения основных точек лица. Применение этот метода позволило добиться 82% уровня верной идентификации лица человека. Недостатками работы этого метода являются чувствительность к качеству изображений и мимическому изменению основных элементов лица.
Одним из методов классификации объектов является определение характерных точек заранее заданной текстуры [32, 33]. В работе [29] предлагается приближенная базовая модель сегментации изображения на основе оценки яркости точек. Авторы работы применяли алгоритм для изображений головного мозга. В результате была получена классификация изображений с различными текстурами с точностью до 84,4%. В работе [33] рассматривался статистический подход к классификации текстур из отдельных изображений, который базируется на определении качества освещения, положения камер и условий обработки изображения. Метод основан на использовании фильтров, устойчивых к вращению изображения, оценки гистограммы изображения и оценки формы гистограммы. За основу принятия решений о классе изображения принята процедура k-средних (k-Means), которая является чувствительной к выбору исходных центров сгущения. Количество правильно классифицированных текстур для учебных примеров составила 98%.
Задача классификации изображения решалась также и с помощью аппарата нечетких множеств и нечеткой логики. Первые работы по применению нечеткого аппарата к классификации изображении появились в конце 80-х – начале 90-х годов 20 века и показали хорошие результаты распознавания картографических изображений с объектами регулярной формы [34-37]. Изложенные основы получили развитие в современных исследованиях [37-42]. Однако, несмотря на множество существующих исследований, остаются нерешенными проблемы классификации изображений с множеством объектов нерегулярной формы, низкого качества и контрастности.
Автором работы в составе научного коллектива проводились исследования по идентификации объектов на изображении с использованием статистических методов [43], морфологических операций [44] и адаптивных нечетких деревьев с динамической структурой [45]. В результате предложена система интеллектуальной поддержки системы управления производством непрерывноли-той заготовки с использованием результатов обработки графической информации серного отпечатка [45]. Однако известные процедуры распознавания изображений, изложенные в [46-48], не позволили получить высокую достоверность информации без предварительной классификации полученных изображений.
Ежегодно в Российской Федерации проводятся международные научно-технические конференции «Графикон» и «АИСТ», на которых рассматриваются проблемы компьютерной графики, компьютерного зрения, обработки изображений и видео, анализа изображений, сетей и текстов. Анализ результатов работы конференций 2013 и 2015 годов показал, что среди множества работ востребованными являются исследования, в которых изучаются: – сравнение методов оценки качества изображений [49]; – применение теории нечетких множеств и нечеткой логики при классификации изображений [50]; – инструментальные средства компьютерного зрения библиотеки OpenCV; – фильтрация изображений [51-54]; – поиск объектов на изображении [55-59]; – проблемы применения классических методов распознавания и обработки изображений в дактилоскопии и медицине [60-63].
В работе [64] приведены результаты исследования в области неопределенности в задачах автоматической классификации, в том числе применение нечетких методов автоматической классификации и нечетких методов распо 30 знавания образов. Автором выполнен широкий обзор работ советских и зарубежных авторов в период 1980 – 2000 годы. Однако в области исследования изображений в большей степени показаны алгоритмы нечеткого распознавания, основанные на использовании мер сходства. Автор [64] как наиболее интересный выделяет метод Л.И. Бородкина, в основе которого лежит поиск линейной разделяющей функции для минимизации суммарной ошибки распознавания с заранее заданным (априорным) разбиением на множества. Также автором [64] выделяются исследования Л. Кунчевой, в которых предлагается объединение нескольких классификаторов и агрегирование их решений.
Классические оптимизационные алгоритмы нечеткой автоматической классификации Уиндхема [65], Рубенса [66], Беждека-Данна [67], Педрича [68], Даве-Сена [69] построены типовым образом и предлагают выполнить первоначальное разбиение объектов на некоторое количество нечетких классов и затем использовать матрицу разбиения прототипов и весов для классификации объектов, задавая специфичный критерий оптимизации. Эвристические методы нечеткой кластеризации имеют множество допущений, ограничивающих их применение при классификации изображений серных отпечатков. Для этих алгоритмов предполагается, что вводимое нечеткое множество является либо унимодальным, либо присутствует нечеткая толерантность и т.п. К эвристическим методам нечеткой кластеризации относят алгоритмы Кутью-Фьолео [70], Гит-мана-Левина [71], Тамуры-Хигути-Танаки [71], Берштейна-Дзюбы [72] и др.
Анализ методов классификации графической информации показал, что разработка и исследование методов классификации проводятся длительное время. В настоящее время разработаны детерминированные, статистические, эвристические и оптимизационные методы классификации изображений в самых различных областях. Для определения места диссертационных исследований в общей массе существующих работ автором выполнена классификация существующих исследований в области обработки графической информации (рисунок 1.9).
Вид функции принадлежности для областей однозначной идентификации по формообразующим характеристикам гистограммы
Для каждого класса изображений были получены гистограммы, имеющие характерные отличия в форме:
1) гистограммы изображений класса унимодальны, так как фон и объект исследования имеют сравнительно одинаковую яркость. Значимые уровни яркости занимают узкую (10М-15% в диапазоне [215, 255]) полосу, характеризуя низкий контраст изображений. Полоса смещена к левому краю, что свидетельствует о высокой яркости изображений (рисунок 2.6);
2) для гистограмм изображений класса В характерно наличие двух выраженных пиков, сопоставимых по площади, так как фон и объект исследования имеют различную яркость. Значимые уровни яркости занимают полосу шириной 40 50% в диапазоне [140, 255] - изображение имеет нормальную контрастность (рисунок 2.7);
Гистограммы для изображения класса B: а – гистограмма для красного канала; б – гистограмма для зеленого канала; в – гистограмма для синего канала; г – гистограмма полутонового изображения 200 -150 -100 -50 -0 - 111 к І mill In Ik j...Lllllllllllll 1 Ш щ k Рисунок 2.8 – Гистограммы для изображения класса C: а – гистограмма для красного канала; б – гистограмма для зеленого канала; в – гистограмма для синего канала; г – гистограмма полутонового изображения
Яркость г 3) гистограммы изображений класса C также имеют два пика, однако левый пик занимает более широкую полосу и меньшее максимальное значение. Фон и объект исследования имеют существенно отличающуюся яркость. Ширина полосы значимых уровней яркости 70% в диапазоне [80, 255], что соответствует высококонтрастному изображению (см. рисунок 2.8).
Оценка полученных гистограмм по каждому классу показала, что:
1) гистограмма полутонового изображения является достаточной для классификации изображений, так как отклонение положений порога и максимумов канальных гистограмм по сравнению с гистограммой полутонового изображения составляет не более 15%;
2) начальное предположение о разделении выборки изображений на три класса подтверждено результатами вычислительного эксперимента и появилась необходимость в разработке методики идентификации формы гистограммы изображении серного отпечатка.
Для каждого класса изображений построены усредненные нормированные гистограммы. Эти гистограммы приняты как эталонные. На рисунке 2.9 приведены эталонные гистограммы для каждого из эталонных классов.
Форма построенных гистограмм позволила выдвинуть гипотезу о возможности классификации изображений по особенностям гистограммы.
Для определения принадлежности гистограммы к одному из трех предполагаемых классов введем понятие формообразующих характеристик гистограммы. В качестве формообразующих характеристик гистограммы определены: 1) положение порога яркости Т; 2) положение максимума яркости слева от порога m; 3) положение максимума яркости справа от порога М (рисунок 2.10).
Для определения положения порогового значения яркости использованы алгоритмы, приведенные в [46-48, 85, 86]. Согласно этим источникам пороговое значение – это величина яркости, относительно которой гистограмма делится на две части.
Разделение гистограммы на две части позволяет найти максимумы яркости каждой части. Поиск порогового значения яркости основан на использовании метода Оцу [85]. Метод позволяет разделить пиксели изображения на два класса, рассчитывая такой порог, чтобы внутриклассовая дисперсия была ми 59 нимальной. Такая дисперсия определяется как взвешенная сумма дисперсий двух классов: где веса со І - это вероятности двух классов, разделенных порогом t;of - дисперсия этих классов. Вероятность для каждого уровня интенсивности рассчитывается как n(t) ИУ J N где n(t) - количество пикселей изображения с яркостью t;N- общее количество пикселей изображения.
Автор метода [85] доказал, что минимизация дисперсии внутри класса равносильна максимизации дисперсии между классами ol = о2- ol(t) = (OwzCO Ct) - M2(t)]2, где ЦІ - среднее арифметическое класса.
После применения метода Оцу и нахождения значения порога яркости методика предполагает нахождение положения максимумов дискретной функции для каждой части гистограммы. Блок-схема методики классификации изображений низкой контрастности на основе гистограммы яркости приведена на рисунке 2.11. Поиск выполнен простым перебором значений дискретной функции гистограммы в каждой ее части.
В блок-схему алгоритма, приведенную на рисунке 2.11, включены блоки: - блок 1, предназначенный для чтения полноцветных изображений серных отпечатков непрерывнолитой заготовки с носителя и размещение его в памяти в виде числового массива, каждый элемент которого соответствует значению цвета пикселей; - блок 2, предназначенный для построения гистограммы яркости для каждого из трех каналов в цветовом пространстве RGB, красного, зеленого и синего; - блок 3, выполняющий преобразование изображения из полноцветного в полутоновое;
Компьютерные технологии системы идентификации объектов нерегулярной формы на изображении серных отпечатков темплетов
В главе 2 предложены два алгоритма для классификации изображений серного отпечатка поперечного темплета непрерывнолитой заготовки. Однако, несмотря на добавление классификационных признаков, характеризующих форму гистограммы яркости изображения, не удалось добиться однозначной идентификации всего набора исходных изображений. Исследование структуры исходного изображения и методов его классификации по принципу от простого к сложному привело к построению каскадного метода классификации изображения серного отпечатка.
Суть метода состоит в том, что для каждого сложноструктурированного изображения серного отпечатка непрерывнолитой заготовки выполняется последовательно три каскада: классификация по трем формообразующим характеристикам; по трем мерам расстояния для 256 признаков; по непрерывным функциям принадлежности. Отличительными признаками метода каскадной классификации изображений являются: 1) строгое соблюдение последовательности в применении каскадов; 2) наращивание количества признаков для каждого каскада; 3) отсечение изображений, классифицированных на предыдущих каскадах. Условием применимости метода каскадной классификации изображений является: сложноструктурированость изображения, состоящее в том, что изображение содержит фон, основной объект исследования (непосредственно тем-плет), объекты нерегулярной формы со случайным местом расположения в пределах границ основного объекта исследования (дефекты макроструктуры заготовки). Результатом применения метода каскадной классификации являются группы изображений серных отпечатков для выбора траектории последующей обработки на основе типовых методов дилатации, эрозии, бинаризации, выделения связных компонент и т.п.
В адаптивный метод каскадной классификации включены три каскада. Первый каскад использует правило идентификации изображения, построенное на основе трех формообразующих характеристик: положение порога яркости – Т; положение максимума яркости слева от порога – m; положение максимума яркости справа от порога – М (см. п. 2.3.1). Второй каскад, наращивая количество идентификационных признаков с 3 до 256, использует три меры сходства, характеризуя дисперсию для оценки рассеяния расстояния относительно среднего значения каждого класса (см. п. 2.4). Третий каскад используется только для изображений, не прошедших однозначную идентификацию на предыдущих двух каскадах. Учитывая невозможность идентификации изображений на основе детерминированных параметров гистограммы, принято решение ввести лингвистические переменные, термы и правила для идентификации изображений в классы. Методики, построенные на нечетких правилах, включают экспертные оценки и позволяют учесть скрытие закономерности при формализации процессов.
На рисунке 3.1 приведена схема адаптивного метода каскадной классификации изображений серного отпечатка. Каждый из блоков 1 – 3 метода каскадной классификации содержит блоки адаптации согласно блок-схемам 2.13 и 2.17.
Адаптация для блока 1 основывается на изменении интервалов значений для формообразующих характеристик при добавлении новых изображений. Адаптация приводит как к расширению интервалов, так и к их сокращению по решению эксперта. Пример интервалов для формообразующих характеристик класса A и класса С приведен на рисунках 3.2 и 3.3. Поступление нового изображения на обработку
Пример размещения интервалов для значений формообразующих характеристик класса С На рисунке 3.2 наблюдается перекрытие диапазонов по значению формообразующих характеристик и в ходе адаптации должно происходить сокращение областей «Left maximum» и «Brightness threshold». На рисунке 3.3 область «Brightness threshold» должна быть смещена в право для охвата локального минимума яркости изображения.
Адаптация в блоке 2 приводит к изменению значения среднего в каждом классе и перераспределению изображений между классами.
Учитывая, что 31% изображений после применения двух алгоритмов, основанных на формообразующих характеристиках гистограмм, и расстояния остаются в области неоднозначной идентификации, разработан метод классификации изображений серных отпечатков на основе структурированной лингвистической переменной и правил логического вывода.
Наиболее сложным этапом является определение лингвистических переменных и их терм [90-92]. Для решения задачи классификации изображений введем структурированную лингвистическую переменную - Image (Изображение), которая в своем составе содержит три компоненты: т, М, Т, где Т - абсцисса точки для положения порога яркости; m - абсцисса точки положения максимума яркости слева от порога; М - абсцисса точки положения максимума яркости справа от порога. На рисунке 3.4 приведена структура лингвистической переменной Image с указанием всех составляющих.
Особенностью переменной Image является включение в ее структуру трех элементов, описывающих формообразующие характеристики, для которых должны быть определены термы и функция принадлежности. Каждая из компонент лингвистической переменной Image принимает три значения: «Принадлежит классу А»; «Принадлежит классу В»; «Принадлежит классу С», которые образуют множество терм (рисунок 3.4).