Введение к работе
Актуальность темы
Основным источником получения информации человеком является зрение, поэтому одним из важных направлений развития информационных технологий является распознавание образов по принципу зрения человека.
Большинство различных информационных систем представляют результаты в виде графических изображений: графики, диаграмма, схемы и т.д. При таком представлении результатов важно придать выводимому изображению качества, при которых человек будет комфортно их воспринимать и в дальнейшем обрабатывать, а соответствующая подсистема ИС - преобразовывать как графический образ.
Задачи распознавания образов возникают в медицинской диагностике. Например, при исследовании морфологической картины биожидкостей для обнаружения патологических состояний, также при томографических исследованиях. Морфологический анализ изображений также применяется в геодезии и геологии. Широкое применение методы распознавания и сегментации нашли в металлографии при обработке микрошлифов металлов. Большое значение распознавание образов имеет при автоматизации контроля качества на производстве. Особое место задача распознавания занимает в робототехнике и в реализации технического зрения.
При распознавании изображений очень сложно оценивать цветное графическое изображение, так как оно представляет собой сочетание тысяч и миллионов форм, яркостей, цветностей, границ и тонов. Однако оказывается, что в большинстве из этих задач это и не нужно, так как не все многочисленные черты исследуемого образа являются информативными. Для эффективности анализа некоторые признаки полезно подчеркнуть, усилить, а другие, наоборот, сделать незаметными или устранить. Во многих задач распознавания образов, например, основной характеристикой, передающей структуру и смысл изображения, является яркость его элементов. Для таких задач оказывается достаточным исследование изображения в палитре серых тонов различной яркости. В предельном случае она может отображать всю гамму яркостей от минимальной (черный цвет) до максимальной (белый цвет). Такое изображение называется в данной работе мультитоновым.
В рассмотренных случаях основным этапом распознавания образов является предварительная обработка изображения, результатом которой является его упрощение для дальнейшей визуализации и преобразования. Основным элементом мультитонового изображения является пиксель, характеризующейся яркостью. Поэтому упрощение сводится к попиксельному преобразованию, в результате которого сокращается количество тонов, используемых для передачи изображения.
В связи с этим в каждом конкретном научном исследовании по распознаванию графического образа возникает две задачи. Во- первых, нужно определить количество тонов S, необходимое для передачи признаков, нужных для распознавания образа. Во-вторых, необходимо разработать и реализовать формальный алгоритм преобразования исходного изображения в S-тоновое. Последняя задача выбрана в качестве основной цели настоящей работы и
w w о
получила в ней название попиксельной S-аппроксимации.
Таким образом, диссертационная работа посвящена решению актуальной научно-технической проблемы, связанной с разработкой и оптимизацией общего метода и ряда частных алгоритмов попиксельной аппроксимации мультитонового изображения с использованием S тонов.
Цель и основные задачи диссертационной работы
Основной целью диссертации является разработка алгоритма параметрически оптимальной попиксельной аппроксимации исходного мультитонового изображения S-тоновым.
Системные исследования этой проблемы выявили, что для достижения поставленной цели необходимо решить следующие научные и экспериментально-практические задачи: 1. Исследовать процесс решения задачи распознавания графического образа и выявить основные этапы предварительной попиксельной обработки изображения.
-
Разработать и исследовать математическую модель критериальной оценки эффективности применения попиксельной S-аппроксимации.
-
Провести сравнительное исследование известных алгоритмов попиксельной аппроксимации мультитоновых изображений с использованием разработанной критериальной оценки.
-
Разработать более эффективные алгоритмы попиксельной аппроксимации мультитоновых изображений и провести их сравнительное критериальное исследование.
-
Провести подробный системный анализ результатов, выбрать наиболее перспективную информационную технологию упрощения изображений, а также построить обобщенный алгоритм попиксельной S-аппроксимации.
-
Разработать, исследовать и довести до формального алгоритма метод поисковой параметрической оптимизации попиксельной S -аппроксимации мультитоновых изображений.
-
Разработать комплекс программ, реализующих разработанные алгоритмы, с учетом возможности их практического, научно- исследовательского и учебного использования, а также возможности проведения сравнительных численных экспериментов.
Методы исследования. В диссертации применялись методы математического анализа, исследования операций, математического моделирования, теории распознавания изображений, математической статистики, теории планирования экспериментов.
Основные результаты и степень их научной новизны
1. Метод и обобщенный алгоритм параметрически оптимальной попиксельной S-аппроксимации мультитоновых изображений, отличающийся от известных методов преобразования изображений тем, что он позволяет получать S-тоновое изображение, минимально отличающееся по яркостным характеристикам от исходного по разработанному квадратичному
критерию (в среднем на 11% по сравнению со стандартными алгоритмами, применяемыми в фотошопах).
-
-
Комплекс субоптимальных алгоритмов ^-аппроксимации мультитоновых изображений, отличающихся от разработанного оптимального простотой реализации и меньшими ресурсными, в частности, временными затратами (в 50-80 раз), а от известных - более обоснованными критериями пиксельных замен, что приводит к более высокой точности аппроксимации (в среднем на 8 %).
-
Модифицированный метод и алгоритм поисковой оптимизации, основанный на идее имитации поведения роя, отличающийся от известных вариантов повышенной эффективностью обнаружения экстремумов и возможностью их параллельного поиска.
-
Метод и алгоритм деления роя, основывающийся на градиентном исследовании пространства оптимизируемых параметров, обоснованные множеством статистически представительных экспериментов, как при исследовании сложных экстремальных аналитических зависимостей, так и при решении конкретных практических задач.
Достоверность результатов исследования достигается за счет корректного применения методов системного и математического анализа, моделирования, исчерпывающей статистической обработки результатов. Проведены представительные по числу опытов вычислительные эксперименты, результаты которых использованы для получения статистически достоверных данных. Общий объем экспериментальных исследований по оценке свойств алгоритмов составил более 135000 опытов. Статистическая достоверность опытных данных обеспечивалась несколькими параллельными опытами.
Теоретическая значимость диссертационной работы
Теоретически значимыми результатами диссертационной работы являются:
-
-
-
Введение этапа попиксельной ^-аппроксимации изображений для их упрощения путем уменьшения количества тонов с сохранением информативных для предметной области признаков на этапе предобработки при решении задачи распознавания образов позволяет упростить всю задачу и расширить ее возможности.
-
Предложенная опорная СКО-оценка, обеспечившая объективное сравнительное исследование всех вариантов алгоритмов попиксельной ^-аппроксимации мультитоновых изображений, может быть использована как стандартная оценка любых графических аппроксимаций.
-
Разработанный для параметрической оптимизации алгоритма попиксельной ^-аппроксимации модифицированный метод роящихся частиц (МРЧ) показал себя при исследованиях эффективным и универсальным инструментом поисковой оптимизации для координатных многоэкстремальных задач.
Практическая полезность диссертационной работы
Практически значимыми результатами диссертационной работы являются:
-
-
-
-
Возможность использования созданных алгоритмов попиксельной ^-аппроксимации изображений для упрощения изображения путем уменьшения количества тонов на этапе предобработки при решении задачи распознавания образов во многих сферах деятельности: физике, металлографии, управлении оценкой качества, геологии и геодезии, робототехнике, медицине и т.д.
-
Добавление в практику обработки изображений процедуры сокращения количества тонов в исходной тоновой палитре до значения, обеспечивающего сохранение информативных признаков, как обязательного этапа распознавания, повышает его эффективность и упрощает информационную обработку изображения.
3. Модифицированный алгоритм оптимизации на основе МРЧ позволил разработать для исследований «Программное средство ^-аппроксимации мультитоновых изображений», построенное на основе концепции объектно-ориентированного программирования и зарегистрированное в Роспатенте (№ 2009616802, заявл. 30.11.2009; зарег. 27.01.2010). Оно также может быть использовано для осуществления предобработки графических изображений с целью повышения эффективности их дальнейшего распознавания, в различных прикладных задачах.
Кроме того, нужно отметить, что уменьшение количества тонов позволит выбирать более простые, быстрые и эффективные методы сегментации и распознавания изображений, что позволит снизить программную сложность реализации таких методов и повысить точность.
Результаты работы применены при решении практических задач в ЗАО «Инфраструктурный проект», ООО «лиОни» г. Ростова-на-Дону и фирме «ДейтаМикро» г. Таганрог.
Результаты работы также внедрены в учебный процесс, при изучении методов распознавания и сегментации в рамках курсов «Интеллектуальные системы» и «Методы распознавания образов» специальности «Программное обеспечение вычислительной техники и автоматизированных систем»; курса «Эвристические методы в криптографии» специальности «Компьютерная безопасность» и в Центр дистанционного обучения и повышения квалификации ДГТУ.
Апробация основных теоретических и практических результатов диссертационной работы
Основные результаты диссертационной работы докладывались и обсуждались на:
-
международных научно-технических конференциях «Математические методы в технике и технологиях»: ММТТ-18 - Казань, 2005 г.; ММТТ-20 - Ярославль, 2007 г.; ММТТ-21 - Саратов, 2008 г.; ММТТ-22 - Псков, 2009 г.; ММТТ-23 - Саратов, 2010 г.;
-
международных научно-методических симпозиумах «Современные проблемы многоуровневого образования» (г. Ростов-на-Дону - с. Дивноморское): 2007-2009 гг.;
-
IV региональной научно - практической конференции, АТИ ДГТУ. - Азов, 2007 г.;
-
IX-ой Международной научно-технической конференции «Интеллектуальные системы '09»: Конгресс по интеллектуальным системам и информационным технологиям «AIS-IT'09». - Москва, 2009 г.;
-
международных научно-технических форумах ИнЭРТ (г. Ростов- на-Дону): 2009 г., 2012 г.
-
международных научных семинарах «Системный анализ, управление и обработка информации» (г. Ростов-на-Дону - с. Дивноморское): 2007 г., 2011 г., 2012 г.
Большинство промежуточных результатов диссертационных исследований докладывались на ежегодных научно-технических конференциях Донского государственного технического университета в 2007 - 2012 гг.
Публикации по теме диссертационной работы
Основные результаты диссертации опубликованы в 30 работах, из которых 20 - самостоятельные публикации. В 10 работах, опубликованных в соавторстве, доля материалов, принадлежащих автору диссертации, составляет не менее 50%. При этом 3 статьи, одна из которых - самостоятельная публикация, опубликованы в ведущих научных журналах, входящих в список ВАК РФ.
Похожие диссертации на Методы решения задачи попиксельной S-аппроксимации мультитоновых изображений и их оптимизация
-
-
-
-
-
-