Введение к работе
Актуальность работы. Довольно часто источником информации о реальном мире служит изображение. Извлечение нужных сведений из изображения называется, как известно, дешифрированием. По настоящее время основным способом дешифрирования остается визуальный, выполняемый заранее подготовленным специалистом. Однако визуальное дешифрирование имеет ряд существенных ограничений. В частности, для работы человека необходима система жизнеобеспечения. Результаты визуального дешифрирования являются принципиально субъективными. В некоторых случаях скорость поступления информации может превышать психофизические возможности восприятия человека. Одним из путей преодоления перечисленных ограничений является автоматизация дешифрирования изображений.
Работы в области автоматизации дешифрирования изображений интенсивно ведутся с 60-х годов XX века во всех высокоразвитых странах. По данной тематике опубликовано большое количество работ, авторами которых являются К.К. Васильев, Ю.Г. Васин, Ю.В. Визильтер, Р. Вудс, Р. Гонсалес, А.Л. Горелик, И.Б. Гуревич, Р. Дуда, Н.Г. Загоруйко, В.Н. Козлов, В.Р. Крашенинников, Т. Куте, У. Прэтт, Ю.П. Пытьев, А. Розенфельд, В.В. Сергеев, К. Тейлор, В.Б. Фофанов, Я.А. Фурман, П. Харт и другие. Однако, общей теории дешифрирования пока создать не удалось, несмотря на впечатляющие успехи, достигнутые в распознавании печатных символов, идентификации людей по папиллярным узорам или сетчатке глаза и решении некоторых других прикладных задач.
Одной из задач дешифрирования является поиск на сцене объектов определенного вида. Для ее решения необходимо построить математическую модель сцены, разработать численные методы поиска объектов и исследовать их эффективность. Для возможности экспериментального исследования эффективности методов поиска объектов необходимо разработать методы моделирования изображений сцен. В.Б. Фофановым1 предложены математическая теория и формализация задачи поиска объектов, состоящая из трех последовательных этапов: поиск зон интереса, сегментация и вычисление признаков. Сформулированы условия сходимости решающих правил к оптимальным, с вероятностью ошибки, равной нулю, когда объемы п выборок и их количество s стремятся к бесконечности. Однако на практике приходится работать с конечным числом выборок конечного объема. Поэтому возникает вопрос о зависимости результатов от п и s.
Целью работы является повышение эффективности решения задач поиска зон интереса и их сегментации на векторных сценах за счет применения
1 В.Б. Фофанов О теоретико-вероятностной формализации задачи дешифрирования аэрокосмических изображений // Автометрия. 2003. №6.- С. 107-118.
разработанной новой математической модели сцены и построенных на ее основе численных методов.
Для ее достижения были поставлены и решены следующие задачи:
Построение математической модели сцены.
Разработка численных методов и программного обеспечения для моделирования изображений локально однородных сцен, которые служат моделями реальных сцен.
Разработка последовательных и параллельных численных методов и соответствующего программного обеспечения для поиска зон интереса и классификации их пикселей по векторным изображениям.
Разработка комплекса программ для экспериментального исследования алгоритмов поиска объектов по векторным изображениям.
Исследование эффективности алгоритмов поиска объектов по векторным изображениям в зависимости от сложности сцены и параметров алгоритмов.
Применение разработанных методов поиска объектов для решения задачи диагностики состояния высоковольтных изоляторов по их инфракрасным изображениям.
Методы исследований. Для решения поставленных задач используется аппарат теории вероятностей, математической статистики, теории случайных процессов и полей. Программное обеспечение разработано на языке С# в среде Microsoft Visual Studio 2008.
Научная новизна.
Предложена новая модель сцены в виде векторного локально однородного случайного поля, каждый фрагмент которого определяется своим вектором средних значений и набором ковариационных функций.
Разработаны численные методы моделирования изображений локально однородных сцен с заданными свойствами на основе бернуллиевских полей.
Разработаны последовательные и параллельные численные методы для поиска зон интереса и классификации их пикселей на объект и фон по векторным изображениям. Поиск зон интереса включает этапы построения семейства квадратов и их классификации. Предложены алгоритмы обобщенных на векторный случай методов сегментации квантилей, мод и пятна.
Практическая значимость. Программное обеспечение, разработанное в рамках выполненной работы, а также рекомендации по его применению могут использоваться при автоматизации решения задач поиска объектов в различных предметных областях, включая поиск объектов по аэрокосмическим, медицинским изображениям и другие. Имеется акт использования полученных в диссертации результатов на Горьковской железной дороге для диагностики состояния высоковольтных изоляторов по их инфракрасным
изображениям. Изложенные в диссертации результаты также используются в учебном процессе в рамках спецкурса по дешифрированию изображений в Казанском (Приволжском) федеральном университете. Основные положения, выносимые на защиту.
Математическая модель сцены в виде векторного локально однородного случайного поля.
Численные методы моделирования изображений локально однородных сцен.
Методы и алгоритмы поиска зон интереса и классификации их пикселей на объект и фон по векторным изображениям.
Комплекс программ для экспериментального исследования алгоритмов поиска объектов по векторным изображениям.
Апробация работы. Результаты диссертационной работы докладывались на VIII и IX Международных конференциях «Pattern Recognition and Image Analysis: New Information Technologies» (г.Иошкар-Ола, 2007; г. Нижний Новгород, 2008), X Международной конференции «Высокопроизводительные параллельные вычисления на кластерных системах» (г. Пермь, 2010), IX Международной конференции «Интеллектуальные системы и компьютерные науки» (г. Москва, 2006), XV Международной конференции «Проблемы теоретической кибернетики» (г.Казань, 2008), XVIII Всероссийской межвузовской научно-технической конференции «Электромеханические и внутри-камерные процессы в энергетических установках, струйная акустика и диагностика, приборы и методы контроля природной среды, веществ, материалов и изделий» (г.Казань, 2006), научных семинарах «Перспективные информационные технологии» в НИИММ имени Н.Г. Чеботарева (руководитель д.ф.-м.н., проф. В.Д. Соловьев), «Методы моделирования» при КНИТУ имени А.И. Туполева (руководитель д.ф.-м.н., проф. В.А. Райхлин).
Публикации. Основные результаты опубликованы в девяти работах, из которых три - в журналах, включенных ВАК в список изданий, рекомендуемых для опубликования основных научных результатов диссертации на соискание ученой степени кандидата и доктора наук. Две компьютерные программы зарегистрированы во Всероссийском научно-техническом информационном центре.
Структура и объем диссертации. Диссертация состоит из Введения, пяти глав, Заключения и Списка использованных источников из 100 наименований. Общий объем диссертации составляет 182 страницы, включая 45 рисунков.