Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний Чжи Я Аунг

Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний
<
Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Чжи Я Аунг. Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний : диссертация ... кандидата технических наук : 05.13.06 / Чжи Я Аунг; [Место защиты: Моск. гос. ин-т электронной техники].- Москва, 2010.- 158 с.: ил. РГБ ОД, 61 10-5/1770

Содержание к диссертации

Введение

Глава 1. Анализ современного состояния методов и средств автоматизированной обработки, визуализации и поиска изображений 14

1.1 Анализ основных проблем автоматизированной обработки изображений 14

1.2 Обзор существующих методов обработки и визуализации изображений 19

1.3 Особенности автоматизированных систем визуализации изображений 29

1.4 Основные цветовые модели изображений 35

1.5 Проблемы автоматизированного поиска и анализа изображений 41

1.6 Постановка целей и задач исследования 46

Выводы по главе 1 48

Глава 2. Разработка методик и алгоритмов обработки и визуализации изображений на основе локальных гистограммных преобразований 50

2.1 Алгоритм гистограммных преобразований в локальных областях яркостей изображений 50

2.2 Разработка алгоритмов управления яркостью изображений на основе гистограммных преобразований 53

2.3 Создание методики компенсации искажений при визуализации полутоновых и цветных изображений 58

2.4. Методики и алгоритмы построения граничных функций локальных преобразований изображений 63

2.4.1. Методика построения функций для сглаживания границ локальных областей 64

2.4.2. Алгоритм выявления перепадов контуров в локальных областях изображений 67

2.5. Разработка алгоритмов рассеяния ошибок при автоматизированной визуализации изображений 69

2.5.1 Проблема рассеяния ошибок при автоматизированной визуализации изображений 69

2.5.2 Алгоритм рассеяния ошибок при обработке полутоновых изображений 72

2.5.3 Алгоритм визуализации и рассеяния ошибок при обработке цветных изображений 75

2.6. Практические рекомендации по применению алгоритмов обработки и визуализации изображений на основе гистограммных преобразований 80

Выводы по главе 2 85

Глава 3. Разработка структуры графической базы знаний, методик представления и поиска изображений в ней 87

3.1. Основные подходы к созданию графических баз знаний 87

3.2. Основные принципы построения структуры графических БЗ для различных приложений 91

3.3. Разработка иерархической базы знаний графических образов 96

3.4 Методика представления и поиска изображений в графической базе знаний 103

Выводы по главе 3 11

4. Программная реализация и результаты экспериментальных исследований эффективности средств автоматизации технологических процессов обработки, визуализации и поиска изображений 114

4.1 Программный комплекс автоматизированной обработки, визуализации и поиска изображений 114

4.2 Результаты экспериментальных исследований по оценке эффективности средств автоматизированной обработки и визуализации изображений 119

4.3 Результаты экспериментальных исследований эффективности средств автоматизированного поиска изображений в иерархическихграфических базах 126

Выводы по главе 4 133

Заключение 134

Список литературы 136

Приложение 1. Акт внедрения результатов диссертационной работы 146

Приложение 2. Фрагмент программной реализации методик визуализации изображений 148

Введение к работе

Актуальность работы.

Автоматизация технологических процессов обработки изображений является одной из центральных и практически важных задач в приборостроении и других отраслях промышленности. Проблема носит комплексный характер и включает ряд основных этапов: восприятие поля зрения, сегментация, нормализация выделенных объектов, распознавание, визуализация и поиск изображений.

Результаты исследований, направленных на создание эффективных методов визуализации и обработки изображений, изложены в работах зарубежных и отечественных ученых: W.K.Pratt, R. Jain, R.W Floyd, J.M.S. Prewitt, IF. Jarvis, B.E. Bayer, T Pavlidis, В.Ф.Нестерук, И.А.Богуславского, A. Rosenfeld, В.А.Сойфера, Л.П.Ярославского, Ю.И. Журавлева.

Задача автоматизированной обработки изображений продолжает оставаться крайне актуальной на протяжении последних десятилетий. Несмотря на неослабевающий интерес исследователей и большое количество работ в данной области есть еще много открытых вопросов и нерешенных задач. В настоящее время существует и активно развивается целая отрасль автоматизированных систем, предназначенных для поиска, обработки и визуализации изображений: в частности системы распознавания образов, системы визуализации изображений, информационно-поисковые системы, системы сжатия и кодирования изображений и др.

Однако ни одну из таких систем нельзя назвать полностью универсальной и обеспечивающей весь необходимый функционал по эффективной обработке изображений, включая задачи поиска, визуализации и распознавания изображений с высокими характеристиками, прежде всего быстродействием и качеством обработки.

Существует ряд проблем, одна из основных состоит в том, что задача построения оптимальной функции преобразования для любого изображения, подлежащего обработке, с учетом способа его воспроизведения в общем случае не решена, её лучше конкретизировать и связать с определёнными выводными устройствами. Разнообразие устройств визуализации требуют разработки эффективных методов и алгоритмов визуализации изображений (ВИ). К методам ВИ предъявляются специфические требования: с одной стороны -улучшение качества воспроизведения изображений, с другой стороны-высокая скорость обработки изображений. Ряд устройств визуализации

воспроизводят меньшее количество цветовых оттенков, нежели само изображение. В связи с этим возникает задача имитации недостающих оттенков цветов при формировании выходной информации. Необходимо осуществить преобразование многоуровневого изображения в такое, число оттенков которого соответствует числу оттенков устройства визуализации.

В связи с вышесказанным требуется разработать методы, корректирующие погрешности визуализации, и учесть факторы, зависящие от техники и от характера воспроизводимых изображений. Разрабатываемые методы должны осуществлять визуализацию изображений на различных устройствах с качеством и временем визуализации более высоким, чем дают известные методы.

С распространением Internet наблюдается тенденция к накоплению информации, представленной в виде изображений, и к созданию графических баз знаний изображений. При этом проблемы эффективного поиска изображений до сих пор полностью не решены. Необходима разработка методов, обеспечивающих высокие показатели быстродействия, точности и полноты поиска изображений.

Таким образом, актуальными являются исследования, направленные на разработку методик и алгоритмов для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний .

Цель работы. Целью диссертационного исследования является разработка методик и алгоритмов для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний, обеспечивающих повышение качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышение быстродействия и точности поиска изображений без заметного снижения полноты поиска. Указанная цель достигается созданием методик и алгоритмов управления яркостью изображений; методик компенсации искажений при визуализации изображений; средств для сглаживания границ локальных областей изображений и снижения краевых эффектов; методик эффективного поиска изображений; имитационных моделей автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний.

Задачи исследования. В соответствии с указанной целью в работе решаются следующие задачи:

анализ современного состояния методов и средств автоматизированной обработки, визуализации и поиска изображений;

разработка методики и алгоритма локальных гистограммных преобразований уровней яркости при обработке и визуализации изображений;

создание методики компенсации искажений при визуализации изображений;

разработка средств для сглаживания границ локальных областей изображений;

создание алгоритмов визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;

имитационное моделирование, программная реализация и экспериментальное исследование эффективности предложенных методик и алгоритмов.

Методы исследования. В диссертационной работе использованы методы системного анализа, теории информационных систем, методы математического и имитационного моделирования, модели и методы теории распознавания образов, теории цифровой обработки сигналов.

Научная новизна работы состоит в создании новых методик и алгоритмов , обеспечивающих автоматизацию технологических процессов обработки, визуализации и поиска изображений в графических базах знаний, повышение качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышение быстродействия и точности поиска изображений без заметного снижения полноты поиска. При этом получены следующие научные результаты.

  1. На основе локальных гистограммных преобразований разработан алгоритм управления уровнем яркости при визуализации изображений, обеспечивающий снижение вычислительных затрат и сохранение ярко-стного баланса визуализированного изображения с высокой точностью.

  2. Предложены методика компенсации искажений при визуализации изображений на терминальных устройствах вывода, алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений, снижающих краевые эффекты.

  3. Созданы алгоритмы автоматизированной визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов, обеспечивающие повышение эффективности воспроизведения при визуализации изображений с

большим количеством мелких деталей, а также когда разница между глубиной цветов входных и выходных изображений велика.

  1. Разработана модель многомодульной графической базы знаний с динамически конфигурируемой структурой, основанной на вероятности обращения как к отдельным модулям, так и содержащимся в них медиадокументах и изображений.

  2. Разработан программный комплекс, созданы и верифицированы имитационные модели для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.

Практическая значимость работы заключается в повышении эффективности средств автоматизированной обработки, визуализации и поиска изображений в графических базах знаний. Гибкость предложенных решений делает возможным их применение в системах технического зрения, системах контроля качества продукции приборостроения, системах распознавания образов, системах компрессии подвижных и неподвижных изображений, системах управления и поиска изображений в мультимедийных и графических базах знаний.

Предложена и программно реализована система автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний. Система обеспечивает возможность: видоизменения гистограмм полутоновых и цветных изображений, нахождения изображения, отвечающего определенным критериям, навигации по категориям изображений; формирования визуального запроса с полным или частичным перечнем всех возможных свойств; накопления и выдачи оценок результатов поиска.

Создана структура базы знаний для подготовки и обработки минии-зображений в среде Linux. Для снижения вычислительных затрат и простоты наращиваемости системы поиска изображений все признаки, используемые при вычислении меры релевантности, определяются только на основе сохраненных в БЗ миниизображений. Получена и экспериментально обоснована рациональная с точки зрения быстродействия и качества визуализации структура фильтра для рассеяния ошибок визуализации.

Результаты экспериментальных исследований предложенных в работе средств автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний показали, что обеспечивается снижение средней относительной погрешности визуализации изображений в 2 раза, повышение быстродействия

поиска изображений на 11,6 %, точности поиска на 2,7 %, при снижении коэффициента полноты поиска всего на 0,8 % по сравнению с традиционными методами.

Достоверность определяется корректным применением строго математического аппарата и подтверждается результатами имитационного моделирования, доказавшими преимущества предложенных в работе методик и алгоритмов, выразившимися в повышении качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышении быстродействия и точности поиска изображений без заметного снижения полноты поиска.

Личный вклад автора. Все основные результаты получены автором лично. Главными из них являются:

разработка алгоритма управления уровнем яркости при визуализации изображений;

создание методики компенсации искажений при автоматизированной визуализации изображений на терминальных устройствах вывода;

разработка алгоритма выявления перепадов контуров в локальных областях изображений и совокупности функций для сглаживания границ локальных областей изображений;

создание алгоритмов автоматизированной визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;

разработка модели многомодульной графической базы знаний с динамически конфигурируемой структурой;

разработка программного комплекса и имитационных моделей для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний;

внедрение результатов диссертационной работы в учебный процесс кафедры МИЭТ.

Внедрение результатов работы. Все работы по реализации и внедрению проводились под руководством или при непосредственном участии автора. Результаты диссертационной работы используются в учебном процессе Московского государственного института электронной техники (технический университет).

На защиту выносятся:

алгоритм управления уровнем яркости при визуализации изображе
ний;

методика компенсации искажений при визуализации изображений на терминальных устройствах вывода;

алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений;

алгоритмы визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;

модель многомодульной графической базы знаний с динамически конфигурируемой структурой;

программный комплекс для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний;

результаты экспериментальных исследований эффективности предложенных методик и алгоритмов;

результаты внедрения и апробации материалов диссертационной работы.

Апробация работы. Основные положения и результаты диссертационной работы были доложены на Всероссийских межвузовских научно-технических конференциях "Микроэлектроника и информатика" (Москва, Зеленоград, МИЭТ, 2007- 2009 г.г.), Научной сессии МИФИ (Москва, МИФИ, 2008-2009 г.г.), Всероссийской межвузовской научно-практической конференции "Актуальные проблемы информатизации. Развитие информационной инфраструктуры, технологий и систем" (Москва, Зеленоград, МИЭТ, 2007-2008 г.), Всероссийской межвузовской научно-практической конференции «Актуальные проблемы информатизации в науке, образовании и экономике» (Москва, Зеленоград, МИЭТ, 2009 г.)

Публикации. Основное содержание диссертации отражено в 17 опубликованных работах, в том числе 2 статьи в ведущих научных журналах, утвержденных ВАК. Без соавторов опубликовано 10 работ.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений. Работа содержит 145 страниц основного текста, включая 32 рисунка, 5 таблиц, а также список литературы из 109 наименований и 2 приложения.

Анализ основных проблем автоматизированной обработки изображений

Сегментация обычно понимается как процесс поиска однородных областей на изображении. Этот этап весьма трудный и в общем виде не алгоритмизированный до конца для произвольных изображений. Наиболее распространены методы сегментации, основанные на определении однородных яркостей (цветов) или однородностей типа текстур.

При существовании стабильных различий в яркостях отдельных областей поля зрения применяются пороговые методы . Методы наращивания областей эффективны при наличии устойчивой связности внутри отдельных сегментов [20,21]. Метод выделения границ хорошо применять, если границы достаточно четіше и стабильные. Перечисленные методы служат для выделения сегментов по критерию однородных яркостей. Эффективным здесь представляется метод водоразделов, основанный на поиске локальных минимумов с последующей группировкой вокруг них областей по связности. Все методы весьма приемлемы с точки зрения вычислительных затрат, однако, для каждого из них характерна неоднозначность разметки точек в реальных ситуациях из-за необходимости применения эвристик (выбор порогов совпадения яркостей, выбор цифровых масок и т.д.).

Для описания и сегментации свойств изображений, а именно: однородности, шероховатости, регулярности применяют текстурные методы, делящиеся условно на две категории: статистические и структурные. После сегментации возникают помехи в виде как разрозненных изменений изолированных элементов изображения, так и в виде искажений некоторых связных областей. Не останавливаясь подробно на методах борьбы с подобными помехами, отметим лишь, что на практике наибольшее распространение получили цифровые фильтры-маски и нелинейные фильтры типа медианных. При этом в случае сегментации путем выделения границ использование усредняющих фильтров-масок невозможно, так как границы при этом не подчеркиваются, а размываются. Для подчеркивания контуров применяются специальные операторы интегрального типа.

Распознавание - чаще всего конечный этап обработки, лежащий в основе процессов интерпретации и понимания. Входными для распознавания являются изображения, выделенные в результате сегментации и, частично, отреставрированные. Они отличаются от эталонных геометрическими и яркостными искажениями, а также сохранившимися шумами.

Для реальных задач распознавания применяются, в основном, четыре подхода, использующие методы: корреляционные, основанные на принятии решений по критерию близости с эталонами; признаковые и синтаксические - наименее трудоемкие и нормализации, занимающие промежуточное положение по объему вычислений [22,23].

Корреляционные методы нашли широкое применение при обнаружении и распознавании изображений в системах навигации, слежения, промышленных роботах. При полностью заданном эталоне многошаговая корреляция путем сканирования входного поля зрения является по сути полным перебором в пространстве сигналов. Однако, строгой математической модели оптимизации подобной задачи еще не создано.

Значительно более простые с точки зрения вычислительной сложности методы основаны на переходе в пространство признаков, которые характеризуются существенно меньшей размерностью по сравнению с пространством сигналов (изображений). В зависимости от поставленной цели (например, достижения заданной точности) выполняется корреляционная обработка признаков, полученных от эталона и входного изображения как с использованием порогов по величине сходства, так и без установления порога (когда ищется максимум сходства) [24,25].

Наиболее помехоустойчивы при действии как случайных помех, так и локальных помех являются алгоритмы, основанные на методе частных корреляций. При этом частные коэффициенты корреляций, полученные для отдельных фрагментов эталона в сигнальном пространстве, могут рассматриваться как признаки (в общем случае разно шкальные).

Признаковые и синтаксические методы - наиболее разработаны в теории распознавания образов [1-3]. Они основаны как на статистических, так и детерминированных подходах. Главную трудность в признаковых методах составляет выбор признаков. При этом исходят из естественных правил: а)признаки изображений одного класса могут различаться лишь незначительно (за счет влияния помех); б)признаки изображений разных классов должны существенно различаться; в)набор признаков должен быть минимально возможным, т.к. от их количества зависит и надежность, и сложность обработки.

В первом приближении синтаксические методы можно отнести к признаковым, т.к. они основаны на получении структурно-лингвистических признаков, когда изображение дробится на части - непроизводные элементы (признаки). Вводятся правила соединения этих элементов, одинаковые для эталона и входного изображения. Анализ полученной таким образом грамматики обеспечивает принятие решений.

Методы нормализации при распознавании занимают промежуточное место между сигнальными корреляционными и признаковыми алгоритмами. Суть нормализации заключается в автоматическом вычислении неизвестных параметров преобразований, которым подвергнуты входные изображения, и последующем приведении их к эталонному виду. В настоящее время остается открытым вопрос о поиске универсальных и надежных нормализаторов для сложных групп преобразований - аффинных и проективных.

Параллельная нормализация методом сечений не всегда приводит к однозначному определению параметров аффинных или проективных преобразований, несмотря на кажущуюся универсальность. Всякий раз для нового изображения возникает вопрос о рациональном разбиении на градации яркости полутоновых изображений, что требует постоянного присутствия оператора и интерактивного режима работы. Кроме того изображения типа "силуэт", а также малоградационные вообще не поддаются нормализации этим методом.

Нормализация проективных преобразований представляет собой трудную и еще не решенную до конца задачу.

Процесс распознавания изображений является сложной многоэтапной процедурой. Многоэтапность (иерархичнос гь) обусловлена тем, что различные задачи обработки на самом деле тесно связаны и качество решения одной из них влияет на выбор метода решения остальных. Так выбор метода распознавания зависит от конкретных условий предъявления входных изобралсений, в том числе характера фона, других изображений, помеховой обстановки и связан с выбором методов предобработки, сегментации, фильтрации.

Разработка алгоритмов управления яркостью изображений на основе гистограммных преобразований

Проблема обработки изображений носит явно выраженный комплексный иерархический характер и включает ряд основных этапов: поиск, восприятие поля зрения, сегментация, нормализация выделенных объектов, распознавание, визуализация. Для решения возникающих при этом задач необходимо с одной стороны дальнейшее улучшение параметров изображения системы (чувствительности, разрешающей способности и т.д.), с другой стороны - совершенствование методов обработки, визуализации и поиска изображений.

Существует множество методов, применяемых для эффективной обработки изображений. В частности, методы гистограммных преобразований благодаря своей эффективности и наглядности нашли широкое применение при решении задач обработки как полутоновых, так и цветных изображений. Гис-тограммная обработка цветных изображений может использоваться в различных областях машинного извлечения цветовой информации - от криминалистики и медицины до сельского хозяйства и поиска полезных ископаемых, а также для улучшения визуального качества цветных изображений. Этим объясняется существование большого количества методов класса гистограммных преобразований, что позволяет решать широкий круг задач с учетом разнообразных нюансов. Основными методами гистограммной обработки являются, во-первых, эквализация гистограмм - получение изображения с равномерной гистограммой значений яркости для каждой цветовой компоненты. Во-вторых, метод локального улучшения - адаптивная эквализация гистограммы, функция преобразования которой основана на распределении яркостей по окрестности каждого элемента изображения.

Вместе с тем при всей своей эффективности существующие методы гистограммной обработки изображений приводят к потерям уровней яркости в различных диапазонах серого, не всегда устраняют искажения в определённых диапазонах тонов изображений Отметим, что процедуры преобразования гистограмм могут применяться как к изображению в целом, так и к отдельным его фрагментам. Последнее может быть полезным при обработке нестационарных изображений, содержание которых существенно различается по своим характеристикам на различных участках. В этом случае лучшего эффекта можно добиться, применяя гис-тограммную обработку к отдельным участкам. Задача построения оптимальной функции преобразования для любого изображения, подлежащего обработке, с учетом способа его воспроизведения в общем случае не решена, её лучше конкретизировать и связать с определёнными выводными устройствами. Разнообразие устройств визуализации требуют разработки эффективных методов и алгоритмов визуализации изображений. К методам ВИ предъявляются специфические требования: с одной стороны - улучшение качества воспроизведения изображений, с другой стороны, высокая скорость обработки изображений. Высококачественные терминалы дороги и используются далеко не везде, поэтому необходимо разработать методы и алгоритмы воспроизведения изображений на экранах мониторов персональных компьютеров и различных терминальных устройств, причем в режиме, приближенном к реальному. Устройства вывода изображений - наиболее проблемное оборудование при визуализации изображений, поскольку зачастую имеют низкие линиатуры, ограниченную палитру цветов и существенные погрешности воспроизведения. Ряд устройства визуализации воспроизводят меньшее количество цветовых оттенков, нежели само изображение. В связи с этим возникает задача имитации недостающих оттенков цветов при формировании выходной информации. Необходимо осуществить преобразование многоуровневого изображения в такое, число оттенков которого соответствует числу оттенков устройства визуализации. С целью повышения качества ВИ предполагается компенсировать недостатки технических характеристик терминальных устройств за счет создания новых методов и алгоритмов и создания соответствующего программного обеспечения. В связи с вышесказанным требуется разработать методы, корректирующие погрешности визуализации и учесть факторы, зависящие от техники и от характера воспроизводимых изображений. Разрабатываемые методы должны осуществлять визуализацию изображений на различных устройства визуализации с качеством и временем визуализации, более высоким, чем дают известные методы. Количество изображений, размещаемых в Интернете и индексируемых поисковыми системами, растет в геометрической прогрессии. При этом классифицированной является лишь незначительная часть этих изображений, а для остальных досіупен только поиск по ключевым словам в сопутствующем тексте. Недостаточная эффективность такого подхода делает актуальной разработку альтернативных методов поиска изображений. Наиболее эффективным с точки зрения простоты реализации и вычислительных затрат является поиск по ми-ниизображениям. Таким образом, цель диссертационной работы состоит в создании эффективных методов и средств для автоматизации технологических процессов обработки, визуализации и поиска изображений в базах графической информации. Выводы по главе 1 1. Рассмотрены и проанализированы основные проблемы автоматизированной обработки изображений. Показано, что проблема носит комплексный характер и включает ряд основных этапов: поиск изображений, сегментация, нормализация выделенных объектов, распознавание и визуализация. 2. Проведенный обзор существующих методов обработки и визуализации изображений показал, что при обработке изображений, содержание которых существенно различается по своим характеристикам на различных участках целесообразно применить локальные гистограммные преобразования, а также необходимо разработать методы, корректирующие погрешности визуализации и учесть факторы, зависящие от техники и от характера воспроизводимых изображений. 3. Определены основные требования к автоматизированным системам поиска изображений, а именно: высокая скорость индексирования и вычисления меры релевантности изображения эталону; простота модификации системы поиска; учет особенностей психовизуального восприятия человека; робаст-ность к небольшим изменениям пропорций, яркости, контраста и др. 4. Сформулирована цель диссертационной работы, состоящая в создании эффективных методов и средств для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.

Основные принципы построения структуры графических БЗ для различных приложений

Эффективность любой интеллектуальной поисковой системы в первую очередь определяется мощностью ее базы знаний (БЗ) [61-63]. Одной из основных проблем реализации такого инструмента является создание систем управления базами знаний (СУБЗ) фафической информации. В настоящее время усилия проектировщиков графических интерфейсов в основном ориентированы на разработку новых форматов фафических образов (ГО) и эффективных методов и средств их синтеза-анализа. Но, зачастую, в различных ГО отражаются разные стороны исследуемого информационного объекта, или один ГО характеризует несколько подобных объектов, необходима интерпретация графической информации, ее структуризация, классификация по самым различным критериям и т.д. Поэтому в интеллектуальных системах целесообразно строить и поддерживать в актуальном состоянии соответствующую БЗ фафической информации.

Любой ГО строится с какой-либо целью и является отражением некоторых (исходных) данных, знаний, информации. Как правило, целью синтеза ГО являются анализ соответствующего процесса, явления, объекта, их трактовка, интерпретация, объяснение, передача понимания, принятие решений.

Выделим в БЗ три взаимосвязанных макрообъекта: декларативные, процедурные и концептуальные знания [64]. Остановимся на декларативном макрообъекте - в нем выделяются четыре взаимосвязанные компоненты: БЗ метаданных информационных объектов — прообразов для синтеза соответствующих ГО (БЗМЕТА); БЗ проблем и целей интеллектуального анализа данных, в которых используются ГО (B3PROB); БЗ методов и средств генерации и анализа ГО (БЗлылш); БЗ графических образов (B30BRAZ)- Кроме этого, поддерживается специальный ассоциатор отношений между приведенными БЗ [65].

В БЗМЕТЛ содержится информация обо всех объектах предметной области интеллектуальной системы, для которых целесообразно использовать графические интерфейсы. По сути, это репозитарий используемого хранилища данных или словарь-справочник метаданных соответствующей системы, но ориентированный на синтез-анализ ГО. Поэтому, с одной стороны, в нем должно быть достаточно информации для поиска прообраза для генерации ГО, с другой — форматы представления исходных данных должны соответствовать методам, используемым для синтеза ГО. Если соответствия нет, то строится специальный конвертор. Таким образом, БЗМЕТЛ связана с соответствующей системой конверторов-преобразователей форматов хранения данных ГО. Заметим, в роли прообразов для синтеза ГО могут выступать и другие графические образы, поступающие как из внешних источников, так и порождаемые системой. Поэтому репозитарий БЗМЕТЛ должен включать описание форматов хранения и указателей путей доступа не только к информационным объектам БЗ соответствующей системы, но и к объектам «собственной» базы знаний B3oBRAZ В БЗряов описываются характеристики проблемных областей информационно-аналитических систем, в которых используются графические методы исследования и с какими целями генерируются соответствующие ГО. В этой БЗ выделяются две взаимосвязанные структуры: сеть «проблем-задач» и сеть «целей-средств» синтеза ГО. Их взаимное отображение обеспечивает процессы анализа эффективности использования графики в интеллектуализации функций соответствующей системы. Здесь накапливается и систематизируется положительный и отрицательный опыт синтеза-анализа ГО. Отношения «проблем-задач» с «целями-средствами» необходимо отражать в БЗ образного мышления независимо от формата и формы представления образа. В БЗДМАШ описываются характеристики методов и средств получения ГО из прообразов. В методах выделяются классические математические (построение графиков аналитических, статистических и других зависимостей в двумерном или трехмерном видах), традиционные компьютерные (синтеза диаграмм, гистограмм и т.п.) и специальные. К последним относятся различные оригинальные методы, вновь разработанные или, по различным причинам, не нашедшие в настоящее время широкого применения. Средства делятся на: аппаратные (и «ручные»), аппаратно-программные и программные. Отличительной особенностью первых является то, что результатом их работы является образ «вне вычислительной среды» (например, ручной эскиз, фотография и т.п.). Поэтому необходимо проведение предварительной операции (оцифровки) перед погружением ГО в БЗ; цифровые видеокамеры, фотоаппараты и другие измерительные приборы и системы — аппаратно-программные средства; разнообразные инструментальные компьютерные комплексы, ориентированные на синтез графических образов. Это могут быть статические и динамические ГО, растровые и векторные и т.п. B30BRAZ - центральная компонента базы знаний графической информации интеллектуальной компьютерной технологии. В этой БЗ хранятся все графические образы, генерируемые и анализируемые в процессе функционирования соответствующей интеллектуальной системы. Особый интерес представляют отношения между образами. Это обусловлено тем, что в БЗ ГО эти отношения, как правило, более «семантически насыщены» относительно традиционных БЗ.

Поддержка этих отношений требует использования в БЗ лингвистических шкал и методов нечеткой математики [66]. Заметим, что отношения ассоциации, подобия, аналогии должны снабжаться весовыми характеристиками. Также сложно описывать родо-видовые отношения между ГО или ассоциативные. В этой БЗ отражаются отношения между ГО, обусловленные принадлежностью некоторому информационному объекту. Вообще в отношениях между ГО должны отражаться структуры отношений между информационными объектами соответствующей интеллектуальной системы. Поскольку любой образ должен иметь прообраз, то у любого ГО должны быть «родители» или в среде БЗ ГО, или в среде информационных объектов. В БЗ ГО также поддерживаются некоторые специальные отношения: «абстрактное-конкретное», «общее-частное» и т.д. В B30BRAZ таюке поддерживаются обычно несколько уровней графемных (неделимых) конструкций. Для поддержки этих отношений в БЗ ГО используются фреймовые структуры и инструментарий многомерных семантических сетей. Интеллектуализация графического обеспечения процессов анализа данных предполагает постепенное выделение стереотипных графических конструкций, из которых можно будет построить алфавит (словарь) графем для синтеза более сложных ГО.

Программный комплекс автоматизированной обработки, визуализации и поиска изображений

На основе предложенных в работе моделей, методик и алгоритмов предложен программный комплекс автоматизированной обработки, визуализации и поиска изображений. Комплекс включает несколько подсистем. Подсистема обработки изображений предназначена для решения следующих задач: 1) видоизменения гистограмм полутоновых и цветных изображений; 2) псевдоцветового кодирования полутоновых изображений; 3) кодирования спектрозональних изображений в ложных цветах. Данные процедуры позволяют существенно изменить визуальные свойства изображений и повысить их дешифровочныс свойства. Функциональная схема алгоритма поточечного преобразования изображений представлена на рис.4.1 Структура программного комплекса автоматизированной обработки, поиска и визуализации изображений представлена на рис. 4.2 . Подсистема обработки изображений включает в себя следующие компоненты: - головной модуль, предназначенный для управления работой программного комплекса, выбора процедур обработки, визуализации исходных изображений и результатов обработки, вычисления просмотровых таблиц преобразования изображений, обмена данными со вспомогательными вычислительными модулями; - модуль преобразования изображения, предназначенный для непосредственного выполнения операций обработки цветных и полугоновых изображений методом просмотровых таблиц. Подсистема для визуализации и поиска изображений дает возможность нахождения изображения, отвечающего определенным критериям. Кроме того, разработанный комплекс программ организует изображения с возможностью навигации по категориям: изображения со сходным содержимым располагаются рядом. Разработанная система хранения изображений удовлетворяет всем этим требованиям, помогает создавать базы данных и управлять коллекциями изображений [101]. Разработанный комплекс программ позволяет решать поставленную задачу с помощью вейвлет-преобразований. Система Visual Studio.NET упрощает разработку эффективных и надежных корпоративных решений. Ключевым фактором для этого является применение полнофункциональных средств разработки и масштабируемых многократно используемых серверных компонентов. Из пакета Microsoft Visual Studio .NET Enterprise Architect используется средство Microsoft Visual C# .NET, которое предоставляет удобную среду разработки для создания Windows-приложений и .NET-приложений, Web-приложений и XML Web-сервисов. Visual С# .NET включает ставшую стандартом отрасли библиотеки ATL (Active Template Library) и MFC (Microsoft Foundation Class), расширения языка C#, а также мощную интегрированную среду разработки (IDE), позволяющую разработчикам эффективно создавать и отлаживать код. В сочетании с .NET Common Language Runtime C# может применяться для разработки объектно-ориентированных программ с привлечением всего опыта С, C++ или СОМ, что позволит создавать быстрые и мощные приложения. Поддерживая шаблоны и имея оптимизирующий компилятор, Visual С# .NET генерирует высокоэффективные приложения и компоненты. Данный продукт позволяет разрабатывать целый комплекс Windows- приложений, включая Web-приложения, приложения для мобильных устройств, а также решения для «тонкого клиента» [102]. Блок определения визуальных свойств формирует множество числовых, текстовых или абстрактных свойств каждого изображения с автоматическим вычислением визуальных свойств; при необходимости может выполняться ручной ввод текстовых аннотаций экспертами предметной области. В блоке обработки визуальных свойств определяется порядок составления индекса с использованием визуальных свойств, что позволяет уменьшить пространство поиска индексов. Схема индексации дает возможность использовать методы быстрого поиска в пространстве индексов, включая многомерное индексирование и поиск. Блок формирования визуального запроса позволяет пользователю сформулировать визуальный запрос с полным или частичным перечнем всех возможных свойств; при этом могут использоваться изображение, построенная пользователем схема изображения, ключевые слова, значения визуальных свойств. Анализ и обработка запроса, формирование индекса и поиск по базе данных с использованием меры сходства запроса и изображений базы данных выполняется блоком обработки визуального запроса. Блок представления результатов обеспечивает отображение и просмотр результатов поиска изображений в удобной и понятной пользователю форме, а также интерфейс с другими приложениями. Система оценки качества поиска предоставляет следующие возможности: модификация изображений; накопление и выдача автоматических (по модификациям и искажениям) и неавтоматических (по оценкам экспертов) оценок результатов поиска. Реализованы следующие виды модификации изображений: восстановимые (поворот, масштабирование, замена цветовых каналов, уменьшение количества цветов, псевдотонирование, размытие, увеличение контраста и яркости); невосстановимые (замена цветов, циклический сдвиг изображения, пре мешивание сегментов). На вход системе подается сценарий, в соответствии с которым она модифицирует и отправляет изображение системе поиска изображений в качестве запроса. Проанализировав результат запроса, система определяет оценку качества поиска, что и выводит, возможно, вместе с экспертными результатами.

Похожие диссертации на Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний