Содержание к диссертации
Введение
1. Анализ методов улучшения качества восприятия слабоконтрастных документов в информационно-измерительных системах обработки документов 12
1.1 Классификация и основные особенности класса цифровых изображений слабоконтрастных документов 12
1.2 Ввод слабоконтрастных документов в информационно-измерительных системах обработки документов 16
1.3 Методы улучшения качества цифровых изображений слабоконтрастных документов 22
1.4 Основные виды оценок качества восприятия изображений слабоконтрастных документов 39
1.5 Выводы 41
2. Низкочастотная нелинейной фильтрации слаборконтрастных документов 43
2.1 Обобщенная модель документа 43
2.2 Обобщенные показатели качества восприятия документов 51
2.3 Обобщенная модель низкочастотного нелинейного фильтра и оценка результатов фильтрации 58
2.4 Выводы 65
3. Синтез ядра низкочастотного нелинейного фильтра 67
3.1 Выделение признаков изображения слабоконтрастного документа 67
3.2 Синтез ядра фильтра 77
3.3 Сравнительная характеристика фильтрации различными ядрами 93
3.4 Выводы 98
4. Экспериментальное исследование качества нелинейной низкочастотной фильтрации 100
4.1 Распределение яркостных и цветовых характеристик изображения слабоконтрастного документа 100
4.2 Оптимизация базового алгоритма низкочастотной нелинейной фильтрации прямоугольным ядром для двухмерных монохромных изображений 104
4.3 Качественное сравнение результатов фильтрации, полученных различными методами 118
4.4 Программное обеспечение для проведения низкочастотной нелинейной фильтрации слабоконтрастных документов 122
4.5 Программное средство для проведения низкочастотной нелинейной фильтрации прямоугольным ядром видеоизображений... 126
4.6 Выводы 133
Заключение 134
Список литературы
- Ввод слабоконтрастных документов в информационно-измерительных системах обработки документов
- Обобщенная модель низкочастотного нелинейного фильтра и оценка результатов фильтрации
- Сравнительная характеристика фильтрации различными ядрами
- Оптимизация базового алгоритма низкочастотной нелинейной фильтрации прямоугольным ядром для двухмерных монохромных изображений
Введение к работе
Актуальность темы. В настоящее время среди информационно-измерительных систем (ИИС) [40, 51, 52, 57, 59] большое распространение получили ИИС, предназначенные для обработки документов (ИИСОД). Такой рост обусловлен двумя основными причинами. Во-первых, потребность в обработке документов в научной, потребительской и производственной сферах всегда была и остается на высоком уровне. Во-вторых, развитие инфраструктуры программно-аппаратных средств для ввода, обработки и отображения графической информации, являющихся основными составляющими ИИСОД, позволило найти практическое применение множеству теоретических методов, накопленных в данной области за все время ее существования.
В связи с широким спектром конструктивных различий между конкретными ИИСОД, обусловленных узкой спецификой целевой задачи, проведение их общей классификации становится невозможным. Однако среди всей совокупности ИИСОД можно выделить системы, эффективность работы которых зависит от качества исходного изображения. Примером таких систем являются:
ИИС, предназначенные для микрофильмирования документов (ИИСМД);
ИИС, предназначенные для распознавания графической и текстовой информации из документов (ИИСРГТИД);
ИИС, предназначенные для ксерокопирования документов (ИИСКД).
Основной особенностью таких систем является существенное снижение эффективности при обработке так называемых слабоконтрастных документов. В основном это ветхие архивные документы, представляющие собой огромную историческую и культурно-социальную ценность, но потерявшие исходное качество в результате процесса старения. Микрофильмирование и ксерокопирование таких документов сопряжено с большой потерей инфор-
мации на результирующем изображении, в связи с чем возникает задача повышения эффективности ИИСОД.
Для решения данной задачи производят предварительное улучшение качества слабоконтрастных документов. Традиционно применяющиеся для этого методы делятся на два класса. Методы первого класса направлены на повышение полностью детерминированных качественных показателей, что бывает очень редко. Другой класс, более распространенный, содержит методы для улучшения субъективного качества восприятия изображений, которое невозможно определить в виде четкой формальной оценки. Это обусловило появление в ИИСОД программно-аппаратных средств, предназначенных для решения так называемой задачи «эстетического» характера, суть которой состоит в «подгонке» изображений под нечетко заданные субъективные нормы наблюдателя за счет предоставления оператору возможности влияния на качество результата посредством изменения параметров обработки. Например, для ИИСМД только опытный специалист может оценить степень информационных потерь, которые возникнут в результате микрофильмирования.
Другое актуальное направление исследований в данной области - формализация качественной оценки результата обработки. Переход к такой оценке не только позволяет частично автоматизировать процесс предварительного улучшения качества, но также делает возможным производить сравнение эффективности существующих в настоящее время методов, предназначенных для решения данной задачи.
Таким образом, повышение эффективности ИИСОД путем улучшения качества восприятия слабоконтрастных документов, а также формализация оценки качества являются актуальными на сегодняшний день задачами.
Указанные обстоятельства обуславливают выбор объекта и предмета диссертационного исследования.
Объектом исследования является информационно-измерительная система, предназначенная для обработки документов, эффективность которой определяется исходным качеством документа.
Предмет исследования можно охарактеризовать как качество восприятия цифровых изображений слабоконтрастных документов.
Цель диссертационной работы — повышение эффективности информационно-измерительных систем, предназначенных для обработки документов, путем предварительного улучшения качества восприятия цифровых изображений слабоконтрастных документов.
Задачи исследования.
Исследование характеристик слабоконтрастных документов, влияющих на качество их восприятия в ИИСОД.
Разработка формальных оценок качества восприятия цифровых изображений слабоконтрастных документов, согласующихся с «эстетическими оценками».
Разработка метода нелинейной цифровой фильтрации, улучшающего качество восприятия цифровых изображений слабоконтрастных документов в ИИСОД.
Разработка различных ядер нелинейного низкочастотного фильтра.
Исследование влияния различных ядер низкочастотного нелинейного фильтра, а также параметров фильтрации на качество восприятия цифровых изображений слабоконтрастных документов.
Проведение экспериментальных исследований, подтверждающих эффективность использования разработанного метода нелинейной низкочастотной фильтрации изображений слабоконтрастных документов в ИИСОД.
Методы исследования. При проведении теоретических исследований в диссертационной работе были использованы методы цифровой обработки изображений, математической статистики и теории вероятностей.
При разработке программного обеспечения для проведения экспериментальных исследований использовался объектно-ориентированный подход.
Научная новизна диссертации заключается в следующем.
Разработан метод улучшения качества слабоконтрастных документов для ИИСОД за счет нелинейного усреднения характеристик точек в локальной области изображения с учетом как качественных, так и пространственных различий между ними.
Предложен общий принцип синтеза ядер нелинейного фильтра на основе функций превосходства между характеристиками точек изображения.
Синтезирован ряд ядер низкочастотного фильтра и проведен анализ эффективности их использования с целью улучшения качества восприятия слабоконтрастных документов.
Для прямоугольного ядра низкочастотного фильтра разработан оптимизированный алгоритм фильтрации.
Разработана методика определения интегральной оценки качества восприятия слабоконтрастных документов — коэффициента бимодальности с целью сравнения результатов фильтрации различными ядрами, а также автоматизации процесса повышения эффективности ИИСОД.
Достоверность полученных результатов подтверждена экспериментальными исследованиями. Для проведения экспериментальных исследований использовались как программные средства сторонних разработчиков, так и специально разработанные для этих целей программные комплексы.
Практическая ценность работы.
Разработан алгоритм нахождения интегральной оценки качества восприятия цифровых изображений слабоконтрастных документов.
Реализованы алгоритмы нелинейной низкочастотной фильтрации цифровых изображений слабоконтрастных документов для различных ядер.
Реализован оптимизированный алгоритм низкочастотной нелинейной фильтрации прямоугольным ядром.
Разработан программный комплекс, являющийся частью программного обеспечения (ПО) ИИСОД, осуществляющий нелинейную низкочастотную фильтрацию цифровых изображений слабоконтрастных документов и позволяющий оценивать результаты фильтрации по интегральной оценке качества восприятия.
Разработан программный модуль дополнительного ПО ИИСОД для проведения низкочастотной нелинейной фильтрации прямоугольным ядром (оптимизированный алгоритм) цветных видеоизображений.
Реализация и внедрение результатов работы. Результаты диссертационной работы были внедрены в ЗАО «Репроникс» г. Тула, а также в учебный процесс кафедры ЭВМ Тульского государственного университета.
Научные положения, выносимые на защиту.
Метод нелинейной низкочастотной фильтрации цифровых изображений слабоконтрастных документов.
Принцип синтеза ядер низкочастотного нелинейного фильтра на базе функции принадлежности.
Интегральная оценка качества результатов фильтрации - коэффициент бимодальности.
Апробация работы. Основные положения диссертационной работы легли в основу докладов на следующих конференциях: 7-ая Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов (Рязань, 2002 г.); «Гагаринские чтения» - международная молодежная научная конференция (Москва, 2003, 2004 гг.); XL Всероссийская конференция по проблемам математики, информатики, физики и химии (Москва, 2004 г.); «Интеллектуальные и информационные системы» - межрегиональная научно-техническая конференция (Тула, 2004, 2005 гг.); «Интеллектуальные и
информационные системы» - Всероссийская научно-техническая конференция (Тула, 2007 г.).
Публикации. По результатам исследований опубликовано 12 научных работ.
Характеристика работы. Диссертационная работа состоит из введения, четырех разделов и заключения, изложенных на 135 страницах машинописного текста, включает 37 рисунков, 10 таблиц, список использованной литературы, содержащий 70 наименований, и 5 приложений.
Во введении обоснована актуальность темы диссертации, охарактеризован объект и предмет исследования, сформулированы цели, задачи исследования и основные научные положения, выносимые на защиту, показана научная новизна и практическая ценность полученных результатов.
В первом разделе исследованы особенности класса слабоконтрастного документа и критерии субъективной оценки качества восприятия. Проведен анализ ИИСОД, эффективность которых падает, если в качестве исходных данных используются слабоконтрастные документы. Показана общая процедура повышения эффективности ИИСОД за счет предварительного улучшения качества изображений слабоконтрастных документов. Проведен анализ существующих методов предварительного улучшения качества, который показал, что главным их недостатком является то, что они не учитывают основных особенностей класса слабоконтрастных документов. Улучшение качества восприятия цифровых изображений слабоконтрастных документов предложено достигать путем нелинейной низкочастотной фильтрации, учитывающей изменения среднестатистических характеристик по всей области изображения. Сформулированы основные требования к синтезируемому фильтру.
Во втором разделе определена математическая модель слабоконтрастного документа. В рамках модели, выявлены и формализованы основные меры качества восприятия слабоконтрастных документов, на базе которых оп-
ределена интегральная оценка качества — коэффициент бимодальности. Формализована общая процедура фильтрации. Показано, что синтезированный фильтр является нелинейным в общем случае и низкочастотным при выполнении условия нормировки. Произведена общая оценка сложности процедуры низкочастотной нелинейной фильтрации. Приведен ряд показателей, для оценки качества результатов обработки различными методами.
В третьем разделе рассмотрены вопросы формирования различных ядер фильтра и подбора оптимальных параметров фильтрации. Разработан алгоритм нахождения интегрального показателя качества по гистограмме яркости слабоконтрастного изображения. Описан принцип синтеза различных ядер фильтрации, учитывающий основные особенности слабоконтрастного документа, с использованием функций принадлежности. Исследовано влияние параметров фильтрации различными ядрами на качество восприятия слабоконтрастного документа. Исследована сложность низкочастотной Нелинейной фильтрации различными ядрами.
В четвертом разделе проведены эксперименты, подтверждающие эффективность применения разработанного метода с целью улучшения качества восприятия слабоконтрастных документов. Проведен сравнительный анализ фильтрации различными ядрами. Показано качественное превосходство предложенного метода фильтрации над ранее известными методами. Приведено описание программного комплекса, предназначенного для проведения низкочастотной нелинейной фильтрации различными ядрами. Приведено описание программного модуля, предназначенного для низкочастотной нелинейной фильтрации прямоугольным ядром цветных видео изображений.
В заключении сделаны выводы по работе.
В приложениях 1 и 2 приводятся выполненные на C++ примерные программные реализации процедуры низкочастотной нелинейной фильтрации с использованием прямоугольной и нормальной функции ядра.
В приложения 3 и 4 вынесены графические материалы для проверки гипотез о нормальном законе распределения гистограмм изображений ГП и БН и сравнения результатов фильтрации различными способами.
Приложение 5 содержит акты внедрения в ЗАО «Репроникс» (г. Тула), а также в учебный процесс кафедры ЭВМ Тульского государственного университета.
Ввод слабоконтрастных документов в информационно-измерительных системах обработки документов
В настоящее время в качестве УПЦФ широкое распространение получили сканеры изображений [14, 23]. Исходный документ представляет собой непрерывное изображение, в основе которого лежит распределение интенсивности светового потока. Формально этот описывается функцией распределения энергии Е источника излучения по пространственным координатам, длинам волн, и времени [47]: Е = /(и,Л,0, (1.2) где и - пространственная координата (и = (х,у) для двумерных изображений); Я - длина электромагнитной волны.
Энергия излучения Е пропорциональна квадрату амплитуды электромагнитного поля и поэтому представляет собой действительную положительную величину. Волны с длиной волны, находящейся в диапазоне Л. = 350ч-780нм., воспринимаются человеческим глазом и образуют спектральную область видимого излучения. Процесс дискретизации документов [3, 19, 38, 47, 70] описывается следующим образом. На вход детектора излучений, являющегося составным элементом сканера, воздействует поток энергии Е, промодулированный по пространственным координатам х, у, времени t и спектру Я: Е = f{u,X,t) = W{x,y,X,t). (1.3)
Дискретизация аргументов изображения осуществляется детектором излучения по элементам пространства X{xi,X2,..., /}, Y{yiry2,...,yz}, времени T\t\,t2 ---Jn\ и спектра h\X\,Я2,...,Яд}. При этом любой входной сигнал может быть представлен в виде дискретной матрицы N с количеством элементов: N = hz-n-K, (1.4) где / - число разложений в строке; z - число строк в поле изображения; п — число кадров; Л - число спектральных интервалов (зон или спектральных компонентов).
Процесс дискретизации в пространстве и времени как в сканирующих системах, так и в системах одновременного действия (например, фотографических) определяется параметрами разложения.
Рассмотрим процедуру дискретизации входного сигнала по спектру. При разложении излучения сложного спектрального состава на Л компонент реакция г-го спектрального излучения, принадлежащего гиперплоскости І і Ук ф] определяется выражением: Vt = \st{X)-Wj(X)-dX, (1.5) о где St{X) — функция спектральной чувствительности приемника г-го спектрального канала; Wj[X) - функция спектральной плоскости мощности излучения на входе приемников рассматриваемой гиперплоскости, которая является элементом изображения с координатами х , у в момент времени t .
Вектор = ( 2 -.- л) является цветовой характеристикой точки изображения с координатами х;, у в момент времени t .
Выбор функции St (X), а также размерность пространства цветовых характеристик Л осуществляется на основе психофизических свойств зрительной системы человека. Поэтому, в настоящее время, широкое практическое применение получила трехкомпонентная RGB-система [1,10,12,43,47,60] (A = 3,V = (R,G,B),Sl(Z) = L(A)iSl(X) = g(Z),Sl(X) = b(Z)) и однокомпонен-тая L-система (A = l,V = {L), . (/1) = / )), в которой каждая из функций S( (v) является приближением одной из функций спектральной чувствительности глаза [47, 70], определяемой экспериментально. Основной особенностью функций r(A), g(Z) и Ь(Х) является тот факт, что их максимумы приходятся на волны, соответствующие красному, зеленому и синему цвету соответственно. Функция 1(Я) является приближением функции спектральной чувствительности глаза к яркости излучения. Поэтому L-систему используют для дискретизации монохромных изображений. Цветные же изображения представляются в RGB-системе.
Наряду с RGB-системой существует множество других [47], однако для большинства систем определен однозначный переход к RGB-системе и обратно. Кроме того, изображения в RGB-системе возможно преобразовать в L-систему, что делает ее удобной как для хранения цветных, так и монохромных изображений.
Рассмотрим основные характеристики сканирующих устройств. Разрешающая способность (разрешение) — величина, определяющая точность оцифровки изображения. Разрешение принято измерять в ppi (сокр. от англ. pixels per inch) - количестве точек, получаемых при дискретизации отрезка, размером в один дюйм. В зависимости от ориентации отрезка разрешение может быть горизонтальным или вертикальным.
Глаз обычного человека не способен различать линии, нанесенные на бумагу с плотностью 10 линий на мм., что соответствует разрешению 300 ppi. Разрешающая способность современных сканеров превышает 2400 ppi.
Обобщенная модель низкочастотного нелинейного фильтра и оценка результатов фильтрации
Перед тем как перейти к описанию модели низкочастотного нелинейного фильтра следует сказать о причинах, обуславливающих его применение для улучшения качества восприятия. В п.2.2 была определена интегральная оценка качества восприятия (коэффициент бимодальности). Как видно из определения, качество тем выше, чем меньше средний коэффициент четкости, который в свою очередь представляет собой сумму среднеквадратичных отклонений значений определенных признаков изображения. Следовательно, для улучшения качества необходимо понизить среднеквадратичные отклонения. Известно, что любой низкочастотный фильтр понижает среднеквадратичное отклонение фильтруемого сигнала. Это обуславливает применение низкочастотного фильтра для улучшения качества восприятия. С другой стороны, линейные низкочастотные фильтры резко понижают среднюю контрастность сигнала, что выражается в понижении коэффициента контрастности. Это обуславливает применение нелинейного фильтра для улучшения качества восприятия документа. Кроме того, необходимо отметить, что так как качество восприятия является больше субъективной оценкой, то фильтр должен включать параметры, влияющие на качество фильтрации, которые будут задаваться оператором, осуществляющим фильтрацию.
Для осуществления фильтрации слабоконтрастного документа D зададим вектор функций превосходства Q, определенных на выделенных признаках документа. Тогда значение /-той функции превосходства между двумя произвольными точками и и v будет равно Qj(D,u,v). Определим общую процедуру нелинейной низкочастотной фильтрации как: /i(a(Aii v),a(Ai«, ,...,edto(g)(Aii,v), - (ii) I2 = r(v) = = . (2.50) KN(u,v,W) где Kft(и,v, W) — нормирующий коэффициент; A(U(A" v),&(A«,v),...,6di - ядро фильтра; W — вектор параметров фильтрации. Опишем физический смысл фильтрации. Для этого рассмотрим точку результирующего изображения к. Как видно из уравнения фильтрации характеристика в данной точке есть произведение значений ядра фильтра на характеристики точек исходного изображения, деленное на нормирующий коэффициент, т.е. ]й(Дм,,#)- (й) г(у = к) = а — . (2.51) KN(u,k,W) Обозначая р(й,Ю = "4 11 (2-52) KN(u,k,W) r = f(v = k), (2.53) выражение можно упростить до
Такая запись позволяет трактовать процедуру фильтрации следующим образом. Значение характеристики конкретной точки результирующего изображения есть взвешенное произведение характеристик исходного изображения. Причем весовые коэффициенты непостоянны и зависят от конкретной точки. Если весовые функции для всех точек результирующего изображения равны единице, т.е. то в результате фильтрации не будет происходить смещение средних значений характеристик, и что не менее важно результирующие характеристики не выйдут из множества значений характеристик исходного изображения. Так, выход характеристики из диапазона допустимых значений в ПАК ИИСОД может привести к образованию ложной характеристики, что в свою очередь негативно отразится на качестве восприятия результата фильтрации. Кроме того, при выполнении условия (2.55) результирующая характеристика будет средне-взвешенным характеристик исходного изображения, а следовательно фильтрация будет низкочастотной.
Если выполняется условие (2.55), то значения p(u,W) можно так же трактовать как меру близости качественных показателей точки и и текущей обрабатываемой точки к. Поэтому, чем меньше значение p(u,W), тем меньше важность участия точки и в формировании характеристики г (к).
Таким образом, результат фильтрации представляет собой нелинейную группировку похожих точек. На результирующем изображении это отразится в том, что точки, имеющие близкие характеристики до фильтрации, будут иметь почти одинаковые характеристики после нее.
Сравнительная характеристика фильтрации различными ядрами
Оценку качества результата фильтрации производят по некоторому критерию качества. Выше был определен обобщенный критерий - коэффициент бимодальности. Однако в связи нелинейностью фильтрации, следствием которой являются громоздкие формулы по нахождению коэффициента бимодальности для различных типов ядер, становится невозможным их формальное сопоставление или сравнение между собой. Поэтому сравнивать качество фильтрации различными типами ядер возможно базируясь только на экспертных оценках. Несмотря на это, пользуясь некоторыми соображениями, несложно выявить общие качественные различия результатов фильтрации различными типами ядер.
Рассмотрим основные различия между фильтрацией прямоугольным ядром, фильтрацией нормальным ядром и фильтрацией ядром на основе разделения гистограмм без использования интегральных функций превосходства. Как было отмечено в п.2.3, нахождение значения каждой характеристики можно трактовать как нахождение взвешенного среднего по некоторой весовой функции. При использовании прямоугольного ядра все коэффициенты данной функции постоянны, а при использовании нормального ядра - они обратнопропорциональны значениям функций превосходства признаков. Данная особенность приводит к более сильному сглаживанию границ при фильтрации прямоугольным ядром. При фильтрации ядром на основе разделения гистограмм весовая функция в каждой точке имеет более сложный вид. Если текущая точка находится в определенной окрестности точки пересечения гистограмм, то весовая функция принимает вид функции Гаусса. Если точка находится левее данной окрестности, то весовая функция является убывающей, если правее - то возрастающей. Такая особенность обуславливает слабое изменение характеристик точек, находящихся в окрестности точки пересечения гистограмм. Однако в связи с тем, что изменение контраста документа проходило неравномерно, гистограммы будут иметь сильное перекрытие, что повлечет за собой не нужное усреднение границ или же ненужное оставление зашумленностей. Для улучшения качества пользуются не общей гистограммой, а некоторой гистограммой окрестности обрабатываемой точки. Однако в этом случае из-за постоянного изменения среднего значения характеристик может возникнуть другой неблагоприятный эффект. Особенность весовых функций обуславливает высокое усреднение точек, которые находятся за пределами некоторой определенной окрестности точки пресечения гистограмм. Так как при фильтрации используется локальная гистограмма, то наличие шума на изображении БН или ГП с непостоянным средним значением приведет к неполному сглаживанию областей БН или ГП. Практически это выражается в том, что на фоне документа появляются размытые контуры, что немного снижает качество восприятия. Фильтрация нормальным и прямоугольным ядром позволяют избежать такого эффекта, так как пространственную и характеристическую области усреднения можно изменять при помощи параметров фильтрации. Другим главным преимуществом ядра на основе разделения гистограмм является адаптивность к разным локальным областям изображения и наличие лишь одного параметра фильтрации, что существенно упрощает его подбор для нахождения оптимального качества.
Основной смысл фильтрации ядром на основе интегральных функций превосходства заключается в следующем. Если между двумя точками встречается значительный перепад признака, то не зависимо от того, как близки между собой значения признаков этих точек, влияние одной точки на изменение характеристик другой в процессе фильтрации будет незначительным. Поэтому в результате фильтрации резкие перепады остаются практически неизменными, а небольшие скачки признака сглаживаются. Эта особенность является как недостатком, так и преимуществом. Если перепад обусловлен границей разделения классов, то она останется практически не тронутой. С другой стороны перепад может быть обусловлен высокочастотной помехой, которая так же останется и на результирующем изображении.
Наряду с качественным сравнением, приведем сравнение по сложности фильтрации, которая в свою очередь влияет на скорость обработки изображений. Для описываемых здесь двумерных изображений с системой кодирования цвета RGB, общая формула вычисления сложности (2.62) примет следующий вид.
Как можно заметить при фильтрации прямоугольным ядром в усреднении участвуют только те точки, которые попали в прямоугольное окно в пространственной области. С учетом этого можно значительно ускорить фильтрацию, сузив границы суммирования до прямоугольной области, с размером Щ.хЩ_.В этом случае выигрыш в сложности составит:
Оптимизация базового алгоритма низкочастотной нелинейной фильтрации прямоугольным ядром для двухмерных монохромных изображений
Посредством меню окна можно сохранять графики в текстовый файл, а так же загружать их из файла.
В правой части окна располагается список всех графиков. Кроме того, используя данный список, можно управлять отображением графиков, т.е. задать, какие графики следует отображать, а какие нет.
Графики отображаются при нажатии на кнопку «КБ» в главном окне. Помимо основных окон имеются вспомогательные. Они предназначаются для ввода пользователем параметров фильтрации и для вывода значения коэффициента бимодальное. Программное средство для проведения низкочастотной нелинейной фильтрации прямоугольным ядром видеоизображений
Временные затраты на фильтрацию оптимальным алгоритмом ННФПЯ, (п. 4.2) делают возможным его использование для фильтрации видео изображений. Программные средства обработки видео изображений обладают повышенной сложностью и требуют значительных трудозатрат. Однако современные операционные системы в ИИСОД позволяют в большой степени снизить время разработки ПО такого типа за счет использования технологий поддержки мультимедийных приложений. Реализация таких технологий производится за счет разработки отдельных модулей ОС: программных библиотек, драйверов, вспомогательного ПО и т.п. Для разработчиков ПО предоставляются библиотеки классов, функций, и программная документация, упрощающие создание приложений такого типа.
При реализации оптимального алгоритма ННФПЯ для видео изображений была использована технология Direct Show (Direct X 9.0) на базе ОС Windows ХР SP2. ПО разрабатывалось в среде Microsoft Visual Studio .NET 2003, с использованием библиотек классов и функций, входящих в пакет Direct X 9.0 SDK.
Технология Direct Show как и вся технология Direct X основана на технологии OLE и СОМ-объектов.
Ключевыми понятиями в технологии Direct Show являются: Фильтр — класс, наследуемый от интерфейса IBaseFilter, являющийся обработчиком потока данных. Каждый фильтр может содержать логические входы и выходы, которые используются для соединения фильтров между собой с целью выполнения заданного преобразования.
Граф фильтров (далее граф) - множество фильтров, соединенных между собой через логические входы и выходы.
Любой поток данных, в Direct Show характеризуется определенным типом (видео, звук и т.д.). Логические входы и выходы фильтров также содержат информацию о типе обрабатываемых данных. Эта информация используется для автоматического построения графа, с целью отображения видео или звукового файла на экране монитора, а также с целью автоматического соединения определенных фильтров между собой.
Кроме описания логических входов и выходов фильтры содержат описание параметров фильтрации, изменение которых производится через окно диалога.
Любой файл рассматривается Direct Show как поток данных, формата, определяемого расширением данного файла. Поэтому первое, что производится при автоматическом построении графа — ищется фильтр источник, т.е. фильтр, который преобразовывает информацию из файла в некоторый промежуточный формат. Затем автоматическое построение продолжается до тех пор, пока не будут использованы (если это возможно) все входы и выходы добавляемых фильтров. Причем завершающим фильтром в потоке данных как правило является фильтр отображения потока на экран или на звуковую карту. Общую структуру графа произвольного видео файла можно представить следующим образом.
Из общей структуры видно, что для реализации оптимального алгоритма ННФПЯ требуется написать модуль промежуточного фильтра. Общий принцип работы фильтров подобного рода заключается в покадровой обработке видео с учетом некоторых вспомогательных параметров. Такой класс фильтров реализован в библиотеке классов, поставляющейся в дистрибутиве Direct X 9.0 SDK. Имя данного класса CTransformFilter. Поэтому для реализации фильтра ННФПЯ будем использовать наследование от CTransformFilter. Для того, чтобы пользователь смог настраивать параметры фильтрации необходимо реализовать интерфейс пользователя через диалоговое окно. Для этого в Direct Show предусмотрен интерфейс ISpecifyPropertyPages. Изменение же параметров фильтра будет происходить через уникальный интерфейс ННФПЯ IExtBlurFilter.