Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Библиотека классов для кластеризации и распознавания топологических форм Бредихин Руслан Николаевич

Библиотека классов для кластеризации и распознавания топологических форм
<
Библиотека классов для кластеризации и распознавания топологических форм Библиотека классов для кластеризации и распознавания топологических форм Библиотека классов для кластеризации и распознавания топологических форм Библиотека классов для кластеризации и распознавания топологических форм Библиотека классов для кластеризации и распознавания топологических форм Библиотека классов для кластеризации и распознавания топологических форм Библиотека классов для кластеризации и распознавания топологических форм Библиотека классов для кластеризации и распознавания топологических форм Библиотека классов для кластеризации и распознавания топологических форм
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бредихин Руслан Николаевич. Библиотека классов для кластеризации и распознавания топологических форм : дис. ... канд. техн. наук : 05.13.11 Москва, 2007 177 с. РГБ ОД, 61:07-5/2294

Содержание к диссертации

Введение

1 Топологические формы и методы их моделирования 14

1.1. Топологические формы 14

1.1.1. Молекулярные формы в химии 14

1.1.2. Распознавание оптических образов текстов 17

1.1.3. Географические информационные системы 19

1.1.4. Морфологический анализ изображений 21

1.2. Некоторые методы моделирования топологических форм . 22

1.2.1. Графы 23

1.2.2. Гиперграфы 25

1.2.3. Мографы 28

1.3. Выводы по главе 30

2 Принцип конечной топологии, его свойства и преимущества 31

2.1. Моделирование топологического пространства с конечной топологией 33

2.2. Логические модели и их свойства 38

2.3. Методы сравнения и классификации 43

2.4. Принцип конечной топологии 49

2.5. Порождение метрики на тестовом наборе 52

2.6. Система распознавания на основе обобщенных эталонов 54

2.7. Тестовая проекция системы распознавания 55

2.8. Множества логических моделей как обобщенные эталоны . 58

2.9. Численные характеристики системы распознавания 63

2.10. Сравнительный анализ некоторых методов моделирования топологических форм 64

2.11. Выводы по главе 67

3 Описание разработанной библиотеки классов для логическо го моделирования на основе принципа конечной топологии 69

3.1. Назначение библиотеки FTLIB и ее возможности 70

3.2. Описание основных классов библиотеки 71

3.2.1. Описание шаблона класса однонаправленного списка Lst 71

3.2.2. Описание класса элемента отношения RelEl 72

3.2.3. Описание класса модели Model и особенности представления логических функций 74

3.2.4. Описание класса семейства моделей SetOfModels 76

3.3. Выводы по главе 88

4 Разработка программного обеспечения на основе созданной библиотеки классов 9

4.1. Общие принципы построения программ на основе библиотеки классов 89

4.2. Примеры программ, использующих библиотеку классов для логического моделирования 90

4.2.1. Описание разработанной программы FM-ORGANIZER 90

4.2.2. Программа XML4FM 91

4.2.3. Программа TOCR Demo 93

4.3. Экспериментальная система TOCR распознавания оптических образов текстов 99

4.4. Выводы по главе 104

5 Результаты экспериментальных исследований для заданных предметных областей 105

5.1. Логические модели молекулярных форм 105

5.1.1. Модели поверхностей уровня 105

5.1.2. Метрика или полуметрика на семействе молекулярных форм 107

5.2. Построение XML-описания семейства логических моделей 115

5.3. Распознавание оптических образов символов на основе принципа конечной топологии 118

5.3.1. Выделение скелета изображения символа и определение критических точек 119

5.3.2. Построение логической модели и введение метрики на основе метода назначения 122

5.3.3. Система эталонов, распознавание символа 124

5.3.4. Использование тестовых наборов для ускорения работы системы распознавания 124

5.3.5. Примеры распознавания 126

5.3.6. Распознавание оптических образов текстов 127

5.3.7. Исследование работы системы с различными шрифтовыми гарнитурами 134

5.3.8. Анализ характеристик предложенной системы распозна вания оптических образов текстов и сравнение ее с аналогичной системой 137

5.4. Выводы по главе 140

Заключение 142

Литература

Введение к работе

Актуальность работы

Одной из ключевых задач информатики является задача распознавания образов. Интерес к ней обусловлен существованием широкого круга задач различных отраслей науки и техники, связанных с разбиением множества объектов на классы и распознаванием класса, которому принадлежит данный объект.

В области распознавания образов сложился ряд научных школ, различающихся подходами к этой проблеме. Комбинаторно-логический подход характерен для школы СВ. Яблонского и В.Б. Кудрявцева [45, 93], берущей начало от фундаментальной работы А.И. Чегис и СВ. Яблонского о контроле электрических схем [86], первой в мировой науке работы по теории построения тестов. Алгебраический подход сформировался в работах Ю.И. Журавлева [34, 36]. Метод физических аналогий в распознавании образов оформился в теории потенциальных функций и морфологическом анализе (М.А. Айзер-ман, Э.М. Браверман, Л.И. Розоноэр, Ю.П. Пытьев) [1,59-61,122]. Особое место занимают подходы к распознаванию образов на основе нейронных сетей и параметрический подход на основе статистических свойств ансамбля классифицируемых объектов.

В настоящей работе используются методы комбинаторно-логической тео-

рий распознавания образов.

В каждом из направлений развитие теории распознаваний сопровождается обоснованием и созданием программных средств для реализации основных подходов и методов с учетом особенностей предметной области.

Данная работа посвящена обоснованию и созданию библиотеки классов для программирования задач кластеризации и распознавания топологических форм.

Топологической формой1 будем называть конфигурацию, которая состоит из определенного числа объектов, обладающих некоторыми свойствами из конечного числа свойств и участвующих в отношениях на множестве объектов. Конфигурации такого типа достаточно широко встречаются во многих областях науки и техники, среди которых стереохимия, распознавание оптических образов текстов, геоинформатика и др. И во многих случаях в связи с топологическими формами возникают задачи их распознавания и кластеризации. Однако, несмотря на то, что отдельные задачи, связанные с описанными конфигурациями, в частных вариантах решаются вполне успешно, в общем случае единые правила и методы моделирования, кластеризации и распознавания структур, названных в данной работе топологическими формами, прежде не рассматривались.

Для успешного решения задачи распознавания требуется некоторая функция расстояния на множестве пар объектов, в частности, функция, удовлетворяющая аксиомам метрики. Как правило, такая функция определяется на основе той или иной математической модели объекта, допускающей сравнение объектов и их множеств.

использованное в данной работе понятие топологических форм является обобщением понятия молекулярных форм, описанных П. Мезеем в его работах по молекулярной химии, в частности, [117]

Формирование модели конкретного объекта называют этапом его параметризации — определения набора значений характеризующих объект атрибутов. Например, часто в качестве исходных данных для параметризации используются результаты измерений геометрии объекта. В этом случае модель изображения формируется на основе вектора его размеров в некотором метрическом пространстве.

Однако подход, требующий помещения объекта в метрическое пространство, на практике оказывается не всегда эффективным. В некоторых областях применения систем автоматического распознавания рассматриваемые объекты, имея одинаковую структуру, могут существенно отличаться друг от друга по геометрическим характеристикам. Используемые для распознавания в таких условиях методы (в частности, разработанный на основе теории построения тестов СВ. Яблонского принцип конечной топологии [106, 107]) существенно отличаются тем, что основным предметом их рассмотрения является не размеры и геометрические параметры объектов, а структура объекта, взаимосвязи между его отдельными составляющими.

Таким образом, задача обоснования и создания программных средств для реализации известных методов, алгоритмов и систем распознавания топологических форм и усовершенствования этих методов является актуальной.

Цель работы

Целью настоящей работы явилось обоснование и создание библиотеки классов для программирования задач кластеризации и распознавания топологических форм. При этом ставились следующие задачи:

1. Проанализировать существующие способы моделирования топологиче-

ских форм, выявить особенности их описания и обосновать выбор методов моделирования, кластеризации и распознавания.

  1. Модернизировать известные методы принципа конечной топологии с целью повышения эффективности процессов кластеризации и распознавания.

  2. Создать структуру классов, поддерживающих описания топологических форм на основе принципа конечной топологии.

  3. Снабдить классы объектов необходимыми подпрограммами (методами) для кластеризации и распознавания.

  4. Обеспечить высокое быстродействие и эффективное использование оперативной памяти при использовании библиотеки.

Методы исследования

Для проведения исследований были использованы методы теории распознавания образов, топологии, теории построения тестов, теории решеток. При создании программного обеспечения использовались методы объектно-ориентированного программирования.

Научная новизна

Реализованная в библиотеке классов модернизированная модель топологической формы допускает несимметричность и неортогональность отношений на базовых элементах топологической формы.

Обоснован и реализован в библиотеке метод порождения метрики на множестве топологических форм путем сравнения моделей на тестовых

наборах.

Обоснован и реализован в библиотеке классов метод построения тестов для топологических форм, имеющих несущественные отличия (обобщенных эталонов).

Реализованы методы кластеризации и распознавания топологических форм.

Практическая значимость работы

Использование метрики, порождаемой сравнением моделей на тестовых наборах существенно, в несколько раз, ускоряет процедуру кластеризации и распознавания, а также сокращает объем информации об эталонах. Представление совокупности несущественно отличающихся топологических форм в виде множеств логических моделей позволяет использовать обобщенные эталоны, что повышает качество и скорость процедур кластеризации и распознавания. Разработанная библиотека классов использована при создании OCR-системы. Библиотека может использоваться также для классификации и распознавания молекулярных форм, объектов геоинформатики и в других областях. Результаты диссертации были внедрены в Центральном научно-исследовательском институте машиностроения (ФГУП ЦНИИМаш) для повышения скорости обработки целевой информации при управлении космическими аппаратами типа "Коронас-Ф" и "Канопус-В" в Российском государственном научно-исследовательском испытательном центре подготовки космонавтов им. Ю.А. Гагарина (РГНИИЦПК им. Ю.А. Гагарина) при создании программного обеспечения функционально-моделирующего стенда подготовки космонавтов, а также использованы при выполнении НИР «Инфор-

мационные технологии классификации и распознавания на основе принципа конечной топологии» и НИР «Методы реализации вычислений в конечных алгебраических структурах применительно к задачам защиты информации и распознавания образов» в МЭИ (ТУ).

Обоснованность и достоверность результатов

Результаты диссертации обоснованы с помощью известных теоретических методов, и их достоверность подтверждена экспериментально путем испытаний созданной на их основе системы распознавания оптических образов текстов.

Апробация работы

Основные результаты диссертационной работы докладывались и обсуждались на:

Шестой, седьмой, восьмой, девятой Московской международной телекоммуникационной конференции студентов и молодых ученых «Молодежь и наука», Москва, 2003, 2004, 2005, 2006;

Девятой, десятой, одиннадцатой и двенадцатой международной научно-технической конференции студентов и аспирантов «Радиоэлектроника, электротехника и энергетика», Москва, 2003, 2004, 2005, 2006;

Тринадцатой международной научно-технической конференции «Информационные средства и технологии», Москва, 2005.

Публикация

Основное содержание диссертации отражено в 13 публикациях.

Структура и объем диссертационной работы

Работа состоит из введения, пяти глав, заключения, библиографического списка, включающего 123 наименования, и приложений, содержащих 5 дополнительных рисунков. Основной текст занимает 158 машинописных страниц, в том числе 35 рисунков и 32 таблицы. Общий объем диссертации составляет 177 страниц.

Основное содержание работы

Во введении обоснована актуальность темы, сформулированы цели и основные задачи исследования, показана научная новизна и практическая значимость результатов, приведены сведения об апробации работы.

В первой главе рассматривается понятие топологических форм и приводятся примеры областей науки и техники, где возникают задачи, связанные с анализом, распознаванием и классификацией подобных конфигураций.

Также здесь дается краткий обзор некоторых методов моделирования топологических форм, таких как графы, гиперграфы и мографы.

Во второй главе рассматривается принцип конечной топологии — новый [106,107] подход к классификации и распознаванию топологических форм, согласно которому может быть осуществлено моделирование топологических форм, анализ и сравнение полученных логических моделей, а также их разбиение на классы. При этом автором снимаются ограничения на симметричность и ортогональность отношений на совокупности объектов, а также рассматривается схема сравнения не отдельных моделей, а их множеств. В главе проведено сравнение принципа конечной топологии с другими способами моделирования топологических форм и отмечено, что логические модели,

построенные на основе принципа конечной топологии, обеспечивая все необходимые функции, допускают сравнение, в отличие от других моделей, по наборам числовых параметров, а не по структурным характеристикам.

В третьей главе описывается разработанная автором библиотека FTLIB классов для логического моделирования на основе принципа конечной топологии. Приводится список возможностей библиотеки и описания основных классов.

В четвертой главе описаны различные аспекты построения программного обеспечения на основе созданной библиотеки классов FTLIB. Также здесь приведены описания программ, разработанных автором с помощью предложенной библиотеки классов.

В пятой главе приведены результаты экспериментальных исследований возможностей использования принципа конечной топологии при решении задач кластеризации и распознавания для некоторых предметных областей. Проиллюстрированы возможности библиотеки для логического моделирования на основе принципа конечной топологии, использованной для описания молекулярных форм, а также ее применение при распознавании оптических образов текстов.

В заключении приведены основные результаты работы.

Приложения содержат тексты XML-описаний, дополнительные иллюстрации, копии актов о внедрении результатов работы и текст заголовочного файла спроектированной библиотеки классов.

Распознавание оптических образов текстов

Для решения задачи распознавания оптических образов текстов, в частности, задачи распознавания образа символа как ее базовой подзадачи, необходимо выбрать некоторый способ построения модели изображения символа. То есть в основе любого алгоритма распознавания образов символов лежит задача выбора и описания характерных признаков объекта, на основе которых возможно проводить классификацию. В качестве примера способов моделирования изображения символа рассмотрим модели среднего и внешнего контура. Средний контур изображения символа получается с помощью специальных алгоритмов утончения [54], принцип действия которых схож с получением несгораемого каркаса некоторой конструкции после сжигания внешнего слоя. В результате получается скелет, отражающий структуру символа," а также некоторые характеристики фрагментов — относительные размеры и координаты характерных точек фрагментов (начало, конец и др.), площадь описанного прямоугольника, длина и тип линии.

Пример 1.3. На рисунке 1.3. приведены исходное изображение символа «Ф» (рисунок 1.3. А), а также изображение его среднего контура и пример выделения фрагментов объекта (рисунки 1.3. Б и В). Здесь в качестве элементов, характеризующих структуру символа, рассмотрены особые точки скелета — точки, в которых линии среднего контура оканчиваются или пересекаются (встречаются). Такие точки могут характеризоваться, например, количеством сходящихся в них линий. Отношения же на множестве этих точек можно определять, основываясь на самих линиях скелета: к примеру, количестве линий, соединяющих две точки, направлении этих линий, их кривизне и т.д. В результате распознавание изображения символа сводится к распознаванию топологической формы.

Помимо среднего контура для описания изображения символа можно использовать, например, внешний контур изображения. В этом случае подход к построению математической модели может быть схож с методом построения модели молекулярной формы в химии для поверхности уровня.

Пример 1.4. На рисунке 1.4. представлен внешний контур изображения символа «Р» и его разбиение на отдельные элементы структуры. В данном случае пространство, ограниченное внешним контуром, рассматривается как геометрическая область и за элементы, составляющие изображение объекта, принимаются множества из разбиения этой области, полученного, например, вертикальными и горизонтальными прямыми, проходящими через линии внешнего контура. Занумерованные слева направо и сверху вниз, ЗЇИ множества можно описать как выпуклые или нет, симметричные или асимметричные, или как фигуры из некоторого набора шаблонов. Отношения же на наборах этих множеств определяются исходя из границы между ними. Таким образом, подход, основанный на выделении внешнего контура, также позволяет свести задачу к распознаванию топологической формы.

Описанные примеры показывают, что задача распознавания оптических образов символов зачастую может быть легко сведена к задаче распознавания топологических форм.

Географические информационные системы (ГИС) [23, 44] представляют собой современные компьютерные технологии, предназначенные для картогра фирования и анализа объектов реального мира, различных событий, как происходящих, так и прогнозируемых, событий и явлений. Геоинформационные системы наиболее естественно отображают пространственные данные и объединяют традиционные операции при работе с базами данных - запрос и статистический анализ - с преимуществами полноценной визуализации и пространственного анализа, которые предоставляет картография. Эта особенность дает уникальные возможности для применения ГИС в решении широкого спектра задач, связанных с анализом явлений и событий, прогнозированием их вероятных последствий, планированием стратегических решений.

Отметим, что в картографии очень активно используется теория топологических пространств [69, 70]. Причина этого состоит в том, что изображение на карте — заведомо имеет топологическую структуру, поскольку лежит на плоскости — в топологическом пространстве. Действительно, если нарисовать карту на плоской резине, а потом растянуть её в разных направлениях, то фигуры (картографические изображения) деформируются, но отношения (связи) между их элементами останутся без изменений. Смежные линии разных фигур, как бы связанные своими концами с другими элементами, так и останутся в прежнем «виде», и лишь формы линий изменятся.

По этой причине при разработке и применении ГИС весьма активно используются топологические отношения. При этом картографические объекты обладают теми или иными свойствами, отражающими природу этих объектов, их форму, размеры.

Система распознавания на основе обобщенных эталонов

В развитие работы [52] введем следующие понятия. Проекцией модели системы распознавания (F,X) на множество Cl = {jhh, ...,jm} С {1,2,...,п} называется модель (FQ, XQ), для которой Fn = {{ai,ri),i = l,...,q}, Xn = 0s,s = l,...,t}, где а1 = (а},, ,..., ), Д5 = Щх,Щ2,...,Щт). Очевидно, взятие проекции соответствует исключению из рассматриваемых векторов всех компонент, кроме тех, номера которых принадлежат множеству Q.

Будем называть набор индексов О, тестовым набором или просто тестом для модели (F, X), если соответствующая проекция (FQ, XQ) является непротиворечивой моделью. Утверждение 2.2: Пусть Q — тестовый набор для полной непротиворечивой системы (F,X).

Тогда для произвольного вектора /, принадлежащего некоторой грани области определения (3s Є X, имеет место следующее: если / Є а\ (а\ г{) Є F, и / Є ak, (ak, rk) Є FQ, где / = (jjj,..., fjm) — проекция распознаваемого вектора на О, то П = П. Доказательство. Пусть / Є аг, (аг,г{) Є F, f Є ak, (ak,rk) Є FQ. Тогда fj = fj Є QJ = alj и /j Є a , Vj Є О. Следовательно, / Є аг П а и, поскольку / Є /5s, то /ей Пй п(и )- (2-1) Если ТІ ф rk, то (2.1) означает, что система (FQ,XQ) противоречива, но это невозможно, ибо по условию Q — тест для {F,X). Значит, Т{ — Гк, и утверждение доказано.

Из этого утверждения следует, что использование теста Q, С {1,2,... ,п} позволяет снизить размерность рассматриваемой задачи распознавания до количества элементов \Q\ в тестовом множестве, откуда автоматически возникает вопрос о поиске минимального тестового набора.

Опишем алгоритм Т построения минимального теста для системы распознавания, исходя из общего подхода к решению задачи поиска тестовых наборов, основные принципы которого были изложены в работе [93]. Пусть имеется модель (F, X) системы распознавания. 1. Для каждой пары (ар,? ) и (as,rs) обобщенных эталонов, для которых гр ф rs, построим определенные на {1,..., п} различающие функции J 1, если of Па? = 0, I 0, иначе. 2. Сформируем бинарную таблицу размером п х q (q —1)/2, где q — количество кластеров в системе, выписав в столбцы значения различающих функций для всех р, s Є {1,... ,q},p s,rp ф rs. 3. Если в построенной таблице имеются нулевые столбцы, то система противоречива, и тест для нее построить нельзя. 4. Найдем некоторое минимальное покрытие этой таблицы строками. Номера найденных строк будут соответствовать минимальному тестовому набору для системы распознавания (F,X).

Следует, однако, заметить, что найденное покрытие может не быть единственным, и различным минимальным покрытиям соответствуют разные минимальные тестовые наборы для системы распознавания.

Очевидно, алгоритм Т помимо поиска минимального теста также позволяет провести также проверку непротиворечивости системы (F,X).

Как уже упоминалось, задача нахождения покрытия двоичной таблицы является NP-трудной [78], в силу чего на практике для ее решения используются преимущественно приближенные методы. В простейшем случае можно применить «жадный» алгоритм, описанный выше.

На практике условие часто приходится иметь дело с моделями, не являющимися полными. В этом случае для классификации объекта обычно используется функция расстояния, позволяющая найти ближайший к распознаваемому вектору эталон.

В работах [52,80,82] достаточно подробно описан механизм принятия решений на основе алгоритмов распознавания частично-упорядоченных объектов. Рассмотрим на примере системы распознавания на базе принципа конечной топологии альтернативный подход, использующий метрические алгоритмы.

Описание шаблона класса однонаправленного списка Lst

В процессе работы с логическими моделями по принципу конечной топологии часто возникают ситуации, когда рассматривается набор однотипных данных, количество которых неизвестно или периодически меняется. Использование массивов для хранения таких данных в подобных случаях часто невозможно или неэкономично с точки зрения затрачиваемой памяти. Для решения задачи организации данных в таких ситуациях библиотека FTLIB включает в себя универсальный шаблон класса массива переменной длины на основе однонаправленного списка, позволяющий создавать массивы-списки с однотипными элементами произвольного класса. Следует подчеркнуть, что, в отличие от стандартного класса list библиотеки STL C++, описываемый класс ориентирован именно на работу со списком как с массивом, без акцента на свойствах однонаправленного списка как структуры данных.

В состав шаблона класса однонаправленного списка Lst входит лишь один элемент-данное — это указатель на первый элемент списка first. Кроме этого, шаблон содержит методы, описанные в следующей Таблице 3.1.

Перечисленные методы шаблона позволяют на его основе строить различные классы списков, которые находят широкое применение при реализации логического моделирования.

Согласно принципу конечной топологии, значениями логической модели на двоичных наборах, соответствующих совокупностям базовых элементов, являются номера симметричных отношений, в которые входят эти совокупности. Поэтому при построении библиотеки классов для логического моделирования удобно ввести специальный класс для описания элемента симметричного отношения — класс RelEl. Этот класс включает в себя в качестве данных степень int s симметричного отношения (количество базовых элементов в соответствующей совокупности) и целочисленный список Lst int е, состоящий из номеров соответствующих базовых множеств. Методы класса перечислены в Таблице 3.2.

С помощью описанных методов реализуется формирование необходимого набора номеров базовых множеств топологии, с которым уже ведется дальнейшая работа при построении логических моделей на основе принципа конечной топологии.

Ключевым классом в библиотеке FTLIB является класс Model, соответствующий логической модели топологического пространства. Он обеспечивает хранение пар аргументов и значений соответствующей логической функции, а также наличие методов обработки этих значений. Объекты этого класса содержат в качестве данных int п — количество базовых множеств и Lst Pair v — список ненулевых значений функции модели. Здесь Pair — простейшая структура, пара "значение-аргумент", (х,у), и список v состоит из таких пар, соответствующих аргументам и значениям представляемой логической функции, причем в этот список включены только пары, отвечающие ненулевым значениям. За счет этого достигается значительная компактность и экономичность представления логической модели, поскольку во многих случаях на большинстве аргументов логическая функция, отвечающая топологическому пространству, принимает нулевые значения.

Для работы с описанным списком аргументов и значений объекты класса содержат следующие методы. Первая группа методов образуется конструкторами и деструктором класса (Таблица 3.3). работы со значениями соответствующих моделей (Таблица 3.4). Методы класса, предназначенные для сравнения и присваивания моделей, собраны в Таблице 3.5.

Последнюю группу методов класса Model образуют методы, обеспечивающие ввод и вывод информации, содержащейся в логических моделях (Таблица 3.6).

Перечисленные методы обеспечивают все функции моделей, необходимее для работы как с отдельными моделями (получение данных, модификация, загрузка из файла и сохранение в файл, вывод на экран или принтер), так и с парами моделей (присваивание, сравнение), а также служат основой для методов более общего класса семейств логических моделей.

Класс семейства логических моделей SetOfModels является общим классом, организующим несколько рассматриваемых моделей в совокупность, с которой уже далее ведется работа как с единым целым. Этот класс служит основным классом для работы с набором данных, рассматриваемых как множество моделей топологических пространств, и все взаимодействие с организованными таким образом данными ведется через объект данного класса.

В состав объектов, построенных на основе класса семейства логических моделей SetOfModels, входят данные, собранные в Таблице 3.7.

Методы класса SetOfModels, предусмотренные для обработки описанных данных, сгруппированы по назначению. Вспомогательные методы класса обеспечивают расчеты внутри класса и выдачу информации о параметрах семейства (Таблица 3.8).

Примеры программ, использующих библиотеку классов для логического моделирования

Программная система FM-ORGANIZER предназначена для задания, хранения, редактирования, построения тестов и классификации логических моделей и их семейств.

Основным элементом интерфейса программы является главное окно (Рис.4.1), возникающее при запуске приложения и позволяющее загрузить из файла на диске или создать новое семейство логических моделей — при создании запрашивается начальное количество базовых множеств для моделей семейства и количество этих моделей.

Все действия в программе производятся с текущим семейством и с те кущей моделью этого семейства (номер которой выводится в специальном поле). Операции, которые можно производить с семейством, сгруппированы в пункте "Семейство" главного меню, а операции над текущей моделью — в пункте "Модель" (большинство из всех этих команд также продублированы кнопками в главном окне программы).

Пункт "Семейство" главного меню содержит команды, приведенные в Таблице 4.1.

Для работы же с текущей моделью семейства в пункте "Модель" главного меню предусмотрены команды, описанные в Таблице 4.2.

Отображение модели в главном окне программы возможно как в полном, так и в сокращенном (только ненулевые значения) режиме вывода, или в режиме отображения значений модели на тестовом наборе (если предварительно было проведено построение теста). Также в главном окне имеются поле и кнопка для быстрого перехода к модели семейства с заданным номером.

Таким образом, система FM-ORGANIZER в полной мере использует возможности библиотеки классов FTLIB для обеспечения задания, редактирования и хранения семейств логических моделей, а также совершения над семейством операций, предусмотренных принципом конечной топологии.

Программа XML4FM используется для автоматизированного интерактивного составления XML-документов, описывающих семейства логических моделей. Написание таких документов производится на основе XML-схемы, достроенной в соответствии с правилами, описанными в [26, 56], и приведенной в Приложении 1.

В программе предусмотрена возможность как чтения уже готовых доку ментов на описанном XML-языке или файлов семейств логических моделей, созданных в программе FM-ORGANIZER, так и создания новых семейств в интерактивном (на базе системы диалоговых окон) режиме с последующим сохранением в формате XML. Следует заметить, что в отличие от файлов семейств, создаваемых с помощью программы FM-ORGANIZER, XML-формат предоставляет возможность снабжать семейство, его модели и их элементы информационными комментариями.

Основную часть окна программы (Рис.4.2) занимает поле для отображения текста XML-файла, соответствующего рассматриваемому семейству логических моделей. Команды для редактирования семейства собраны в главном меню, наиболее важные из них также продублированы в виде кнопок быстрого доступа.

Главное меню программы содержит пункт "Файл", включающий в себя команды для работы с файлом семейства логических моделей (Таблица 4.3).

Пункт главного меню "Модель" содержит команды для работы в интерактивном режиме с текущей моделью семейства (Таблица 4.4).

Таким образом, программа XML4FM, созданная на основе библиотеки классов для логического моделирования FTLIB, является удобным и эффективным средством для формирования XML-документов, описывающих семейства логических моделей, не требующим при этом знания стандарта XML.

Окно программы (Рис.4.3) содержит, кроме главного меню и строки состояния, визуальное представление растра, в котором хранится рассматриваемое изображение символа в увеличенном масштабе, а также уменьшенную копию изображения и поле для вывода списка текущих классов толерантности. Некоторые из команд главного меню продублированы кнопками быстрого запуска.

Пункт "Файл" главного меню содержит следующие команды для работы с изображениями символов (Таблица 4.5).

Пункт меню "Распознавание" включает в себя всего две команды: команду "Средний контур", которая запускает процедуру выделения скелета изображения символа [54], и команду "Распознать", осуществляющую распознавание по специальной схеме, основанной на принципе конечной топологии.

Программа TOCR Demo позволила опробовать использование принципа конечной топологии в распознавании оптических образов символов и послужила основой для построения более мощной OCR-системы.

Похожие диссертации на Библиотека классов для кластеризации и распознавания топологических форм