Содержание к диссертации
Введение
Глава 1. Современное состояние научных исследований по распознаванию образов 11
1.1. Содержательная и математическая постановки задачи распознавания 11
1.1.1. Распознавание образов с учителем и без учителя 12
1.1.2. Признаки 13
1.1.3. Решающие правила и риск потерь 14
1.1.4. Изменчивость реализаций образов 15
1.2. Анализ современных методов распознавания образов 16
1.2.1. Классификация методов распознавания 16
1.2.2. Детерминиские методы 18
1.2.3. Статистические методы 23
1.2.4. Лингвистические методы 25
1.2.5. Нейросетевые методы 27
1.2.6. Методы с использованием теории нечетких множеств 31
1.2.7. Другие методы распознавания 36
1.3. Постановка цели и задач исследований 46
1.4. Выводы по главе 57
Глава 2. Эволюционно-аппроксимационные методы и алгоритмы распознавания динамически изменяющихся образов 58
2.1. Нейросетевой метод 58
2.2. Локальные методы и алгоритмы ...73
2.2.1. Метод коллективного распознавания 73
2.2.2. Метод с использованием элементов нечеткой логики 78
2.2.3. Методы и алгоритмы локально-аппроксимационного типа 81
2.3. Метод и алгоритм прогнозируемых эталонов 96
2.3.3. Сущность метода 96
2.3.4. Модификации метода 104
2.3.5. Критерии проверки динамичности задачи распознавания... 110
2.4. Выводы по главе 117
Глава 3. Разработка комплекса программ распознавания динамически изменяющихся образов 119
3.1. Архитектура и обобщенный алгоритм функционирования комплекса программ Uniclass 120
3.2. Подсистема универсальных программных средств комплекса программ 124
3.3. Выводы по главе 139
Глава 4. Применение эволюционно-аппроксиммационных методов распознавания динамически изменяющихся образов для решения прикладных задач 140
4.1. Автоматизированная система тестирования водителей транспортных средств «Машинист» 140
4.1.1. Архитектура и программная реализация комплекса программ TESTMACH 140
4.1.2. Результаты применения комплекса программ TESTMACH и инструкция пользователя 146
4.2. Компьютерная система поддержки принятия инновационных решений 151
4.2.1. Архитектура и программная реализация компьютерной сис темы поддержки принятия инновационных решений 151
4.2.2. Результаты применения компьютерной системы поддержки принятия инновационных решений и инструкция пользователя 154
4.3. Выводы по главе 165
Заключение 167
Литература 169
Приложения 177
- Методы с использованием теории нечетких множеств
- Метод с использованием элементов нечеткой логики
- Подсистема универсальных программных средств комплекса программ
- Результаты применения комплекса программ TESTMACH и инструкция пользователя
Введение к работе
Задача распознавания образов в своей классической постановке достаточно давно и хорошо изучена. Ее основной особенностью является неизменность во времени классов (образов) распознавания. Между тем, более естественной представляется ситуация, когда данные классы являются динамически изменяющимися, т.е. когда они эволюционируют во времени. Примерами могут служить биологические объекты (очевидно, любой человек в юности и в старости - это два совершенно разных образа и т.п.), объекты техники (если рассматривать эволюцию их развития), объекты природы (вид ландшафта и т.д.).
Методы распознавания таких динамически изменяющихся образов, если судить по изученным литературным источникам, отсутствуют. Данное обстоятельство, а также большая практическая значимость задачи распознавания, в частности, для систем поддержки принятия решений, обосновывают актуальность научной проблемы, связанной с разработкой и исследованием указанных методов.
Цели диссертационной работы. Разработать и исследовать эволю-ционно-параметрические методы распознавания образов, динамически изменяющихся во времени. Разработать быстродействующие алгоритмы и комплексы программ, реализующие математические модели эволюционно-параметрического классификатора, и позволяющих решать задачи распознавания в сложных технических и социально-экономических системах.
Применить разработанные быстродействующие алгоритмы и комплексы программ эволюционно-параметрического распознавания в системе тестирования машинистов железнодорожных локомотивов для прогнозирования функциональных возможностей человека-оператора выполнять свои функции, а также в системе поддержки принятия решений для про-
гнозирования технико-экономических показателей аппаратурно-технических средств сотовой связи с целью выбора оптимальных инновационных решений.
Для реализации указанной цели поставлены и решены следующие задачи:
анализ существующих методов распознавания образов;
обоснование и математическая формулировка задачи распознавания динамически изменяющихся образов;
определение математических условий, при выполнении которых задача распознавания образов относится к классу динамических задач,
разработка и исследование методов распознавания динамически изменяющихся образов;
разработка комплекса программ, реализующего распознавание динамически изменяющихся образов;
6) применение разработанного комплекса программ для исследования
сложных технических и социально-экономических систем.
Методы исследования в диссертации; методы классической теории распознавания образов, теории оптимизации, нечеткой логики, нейронных сетей, и методы имитационного моделирования.
Достоверность научных результатов, выводов и рекомендаций, сформулированных в диссертации, определяется корректным применением теории распознавания образов, теории оптимизации, нечеткой логики, нейронных сетей и методов имитационного моделирования.
Обоснованность теоретических разработок подтверждена, вычислительными экспериментами на персональных компьютерах (ПК) и реальными натурными экспериментами , результаты которых позволяют сделать вывод об адекватности разработанных математических моделей.
Научная новизна работы заключается в следующем.
Впервые сформулированы содержательная и математическая постановки трех типов задач распознавания динамически изменяющихся образов, которые отображают задачи классификации интерполяционного и экстраполяционного типов, а также задачу экстраполяции в область.
Сформулированы математические условия, при выполнении которых исследуемая задача распознавания должна рассматриваться как задача динамического типа.
Разработан нейросетевой метод решения данной задачи, позволяющий учитывать временную эволюцию характеристик исследуемых классов.
Предложены эволюционно-аппроксимационные метод и алгоритм распознавания динамически изменяющих образов локального типа на базе коллектива правил с использованием элементов нечеткой логики, отличающиеся от известных возможностью учета временного фактора, что позволяет более точно определять области компетенции.
Впервые разработаны методы и алгоритмы распознавания динамически изменяющих образов на основе локально-аппроксимационного подхода, которые позволяют решать задачи классификации при сложной разделяющей классы поверхности, минимуме априорной информации об исследуемой системе и незначительном объеме хранимых экспериментальных данных.
Предложен экстраполяционныи алгоритм распознавания динамически изменяющихся образов на основе прогнозирования эталонов, который позволяет исследовать динамику изменения границ и характеристик кластеров с течением времени.
Изучены свойства разработанных эволюционно-аппроксимационных методов и алгоритмов распознавания, определены области их применения, что позволяет обеспечить существенное повышение эффективности классификации.
Разработан обобщенный алгоритм функционирования программного комплекса, реализующего функции распознавателя, который характеризуется высокой степенью универсальности, что позволяет использовать его для решения задач классификации в технической и социально-экономической областях с уменьшенным риском ошибки распознавания.
На основе предложенных методов и алгоритмов с использованием среды визуального программирования BORLAND DELPHI 5.0 разработаны комплекс программ UNICLASS для решения задач динамической классификации и комплекс программ TESTMASH, обеспечивающий программную поддержку аппаратурно-программной системы тестирования машинистов железнодорожных локомотивов «Машинист».
Ю.Комплекс программ UNICLASS является универсальным классификатором и может быть использован в системах поддержки принятия решений. 11 .Проведена серия вычислительных экспериментов по проверке работоспособности комплекса UNICLASS , результаты которых показали возможность повышения качества распознавания, прогноза и принимаемых решений. 12.Эксплуатационная проверка программного комплекса TESTMASH автоматизированной тестирующей системы «Машинист» показала, что его использование позволяет повысить точность прогноза и значительно сократить время обучения системы.
Реализация результатов работы. Разработанные программные комплексы и научно-обоснованные рекомендации по их применению практически используются в системе поддержки принятия решений в ОАО «Мобильные ТелеСистемы», что позволило повысить качество принимаемых инновационных решений по развитию мобильных средств связи, и в автоматизированной системе тестирования машинистов локомотивов под-
вижного состава в Смоленском отделении Московской ж/д, что позволяет повысить уровень безопасности при эксплуатации железнодорожного транспорта . Методологические и теоретические результаты работы используются в учебном процессе филиала Московского энергетического института в г.Смоленске и Смоленской Государственной медицинской академии.
Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на 14-й Международной конференции «Математические методы в технике и технологиях» (Смоленск, 2001), 6-й Международной школе молодых ученых (Смоленск, 2001), Межвузовском семинаре « Актуальные вопросы управления техническими и экономическими системами» (Смоленск, 2001), 2-й Всероссийской конференции «Ресурсосбережение и экологическая безопасность» (Смоленск, 2001), Областной конференции « Современные проблемы энергетики» (Смоленск, 2001), также на семинарах в РХТУ им Д.И.Менделеева, филиале Московского энергетического института в г.Смоленске , Смоленской Государственной медицинской академии и Военном университете общевойсковой ПВО МО РФ.
Публикации, По теме диссертации опубликовано 16 печатных работ. В работах, написанных в соавторстве, Гимарову В.А. принадлежат все результаты, касающиеся теоретических и методических аспектов создания математических динамических распознавателей, а также результаты, относящиеся к практической реализации и применению разработанных методов распознавания.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 94 наименований и приложений. Диссертация содержит 189 стр. машинописного текста, 37 рисунков, 7 таблиц и 7 приложений.
Краткое содержание работы.
В первой главе приведена общая постановка задачи распознавания, ее понятия и определения. Рассмотрена классификация методов распознавания и проведен обзор данных методов, с использованием которого уточнена постановка задачи исследований.
Вторая глава посвящена разработанным авторам методам, алгоритмам и методикам распознавания динамически изменяющихся образов. Изложен неиросетевои подход, группа локальных методов и метод прогнозируемых эталонов.
В третьей главе приведены результаты численного моделирования и применения разработанных теоретических выводов и положений для построения ряда программных систем.
В четвертой главе рассмотрены варианты использования разработанных теоретических методов и программных средств для решения конкретных прикладных задач.
В заключении приводятся общие выводы по работе.
В приложении приведены некоторые описания использованных программных средств и акты внедрения.
Методы с использованием теории нечетких множеств
Как видно из рисунка, на нейроны входного слоя поступают входы сети, а на вход каждого нейрона последующих слоев поступают выходные сигналы всех нейронов предыдущего слоя.
Выходом сети является совокупность выходных сигналов нейронов последнего слоя; в рассматриваемом случае последний слой содержит два нейрона. Чтобы нейронная сеть могла решать поставленную задачу, ее предварительно необходимо обучить. Сущность обучения состоит здесь в определении весов и смещении нейронов при последовательном предъявлении на вход сети обучающей выборки в виде наборов значений входных сигналов хк, к = 1,2,...,N, выходы для которых (т.е. номера соответствующих образов) известны - так называемое обучение с учителем (возможно обучение и без учителя [8,20,22]).
При обучении с учителем предполагается минимизация критерия Y (характеризующего ошибку функционирования сети) путем модификации весовых коэффициентов (смещения также формально могут рассматриваться как некоторые веса для единичных входов). Обычно данный критерий задается в виде суммы квадратов и применительно к задаче распознавания имеет ви где т - число выходов сети, N - число примеров в обучающей выборке, у) - реальный у -й выход сети при подаче на ее входы к-то примера хк.
Модификация весовых коэффициентов, приводящая к минимизации J обычно производится по алгоритму обратного распространения ошибки [8,20.22], представляющему собой градиентный алгоритм минимизации нелинейной функции, учитывающий некоторые особенности функции активации вида (1.8).
Из логики нейросетевого подхода и в соответствии с теоремами о полноте [8,20] следует, что любая непрерывная функция у = F(x) на замкнутом ограниченном множестве (хеХ) может быть равномерно приближена функциями, вычисляемыми нейронными сетями (при некоторых, легко реализуемых условиях, накладываемых на функции активации сети). Таким образом, обученная нейронная сеть способна реализовывать практически любую, сколь угодно сложную, гиперповерхность, разделяющую образы, и решать задачу классификации. Как отмечалось выше, к настоящему времени известно несколько десятков различных структур нейронных сетей, способных решать указанную задачу, при этом подобные структуры реализуются как с помощью программных средств (программами-нейроимитаторами или нейросетевы-ми пакетами [26]), так и с помощью аппаратных (нейрочипы, нейроплаты, нейрокомпьютеры [23,27]). По-видимому, нейросетевой подход без каких-либо модификаций может быть использован для решения задачи динамически изменяющихся образов - для этого достаточно лишь к набору признаков (х =х1,х2,...,хп)т в качестве входного сигнала сети добавить время (т.е. ввести хп+х =t). При этом, однако, следует иметь в виду следующие недостатки такого подхода [8]: а) требуемый большой объем обучающей выборки; б) вероятность зацикливания процесса обучения; в) плохие экстраполирующие свойства (точность распознавания не гарантируется). Теория нечетких множеств и нечеткой логики имеет (как ни парадоксально) совершенно точную, четкую дату своего появления: в 1965 году Л.Заде (L.Zadeh) в журнале "Information and Control" опубликовал статью "Fuzzy Sets" ("Нечеткие множества"), которая явилась толчком к развитию новой математической теории [9,10,28-33]. Заде расширил классическое понятие множества, допустив, что характеристическая функция (функция принадлежности элемента множества) может принимать любые значения в интервале [0,1], а не только значения 0 либо 1. Такие множества были названы им нечеткими (fuzzy). Заде определил также ряд операций над нечеткими множествами и предложил обобщение известных методов логического вывода modus ponens и modus tollens. Введя затем понятие лингвистической переменной и допустив, что в качестве ее значений (термов) выступают нечеткие множества, Заде предложил аппарат для описания процессов интеллектуальной деятельности, включая нечеткость и неопределенность выражений. Это позволило создать фундамент нечетких множеств и нечеткой логики, а также предпосылки для внедрения методов нечеткого управления в инженерную практику. Математическая теория нечетких множеств позволяет описывать нечеткие понятия и знания, оперировать этими знаниями и делать нечеткие выводы. Данная теория оказывается особенно полезной, когда исследуемые процессы являются слишком сложными для анализа с помощью общепринятых методов, или когда доступные источники информации интерпретируются некачественно, неточно или неопределенно. Нечеткая логика, представляющая эффективные средства отображения неопределенностей и неточностей реального мира, ближе к человеческому мышлению и естественным языкам, чем традиционные логические системы. Применительно к задаче распознавания образов, методы указанной теории могут быть описаны следующим образом. Как переменные-признаки (хг,х2,...,хп), так и переменная-индикатор (і) принадлежности объекта х = (хх,х2,...,хп)т к одному из классов Si, рассматриваются как нечеткие (лингвистические) переменные, при этом каждой из перечисленных переменных соответствует некоторый набор термов (значений), заданных функциями принадлежности [8].
Метод с использованием элементов нечеткой логики
Последующие этапы построения и использования локально-аппроксимационного распознавателя аналогичны рассмотренным выше. Остановимся на рекомендациях по выбору параметров п, М, щ+м п. По-видимому, здесь невозможно теоретически сразу указать оптимальный порядок п, поэтому последующие рекомендации носят эмпирический характер. Так, исходя из принципа экономии, можно рекомендовать построение модели, начиная с п=\; величину М целесообразно выбирать равной (л+3)-г(я+5); весовые коэффициенты w; - - wn - равные единице или убывающие в геометрической прогрессии (возможен и подход с поиском из оптимальных значений). Если при указанном выборе число строк матрицы (базы данных модели) оказывается очень большим, сопоставимым с объемом обучающей выборки, следует увеличить п. В ряде имитационных экспериментов по изучению свойств описанной модели погрешность уменьшилась на 20-ь30% при удачном подборе весовых коэффициентов. Заметим, что обычно нескольких таких уточняющих итераций (по подбору п,М, w1 + wn) оказывается достаточным для формирования по итогам обучающего этапа итоговой матрицы обученного распознавателя умеренного размера, при котором прогностические свойства алгоритма соответствуют допустимым. Рассмотренная программная модель объектов допускает модификации, связанные, в основном, с видом локального описания, что, соответственно, приводит к изменению представления исходной матрицы данных. Например, строки указанной матрицы могут иметь вид при этом необходимо привести разности к одному масштабу. Говоря о задаче экстраполяции в область, следует отметить, что в общем случае время прогноза m не следует задавать большим, т.к. при этом точность подобного распознавания снижается. На практике в некоторых случаях ставится задача распознавания тех или иных состояний исследуемой системы, которые характеризуются значениями определенного процесса (процессов). Подобная постановка задачи предполагает, что в распоряжении исследователя может находиться только одна реализация некоторого процесса, хотя, возможно, достаточно большой длительности. В этом случае рассматриваемая проблема «идеологически» близка к классической задаче экстраполяции значений процесса. В то же время цели исследования - распознавание текущей ситуации путем ее отнесения к некоторому классу, входящему в состав алфавита, и качественного прогнозирования ее развития, а также динамичность характеристик, определяющих указанные классы, создают предпосылки для использования методов распознавания динамически изменяющихся образов. Нетрудно показать, что подобные задачи могут быть сведены к задачам экстраполяции в область, однако, учитывая единственность наблюдаемого процесса, обучающую выборку надо формировать следующим образом. Сначала вся имеющаяся реализация делится на несколько равных интервалов, при этом начало каждого интервала считается нулевой точкой (например, в качестве точки отсчета можно выбрать первый день года, недели и т.п.). Далее предположим, что ставится задача прогнозирования состояния системы на один шаг вперед. Тогда обучающая выборка будет содержать строки вида: где индекс «г» определяет принадлежность значения процесса к г -му периоду. Как показали расчеты на основе реальных данных (некоторые из которых приведны в главе 3),на практике при выборе п можно ограничиться числом 1-3, так как при увеличении данного показателя резко возрастают вычислительные проблемы, не приводя при этом к заметному снижению ошибки распознавания. Заметим, что сформировав указанным образом обучающую выборку, можно использовать как метод локальной аппроксимации, так и нейросе-тевой подход. В завершение параграфа подчеркнем общие черты и различия рассмотренных локальных методов. Два первых из них (метод коллективного распознавания и нечеткий метод) в явном виде используют идею разбиения области определения признаков на подобласти, в каждой из которых используется достаточно простая, в частности, не учитывающая динамику изменения образов, модель распознавателя. И для одного, и для другого метода алгоритм распознавания задается совокупностью (набором) некоторых правил, только в методе коллективного распознавания разбиение области определения признаков является четким, и имеется однозначное соответствие между подобластями и правилами, а в нечетком методе подобное разбиение является нечетким (размытым), и с каждой подобластью в той или иной степени связаны одновременно несколько (нечетких) правил. Для обоих методов правила формируются, исходя из накопленного опыта, т.е. по данным обучающей выборки данных из временного отрезка [0,Т], поэтому экстраполяционные свойства методов невысоки.
Локально-аппроксимационный метод, в отличие от двух предыдущих, не предполагает разбиения исходной области определения признаков на подобласти. Используемая в нем локальная область пространства признаков является «плавающей», и ее положение (да и размеры) зависят от значения признаков предъявленного объекта. Поскольку локальная модель здесь имеет вид регрессии, по экстраполяционным свойствам данный метод существенно превосходит метод коллективного распознавания и нечеткий метод (что иллюстрировано рассмотренными примерами).
Между тем, хорошие прогнозирующие свойства моделей регрессии дают возможность предложить метод распознавания динамически изменяющихся образов, изложенный ниже и названный автором методом прогнозируемых эталонов.
Подсистема универсальных программных средств комплекса программ
В результате проведенного исследования был разработан ряд прикладных и моделирующих программ, вошли в состав комплекса программ Uniclass , выполняющего функции универсального классификатора. Указанные программы по своему функциональному назначению условно могут быть разделены на универсальные и специализированные. К универсальным можно отнести программные средства, реализующие указанный подход без привязки к решению какой-либо конкретной практической задачи, а к специализированным - предназначенные для решения конкретных задач. В рамках данной главы представляется целесообразным рассмотрение универсальных программ. Разработанные специализированные программные средства будут подробно описаны в главе 4.
Используемые вычислительные средства: персональные компьютеры (ПК) класса Pentium, операционная среда - Windows 95/98, системы программирования - MathCAD 8.0 PRO, MathCAD 2000 PRO и DELPHI 5.
Однако вначале рассмотрим принципы построения и алгоритмы, используемые при реализации общего программного комплекса Uniclass, позволяющего решать любую из трех сформулированных выше задач распознавания (интерполяции, экстраполяции в область и прогноза), используя при этом наиболее подходящий для этого (с учетом определенной априорной информации) метод.
Модуль «Интерфейс пользователя» обеспечивает взаимодействие пользователя с рабочими блоками программного комплекса, при этом интерфейс обеспечивает диалог на уровне пользователя, возможно, не знакомого с используемыми в составе комплекса алгоритмами и методами распознавания образов.
В зависимости от вида и содержания имеющейся априорной информации об исследуемой системе или предметной области комплекс программ осуществляет подбор наиболее подходящего алгоритма статической или динамической классификации с точки зрения минимизации риска ошибки распознавания. Заметим, что комплекс программ Uniclass позволяет решать задачи классификации как статического, так и динамического типов. В статическом случае для относительно простых задач, для которых порядок гипотетической разделяющей классы поверхности невелик, результат применения программного комплекса Uniclass, работа которого основана на разработанных в диссертации методах и алгоритмах, по точности будут близки к результатам, которые могли быть получены в случае применения уже существующих подходов. Однако если гипотетическая разделяющая классы поверхность имеет более сложный вид, то даже при решении задач распознавания статического типа точность предлагаемых подходов (как было показано в предыдущих главах) будет значительно выше по сравнению с применением «классических» методов распознавания образов. Для выбора соответствующего метода распознавания образов в состав программного комплекса входит «Модуль анализа условий поставленной задачи». В функции данного модуля входит проверка динамичности задачи распознавания.
Для реализации разработанных подходов к решению задачи распознавания динамически изменяющихся образов предлагается построение обобщенной программной системы, включающей в себя основные методы и функционировавшей согласно алгоритму, вид которого приведен на рис.3.2.
Блок 1 предполагает ввод исходной базы данных, которые были накоплены в ходе наблюдения за исследуемым объектом (группой однотипных объектов). Заметим, что формат представления исходных данных должен соответствовать либо форматам, представленным в таблице 2.1 (или таблице 2.2) для задач распознавания интерполяционного или экстраполяционного типов, либо формату таблицы 2.3 для задач экстраполяции в область. В то же время программа при помощи простейших преобразований может сама соответствующим образом группировать исходные данные в соответствии с поставленной задачей.
В рамках второго блока алгоритма осуществляется проверка динамичности задачи распознавания, для чего может использоваться некоторая априорная информация о характере изменчивости образов, а также результаты проверки по критериям динамичности, сформулированным в диссертации.
После определения задачи распознавания (блок 4) на основании полученных в предыдущей главе результатов выбираются те или иные методы распознавания (блоки 5, 7-10), которые предлагается оформить в виде автономных программ в составе описываемой программной системы. Для выбора наиболее эффективного метода распознавания в рамках блока 11 осуществляется сравнение полученных результатов (оценивается средняя ошибка распознавания), в ходе которого выбирается и рекомендуется для дальнейшего использования тот или иной тип модели. Проверка качества построенных моделей производится при помощи контрольной выборки, представленной в формате исходной базы данных, при этом обычно исходная база данных изначально делится на две части, одна - используется для построения модели, другая - для проверки. В результате функционирования программной системы формируется программный распознаватель, представленный в виде, соответствующем выбранному методу.
Результаты применения комплекса программ TESTMACH и инструкция пользователя
Для решения задач динамического распознавания экстраполяционного типа в случаях, если гипотетическая разделяющая поверхность может быть описана регрессионной зависимостью большого порядка, лучше использовать методы локальной аппроксимации. Если же число коэффициентов регрессии относительно невелико (4-6), то можно использовать метод прогнозируемых эталонов.
Неоспоримым преимуществом метода прогнозируемых эталонов является возможность описания классификатора в виде явных математических зависимостей, что позволяет в определенной степени понять природу и закономерности исследуемой предметной области.
Говоря о программе PROG, можно отметить следующее. Разумеется, для ее реализации можно было использовать более укрупненные процедуры пакета MathCAD 2000 PRO, однако предлагаемая версия позволяет, во-первых, сделать алгоритм более доступным для изучения, и, во-вторых, облегчить в дальнейшем реализацию данного модуля на языке прикладного программирования (например, DELPHI).
Программа CLASMOD (версия 1.0). Программа CLASMOD 1.0 является универсальным классификатором, в том смысле, что позволяет решать любую из сформулированных выше задач распознавания объектов произвольной природы. В основе алгоритма программы лежит локально-аппроксимационный подход, который, как было показано выше, позволяет с высокой степенью эффективности решать указанные задачи. Программа CLASMOD 1.0 может использоваться либо в составе общей программной системы как один из альтернативных вариантов решения задачи, либо в качестве автономного программного модуля. Алгоритм функционирования программы в наиболее общем виде представлен на рисунке 3.8. Первый блок алгоритма предусматривает ввод исходной обучающей выборки в виде таблицы значений, формат которой определяется заданным типом задачи распознавания. Если исходная база данных вводится не в соответствующем формате, то при помощи операций, структурно входящих в состав блоков 2 и 3, осуществляется перевод указанной информации в требуемую форму. Программа предусматривает два варианта задания средней ошибки распознавания. Первый вариант предполагает ввод максимально возможной величины ошибки пользователем. В этом случае если заданная точность в результате построения модели не будет достигнута (и при этом использовались все исходные данные), то программа делает запрос на ввод дополнительной информации, и если таковая отсутствует, то выдается сообщение о том, что классифицирующая модель не может быть построена с заданной степенью точности. При выборе второго варианта допустимое значение ошибки распознавания не задается пользователем, а определяется по результатам построения модели. Если определяемая таким образом точность не удовлетворяет пользователя, то необходимо либо ввести дополнительные данные, либо использовать другой подход к моделированию, представленный в составе обобщенной программной системы. Как было показано, для определения степени достоверности величины средней ошибки распознавания используется некоторая вероятность ju, величина которой может либо задаваться, либо вычисляться автоматически в ходе построения модели (блоки 4 и 5). Реализация метода локальной аппроксимации предполагает задание числа ближайших узлов М и вида локальной зависимости (блок 5). Однако если программу применяет пользователь, не имеющий опыта работы в соответствующей предметной области и не знающий основных положений метода, требовать от него определения отмеченных элементов нельзя. Для решения данной проблемы в программу введен блок 6, который позволяет осуществить подбор оптимального (с точки зрения минимума ошибки распознавания) сочетания числа М и вида локальной модели. Разумеется, ввод запрашиваемой программой информации (или хотя бы ее части) позволяет значительно сократить время расчетов, которые производятся на этапе построения модели, что является весьма желательным при использовании системы для классификации быстро изменяющихся образов (прогноз состояния больного, находящегося в критическом состоянии, и т.д.). Однако во многих случаях, с учетом того, что процедура построения конкретной модели осуществляется обычно один раз (хотя алгоритм позволяет реали 138 зовать процедуру адаптации), объем и время, затрачиваемое на расчеты, не имеют сколько-нибудь решающего значения. Блок 10 «Использование модели» предполагает, что итоговая база модели сформирована (и заданная точность достигнута). Процедура использования модели включает в себя ввод характеристик классифицируемого объекта с последующим отнесением его к тому или иному классу. Следует отметить, что полученные в ходе моделирования локальные зависимости (или хотя бы их вид) имеют определенную научно-практическую ценность, т.к. позволяют понять суть и основные зависимости, характеризующие исследуемые явления. В Приложении П.2 приведены некоторые из окон программы CLASMOD 1.0, реализованные на языке DELPHI 5.0. Программа проста в обращении, и, как уже упоминалось, не требует от пользователя каких-либо специальных знаний как о природе классифицируемых объектов, так и о структуре и принципах функционирования программы. Назначение кнопок или зафиксировано в явном виде, или интуитивно понятно пользователю, тем более что при наведении на них курсора мыши в строке статуса высвечивается соответствующая подсказка. Работа с интерфейсом программы максимально упрощена. Так, например, при определении входов рядом с названием кнопок можно поставить "галочку" в квадратике простым щелчком мыши, а для выбора выхода - либо двойным щелчком мыши, либо воспользовавшись клавишей переноса. Все построенные модели (представленные в виде сформированных соответствующим образом баз данных) сохраняются на дискетах, в локальных сетях и могут быть доступны в рамках функционирования какой-либо корпоративной системы.