Содержание к диссертации
Введение
ГЛАВА I. Общие теоретические вопросы распознавания образов применительно к решению диагностических задач .
1.1. Опыт применения распознавания образов при
поиске полезных ископаемых и в других областях. 19
1.2. Общие представления о теоретических задачах и целях 25
1.3. Классификация задач распознавания (для прямых свойств номинального типа) 29
1.4. Общая схема постановки и решения задач распознавания 36
1.5. Теоретическое обоснование этапов общей схемы постановки и решения задач распознавания 45
ГЛАВА 2. Автоматизированная система решения задач распознавания (подход к построению и реализация)
2.1. Общие вопросы построения. Требования к системе. 80
2.2. Подход к построению входного языка системы (Правила построения. Экспликация обобщенного параметрического алгоритма распознавания) 83
2.3. Синтаксис входного языка системы 89
2.4. Математическое обеспечение системы 94
2.5. Об организации информации в системе 97
2.6. Структура программного обеспечения системы .101
2.7. Семантика некоторых операций входного языка .106
ГЛАВА 3. Некоторые результаты использования автоматизированной системы распознавания образов в решении мещи-кобиологических, психологических и других задач .109
3.1. Медицинская диагностика: дифференциальный диагноз острых нарушений мозгового кровообращения III
3.2. Структура и типология иммунной системы коренного населения Крайнего Северо-Востока СССР: организация образов 134
3.3. Обработка данных о трех группах подростков: моделирование поведения 141
3.4. Применимость автоматизированной системы распознавания образов в различных областях 144
Заключение 149
Литература 155
Приложение 174
- Классификация задач распознавания (для прямых свойств номинального типа)
- Подход к построению входного языка системы (Правила построения. Экспликация обобщенного параметрического алгоритма распознавания)
- Медицинская диагностика: дифференциальный диагноз острых нарушений мозгового кровообращения
- Применимость автоматизированной системы распознавания образов в различных областях
Введение к работе
Диссертационная работа посвящена разработке методологического и теоретического обоснования методов распознавания образов, применительно к решению диагностических задач.
Полученные теоретико-методологические результаты положены в основу подхода к созданию программного обеспечения автоматизированной системы распознавания образов, использованной для решения практических диагностических задач в области медицины, психологии, геологии.
В настоящее время по проблеме распознавания проведено значительное количество исследований, представленное работами ряда специалистов, среди которых необходимо упомянуть: Айзермана М.А. [і], Александрова В.В. [2J, Бонгарда М.М. [з], Вайнцвайга М.Н. [4], Вапника В.П. [б], Васильева В.И. [б] , Воронина Ю.А. [_7-10] , Горелика Л.А. [її] , Дорофеюка А.А. [l2], Журавлева Ю.И. [l3,I4j, Загоруйко Н.Г. [I5-I8J, Ивахненко А.Г. [l9,20J, Ковалевского В.А. [21] , Лбова Г.С. [22] , Мазурова А.Д. [23] , Растригина Л.А. [24], Раудиса Ш.Ю. [25,2б], Турбовича и.Т. [27,28], Файна B.C. [29], Фомина В.Н. [ЗО], Шрейдера Ю.А. [3I,32J и других отечественных и зарубежных специалистов [33-44_].
Имея дело с конкретной задачей распознавания, обычно пытаются поставить ее, найти алгоритм для ее решения, а также оценить качество этого решения. Известны различные постановки и алгоритмы решения задач распознавания, а также способы оценки качества их решения. Нет оснований недооценивать успехи распознавания, однако можно считать, что дальнейшее продвижение в областях приложений связано с развитием теоретических представлений о задачах распознавания, включая их постановку, решение и оценку качества распознавания, с построением классификаций постановок задач распознавания, алгоритмов их решения и способов оценки качества.
Главное направление разработок по проблеме распознавания принято связывать с созданием и эксплуатацией соответствующего программного обеспечения на базе той или иной технологии разрешения этой проблемы [8,9,11,16,19,26,33,37-40,45-48]. Причем в большинстве разработок программного обеспечения во главу угла ставится "программистский" взгляд на проблему. Как правило, обращается внимание на такие аспекты, как модульность, способ планирования вычислений, наличие языка управления, особо - на низкие требования к пользователю [26,38,49-56).
Слабо разработанным является подход к созданию программного обеспечения, опирающегося на такую технологию решения задач распознавания, которая давала бы возможность выбора постановок задач распознавания, их проверки в вычислительном эксперименте и была бы ориентирована на ведущих прикладных специалистов, ожидающих от работы с программными средствами уточнения своих методоло-го-теоретических представлений. Многими ведущими исследователями подчеркивается необходимость совершенствования такой технологии, прежде всего - с точки зрения обоснования постановки задачи распознавания и строгости оценки эффективности ее решения [3,4,6,9, 11,45-47,57-59].
В связи с вышесказанным разработку автоматизированной системы распознавания следует считать актуальной проблемой.
С 1972 года автор под руководством Ю.А.Воронина и при учаетии Е.Н.Черемисиной проводил исследования по разработке так называемой новой технологии распознавания.
Распознавание обычно принято толковать как разнесение объектов исследуемого множества jt , описанных векторами значений неких свойств cL по образам Щ при условии, что задано конечное число примеров такого разнесения или материал обучения 3vQ, Множество свойств Зі измерено, как правило, в различных шкалах ( о шкалах
подробно изложено в [бо]). При детализации такого представления различные исследователи поступают различно. В новой технологии эта детализация проводится следующим образом.
Среди свойств 2i , которые приписываются объектам а из есть свойства, для непосредственного определения которых требуются большие или малые затраты времени и средств на наблюдения, высокая или низкая квалификация исследователей. Под косвенными свойствами из сі объектов а. из ж понимаются такие свойства, которые для своего непосредственного определения требуют малых затрат времени и средств, низкой квалификации исследователей. Все остальные свойства считаются прямыми. По характеру определения своих значений свойства 21 объектов а из ж делятся на объективные и субъективные. Прямые объективные свойства из Si объектов CL из 9г называются задающими образы, косвенные объективные свойства объектов называются распознающими образы, а все субъективные свойства объектов - предетавляющими образы.
Будем говорить о проблеме предсказания, когда речь идет об определении значений прямых свойств из сі объектов а из jv через их (объектов) косвенные свойства. Когда при таком определении важным является экономия времени, будем говорить о прогнозе, когда важным является экономия средств - о диагнозе. В тех случаях диагноза, при которых прямые свойства из 2L объектов а из доказываются в слабых шкалах (наименования и (или) порядка), будем говорить о слабом диагнозе. Если при этом отсутствует готовая форма математической модели, связывающей прямые и косвенные свойства объектов Ос из д, и нет возможности получить ее за счет дедуктивного вывода, то будем говорить о распознавании вообще. Если при этом прямые свойства объектов а из ж являются объективными, то будем говорить о распознавании.
Таким образом, в новой технологии распознавания используются
представления, несколько отличные от общепринятого толкования распознавания.
Распознавание ниже понимается как определение прямых свойств из сі объектов а из Ж через их косвенные свойства из 2С в фиксированный момент времени, когда речь идет только об экономии средств на измерения. Прямые свойства измеряются в слабых шкалах, прямые и косвенные свойства определяются объективно, отсутствует связывающая их математическая модель, имеется исходный эмпирический материал и общие априорные представления о характере упомянутой математической модели.
Распознавание рассматривается как сложный творческий процесс прежде всего потому, что он связан с построением математической модели, который обязательно направляется некоторыми заранее фиксированными нормативами. Предполагается, что распознавание проводится в целях, во-первых, совершенствования теоретических и эмпирических средств оперирования с а- из «ж, во-вторых, в установлении значений прямых свойств и, в-третьих, объяснения связи прямых и косвенных свойств.
В новой технологии распознавания в качестве основного норматива выступает сценарий взаимодействия пользователя и исполнителя или общая схема распознавания, введенная впервые в работе [45]. Эта общая схема опирается на особым образом фиксированные представления о задачах вообще и задачах распознавания в частности, и на представления о процессе их решения, отраженные в работах [37,61-66]. В соответствии с этой схемой процесс решения задач распознавания делится на пять стадий:
анализ задачной ситуации распознавания;
постановка задачи распознавания;
построение решения задачи распознавания, его исследование и оптимизация;
анализ качества решения задачи распознавания;
выяснение возможности повышения эффективности распознавания, объяснение результатов, вывод следствий, фиксация результатов и следствий.
Каждая из этих стадий делится на подстадии и этапы, а этапы, в свою очередь, делятся на подэтапы и операции. Важно, что при новой технологии общая схема распознавания фактически включает не одну, а несколько таких схем, ориентированных на различные классы пользователей с учетом их целевых установок, квалификации и возможностей дополнительного сбора эмпирических данных.
Все используемые общие схемы строятся из необходимости ответить на три главных вопроса:
Какие объекты а из jr имеет смысл распознавать на ЭВМ в данной ситуации, в частности, при данном материале обучения УтЬ*?
К какому образу принадлежит распознаваемый объект а из ж?
Какова надежность распознавания каждого объекта б- из jf с учетом тех или иных критериев надежности?
Необходимо подчеркнуть, что вопрос (2) строится в таком режиме, который обеспечивает наиболее рациональное использование всех, в том числе и субъективных свойств из сі объектов а из Jr и любых представлений пользователя об образах.
Вначале на основе некоторых представляющих свойств из сі объектов d из ж формулируется предварительный ответ на вопрос (2) для всех й из jf- , затем, за счет проверки гипотез, формулируется прямой ответ на вопрос (2) лишь для некоторых а из jf на основе задающих свойств из сі объектов а из Л- , а далее формулируется окончательный ответ на основе распознающих свойств из cL объектов л из Уг для всех а из Л .В первом случае мы говорим о представлении образов, во втором случае - о их задании, в третьем случае - о их распознавании. Для оценки качества задания и
распознавания образов используются в принципе разные подходы.
Существенно, что в новой технологии распознавания использование алгоритмов задания образов и алгоритмов их распознавания нормируется заранее принятыми условиями:
допустимости (соответствия некоторым общим методолого-теоретическим требованиям);
рациональности (соответствия некоторым частным теоретическим требованиям);
эффективности (соответствия эмпирическому материалу).
Придерживаясь так называемой "слабой" теории распознавания [6I,9J, которая говорит о том, когда и как можно распознавать на ЭВМ, но не говорит о том, как именно нужно это делать в конкретных ситуациях, автор считает, что в новой технологии распознавания наиболее важными являются условия рациональности, формулировка которых не должна опираться на ошибки распознавания на материале экзамена [б7].
При разработке новой технологии распознавания предполагалось, что успех распознавания зависит только от выбора распознающих свойств и мер сходства по этим свойствам [68-71]. При выборе совокупности распознающих свойств и меры сходства по этой совокупности использовались некие особые представления о типах, подтипах, модификациях и видах мер сходства. Существенно, что вопрос о выборе вида меры сходства и вопрос об оценке параметров мер сходства фиксированного вида рассматривается раздельно [б9-7і].
Предполагается, что процесс распознавания реализуется на основе заранее созданной автоматизированной системы распознавания, отвечающей новой технологии распознавания. При этом автор опирался на идеи Ю.А.Воронина и др., отраженные в ряде публикаций [46,64,72,73], в которых поднимаются и анализируются вопросы повышения успешности внедрения разработок автоматизированных сие-
тем распознавания в практику исследовательских и производственных работ. Разработка вышеупомянутой автоматизированной системы должна опираться на предварительно построенную общую схему распознавания. Эта схема рассматривается как методолого-теоретичес-кая основа автоматизированной системы распознавания. Эта основа может быть различной по числу стадий, подстадий, этапов и детальности их описания.
Известно, что задачу распознавания можно рассматривать, как задачу оптимизации, зависящую от ряда параметров (способа отыскания информативной совокупности, выбора мер сходства, выбора решающих правил и т.п.), упоминаемых в работах [6,8,27,28,30,68-70, 74 и др.!. Опираясь на вышесказанное и то , что в новой технологии фактически используется несколько общих схем распознавания, будем говорить, что общая схема может быть представлена формально классом алгоритмов распознавания или обобщенным алгоритмом. Если зафиксировать параметры задачи распознавания, то из обобщенного алгоритма можно получить некоторый частный алгоритм, соответствующих условиям фиксации. В этом смысле будем говорить об обобщенном параметрическом алгоритме. Обобщенный параметрический алгоритм рассматривается как вычислительная основа автоматизированной системы распознавания [75,76j. Эта основа может быть различной по гибкости (числу возможных вариантов проведения этапов и подэтапов), удобству (возможности представления и преобразования всех данных, включая любые промежуточные), простоте, экономичности и пр.
Автор считает, что любая автоматизированная система распознавания должна иметь явно фиксированные по определенным правилам методолого-теоретические и вычислительные основы. Сравнение автоматизированных систем распознавания предполагается, прежде всего, по методолого-теоретической основе. По вычислительной основе
- II -
имеет смысл сравнивать только такие автоматизированные системы распознавания, которые имеют почти одинаковые методолого-теоретические основы.
Создание автоматизированных систем распознавания в новой технологии распознавания понимается как многошаговый процесс. В начале создается первый вариант автоматизированной системы распознавания, назначение которого состоит, во-первых, в накоплении опыта по распознаванию на прикладных и модельных задачах, во-вторых, в разработке программ для построения второго варианта, в-третьих, в тренинге прикладных пользователей и разработчиков, в-четвертых, в выработке методолого-теоретического обеспечения стратегии построения второго варианта. Затем строится второй вариант автоматизированной системы распознавания и так далее.
Существенно, что на основе любого варианта автоматизированной системы распознавания можно получить производственную модификацию этой системы, ориентированную только на эффективное решение конкретных задач распознавания.
В данной работе новая технология распознавания рассматривается узко: имеются в виду только так называемые голотипные решающие правила [74J. Иначе говоря, предполагается, что каждый образ представляет собой в пространстве распознающих свойств совокупность "простых" компонент связности (выполнено условие локальной компактности) [77]. К автоматизированной системе предъявлены следующие требования [46,75,76]:
(I) возможность выбора различных постановок задач распознавания;
возможность экспериментальной проверки частных постановок задач распознавания;
возможность гибкого, технологичного оперирования параметрами задачи распознавания, данными;
(4) возможность накопления опыта решения задач распознавания.
В работе представлены результаты построения автоматизированной системы, удовлетворяющей требованиям (1)-(4) на базе языковой экспликации обобщенного параметрического алгоритма распознавания, ориентированного, в основном, на голотипный подход.
Из сказанного выше вытекают следующие основные цели:
Предложить методолого-теоретическое обоснование элементов новой технологии разрешения проблем распознавания, учитывающей представления о различных классах пользователей и общей схеме постановки и решения задач распознавания.
Провести теоретическое обоснование элементов новой технологии разрешения проблем распознавания.
Разработать системное и проблемное математическое обеспечение варианта автоматизированной системы распознавания, отвечающего новой технологии, снабженной входным языком и интерпретатором с него, информационно-поисковой и решающей подсистемами.
Провести численные эксперименты с системой на тестовых задачах и ее опробование на прикладных геологических, медико-биологических и психолого-педагогических задачах.
Наметить дальнейшие пути развития новой технологии разрешения проблем распознавания.
В методическом плане автор следовал общим представлениям исследования операций, а также методолого-теоретическим разработкам ведущих специалистов по проблеме распознавания, в первую очередь - Бонгарда М.М., Журавлева Ю.И., Загоруйко Н.Г. и Турбо-вича И.Г. Во многом работа опирается на результаты научного руководителя Воронина Ю.А., связанные с решением задач распознавания в геологоразведке, медицине и спорте.
Обычно в распознавании выделяют три формальных подхода: вероятностно-статистический , детерминированно-статистический и
- ІЗ -
структурно-лингвистический. При развитии новой технологии распознавания автор опирался на несколько модифицированные представления о типах формальных подходов. Если для всех распознаваемых объектов о. из указываются вероятности принадлежности ко всем образам Jri будем говорить о вероятностном распознавании. Если для всех распознаваемых объектов а изі указывается только принадлежность к одному из образов Jri будем говорить о детерминированном распознавании, если же дополнительно указываются некие показатели надежности принадлежности, то будем говорить о надежном детерминированном распознавании. Данная работа отвечает последнему подходу. Научная новизна.
1. Построены элементы новой технологии, которая ориентирована
на:
пользователей автоматизированной системы распознавания таких, которых интересует не только хорошее распознавание совокупности конкретных объектов распознавания Stp , но и уточнение методо лого-теоретических представлений о множестве распознаваемых объектов;
сложные задачи распознавания, когда заведомо известно, что совокупность косвенных свойств «J нуждается в преобразовании, материал обучения jrQ мал и может содержать ошибки распознавания;
совокупность представляющих свойств из 2L , включающую любые субъективные свойства;
объекты распознавания а;є ж, эмпирически заданные матрицами "пробы-координаты-свойства" и "срезы-время-свойства", особым образом преобразованные к векторам значений свойств;
целевые (искомые) объекты сиеЛґу составляющие незначительную часть от всех объектов.
2. Уточнена общая схема постановки и решения задач распознава-
ния в виде последовательности стадий (анализа задачной ситуации, постановки задачи, решения задачи, анализа решения задачи, повышения эффективности распознавания) и этапов.
3. Проведено теоретическое обоснование ряда этапов и стадий
постановки задачи путем:
фиксации одного класса мер сходства между объектами, описание которых представлено свойствами, измеренными в различных шкалах;
разработки критерия, позволяющего качественно оценить сложность структуры исследуемого множества $г и грубо оценить эффективность алгоритма распознавания.
Предложен обобщенный параметрический алгоритм распознавания за счет редукции класса локальных алгоритмов.
Предложена экспликация обобщенного алгоритма в виде языка с формальной грамматикой для постановки и решения задач распознавания, включающего как технологию процесса распознавания, использующую качественные и количественные критерии оценки результатов решения задач, так и основные понятия распознавания*
Построен и апробирован вариант автоматизированной системы распознавания, ориентированный на новую технологию разрешения проблемы распознавания, включающий интерпретатор с входного языка, информационно-поисковую и вычисляющую подсистемы. Этот вариант автоматизированной системы расчитан на стыковку с другими автоматизированными системами, разрабатываемыми в лаборатории "Вычислительных методов в геологоразведке" ВЦ СО АН СССР.
Практическая ценность работы состоит в том, что:
Введенные элементы новой технологии позволяют уточнить исходные условия и ограничения на стадии анализа задачной ситуации, что повышает успешность решения распознавательских задач.
Разработанный формальный язык, описывающий новую техноло-
гию разрешения проблемы распознавания, включающий основные понятия теории распознавания, облегчает проведение: численных модельных экспериментов, реальных расчетов, интенсификации обучения, а также может служить основой дальнейшего развития языковых экспликаций распознавания.
3. Построенный вариант автоматизированной системы распознава
ния:позволяет выполнять диагностические процедуры в широком спектре научно-практических приложений, уже использующих или предполагающих использование распознавания;
обеспечивает возможность создания на ее основе производственных систем, в которых фиксируется вариант алгоритма, ориентированный на эффективное решение конкретной задачи распознавания.
4. Оригинальное системное и программное обеспечение автомати
зированной системы распознавания, разработанное автором для ЭВМ
БЭСМ-б (фрагменты для ЕС ЭВМ) внедрено и используется в настоя
щее время в пяти учреждениях и организациях Академии наук, МЙНГЕО
СССР, MB и ССО РСФСР.Определенные выше возможности автоматизированной системы апробированы на некоторых частных геологических, медико-биологических и психолого-педагогических задачах. Совокупный экономический эффект от внедрения автоматизированной системы распознавания составил 190 тыс. рублей. Эффективность результатов, полученных за счет использования автоматизированной системы, отражена в справках об экономическом эффекте от использования программного обеспечения.
Связь с планами научно-исследовательских работ. Диссертационное исследование проводилось в соответствии с планами НИР Вычислительного центра СО АН СССР (в рамках темы Гос. per, № 72025901 "Разработка теории поиска полезных ископаемых на основе комплекс-
ных геологических данных"), Северо-Восточного комплексного НИИ ДВНЦ АН СССР (в рамках особо важной научно-технической проблемы 0.80.16.01.14, Постановление ГКНТ СМ СССР $ 390 от 5 ноября 1976 года и Распоряжение Президиума АН СССР № I0I03 от 31 января 1977 года, тема Гос. per. № 76084964 "Разработать и ввести в эксплуатацию автоматизированную систему обработки данных и управления научными экспериментами в области геологии в СВКНИИ ДВНЦ АН СССР"), Института биологических проблем Севера ДВНЦ АН СССР по теме "Психологические и психофизиологические особенности адаптации человека к условиям Севера", Гос. per. № 70043048.
Автоматизированная система постановки и решения задач распознавания включена, в целях дальнейшего развития, в планы НИР в рамках особо важной целевой комплексной научной программы 0.Ц.025 "Создание сети обработки и передачи данных на базе новых и развиваемых вычислительных центров коллективного пользования (ВЦКП) и вычислительных центров отраслей народного хозяйства в качестве первой очереди государственной сети вычислительных центров (ГСВЦ) и общегосударственной сети передачи данных (ГСПД)". Постановление ГКНТ, ГОСПЛАНА СССР и Президиума АН СССР от 12 декабря 1980 года $ 474/250/132. Задание 07.03.08. Тема "Разработать и ввести в эксплуатацию вычислительную систему коллективного пользования (ВСКП)". Гос. per. № 81052296. Раздел "Разработка, освоение и внедрение ППП и отдельных программ, эксплуатируемых в ВСКП".
Использование автоматизированной системы является основой для проведения машинного анализа данных в исследованиях выполняемых в Институте биологических проблем Севера ДВНЦ АН СССР по проблеме Союзного значения "Межведомственные проблемы наркологии". Темы: "Генодемографическая характеристика больных алкоголизмом на Крайнем Северо-Востоке СССР" и "Клинико-эпидемиологические характеристики для создания модели нормы и патологии при злоупотреблении
алкоголем (Постановление ГКНТ СМ СССР от 24 мая 1983 г. № 225, задание 04.02, этапы HI и НЗ).
Апробация работы. Диссертация и отдельные результаты, приведенные в ней докладывались и обсуждались на: Втором Всесоюзном симпозиуме "Математические методы в психологии и неврологии" (Ленинград, 1972), Всесоюзном совещании "Применение математических методов и ЭВМ для решения прогнозных задач нефтяной геологии" (Новосибирск, 1973), Всесоюзной конференции "Применение математических методов и ЭВМ при поиске и разведке полезных ископаемых" (Новосибирск, 1977), Второй Всесоюзной конференции по адаптации человека к различным географическим, климатическим и производстве* ным условиям (Владивосток, 1978), Первой Всесоюзной школе-семинаре "Математика в палеонтологии" (Кишинев, 1978), Шестой Всесоюзной конференции "Автоматизация научных исследований на основе применения ЭВМ" (Новосибирск, 1981), Всесоюзной конференции "Теория классификаций и анализ данных" (Новосибирск, 1981), научных семинарах ВИМС (Москва), ВСЕГЕИ (Ленинград), ВЦ СО АН СССР (Новосибирск), СВКНЙИ ДВНЦ АН СССР,ИШС ДВНЦ АН СССР (Магадан).
Публикации. Результаты исследований изложены в 19 работах (14 публикаций и 5 научно-исследовательских отчетов).
Автор защищает:
Методологическое обоснование и развитие элементов новой технологии разрешения проблемы распознавания (общей схемы постановки и решения задач распознавания, мер сходства между объектами, критерия оценки эффективности голотипных алгоритмов, не зависящего от ошибок на материале экзамена),
Разработку обобщенного параметрического алгоритма распозна^ вания, экспликацию этого алгоритма и технологии постановки и решения задач распознавания в виде языка с формальной грамматикой.
Разработку и реализацию системного и проблемного програм-
много обеспечения автоматизированной системы постановки и решения задач распознавания, отвечающего новой технологии, снабженной входным языком и интерпретатором с него, информационно-поисковой и вычисляющей подсистемами.
Основное содержание диссертации отражено в трех главах и заключении.
В первой главе рассматриваются общие методологические и теоретические вопросы построения новой технологии разрешения проблемы распознавания образов. Анализируется опыт применения алгоритмов. Вводятся представления о теоретических задачах и целях.Пред-лагается классификация задач распознавания. Описывается и уточняется общая схема постановки и решения задач распознавания. Проводится теоретическое обоснование этапов общей схемы постановки и решения задач распознавания.
Во второй главе описывается подход к созданию и реализация автоматизированной системы. Предлагается классификация пользователей и требования к системе. Излагается подход и правила построения обобщенного параметрического алгоритма и входного языка системы. Приводится синтаксис входного языка системы. Рассматриваются вопросы создания системного и проблемного программного обеспечения. Поясняется семантика операций входного языка.
В третьей главе кратко излагаются результаты решения прикладных задач. Рассматриваются вопросы применимости разработанной системы.
В заключении обсуждаются основные научные и практические результаты, пути и направления продолжения описанных в работе исследований.
В приложении приведены акты об использовании системы.
Классификация задач распознавания (для прямых свойств номинального типа)
Рассмотрим представления о квазизадаче номинального распознавания (КЗНР) _67j, необходимые для уяснения основной логической структуры распознавания (когда исключаются из рассмотрения вопросы переописания и выбора информативного описания).
Условимся толковать квазизадачу номинального распознавания так [_9,67_]. При заданных: множестве точечных объектов Лг , прямом свойстве ОІ и множестве косвенных свойств объектов J экспериментальном материале, представленном матрицей "объекты-свойства" т -Ж гДе Не J и матрицей "объекты-объекты"!Нс Ярг , ЖС-ftr б,8,41 и др.], когда прямое свойство cL непосредствеїшо измеримо в номинальной шкале почти на всех объектах CL B jf , cL-CcLj-rcLQ) , когда затраты C# и C на измерение прямого свойства cL и множества косвенных свойств на всех объектах (Xi Jh-удовлетворяют условию С,У С , a CccLy - максимальная цена ошибок распознавания cL удовлетворяет условию CccL) « С сО) , где СсО) - некоторая пороговая величина, определяемая содержательно, требуется построить алгоритмы: {І)Лі гЛ переописания, позволяющий перейти от J к сі , множество пластов-коллекторов, J - как множество их физических, химических и литологических свойств, измеряемых в процессе каротажных работ, cL - как их насыщенность углеводородами, измеряемая в процессе опробования, п - как возможные расположения пластов-коллекторов друг относительно друга (например, выше, ниже, на одном уровне, по-соседству, в отдалении) 8,ІІІ_.
Таким образом, КЗНР связана с последовательным построением трех алгоритмов A-LG Л 9Аі Л и jSfj.eJr . Суть КЗНР сводится к построению частного косвенного способа определения прямого свойства в шкале наименований, который имел бы полную область применимости, давал бы малое число не очень дорогих ошибок и требовал затрат значительно меньших, чем затраты на прямое измерение этого свойства.
Заметим, что вместо номинального распознавания можно говорить о порядковом или сильном распознавании. Эти виды распознавания отличаются лишь структурой критериев оценки качества распознавания и деталями используемых математических конструкций, но не методолого-теоретическими элементами [57,II3J.
Естественно, что можно рассматривать частные КЗНР такого ти па, когда речь идет о последовательном построении только двух алгоритмов А- & Л и! eil или А: бг$ и JV; Є Лг , считая Jbi&jk или я бгЛ заранее заданными, или только одного алго ритма , считая заранее заданными AL &А и Лі є Л . Как легко видеть, уже в простейшем случае последовательного по строения двух алгоритмов при заранее за данном алгоритме А і :j\r приходится сталкиваться с большими трудностями в постановке задачи построения алгоритма A-L A . Напомним из _1б,22,69 и др.], что при выборе информативной совокупности косвенных свойств cLc2L в общем случае оказывается необходимым: - ЗІ во-первых, задать прямое правило установления отношения предпочтения или безразличия между двумя произвольными подмно жествами косвенных свойств cL и С1д 2с(это правило должно явно опираться на качество конкретного распознавания по cij и 3.L и, следовательно, явно зависит от экспериментального мате риала , а также алгоритма ли р , по добно [69J); во-вторых, указать хорошо согласованное с прямым косвенное правило установления отношения предпочтения или безразличия между 2if и 21JI 2L (это правило не должно явно опираться на качество конкретного распознавания по cl{ и cLi) в-третьих, построить способ последовательного получения всех конкурирующих между собой подмножеств косвенных свойств diiCci,
Подход к построению входного языка системы (Правила построения. Экспликация обобщенного параметрического алгоритма распознавания)
В работе 76] отмечалось, что возможность эффективной реализации конкретной автоматизированной системы наступает тогда, когда прикладная область может быть достаточно полно описана на некотором формальном языке.
Наиболее естественным путем выделения необходимого набора элементарных понятий является анализ голотипного подхода к распознаванию образов с целью систематизации многообразия реализа - 84 ций вышеупомянутых параметров задачи распознавания и формирования в итоге обобщенного параметрического алгоритма.
Наряду с этим необходим анализ комбинаций этих понятий с учетом: исходных ситуаций, типов данных и выводимых из этих комбинаций следствий. Методологическую увязку понятий, их отношений и операций на них, разумно объединить в некоторую схему.
Дальнейшее совершенствование схемы, детализация ее пунктов позволяет более полно и эффективно перечислить необходимые понятия и их связи. При этом, механизм конструирования обобщен -ного алгоритма во многом аналогичен формированию ОСГМРР (табл. І.І). Он состоит из следующих этапов:
- редукции частных алгоритмов, реализующих элементарные формальные понятия ;
- синтеза минимального полного набора (МПН) алгоритмических элементов (некоторого приближения) ;
- выработки правил объединения алгоритмических элементов из МПН.
Таким образом, обобщенный алгоритм является построением,включающим МПН, список отношений на МПН, правил получения частных алгоритмов из МПН и отношений.
Следующим шагом экспликации обобщенного алгоритма является его представление некоторой формальной грамматикой. Осветим этот вопрос.
Исследования языков, помимо традиционно языковедческих направлений, производятся и с целью частичной их формализации [133,134]. Показано, что универсальность естественных языков, способность передать любую полезную информацию делает их "неудобными" для передачи специальной информации. Для специальных целей оказывается противопоказаным смысловое богатство естественных языков, оборачивающееся неоднозначностью, неопределен - 85 ностью и смысловыми противоречиями. Поэтому для специальных целей разрабатываются искусственные языки, адаптированные к специфическим условиям обработки, манипулирования или передачи специальных данных.
Искусственные языки частично или полностью "замкнуты", т.е. их грамматики строятся так, что фразы их однозначны и в смысловом отношении независимы от внешних для данного языка условий. В LI35J приводится деление языков на:
а) информационно-управляющие (алгоритмические - для записи команд, идущих от человека к ЭШ, для которых в основном предназначены известные формальные подходы j_I36,I37,I38j и др., реализующие идеи Хомского [l39,I40j о фразовой структуре языка ;
б) информационно-логические, формализующие понятия той или иной области знания с помощью аппарата математической логики ;
в) информационно-поисковые, предназначенные для записи, накопления и однозначной выдачи информации по запросу ; в которых лишь частично используются разработки для информационно-управ ляющих языков I4IJ и которые обычно обладают простейшей (иерархической) структурой.
Необходимый искусственный язык должен быть компромиссным между совершенно искусственным языком и естественным языком,облегчающим пользователю оперировать с первым: он должен обладать изобразительными средствами, присущими всем трем искусственным языкам [141J и отражать терминологию области. Действительно, информационно-логическая "составляющая" такого языка должна в некотором смысле содержать формализацию (для фиксированного уровня разработанности) данной предметной области. Эта задача трудна, т.к. подходы, обеспечивающие уровень формализации, достаточный для перехода к реализации информационно-логического языка на ЭШ, то есть "превращения" его, с сохранением его спе - 86 -цифики, в информационно-управляющий, лишь намечаются, например, в [142,143 j , где речь идет о хорошо формализованной области -решении уравнений в частных производных. Для наших целей необходимо не только построение логически однородного формального языка распознавания, но и учет необходимости гибкого моделирования различных постановок задач распознавания и решения практических задач по обработке данных. При всей трудности такого подхода, он является реалистичным [ I44J, и ниже предложен вариант подобного решения (языка).
Входной язык системы, являющийся формальным искусственным языком, предназначен для реализации высказываний формального языка распознавания образов, описанного в (гл.1), который в свою очередь является подъязыком языка теории поиска полезных ископаемых, основы которого заложены в Г 7 ,107,145,146] В принципе, входной язык системы можно было бы строить безотносительно к какой-либо содержательной области знания. Но практически справедливо предположение, что выделение понятий входного языка и правил построения из них более сложных понятий, не может быть проведено удачно чисто априорно, без дополнительной информации. Кроме того, оправдалось представление, что использование содержательной области позволит наложить ряд ограничений, которые несколько упростят решение проблем, указанных в (гл.1). Более того, сохраненная связь с содержательной областью позволит в дальнейшем образовать подобные связи с другими дисциплинами, готовыми или готовящимися использовать аппарат распознавания в своих целях.
В литературе, в некотором смысле обобщающей опыт по реализации и формальному созданию языков информационно-управляющего типа 136-139,147-15ij , не отражена методология построения этих языков, что лишает нас возможности учесть предшествующий опыт.
Очевидно, что построение входного языка системы может идти двумя путями: индуктивным, от Ьи логической базы алгоритмов распознавания, введенной в работах ц64,7б], и дедуктивным - от тех функциональных элементов, на которые раскладываются алгоритмы распознавания. Рассмотрим особенности этих, считающихся альтернативными, подходов применительно к нашим целям. Будем называть первый подход "базовым", а второй - "функциональным".
Базовый или индуктивный путь является более прогрессивным. Этот путь (снизу-вверх) требует хотя бы приближенно законченного языка элементарных понятий. В нашем случае констатируется заведомая некомплектность LiD : не решен вопрос об использовании в распознавании наряду с теоретико-множественными - лингвистических моделей, не исчерпаны разнообразные статистические подходы, не исключена возможность и других направлений расширения, углубления и изменения Lb . Также не определен (и не исчерпан) набор необходимых правил, позволяющих строить сложные понятия языка из более простых. Все это приводит к минимальной реализационной ценности этого пути в настоящее время.
Медицинская диагностика: дифференциальный диагноз острых нарушений мозгового кровообращения
Слово "диагноз" происходит от греческого слова aiaojiosis что значит "распознавание". Еще в ХУШ веке Бургав считал, что "кто "хорошо диагностирует - хорошо лечит" [ 174, c.IIj. Представление о качестве медицинского диагноза традиционно связывалось с искусством врача. Здесь искусством, как высшим уровнем сочетания научности и эмпиризма, считался уровень индивидуального подхода. "Диагностика, поскольку она естественно стремится индивидуализировать больных, - писал В.Ф.Чиж, - т.е. то, что теоретическое исследование хотя и стремится, но никогда не может достигнуть, - уже не научная дисциплина, а искусство" JJT74, C.22J. В связи с этим С.П.Боткин писал: "Заключение должно быть основано на возможно большем количестве строго и научно наблюдаемых фактов. Поэтому ... научная практическая медицина, основывая свои действия на таких заключениях, не может допускать произвола, иногда тут и там проглядывающего под красивой мантией искусства, медицинского чутья, такта и т.д." I74,c.22j.
Обоснование возможности применения индивидуального подхода в диагностике на базе автоматизированной системы распознавания образов для целей экстренной и надежной дифференциации острых нарушений мозгового кровообращения (НМК) было проведено нами совместно с Б.М.Дорониным [П6, I75J, Ю.А.Ворониным, А.П.Иеру-салимским, Б.М.Дорониным и А.Ф.Марасуловым J_I76j. Отметим, что выбор этой области паталогии вызван ее актуальностью: увеличивающейся частотой поражения людей всех возрастов, стойкой потерей трудоспособности или смертельными исходами в случаях промедления активных лечебных мероприятий и др. Гі77І.
Данные 450 больных по максимальному числу свойств были пере -несены на карты формальной регистрации. Их обработка проведена в научно-исследовательском режиме в соответствии с представле - из ниєм о прикладных диагностических системах, а результаты исследования стали основой действующей системы дифференциального диагноза [_177, с.4-7, табл.1 и 2J.
Основой индивидуального подхода является разделение свойств на группирующие и диагностирующие. К первым относятся такие, которые позволяют наиболее адекватно отнести данного больного к группе аналогичных больных, т.е. выявить индивидуальность больного (конституцию, жизненный путь, социально-демографические данные Г178J , состояние сознания, интервал времени от начала заболевания и др.). Ко вторым - неврологические и общесоматические симптомы.
Выбор достаточно информативной совокупности свойств (валидиза-ция теста) проводится с учетом критерия приемлемости специфических характеристик, сложившегося в данном подходе к распознаванию (см.гл.1). Была проверена обоснованность классификации признаков НМК.
Исследование связей свойств проведено на группе состоящей из 100 больных и отражающей по характеру НМК структуру всего материала обучения. Организовано 4 группы свойств: группа, характеризующая конституцию и преморбидные особенности больного ; возможные причины срыва компенсации и начала заболевания ; характеризующие начало заболевания ; группа,характеризующая течение заболевания. Группа свойств, характеризующая течение заболевания, разбита на три подгруппы: I) общемозговая симптоматика, 2) очаговая мозговая симптоматика, 3) симптоматика поражения других систем. К общемозговой симптоматике отнесены такие свойства,по которым затруднительно локализовать очаг поражения в одном из полушарий. К ней близко примыкает общесоматическая симптоматика, т.е. свойства нарушения деятельности различных систем и органов. К очаговой мозговой симптоматике отнесены свойства,кото - 114 рые позволяют локализовать очаг в одном из полушарий.
Для каждой группы подсчитаны матрицы симметричных коэффициентов связи (СКС) [_69_1 для каждой пары свойств. Для каждого свойства вычислен средний СКС с остальными свойствами группы ( 8 ) и средний СКС с остальными 90 свойствами описания больных (Н). Средние арифметические этих средних ( и Н) показывают близость свойств группы между собой и со всеми свойствами описания (табл.3.1).
Применимость автоматизированной системы распознавания образов в различных областях
В главе I отмечалось, что область поиска полезных ископаемых является научно-практическим направлением, развитие которого значительно стимулировало исследование проблем распознавания. Там же показано, что создание специализированных алгоритмов -лишь определенный этап включения распознавания в исследователь - 145 -ские комплексы на базе конкретного парка ЭВМ. Реализация обобщенного алгоритма распознавания в той или иной автоматизированной системе является следующим этапом такого включения (гл.2).
В процессе работы над реализацией системы решались некоторые частные задачи, помимо изложенных в п.п. 3.1, 3.2, 3.3.
Так, при выяснении принадлежности к пустым или продуктивным на нефть некоторых структур Лено-Вилюйской провинции экспериментальный материал был представлен структурами трех нефтегазоносных комплексов нижнеюрского , средневерхнетриасового и нижнетриасового, описанных различными геохимическими, структурно-тектоническими и литологическими свойствами так же обработаны материалы анкетирования учащихся 5-8 классов магаданских школ и выделены основные типы их зависимости от алкогольных традиций микросоциальной среды [18б.
Несмотря на определенный эффект ускорения и повышения уровня обработки больших массивов информации указанные задачи являются лишь отдельными частными примерами, в смысле использования возможностей системы.
Поэтому представляется целесообразным применение системы в наиболее сложных областях диагностики, к которым относится,например, психодиагностика. Работа в этом направлении начата, и первые результаты можно считать обнадеживающими. Оказалось,например, что результаты многостороннего исследования личности по 377 альтернативным характеристикам каждого обследованного ГІ9І » могут быть использованы для форсированной валидизации новых диагностических шкал. Начато конструирование шкалы для диагностики лево- и правосторонней межполушарной асимметрии. Эта шкала позволит во многих случаях обходиться без трудоемкой электроэнцефалографической методики.
В дополнение к известным гениалогическим методам генетического анализа оказалось перспективным использование автоматизиро - 146 ванной системы для анализа механизмов наследования некоторых особенностей поведения, улавливаемых одной из шкал упомянутого выше теста.
Для краткого изложения применимости автоматизированной системы распознавания образов необходимо отметить, что она представляет в распоряжение пользователя результат, который необходимо интерпретировать, исходя из содержательной постановки какой-либо диагностической задачи.
"Интерпретатор", представляющий содержание всех основных задач (целей) научно-практического направления, отраженных,например, в программно-целевой или других моделях, имеет возможность:
(а) управлять моделью ;
(б) давая положительную и отрицательную оценку результата распознавания, включать этот результат в систему, т.е. присваивать положительный или отрицательный опыт обучения ;
(в) при неудовлетворительном решении оставить задачу в числе нерешенных, поставив ее как проблему, для разрешения которой требуется уточнение теоретических положений, т.е. изменения как модели, так и методов диагноза.
Последнее (в) в общей форме отражает участие распознавания как диагностической процедуры в реализации научно-практических связей (комплекса).
Нет таких областей научно-практической деятельности, в которых нельзя было бы выделить класс диагностических задач. Вслед за выделением этих задач значимость применения распознавания нарастает в зависимости от:
(а) сохранения областью научно-практического интереса (цели) к объекту высокой сложности или "опредмечиванию" тех сторон и связей объекта, которые вызывают трудности в их формализации,
- 147 что находит отражение в "языке теоретика" и модели области,т.е. формулировании (и переформулировании) программно-целевой структуры, основных теоретических задач, теоретических целей и под -целей ;
(б) результативности решения старых задач и переходов к новым задачам при практической оценке результатов (совершенствования критерия практики) ;
(в) накопления в данной области положительного и отрицательного опыта решения ее диагностических задач и развития системы распознавания за счет совершенствования входного языка и технологии при адаптации системы к новым диагностическим и другим задачам, решаемым обобщенным алгоритмом распознавания.
Очевидно и неслучайно, что наиболее перспективными направлениями, в которых применение автоматизированной системы распознавания образов позволяет ожидать наибольшего эффекта, оказываются интегративные (можно сказать, "парадигмальные" [ J ) нап -равления НТР: экологическое, социологическое, психолого-педагогическое и одновременно классические области деятельности, обладающие наиболее подвижной эмпирической базой: медицина, поиск полезных ископаемых, управленческая, учебно-воспитательная и многие другие.
Стыковка теоретических разработок (фундаментальных исследований) и практики (производства, управления, обучения) получает в системе распознавания технологически гибкий, хотя и не сов -сем совершенный инструмент. Применение системы вводит во взаимодействие между теорией и практикой необходимые элементы взаимообучения и взаимоконтроля.
Сказанное не означает, что осуществление связи теории и практики с помощью той или иной системы распознавания является единственно возможным. Между тем, продвижение исследований в области решения задач: теории обучения, управляемого эксперимента, искусственного интеллекта [_17, 0,62,193-198 J и др. в той мере, в которой оно опирается на системный подход и общенаучную методологию, имеет аналогичную научно-практическую направленность. Поэтому можно утверждать, что перечисленные направления могут использовать аппарат распознавания для решения своих специфических проблем.
Похожие диссертации на Разработка автоматизированной системы распознавания образов и ее использование в решении диагностических задач