Введение к работе
Актуальность темы и цель работы. Исследование задач продолжения (экстраполяции) функций является одним из традиционных и важнейших направлений математики, в рамках которого получены как многие теоретические результаты, так и разработаны эффективные методы решения прикладных проблем. Аналогом этого направления в современной информатике выступает область, известная как распознавание, восстановление эвристических зависимостей или обучение по прецедентам. Этот раздел науки развивается с середины 50-х годов, и в настоящее время можно говорить о его установившихся особенностях по сравнению с конструкциями традиционной математики, которые приводят к необходимости диалоговых методов анализа информации.
Первая особенность, которую следует отметить, состоит в том, что описание объектов, явлений или ситуаций, для решения которых синтезируются алгоритмы распознавания, представляют собой, как правило, очень сложные конструкции. В лучшем случае это числовые векторы очень большой размерности (порядка нескольких десятков или даже сотен). Часто компоненты описания имеют нечисловую природу. Они могут быть графами, фрагментами изображений и т.д. Иногда на компонентах описаний объектов могут быть заданы отношения типа порядка, близости, толерантности и т.д. Эта особенность приводит к необходимости для исследователя при решении задач
-2.-
раслознавания и даже, более того, при самом начальном этапе их исследования пытаться представить себе ситуацию в той или иной наглядной форме.
Далее рассмотрим вторую особенность, которая приводит к необходимости разработки специальных методов визуализации и обеспечения адекватного диалога при решении и исследовании проблем распознавания. Эта особенность состоит в том, что современные подходы к решению задач распознавания позволяют строить решения практически во всех возможных ситуациях. Поэтому вопрос об оценке качества решения оказывается чрезвычайно важным, поскольку для сложно описанных объектов в пространствах очень большой размерности используются мощные методы настройки, которые гарантированно позволяют строить корректные алгоритмы, т.е. алгоритмы точные на прецедентах. Но при этом немедленно возникает вопрос о том, какой из возможных способов решения, включающих в себя выбор модели, методов настройки параметров и семейства корректирующих операций следует предпочесть в той или иной ситуации. Эта Еторая особенность связана напрямую с существенной некорректностью задач распознавания в общематематическом смысле, поскольку мы имеем лишь частичную информацию о подлежащих анализу классах, объектах, ситуациях и явлениях и не можем дать точный ответ на вопрос о том, какой из алгоритмов следует предпочесть в данной конкретной ситуации.
И, наконец, третья особенность, существенная для обучения методам распознавания. Поскольку современные метода
распознавания ориентированны на технически трудный анализ сложно описанных объектов, то вопрос об обучении специалистов в данной области также должен включать в себя элементы синтеза адекватных в том или ином смысле представлений для ситуаций, с которыми приходится работать, и для методов решения, которыми приходится пользоваться.
Итак, обоснованием проведения настоящего исследования являются слоекость пространства описания исходных объектов, необходимость получения представления о соответствии структуры областей постоянства значений, порождаемых построенными алгоритмами, и структуры областей, которые определяются прецедентами, и необходимость выработки у специалистов в области распознавания интуитивных представлений о способах работы тех или иных алгоритмов распознавания и методов их настройки.
Приведенные положения являются основными в обосновании темы предлагаемой работы.
Из сказанного вытекают цели работы:
1. Создание методики построения плоских визуальных образов
конечных точечных метрических конфигураций, т.е. наборов
описаний объектов о заданными попарными расстояниями
между ними.
2. Разработка технологии построения плоских представлений
разделяющих гиперповерхностей, порождаемых алгоритмами
распознавания.
3. Проведение экспериментальной проверки разработанных
методов на модельных и реальных данных.
-4.-
Научыая новизна. Работа является первой и пока единственной в области разработки методов визуального анализа начальной информации в задачах распознавания и алгоритмов их решения. Все полученные в ней результаты являются новыми.
Практическая значимость. Результаты ориентированы на использование при анализе слокной прецедентной информации, подборе адекватных алгоритмов распознавания и при обучении специалистов в области распознавания образов. Разработанные методы уже использовались при анализе медицинской (токсикологической) и социологической информации в Вычислительном центре РАН, Институте' проблем прогнозирования АШ и в Ситуационном центре Президента РФ.
Апробация работы и публикации. Результаты работы докладывались и обсуждались на viі-конференции "Математические методы распознавания образов" (Пущино, 1995 г.), на научных семинарах Вычислительного центра РАН, на научно-методическом семинаре кафедры информатики и дискретной математики МШУ им.В.И.Ленина (май 1ЭЭ5 г.).
Структура и объем работы. Диссертация состоит из введения, четырех глав и списка литературы (51 наименование) Объем работы - 92 страницы машинописного текста.
АЕтор выражает глубокую признательность есєм сотрудникам кафедры информатики и дискретной математики ЖГУ им. В.И.Ленина за их доброжелательное отношение к его работе в года учебы в аспирантуре и на завершающем этапе. Чувстео глубочайшей благодарности автор выражает своим научным руководителям академику РАО Матросову Виктору Леонидовичу и академику РАШ Рудакову Константину Владимировичу, которые с огромным вниманием и терпеливостью относились к написашію автором реферируемой диссертации. .
- є -