Введение к работе
Актуальность темы. Классификационные системы являются эффективным средством исследования сложных объектов при априорной неопределенности. Применение методов распознавания образов позволяет прогнозировать закономерности изучаемых явлений и процессов на основе накопленной информации.
Методы классификации и средства их реализации в виде систем диагностики, оценки и управления качеством изделий, автоматизации обработки разнообразной информации нашли в последнее десятилетне широкое распространение в народном хозяйстве н научных исследованиях.
Большой вклад в формирование теории распознавания образов внесли работы М. А. Айзермана, Т. В. Андерсона, Ю. Л. Барабаша, М. М. Бонграда, Э. М. Бравермана, М. Н. Вайнцвапга, В. Н. Вапнпка, Д. М. Грина, Л.Девроя, Р.О.Дуда. Л.Дьерфп. Ю.П.Журавлева, Н. Г. Загоруйко, Т. М. Ковера, Г. С. Лбова. Т. Мэрнла, Л. А. Растрпгина, К. С. Фу, П. Е. Харта, Я. 3. Цыпкина, А. Я. Червопенкнса и других ученых.
Методы размытом классификации и распознавания можно рассматривать как развитие традиционных алгоритмов на условия принятия решений, приближающиеся к естественным. Основными источниками необходимости введения нечеткого описания в задачах распознавания являются:
ограничения на ресурсы моделирования (временные, стоимостные), не-позволяющне получить в принципе существующую четкую информацию и вынуждающие воспользоваться знаниями экспертов, которые выражаются в виде нечетких инструкций относительно распределения объектов по классам;
случайный характер сигнала, что обусловлено наличием различного рода помех на этапах съемки и передачи сигнала (погрешности измерения, связанные с реакцией человека, разрешающей способностью прибора и т.п., неоднородные характеристики канала передачи и т.д.);
то обстоятельство, что "большинство реальных классов размыты по своей природе в том смысле, что переход от принадлежности к непринадлежности для этих классов скорее постепенен, чем скачкообразен" (цитируя Л. А. Заде).
В настоящее время особую актуальность приобретают проблемы синтеза и анализа распознающих алгоритмов для решения задач, занимающих промежуточное положение между традиционными задачами классификации (распознавание образов и автоматическая классификация), способных эффективно работать в условиях неполной пли неоднозначной информации об исследуемых сложных объектах.
Известны работы /Дж. Беждек и др., 1981/, в которых излагаются раз личные подходы к построению алгоритмов автоматической классификации имеющих целью определение степенен принадлежности объ'-гг?- классам размытым множествам. Применение прикладной теории нечетких м но жесті при решении задач управлення связано с работами С. А. Орловского /1981/ С. А. Дубровского, В. X. Кайлова. А. А. Селюгнна /1985/. Менее разработан иымп являются нечеткие алгоритмы распознавания образов, хотя первы< результаты в этом направлении были получены еще в 60-е годы /Л. А. Заде 1968, А. Н. Борисов, 1969/. Их дальнейшее развитие связано с работам! А. Н. Борисова /1989/. К. В. Кириллова, Ю. П. Пытьева /1995/. Среди совре менных публикаций можно отметить работу Л. П. Бородкппа и О. Е. Стад пика /1985/, где формулируется наиболее близкая предлагаемой в данно работе постановка задачи распознавания размытых образов, в которой пр линейном виде разделяющей поверхности нечеткие определения классов ВВС дятся при формировании критерия ошибки распознавания образов.
Исследуемый в настоящей работе подход пепользуег нечеткие указанії "учителя" о распределении объектов обучающей выборки по классам пр восстановлении функций принадлежности сигнала размытым образам и оспе вывается на мегодах непараметрпческоп статистики, что позволяет обоПт проблему детальной формулировки математической модели путем статисті ческой интерпретации исходной информации.
Распознавание образов с позиции "пепдеалыюго учителя" отража< объективно существующую неоднозначность в описании обьектов и позвол ет учитывать знання "неуверенного эксперта", тем самым повышается эффе; тнвность использования априорной информации, расширяется круг решаемь задач.
Учитывая важность решения проблемы сокращения размерности в з дачах классификации, рассматриваются методы повышения вычпелнтелык эффективности алгоритмов распознавания образов путём преобразован! исходной информации на основе выявления пространственных закономерн стей расположения классов.
Диссертационная работа выполнена в соответствии с программ! "Технические университеты России", раздел "Интеллектуальные пнформац онные системы" при поддержке Красноярского Краевого Фонда Науки.
Цель работы: разработка и исследование непараметрических метод классификации в условиях "неидеального учителя", охватывающих пробле.ч синтеза и анализа эффективных алгоритмов распознавания образов, мннпм зацмн описания п их применения в системе прогнозирования уровня фи: ческой подготовленности студентов.
Цель достигается путем решения следующих задач:
разработка и исследование непараметрпческнх алгоритмов распознавания образов при нечетких указаниях "учителя";
создание высокоэффективных структурно-аналитических методов минимизации описания в задачах классификации статистических данных больших объемов, обеспечивающих максимальный учет априорных сведений;
программная реализация предложенных алгоритмов и их применение при прогнозировании уровня физической подготовленности студентов на базе информационном компьютерной системы "Здоровье", внедренной в Красноярском государственном техническом университете.
Методы исследования. Для решения поставленных задач использовался аппарат непараметрпческой статистики, теории классификации, теории нечётких множеств и теории графов, методы коллективных решений и статистического моделирования.
Научная новизна диссертации состоит в постановке и решении нетрадиционной задачи распознавания образов в условиях сложной структуры классов нечеткой природы на основе неоднозначных указании "учителя".
В отличии от существующих в этом направлении разработок предлагаемый подход основывается на априорном знании функций принадлежности классам обьектов обучающей выборки и имеет целью построение размытого решающего правила, выявляющего степень принадлежности распознаваемого сигнала размытым образам.
Предложен оригинальный структурно-аналитический метод минимизации описания в задачах распознавания образов и исследованы его свойства в зависимости от объема и размерности исходных статистических данных.
Практическая ценность.
-
Разработано алгоритмическое и программное обеспечение решения задач класспфпкацпп с "непдеальным учителем" с использованием которого создана система прогнозирования уровня физической подготовленности студентов. На этой основе специалистами лаборатории "Мониторинг здоровья" Красноярского государственного технического университета разработаны методики укрепления здоровья и повышения физической подготовленности студентов вузов.
-
Научные и практические результаты диссертационной работы могут быть использованы:
- при прогнозировании в условиях неполного описания объекта задачи; исследовании объектов сложной структуры, когда неоднозначная принадлежность выделенным классам является объективным свойством; оценке возмож-
ных траекторий изменения состояний развивающихся систем с дискретным временем;
- при создании высокоэффективных методов распознавания образов и классификации в условиях больших выборок; разработке и исследовании алгоритмов выбора наиболее информативных признаков, отличающихся низким уровнем эвристики и базирующихся на графовых методах выявления закономерностей локализации классов; разработке и программной реализации средств повышения наглядности и качества интерпретации результатов классификации.
Защищаемые тезисы.
-
Нетрадиционная математическая постановка задачи распознавания образов в условиях "неидеального учителя";
-
Непараметрические методы классификации статистических данных при "нендеалыюм учителе", вычислительные аспекты их применения и свойства;
-
Структурно-аналитические методы минимизации описания в задачах распознавания образов на основе графовых преобразований исходной информации, результаты исследования показателен их эффективности и свойства;
-
Статистическая модель прогноза уровня физической подготовленности студентов на основе функциональных параметров организма при нечетком определении классов;
-
Результаты прогнозирования физической подготовленности студентов.
Реализация результатов работы. Разработанная методика распознавания образов (РО) в условиях неоднозначных указаний "учителя" и программное обеспечение внедрены при обследовании студентов Красноярского государственного технического университета, Красноярского государственного торгово-экономического института и Томского государственного университета.
Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на научно-технической конференции с международным участием "Проблемы техники и технологий XXI века" (Красноярск, 1994), VIII Международным Симпозиуме по непараметричеекпм и робастным методам в кибернетике (Красноярск, 1995), Всероссийской конференции с международным участием "Математические методы распознавания образов -7", посвященной 60-летню академика РАН Ю. И. Журавлева (Пущино на Оке, 1995), Всероссийской конференции с международным участием "Распознавание образов и анализ изображений. Перспективные информационные технологии" (Ульяновск, 1995), Межрегиональной конференции "Проблемы
информатизации региона" (Красноярск, 1995), Региональной конференции "Экологическое состояние и природоохранные проблемы Красноярского края" (Красноярск, 1995), межвузовской научно-методической конференции "Новые технологии обучения и реализация, государственного образовательного стандарта в технических вузах" (Красноярск, 199*5), городск$й конференции "Проблемы информатизации города" (Красноярск, 1995), II Сибирском Конгрессе по Прикладной и Индустриальной Математике (Новосибирск, 1996).
Публикации. По теме диссертации опубликовано 13 печатных работ. Личный вклад автора в публикациях соответствует основным положениям, выносимым на защиту.
Структура и объем работы. Диссертационная работа представлена на 140 страницах машинописного теста, иллюстрируется 36 рисунками п 24 таблицами и состоит из введения, 4 глав, заключения, списка литературы из 149 наименований и приложения.