Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Классификация при неполной информации о вероятностных характеристиках классов Нагаев, Ильяс Мансурович

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Нагаев, Ильяс Мансурович. Классификация при неполной информации о вероятностных характеристиках классов : диссертация ... кандидата физико-математических наук : 05.13.16.- Уфа, 1996.- 99 с.: ил. РГБ ОД, 61 97-1/648-9

Введение к работе

Актуальность темы. Одна из ключевых проблем информатики -разработка, исследование и реализация методов синтеза при помощи обучения алгоритмических процедур преобразования и анализа информации, предназначенных для решения задач, для которых соответствующие алгоритмы неизвестны. Задачи, требующие использования таких методов, возникают в связи с обработкой и преобразованием на ЭВМ структур, образованных из символов, т.е. структур, представляющих в программах искусственного интеллекта знания о проблемной области в целом и знания, относящиеся к конкретной задаче. Несмотря на универсальность задач, эти методы стали предметом интенсивных исследований, развивались и в конце концов получили оформление в виде нескольких общих математических моделей лишь в рамках одного, хотя и весьма обширного класса задач преобразования и анализа информации - задач распознавания образов.

К настоящему времени развиты и оформлены в виде моделей несколько подходов к распознаванию: методы, основанные на близости описаний классифицируемых объектов и эталонов - детерминистский подход; вероятностно-статистические модели , используемые для решения задач в стохастических средах; логические методы, основанные на использовании логики высказываний, в частности, на аппарате алгебры логики; лингвистический подход к распознаванию, применяемый для классификации объектов со сложным структурным описанием.

Так как практически любое достаточно сложное явление или процесс содержит в себе некий элемент случайности, то вероятностное описание часто бывает вполне уместно.

В диссертации рассмотрена задача распознавания в стохастической среде в случае неравномерной изученности классов, когда вероятностные характеристики классов удается"выявить лишь для части классов.

На практике случай неравномерной изученности объектов из разных классов встречается часто. Это может быть результатом "плохой" изученности объектов из отдельных классов как следствие недостаточности примеров объектов из данного класса или сложности закона распределения объектов внутри класса. Так как традиционные статистические методы принятия решений требуют знания вероятностных законов распределения объектов внутри всех классов или их оценок, то их применение в данной ситуации невозможно. В связи с этим, на практике применяются алгоритмы, основанные на детерминистском подходе, которые не используют имеющуюся информацию о вероятностных характеристиках классов.

Поэтому возникает потребность в разработке специальных алгоритмов для случая, когда доступна информация о вероятностных характеристиках лишь для части классов.

Цель работы. Разработка, теоретическая оценка < эффективности и сравнительный анализ методов классификации при доступности информации о вероятностных характеристиках лишь для части классов с использованием вероятностно-статистической модели распознавания образов.

На защиту выносятся:

1. Два подхода к решению задачи классификации при неполной
информации о вероятностных характеристиках классов, основанные на
использовании имеющейся информации о вероятностных характеристиках
для части классов до и после классификации по правилу ближайшего
соседа.

2. Три схемы классификации с использованием предложенных
подходов.

3. Асимптотические оценки вероятностей ошибочной классификации
по каждой из трех схем в случае неограниченного объема обучающей
выборки.

4. Алгоритм выбора подмножества классов, минимизирующий
асимптотическую оценку вероятности ошибочной классификации в
рамках схемы 2.

Научная новизна.

Новыми в работе являются:

постановка и решение задачи классификации в рамках вероятностно-статистического подхода при доступности информации о вероятностных характеристиках лишь для части классов;

предлагаемые подходы к решению задачи классификации при доступности информации о вероятностных характеристиках лишь для части классов;

предлагаемые схемы классификации при доступности информации о вероятностных характеристиках лишь для части классов;

асимптотические оценки условной вероятности ошибки классификации по предлагаемым схемам при неограниченном объеме обучающей выборки;

алгоритм выбора подмножества классов, минимизирующий асимптотическую оценку условной вероятности ошибочной классификации в рамках схемы 2;

критерий выбора подмножества классов для минимизации асимптотической оценки вероятности ошибочной классификации в рамках схемы 3, позволяющий существенно упростить задачу поиска подмножества классов, минимизирующего асимптотическую оценку условной вероятности ошибочной классификации в рамках схемы 3;

сравнительный анализ предложенных схем классификации с правилом ближайшего соседа (БС) и между собой.

Практическая ценность. В работе приведен ряд примеров возможного использования результатов работы для решения практических задач -медицинской диагностики, технической диагностики и геологической разведки, дешифровки данных дистанционного зондирования Земли.

Результаты исследований были использованы при разработке программного модуля для классификации и идентификации водных объектов, который создавался в рамках НИР "Разработка и внедрение математических, программных и аппаратных средств дистанционного мониторинга" при реализации программы по созданию единой государственной системы мониторинга Республики Башкортостан (№ ГР 01960003774; Инв. № 02.9.60003721).

Результаты работы использованы в учебном процессе в УГАТУ в рамках специального курса "Распознавание образов".

Апробация работы.

Основные результаты диссертации докладывались на:

2-ой Всероссийской с участием стран СНГ конференции "Распознавание образов и анализ изображений: новые информационные технологии" (1995, г. Ульяновск),

конференции "Проблемы экологического мониторинга" (1995, г. Уфа),

Всероссийской конференции "Повышение эффективности средств обработки информации на базе математического и машинного моделирования" (Тамбов, 1995),

Всероссийской молодежной научно-техническая конференции "Информационные и кибернетические системы управления и их элементы" (1995, г. Уфа),

на городском семинаре по прикладной математике и математической физике (1996, г. Уфа),

семинарах "Модели искусственного интеллекта" кафедры ВМиК УГАТУ (1994-1996, г. Уфа).

Публикации. По теме диссертации опубликовано 7 работ.

Структура и объем работы. Диссертация состоит из введения, трех глав, заключения и приложения. Полный ее объем составляет 99 страниц машинописного текста, включая 4 рисунка на 4 страницах, 4 таблицы на 1 странице, библиографию, содержащую 40 названий.