Введение к работе
Актуальность темы. Проблема распознавания и классификации в течении продолжительного времени привлекает к себе внимание специалистов в области прикладной математики и информатики. Методы распознавания и классификации широко используются во многих областях исследовательской и практической деятельности при обработке экспериментальных данных и решении прикладных задач в слабо формализованных областях естествознания, геологическом прогнозировании, экологии, дистанционном зондировании, автоматизации научных исследований и т.д.
Становление распознавания как самостоятельной научной дисциплины характеризуется следующими этапами: создание некорректных (эвристических) методов и алгоритмов, переход в; моделям алгоритмов, исследование коллективных методов, создание алгебраического подхода к решению задач распознавания. В настоящее время развитие распознавания характеризуется широким распространением коллективных (ко-читетных, групповых) методов, предусмат риьающих решение задачи распознавния на основе результатов обработки исходной информации отдельными алгоритмами и развитием алгебраического подхода, позволяющим строить экстремальные алгоритмы, как правило, с использованием несложной математической техники.
С другой стороны для решения задпч классификации (кластеризации, таксономии, распознавания без учителя), создано большое число метолом и алгоритмов, накоплен значительный практический опыт, однако такой» качественного развития, какое наблюдается в распознавании, не произошло. Используемы,* в классификации алгоритмы и модели являются некорректными (эвристическими), а многолетний процесс развития многочисленных направлений не привел к созданию универсальных моделей, : также к формализации принципа выбора определенной модели
или алгоритма для решения соответствующей задачи.
В силу специфики постановки задачи классификации, оценить работу отдельного алгоритма, а также нескольких алгоритмов, использующих различные принципы формирования классификации, и, как правило, имеющих существенные различия в результатах, не всегда представляется возможным из-за отсутствия общего критерия, аналогичного той оценке, которая принята в распознавании, например, но доле правильных ответов на контрольном материале, вероятности ошибки или значению среднего риска. Поэтому в задачах классификации, с целью получения объективной информации о структуре анализируемой) множества, также применяются групповые (коллективные) методы, формирующие решение на основе результатов работы нескольких алгоритмов, однако такого развития, как в аналогичных задачах распознавания не имеют.
В задачах классификации проблемі» группового синтеза была сформулирована около 30 лет назад. Но существовавшие до сих нор методи были недостаточно разработаны и изучены, расчиталы на конкретный вид представления исходных классификация (информационные матрицы, матрицы смежности) и применимы, как правило, для классификации небольшого числа объектов или классификаций с малым числом классов.
Все это определяет актуальноегь дальнейшей разработки теории и применения групповых методов классификации и перспективность данного направления в теории распознавания и классификации.
В работах Айдарханова М.Б. (1),(2) были развиты подходы для решения задачи синтеза групповых классификаций опирающиеся на исследование метрических и структурных свойств пространства классификаций. Для структурного подхода к построению групповых классификаций им было введено координатное представление классификаций, которым пространство классификаций вкладывается в единичный куб и рассмотрена
метрика индуїіиропаїпі ая мегрнкоГі Хеммішга.
Лпннпя диссертации посвящена исследованию свойств пространства классификаций с данной метрикой.
Связь томы исследования с планами HWR Настоящая работа выполнялась п соответствии с плановыми темами FT И Р лаборатории распознавания и управления в экономике Института проблем информатики и управления МП-АН РК "Разработка методологии, инструментальных средств и нолмх информационных технологий создания, сопровождения и развития информационных систем" на 1991 - 1990 гг. (N гос. per. (Ш6РК00970) и "Разработка и исследование математических моделей и методов в распознавании образов и принятия решений в задачах управления" на период 1997-190» гг. (N roc. per. 0197PKG0.119).
Цель работы. Целью настоящей диссертации является теоретическая разработка естественных практических проблем задачи классификации: описание несущественных классификаций участвующих в построении групповых, исследование устойчивости групповых классификаций относительно модификаций исходного множества объектов, а также изучение покрытий области единичного куба в которую ькладывается пространство классификаций координатным представлением.
Мстодьт исследования, b работе использованы методы и аппарат теории множеств, булевой алюбры, теории структур и алгебры.
Научная новизна. Нее исследования проводились впервые и чем заключается научная новизна результатов работы. Описано минимальное покрытие области единичного куба в которую вкладывается пространство классификаций двоичным представлением и вычислен его индекс простоты, дан критерий несущественности классификаций участвуимциу. п построении групповых, получена оценка степени устойчивости групповых классификаций относительно уменьшений длины исходной выборки
объектов.
Практическая ценность. Результаты, полученные ь диссертации, могут быть использованы для нахождения несущественных классификаций ігри вычислении грушговых, при исследовании устойчивости классификаций, для оценки степени устойчивости групповых классификаций. Описанные в диссертации методы исследования классификаций были применении при решении задачи классификации іидроіеохимической информации при прогнозных оценках на рудные полотые ископаемые.
Публикации и апробация работ. Оснокные результаты работы до-кладыналисъ на Республиканской научной конференции ЛИ республики Узбекистан "Современные проблемы алтритминний", Ташкент, 199G г, Международной конференции ^Актуальные проблемы математики и математического моделирования экологических систем'', посвященной (W -летию академика Султалгазииа У.М., 199(1 г., Алмати, Международной научно-практической конференции "Современные проблемы информати ки( управления и создал и я информационных технологий и систем", г. Алмати, январь 1997 г., Республиканской научной конференции "Математическое моделирование « вычислительный эксперимент", Ташкент, 1997г., Международной научной конференции "Математическое моделирование в естественных науках", Алмати, 1!)!)7г. и опубликованы в работах список которых приведен в конца аптореферата!
Структура и объем работы. Диссертация состоит из введения, четырех глав и списка литературы с«грмншего 80 наименований. Объем основного текста 92 страницы.