Содержание к диссертации
Введение
1. Анализ информационных процессов, систем и моделей принятия решений при нечетких исходных данных 11
1.1. Способы учета факторов неопределенности и субъективности в процессе принятия управленческих решений 11
1.2. Использование нечетких множеств для описания ситуаций и представления знаний экспертов в задачах принятия решений 18
1.3. Анализ информационных процессов, систем и моделей нечеткого логического вывода 25
1.4. Выводы по главе 1 34
2. Разработка метода и алгоритма многокритериального выбора управленческих решений при нечетких исходных данных 36
2.1. Методы и алгоритмы многокритериального выбора лучших решений...36
2.2. Разработка метода и алгоритма многокритериального выбора решений с учетом нечетких предпочтений нескольких экспертов 47
2.3. Оценка эффективности процедуры многокритериального выбора решений с учетом нечетких предпочтений нескольких экспертов 54
2.4. Выводы по главе 2 67
3. Разработка классификационной модели и метода принятия решений на основе нечеткого распознавания ситуаций 69
3.1. Виды классификационных моделей принятия решений и их особенности 69
3.2. Этапы построения классификационной модели и метода принятия решений на основе нечеткого распознавания ситуаций 76
3.3. Разбиение множества нечетких описаний ситуаций на классы 82
3.4. Отыскание эталонного представителя класса нечетких ситуаций 91
3.5. Выводы по главе 3 101
4. Применение методов выбора и принятия решений при управлении производственным предприятием ... 102
4.1. Необходимость учета в моделях принятия решений специфики деятельности предприятий 102
4.2. Применение классификационного метода для распознавания текущего состояния предприятия 107
4.3. Многокритериальный выбор лучшей альтернативы при управлении производственным предприятием 117
4.4. Компьютерная поддержка процедур выбора лучших решений 125
4.5. Выводы по главе 4 130
Заключение 132
Библиографический список 134
Приложения
- Использование нечетких множеств для описания ситуаций и представления знаний экспертов в задачах принятия решений
- Разработка метода и алгоритма многокритериального выбора решений с учетом нечетких предпочтений нескольких экспертов
- Этапы построения классификационной модели и метода принятия решений на основе нечеткого распознавания ситуаций
- Применение классификационного метода для распознавания текущего состояния предприятия
Введение к работе
Актуальность темы. Наличие эффективных методов принятия решений (ПР), основанных на использовании современных информационных технологий, является определяющим фактором при управлении сложными системами. Выбор лучшего решения осуществляется в условиях неполноты информации, невозможности все строго рассчитать и проанализировать, а также множественности мнений о целях, критериях, их предпочтительности. На современном этапе объект научного исследования дополняется лицом, принимающим решения (ЛПР), предпочтения которого необходимо учитывать в процессе ПР. Особую значимость приобретают исследования по развитию и совершенствованию методов обработки экспертных знаний.
Эти обстоятельства привели к необходимости разработки методов и инструментария поддержки ПР, учитывающих фактор неопределенности и субъективности. Одна из наиболее важных задач организации успешного процесса ПР состоит в предоставлении средств для оперирования с нечеткой, размытой информацией, учета точек зрения различных участников этого процесса, позволяющих генерировать и оценивать варианты решений (альтернативы) в кратчайшие сроки.
Весьма актуальной является автоматизация процессов ПР на основе повышения уровня интеллектуальности используемых моделей и методов.
Теоретические и практические предпосылки настоящего исследования составили фундаментальные и прикладные работы ученых в области нечетких множеств и нечеткой логики для представления знаний и данных (А.Н. Аверкин, Р.А. Алиев, И.З. Батыршин, Р. Беллман, Л.С. Берштейн, А.В. Боженюк, А.Н. Борисов, Л.А. Заде, А. Кофман, А.Н. Мелихов, А.П. Рыжов, Б.Н. Тарасов, В.И. Финаев, Д.И. Шапиро, P.P. Ягер), теории ПР и ранжирования альтернатив (Л.Г. Евланов, О.И. Ларичев, Е.М. Мошкович, А.О. Недосекин, С.А. Орловский, А.Б. Петровский, Т.Л. Саати, Э.А. Трахтенгерц, Ф. Херрера), искусственного интеллекта (Д.А. Поспелов), рационального поведения и субъективности при решении задач управления (Г.Б. Клейнер, Г.А. Саймон), классификационных методов ПР на основе нечеткого распознавания (В.Д. Баронец, Л.С. Берштейн, Р. Гонсалес, В.П. Карелин, СМ. Ковалев, А.Н. Мелихов, Дж. Ту, А.Н. Целых).
В связи с возрастающей сложностью и динамичностью решаемых задач в условиях неполноты сведений об исследуемых объектах, происходит адаптация широко известных методов ПР к нечетко-числовым исходным данным. Однако они не в полной мере соответствуют природе социально-технических систем и информационной ситуации, в которой применяются.
Многие из методов многокритериального выбора достаточно сложны, не обеспечивают полноту сравнений, не учитывают все множество критериев или же оценка альтернативных вариантов ведется только по числовым или нечисловым критериям. При выборе лучшего решения недостаточно внимания уделено проблеме учета предпочтений ЛПР, информации о важности экспертов для ЛПР при одновременном сохранении множественности критериев, также имеющих различную значимость.
В классификационных методах ПР важной проблемой является отыскание эталонных представителей классов, наличие которых ускоряет распознавание сложившейся ситуации, а значит и выбор лучшего решения. Особенно актуальными представляются задачи разбиения множества ситуаций на классы и нахождения эталонных представителей классов, когда ситуации описаны нечеткими множествами второго уровня.
В связи с этим возникает потребность в создании более удобных и достаточно надежных методов многокритериального выбора лучших решений на основе обработки экспертных знаний и нечеткого распознавания ситуаций.
Объект исследования: автоматизация процесса обработки экспертных знаний и принятия решений.
Предмет исследования: методы обработки экспертной информации и выбора лучших решений в условиях нечеткости и многокритериальности.
Цель и задачи исследования. Целью диссертационного исследования является разработка методов и алгоритмов ПР на основе экспертных знаний и предпочтений ЛПР, нечеткого распознавания ситуаций.
Поставленная цель определяет следующие основные задачи диссертационного исследования:
1. Рассмотрение неопределенностей, возникающих при ПР, математических формализмов для их учета в методах ПР и механизмов нечеткого логического вывода, используемых в интеллектуальных системах поддержки принятия решений (ИСППР).
2. Анализ способов учета предпочтений ЛПР и экспертов, методов многокритериального выбора и ПР на основе обработки экспертных знаний, выявление их достоинств и недостатков.
3. Разработка метода ранжирования многокритериальных альтернатив, учитывающего критерии различной природы, на основании нечетких предпочтений экспертов и ЛПР.
4. Развитие классификационных методов ПР, позволяющих ускорить нахождение лучшего решения, когда ситуации на объекте управления описываются нечеткими множествами.
5. Разработка метода формирования эталонного представителя класса нечетких ситуаций.
6. Программная реализация разработанных методов.
7. Применение разработанных методов ПР к решению конкретных практических задач.
Методы проведения исследований базируются на использовании теории и методов выбора и ПР, аппарата теории нечетких множеств и нечеткой логики, методов интеллектуального анализа данных (получение информации от экспертов, ее преобразование и использование), теории нечеткого распознавания ситуаций и их классификации, проектирования систем поддержки принятия решений (СППР) с нечеткой логикой. Научная новизна работы заключается в следующем:
1. Разработан метод ранжирования многокритериальных альтернатив, который, в отличие от известных, позволяет находить лучшее решение при многих разнородных критериях с учетом мнений нескольких экспертов и информации о важности экспертов для ЛПР.
2. Предложен способ представления нечетко описанной ситуации «репрезентативным вектором» (РВ), элементами которого являются «репрезентативные числа», характеризующие входящие в описание ситуации нечеткие множества1. Такое числовое представление ситуаций является более компактным по сравнению с описанием нечеткими множествами.
3. Разработана процедура кластеризации множества нечетко описанных ситуаций, позволяющая за счет использования РВ упростить разбиение множества ситуаций на классы.
4. Предложен и обоснован метод формирования эталонного представителя класса нечетких ситуаций, основанный на использовании РВ ситуаций данного класса.
На защиту выносятся:
1. Метод ранжирования многокритериальных альтернатив, учитывающий субъективные оценки и предпочтения нескольких экспертов и их различную важность для ЛПР.
2. Способ представления нечетко описанной ситуации «репрезентативным вектором», элементами которого являются «репрезентативные числа», характеризующие входящие в описание ситуации нечеткие множества.
3. Процедура кластеризации множества нечетко описанных ситуаций, позволяющая упростить разбиение множества ситуаций на классы.
4. Метод формирования эталонного представителя класса нечетко описанных ситуаций, отличающийся меньшей трудоемкостью по сравнению с известными методами отыскания медианы Кемени.
5. Применение разработанных методов, процедур и алгоритмов для сравнения и выбора многокритериальных альтернатив (решений) и распознавания сложившихся ситуаций при управлении производственным предприятием.
Теоретическая и практическая значимость результатов исследования.
1. Предложенный метод многокритериального выбора и ПР позволяет учесть больше количественной и качественной информации, полученной от экспертов и ЛПР, и тем самым повысить эффективность принимаемых решений.
2. Предложенный и научно обоснованный способ более компактного представления в виде РВ нечетко описанных ситуаций позволяет уменьшить трудоемкость на всех этапах построения и применения классификационных моделей ПР.
3. Получены оценки, доказывающие понижение трудоемкости предложенных методов по сравнению с известными.
4. Разработанные методы многокритериального выбора и ПР на основе экспертных знаний и нечеткого распознавания ситуаций реализованы программно и используются в учебном процессе и на производственных предприятиях.
5. Предложенные методы многокритериального выбора, кластеризации множества нечетко описанных ситуаций, формирования эталонного представителя класса ситуаций могут пополнить базу моделей и механизмы нечеткого логического вывода для интеллектуализации СППР.
Разработанные методы, способы и алгоритмы дополняют существующие разработки в данной области и расширяют сферу их использования, что подтверждает их практическую значимость, а научная новизна и теоретическое обоснование предложенных методов подтверждает их теоретическую значимость.
Достоверность результатов вытекает из их математического обоснования, подтверждается оценками трудоемкости и корректным применением известных и апробированных математических методов, подтверждается результатами вычислительных экспериментов, практическим использованием на предприятиях.
Использование результатов работы. Отдельные результаты диссертационного исследования приняты к использованию в деятельности промышленных предприятий г. Таганрога (ОАО ТКЗ «Красный котельщик», ОАО «ТАГМЕТ», ОАО «Стройдеталь»), используются в учебном процессе ТИУиЭ в курсах дисциплин «Математика (математические методы и модели)», «Математические модели в теории управления и ИСО», «Информационные технологии управления», что подтверждается документами об использовании результатов исследования.
Апробация работы. Основные результаты и выводы диссертационной работы докладывались и обсуждались на IV и V Международных научно-практических конференциях «Проблемы регионального управления, экономики, права и инновационных процессов в образовании» (г. Таганрог, 2005 г., 2007 г.); VI — IX научно-практических конференциях преподавателей, студентов, аспирантов и молодых ученых (г. Таганрог, 2005-2008 гг.); VI Международной научно-практической конференции «Методы и алгоритмы прикладной математики в технике, медицине и экономике» (г. Новочеркасск, 2006 г.); Международной научно-технической конференции «Математические модели и алгоритмы для имитации физических процессов» (г. Таганрог, 2006 г.); VII Международной научно-практической конференции «Компьютерные технологии в науке, производстве, социальных и экономических процессах» (г. Новочеркасск, 2006 г.); на Конференции лауреатов и стипендиатов Международного научного фонда академика Н.П. Федоренко (г. Москва, 2006 г.). Отдельные результаты работы по направлению исследования «Информационные технологии» были отмечены стипендией Международного научного фонда академика Н.П. Федоренко (2006 г.).
Публикации. Основные научные результаты диссертационного исследования опубликованы в 11 печатных работах, в том числе в двух периодических научных изданиях, рекомендуемых для публикации ВАК, общим объемом 5 п.л.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, библиографического списка, содержащего 79 литературных источников, и приложений. Объем диссертации - 142 страницы, содержащих 26 таблиц, 11 рисунков и графиков.
Использование нечетких множеств для описания ситуаций и представления знаний экспертов в задачах принятия решений
При выработке и принятии решений в компьютерных СППР используются как строгие количественные математические, так и менее строгие - качественные методы, которые, тем не менее, также допускают формализацию и могут быть реализованы в компьютерных системах.
К количественным методам, используемым при анализе сложных систем, традиционно относят методы математического программирования, теорию графов и комбинаторный анализ, теорию вероятностей и статистический анализ, методы теории игр и статистических решений, теорию полезности и др. Обычный способ использования количественных методов в моделях ПР — это введение целевой функции, позволяющей численно оценивать полезность того или иного решения. Числовое описание результатов очень удобно, но не всегда возможно и, главное, не всегда имеет смысл, так как чем сложнее система, тем меньше она допускает возможность дать точные и, в то же время, имеющие практические значения суждения о ее поведении [18, 27].
В предыдущем разделе говорилось о том, что оценка управленческого решения основывается не только на объективном анализе, но и субъективном понимании ценности, эффективности решений. Субъективные оценки и предпочтения ЛПР и экспертов должны учитываться в качестве входных данных формального анализа и оценки вариантов решений. При этом используемые методы не должны приводить к потере (искажению) данных, способных повлиять на конечный результат, точность вывода должна быть соизмерима с точностью исходных данных. Кроме того, должна существовать возможность их компьютерной реализации для включения в базу моделей интеллектуальной СППР (ИСППР).
Возможности традиционного математического аппарата в отношении сложных и плохо формализованных задач ограничены. Нужны подходы, в которых используются методы качественного анализа, допускающие нечеткости и частичные истины. Подобные «нетрадиционные» методы в последнее время привлекают все больше внимание специалистов разных областей знаний. Большинство методов входит в арсенал научного направления «интеллектуальные системы». Это, например, теория нечетких множеств и теория возможностей, эволюционные вычисления и генетические алгоритмы, нейронные сети и моделирование рассуждений [44, 48]. В условиях неполноты сведений об исследуемых явлениях, объектах и процессах и при оценке ситуаций, характеризующихся неопределенностью нестатистического характера, альтернативой традиционным количественным методам теории ПР является лингвистический (нечетко-множественный) подход, предложенный Л. Заде [18].
Нечетко-множественный подход позволяет наилучшим образом формализовать нечеткие представления экспертов (качественные высказывания в терминах естественного языка). В рамках этого подхода в качестве значений переменных допускаются не только числа, но и слова и предложения естественного языка. Формализация нечетких понятий и отношений профессионального языка ЛПР обеспечивается введением понятий нечеткой и лингвистической переменных, нечеткого множества и отношения. Первые два обеспечивают переход от словесных описаний элементов задачи ПР к числовым, другие два являются средством числового представления нечетких понятий и отношений [8, 18, 49, 52, 78, 79].
Рассмотрим метод определения таких нечетких понятий. Носитель X — это универсальное множество, которое может быть произвольным набором объектов или математических конструкций. Нечеткое множество А — это множество значений носителя с элементами х\, х2, ..., хп, такое, что каждому значению носителя сопоставлена степень принадлежности этого значения множеству А. Конечное нечеткое (размытое) подмножество А из X— это множество упорядоченных пар [5, 18]:
А = {(МА(ХІ)/Х{)}, ХІ еХ, где jUA&d - функция принадлежности, указывающая предполагаемую степень принадлежности элемента этому множеству. Областью значений JUA(XI) является единичный интервал [0,1]. Чем выше JUA(X,), тем выше оценивается степень принадлежности элемента носителя х/ нечеткому множеству А. Значение д (.зс/) определяется экспертом или ЛПР. У каждого специалиста эта функция может иметь различный вид (в этом ее принципиальное отличие от функции распределения в теории вероятностей).
Безусловно, привлекательней всего использовать объективные закономерности классической вероятности, если они известны. Однако классическая вероятность — это характеристика генеральной совокупности событий. Управление отдельным предприятием (системой, объектом) выявляет его уникальность и специфику, что исключает наличие статистической вероятности. В таких ситуациях эксперту или ЛПР приходится опираться на свои знания и опыт, формулировать свои субъективные предпочтения посредством формирования функции juA(x,).
Операции над нечеткими множествами производят через операции с функциями принадлежности этих множеств, среди часто применяемых следующие [5, 18, 50, 79]: - вложение множеств: A z.B juA(x,) //в(х,), Vх,- є X; - дополнительное нечеткое множество: ju7l(Xi)= l-juA(xi), V х,- є X; - объединение множеств: //лив(х,) = max{/ (x/), //5(x,)}, V xf є X; - пересечение множеств: цА лв ( /) = пііп{д4(л:,), / (х/)}, V х,- є X; - операция степени о:нечеткого множества: juA(4xi) = {{1А(х,)}а, V х,- є X. Управление - это перевод объекта управления из ситуации, характеризуемой менее предпочтительными значениями параметров, в ситуацию с более привлекательными характеристиками, в которой будет с известной степенью гарантировано требуемое состояние параметров.
Ситуацией называется набор значений признаков, описывающих состояние объекта управления в некоторый момент времени. Под нечетким описанием ситуации понимается такое, где отображены не только количественные, но и ряд качественных характеристик системы, определенных в терминах естественного языка [43]. Вид нечеткого описания ситуаций существенно зависит от области приложения. В ряде случаев нечеткое описание представляет собой совокупность нечетких множеств первого уровня, например: S = {качество «среднее», производительность «низкая», себестоимость «высокая» и т.д.}. В еще более неопределенных обстоятельствах принятия решений описание ситуации представляется совокупностью нечетких множеств второго уровня [18, 43].
Разработка метода и алгоритма многокритериального выбора решений с учетом нечетких предпочтений нескольких экспертов
Процедура управления состоит из непрерывной цепочки осуществления индивидуальных выборов, результативность которых может быть ухудшена в сложных или уникальных ситуациях выбора или при недостаточной информированности отдельного человека. Снизить субъективность при ПР можно путем привлечения экспертов (аналитиков, специалистов). Таким образом, важной интеллектуальной составляющей процесса управления являются технологии экспертного оценивания и анализа данных. И следует принимать во внимание, что обычно в условиях конкретной задачи руководитель к мнениям экспертов относится по-разному, в зависимости от их личных качеств. Выбор величин коэффициентов компетентности экспертов зачастую сложен и носит субъективный характер.
Принятие окончательного решения вырабатывается на основе комбинации математических методов и интуитивных знаний и опыта экспертов, ЛПР [73].
Выделяют шесть компонентов модели деятельности человека при ПР [70]: 1) выбор, 2) существование предпочтений и ограничений, 3) процесс оценивания, 4) принятие решения на основе собственных предпочтений, 5) ограниченность информации, 6) рациональность.
Ситуация выбора задается предпочтениями и ограничениями, и именно предпочтения индивида, как форма выражения потребностей, выступают критерием отбора доступных вариантов, а ограничения являются внешними по отношению к человеку возможностями удовлетворения потребностей. Человек определяется именно как система предпочтений.
Таким образом, на основании вышеизложенного, в результате анализа и сравнения методов, указанных в разделе 2.1, автором диссертационного исследования были выделены подходы, основанные на построении нечетких отношений предпочтения, рассмотренные в работах [54, 67]. Такое представление знаний хорошо тем, что не требует от экспертов или ЛПР четкого представления о предпочтениях между альтернативами и является наиболее близким логике рассуждений индивидуума при ПР.
В [67] приведен метод, в котором отношения предпочтения строятся посредством лингвистических переменных, полученных либо с помощью базовых шкал, либо непосредственно от ЛПР. Алгоритм ранжирования альтернатив подобным методом включает следующие этапы [67]: 1) задание ЛПР базовых шкал, определение по ним критериальных оценок альтернатив (матрицы оценок) и задание «весов» критериев (вектор); 2) вычисление значений нечетких отношений предпочтения по каждому критерию для каждой пары альтернатив; 3) вычисление значений нечетких отношений предпочтения с учетом всех критериев для каждой пары альтернатив; 4) вычисление отношений доминирования и недоминирования альтернатив; 5) вычисление интенсивности доминирования каждой альтернативы (отыскание множества неломинируемых альтернатив); 6) ранжирование альтернатив и определение лучшей альтернативы. Согласно алгоритму метода из [54], ЛПР задает нечеткие отношения предпочтения альтернатив по каждому критерию, описываемые матрицами, также ЛПР задается не вектор «весов» критериев, как в предыдущем методе, а матрица отношения их относительной важности. Далее определяются нечеткие подмножества недоминируемых альтернатив по каждому критерию, которые необходимо обобщить («свернуть») в единое нечеткое отношение предпочтения с учетом информации об относительной важности критериев, заданной в форме нечеткого отношения. Таким образом, задача выбора сводится к задаче с единственным отношением предпочтения, на основании которого получают нечеткое подмножество недоминируемых альтернатив и выбирают лучшую из них. Алгоритм метода позволяет рассматривать вместо множества критериев множество экспертов, и тогда рассматриваются нечеткие отношения предпочтения альтернатив, предложенные каждым экспертом, и учитывается отношение важности экспертов, а не критериев (множественность критериев, таким образом, уже не учитывается).
Каждый из описанных выше методов позволяет учитывать коэффициенты значимости выбранных критериев и не исключает возможность участия в процессе ПР нескольких экспертов. Однако в первом подходе ничего не сказано о возможности существования нескольких экспертов и, соответственно, способах учета информации каждого из них, во втором - наличие нескольких экспертов заменяет множественность критериев. Таким образом, ни один из них не позволяет учитывать предпочтения ЛПР в отношении экспертов при одновременном сохранении множественности критериев (в том числе, обладающих различной значимостью).
Для устранения указанных недостатков существующих алгоритмов многокритериального выбора альтернатив при нечеткой исходной информации разработан метод, позволяющий находить лучшее решение при многих критериях и наличии нескольких экспертов одновременно (с возможностью учета важности каждого из экспертов), основанный на информации о нечетких отношениях предпочтения. Данный метод представляет собой модификацию методов из [54, 67].
Алгоритм ранжирования альтернатив включает следующие шаги: задание экспертами базовых шкал для оценок альтернатив и для оценок критериев; задание ЛПР матрицы относительной важности экспертов; определение критериальных оценок альтернатив и задание «весов» критериев; вычисление значений нечетких отношений предпочтения по каждому критерию для каждой пары альтернатив; вычисление значений нечетких отношений предпочтения с учетом всех критериев для каждой пары альтернатив; определение нечетких подмножеств недоминируемых альтернатив, которые необходимо обобщить в единое нечеткое отношение предпочтения с учетом информации об относительной ценности экспертов, заданной в форме нечеткого отношения. В конечном итоге, на основании единственного отношения предпочтения определение нечеткого подмножества недоминируемых альтернатив и выбор из них наилучшей.
Постановка задачи. Имеется N альтернатив (Ah і = 1, 2, ..., N). Требуется выбрать лучшую альтернативу А с учетом мнений Q экспертов (Eq, q = 1, 2, ..., Q) об оценках альтернатив по J критериям (Q,y = 1, 2, ..., J). Каждый эксперт Eq дает оценку rqy каждой альтернативе А{ по критерию С,. Критерии оценки различаются весами важности wqj, заданными экспертами. В свою очередь мнения экспертов представляют различную ценность для ЛПР (руководителя), выраженную нечеткими отношениями предпочтения (степенью предпочтительности одного эксперта другому) [Л(ЕЬ Ej), где /л{Еь EJ) — число, описывающее степень выполнения предпочтения Et Ej («не менее важен»). При этом существует возможность учитывать различные шкалы оценок в зависимости от выбранного критерия.
Алгоритм ранжирования альтернатив включает следующую последовательность шагов [22]:
1. Эксперты задают базовые шкалы для оценивания по ним альтернатив и критериев. При этом шкалы оценок могут быть индивидуальны для каждого эксперта.
2. Эксперты определяют критериальные оценки альтернатив по заданным шкалам и задают «веса значимости» критериев. ЛПР задает матрицу относительной важности экспертов.
Этапы построения классификационной модели и метода принятия решений на основе нечеткого распознавания ситуаций
Важным моментом при построении классификационных МПР является разработка методов структурирования и классификации проблемных ситуаций по множеству определяющих их признаков.
Задача кластеризации состоит в разбиении объектов некоторого множества на несколько подмножеств (классов, кластеров), в которых объекты более схожи между собой, чем с объектами из других кластеров [10, 19]. Методы четкой кластеризации разбивают исходное множество объектов на несколько непересекающихся подмножеств. При этом любой объект из множества принадлежит только одному кластеру. Методы нечеткой кластеризации позволяют одному объекту принадлежать одновременно нескольким кластерам, но с различной степенью. Такая кластеризация во многих ситуациях более «естественна», чем четкая, например, для объектов, расположенных на границе кластеров [74].
Для формирования классов ситуаций необходимо прежде построить отношение сходства на множестве структурных описаний ситуаций, а затем, пользуясь одним из известных методов одноуровневой или многоуровневой (иерархической) кластеризации, разбить множество ситуаций на классы [6]. Для проведения кластеризации могут быть заданы такие параметры, как число объектов, включенных в каждый из кластеров, связность элементов одного кластера между собой, расстояния между отдельными кластерами, пороговая величина сходства (мера близости объектов, позволяющая отнести их к одному кластеру). При этом число классов либо задается априори, либо определяется в процессе работы самого алгоритма.
Существует множество различных методов кластеризации, основанных на использовании матриц сходства, оценивании функций плотности статистического распределения, эвристических алгоритмах перебора, идеях математического программирования и др. [13, 19, 69, 77]. Выбор того или иного метода определяет результаты кластеризации.
Для того чтобы определить на множестве данных (объектов) кластер, необходимо ввести меру сходства, которая будет положена в основу правила отнесения объектов к кластеру, характеризируемому некоторым центром (эталоном, представителем) [13, 69].
К наиболее часто используемым алгоритмам кластеризации могут быть отнесены иерархический кластерный анализ и кластеризация методом К-средних (относящаяся к методам перераспределения).
Смысл иерархический агломеративной процедуры кластеризации заключается в следующем. Перед началом кластеризации все р объектов (ситуаций) считаются отдельными кластерами. На первом шаге алгоритма определяются два наиболее близких или сходных объекта, которые объединяются в один кластер, при этом общее количество кластеров сокращается на единицу. Итеративный процесс повторяется, пока на последнем (р-1)-м шаге все классы не объединятся. На каждом последующем шаге рассчитываются расстояния от образованного кластера до каждого из оставшихся кластеров. Процедура кластеризации может быть остановлена, если получено определенное заранее количество кластеров, все кластеры содержат более определенного числа элементов или же если кластеры обладают требуемым соотношением внутренней однородности и разнородности между собой.
В методах перераспределения число кластеров задается изначально, и исходные объекты каким-либо образом распределяются между кластерами. Далее итеративно каждый объект перераспределяется в другой кластер, оптимизируя определенную функцию цели. Алгоритм завершается, если нельзя больше перераспределить объекты со значительным улучшением функции цели. Метод Х-средних основан на минимизации суммы квадратов расстояний между каждым из исходных объектов и центром его кластера.
Качество работы алгоритма кластеризации методом -средних зависит от числа выбираемых центров кластеров, от выбора исходных центров кластеров, от последовательности оценки объектов множества.
Предлагается адаптация приведенного алгоритма к условиям нечетко описанных ситуаций, позволяющая снизить трудоемкость на некоторых этапах процедуры кластеризации.
Для разбиения множества из N объектов (ситуаций) на подклассы (кластеризация по сходству описаний) необходимо определить степень сходства (или расстояние) для каждой пары ситуаций из заданного множества. Поскольку каждая ситуация описывается совокупностью нечетких множеств, то при определении близости (степени сходства или несходства) ситуаций можно использовать формулы, приведенные в разделе 3.2, по которым сравниваются нечеткие множества.
Применение классификационного метода для распознавания текущего состояния предприятия
Ранее было определено, что значения выбранных факторов-показателей для оценки УФ предприятия могут измеряться в количественных и качественных шкалах. Для этого каждому z-му фактору (Ф, ПТ, Р, К, И), см. табл. 4.1, сопоставим лингвистическую переменную ft. Определим значения, которые могут принимать лингвистические переменные УФ, /ит,/р,/к,/и, и для каждой из них составим терм-множества нечетких значений.
В нашем случае для оценки значений приведенных в табл. 4.1 показателей использовалось 5-ти уровневое терм-множество со следующими значениями: Т= {to — очень низкий уровень; t\ — низкий уровень; t2- средний уровень; t3 - высокий уровень; /4 _ очень высокий уровень}, где лингвистические значения tt задаются нечеткими множествами, функции принадлежности которых представлены нечеткими треугольными числами, определенными на базовом множестве: D = {0,075; 0,3; 0,5; 0,7; 0,925} (рис. 4.2).
Все соседние термы (треугольные функции) пересекаются друг с другом в точке с ординатой 0,5. Это означает, что нарастание силы одного из качественных признаков сопряжено с соответствующим убыванием смежного признака, а в точке /л = 0,5 достигается максимум информационной неопределенности. Такая шакала является серой шкалой в смысле Поспелова [56]. Количество термов лингвистической переменной, равное пяти, является оптимальным и, как показал опыт при решении конкретных задач, оценивание показателя по такой шкале не вызывает затруднений у экспертов.
Так, например, «среднему уровню» УФ соответствует кратковременная потеря эффективности функционирования, связанная со снижением производительности труда, незначительной потерей прибыли, несоответствием динамики емкости и доли рынка. «Низкий уровень» УФ может быть вызван нарушениями производственного цикла. «Очень низкому уровню» УФ могут соответствовать крупные финансовые потери.
Начинать оценку УФ предприятия нужно с показателей нижнего уровня иерархии. При этом, если значение входного показателя задано четко, конкретным числом из числового базового множества D, то, воспользовавшись графиками (рис. 4.2), можно (без привлечения экспертов) определить значения функций принадлежности каждого из треугольных чисел. В результате для четкого значения входного показателя получают его нечеткое значение, представленное либо нечетким множеством 2-го уровня [18], либо в несколько упрощенном виде единственным лингвистическим значением th но с соответствующей ему величиной функции принадлежности.
Пусть, например, значение показателя х для уровня финансовой устойчивости равно 0,65. Из графиков на рис. 4.2 видим, что при JC = 0,65 значение функций принадлежности jut2(0,65) = 0,3 и /ut3(0,65) = 0,7. Поэтому четкое значение 0,65 показателя х описывается следующим нечетким множеством 2-го уровня: { 0/t0 , 0/t\ , 0,3/Ь , 0,7/t3 , 0/t4 «Ф»}, где элементами базового множества являются все лингвистические значения tt из Т. В более упрощенном виде можно считать значение х = 0,65 в нечетком представлении как 0,7//з , что означает уровень финансовой устойчивости «высокий» со степенью уверенности 0,7.
Для оценки обеспеченности финансовыми ресурсами, мы воспользовались лингвистической классификацией уровней финансовых показателей, построенной в работе [47]. Данные получены на основе финансовой российской статистики четырехсот предприятий за четыре года. Так как количественные значения финансовых показателей вычисляются по общеизвестным формулам, принятым в практике финансового анализа, то нечеткое распознавание уровня каждого из них было произведено автоматически (без привлечения экспертов).
Особенностью нечеткого логического вывода по иерархической базе знаний является отсутствие процедур дефаззификации и фаззификации для промежуточных переменных. Результат оценки, логического вывода на данном уровне иерархии, в виде нечеткого множества напрямую передается на следующий более высокий уровень иерархии. Таким образом, поиск интегральной оценки текущего состояния предприятия сводится к последовательной оценке показателей снизу вверх по иерархическому дереву факторов-показателей. Такая последовательная многоуровневая стратегия получения решения (комплексной оценки) является более эффективной, чем одноуровневая (одношаговая) стратегия, при которой из-за большого количества факторов-показателй приходится вводить ряд упрощений,- что приводит к утрате адекватности описания ситуации.
Агрегирование данных с уровня на уровень производится по так называемому матричному принципу [47], где строки матрицы — это факторы или группы факторов, столбцы — пять качественных уровней (/о, h, t2, h, t4), a на пересечении строк и столбцов находятся уровни принадлежности значений уровней факторов тем или иным качественным уровням. В этом случае агрегирование данных представляет двумерную свертку матричных данных с двумя системами весов: по строкам — с весами значимости факторов, по столбцам - с весами узловых точек (0,075; 0,3; 0,5; 0,7; 0,925) базового множества D. Полученный результат свертки находится в пределах от 0 до 1. Этот результат может быть распознан на основе упомянутого выше 5-ти уровневого терм-множества, и в итоге можно сказать, с какой степенью полученный результат принадлежит тому или иному терму лингвистической переменной.
По результатам работы предприятия за 5 лет имелись данные о 20 (по количеству кварталов) ситуациях, оцененных по приведенным в табл. 4.1 параметрам, с известными управленческими решениями, принятыми руководством предприятия после получения результатов оценки уровня УФ. Под управленческим решением понимается некоторая совокупность действий по улучшению положения предприятия.
Таким образом, множество ситуаций можно было объединить в классы по сходству принятых управленческих решений. Однако для распознавания некоторой текущей ситуации с уже имевшими место на предприятии и отнесения ее к тому или иному классу, необходимо выделить эталонные представители в каждом таком классе. Для этого каждое подмножество ситуаций с одинаковыми решениями необходимо разбить на классы эквивалентности - эталонные классы ситуаций (ЭКС), включающие близкие по описанию ситуации.