Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методы формализации и обработки нечеткой экспертной информации Полещук Ольга Митрофановна

Методы формализации и обработки нечеткой экспертной информации
<
Методы формализации и обработки нечеткой экспертной информации Методы формализации и обработки нечеткой экспертной информации Методы формализации и обработки нечеткой экспертной информации Методы формализации и обработки нечеткой экспертной информации Методы формализации и обработки нечеткой экспертной информации Методы формализации и обработки нечеткой экспертной информации Методы формализации и обработки нечеткой экспертной информации Методы формализации и обработки нечеткой экспертной информации Методы формализации и обработки нечеткой экспертной информации
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Полещук Ольга Митрофановна. Методы формализации и обработки нечеткой экспертной информации : Дис. ... д-ра техн. наук : 05.13.01 : Москва, 2004 278 c. РГБ ОД, 71:05-5/27

Содержание к диссертации

Введение

Глава I. Анализ методов формализации и обработки нечеткой экспертной информации на базе семантических пространств и постановка решаемой проблемы 18

1.1. Классификация неопределенности и класс решаемых прикладных задач ... 18

1.2. Шкалы и допустимые преобразования 22

1.3. Нечеткие множества, лингвистические переменные, семантические пространства и полные ортогональные семантические пространства 28

1.4. Обзор методов построения функций принадлежности нечетких множеств и семантических пространств 34

1.5. Нечеткие отношения и элементы нечеткого кластерного анализа 37

1.6. Обзор методов нечеткого регрессионного анализа 45

1.7. Выводы по главе 1 49

Глава II. Методы формализации нечеткой экспертной информации 51

2.1. Построение совокупности нечетких чисел для формализации лингвистических значений признаков 51

2.2. Формализация нечеткой информации, полученной при оценивании качественных признаков в вербальных шкалах 56

2.3. Формализация экспертной информации, полученной при оценивании качественных признаков в балльных шкалах 67

2.4. Формализация нечеткой информации на основе прямого опроса единственного эксперта 78

2.5. Формализация нечеткой информации на основе прямого опроса группы экспертов 89

2.6. Формализация нечетких рассуждений экспертов 93

2.7. Выводы по главе II 97

Глава IIІ. Методы сравнительного и нечеткого кластерного анализа формализованной информации 99

3.1. Построение сравнительных показателей и показателей согласованности моделей экспертного оценивания признака 99

3.2. Нечеткий кластерный анализ множества моделей экспертного оценивания признака 104

3.3. Построение сравнительных показателей и показателей согласованности формализованных результатов оценивания качественного признака у совокупности объектов 108

3.4. Нечеткий кластерный анализ множества формализованных результатов оценивания качественного признака у совокупности объектов 113

3.5. Выводы по главе III 115

ГЛАВА IV. Методы построения обобщенных моделей экспертного оценивания признаков 117

4.1. Построение обобщенной модели экспертного оценивания признака на основе метода наименьших квадратов 117

4.2. Определение весовых коэффициентов моделей экспертного оценивания признака и формализованных результатов экспертного оценивания качественного признака у совокупности объектов на основе отношений подобия 120

4.3. Определение весовых коэффициентов моделей экспертного оценивания признака на основе степеней нечеткости 127

4.4. Построение обобщенной модели экспертного оценивания признака на основе минимума потери информации 129

4.5. Построение обобщенного формализованного результата экспертного оценивания качественного признака у совокупности объектов на основе метода наименьших квадратов 134

4.6. Метод определения оптимальных множеств лингвистических значений признаков 138

4.7. Выводы по главе IV 142

Глава V. Методы определения рейтинговых оценок для объектов с качественными признаками 143

5.1. Метод определение рейтинговых оценок объектов в рамках одного качественного признака 143

5.2. Определение рейтинговых оценок объектов по нескольким качественным признакам 149

5.3. Метод определения рейтинговых оценок совокупностей объектов в рамках одного качественного признака 156

5.4. Метод определения рейтинговых оценок совокупностей объектов в рамках нескольких качественных признаков 157

5.5. Выводы по главе V 159

Глава VI. Развитие методов нечеткого регрессионного анализа 161

6.1. Метод дефаззификации нечетких чисел на основе взвешенных множеств 161

6.2. Линейная комбинированная регрессионная модель на основе формализации лингвистических значений признаков 165

6.3. Линейная комбинированная регрессионная модель на основе нечетких неотрицательных чисел 170

6.4. Выводы по главе VI 174

Глава VII. Примеры практического применения разработанных методов 176

7.1. Определение оптимальных множеств значений лингвистических шкал для экспертного оценивания характеристик качества программных средств 176

7.2 Многокритериальный выбор программных средств на основе семантических пространств и нечетких правил вывода 187

7.3. Анализ нечеткой экспертной информации экологического мониторинга. 190

7.4. Определение степени аналогичности технических изделий 206

7.5. Оценивание соответствия уровня подготовленности специалистов требованиям их профессионального поля деятельности 209

7.6 Формализация и обработка результатов экспертного оценивания качества учебной литературы 212

7.7. Профессиональный отбор выпускников вуза на основе показателей успеваемости, психофизиологических и личностных характеристик с учетом нечетких предпочтений 220

7.8. Сравнительный анализ классической и комбинированной регрессионных моделей образовательного процесса 234

7.9. Выводы по главе VII 238

Заключение 241

Список использованных источников 244

Приложение 271

Введение к работе

Решения многих народнохозяйственных задач (наука, техника, образование, медицина и т. д.) опираются на информацию, полученную от экспертов. Эффективность использования этой информации непосредственно зависит от мощности современного аппарата формализации и обработки экспертной информации, важность совершенствования и развития которого трудно переоценить.

Информация, поступающая от экспертов, может содержать, как четкие данные, так и нечеткие. Последних объективно много по причине того, что эксперты, оценивая признаки и выражая свои знания, используют в рамках профессионального языка лингвистические значения этих признаков (например, технологичность - низкая, интерфейс - удобный, квалификация -высокая, соответствие — полное, вероятность - большая и т. д.).

Экспертная информация с нечеткими данными (то есть нечеткая экспертная информация) трудноформализуема в рамках традиционных математических формализмов. Для количественных признаков возникают скачкообразные переходы от одного лингвистического значения к другому, в связи с чем плохо описываются объекты с пограничными физическими значениями этих признаков. При отображении лингвистических значений качественных признаков на числовые элементы порядковых шкал информация огрубляется, теряется та ее ценная составляющая, которая характеризует индивидуальный опыт и знания эксперта. Попытки формализации нечеткой информации на основе классических и субъективных вероятностей не принесли успеха в связи с известными ограничительными требованиями их использования.

Модельный подход на основе аппарата теории нечетких множеств позволил устранить недостатки традиционных формализации нечеткой экспертной информации [1-9]. С точки зрения этого подхода моделями экспертного оценивания признаков служат семантические пространства, термы которых соответствуют уровням вербальных шкал, используемых для оценивания признаков [1]. Формализация нечеткой информации на основе этих моделей позволяет использовать аппарат теории нечетких множеств для воплощения в ЭВМ компоненты опыта эксперта, основанной на знании [1,2, 10-35].

Успешное развитие теории нечетких множеств и ее приложений обеспечило признание этой теории, но выявило также и проблемы, требующие своего решения.

Этап формализации нечеткой информации на основе семантических пространств является фундаментом, на котором строятся методы обработки информации непосредственно в рамках аппарата теории нечетких множеств. Эти методы используются для разработки экспертных систем, интеллектуальных систем поддержки принятия решений, анализа данных и управления сложными процессами.

Однако субъективное и приближенное представление значений функций принадлежности термов семантических пространств может приводить к неадекватности нечетких моделей субъективным суждениям и исходным данным. Широкое использование такого представления диктует необходимость усиления разработок, направленных на повышение адекватности, как самих моделей формализации, так и нечетких моделей на их основе.

Требования к моделям экспертного оценивания признаков, как правило, формулируются в рамках каждой конкретной задачи, а качество построенных моделей зависит от опыта и искусства исследователей. Причиной такой зависимости, по-видимому, является не только то, что методы формализации ограничены как способами получения информации от экспертов, так и видом информации, но и отсутствие общих естественных требований к функциям принадлежности используемой для формализации совокупности нечетких множеств [36-42].

Отсутствуют методы формализации экспертного оценивания качественных признаков на универсальных множествах, элементами которых являются значения интенсивности проявлений этих признаков. Как следствие, отсутствуют методы, позволяющие использовать формализации качественных признаков для определения количественных показателей их проявлений и, тем самым, решать одну из основных задач экспертного оценивания. Актуальность разработки таких методов и их значение для решения практических задач подчеркиваются в работах зарубежных специалистов в области теории нечетких множеств [43-44].

Проведенные рядом авторов исследования свойств семантических пространств, направленные на повышение адекватности моделей экспертного оценивания признаков и их полезности для решения практических задач, позволили обоснованно сформулировать требования к свойствам функций принадлежности термов и на их основе определить количественный показатель качества семантических пространств, названный степенью нечеткости [9].

Тем не менее, вне рассмотрения оказались методы построения семантических пространств, обеспечивающие практическое выполнение сформулированных требований.

Не разработаны методы сравнительного анализа моделей экспертного оценивания признаков, изучения структурного состава их множеств и построения обобщенных моделей. Эти методы имеют существенное значение как для обработки нечеткой экспертной информации, полученной из разных источников при оценивании одного признака, так и для обработки нечеткой экспертной информации, полученной при оценивании качественного признака у разных совокупностей объектов.

Требуют развития методы построения множеств лингвистических значений признаков, удовлетворяющих критериям оптимальности: минимальная степень нечеткости экспертной информации и максимальная согласованность информации при использовании этих множеств для оценивания признаков. Задача построения оптимальных множеств лингвистических значений признаков решена только в условиях первого критерия [9].

Широкое использование моделей экспертного оценивания признаков в экспертных системах, интеллектуальных системах поддержки принятия решений, анализа данных и управления сложными процессами диктует необходимость разработки перечисленных методов с целью повышения адекватности нечетких моделей моделируемым в этих системах процессам. Критерием адекватности, как известно, может служить «естественность» заключений, получаемых на основе этих моделей. Подобный критерий «естественности» является обобщением известного теста Тьюринга [45].

Для прогноза лингвистических значений признаков и анализа зависимостей между признаками используются методы нечеткого регрессионного анализа [46], которые, находясь в стадии активного развития, значительно расширили область применения методов классического регрессионного анализа. Ограниченность спектра функций принадлежности исходных данных в методах нечеткого регрессионного анализа явилась причиной пробела, частично восполненного построением нечеткой регрессионной модели в виде системы классических линейных регрессионных уравнений. При этом актуальной остается разработка регрессионной модели с нечеткими коэффициентами, позволяющей расширить спектр функций принадлежности исходных лингвистических значений признаков и соответственно спектр анализируемой нечеткой экспертной информации.

Поэтому разработка методов формализации и обработки нечеткой экспертной информации на основе семантических пространств является актуальной научной проблемой. Целью диссертации является разработка методов формализации и обработки нечеткой информации, позволяющих осуществлять сравнительный анализ моделей экспертного оценивания признаков, изучать структурный состав их множеств, строить обобщенные модели, использовать построенные модели для прогноза значений признаков и определения количественных показателей проявления качественных признаков.

Для достижения указанной цели в работе были поставлены и решены следующие основные задачи:

• развитие методов формализации нечеткой экспертной информации в рамках количественных и качественных признаков;

• разработка методов сравнительного анализа моделей экспертного оценивания признаков и нечеткого кластерного анализа их множеств;

• разработка методов построения обобщенных моделей оценивания признаков в рамках фиксированных множеств их лингвистических значений;

• определение количественных показателей проявлений качественных признаков на основе моделей их экспертного оценивания;

• разработка регрессионной модели, позволяющей использовать формализацию лингвистических значений признаков для анализа зависимостей между этими признаками и прогноза их значений.

Научная новизна диссертационной работы определяется следующими научными результатами.

1. Разработаны методы построения функций принадлежности терм-множеств семантических пространств, повышающие адекватность моделей экспертного оценивания признаков; построена совокупность нечетких чисел для использования их в качестве формализации лингвистических значений признаков; определен аналог показателя надежности для моделей экспертного оценивания признаков.

2. Созданы методы сравнительного анализа разработанных моделей экспертного оценивания признаков; построены нечеткие отношения сходства и подобия на множествах моделей; разработаны методы нечеткого кластерного анализа этих множеств.

3. Разработаны методы определения обобщенных моделей экспертного оценивания качественных признаков и описания в лингвистических термах значений количественных признаков с учетом различных критериев оптимальности; разработан метод построения оптимальных множеств лингвистических значений признаков по критерию максимина.

4. Построены методы определения нечетких рейтинговых, интервальных (с заданным уровнем доверия), точечных оценок и оценок интенсивности проявлений признаков для объектов с качественными признаками.

5. Разработана линейная комбинированная регрессионная модель, расширяющая спектр функций принадлежности анализируемойформализованной экспертной информации; определено новое понятие «взвешенное множество»; на его основе разработан метод дефаззификации нечетких чисел, включающий построение интервальных агрегирующих показателей для лингвистических значений признаков; определены аналоги коэффициента детерминации, оценки стандартной ошибки и стандартного отклонения, позволяющие оценивать качество регрессионных моделей. Практическая значимость результатов работы.

1. Разработан комплекс инструментальных средств формализации и обработки нечеткой экспертной информации, полученной в результате оценивания качественных признаков и описания значений количественных признаков в лингвистических термах; результаты диссертации реализованы в разработанной библиотеке программ, названной автором «Fuzzy Expert». 

2. Полученные в работе результаты обеспечивают возможность дальнейшего развития практических приложений на их основе и возможность создания новых инструментальных средств. Разработанные методы внедрены и позволили: - построить оптимальные (в определенном смысле) множества лингвистических шкал для экспертного оценивания характеристик качества программных средств;

- осуществить многокритериальный выбор программных средств на основе нечетко сформулированных предпочтений пользователя;

- опираясь на нечеткую информацию экологического мониторинга, принять адекватные решения о перспективности использования отдельных видов растений для озеленения г. Москвы;

- построить модели профессионального отбора выпускников вуза и оценивания соответствия уровня подготовленности специалистов требованиям их профессионального поля деятельности;

построить линейную комбинированную регрессионную модель образовательного процесса и обосновать ее преимущество над классической линейной регрессионной моделью. На защиту выносятся.

1. Методы формализации нечеткой экспертной информации, полученной в результате оценивания качественных признаков и описания значений количественных признаков в лингвистических термах.

2. Нечеткие бинарные отношения сходства и подобия на множествах формализации экспертного оценивания признаков, построенные на основе впервые введенных по парных сравнительных показателей и показателей согласованности моделей формализации; методы нечеткого кластерного анализа этих множеств.

3. Обобщенная модель экспертного оценивания признака в рамках фиксированного множества его лингвистических значений с учетом различных критериев оптимальности.

4. Нечеткие рейтинговые оценки объектов для одного и нескольких качественных признаков, позволяющие находить количественные показатели проявлений этих признаков. 5. Метод построения линейной комбинированной регрессионной модели, позволяющий использовать формализацию лингвистических значений признаков для анализа зависимостей между этими признаками и прогноза их значений.

В соответствие с выше изложенным, диссертация построена следующим образом.

Первая глава посвящена анализу методов формализации и обработки нечеткой экспертной информации на базе семантических пространств и постановке решаемой в диссертации проблемы. Рассмотрены шкалы, применяемые для оценивания количественных и качественных признаков, и допустимые преобразования значений этих признаков. Приведены классификация видов неопределенности и методов их обработки. Изложены необходимые сведения из теории нечетких множеств, теории нечетких отношений, теории кластерного анализа. Критически проанализированы известные методы формализации и обработки нечеткой экспертной информации, полученной в результате оценивания качественных признаков и описания значений количественных признаков в лингвистических термах. Рассмотрен класс задач, требующих применения разрабатываемого в диссертации аппарата.

Проведенный в главе анализ позволил сделать вывод об актуальности развития методов формализации и обработки нечеткой информации, обеспечивающих повышение адекватности, как самих моделей формализации, так и нечетких моделей на их основе и сформулировать постановки задач исследования в данной работе.

Во второй главе разработаны методы формализации нечеткой информации, состоящие в построении моделей экспертного оценивания признаков. Эти модели удовлетворяют требованиям, сформулированным автором на основе постановки задачи главы 1. Построена совокупность нечетких чисел для использования их в качестве формализации лингвистических значений признаков. Определены необходимые операции для элементов этой совокупности и доказаны утверждения относительно свойств этих операций.

Разработаны два метода формализации информации, полученной в результате оценивания экспертом качественного признака у совокупности объектов. Первый метод работает в условиях применения вербальной шкалы для оценивания признака и не требует дополнительного привлечения эксперта, что существенно при многочисленности оцениваемых объектов. Второй метод работает в условиях применения балльной шкалы для оценивания признака и требует дополнительного привлечения эксперта для проведения сравнительных процедур.

Разработаны три метода формализации нечеткой информации на основе прямого экспертного опроса, которые могут быть применены как для качественных, так и для количественных признаков. Первый метод опирается на мнение единственного эксперта о типичных значениях лингвистических термов. Второй метод опирается на мнения группы экспертов о типичных значениях лингвистических термов. Третий метод опирается на мнение единственного эксперта о разбиении множества значений признака.

Определен аналог показателя надежности для моделей экспертного оценивания признаков.

В третьей главе разработаны методы сравнительного и нечеткого кластерного анализа информации, формализованной методами второй главы.

Построено множество, элементами которого являются модели экспертного оценивания признака. На основе элементов этого множества построено множество, элементами которого являются формализованные результаты оценивания экспертами качественного признака у совокупности объектов. Определены операции на этих множествах; попарные сравнительные показатели, показатели согласованности моделей формализации; построены нечеткие бинарные отношения сходства и подобия; разработаны методы нечеткого кластерного анализа построенных множеств, позволяющие изучать их структурный состав.

Все показатели определены на основе функций принадлежности моделей формализации, а поэтому позволяют проводить сравнительный и нечеткий кластерный анализ на объективных основаниях.

Четвертая глава посвящена построению обобщенной модели экспертного оценивания признака и обобщенного формализованного результата экспертного оценивания качественного признака у совокупностей объектов на основе элементов множеств, построенных в третьей главе.

Сформулировано условие оптимальности по Парето для обобщенной модели экспертного оценивания признака и обобщенного формализованного результата экспертного оценивания качественного признака у совокупностей объектов.

Разработаны методы определения оптимальных по Парето обобщенной модели экспертного оценивания признака и обобщенного формализованного результата экспертного оценивания качественного признака у совокупностей объектов в рамках построенных в третьей главе множеств на основе минимума суммы взвешенных квадратов разностей между параметрами обобщенной модели и обобщенного результата и параметрами элементов этих множеств.

Изложены методы определения весовых коэффициентов элементов построенных в третьей главе множеств на основе отношений подобия, которые тоже построены в третьей главе.

Разработан метод определения весовых коэффициентов моделей экспертного оценивания признаков на основе степеней их нечеткости.

Разработан метод построения обобщенной модели экспертного оценивания признака на основе минимума потери информации, заложенной в исходных моделях экспертного оценивания этого признака. Описан метод построения оптимальных множеств лингвистических значений признаков с учетом двух показателей оптимальности: минимальная степень нечеткости экспертной информации и максимальная согласованность информации при использовании этих множеств для оценивания признаков.

В пятой главе построено пять методов определения нечетких рейтинговых, интервальных (с заданным уровнем доверия), точечных оценок и оценок интенсивности проявлений признаков для объектов с качественными признаками.

Шестая глава посвящена развитию методов нечеткого регрессионного анализа.

Определено новое понятие «взвешенное множество» для нечетких чисел. На его основе разработан метод дефаззификации нечетких чисел, включающий построение интервальных агрегирующих показателей для лингвистических значений признаков и позволяющий сохранить их информационные особенности. Доказаны утверждения относительно свойств взвешенных множеств для суммы и произведения нечетких чисел.

Разработан метод построения линейной комбинированной регрессионной модели, позволяющий использовать формализацию лингвистических значений признаков для анализа зависимостей между этими признаками и прогноза их значений. Модель названа комбинированной, поскольку она сочетает в себе элементы нечеткой и классической регрессионных моделей.

Определены аналоги коэффициента детерминации, оценки стандартной ошибки и стандартного отклонения, позволяющие оценивать качество регрессионных моделей с нечеткими исходными данными.

В седьмой главе изложены примеры практического применения разработанных в диссертации методов.

Решена задача определения оптимальных множеств лингвистических шкал для экспертного оценивания характеристик качества программных средств на примере характеристики «завершенность». Осуществлен многокритериальный выбор программных средств на основе нечетких предпочтений пользователя.

В рамках экспертной информации экологического мониторинга г. Москвы проведен кластерный анализ и найдены рейтинговые оценки состояния видов растений, произрастающих в центре города и на его окраинах. Полученные результаты позволили принять подтвержденные последующими обследованиями адекватные решения о перспективности использования отдельных видов растений для озеленения города.

Разработана новая формула для определения аналогичности технических изделий.

Проведен эксперимент на реальной выборке по определению соответствия уровня подготовленности специалистов требованиям их профессионального поля деятельности.

Формализованы и проанализированы результаты оценивания экспертами качества учебной литературы по характеристике «соответствие учебным планам», построен обобщенный результат оценивания.

Построена модель профессионального отбора выпускников вуза в рамках показателей успеваемости, психофизических и социально-психологических особенностей с учетом нечетких предпочтений.

На основе данных образовательного процесса построены классическая линейная и разработанная в диссертации линейная комбинированная регрессионные модели. Сравнительный анализ качества обеих моделей позволил обоснованно рекомендовать применение разработанной комбинированной модели для обработки и достоверного прогноза информации образовательного процесса.  

Классификация неопределенности и класс решаемых прикладных задач

Физическая неопределенность описывает неопределенность реального мира с точки зрения наблюдателя. Неточностью занимается теория измерений [47], а случайностью теория вероятностей. Лингвистическая неопределенность включает в себя неопределенности понятий и конструкций естественного языка. Неопределенностью смысла фраз занимается теория формальных грамматик. Неопределенностью значений слов занимается теория нечетких множеств и теория шкалирования [47].

До момента изучения организационных задач, связанных с принятием решения человеком, и построения автоматизированных систем управления с моделированием деятельности человека-оператора, обработка и анализ информации с физической неопределенностью успешно осуществлялась в рамках методов классической теории вероятностей и математической статистики, а элементы систем управления представлялись в рамках классической теории множеств. Теория вероятностей была первой теорией, занимающейся обработкой неопределенности, а точнее ее разновидности -случайности и поэтому из всех теорий, в настоящее время занимающихся обработкой неопределенности, теория вероятностей наиболее развита. Однако теория вероятностей базируется на ряде требований [48], выполнение которых необходимо для адекватности выводов, полученных в рамках анализа формализованной ее методами информации [49-54]. Примерами таких требований могут быть: - гарантии того, что наблюдаемые признаки могут быть перенесены на все объекты или события данного типа (генеральную совокупность); - неограниченная повторяемость наблюдаемых признаков в одинаковых условиях; - независимость событий и т.п.

Методы теории вероятностей и математической статистики с самого начала своего развития были направлены именно на изучение физических неопределенностей (случайностей). Если информация получена в условиях искусственно созданных или независимо от воли наблюдателя [55-56], то можно говорить об адекватности применения методов теории вероятностей и математической статистики для обработки и анализа этой информации [57-59]. В реальных ситуациях эти условия часто не выполняются.

В процедурах экспертного оценивания возможность обеспечения одинаковых условий для повторяемых наблюдаемых признаков объективно мала по причине того, что мнения, суждения или качества экспертов вносят в процедуру оценивания субъективный фактор, который меняет условия проведения процедур оценивания и который нельзя не учитывать.

Поэтому классические вероятности пытались заменить неклассическими вероятностями [60]. Наиболее часто применяемые неклассические вероятности - валентные и аксиологические вероятности. Валентная вероятность выражает ожидаемость реализации гипотезы с учетом контекста фактических свидетельств об объекте исследования. В частном случае, когда репрезентативная выборка является выборкой однородных событий, валентная вероятность является статистической (классической). Аксиологическая вероятность выражает ожидаемость реализации гипотезы с учетом контекста субъективных оценок об объекте исследования, выдвинутых экспертом или группой экспертов. При использовании такой вероятности неизменно возрастает риск произвола и ошибочного прогноза поведения объекта. Кроме этого, исследования реальных процессов экспертного оценивания показали, что мысли и суждения экспертов не аддитивны в том плане, что используемые ими меры свободны от свойства аддитивности, присущей мере вероятности.

Попытки формализации логико-лингвистических высказываний, связанных с мыслительной деятельностью экспертов и их субъективной оценкой наблюдаемых свойств определенного объекта, привели к появлению и развитию теории нечетких множеств Л. Заде. В 1965 году в журнале «Information and Control» появилась статья «Fuzzy Sets» [61], которая стала мощным толчком для теоретических разработок и прикладных исследований в различных областях с активным участием экспертов.

Подход Л.Заде опирался на предпосылку о том, что элементами мышления экспертов являются не числа, а элементы некоторых нечетких множеств или классов объектов, для которых переход от «принадлежности» к «не принадлежности» не скачкообразен, а непрерывен. С самого начала развития своей теории он понимал, что использование таких объектов — средство повысить устойчивость математических моделей реальных явлений сферы человеческой деятельности.

Различие между нечеткостью и случайностью приводит к тому, что методы теории нечетких множеств не похожи на методы теории вероятностей. Можно даже сказать, что методы теории нечетких множеств проще во многих отношениях, поскольку базируются на более простом понятии - функции принадлежности (по Л. Заде) по сравнению с функцией распределения вероятностей, которая предполагает определение вероятностной меры, порождающей эту функцию [10].

Информация, поступающая от экспертов, очевидно, может содержать как четкие данные, так и нечеткие. Нечеткие данные возникают в связи с использованием в рамках профессионального языка экспертов лингвистических значений оцениваемых ими признаков. Информация, содержащая нечеткие данные, получила название нечеткой экспертной информации.

Класс решаемых в диссертации технических задач с активным участием экспертов характеризуется наличием трудноформализуемой информации с неопределенностью неслучайного характера, необходимостью учета индивидуальных свойств и особенностей лиц, производящих оценивание, сложностью количественного оценивания процессов управления и обучения.

Многие народнохозяйственные задачи (наука, техника, экология, образование, медицина и т. д.) опираются на информацию, полученную от экспертов, и принадлежат классу задач, решаемых с использованием разработанных в диссертации методов.

Построение совокупности нечетких чисел для формализации лингвистических значений признаков

В [141, 151] метод наименьших квадратов применяется для отклонений центров модельных выходных нормальных треугольных чисел от центров наблюдаемых выходных нормальных треугольных чисел. Центром нормального треугольного числа с функцией принадлежности (1.4) является число ах. В [151] решается оптимизационная задача относительно минимума суммы коэффициентов нечеткости выходных модельных нормальных треугольных чисел. Коэффициентами нечеткости нормального треугольного числа с функцией принадлежности (1.4) являются числа aL,aR.

Однако, модели перечисленных выше и других работ [148, 149] ограничены рассмотрением только унимодальных функций принадлежности исходных данных, что делает их непригодными, например, в случае толерантных функций принадлежности. В практических задачах нечеткие данные с толерантными функциями принадлежности представляют несомненный интерес, поэтому задача их анализа методами регрессионного анализа стоит достаточно остро. В связи с рассмотрением ограниченного спектра функций принадлежности исходных данных в методах нечеткого регрессионного анализа возник пробел, который частично был восполнен в [138].

Изложенный в этой работе метод построения комбинированной регрессионной модели в виде системы классических регрессионных уравнений (по каждому из параметров функций принадлежности исходных нечетких данных) может применяться, в отличие от остальных методов, как к унимодальным, так и к толерантным функциям принадлежности исходных данных. Ограничением метода [138] является то, что на его основе можно построить регрессионную модель только с четкими коэффициентами.

При этом актуальной остается разработка регрессионной модели с нечеткими коэффициентами. Поскольку формализациями лингвистических значений признаков могут быть как унимодальные, так и толерантные нечеткие числа, то в диссертации ставится задача: - разработка регрессионной модели, позволяющей использовать формализацию лингвистических значений признаков для анализа зависимостей между этими признаками и прогноза их значений. Использование моделей экспертного оценивания признаков в экспертных системах, интеллектуальных системах поддержки принятия решений, анализа данных и управления сложными процессами диктует необходимость решения поставленных в диссертации задач с целью повышения адекватности нечетких моделей моделируемым в этих системах процессам. В совокупности решения поставленных в диссертации задач направлены на решение крупной научной проблемы: - разработка методов формализации и обработки нечеткой информации, позволяющих осуществлять сравнительный анализ моделей экспертного оценивания признаков, изучать структурный состав их множеств, строить обобщенные модели, использовать построенные модели для прогноза значений признаков и определения количественных показателей проявлений качественных признаков. 1.7. Выводы по главе I 1. Решения многих народнохозяйственных задач на основе нечеткой экспертной информации зависят от мощности современного аппарата для формализации и обработки этой информации. 2. Методы формализации нечеткой информации на основе семантических пространств немногочисленны и локальны в применении. 3. Существующие методы формализации нечеткой информации в рамках количественных признаков имеют недостатки, состоящие в отсутствии формальных алгоритмов построения функций принадлежности термов и условий на связи между этими функциями. Следствием этого является неоднозначность построений и зависимость их качества от опыта и искусства исследователей. 4. Отсутствуют методы формализации экспертного оценивания качественных признаков на универсальных множествах, элементами которых являются значения интенсивности проявлений этих признаков. Как следствие, отсутствуют методы, позволяющие использовать эти формализации для определения количественных показателей проявлений качественных признаков. 5. Отсутствуют методы сравнительного анализа моделей экспертного оценивания качественных признаков или описания значений количественных признаков в лингвистических термах. 6. Не существует методов, позволяющих изучать структурный состав множеств моделей экспертного оценивания признаков. 7. Отсутствуют методы построения обобщенных моделей экспертного оценивания признаков. 8. Требуют развития методы получения нечеткой экспертной информации при оценивании признаков, обеспечивающие этой информации минимальную степень нечеткости при максимальной согласованности. 9. Существующие нечеткие регрессионные модели имеют ограниченный спектр функций принадлежности анализируемой формализованной информации, что сужает область практического применения этих моделей для анализа зависимостей между признаками в рамках их лингвистических значений и прогноза этих значений. Глава посвящена разработке новых методов формализации нечеткой экспертной информации или построению моделей экспертного оценивания признаков на основе полных ортогональных семантических пространств (ПОСП). Выделение этих пространств из множества семантических пространств обусловлено свойствами их функций принадлежности, сформулированными в результате исследований ряда авторов [9], направленных на повышение адекватности моделей формализации и нечетких моделей на их основе. Целью настоящего раздела является построение совокупности нечетких чисел, которые будут использоваться в методах второй главы в качестве формализации образующих полные ортогональные семантические пространства понятий.

Построение сравнительных показателей и показателей согласованности моделей экспертного оценивания признака

Методы обработки нечеткой информации, представленной в виде совокупности приближенных рассуждений, достаточно хорошо разработаны [1, 2, 6, 10]. В качестве Х1,Х2,...,Хп и Г обычно используются семантические пространства. Однако, использование при формализации этой информации субъективных представлений значений функций принадлежности термов семантических пространств диктует необходимость усиления разработок, направленных на повышении адекватности разрабатываемых нечетких моделей, на что и направлены исследования второй главы.

Основными результатами второй главы являются следующие результаты. 1. Построено множество Л, элементами которого являются (L - і?)-числа с некоторыми дополнительными условиями на функции L(X),R(X). Доказаны утверждения относительно замкнутости расширенных бинарных операций сложения и умножения на этом множестве. Необходимость построения множества Л и доказательства утверждений продиктована использованием элементов множества Л в качестве формализации лингвистических значений признаков. 2. Разработан метод формализации нечеткой информации, полученной в результате оценивания качественных признаков в вербальных шкалах. Метод имеет существенное достоинство, состоящее в том, что построение функций принадлежности формализованной информации может осуществляться в условиях большого числа оцениваемых объектов и для этого построения не требуется никакой дополнительной информации (полученной от экспертов, проводящих стандартные парные сравнения объектов друг с другом). Разработанный метод может применяться для построения функций принадлежности моделей экспертного оценивания не только в рамках информации, полученной непосредственно после проведения оценочных процедур, но также на основе информации из предыдущего опыта их проведения. 3. Разработан метод формализации нечеткой информации, полученной в результате оценивания качественных признаков в балльных шкалах. Этот метод требует дополнительного привлечения экспертов с целью парных сравнений объектов друг с другом. Следует отметить, что известные методы парных сравнений применялись для построения дискретных функций принадлежности нечетких множеств и никогда не применялись для построения функций принадлежности моделей экспертного оценивания. 4. Разработаны три метода формализации нечеткой информации на основе прямого экспертного опроса. Эти методы могут применяться для формализации информации как в рамках качественных, так и в рамках количественных признаков. Первый метод опирается на опрос единственного эксперта о типичных представителях лингвистических значений признака. Второй метод опирается на опрос единственного эксперта о разбиении универсального множества признака. Третий метод опирается на опрос группы экспертов о типичных представителях лингвистических значений признака. 5. Построен аналог показателя надежности для моделей экспертного оценивания признаков, позволяющий контролировать их качество. Обозначим через Е множество, элементами которого являются к ПОСП {к моделей экспертного оценивания качественного признака или описания физических значений количественного признака в лингвистических термах) После определения множества Н необходимо иметь возможность проведения сравнительного анализа его элементов. А именно - насколько элементы попарно различны (сходны) между собой, насколько различны (сходны) все элементы в совокупности, есть ли существенно различающиеся группы элементов или структурный состав множества S достаточно однороден? С целью разработки методов сравнительного и нечеткого кластерного анализа в настоящем разделе определяются количественные показатели различия, сходства и согласованности элементов множества S , на основе которых в следующем разделе строятся нечеткие бинарные отношения сходства и подобия и разрабатывается метод нечеткого кластерного анализа множеств Н.

Определение весовых коэффициентов моделей экспертного оценивания признака и формализованных результатов экспертного оценивания качественного признака у совокупности объектов на основе отношений подобия

Задачи определения рейтингов и рейтинговых оценок реальных объектов возникают при оценивании этих объектов, как в рамках количественных признаков, так и в рамках качественных признаков.

Нахождения рейтингов в рамках количественных признаков достаточно часто [189] сводятся к нахождениям по векторам частных количественных оценок скалярных интегральных показателей.

Методы определения рейтингов в рамках качественных признаков [67-73, 190-193] используют подход [189] к оценке качественных признаков. Однако этот подход имеет ряд ограничений, связанных с особенностями шкал, используемых для измерения качественных признаков и подробно рассмотренными в разделе 1.2.

При оценивании качественных признаков достаточно часто используются вербальные шкалы, уровням этих шкал в соответствие ставятся числовые баллы - элементы порядковых шкал. В теории экспертного оценивания задача определения наборов числовых баллов, поставленных в соответствие элементам порядковых шкал, является одной из основных задач [194]. В случае использования необоснованного произвольного набора числовых баллов нарушается устойчивость окончательных выводов. Из этого следует, что или в рамках каждой конкретной задачи должен быть обоснован выбор набора числовых баллов, поставленных в соответствие уровням вербальных шкал, или должен быть предложен новый подход (исключающий необходимость оперирования с конкретным набором числовых баллов) к нахождению рейтинговых результатов.

Ниже разработаны методы [195-197] нахождения рейтинговых оценок объектов и совокупностей объектов по одному и нескольким качественным признакам на основе их лингвистических значений. Эти методы позволяют оперировать не с числовыми баллами, а с абстрактными величинами -значениями функций принадлежности лингвистических значений оцениваемых признаков.

Будем считать процедуру оценивания качественного признака простой, если эксперт относит объект к некоторому вербальному уровню проявления признака и выставляет определенное количество баллов, соответствующее этому уровню. Например, эксперт оценивает удобство интерфейса программных средств в рамках вербально-числовой шкалы с четырьмя уровнями состояния: «неудобный» - 1 балл, «достаточно неудобный» - 2 балла, «достаточно удобный» - 3 балла, «удобный» - 4 балла. Выставляя определенное количество баллов, эксперт тем самым определяет рейтинговую оценку для каждого объекта. Однако следует отметить, что подобные простые процедуры оценивания качественного признака достаточно часто дают грубую и приблизительную оценку, которая может быть ошибочной, поэтому эти процедуры усложняют.

Процедуру оценивания качественного признака будем считать сложной, если она состоит из оценивания нескольких характеристик, составляющих этот признак. Примером сложной процедуры оценивания качественного признака является процедура оценивания знаний в рамках некоторого предмета по следующим составляющим: работа в течение семестра, тестирование по разным разделам этого предмета, участие в научно-исследовательской работе в рамках этого предмета и т. д. Результат сложного оценивания качественного признака может быть представлен в виде вектора, координатами которого являются промежуточные оценки его оценивания. После этого возникает задача агрегирования разрозненных оценок в единую интегральную (рейтинговую) оценку и присвоения объектам в рамках этого признака принятых или специально разработанных градаций (вербальных уровней).

В настоящем разделе предлагается вместо свертки полученных промежуточных оценок построить свертку сопоставимых компонентов принадлежности этих оценок к нечетким числам, формализующим лингвистические значения оцениваемого качественного признака.

Рассмотрим совокупность N объектов, которые оцениваются в рамках проявления качественного признака X. Рейтинговые оценки определяются на основе балльных оценок к характеристик, составляющих этот признак. Минимальное количество баллов, которыми может быть оценен объект в рамках і- ой характеристики равно нулю, а максимальное количество баллов равно Zt,i = l,k.

Похожие диссертации на Методы формализации и обработки нечеткой экспертной информации