Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Некоторые расширения в теории нечетких реляционных баз данных Лыу Дык Кхам

Некоторые расширения в теории нечетких реляционных баз данных
<
Некоторые расширения в теории нечетких реляционных баз данных Некоторые расширения в теории нечетких реляционных баз данных Некоторые расширения в теории нечетких реляционных баз данных Некоторые расширения в теории нечетких реляционных баз данных Некоторые расширения в теории нечетких реляционных баз данных Некоторые расширения в теории нечетких реляционных баз данных Некоторые расширения в теории нечетких реляционных баз данных Некоторые расширения в теории нечетких реляционных баз данных Некоторые расширения в теории нечетких реляционных баз данных
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Лыу Дык Кхам. Некоторые расширения в теории нечетких реляционных баз данных : Дис. ... канд. физ.-мат. наук : 05.13.01 : Санкт-Петербург, 2003 134 c. РГБ ОД, 61:04-1/164-4

Содержание к диссертации

Введение

ГЛАВА I. Нечеткая реляционная модель баз данных buckles и petry

1. Первоначальная версия 11

2. Расширение базы данных с нечеткими числами 17

2.1. Свойства доменов нечетких чисел 17

2.2. Нечеткие Булевы запросы 21

ГЛАВА II. Расширение модели нечеткой реляционной базы данных с отношениями близости и нормальными нечеткими множествами

1. Отношения близости и конечные скалярные домены 26

2. Нормальные нечеткие множества в реляционной модели 30

3. Непроцедурный язык запросов для нечетких реляционных баз данных, основанных на отношении близости 37

3.1. Введение 37

3.2. Нечеткие подъязыки данных 38

3.3. Реляционное исчисление нечеткого домена 40

3.4. Применение 46

ГЛАВА III. Расширение нечетких реляционных баз данных с классами эквивалентности

1. Введение 48

2. Классы эквивалентности и неточная информация 49

3. Нечеткая реляционная структура 54

4. Нечеткая реляционная алгебра 58

4.1. Объединение 58

4.2. Разность 59

4.3. Декартовое произведение 60

4.4. Проекция 60

4.5. Выборка 61

4.6. Пересечение 62

4.7. Деление 62

4.8. Соединение 63 5.

Пример 65

ГЛАВА IV. Функциональные и многозначные зависимости и нормальные формы в нечеткой реляционной модели баз данных

1. Введение 70

2. Предварительные концепции 72

3. Функциональные зависимости (ФЗ) 81

4. Многозначные зависимости (МЗ) 93

4.1 .Аксиомы для нечетких ФЗ и МЗ 96

4.2. Дополнительные правила вывода для нечетких МЗ 98

5. Нормальные формы 98

6. Проблемы нормализации 104

7. Заключение 106

ГЛАВА V. Представление, хранение и обработка данных в нечеткой реляционной модели

1. Введение 108

2. Представление и хранение данных 109

3. Обработка данных 113

3.1. Расширенные арифметические операции над данными 114

3.2. Реляционные операции в расширенных (нечетких) базах данных 118

3.2.1. Операция выборки 118

3.2.2. Операция соединения 119

3.2.3. Операция проекции 120

4. Заключение 121

Заключение 122

Литература 123

Введение к работе

Актуальность темы. Проблема проектирования баз данных (БД) является в настоящее время объектом все возрастающего интереса широкого круга специалистов в различных областях науки и техники. Однако, во многих случаях, хранимая в БД информация не всегда точно отражает характеристики исследуемого объекта реального мира. Это объясняется рядом объективных и субъективных причин. Во-первых, рассматриваемый объект имеет сложную функциональную структуру, и исследователи не в состоянии полно ее выяснить. Во-вторых, в связи с объективными причинами, специалисты не имели возможности получить точную информацию, а получили только ее некоторую часть (т.е. неполную информацию). В-третьих, на практике бывает достаточно много атрибутов объекта, которые нельзя оценить количественными величинами, а только качественными. Такие типы данных часто встречаются в экспертных системах, системах принятия решений, и интеллектуальных БД Поэтому в настоящее время в круг проблем проектирования нечеткой модели БД и методик обработки неточной и абстрактной информации вовлекается широкий круг пользователей информационных систем.

Достаточно много ученых рассматривает проблемы нечетких баз данных, особенно их реляционную модель. Ими были разработаны различные нечеткие модели реляционных баз данных. Они изложены, например, в работах: Buckles В.Р и Petty F.E. [66-72], Shenoi S. и Melton А. [116-120], Medina Ш. и Vila М.А. [101-102, 132], Lipski WJr. [96-97], Prade H. [109-111], Zemankova-Leech M. и Kandel A. [146], Umano M. [129-130], Ding-An Chiang, Lui R. Chow и Nan-Chen Hsien [79], Le Tien Vuong, Ho Thuan и Truong Due Hung [56, 94, 95, 149]... и т.д. Среди них нечеткие модели Buckles В.Р и Petry F.E., Shenoi S. и Melton А. более привлекают специалистов различных областей, благодаря их структуре, приближающейся к структуре человеческого мышления.

Благодаря работам многочисленных специалистов: Мартин Дж. [21], Мейер Д. [23], Дейт К.Дяс [10], Томас Коннолли и Каролин Бегг [45], Codd E.F. [76,77], Fagin R. [83-85], Maier D. [98], Aimstrong W.W. [60]... и т.д., теория классических баз данных была достаточно развита с математической точки зрения. В то же время, нечеткая база данных рассматривается как обобщенная версия традиционной базы данных, иначе говоря, последняя является специальным случаем нечеткой базы данных. С одной стороны, теория нечетких баз данных, по-видимому, еще не закончена с математической точки зрения, и в ней остается немало вопросов, требующих решения. С другой стороны, области, к которым применимы нечеткие базы данных, разнообразны, кроме того, исследуемые объекты обычно имеют сложную функциональную структуру и для работы с ними требуются подходящие методы манипуляции нечеткими данными. Поэтому, проблема расширения нечеткой модели баз данных является актуальной. Среди трех основных моделей баз данных, наиболее простой и распространенной оказалась реляционная модель. Мы выбираем ее нечеткий аналог, чтобы проводить некоторые расширения.

Целью работы является уточнение и расширение нечетких реляционных моделей баз данных, в особенности модели Buckles и Petry и модели Shenoi и Melton. В основе исследования лежат такие вопросы, как нечеткое исчисление доменов, вполне определенности реляционной алгебры, нечеткие функциональные и многозначные зависимости и связанные нечеткие нормальные формы. Более того, опирая на результаты, полученные Medina, Pons и Vila [101, 102], ставится целью поиск одной группы операторов нечеткого сравнения между нечеткими значениями, с одной стороны и нечетким н четким значениям одного и того же домена, с другой стороны.

Аппаратом исследования служат: теория нечетких множеств, нечеткая логика, теория возможностей, теория проектирования реляционных баз данных, исчисление высказываний, исчисление предикатов, лингвистические

переменные, теория графов и алгебра лингвистических неопределенностей (hedge algebras).

Научная новизна.

1. Исследована задача исчисления доменов (непроцедурный язык
запросов) для основанной на отношениях близости нечеткой реляционной
модели и показана компактность этого непроцедурного языка запросов.

  1. Определен полный набор операций нечеткой реляционной алгебры в основанной на классах эквивалентности нечеткой реляционной модели и показано свойство вполне определенности каждой операции.

  2. Продемонстрированы дополнительные правила вывода для нечетких функциональных зависимостей в основанной на классах эквивалентности реляционной модели. Исследованы в ней нечеткие многозначные зависимости и связанная нормальная форма для схем нечетких отношений.

4. Построена группа операций нечеткого сравнения в нечеткой
реляционной модели баз данных и применены эти операции в командах
реляционной алгебры. Определен новый метод хранения и обработки
нечеткой информации.

Практическая ценность. Полученные во второй и третьей главе диссертации теоретические результаты могут использоваться при создании нечеткой базы данных и реализации нечетких запросов к ним. Результаты» развитые в четвертой главе, могут быть применены при проектировании баз данных для создания "хороших" нечетких моделей с помощью процедуры нормализации схем нечетких отношений. Результаты, полученные в пятой главе, могут быть использованы при хранении и обработке информации с различными уровнями точности.

Полученные нами результаты были реализованы в системе FAMEBASE 3.0 [149] и при проектировании информационной системы "Розыск уголовных преступников" (министерство внутренних дел СРВ).

Апробация работы. Материалы диссертации докладывались на семинарах кафедры технологии программирования (2002г.), на 33-ой и 34-ой

научных конференциях студентов и аспирантов факультета ПМ-ПУ, СПбГУ (4.2002,4.2003).

Публикация. Некоторые результаты содержатся в работах [147- 15fPJ.

Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, заключения и списка русской и зарубежной литературы.

Содержание работы.

В главе I коротко рассмотрена нечеткая реляционная модель баз данных Buckles и Petry, основанная на отношениях подобия для дискретных, конечных множеств Dj. Показано, что отношение идентичности в традиционной реляционной модели является частным случаем отношения подобия.

В параграфе 1 описаны основные понятия и свойства первоначальной модели.

В параграфе 2 первоначальная модель расширена нечеткими числами. Перечислены основные свойства размытых чисел. Отношения подобия, используемые для дискретных, конечных множеств домена не могут быть непосредственно распространены на непрерывные множества нечетких чисел, так как в данном случае отсутствует свойство транзитивности, которое производит разделение множества домена так, чтобы гарантировать уникальность представления отношения. Определены новые отношения "близости", названные «-подобными Sa и а-ближайшими Sa+. Sa или Sa+ делит множество размытых чисел на непересекающиеся блоки такие, что каждое нечеткое число находится только в одном блоке. Это свойство обеспечивает уникальность отношения. На основе Sa и Sa+ определены понятие избыточности, операция слияния для размытых чисел и команд нечеткой реляционной алгебры, доказано их свойство вполне определенности.

Продемонстрированы нечеткие Булевы запросы для модели Buckles и Petry и применены для случая размытых чисел.

В главе П рассмотрен вопрос расширения модели Buckles и Petty с отношениями близости и нормальным нечетким множеством, показано, что понятие отношения близости, предлагаемое Shenoi и Melton, является обобщением понятия отношения подобия. Кроме того, в этой главе исследован непроцедурный язык запросов для основанной на отношениях близости нечеткой реляционной модели баз данных.

В II.1 объясняется, как отношения близости, определенные на конечных скалярных доменах, использованы для разделения доменов на непересекающиеся блоки информации. Показано, что отношение близости является отношением эквивалентности, т. е. оно делит каждый домен на классы эквивалентности. Выяснено, что этот подход обобщает подход Bucles и Petty.

Свойства доменов нечетких чисел

Параграф Ш.З связан с нечеткой реляционной структурой относительно модели классов эквивалентности. Сформулирована группа операций реляционной алгебры и доказано, что эти операции сохраняют свойство вполне определенности.

В главе IV исследованы нечеткие функциональные и многозначные зависимости для модели классов эквивалентности, определены связанные с ними нечеткие нормальные формы.

В IV.2 введены основные концепции: частный домен, нечеткий кортеж, а -избыточность, схема нечеткого отношения, операция слияния избыточных кортежей, операция слияния по эквивалентности, одноуровневая и многоуровневая нечеткая реляционная база данных. Показана структурированная решеткой нечеткая реляционная схема базы данных.

В IV.3 определены функциональные зависимости в терминах а-избыточности в проверена их непротиворечивость по отношению к понятию классических зависимостей, т.е., последние являются частным случаем нечетких функциональных зависимостей (НФЗ). Показано преимущество этого подхода по сравнению с подходом, предложенным Raj и и Majumdar [112]. Проверена правильность и полнота аксиом Армстронга, а также верность дополнительных правил вывода. Определены понятия ключа и суперключа в терминах нечетких функциональных зависимостей.

Исследование нечетких многозначных зависимостей проведено в IV.4. Как функциональная зависимость, нечеткая многозначная зависимость построена на основе а -избыточности. Она охватывает традиционную многозначную зависимость в том смысле, что последняя представляет собой частный случай нечеткой многозначной зависимости (НМЗ). Проверена правильность и полнота множества правил вывода для НМЗ.

На основе изучения структуры НФЗ и НМЗ в IV.5 предложены определения первой, второй, третьей, четвертой нечетких нормальных форм и нечеткой нормальной формы Boyce-Codd для схем одноуровневых и многоуровневых нечетких реляционных баз данных.

В параграфе IV.6 коротко и формально изложена проблема нормализации и раскрыты два ограничения на уровни точности информации по сравнению с нормализацией схем традиционных реляционных отношений.

В главе V предложен метод представления, хранения и обработки информации для случая, когда на каждом домене отношения присутствуют одновременно четкие и нечеткие значения, причем последние состоят из нормальных нечетких множеств и лингвистических значений. Построена группа операций нечеткого сравнения, совместно использующая носители и функции принадлежности конечных нечетких множеств. Продемонстрировано применение этих операции в командах нечеткой реляционной алгебры. Таким образом, предложена нечеткая реляционная модель баз данных.

Ключевые идеи в теории традиционных реляционных баз данных могут быть найдены в [10, 77]. Традиционная реляционная база данных состоит из одной или более двумерных таблиц, называемых отношениями. Строки отношений называются кортежами и столбцы - атрибутами. Описания расширений, приводящих к нечеткой реляционной модели данных, развитые в [66-69,72], рассмотрены ниже.

Для каждого атрибута Aj в реляционной базе данных, базовое множество домена Dj всегда известно. Домен - набор допустимых значений для одного или нескольких атрибутов. Значениями домена для реляционных баз нечетких данных могут быть дискретные скаляры (взятые из конечного множества) или нечеткие числа. Пример конечного скалярного домена -множество {бедный, средний, хороший, превосходный]. Значениями домена конкретного кортежа могут быть отдельные скаляры, отдельные нечеткие числа, последовательности скаляров, или последовательности нечетких чисел.

Подразумеваемое отношение идентичности на у, используемое в четких реляционных базах данных порождает классы эквивалентности (обычно множества с единственным элементом), затрагивающие результат некоторых операций и удаления избыточных кортежей. Отношение идентичности заменено в нечеткой реляционной базе данных явно объявленным отношением подобия, для которого идентичность является частным случаем. ОПРЕДЕЛЕНИЕ 1.1 [бб]. Отношением подобия, $/. DJX Dj-+ [0,1], является такое отображение, что Ух, у, z є Dj (і) Sj{x, х) — 1 (рефлексия). (іі) Sj{x, у) = s/y, х) (симметрия). (ііі) Sj{x,z) max {nan[sj(pc, y\ s/y, z)])}(max-min транзитивность).

Отношения близости и конечные скалярные домены

Пусть Р - некоторое разделение домена D на подмножества. С каждым разделением Р на D связано отношение эквивалентности р на D (р -подмножество прямого произведения D х Д и по определению отношения эквивалентности, р рефлексивно» симметрично, и транзитивно). Имеет место связь между Р и р: если хг уєОл то х и у находятся в том же самом подмножестве, полученном в результате разделения, если и только если х р у. Каждое подмножество в разделении называется классом эквивалентности.

Элементы в данном классе эквивалентности близко связаны (относительно данного применения). Классы эквивалентности могут быть определены через отношения подобия, отношения близости, или конечные домены нормальных нечетких множеств.

Принимая во внимание, что Bucles (В.) и Petry (Р.) используют а-уровни точности относительно отношений подобия и нечетких чисел, а Shenoi и Melton используют их абстрактно: с а- уровнем точности можно представить любое отношение близости или сходства элементов в доменах базы данных, пока компонент а определяет разделение Р на D Ключом для сохранения важных свойств реляционной базы данных в ее нечеткой модели является способность разделения доменов согласно уровням точности. Чтобы развивать числовую модель, соответствующую схеме Buckles и Petry, уровни точности выбраны в интервале [ОД] наряду с числовыми значениями также в интервале [ОД] для выражения степени близости между элементами в конечных скалярных доменах базы данных. (Свойство конечности должно гарантировать, что разделение будет закончено в конечное время). Разделение доменов базы данных выполняется относительно уровней заданной точности,

Отношение близости обеспечивает удобную схему выражения степеней близости между элементами домена. Рефлексия и симметрия - очень подходящие свойства в этом применении. В дополнение к обеспечению интуитивно привлекательного подхода для выражения степеней близости между элементами, эти свойства играют критическую роль в определении отношений эквивалентности на конечных скалярных доменах. Они необходимы, чтобы определить а-подобие и z-близость (см. например [69)]. Ради простоты, нижние индексы домена будут опущены в последующем. ОПРЕДЕЛЕНИЕ 1.2. Если 8 - отношение близости на Д то для любого данного значения а [О,1], два элемента хг у D- а-подобны (обозначение: х$аУ) если и только если s(x, у) а, ОПРЕДЕЛЕНИЕ 1 3- Если & - отношение близости на D и дано любое значение а с [0,1], то два элемента х, z є D а-близки (обозначение: х Si z), если и только если х Sa z или существует последовательность У и Уь - Уг D такая, что х Sa У і Sa Уг -» $а Уг а & Ключевой результат - а-близость является отношением эквивалентности. Другими словами» а-близость может использоваться в разделении домена согласно уровню точности. ЛЕММА 1.Щ17]. Если з: D х D -+ [0,1] - отношение близости, то S отношение эквивалентности, то есть, оно разделяет D, для V а с [0,1]. Доказательство. Дня доказательства леммы необходимо доказать, что является рефлексивным, симметричным, и транзитивным для любого а [0, 1]. Эти свойства следуют непосредственно от определений отношения близости и а-близости. Влияние рефлексивных и симметричных свойств в определении отношения эквивалентности теперь очевидно. Каждый элемент домена должен существовать в блоке (или в классе эквивалентности) на любом уровне точности (то есть, для любого элемента х, отношение xS x должно выполняться для всех значений а и для всех поддоменов , содержащих элемент ). Только рефлексия гарантирует это свойство и поэтому является необходимой. Симметрия, с другой стороны, не абсолютно необходима. Допустимо, чтобы s(xty) отличалось от s(y,x); степень близости может измеряться нормальным нечетким отношением [82]. Однако» так как симметрия должна присутствовать для обеспечения отношения эквивалентности, необходимо добиваться симметрии от нормального нечеткого отношения (например, используя минимум из двух значений). Это по существу преобразовывает нормальное нечеткое отношение к отношению близости. Продемонстрировав, что а-близость делит конечные скалярные домены с отношениями близости, необходимо проверить, что свойство поддержания классов эквивалентности служит для разделения, созданных с а-близостью- Следующая лемма демонстрирует, что свойство вложенности удовлетворено. ЛЕММА 1.2 [117]. Для V#, Vy «Д еслиж; у и а а\ to xS y. Доказательство Результат следует непосредственно от определения а-близости Леммы 1.1 и L2 показывают, что два предположения, необходимые в реляционной модели базы нечетких данных удовлетворены благодаря использованию л-близости на конечных скалярных доменах базы данных со связанными отношениями близости. Таким образом, мы установили, что желательные свойства классической реляционной модели БД сохраняются в рассматриваемом случае.

Классы эквивалентности и неточная информация

Допущение компонентам кортежа быть подмножествами доменов базы данных - привлекательная схема представления неточной информации. Количество элементов компонента кортежа - мера неточности сохраняемой информации: большое подмножество - более неточная информация. Интуитивно ясно, что для к-ого компонента кортежа, полный домен Z соответствует информации худшего качества, и подмножества с единственным элементом Dt представляют данные самой высокой точности. Пустое множество не имеет никакого значения в этой структуре и поэтому не является действительным значением для компонентов кортежа.

Так как структура нечетких кортежей существенно отличается от структуры классических кортежей, важно гарантировать, что некоторые критические свойства классических реляционных баз данных сохранены в нечеткой модели. Рассматриваемые свойства включают избыточность, уникальность представления и четкость (вполне определенность) реляционной алгебры. Сохранение этих свойств гарантирует, что мощь классических реляционных баз данных сохраняется наряду со способностью иметь дело с неточностью.

В своих работах по нечетким реляционным базам данных Buckles и Petty [66-69] демонстрировали, что желательные свойства классической модели сохранены для нечетких отношений базы данных, использующих два вида доменов: простые скалярные (дискретные конечные) домены с отношениями подобия и домены специальных нечетких чисел. Впоследствии, эти домены Shenoi и Melton показывали в качестве примеров простых скалярных доменов со связанными отношениями близости [1 loll 8]. В каждом случае разделение доменов базы данных на классы эквивалентности является ключом к сохранению основных свойств, присущих классической модели.

Классы эквивалентности могут быть определены на скалярных доменах без предположения существования отношений близости или подобия. Кроме того, так как разделение домеыов на классы эквивалентности - ключ к сохранению свойств, присущих классической модели [117], оно является естественным и заслуживающим, чтобы определить модель классов эквивалентности для нечетких реляционных баз данных. Поэтому в этой главе мы рассматриваем конечные домены базы данных со связанными отношениями эквивалентности. В этой модели определим реляционную структуру и связанные операции манипуляции данными, заменяя атомные значения данных подмножествами классов эквивалентности. 2. Классы эквивалентности и неточная информация

Основная стратегия работы с неточностью в нечеткой реляционной модели базы данных состоит в том, чтобы разрешить каждой компоненте кортежа быть непустым множеством значений, взятых из соответствующего домена базы данных. При использовании множеств значений для того, чтобы выражать неточную информацию, удобно рассматривать элементы, составляющие компонент кортежа, как неразличимые друг от друга на указанном уровне точности. Увеличение неточности может заставить больше элементов домена быть неразличимыми. Каждый из этих компонентов может интерпретироваться как представление "куска" информации, включающей элементы домена, неразличимые друг от друга на указанном уровне точности.

Идея группировать в доменах базы данных куски неразличимых элементов ведет естественно к понятиям разделения домена и классов эквивалентности; это объясняется тем, что элементы являются неразличимыми относительно некоторых критериев, когда они эквивалентны относительно тех же самых критериев. Разделение домена & является собранием непустых непересекающихся подмножеств в А, названных классами эквивалентности, с таким свойством, что каждый элемент в Dk находится в одном из классов эквивалентности. Отношение эквивалентности, то есть рефлексивное, симметрическое и транзитивное подмножество в Dk х Dk, определяет разделение на . Связь между разделением и соответствующим отношением эквивалентности, р, следующая: для любых х, у є Dk х и у находятся в том же самом подмножестве в разделении, если и только если х р у. В рассматриваемой структуре, один класс эквивалентности представляет кусок неточной информации, включающий элементы домена, неразличимые друг от друга на данном уровне точности.

Разделение доменов базы данных в классы эквивалентности также существует в классической реляционной модели базы данных. Фактически, классическое отношение - нечеткое отношение, в котором каждый кусок информации является отдельным элементом, то есть, каждый класс эквивалентности имеет точно один элемент. Эти множества единственного элемента, выражая информацию самой высокой точности, соответствуют атомным значениям, требуемым классической реляционной моделью.

В каждый конкретный момент отношение базы данных, обозначаемое г(Л), не может использовать всех элементов его доменов, присутствующих в компонентах соответствующего кортежа. Это наблюдение важно, потому что качество информации, которое может быть извлечено из базы данных в любой момент, зависит от фактической присутствующей информации. Чтобы подчеркнуть этот частичный характер базы данных, стандартные домены заменены множествами текущих значений. Эти домены, названные частными доменами, содержат только элементы оригинальных доменов, связанные с кортежами в отношении.

Функциональные зависимости (ФЗ)

Естественный подход к выражению неточной или абстрактной информации в нечетких реляционных базах данных состоит в том, чтобы разрешить каждому компоненту кортежа быть непустым множеством значений, взятых из соответствующего домена базы данных (см., например, [66])- В этом подходе компонент кортежа интерпретируется как представление "куска" информации на некотором уровне точности. Кусок информации включает элементы домена, неразличимые друг от друга на данном уровне точности- Так как уменьшение уровня точности может кончиться большим количеством элементов домена, являющихся неразличимыми друг от друга, то, чем ниже уровень точности, тем потенциально больше компоненты кортежа. Таким образом, множества с единственным элементом выражают информацию самой высокой точности, я полный домен представляет самую неточную информацию. Пустое множество Ф не имеет никакого значения в этом контексте; поэтому, оно -недопустимое составляющее значение. В то же время, мы предполагаем, что полный домен (соответствующий информации худшего качества) по существу представляет неизвестное значение.

Разделение доменов базы данных в классы эквивалентности является ключом для сохранения нескольких важных свойств классической модели. Модель Shenoi и Melton, основанная на классах эквивалентности в результате разделения конечных доменов, непосредственно расширяет подход Buckles и Petty. Кроме применения отношения подобия и нормальных нечетких множеств, любые критерии для того, чтобы разделять домены базы данных могут использоваться в нечеткой реляционной модели; только разделения достаточно, чтобы гарантировать сохранение классических свойств. Модель классов эквивалентности обеспечивает мощную структуру для исследования свойств нечетких реляционных баз данных. Фактически, поскольку домен классической базы данных с атомными значениями рассматривается как домен нечеткой базы данных с классами эквивалентности имеющими единственное значение, классическая модель является специальным случаем модели классов эквивалентности. Следовательно, естественно возникает вопрос, какие классические свойства могут быть расширены от понятий, основанных на атомных значениях к понятиям, основанным на классах эквивалентности. В работах [117,119], авторы расширили классические понятия кортежа, избыточности, согласованных (допустимых) отношений базы данных и реляционной алгебры. В этой работе, мы используем понятие классов эквивалентности для формулировки функциональных и многозначных зависимостей и нормальных форм. Как в случае других свойств, определения функциональных и многозначных зависимостей н нормальных форм также обобщают соответствующие классические понятая.

Формулировка понятий функциональных зависимостей и нормальных форм является важным развитием в модели классов эквивалентности. Традиционные функциональные и многозначные зависимости определяют ограничения на данные, присущие базам данных и связанные нормальные формы представляют руководящие принципы для разработки "хороших" баз данных относительно этих ограничений. Так как потенциальные аномалии также существуют в нечетких отношениях» понятия классов эквивалентности функциональных и многозначных зависимостей и нормальные формы обеспечивают ценные руководящие принципы для того, чтобы разработать "одинаково хорошие" нечеткие базы данных, воплощающие неточную или абстрактную информацию. Таким образом, факт, что, определения классов эквивалентности обобщают их классические аналоги, приобретает дополнительное значение. Теперь возможно объединить обработку точной и неточной информации и в то же самое время, гарантировать отсутствие аномалий в обобщенных отношениях. 2. Предварительные концепции

Существующая стратегия выражения неточной информации базируется на идее разделения конечных доменов базы данных на куски элементов, которые являются неразличимыми на данном уровне точности (или неточности). Снижение уровня точности приводит к увеличению кусков. Эти идеи формально выражены в терминах классов эквивалентности, полученных от разделения доменов. Разделение домена - собрание непустых непересекающихся подмножеств или классов эквивалентности в Dk со свойством» что каждый элемент в Dk находится точно в одном из классов эквивалентности. Каждый класс эквивалентности является собранием элементов домена, неразличимых друг от друга на определенном уровне точности- Этот уровень точности, в некотором смысле, ограничен разделением.

При хранении неточной информации в отношениях базы данных, важно знать о некотором частичном характере информации базы данных. В любой момент, база данных не может иметь всех элементов ее доменов, связанных с компонентами кортежа. Это наблюдение существенно, потому что» качество информации, восстановленной из базы данных, может зависеть от фактической присутствующей информации.

Похожие диссертации на Некоторые расширения в теории нечетких реляционных баз данных