Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей Зуенко Александр Анатольевич

Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей
<
Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей
>

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Зуенко Александр Анатольевич. Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей : диссертация ... кандидата технических наук : 05.13.11 / Зуенко Александр Анатольевич; [Место защиты: С.-Петерб. ин-т информатики и автоматизации РАН].- Апатиты, 2009.- 159 с.: ил. РГБ ОД, 61 09-5/3223

Введение к работе

Актуальность темы диссертации

Современные системы моделирования, как правило, предоставляют возможности исследования слабо формализованных предметных областей, для которые не сущес-шует аналитических моделей. Такие системы позволяют не только настраивать отдельные параметры модели, но и оперативно менять ее структуру, добавляя/удаляя элементы по мере накопления знаний о предметной области. В связи с постоянным усложнением модели возникает необходимость использования новых программных модулей, реализующих более совершенные алгоритмы расчетов. Таким образом, программный комплекс, поддерживающий проведение моделирования, должен проектироваться открытым как для оперативных модификаций структуры модели, так и для включения новых элементов из вычислительной среды. Сам процесс построения модели происходит поэтапно. Вначале проектируется "скелет" модели, позволяющий решать небольшую часть задач. В дальнейшем эта приближенная модель уточняется путем дополнения новыми деталями и выбора тех алгоритмов из общего набора, которые необходимы и достаточны для конкретного варианта расчетов.

Ввиду открытости модели возникает необходимость реализовывать незапланированные запросы к базе данных системы моделирования, так как невозможно заранее предугадать информационные потребности подключаемых программных модулей. Целесообразно автоматически осуществлять проверку самой модели и запросов к ней, чтобы своевременно выявлять некорректные конструкции, например, ошибки при редактировании модели или подключении модулей, и, тем самым, гарантировать точность результатов запросов и корректность процесса моделирования.

Тем не менее, в большинстве систем моделирования обеспечение корректности модели остается задачей конечного пользователя. На общем фоне выгодно отличаются системы концептуального моделирования, автоматизирующие проверки структуры модели, но и в них отсутствуют средства анализа незапланированных запросов. Кроме того, в существующих системах моделирования рассматриваются только ограничения, очерчивающие допустимые модели, и не учитываются ограничения, специфичные для конкретной предметной области. Причина перечисленных недостатков, по мнению автора, состоит в том, что ограничения на модель "жестко зашиты" в специализированных процедурах проверки и не могут быть ни модифицированы в процессе эксплуатации системы моделирования, ни использованы в других целях, в частности, при анализе запросов.

Многие недостатки существующих систем моделирования можно преодолеть путем создания семантического интерфейса, существенно дополняющего стандартные функции СУБД средствами анализа незапланированных запросов и контроля корректности модели на уровне БД. Предлагается уточнять запрос до стадии его исполнения, основываясь на упомянутых ограничениях и пользовательских правилах оптимизации запроса. Это составляет главное отличие предлагаемого подхода от методов семантической обработки данных, типичных для документальных поисковых систем Semantic Web, где пространство поиска, наоборот, расширяется посредством логического вывода, что вызывает необходимость участия пользователя в окончательном выборе интересующей его информации.

Потребность оперативно изменять модель предметной области обусловливает применение реляционных СУБД при организации семантического интерфейса, поскольку они обеспечивают корректность модификаций данных за счет механизма ссылочной целостности. Однако на данные моделирования целесообразно накладывать ограничения, отличные от ограничений целостности реляционных СУБД, в которых семантическая составляющая развита слабо. Такие ограничения часто можно представить в виде логических формул. "Расширенные" или семантические модели (например, ER, RM/T), которые используют в качестве базовой реляционную модель, также не позволяют работать со структурами, типичными для баз знаний (логические формулы, продукции). В диссертационной работе предлагается использовать семантические модели данных для декларативного представления концептуальной схемы реляционной БД, что облегчает ее проектирование и автоматическую генерацию. Такое представление БД позволяет естественным образом накладывать ограничения на сложно

структурированные данные. Дополнив семантическую модель подобными ограничениями, а также пользовательскими правилами оптимизации запроса, необходимо разработать формальную основу для программно-алгоритмической реализации процедур анализа БД и незапланированных запросов.

Изложенное обосновывает следующую формулировку цели выполненных автором исследований и разработок.

Цель работы состоит в совершенствовании процессов построения, развития и использования инструментов контроля корректности модели и незапланированных запросов при исследовании слабо формализованных предметных областей путем разработки математического и программно-алгоритмического обеспечения процедур семантической обработки информации в реляционных базах данных систем моделирования.

Для достижения этой цели решены перечисленные ниже Задачи исследования

  1. Анализ существующих средств хранения и семантической обработки данных в современных информационных системах.

  2. Разработка декларативного способа представления схемы БД, ограничений на данные моделирования, а также пользовательских правил оптимизации запросов в виде специализированной базы знаний.

  3. Разработка процедуры автоматической синхронизации открытой модели предметной области и базы данных системы моделирования с возможностью дополнительного контроля модели на уровне БД.

  4. Создание метода анализа незапланированных запросов к семантизированной базе данных, гарантирующего соответствие их результатов пользовательским ограничениям на данные моделирования.

  5. Автоматизация процедур семантического анализа незапланированных запросов.

  6. Программно-алгоритмическая реализация семантического интерфейса реляционных баз данных для систем моделирования слабо формализованных предметных областей.

Методы исследования

Для решения поставленных в работе задач используются методы искусственного интеллекта, концептуального моделирования, элементы теории множеств, теории графов, математической логики. Положения, выносимые на защиту

  1. Модель базы знаний, содержащая семантическую модель данных, ограничения на данные, правила оптимизации запросов.

  2. Контекстно-ориентированный подход к отбору ограничений, актуальных для исследуемой модели предметной области.

  3. Метод семантических преобразований и анализа незапланированных путевых запросов на основе контекстов, а также средства автоматизации процедуры анализа запросов с помощью разработанной алгебры условных кортежей.

  4. Практическая реализация семантического интерфейса баз данных для систем моделирования слабо формализованных предметных областей.

Научная новизна

  1. Разработана модель базы знаний, специализированная для анализа незапланированных запросов. Она отличается от "расширенных" моделей данных (ER, RM/T) тем, что позволяет задавать правила семантической оптимизации и учитывать, помимо ограничений ссылочной целостности, дополнительные ограничения, представимые в виде логических формул над элементарными одно- и двуместными предикатами без кванторов.

  2. Предложен контекстно-ориентированный подход к управлению знаниями, отличающийся применением контекста для отбора только тех ограничений, которые актуальны для исследуемой в текущий момент модели предметной области. Это позволяет декларативно описывать и оперативно анализировать как ограничения, общие для всего класса допустимых моделей, так и специфичные для конкретной предметной области.

  3. Предложен метод семантических преобразований и анализа незапланированных запросов на основе контекстов, отличающийся от методов поиска Semantic Web тем, что

область поиска сужается с учетом ограничений на данные моделирования. Это позволяет выявлять некорректность запроса до стадии его исполнения и гарантировать соответствие результатов запроса указанным ограничениям. Метод дает возможность выявлять ошибки в работе системы моделирования, возникающие в результате подключения новых программных модулей.

4. Разработана алгебра условных кортежей, которая, в отличие от реляционной алгебры и алгебры кортежей, позволяет использовать в качестве значений атрибутов отношений не только константы и одноместные предикаты, но и двуместные предикаты, и, соответственно, расширить возможности автоматизации логического анализа данных.

Научная новизна работы подтверждена включением ее результатов в исследования по Программе фундаментальных научных исследований Отделения нанотехнологий и информационных технологий РАН (проект 2.3) и Программе № 3 Президиума РАН (проект № 4.3 "Интеллектуальные базы данных"). Обоснованность и достоверность

Обоснованность и достоверность научных положений, основных выводов и результатов диссертации обеспечивается за счет тщательного анализа состояния исследований в данной области, подтверждается корректностью предложенных решений, а также всесторонней апробацией основных теоретических положений диссертации в печатных трудах и докладах на Всероссийских научных конференциях, положительными результатами практического использования разработанной системы в различных отечественных организациях. Практическая ценность работы

На этапе проектирования системы моделирования предложенные программные средства способствуют ускорению разработки инструментов контроля корректности. С использованием предложенной модели базы знаний представление ограничений на модель предметной области становится декларативным и появляется возможность применять их не только для анализа самой модели, но и при проверке незапланированных запросов. Модификация контекстно-ориентированного подхода для управления знаниями в системах моделирования даст возможность учитывать и оперативно анализировать как ограничения, общие для всех допустимых моделей, так и ограничения, специфичные для конкретной предметной области.

В процессе эксплуатации системы моделирования разработанные методы и алгоритмы позволяют организовать автоматическую проверку модели предметной области на уровне ее структуры и выявлять некорректности при обращении к данным со стороны подключаемых программных модулей. Разработанный метод семантического анализа незапланированных запросов на основе контекстов позволяет исключить некорректные обращения к реляционной СУБД.

Использование семантического интерфейса способствует уменьшению трудозатрат на модификацию и ввод ограничений в систему моделирования. Реализация результатов работы

Результаты проведенных исследований применены в следующих разработках:

  1. Система моделирования региональной энергетики, созданная в рамках хоздоговоров с ЦЭС ОАО "Колэнерго".

  2. Информационная система моделирования и прогнозирования безопасности на опасном объекте (хвостохранилище) АНОФ-2, созданная при выполнении хоздоговора с ОАО "Апатит".

  3. Система баз данных, способствующая оперативной диагностике состояния горного массива рудника "Карнасурт" и разработанная в рамках хоздоговора с Горным институтом КНЦ РАН.

  4. Учебные курсы "Представление знаний в информационных системах", "Теория принятия решений" в Кольском филиале Петрозаводского государственного университета.

В основу диссертационной работы положены результаты, полученные автором в ходе исследований по планам научно-исследовательских работ Института информатики и математического моделирования Кольского научного центра РАН в период 2006-2009 гг.: "Ситуационный синтез стратегий устойчивого развития региональных промышленных комплексов с учетом техногеино-природных рисков", гос.рег. № 01.20.06 03210, "Модели и

методы координации решений по управлению региональным промышленно-природным комплексом" гос.рег. № 01.2.00 951211. Апробация работы

Основные результаты и положения диссертационной работы докладывались и обсуждались на пятой и седьмой Всероссийской школе-семинаре "Прикладные проблемы управления макросистемами" (Апатиты, 2004 г. и 2008 г.), второй и третьей Всероссийской научной конференции "Теория и практика системной динамики" (Апатиты, 2007 г. и 2009 г.), одиннадцатой национальной конференции по искусственному интеллекту с международным участием КИИ-2008 (Дубна, 2008 г.), четвертой школе молодых ученых "Сбалансированное природопользование" (Апатиты, 2007 г.), девятнадцатой конференции молодых ученых, посвященной памяти члена-корреспондента, профессора К.О. Кратца "Геология и геоэкология: исследования молодых" (Апатиты, 2008 г.). Публикации

По теме диссертации опубликовано 14 печатных работ (из них 4 - в списке ВАК). Структура и объём работы

Диссертация состоит из введения, четырех глав, заключения, списка литературы (123 наименования). Общий объем - 159 печатных страниц, в том числе 15 рисунков, 11 таблиц и 1 приложение.

Похожие диссертации на Семантический интерфейс реляционных баз данных в системах моделирования для слабо формализованных предметных областей