Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных Комар Феликс Викторович

Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных
<
Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных
>

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Комар Феликс Викторович. Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных : диссертация ... кандидата технических наук : 05.13.11 / Комар Феликс Викторович; [Место защиты: Воронеж. гос. техн. ун-т].- Липецк, 2009.- 137 с.: ил. РГБ ОД, 61 09-5/3151

Введение к работе

Актуальность темы. Для решения задачи интеграции баз данных необходимо решение двух подзадач: интеграция схем баз данных и интеграция самих данных. Задача интеграции данных может быть решена с использованием нестрогого соединения реляционных таблиц. Задача интеграции схем баз данных требует отождествления объектов схем баз данных. В настоящее время нет методов, автоматически решающих эту задачу.

Наиболее известны два основных подхода к решению задачи отождествления объектов схем баз данных (объектами схем баз данных являются сущности, их атрибуты и связи между сущностями). Первый подход основан на расчете расстояния между строковыми значениями (названиями отношений, названиями атрибутов, значениями атрибутов и т.д.). Данный подход в очень малой степени учитывает семантику объектов и далеко не всегда дает удовлетворительные результаты. Второй подход основан на' построении онтологии предметной области рассматриваемых схем баз данных. Такой подход требует больших трудозатрат и слабо поддается автоматизации. Ни один из существующих методов не позволяет строить отождествления составных атрибутов.

Одним из способов описания синтаксических особенностей строк являются строковые шаблоны. Однако в настоящее время нет алгоритмов, решающих задачу автоматического построения шаблона, описывающего заданное множество строк. Разработка алгоритма решения такой задачи позволит автоматически строить обобщенную характеристику объектов схем баз данных в виде множества строковых шаблонов, а уже на основе этой характеристики определять сходство объектов. Также на текущий момент окончательно не решена задача автоматического отождествления объектов схем баз данных.

Таким образом, актуальна проблема разработки и внедрения специального математического и программного обеспечения, которое позволит решать задачи автоматического построения обобщенной характеристики объектов схем баз данных, определения сходства объектов, а также построения отождествлений объектов схем баз данных, в том числе и составных атрибутов. Разработка такого математического и программного обеспечения позволит снизить затраты и ускорить процесс интеграции баз данных.

Работа выполнена в соответствии с научным направлением ГОУ ВПО «Липецкий государственный технический университет» «Информационные системы и базы данных».

Цель исследования состоит в разработке специального математического обеспечения для автоматизированного отождествления объектов схем баз данных и создании на его основе программного обеспечения.

Задачи исследования:

- анализ методов и моделей, возникающих при автоматизированном : отождествлении объектов схем баз данных;

; - разработка способов, моделей и алгоритмов автоматического построения

обобщенной характеристики, численной оценки сходства и отождествления объектов схем баз данных, в том числе и составных атрибутов;

разработка специального программного обеспечения для автоматизированного отождествления объектов схем баз данных;

анализ разработанного математического и программного обеспечения, а также решение задач отождествления объектов схем баз данных при реализации проекта интеграции информационных систем производственного холдинга.

Методы исследования базируются на теории множеств, теории графов, дискретной математике, математической статистике, эволюционном моделировании, объектно-ориентированном программировании, реляционной алгебре, теории баз данных, методах модульного и структурного программирования.

Научная новизна результатов исследования. В работе получены следующие результаты, характеризующиеся научной новизной:

способ описания строковых атрибутов сущностей схем баз данных, позволяющий формально представлять синтаксические особенности рассматриваемых атрибутов, отличающийся использованием в качестве обобщенной характеристики множества строковых шаблонов;

функция численной оценки значимости строкового шаблона, отличающаяся использованием частоты появления рассматриваемого шаблона на множестве значений строкового атрибута, позволяющая свести задачу построения обобщенной характеристики строкового атрибута к оптимизационной задаче;

функция численной оценки сходства объектов схем баз данных, отличающаяся использованием в качестве обобщенной характеристики множества строковых шаблонов, позволяющая оценивать сходство объектов на основе множества экземпляров объектов;

алгоритм отождествления объектов схем баз данных, отличающийся применением численной оценки сходства объектов на основе обобщенной характеристики в виде строковых шаблонов, позволяющий строить отождествления составных атрибутов.

Практическая значимость состоит в создании на основе разработанных методов и алгоритмов специального программного обеспечения, позволяющего автоматизировано отождествлять объекты схем баз данных. Использование данного программного обеспечения позволяет сократить время, требуемое для интеграции схем баз данных. Предложенные методы могут быть использованы для решения задачи интеграции баз данных.

Реализация и внедрение результатов работы. Разработанное программное обеспечение внедрено при реализации проекта интеграции информационных систем предприятий холдинга ООО «ПРОДО Менеджмент» компанией 000 «Л-ком», а также прошло апробацию при реализации проекта интеграции информационных систем 000 «Дойче банк».

Программное обеспечение зарегистрировано в Государственном фонде алгоритмов и программ.

Результаты диссертационной работы используются в учебном процессе ГОУ ВПО «Липецкий государственный технический университет» при подготовке инженеров по специальности «Прикладная математика».

Апробация работы. Теоретические и практические результаты, полученные в процессе исследования, докладывались и обсуждались на ХІ-й

Международной научно-практической конференции «Проблемы экологии и экологической безопасности Центрального Черноземья РФ» (Липецк, 2007), Межрегиональном молодёжном научно-практическом форуме «Молодежная инициатива - 2007» (Липецк, 2007), Всероссийской электронной научной конференции «Современные системы автоматизации» (Москва, 2007), ХШ-й Международной открытой научной конференции «Современные проблемы информатизации» (Воронеж, 2008), ІХ-й Всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (Улан-Удэ, 2008), V Всероссийской школе-семинаре молодых ученых «Управление большими системами» (Липецк, 2008).

Положения работы поддержаны грантами Российского фонда фундаментальных исследований № 05-01-96402 "Совершенствование методологии проектирования информационных систем для управления производственными объектами", № 07-07-96403 "Разработка специальных реляционных операций и алгоритмов для отождествления объектов в распределенных информационных системах".

Публикации. По теме диссертационной работы опубликовано 14 научных работ, в том числе 2 - в изданиях, рекомендованных ВАК РФ.

В работах, опубликованных в соавторстве и приведенных в конце автореферата, лично соискателю принадлежат: [2] — алгоритм решения задачи максимизации функции значимости строкового шаблона; [3] - метод формального описания синтаксических особенностей строковых атрибутов сущностей баз данных с использованием множества строковых шаблонов; [5] - архитектура классов для реализации специального программного обеспечения; [6] - алгоритм поиска множества строковых шаблонов для формального описания синтаксических особенностей значений атрибутов реляционных баз данных; [7] -функция оценки значимости строкового шаблона; [11] - анализ качества методов интеграции схем баз данных и сравнительный анализ с существующими методами; [12] — алгоритм выбора пар объектов схем данных для отождествления.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, библиографического списка из 124 наименований, 2 приложений. Основная часть работы изложена на 132 страницах, содержит 33 рисунка и 1 таблицу.

Похожие диссертации на Разработка математического и программного обеспечения для автоматизированного отождествления объектов схем баз данных