Введение к работе
Актуальность темы. Непрерывный рост объемов баз данных ставит на повестку дня задачу разработки эффективных параллельных СУБД. Реальные финансовые ограничения заставляют искать альтернативу мэйнфреймовым платформам. Хорошей альтернативой является кластерная технология. Использование аппаратно-программного обеспечения широкого применения (ПК-кластеры или Beowulf-технология) еще более актуализирует эту задачу.
Научная задача диссертационной работы. Разработка и исследование высокоэффективных кластерных параллельных СУБД, реализованных по Beowulf-технологии.
Цель работы: Построение математических моделей, создание комплекса программ и выработка практических рекомендаций по построению ПК-кластеров баз данных (БД). Решение общей научной задачи и достижение поставленной цели связывается с решением следующих частных задач:
Обобщение мирового опыта построения параллельных СУБД кластерного типа и решение на этой основе задачи внешнего моделирования.
Построение процедурной модели синтеза ПК-кластеров БД как необходимой компоненты внутреннего моделирования.
Разработка с учетом мирового опыта исследовательского прототипа параллельной СУБД как одной из основных компонент внутреннего моделирования и как инструментального средства модельного исследования.
Установление закономерностей для границ масштабируемости ПК-кластеров БД, фактов существования в общем случае решения задачи поиска релевантной базы знаний и эффективности предложенной процедурной модели в процессе модельного эксперимента.
Методы исследований. Решение указанных задач проводилось на основе методологии конструктивного моделирования систем с использованием методов модальной и нечеткой логик, семантики Крипке, методов обработки результатов эксперимента, теории временных рядов. Для установления релевантности предложенной темпорально-нечеткой процедурной модели был разработан исследовательский прототип параллельной СУБД Clusterix с использованием методов параллельного программирования.
Научная новизна работы.
Развитие элементов теории параллельных СУБД на платформе ПК-кластеров.
Использование парадигмы внешних параметров и нечеткая трактовка темпоральности в контексте семантики Крипке при построении процедурной модели синтеза параллельной СУБД кластерного типа. Установление факта существования в общем случае решения задачи поиска релевантной базы знаний для этой модели.
Выявление зависимости границы масштабируемости ПК-кластеров БД от объемов баз данных.
Достоверность результатов работы. Задача внешнего моделирования решена с привлечением мирового опыта. Разработанная программная система Clusterix верифицирована на множестве тестов с заведомо известными результатами. Релевантность предложенной модели подтверждена экспериментально. Сформулированные утверждения строго доказаны. Достоверность высказанных гипотез установлена опытным путем.
Практическая значимость.
Разработанный исследовательский прототип параллельной СУБД Clusterix после его доведения до уровня действующего прототипа может быть использован для решения практических задач, требующих больших вычислительных мощностей.
Разработанная процедурная модель синтеза кластера баз данных может быть использована при построении подсистемы динамической реконфигурации параллельной СУБД.
Результаты диссертации внедрены в учебный процесс КГТУ им. А.Н.Туполева (КАИ) как учебное пособие «Параллельные СУБД. Компьютерный практикум». Его успешная апробация проведена на лабораторных занятиях по дисциплине «Параллельные вычисления» в весеннем и осеннем семестрах 2007 г.
На защиту выносятся следующие результаты:
систематика исследований в области параллельных СУБД и решение задачи внешнего моделирования;
темпорально-нечеткая процедурная модель синтеза ПК-кластеров БД;
разработка исследовательского прототипа параллельной СУБД Clusterix;
результаты модельных исследований.
Апробация работы. Основные результаты работы докладывались и обсуждались на Казанском научном семинаре «Методы моделирования» (Казань, 2001-2007 гг.); V Международной научно-технической конференции «Новые информационные технологии и системы» (Пенза, 2002 г.); Международной научно-технической конференции IEEE AIS’03 (Геленджик, 2003 г.); Всероссийском конкурсе инновационных проектов аспирантов и студентов по приоритетному направлению развития науки и техники «Информационно-телекоммуникационные системы» (Москва, 2005 г.); Московской секции Международного семинара ACM SIGMOD (МГУ им. Ломоносова, Москва, 2005 г.); VII Международной конференции-семинаре «Высокопроизводительные параллельные вычисления на кластерных системах» (ННГУ им. Н.И.Лобачевского, Нижний Новгород, 2007 г.).
Публикации. Основное содержание диссертации отражено в 10 печатных работах. Среди них 6 статей, 3 из которых в журнале из перечня ВАК и 4 тезисов докладов.
Структура и объём диссертации. Диссертационная работа изложена на 115 страницах машинописного текста, содержит 35 рисунков и 11 таблиц, состоит из введения, четырех глав, заключения и списка литературы из 66 наименований.