Введение к работе
Настоящая диссертация посвящена созданию строгой математической додели управления данными в информационных системах, предназначен-іьіх для автоматизации фундаментальных научных исследований, связанных с обработкой больших наборов экспериментальных данных, в таких ібластях знания как астрономия.
Актуальность темы. Задача создания развитого математического і программного обеспечения в области астрономических исследований уществует давно, и на сегодняшний день имеются различные принци-:иальные и практические решения данной задачи. Однако, используемые редметными специалистами концептуальные идеи и инструментальные редства программирования не адекватны современному уровню разви-ия системного программирования. Принятое в настоящее время разде-ение проблем хранения и обработки данных приводит, как правило, к лохо согласованному параллельному существованию, с одной стороны, рограммных модулей, обеспечивающих хранение данных (возможно, на азе коммерческих СУБД) и, с другой стороны, модулей, отвечающих і вычислительную обработку этих же данных (часто в виде замкнутых ПП). Предпринимаемые попытки преодолеть такое разделение заканчи-іются созданием либо замкнутых информационных систем, решающих зкий круг задач, либо слишком сложных и нестандартных (а, следо-
вательно, не жизнеспособных) универсальных инструментальных систем программирования.
Вообще говоря, подобные проблемы возникают во всех областях науки, связанных с хранением и алгоритмической обработкой экспериментальных данных. И тому есть объективные причины. Среди них, в частности, нужно отметить следующее: в отличие от классических предметных областей для СУБД, здесь наборы данных не моделируют объекты (сущности), их структуру и связи, а лишь фиксируют количественные характеристики протекания процессов и явлений во времени. Моделями же этих процессов и явлений служат алгоритмические модули, создаваемые, преимущественно, предметными специалистами. А существующие на сегодняшний день инструментальные СУБД не предоставляют адекватных средств для алгоритмического моделирования. С другой стороны, наиболее распространенные алгоритмические языки (Си, Паскаль, Фортран) не обладают специальными средствами для организации структурного хранения и доступа к наборам данных, что делает задачу организации работы с данными слишком сложной для пользователя (предметного специалиста).
Таким образом, к настоящему моменту представляется перспективным разработать математическую модель управления данными, органично сочетающую в себе возможности структурного хранения и доступа к данным (СУБД) и возможности нетривиальной вычислительной обработки этих данных (ППП); модель, сочетающую в себе универсальную идек гибкой настройки на предметную область пользователя с внешней простотой и эффективностью специализированного замкнутого ППП?
Целью диссертационной работы является разработка математической модели управления данными, включающей в себя возможності структурного хранения и доступа к данным и возможности сложной вы числительной обработки этих данных; модели, сочетающей в себе универсальную идею гибкой настройки на предметную область пользовате ля с внешней простотой и эффективностью специализированного ППП Для решения поставленной задачи необходимо четко определить степені применимости СУБД в областях, связанных с хранением и обработкоі экспериментальных данных, построить алгебраическую и процедурнук абстракции модели Таблично-ориентированного программирования.
1 Разработка была поддержана РФФИ: проект "АстроТОП" (грант № 94-02-05296)
Методика исследования. В работе применяются положения общей ягебры, теории типов, теории моделей данных, используемые при потроєний математической модели Таблично-ориентированного програм-гарования, а также теории алгоритмов для проведения сравнительного нализа алгоритмов интерпретации табличных выражений. Теоретиче-кие разработки проверялись практически путем реализации инструмен-альной интегрированной оболочки АстроТОП и создания средствами болочки конкретных информационных систем, настроенных и протести-ованных на предметных областях "Планиметрия" и "Малые планеты олнечной системы".
Научная новизна работы заключается в следующем:
предложена новая концепция построения информационных систем для областей знания, связанных с обработкой экспериментальных данных, которая позволяет органично соединить возможности СУБД и ППП (концепция Таблично-ориентированного программирования);
на основе концепции Таблично-ориентированного программирования построена математическая модель управления данными (модель Таблично-ориентированного программирования), позволяющая создавать информационные системы для означенных выше предметных областей;
получено строгое соотношение ТОП-модели и классических моделей данных; доказана реляционная полнота ТОП-модели как модели данных;
построены алгоритмы интерпретации таблично-ориентированных программ, позволяющие совместно оптимизировать исполнение запроса и структуру хранения данных; получены оценки временной и емкостной сложности алгоритмов и доказана их корректность;
построена операционная семантика операций ТОП-алгебры, позволяющая теоретически промоделировать функционирование ТОП-модели;
разработана и реализована инструментальная интегрированная программная оболочка, настраиваемая на предметную область пользователя.
Научная и практическая ценность. Научное значение работы со-эит в том, что впервые удалось построить строгую математическую
модель управления данными в информационных системах, ориентированных на использование в фундаментальных научных исследованиях, связанных с обработкой больших наборов экспериментальных данных. Практическое значение работы определяется внешней простотой использования инструментальной интегрированной программной оболочки при создании конкретных информационных систем для различных предметных областей и возможностью использования созданных информационных систем для автоматизации научных исследований. Поскольку механизмы представления и доступа к данным, а также применения обрабатывающих вычислительных процедур построены на общих сквозных идеях (итераторное представление таблиц данных и табличные ссылки), что обеспечивает возможность гибкой динамической настройки (без перетрансляции) на предметную область пользователя, то рассматриваемая в работе модель управления данными приобретает практическое значение как методологический прототип построения подобных инструментальных сред.
На защиту выносятся следующие результаты:
-
новая концепция управления данными в информационных системах сбора, хранения и обработки наблюдательной (экспериментальной) информации — модель Таблично-ориентированного программирования (ТОП-модель);
-
формальное описание ТОП-модели;
-
доказательство реляционной полноты ТОП-модели (как модели данных);
-
алгоритмы интерпретации Таблично-ориентированных программ, позволяющие совместно оптимизировать исполнение запроса и структуру хранения данных; оценки сложности алгоритмов;
-
операционная семантика ТОП-алгебры;
Апробация работы. Основные результаты, полученные в диссертации, докладывались на:
XI научной школе по ППП "Программное обеспечение математического моделирования, управления и искусственного интеллекта", Адлер, 1991.
Всесоюзном совещании "Компьютерные методы небесной механики", С.-Петербург, 1991.
Всероссийском совещании "Компьютерные методы небесной механики", С.-Петербург, 1992.
Международной конференции "Современные проблемы теоретической астрономии", С.-Петербург, 1994.
Конференции "Информационные системы в науке — 95", Москва, 1995.
Всероссийской конференции с международным участием "Компьютерные методы небесной механики — 95", С.-Петербург, 1995.
Семинаре Института высокопроизводительных вычислительных систем РАН, Москва, 1995.
Семинаре отдела компьютеризации астрономических исследований Института теоретической астрономии РАН, С.-Петербург, 1995.
Семинаре кафедры Прикладной математики Санкт-Петербургского государственного технического университета, С,-Петербург, 1995.
Структура и объём диссертации. Диссертация состоит из введе-їия, трёх глав, заключения, списка литературы из 104 наименований. Гекст диссертации изложен на 121 странице, включая список литературы на 13 страницах. Диссертация подготовлена средствами системы сомпьютерной верстки IATgX.