Введение к работе
Актуальность темы. Одна из проблем, которую приходится решать при разработке программного обеспечения (ПО), - это хранение и обработка информации в долговременной памяти. При этом информация должна легко, быстро и в удобном для использования виде извлекаться из хранилища, обрабатываться и помещаться обратно.
Внутри программного обеспечения информация представляется в виде сложно структурированных данных: объектов, коллекций объектов, всевозможных связей между ними, а также в виде сложных структур - массивов, списков, деревьев и т. д. Таким образом, на современном этапе развития программной индустрии актуальной является задача обработки в долговременной памяти объектов, коллекций объектов, связей между ними и структур данных.
Для решения этой задачи существует несколько подходов:
использование плоских файлов и ПО для управления ими;
использование специализированных хранилищ, таких, как Storage от Microsoft;
- использование систем управления базами данных (СУБД).
Первый подход требует разработки ПО для управления плоскими
файлами и данными. Второй подход также требует создания промежуточного ПО между приложением и хранилищем. Оба подхода обладают слабой интероперабильностью к другим способам и средствам хранения данных. СУБД лишены этих недостатков, так как предоставляют готовые и универсальные интерфейсы для обработки данных.
На сегодняшний момент существует несколько типов СУБД: объектно-ориентированные, иерархические, сетевые, реляционные. Каждый из типов СУБД обладает своими достоинствами и недостатками. Объектно-ориентированные СУБД хорошо работают с объектами и коллекциями объектов, но не имеют универсальных и стандартизованных интерфейсов обработки данных. Иерархические и сетевые СУБД предназначены для обработки иерархий и сетей соответственно, но для работы с неиерархическими или несетевыми данными требуют разработки специализированных, жестко определенных запросов. Реляционные СУБД (РСУБД) обладают неоспоримыми преимуществами по сравнению с другими: основаны на формальной математической модели, являются своего рода стандартом хранения данных, занимают львиную долю рынка СУБД. В то же время
РСУБД, как и другие СУБД (иерархические, сетевые и объектные), непосредственно не поддерживает хранение и обработку сложных структур данных, таких, как списки, массивы, деревья, графы, стеки и очереди.
Коллекции объектов и структуры данных являются подмножеством графов, которые, в свою очередь, являются подмножеством мультиграфов и псевдографов. Исследованиям мультиграфов и псевдографов посвящены работы Касьянова В. Н, Евстигнеева В. А., Акимова О. Е.,ХарариФ. (HararyF.), ЗвиллингераД. (ZwillingerD.).
Указанные выше обстоятельства обусловливают выбор в качестве объекта исследования реляционных баз данных (РБД), в основе которых лежит реляционная модель данных (РМД). Данная работа направлена на решение проблемы обработки сложно структурированных данных о предметной области, представленных в виде нагруженного псевдографа, в РБД. Нагруженный псевдограф означает, что его вершины и ребра являются объектами, имеющими собственную сложную структуру, состоящую из множества атрибутов. Каждый атрибут характеризуется именем атрибута и доменом, к которому принадлежит атрибут. Каждый атрибут можно определить только на одном домене.
В качестве предмета исследования были выбраны модель преобразования сложно структурированных данных о предметной области, представленных в виде нагруженного псевдографа, в РБД, а также методы и средства обработки сложных структур данных в рамках РБД.
Цель работы - ускорение процесса разработки программных средств, предназначенных для обработки сложно структурированных данных о предметной области, с помощью формализации и автоматизации преобразования нагруженных псевдографов в реляционные базы данных.
Задачи исследования. Для достижения поставленной цели были решены следующие задачи:
-
Исследование существующих способов хранения и средств обработки информации в долговременной памяти для ускорения процесса разработки программных средств, предназначенных для работы со сложно структурированными данными во внешней памяти.
-
Разработка метода и средств преобразования сложно структурированных данных в РБД, позволяющих формализовать и автоматизировать разработку программных средств обработки данных во внешней памяти.
-
Разработка метода и средств преобразования в РБД фундаментальных структур данных: массивов, списков, стеков, очередей, бинарных и сильно ветвящихся деревьев, графов, а также файловой системы и иерархии компонентов ПО SCADA-систем.
-
Разработка программных инструментальных средств для работы с фундаментальными структурами данных в РБД.
-
Оценка эффективности преобразования фундаментальных структур данных в РБД на основе оценки количества операторов реляционной алгебры и среднего времени выполнения операций обработки данных.
Методы исследования данной работы основаны на методах формальной логики, теории множеств и теории графов. Для теоретической оценки производительности операций с преобразованными в РБД структурами данных использовалась реляционная алгебра. При разработке модели преобразования нагруженных псевдографов и программного обеспечения использовался объектно-ориентированный подход.
Научная новизна работы состоит в следующем:
-
Обосновано использование РБД и РСУБД для долговременного хранения и обработки сложно структурированных данных, которые можно представить в виде нагруженного псевдографа. Применение РБД и РСУБД позволяет ускорить разработку программных средств обработки данных во внешней памяти.
-
Разработана формальная модель преобразования сложно структурированных данных, представленных в виде нагруженного псевдографа, которая позволяет формализовать и автоматизировать отображение данных о предметной области в РБД.
-
Разработаны правила изменения набора реляционных отношений, полученного в результате применения формальной модели преобразования, с целью повышения быстродействия операций обработки данных и уменьшения занимаемого места во внешней памяти.
-
Предложен метод и средства отображения фундаментальных структур данных в РБД, основанные на модели преобразования нагруженных псевдографов, с помощью которых было осуществлено преобразование в РБД массивов, списков, стеков, очередей, бинарных и сильно ветвящихся деревьев, графов, а также файловой системы и иерархии компонентов ПО SCADA-систем.
5. Разработаны программные инструментальные средства, позволяющие ускорить процесс разработки программ, программных комплексов и пакетов прикладных программ, предназначенных для обработки сложно структурированных данных о предметной области в РБД.
Практическая значимость работы заключается в следующем: І.Для разработки систем обработки данных созданы программные инструментальные средства: набор хранимых процедур на языке Trans-act-SQL и программные инструментальные средства для создания программ, программных комплексов и пакетов прикладных программ в виде динамически подключаемой библиотеки прикладного программиста, позволяющие ускорить процесс разработки программных средств, предназначенных для обработки сложно структурированных данных в РБД.
-
Результаты теоретических исследований, приведенных в работе, нашли практическое применение при разработке различных систем обработки информации.
-
Разработанная модель преобразования нагруженных псевдографов в РБД, методы и программные средства могут быть использованы для создания программного обеспечения, позволяющего автоматически осуществлять преобразование заданных в виде нагруженного псевдографа данных о предметной области в РБД.
Реализация результатов работы. Основные результаты работы были использованы при разработке следующих программных систем:
информационная система «Приемная руководителя» внедрена и используется в приемной Губернатора Пензенской области (г. Пенза), что подтверждается соответствующим актом;
«Система управления несоответствиями программного обеспечения» внедрена в ООО НПФ «КРУГ» (г. Пенза), применяется при разработке ПО АСУТП для предприятий нефтехимической и газовой промышленности, а также для объектов энергообеспечения, что подтверждается соответствующим актом;
информационная система «Формирование правил оплаты, учет и анализ платежей потребителей электроэнергии» внедрена и используется в районном электротеплосетевом предприятии Городи-щенского района Пензенской области (г. Городище), что подтверждается соответствующим актом.
Апробация работы. Основные положения и результаты работы докладывались на:
Международной научно-технической конференции «Проблемы автоматизации и управления в технических системах» (г. Пенза, 2004 г.);
Международном юбилейном симпозиуме «Актуальные проблемы науки и образования» (г. Пенза, 2004 г.);
V Международной научно-технической конференции «Новые информационные технологии и системы» (г. Пенза, 2002 г.);
IV-VII Международных научно-методических конференциях «Университетское образование» (г. Пенза, 2000-2003 гг.).
Основные положения диссертационной работы, выносимые на защиту:
-
Формальная модель преобразования сложно структурированных данных о предметной области, представленных в виде нагруженного псевдографа, в котором вершины и ребра являются объектами, имеющими собственную сложную структуру, в набор отношений реляционной базы данных. Данная модель позволяет формализовать и автоматизировать отображение сложно структурированных данных о предметной области в реляционную базу данных, что существенно ускоряет разработку программных средств обработки данных во внешней памяти.
-
Правила изменения набора реляционных отношений, полученного в результате применения формальной модели преобразования, с целью повышения быстродействия операций обработки данных и уменьшения занимаемого места во внешней памяти.
-
Метод и средства преобразования фундаментальных структур данных в реляционную модель данных, позволившие преобразовать в реляционную базу данных массивы, списки, стеки, очереди, бинарные и сильно ветвящиеся деревья, графы, а также файловую систему и иерархию компонентов программного обеспечения SCADA-сис-тем, что ранее не было формализовано.
-
Оценка эффективности преобразования фундаментальных структур данных на основе соотношения количества операторов реляционной алгебры и среднего времени выполнения операций обработки данных в реляционных базах данных, подтверждающая эффективность предложенных модели, методов и средств.
-
Программные инструментальные средства, позволяющие ускорить процесс разработки программ, программных комплексов и пакетов прикладных программ, предназначенных для обработки слож-
но структурированных данных о предметной области в реляционную базу данных.
Публикации. По теме диссертации опубликованы 16 печатных работ, в том числе 3 статьи и 13 тезисов докладов.
Объем и структура работы. Диссертация состоит из введения, 4 глав, заключения, списка использованной литературы, включающего 153 наименования, 5 приложений. Содержание диссертации изложено на 228 страницах машинописного текста. В работе 35 рисунков, 38 таблиц, 50 графиков.