Введение к работе
Актуальность темы. Возрастающие объемы информации требуют изменения бизнес-процессов предприятий и организаций. На смену традиционному бумажно-ориентированному взаимодействию, где информационные системы лишь обрабатывают сведения из бумажных документов- первоисточников, приходят электронно-ориентированные системы, в которых первоисточником являются операции, совершаемые пользователями в информационной системе.
Большинство современных корпоративных информационных систем - это многопользовательские автоматизированные информационные системы на основе реляционных баз данных. Возможность выполнения пользователями отдельных операций в системе определяется (программно или нормативно) содержанием в базе данных в каждый момент времени данных. Для возможности обнаружения некорректных операций и установления их причин (действия пользователя, неактуальность данных или другие факторы) необходима возможность восстановления содержания базы данных по состоянию на произвольный момент времени. Современные стандарты требуют хранения данной информации не менее 3-5 лет.
Для этих целей могут быть использованы существующие технологии темпоральных баз данных. Среди исследований в данной области можно отдельно выделить работы Р. Снодграса, К. Йенсена, А. Стейнера, К. Дейта. Среди отечественных работ в данной области следует отметить работы Б. А. Новикова, Е. А. Горшковой, Д. С. Порай, А. В. Соловьева, Г. В. Королькова. Большая часть из них сосредоточена на разработке специализированных языков запросов, темпоральных СУБД и других инструментальных средств, упрощающих оперирование темпоральными данными. Использование темпоральных баз данных для целей управления коллективным доступом к данным до настоящего времени практически не исследовалось.
Поскольку большинство современных многопользовательских АИС имеют клиент-серверную архитектуру, то для решения указанной задачи требуется обеспечение возможности восстановления данных, содержавшихся в момент выполнения пользователем операции, не в базе данных, а в локальном кэше клиента. Одновременно требуется сохранение сведений об авторстве всех производимых в данных изменений.
В настоящее время обеспечение юридической значимости информации на практике применимо лишь в отношении электронных документов. Документ, сформированный на основании данных информационной системы, приобретает юридическую значимость после его подписи уполномоченным должностным лицом, которое может не иметь возможности проверки истинности исходных данных. Не редки ситуации, когда выборки из информационной системы формируются и подписываются автоматически (электронным сервисом). Если в корпоративных информационных системах отслеживание авторства всех изменений совместно с некоторым набором организационных документов может быть достаточным способом разграничения ответственности за данные, то при совместной обработке данных пользователями нескольких юридических лиц необходимо обеспечение юридической значимости (посредством электронной подписи) всех производимых изменений.
Изменение отдельных категорий данных, особенно при обработке совместных данных, не может осуществляться отдельными пользователями, а требует согласования, которое может осуществляться различными способами (все участники, большинство, отдельные участники и более сложные схемы). Причем проведение согласования должно осуществляться не на уровне пересылки сообщений, а в рамках единого юридически значимого массива данных.
Совместная обработка данных несколькими информационными системами зачастую предполагает не просто редактирование единого информационного массива, а редактирование только общих элементов либо только поддержание связанности единых элементов (НСИ, Master Data Management). Зачастую данные в различных информационных системах могут быть организованы с использованием различных структур данных, которые также необходимо связывать.
Другой крайне важной задачей является необходимость обеспечения возможности модернизации информационных систем и связей между ними. В первую очередь сложность составляет необходимость модернизации метаданных систем. Таким образом, требуется обеспечение темпорально- сти не только данных, но и метаданных систем. При этом требуется обеспечение работы с данными прошлых периодов в соответствующей схеме данных.
Актуальность данной тематики отмечается в Клермонтском отчете об исследованиях в области баз данных, в котором задачи нахождения компромиссов между согласованностью и доступностью для достижения лучшей производительности и масштабируемости, отслеживания происхождения данных, а также поддержки эволюции схем и версий отнесены к числу приоритетных исследований в области баз данных.
Объектом исследования являются процессы коллективного управления данными в автоматизированных информационных системах.
Предметом исследования являются модели представления данных и метаданных в реляционных базах данных и способы их коллективной обработки.
Цель диссертационной работы - разработка моделей темпоральной организации данных и метаданных для совершенствования процессов коллективной обработки данных в автоматизированных информационных системах.
В диссертационной работе поставлены и решены следующие задачи:
-
Системный анализ информационных потребностей коллективных пользователей автоматизированных информационных систем, оценка применимости существующих способов коллективного управления данными.
-
Разработка реляционной модели темпоральной организации данных, позволяющей осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.
-
Разработка реляционной модели темпоральной организации данных и метаданных, обеспечивающей темпоральность метаданных, исключающей возникновение проблем отсутствующих значений.
-
Разработка реляционной модели темпоральной организации данных о связях между доменами данных независимых информационных систем, позволяющей осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.
-
Апробация предложенных моделей путем их реализации на основе промышленной системы управления базами данных и оценка их эффективности в сравнении с известными прототипами, разработка методики реорганизации баз данных существующих автоматизированных систем на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.
-
Оценка эффективности предложенных моделей и алгоритмов на основе исследования результатов использования разработанного программного комплекса в процессе его эксплуатации.
Методы исследования. В диссертационной работе использованы теоретические основы информационных систем и технологий, теория управления, теория системного анализа, элементы теории множеств, теория баз данных, реляционная алгебра, теория темпоральных баз данных, математическая логика, методы проектирования информационных систем.
Научная новизна работы. Научная новизна результатов диссертационного исследования представлена совокупностью следующих положений:
1. Предложена реляционная модель темпоральной организации данных, отличающаяся раздельным хранением сведений о жизненных циклах сущностей и значений атрибутов на основе полутемпоральных отношений и использованием отношения транзакций, включающего сведения об авторстве изменений, электронной подписи и максимуме транзакционного времени исходных данных, позволяющая осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.
-
-
Предложена реляционная модель темпоральной организации данных и метаданных, отличающаяся раздельным хранением сведений о жизненных циклах классов, атрибутов, сущностей и значений атрибутов на основе полутемпоральных отношений, обеспечивающая темпоральность метаданных и исключающая возникновение проблем отсутствующих значений.
-
Предложена реляционная модель темпоральной организации данных о связях между доменами данных независимых информационных систем, отличающаяся наличием темпоральных связей между классами, атрибутами и сущностями, позволяющая осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.
-
Впервые предложена методика реорганизации баз данных существующих автоматизированных систем для совершенствования процессов коллективного управления данными на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.
Практическая значимость. Практическое значение результатов данной работы состоит в решении задач управления коллективным доступом к данным, сокращении памяти, требуемой для хранения темпоральных данных, упрощении процессов модернизации автоматизированных информационных систем.
Основные положения, выносимые на защиту:
-
-
-
Реляционная модель темпоральной организации данных, позволяющая осуществлять представление расширенного набора операций с сущностями, сохранять сведения и доказательства авторства всех изменений, осуществлять отслеживание исходных данных, использовавшихся пользователями при внесении изменений, а также реализовать асинхронное согласование внесения изменений в данные.
-
Реляционная модель темпоральной организации данных и метаданных, обеспечивающая темпоральность метаданных и исключающая возникновение проблем отсутствующих значений.
-
Реляционная модель темпоральной организации данных о связях между доменами данных независимых информационных систем, позволяющая осуществлять управление совместными данными и метаданными в режимах дедупликации, актуализации и синхронизации в условиях семантической и синтаксической гетерогенности информационных систем.
4. Методика реорганизации баз данных существующих автоматизированных систем на основе предложенных моделей с сохранением используемого прикладного программного обеспечения.
Внедрение результатов работы. Результаты диссертационной работы использованы:
-
-
-
-
при модернизации АИС «Электронный социальный регистр населения Республики Мордовия» для построения регионального регистра получателей государственной помощи и организации информационного взаимодействия Министерства социальной защиты населения Республики Мордовия с Отделением Пенсионного фонда по Республике Мордовия;
-
в научно-исследовательской работе по теме «Создание действующего макета системы автоматизированного учета и формирования справочной отчетности о тиражах печатных средств массовой информации», выполненной Закрытым акционерным обществом «Эволента» в 2011 г. по заказу Федерального агентства по печати и массовым коммуникациям.
Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях и научных школах: конференции «Наука и инновации в Республике Мордовия» (Саранск, 2006-2009), Ежегодной научной конференции «Огарев- ские чтения» (Саранск, 2007, 2008), Четвертой Международной научной школе-семинаре «Математическое моделирование, численные методы и комплексы программ» (Саранск, 2009), Международной научно-практической конференции «Электронная Казань - 2009» (Казань, 2009), Межвузовской научной конференции по проблемам информатики «СПИСОК-2009» (Екатеринбург, 2009), VII Всероссийской научно-технической конференции «Технологии Microsoft в теории и практике программирования» (Москва, 2010), I Международной научно-практической конференции «Объектные системы - 2010» (Ростов-на-Дону, 2010).
На конкурсе работ VII Всероссийской научно-технической конференции «Технологии Microsoft в теории и практике программирования» (Москва, 2010) доклад автора был отмечен дипломом первой степени по секции «Базы данных и информационные системы».
Публикации. Основные результаты, полученные в диссертации, опубликованы в 13 статьях (3 из них в соавторстве), в том числе 3 статьи - в журналах, рекомендованных ВАК для публикации результатов научных работ. Подана заявка на выдачу патента на изобретение РФ.
Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения и списка литературы из 171 наименования. Объем работы - 135 страниц.
Работа выполнена при финансовой поддержке федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009-2013 гг.» (ГК № П1113).
Похожие диссертации на Совершенствование процессов коллективной обработки информации на основе темпоральной организации данных и метаданных
-
-
-
-
-
-