Содержание к диссертации
Введение
ГЛАВА 1. Анализ инструментально-программных средств создания и ведения комплекса динамических электронных документов 10
1.1. Анализ существующих систем электронного документооборота 10
1.2. Обзор некоторых аспектов функциональности систем электронного документооборота 29
1.3. Проблема целостности электронных документов 29
1.4. Целостность применительно к базам данных 30
1.5. Понятие целостности применительно к системам электронного документооборота 39
ВЫВОДЫ ПО ПЕРВОЙ ГЛАВЕ 41
ГЛАВА 2. Разработка общего подхода к построению комплексов динамических электронных документов 42
2.1. Применение динамических моделей для обеспечения целостности комплексов ЭД 42
2.2 Динамические модели электронных документов из диссертационного дела соискателя 52
Выводы по второй главе 61
ГЛАВА 3. Разработка моделей целостности и методики проектирования комплексов динамических электронных документов 62
3.1. Целостность динамических документов 62
3.2. Модель ограничений структурности 64
3.2. Модель ограничений обязательности 65
3.3. Модель ограничений ссылочное 66
3.4. Модель ограничений баланса 73
3.5. Методика проектирования 74
Выводы по третьей главе 76
ГЛАВА 4, Разработка инструментально-программного комплекса dissertant assistant 77
4.1. Возможности практической реализации динамических документов...77
4.2. Краткий обзор объектной модели Word 80
4.3. Встраивание динамической модели в документ Word 83
4.4. Разработка ведущего документа 94
4.5. Разработка ведомых документов 97
4.6. Оценка эффективности комплекса Dissertant Assistant 100
Выводы по четвертой главе 101
Основные результаты 102
Список литературы
- Обзор некоторых аспектов функциональности систем электронного документооборота
- Динамические модели электронных документов из диссертационного дела соискателя
- Модель ограничений структурности
- Краткий обзор объектной модели Word
Введение к работе
Актуальность проблемы. В настоящее время в автоматизированных системах различного назначения (организационного управления, автоматизированного проектирования и др.) широкое распространение получили электронные документы (ЭД). Комплексы взаимосвязанных ЭД представляют собой так называемые «слабоструктурированные» базы данных, в которых наряду с фрагментами свободного изложения имеются реквизиты со строго определенными правилами заполнения и связи с другими реквизитами на протяжении жизненного цикла - от создания до сдачи в архив. На повестке дня стоит создание «единых корпоративных систем управления бизнес-процессами» на основе концепции ЕСМ (Enterprise Content Management), понимаемой как «умение обращаться со слабоструктурированной корпоративной информацией».
В этих условиях большую роль играет целостность (Integrity) как отдельных ЭД, так и комплекса в целом, задающая требования к структуре ЭД и согласованности значений реквизитов на различных этапах жизненного цикла.
Современные системы управления электронным документооборотом представляют широкий набор по поддержанию жизненного цикла документов: разработки и создания документов - на основе шаблонов, путем прикрепления или сканирования; хранения документов в электронных хранилищах; рассылки документов по различным адресам согласно жестким, гибким или индивидуальным маршрутам; регистрации и учета как самих документов, так и доступа к ним пользователей, ознакомления, согласования, утверждения документов; обеспечения секретности доступа к документам; редактирования содержимого документов с сокращением промежуточных версий и возможностью «отката»; архивации документов и ведения архива; поиска нужных документов по множеству реквизитов; взаимодействия с внешними редакторами, базами данных, электронными таблицами,
сканерами, почтовыми системами, а также многое другое. ' Вместе с тем, практически отсутствуют возможности гибкого обеспечения целостности реквизитов в рамках комплекса ЭД в течении жизненного цикла. Поддержка целостности ограничивается простейшими возможностями задания допустимых значений реквизитов и выражений для вычисляемых реквизитов. Неясно, как обеспечить согласованность значений реквизитов с другими реквизитами в том же или в других ЭД, как контролировать реквизиты на тех или иных этапах жизненного цикла, как реализовать ограничения целостности в рамках всего комплекса документов. Отсутствует научная проработка этих вопросов на концептуальном, теоретическом, алгоритмическом уровнях.
В этой связи исследования, направленные на поиск научно обоснованных методов обеспечения целостности реквизитов комплексов ЭД на различных этапах жизненного цикла, являются актуальными. Объект исследования, таким образом, представляет собой комплексы ЭД со взаимосвязанными реквизитами и достаточно строго определенным жизненным циклом. В качестве базового объекта (сквозного примера) используется комплекс ЭД из личного дела соискателя ученой степени.
Предмет исследования - содержание понятия целостности структуры и реквизитов ЭД и его обеспечение на различных этапах жизненного цикла.
Основополагающая идея исследования - встраивание в ЭД динамических моделей, отражающих существенные этапы жизненного цикла, и на этой основе организация контроля целостности реквизитов.
Цель работы - разработка научно обоснованного подхода к обеспечению целостности реквизитов комплекса ЭД на основе встраиваемых
Рынок систем электронного документооборота предлагает множество программных продуктов зарубежных и отечественных фирм: CORPORATE BUSINESS, Docs Vision, LanDocs, БОСС-Референт, DIRECTUM, ДЕЛО, NAUDOC, ЕВФРАТ-Документооборот, СУПеР, PayDox, ИНТАЛЕВ-Докумеитаоборот, OPTIMA-WORKFLOW, МОТИВ, Effect Office, jDocflow, Avacco. Исследованию различных аспектов создания и использования ЭД посвящены работы как отечественных, так и зарубежных ученых. В УГАТУ эти вопросы затрагивались в работах Г.Г. Куликова, Л.Р. Черняховской, А.В. Речкалова и др.
динамических моделей и проверка его на примере комплекса ЭД из личного дела соискателя ученой степени.
Задачи, решаемые в работе для достижения цели:
Разработка концепции комплекса динамических ЭД.
Разработка моделей целостности ЭД.
Разработка методики проектирования комплекса ЭД.
Разработка комплекса инструментально-программных средств для создания ЭД из диссертационного дела соискателя ученой степени.
Результаты, выносимые на защиту:
Концепция комплекса динамических ЭД, основанная на обеспечении целостности структуры документов и значений их реквизитов.
Модели целостности динамических ЭД в виде ограничений на структуру и значения реквизитов для различных этапов жизненного цикла.
Методика проектирования комплекса ЭД в основе которой лежит разработка концептуальных и логических моделей генерации документов на основе предварительно разработанных шаблонов.
Комплекс инструментальпо-програмных средств Dissertant Assistant для создания динамических документов из диссертационного дела соискателя ученой степени на основе объектной модели Microsoft Word.
Научная новизна результатов в целом определяется новизной идеи встраивания в ЭД динамических моделей для организации контроля целостности документов. При этом:
Новизна концепции по п. 1 (см. «Результаты, выносимые на защиту»)
состоит в том, что в составе комплекса предусматривается ведущий
документ, содержащий базу контролируемых реквизитов, и в него
встраиваются динамические модели жизненного цикла, Отслеживая текущие
состояния которых, выполняется генерация ведомых документов,
контролируется целостность их структуры и реквизитов, что позволяет
обеспечить целостность на различных этапах жизненного цикла комплекса
ЭД.
Новизна моделей по п. 2 заключается в том, что они отражают
ограничения:
структурности - в виде последовательности допустимых фрагментов;
обязательности - в виде условий наличия значений реквизитов;
ссылочное - в виде наличия для одних реквизитов других реквизитов с соответствующими значениями;
баланса - в виде ограничений на совместные значений нескольких реквизитов. Это позволяет реализовать концепцию динамических ЭД.
Новизны методики по п. 3 состоит в том, что:
о Для ведущего документа разрабатываются модели базы реквизитов, динамической модели, памяти текущего состояния, структуры и шаблона ведущего документа, целостности базы реквизитов.
о Для ведомых документов - динамические модели, модели структуры, генерации, коррекции реквизитов, памяти текущего состояния.
Это, соответственно, позволяет реализовать концепцию ЭД.
Новизна комплекса по п. 4 состоит в том, что он содержит набор
разработанных шаблонов и макросов, обеспечивающих генерацию и
проверку документов на основе моделей целостности ЭД и построенных в
соответствии с методикой проектирования ЭД.
Значение результатов для теории электронного документооборота состоит в том, что они расширяют понимание того, что представляет собой целостность комплекса ЭД и как ее обеспечить в системах электронного документооборота.
Значение результатов для практики создания систем электронного документооборота заключается в том, что они дают методику разработки комплекса целостных ЭД. Разработанный комплекс инструментально-программных средств Dissertant Assistant позволяет сократить сроки создания документов из диссертационного дела соискателя ученой степени, уменьшить число допускаемых при этом ошибок.
Внедрение результатов. Результаты используются в научно-производственной фирме «РД-Технология» - в форме методики проектирования комплекса электронных документов, а также в Уфимском государственном авиационном техническом университете - в форме комплекса инструментально-программных средств Dissertant Assistant при подготовке документов диссертационного дела соискателей.
Связь с плановыми исследованиями. Работа выполнена в рамках плановых исследований кафедры АСУ УГАТУ.
Апробация и публикации. Основные положения, представленные в диссертации, были представлены и получили одобрение на научных конференциях всероссийского и международного уровня: Международном семинаре «Computer Science and Information Technologies», Венгрия, Будапешт, 2004, Германия 2006; Международной молодежной научно-технической конференции «Интеллектуальные системы управления и обработки информации», Уфа, 2001,2003.
Список публикаций автора по теме диссертации включает 7 научных трудов, в том числе 1 статью в научном журнале из рецензируемого списка ВАК и 2 в трудах международных конференций.
Структура диссертации. Диссертация состоит из введения, четырех глав, заключения, изложенных на 103 листах, приложения на 38 листах, библиографического списка, включающего 98 наименований.
Обзор некоторых аспектов функциональности систем электронного документооборота
Автоматизированные системы организационного управления характеризуются сложным документооборотом, включающим большое количество взаимосвязанных электронных документов, которые создаются и используются, в процессе функционирования системы, большим количеством людей. Будучи не столь сильно структурированным, как базы данных, «документное обеспечение» хорошо организованных бюрократических систем, тем не менее, характеризуется значительной типизацией используемых документов, строгими правилами и ограничениями на их состав, структуру, взаимосвязь, составление, использование. Разработчики системных проектов организационных АСУ предпринимают значительные усилия для построения и увязки моделей как документооборота в целом, так и отдельных документов (состава, процессов создания, использования его на различных этапах организационного управления).
Традиционная бумажная организация документооборота характеризовалась естественным разделением собственно документов и моделей их построения и использования. С появлением компьютерных технологий стали создаваться инструментальные среды для разработки, пересылки, модификации и просмотра электронных документов и создания на их основе бумажных копий. Возникли компьютерные приложения, создающие документы на основе информации из баз данных. Появились возможности создания бланков электронных документов (как, например в Microsoft Word, Lotus Notes и др.) или схем (как в технологии XML), позволяющих задавать и контролировать их состав, структуру и ограничения. Тем не менее ситуация, когда модель создания и использования документа отделена от самого документа, существует вне него, сохраняется до сих пор.
Подобная ситуация, когда документы сначала создаются, а лишь затем (возможно) проверяется на соответствие требованиям и ограничениям, порождает известную проблему целостности.
В структурированных базах данных понятие проблемы целостности и методы ее обеспечения подробно изучены и описаны. Для проработки вопросов решения этой проблемы необходимо проанализировать имеющийся опыт обеспечения целостности в СУБД.
База данных находится в согласованном состоянии, если для этого состояния выполнены все ограничения целостности.
Ограничение целостности - это некоторое утверждение, которое может быть истинным или ложным в зависимости от состояния базы данных.
Ограничения целостности классифицируются несколькими способами: По способам реализации. По времени проверки. По области действия. По способам реализации различают: Декларативную поддержку ограничений целостности - средствами языка определения данных (DDL). Процедурную поддержку ограничений целостности - посредством триггеров и хранимых процедур.
По времени проверки ограничения делятся на: Немедленно проверяемые ограничения. Ограничения с отложенной проверкой. По области действия ограничения делятся на: Ограничения домена. Ограничения атрибута. Ограничения кортежа. Ограничения отношения. Ограничения базы данных.
Стандарт языка SQL поддерживает только декларативные ограничения целостности, реализуемые как: Ограничения домена. Ограничения, входящие в определение таблицы. Ограничения, хранящиеся в базе данных в виде независимых утверждений (assertion).
Проверка ограничений допускается как после выполнения каждого оператора, могущего нарушить ограничение, так и в конце транзакции. Во время выполнения транзакции можно изменить режим проверки ограничения.
Целостность (от англ. integrity - нетронутость, неприкосновенность, сохранность, целостность) - понимается как правильность данных в любой момент времени. Но эта цель может быть достигнута лишь в определенных пределах: СУБД не может контролировать правильность каждого отдельного значения, вводимого в базу данных (хотя каждое значение можно проверить на правдоподобность). Например, нельзя обнаружить, что вводимое значение 5 (представляющее номер дня недели) в действительности должно быть равно 3. С другой стороны, значение 9 явно будет ошибочным и СУБД должна его отвергнуть. Однако для этого ей следует сообщить, что номера дней недели должны принадлежать набору (1,2,3,4,5,6,7).
Поддержание целостности базы данных может рассматриваться как защита данных от неверных изменений или разрушений (не путать с незаконными изменениями и разрушениями, являющимися проблемой безопасности). Современные СУБД имеют ряд средств для обеспечения поддержания целостности (так же, как и средств обеспечения поддержания безопасности).
Динамические модели электронных документов из диссертационного дела соискателя
Этап подготовки к сдачи в совет состоит из подготовки бумажных документов (диссертации, заявления, личного листка) получения согласия и подготовка сведений об оппонентах и ведущей, подготовки списка рассылки автореферата.
Диссертация, заявление, личный листок принимаются после предварительной проверки и при необходимости доработки.
Параллельно с подготовкой бумажных документов готовятся документы: согласие и сведения об оппонентах и ведущей. После подготовки проекта документов ведутся переговоры, по окончанию которых документы подписываются.
После принятия диссертации, заявления, личного листка и получения согласия и сведений об оппонентах и ведущей подготавливается список рассылки автореферата. Процесс подготовки включает в себя разработку проекта списка рассылки, дальнейшую его проверку и доработку при необходимости, и заканчивается принятием проекта. На этой стадии подготовка к сдаче в совет заканчивается.
Этап подготовки к принятию к защите состоит из подготовки заседания, экспертизы, согласования списка рассылки, организации предварительного заседания и согласования текста автореферата, проведения заседания.
Выполнение экспертизы начинается с назначения экспертов, которые ознакомившись с работой, выдают заключение. Результатом экспертизы будет положительное заключение.
Согласование списка рассылки состоит в разработке проекта списка рассылки, последующем его согласовании и при необходимости доработки. После этого проект списка рассылки утверждается.
Организация предварительного заседания заключается в назначении даты заседания, подготовки приглашений членам совета и последующей их раздаче.
Согласование текста автореферата состоит в подготовке проекта и согласованию с доработкой при необходимости и дальнейшему утверждению автореферата.
При завершении всех вышеуказанных процессов подготовки к принятию к защите, на предварительном заседании, диссертация принимается к защите. В случае, если диссертация отвергнута, она отправляется на доработку и заседание проводится заново.
Этап подготовки к защите состоит из подготовки и вручения приглашений членам совета, получению отзывов на автореферат и подготовке ответов на замечания, получение отзывов оппонентов и ведущей и подготовка ответов на замечания, подготовки раздаточных материалов, подготовки проекта заключения, подготовки доклада .
Приглашения подготавливаются и вручаются каждому члену диссовета.
Получение отзывов на автореферат начинается с рассылки автореферата. Затем, после получения отзывов, необходимо подготовить отзывы на замечания (при их наличии). Получение отзывов ведущей и оппонентов начинается с отправки диссертации, Затем, когда получены отзывы, готовятся ответы на замечания (при их наличии), указанные в отзывах. Подготовка раздаточных материалов ведется параллельно с остальными процессами подготовки к защите. Проект заключения диссертационного совета составляется и затем согласуется с 3-мя экспертами и ученым секретарем.
Модель ограничений структурности
В реляционных базах данных ссылочная целостность (Referential Integrity) означает, что внешнему ключу в дочерней таблице всегда должен соответствовать первичный ключ в родительской таблице, т.е. значение внешнего ключа в дочерней таблице должно принадлежать множеству имеющихся значений первичных ключей в родительской таблице. Для выполнения этого требования система управления базой данных поддерживает индексы (индексные таблицы) первичных и внешних ключей, на основе которых производит проверку целостности при выполнении операций вставки, удаления или изменения записей таблиц.
В комплексах документов целостность этого вида обеспечить труднее, поскольку здесь отсутствуют четко определенные понятия родительских и дочерних объектов, контролируемых некоторой системой управления.
В основу ссылочной целостности применительно к комплексам документов положена идея о том, что для проверяемых реквизитов должны быть заданы множества их допустимых значений. Модель ссылочной целостности должна достаточно наглядно показывать, как формируются множества допустимых значений реквизитов, чтобы на этой основе организовать проверку значений реквизитов.
Для реализации этой идеи была предложена графическая модель множеств допустимых значений для контроля ссылочной целостности реквизитов комплексов документов.
На Рисунок 3.4 приведены условные обозначения, используемые в модели ссылочной целостности. Они позволяют специфицировать: множество контролируемых документов; выбор из него отдельных документов по заданному критерию; формирование из реквизитов выбранных документов некоторого множества допустимых значений; формирование множества допустимых значений на основе других множеств допустимых значений путем алгебраических операций объединения, вычитания, пересечения множеств и т.п.; задания независимых проверяемых реквизитов, ассоциированных с данным множеством допустимых значений. задание зависимых (коррелированных) проверяемых реквизитов, значения которых должны соответствовать друг другу при проверке принадлежности множеству допустимых значений.
Возможность задания в модели множеств дополнительных значений, сформированных из других множеств, позволяет определять ссылочную целостность комплексно, для нескольких реквизитов сразу: в одной модели ссылочной целостности определяется сразу несколько взаимосвязанных множеств допустимых значений реквизитов.
Реквизиты, ассоциированные с одним множеством допустимых значений, могут быть независимыми, когда ограничение на значение одного реквизита никак не зависит от значения другого, или зависимыми (коррелированными), когда допустимые значения одного определяются в зависимости от значений другого. В простейшем случае такая корреляция выражается в запрете одинаковых значений у группы реквизитов. Например, группа реквизитов «Первый оппонент», «Второй оппонент» и «Третий оппонент» коррелированны в том смысле, что не могут принимать одинаковые значения, а такие реквизиты, как, скажем, «Вопросы диссертанту» и «Вопросы научному руководителю» независимы и могут содержать одинаковые значения, поскольку оба эти типа вопросов может задавать одно и то же лицо.
Если множество допустимых значений формируется из других множеств или реквизитов документов путем применения алгебраических операций, то эти правила формирования, вообще говоря, могут быть отражены на графической диаграмме модели и не требуют дополнительных пояснений. Однако, часто встречаются ситуации, когда множества допустимых значений конструируются более сложным образом, тогда правила построения таких множеств требуют дополнительного пояснения. Такие множества, для которых имеются дополнительные правила построения, представляются на диаграмме модели символом с двумя вертикальными линиями.
Дополнительные правила построения задаются в форме предикатов, позволяющих установить истинность или ложность утверждения о том, что проверяемое значение принадлежит данному множеству допустимых значений.
Ниже представленные общие положения иллюстрируются на примере формирования модели ссылочной целостности для комплекса документов из диссертационного дела.
Модели такого рода ранее не предлагались, поэтому приведем используемые обозначения. Множества изображены шестиугольниками. Треугольные стрелки обозначают множественность реквизитов (как например, для вопросов по личному делу), а круглые - единичный реквизит (фамилия 1-го оппонента). Закрашенная стрелка обозначает обязательность наличия реквизита, незакрашенная - необязательность. В зависимости от того, могут ли быть значения реквизитов одинаковыми, выносные линии изображаются на раздельной или общей основе (для реквизитов, значения которых могут быть одинаковыми, основа выносных линий изображается раздельной - как показано для вопросов, а для реквизитов, которые могут совпадать изображается общая основа - как для оппонентов, которые не могут совпадать). Подобные обозначения позволяют отобразить ограничение совокупных значений реквизитов.
Модель ограничений ссылочное задает правила, согласно которым значения нового реквизита, появившегося на некотором этапе жизненного цикла должно соответствовать значениям уже имеющихся реквизитов. В работе предложено рассматривать ссылочное ограничение в виде множества допустимых значений реквизита, которое зависит от текущих значений других реквизитов.
Краткий обзор объектной модели Word
лишь в пределах сеанса взаимодействия, после чего При встраивании динамических моделей в документ Word необходимо разместить в документе (в невидимой для пользователя форме) информацию 3-х видов: - постоянную информацию, неизменную на протяжении всего жизненного цикла документа. Это информация, отражающая диаграммы переходов динамической модели и способы связи модели с внешним миром; - переменная информация жизненного цикла, изменяющаяся и сохраняемая на протяжении жизненного цикла документа. Это информация о текущем состоянии динамической модели, т.е. память текущего состояния -ПТС; - переменная информация сеанса взаимодействия с пользователем, которую требуется сохранять можно «забыть». Это информация о результатах интерпретации динамической модели и взаимодействия с пользователем в текущем сеансе, необходимая для смены текущего состояния динамической модели.
Исходя из этих положений, была разработана схема структуры данных встроенной динамической модели документа Word, представленная на Рисунок 4.2, включающая постоянную информацию, переменные жизненного цикла и переменные сеанса.
Постоянная информация организована в виде 3-х таблиц, задающих структуру динамической модели в универсальной форме: Модели (Models) - задает иерархию элементарных одноуровневых отдельных моделей, входящих в состав динамической модели. Каждая строка таблицы соответствует одной элементарной модели, причем модель верхнего уровня расположена первой. Состояния (States) - задает состояние элементарных моделей. Каждая строка этой таблицы соответствует одному состоянию некоторой элементарной модели. Дуги (Arcs) - задает дуги в графах динамической модели. Каждая строка этой таблицы соответствует одной дуге. Дуги бывают двух типов: - переходы (Jump), связывающие состояния с другим состоянием внутри элементарных моделей; - погружения (Dive), связывающие состояние родительской модели с начальным состоянием дочерней модели.
Указанные таблицы организованы в виде двумерных числовых массивов, определяемых в макросе на языке VBA (Visual Basic for Applications) в составе ведущего документа. Первое измерение массивов соответствует строкам таблиц, второе - столбцам. Для удобства применена относительная адресация состояний моделей. Состояния каждой элементарной модели нумеруются локально в пределах этой модели, начиная с нуля (начальное состояние модели). И для каждой модели в массиве Models указан ее индекс начального состояния (ISI). Индекс других состояний рассчитывается путем сложения с базой ISI локального номера этого состояния.
Моделирование иерархии элементарных графов моделей обеспечивается за счет указателей, ссылающихся на другие строки той же или другой таблицы. На Рисунок 4.2 для наглядности каждый указатель снабжен стрелкой на ту таблицу, на которую он ссылается.
Каждый элемент таблицы МОДЕЛИ ссылается: на ячейку ПТС (PTS); на начальное состояние (ISI); на родительскую модель, для которой данная модель является дочерней (PMI, рекурсивная ссылка), вместе с номером состояния родителя (PSN). Эта ссылка задает родительское состояние, к которому прикреплена дочерняя модель.
Каждый элемент таблицы СОСТОЯНИЯ ссылается: на исходную модель (IMI), в которую входит данное состояние; на интерфейсный модуль (INT), с которым ассоциировано данное состояние.
Каждый элемент таблицы ДУГИ ссылается: на исходную модель, в которой размещена данная дуга (IMI), вместе с номером исходного состояния (ISN), Эта ссылка задает состояние, из которого исходит данная дуга; на целевую модель, в которой расположено состояние, в которое направлена данная дуга (TMI), вместе с номером целевого состояния (TSN). Эта ссылка задает состояние, в которое направлена данная дуга (отметим, что дуга типа «переход» направлена в состояние, принадлежащее той же элементарной модели, что и исходное, а дуга типа «погружение» - принадлежащее дочерней модели относительно исходного состояния); на предикативный модуль, с которым ассоциирована данная дуга (PMI).