Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математическое моделирование и технологии интеграции данных в учетных информационных системах Воробьева Марина Сергеевна

Математическое моделирование и технологии интеграции данных в учетных информационных системах
<
Математическое моделирование и технологии интеграции данных в учетных информационных системах Математическое моделирование и технологии интеграции данных в учетных информационных системах Математическое моделирование и технологии интеграции данных в учетных информационных системах Математическое моделирование и технологии интеграции данных в учетных информационных системах Математическое моделирование и технологии интеграции данных в учетных информационных системах Математическое моделирование и технологии интеграции данных в учетных информационных системах Математическое моделирование и технологии интеграции данных в учетных информационных системах Математическое моделирование и технологии интеграции данных в учетных информационных системах Математическое моделирование и технологии интеграции данных в учетных информационных системах
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Воробьева Марина Сергеевна. Математическое моделирование и технологии интеграции данных в учетных информационных системах : Дис. ... канд. техн. наук : 05.13.18 Тюмень, 2006 130 с. РГБ ОД, 61:06-5/1410

Содержание к диссертации

Введение

ГЛАВА 1. Методы, принципы и технологии интеграции информационных ресурсов и систем 12

1.1. Концепция интеграции информационных ресурсов и систем 12

1.2. Основные подходы интеграции информационных ресурсов 17

1.3. Классификация методов и подходов интеграции данных 20

1.4. Общие принципы моделирования 36

1.5. Классификация основных понятий учетных информационных систем 44

ГЛАВА 2. Построение моделей интеграции данных 49

2.1. Описание модели интеграции данных 49

2.2. Семантические зависимости 54

2.3. Определение степени зависимости между информационными системами 61

2.4. Объектная модель учетных информационных систем 64

2.5. Представление элементов модели 74

ГЛАВА 3. Проектирование интегрированной информационной среды на примере департамента имущественных отношений АТО 77

3.1. Информационная инфраструктура Департамента имущественных отношений АТО 78

3.2. Формирование информационных объектов 83

3.3. Многоуровневые объектные схемы в УИС 85

3.4. Создание информационного банка данных 98

3.5. Проектирование интегрированной информационной среды 103

3.6. Этапы программной реализации интеграции данных 110

Заключение 121

Список литературы

Введение к работе

Информатизация территориального управления является одним из ведущих направлений информатизации государственных и муниципальных административных органов. Отдавая предпочтение первостепенным задачам разграничения полномочий федерального, регионального управления и местного самоуправления, эффективным экономическим механизмам их конкретной реализации, следует отметить, что своевременная и качественная информационная поддержка этих процессов - залог успешного решения проблемы в целом при рациональном их использовании.

На федеральном и на региональном и муниципальном уровнях создавались и продолжают создаваться локальные автоматизированные информационные системы, не ориентированные на взаимодействие. Каждая из таких систем, применяющая свои стандарты описания и представления данных, как правило, представляет собой сложный комплекс, который включает в себя продукты и технологии от разных производителей, использует различные форматы данных. При этом с одной стороны, информация об объектах зачастую дублируется и не всегда актуальна, что приводит к ее противоречивости и неполноте. С другой стороны, для поддержки принятия решений в области комплексного управления возникает необходимость получения результатов на основе всех данных, собираемых и обрабатываемых различными структурами.

Помимо прямой задачи получения интегрированных данных существует и обратная задача: есть входной управляющий документ, который определяет необходимость изменения некоторой информации в разных системах. Проблема заключается в обеспечении целостности всей совокупности данных.

Существуют различные подходы к решению указанных задач. В работах зарубежных и отечественных авторов (К.А.Лисянский, А.Г.Назаров, А.А.Сухобоков, С.А.Хабаров, Л.Черняк, Ф.Бруссар, Б.Голд-Бернштейн, С.Крэггс, М.Кубок, Дж.Мэдден, Т.Мэттьюс, Дж.Тейлор) [10-14, 69, 84, 85, 96] предлагаются различные способы формирования интегрированной информа ционной среды: от создания систем на основе единой структуры данных до использования больших хранилищ данных, а также универсальной платформы бизнес-интеграции, которая объединила бы разрозненные технологии в едином продукте, позволяющем решить задачи интеграции корпоративных приложений. Представляется перспективным подход к серверным мощностям, устройствам хранения, настольным сервисам и приложениям как к универсальным ресурсам. Для решения отдельных задач интеграции используются системы гарантированной доставки сообщений, интеграционные брокеры, средства моделирования бизнес-процессов, серверы приложений, портальные системы, средства бизнес-аналитики. Но при таком подходе возрастает сложность проекта - слишком много различных инструментальных средств придется использовать при разработке, а после внедрения нужно будет еще и поддерживать отдельные компоненты интеграционного решения. Из-за этой сложности множество проектов интеграции не достигли всех своих целей.

Тем не менее, единый подход к реализации процесса интеграции данных отсутствует, что делает актуальным построение и исследование моделей, позволяющих анализировать межсистемные связи, а также разработку принципов и методов интеграции, в которых поддерживается согласованное изменение данных и получение интегрированной информации. Цель работы

Разработка принципов, моделей и технологий интеграции данных в учетных информационных системах (УИС), позволяющих обеспечить целостность, корректность и согласованность информации, и апробация предложенного подхода в рамках программной реализации. Основные задачи работы

• анализ существующих принципов и технологий интеграции данных;

• систематизация и классификация основных понятий УИС;

• построение и исследование моделей интеграции данных, определяющих интегрированную систему полного учета объектов;

• создание концептуальной объектной модели для исследования, построения и интеграции данных из учетных информационных систем;

• разработка на базе предложенной модели технологии интеграции данных;

• программная реализация принципов, моделей и технологий интеграции данных.

Методы исследования

При решении поставленных задач использовались методы теории графов, теории множеств, теории баз данных, объектно-ориентированные методы анализа и проектирования УИС.

Научная новизна и теоретическая значимость • уточнен понятийный аппарат - систематизация и раскрытие содержания основных понятий УИС;

• предложена модель интеграции данных, позволяющая анализировать межсистемные связи, зависимости и закономерности, возникающие между информационными объектами и системами;

• на основе построенной модели разработаны принципы и методы интеграции, поддерживающие согласованное изменение данных и получение интегрированной информации;

• предложена объектная модель для построения и интеграции данных в учетных информационных системах.

Практическая ценность работы

На основе предложенной модели информационного пространства разработана технология, которая позволяет обеспечить целостность, корректность и согласованность информации при организации доступа к интегрированным данным. Результаты исследований обобщены и реализованы в проектах многофункциональных автоматизированных систем для ведения соответствующих УИС в Центре мониторинга качества образования Тюменской области, в фи лиале ТюмГУ (г. Нягань), в Департаменте имущественных отношений Администрации Тюменской области. Апробация работы

Основные результаты докладывались на научно-технических советах Департамента имущественных отношений Администрации Тюменской области (2001-2005 гг.), на Международных научных конференциях: ММТТ-2000 (Санкт-Петербург, 2000), ММТТ-18 (Казань, 2005), на Межвузовской электронной научно-технической конференции «Управляющие и вычислительные системы. Новые технологии» (Вологда, 2000, 2001), на научно-методических семинарах Факультета математики и компьютерных наук и кафедры программного обеспечения Тюменского государственного университета (2000-2005 гг.).

Работа поддержана грантом № 75-12 (подпрограмма 301, раздел 301.5) «Разработка проекта программы развития единой образовательной информационной среды Тюменской области», 2001 год.

На защиту выносятся

• модель интеграции данных, позволяющая анализировать межсистемные связи УИС;

• концептуальная объектная модель для исследования, построения и интеграции УИС;

• принципы интеграции учетных информационных систем на основе использования XML-технологии;

• проблемно-ориентированная программная реализация интеграции данных на основе предложенных моделей.

Публикации

По материалам диссертации опубликовано 10 работ.

Структура и объем работы: текст диссертации состоит из введения, 3 глав, заключения, содержит 130 страниц, в том числе 37 рисунков и 7 таблиц. К тексту прилагается список литературы из 99 наименований.

Основные подходы интеграции информационных ресурсов

В настоящее время в числе основных принципов интеграции информационных ресурсов выделяют следующие подходы: интеграция корпоративных приложений (enterprise application integration, EAI), интеграция между организациями (межведомственная интеграция, Businesso-Business Integration, В2ВІ), интеграция бизнес-процессов (Business Process Integration, BPI), интеграция информации (enterprise information integration, ЕП), а также извлечение, преобразование и загрузка данных (extract, transform and load, ETL) [11,18, 37, 63, 67, 70, 82].

При интеграции бизнес-процессов (ВРІ) компания должна определять, реализовывать и управлять процессами обмена корпоративной информацией между различными бизнес-системами. Благодаря этому организация может упростить операции, сократить расходы и улучшить реагирование на запросы клиентов. Элементы такой интеграции включают управление процессами, моделирование процессов и технологический процесс, который охватывает различные задачи, процедуры, архитектуры, входную и выходную информацию, а также средства, необходимые для каждого шага в бизнес-процессе.

На уровне интеграции приложений целью является объединение данных или функции одного приложения с другим, благодаря чему обеспечивается интеграция, близкая к реальному времени. Интеграция приложений используется для интеграции В2В, внедрения CRM-систем, которые интегрированы с корпоративными серверными приложениями, web-интеграции и построения web-сайтов, которые поддерживают многочисленные бизнес системы. Кроме того, может потребоваться проведение специальной интеграции, особенно когда требуется интегрировать существующее приложение с вновь устанавливаемым ERP-приложением [83].

Залогом успешной интеграции данных приложений и бизнес-процессов является консолидация данных и систем баз данных. Прежде чем приступать к интеграции, необходимо идентифицировать (определить местонахождение) и каталогизировать данные, построить модель данных. Для обеспечения интеграции данных необходимо выбрать стандартные форматы для данных (Standards of Integration), которые поддерживают использование и распространение информации и бизнес данных и являются основой для проведения интеграции корпоративных приложений. К ним относятся DCOM, CORBA, OLAP, GIS, Sun RPC, XML, Web-сервисы [20, 26, 87, 89, 90].

Интеграция платформ (Platform Integration) касается процессов и инструментов, с помощью которых эти системы могут осуществлять безопасный и оптимальный обмен информацией. В результате, данные могут беспрепятственно передаваться по различным приложениям. Например, определение того, как нужно надежно передавать информацию с NT- на UNIX-машину, является чрезвычайно непростой задачей по интеграции всей корпоративной системы.

Существующую неоднородность рынка интеграции корпоративных приложений можно объяснить тем, что компании предлагают продукты, в которых реализуется только часть задач интеграции, и ни один поставщик пока не поставляет законченного решения. Лидерами на этом рынка являются BE А Systems, CrossWorlds Software, IONA Technologies, Level 8 Systems, Mercator Software, NEON (в 2001г. этот поставщик был приобретен компанией Sybase), SeeBeyond, Software AG, TIBCO, Vitria Technology и webMethods. Среди компаний, занимающихся интеграцией крупных систем, можно выделить IBM Global Services, Accenture, PricewaterhouseCoopers, CSC и EDS. На рынке существует многообразие средств и инструментов интеграции: MICROSOFT SHAREPOINT PORTAL SERVER 2003, IBM WebSphere, BEA AguaLogic, SAP NetWeaver, SAS, Microsoft BizTalk Server, которые включают в себя универсальные платформы бизнес-интеграции, системы доставки сообщений, интеграционные брокеры, средства моделирования бизнес-процессов, серверы приложений, портальные системы, средства бизнес-аналитики, представляют доступ к серверным мощностям, устройствам хранения, настольным сервисам и приложениям как к универсальным ресурсам [16, 17, 41, 48, 67, 84, 87].

Согласно прогнозам аналитиков, в ближайшем будущем рынок услуг и разработки ПО в области интеграции станет наиболее перспективным и быстро растущим сегментом рынка ИТ. По оценке консалтинговой компании IDC, ожидается устойчивый рост поступлений от реализации программного обеспечения, предназначенного для решения интеграционных задач: так в 2001 году эта сумма составляла 4.3 млрд. долларов, а в 2006 году она должна вырасти до 8.2 млрд. долларов.

Общие принципы моделирования

Моделирование можно рассматривать как один из методов, используемых при проектировании и исследовании сложных систем. В основе любого моделирования лежит теория подобия, суть которой состоит в замещении одного объекта другим с целью получения информации о важнейших свойствах объекта-оригинала с помощью объекта-модели [77, 97]. Классификация видов моделирования В работе [94] автор дает определение модели данных. Определение:

Моделью данных будем называть совокупность правил организации данных и операций над ними.

В основе любого моделирования лежит теория подобия, суть которой в замещение одного объекта другим с целью получения информации о важнейших свойствах объекта-оригинала с помощью объекта-модели [62, 81, 94, 95].

По степени полноты модели можно подразделить на категории: полные, неполные и приближенные. В основе полных моделей лежит полное подобие, которое проявляется как во времени, так и в пространстве. Неполные модели характеризуются неполным подобием модели изучаемому объекту. В приближенных моделях некоторые стороны функционирования реального объекта не моделируются совсем.

Классификация моделей по характеру изучаемых процессов включает: детерминированные, стохастические, статические, динамические, дискретные, непрерывные, дискретно-непрерывные модели.

В детерминированных моделях предполагается отсутствие всяких случайных воздействий. Стохастические модели отображают вероятностные процессы и события. Статические модели служат для описания объекта в определенный момент времени. Динамические модели отражают поведение объекта во времени. Дискретные модели используются для системы с дискретными процессами. Непрерывные модели позволяют отразить непрерывные процессы в системах, а дискретно-непрерывные - используются для выделения как дискретных, так и непрерывных процессов.

В зависимости от формы представления объекта выделяют: мысленное, наглядное, символическое, математическое (аналитическое, имитационное и комбинированное), реальное, натурное (научный эксперимент, комплексные испытания и производственный эксперимент), физическое моделирование [66, 72].

С точки зрения математического описания модели выделяют [72, 95]: Аналоговую модель. Описывается уравнениями, связывающими непрерывные значения. Цифровую модель. Описывается уравнениями, связывающими дискретные величины, представленные в цифровом виде. Комбинированную (аналогово-цифровую) модель. Может быть описана уравнениями, связывающими непрерывные и дискретные величины.

Среди свойств модели нужно выделить наиболее характерные: Конечность. Модель отображает оригинал лишь в конечном числе его отношений и, кроме того, ресурсы моделирования конечны; Упрощенность. Отображаются только существенные стороны объекта; Приблизительность. Действительность отображается моделью приблизительно; Адекватность. Модель успешно описывает моделируемую систему; Информативность. Модель должна содержать достаточную информацию о системе - в рамках гипотез, принятых при построении модели. Применение системного подхода в моделировании единого информационного пространства

Единое информационное пространство - это сложная, многоуровневая, открытая, непрерывно развивающаяся структура, включающая учетные информационные системы, электронные реестры, автоматизированные рабочие места, программные комплексы и приложения.

Определение степени зависимости между информационными системами

Построенная математическая модель интеграции данных хорошо описывают межсистемные особенности информационных систем. Основными носителями активной модели будут множество информационных объектов, множество семантических зависимостей.

На следующем этапе моделирования понижается уровень абстракции модели, выделяются основные классы объектов единого информационного пространства, для которых определяется структура: свойства, поведение и взаимное отношение. Для построения многоуровневой объектной схемы интегрированной системы применяется объектно-ориентированный анализ, в процессе которого основное внимание уделяется определению и описанию объектов (или понятий) в терминах предметной области.

Объектно-ориентированный подход позволяет моделировать конкретную систему, определяя множество объектов и их атрибутов (данных) и методов (операций и сообщений), которые манипулируют данными объектов или высылают запросы к другим объектам [23].

Анализ предметной области, который считается одним из самых эффективных методов объектно-ориентированного анализа и признается основным принципом объектно-ориентированного подхода, определяется как процесс идентификации и организации знаний о некоторых типах систем в целях моделирования этих систем [1,3, 15].

При анализе предметной области составляется список классов объектов путем идентификации в описании структур системы и операций; из составлен 66 ного списка извлекается усеченный список классов; с помощью идентификации сообщений и структур наследования определяются взаимоотношения классов.

Термин "объект" в программной индустрии впервые был введен в языке Simula (1967 г.) и означал некоторый аспект моделируемой реальности. Сейчас под объектом понимается "нечто, имеющее четко определенные границы" [21]. Объекты, обладающие одинаковыми свойствами, составляют классы - основное понятие объектного проектирования, описывающее множество объектов с общей структурой и поведением. Каждый объект принадлежит только одному классу. Обычно класс описывается как новый тип данных, а объекты (экземпляры класса) - определенные на его основе переменные.

Инструментами объектно-ориентированного анализа в методологии Коа-да-Уордона [3] являются (рис. 2.3): 1) атрибуты: инкапсулированные в классы объектов описания данных; 2) операции: процессы, применяемые к классам объектов. Существует два типа операций: методы и сообщения.

a. метод: операция, которая манипулирует инкапсулированными в объ ект данными;

b. сообщение: операция запроса к другим объектам, при этом посылка сообщений од одного класса к другому создает динамические связи между классами объектов;

3) поток данных: группа элементов данных, ассоциированных с сообщением и реализующих коммуникации между объектами;

4) наследование: в иерархии классов подклассы наследуют свойства, вклю чая определения данных и операции, находящихся на более высокой сту пени иерархии классов (надклассов и суперклассов). Наследование опре деляет статистические связи между классами объектов. Существуют два типа отношений наследования: агрегация (has_a) и обобщение (is_a).

Таким образом, неотъемлемыми характеристиками классов являются ат рибуты и методы. Атрибуты - данные, входящие в класс (текстовые, цифровые, темпоральные и мультимедийные данные, ссылки на другие объекты и т.д.). Методы описывают правила, по которым объекты оперируют со своими атрибутами. Неотделимость методов класса от данных - важное преимущество объектной модели.

Многоуровневые объектные схемы в УИС

Классификация объекта недвижимости «Строение» проводится по определенным параметрам (целевому назначению; типу использования; основание объекта). Балансодержателем ежеквартально сдается отчет «Карта учета областного имущества, имеющегося у юридического лица и перечня объектов недвижимости» (в соответствии с постановлением Губернатора Тюменской области от 25.11.99 № 251) для внесения данных в государственную базу данных реестра областного имущества. Ежегодно определяется балансовая и остаточная стоимость объекта недвижимости, вычисляется процент износа, по всем изменяемым данным ведется история в хронологическом порядке, дополнительно ведется учет данного объекта по городу, информация берется из базы данных имущественного реестра Департамента имущественных отношений города Тюмени.

Рассмотрим, например, подробнее работу с информационным объектом «Земельный участок», для которого можно выделить следующие основные характеристики: Кадастровый номер, Адрес участка, Классификация, Экспликация, Планшеты, Топография, Сервитуты.

Классификация участка проводится по определенным параметрам (целевому назначению; типу использования; типу (качеству); форме собственности; зоне градостроительной ценности), которые являются информационной основой для «Формы 22». Основной государственный отчет содержит данные о наличии земель и распределении их по формам собственности, категориям, угодьям и пользователям, о расположении земельного участка.

Поскольку данные, связанные с информацией об участке, могут изменяться (данные о сервитутах, выделение площади под благоустройство, переопределение прав долевой собственности и т.д.), необходимо вести историю по изменяемым данным в хронологическом порядке.

Для работы с топогеодезическими данными была выбрана технология использования методов обеспечивающих визуализацию участка с помощью OLE встраивания объекта Maplnfo или МарХ .

Информационный объект «Земельное дело» (рис. 3.9) содержит данные об юридических отношениях субъектов и земельных участков, а также документы, на основании которых было получено право владения, номер заявки, даты регистрации, сделки, заключения договора, тип владения, номер земельного дела, количество долей во владении, общее количество долей на участке.

Расширением класса «Право» является класс «Аренда», который описывает: вид арендного обязательства, сроки договора, назначение, сведения государственной регистрации, документы и т.д. С объектами этого класса тесно связан информационный объект «Лицевой счет» (рис. 3.10), в котором отражается финансовая сторона: расчет арендной платы, отслеживание платежей, зачетов, перемещений, взысканий по суду, расчет недоимки и начисление штрафных санкций.

Данный класс позволяет сохранять формируемые хранимые документы, связанные с балансодержателем, которые создаются на основе заготовленных шаблонов, с внесением данных и последующим хранением и редактированием. Здесь организованы такие методы, как поиск контекста в документах, создание новой формы для документа (рис. 3.12.). Для реализации методов был разработан класс, поддерживающий работу с текстовыми RTF строками [27, 35]. Класс для работы с RTF строками имеет следующие свойства: количество полей в документе-форме; количество таблиц в документе-форме; количество столбцов в объекте «таблица» формы.

Доступ к полям формы и полям таблиц возможен с помощью соответствующих методов, как по номерам полей, так и по их именам.

Используется тот факт, что тело документа RTF файла является последовательность строк текста и таблиц. Объект при загрузке RTF файла расчленяет документ на отдельные составляющие: начало файла, текст и его окончание. Принцип генерации отчета можно разбить на 3 части: загрузить шаблон; в цикле перебрать все строки документа и записать их в отчет, предварительно установив нужные значения переменных; сохранить результат в файл.

RTF-формат имеет подробную спецификацию и поддерживается большинством текстовых редакторов, данный формат можно обрабатывать программно, без вызова зарегистрированного приложения.

Помимо стандартных свойств (предварительный просмотр и печать итогового документа) также организованы такие методы как поиск контекста в до кументах, редактирование документа перед печатью, создание новой формы для документа. При этом предполагается, что пользователь владеет навыками редактирования текстов в MS WORD и его фантазия по поводу формы документа ограничивается только возможностями этого редактора.

Документы и их шаблоны хранятся в поле типа TEXT одной из таблиц базы данных, что обеспечивает эффективный поиск контекста.

Вспомогательный класс «Документ» используется в УИС и ЭР единого информационного пространства. Например, метод «Создание новой формы для документа» формирует документ в зависимости от функциональной нагрузки: документы строгой отчетности, связанные документы, отчеты, имеющие табличную структуру, формируемые хранимые документы.

Документы строгой отчетности служат для отображения содержания набора данных без возможности внесения изменения в печатную форму. Используется, например, для карточки объекта учета, лицевого счета договора аренды и т.д. Обычно формируются встроенным генератором отчетов с возможность предварительного просмотра, настройки принтера и печати.

Связанные документы - это хранимые статичные документы, полученные из внешних источников и связанные с объектами системы. Например, для каждого объекта собственности хранятся правоподтверждающие и правоустанавливающие документы. Для каждого документа, помимо стандартных атрибутов (№, дата, тип документа, выдавший орган) хранится либо отсканированная копия бумажного носителя либо электронная версия документа.

Похожие диссертации на Математическое моделирование и технологии интеграции данных в учетных информационных системах