Содержание к диссертации
Введение
Глава 1. Научно-методические основы моделирования структуры и создания баз метаданных 11
1.1.Общие сведения о метаданных 11
1.2. Использование метаданных 12
1.2.1. Отечественный и зарубежный опыт использования метаданных 12
1.2.2. Использование метаданных в землеустройстве и государственном кадастре недвижимости 20
1.3. Методы моделирования структур данных 24
1.3.1. Обзор основных методов моделирования данных 24
1.3.2. Объектно-ориентированная модель данных 29
1.3.3. Реляционная модель данных 37
Выводы по главе 1 46
Глава 2. Разработка состава метаданных для ведения государственного фонда данных, полученных в результате проведения землеустройства, и создания Государственного кадастра недвижимости 48
2.1. Состав пространственных данных землеустройства и Государственного кадастра недвижимости 48
2.2. Определение необходимых к документированию элементов метаданных национального профиля для ведения фонда данных землеустройства и создания ГКН 51
2.2.1. Обязательные к документированию классы и атрибуты метаданных национального профиля РФ 51
2.2.2. Определение обязательности документирования условных классов и атрибутов метаданных национального профиля 54
2.2.3. Определение необходимых к документированию классов и атрибутов метаданных национального профиля из состава не обязательных 56
2.3. Определение и описание дополнительных классов и атрибутов метаданных, необходимых при ведении фонда данных землеустройства и создании ГКН 60
2.3.1. Определение дополнительных элементов метаданных 60
2.3.2. Формирование дополнительных классов и атрибутов метаданных 66
2.4 Объектно-ориентированная модель метаданных 77
2.4.1 Описание и анализ полученной объектно-ориентированной модели 77
2.4.2. Тестирование объектно-ориентированной модели 79
Выводы по главе 2 86
Глава 3. Проектирование базы метаданных землеустройства и государственного кадастра недвижимости 88
3.1. Создание реляционной модели на основе разработанного тематического профиля 88
3.1.1. Формирование исходных отношений и создание ER-диаграммы 88
3.1.2. Проверка реляционной модели тематического профиля с помощью правил нормализации 92
3.2. Анализ итогов реляционного моделирования .' 108
3.2.1. Анализ полученной реляционной модели 108
3.2.2. Анализ процесса создания реляционной модели на основе объектно-ориентированной модели 111
3.3. Реализация баз метаданных 114
3.3.1. Создание программного продукта «Метаданные ИПД ГКН и землеустройства» 114
3.3.2. Практическое использование результатов исследования 121
Выводы по главе 3 123
Заключение 125
Библиографический список использованной литературы 127
- Отечественный и зарубежный опыт использования метаданных
- Определение необходимых к документированию элементов метаданных национального профиля для ведения фонда данных землеустройства и создания ГКН
- Определение дополнительных элементов метаданных
- Формирование исходных отношений и создание ER-диаграммы
Введение к работе
Актуальность темы. На современном этапе экономических преобразований в Российской Федерации особое значение приобретают вопросы государственного регулирования земельно-имущественных отношений [27]. В связи с этим в системе управления земельными ресурсами обозначились новые приоритеты, например, уточнение налогооблагаемой базы для повышения бюджетных доходов, создание эффективной системы обеспечения прав и гарантий правообладателей земельных участков с целью привлечения инвестиций на рынок недвижимости [26]. Одним из основных инструментов решения указанных задач является Государственный кадастр недвижимости (далее ГКН), являющийся информационной основой государственного управления земельными ресурсами и экономического регулирования земельных отношений[25].
Одним из источников информации ГКН являются результаты землеустроительных и кадастровых работ. Проведение таких работ регламентировано целым рядом федеральных законов, основными из которых являются №221-ФЗ «О государственном кадастре недвижимости» и №78-ФЗ «О землеустройстве» [31,55,57].
Однако, результаты кадастровых и землеустроительных работ используются не только для ведения ГКН. Они также представляют большую ценность для разработки документов территориального планирования, решения вопросов экологической безопасности, защиты плодородия почв и т.д. [44,74]. В свою очередь при ведении ГКН используются материалы геодезических, картографических и фотограмметрических работ, данные информационной системы обеспечения градостроительной деятельности (ИСОГД) в отношении градостроительных регламентов и др. [1,60].
Кроме того, административным регламентом по предоставлению государственной услуги «Ведение государственного фонда данных, полученных в результате проведения землеустройства», утвержденным приказом Минэкономразвития РФ №376 от 14.11.2006г., предусмотрена
открытость и доступность результатов землеустроительных работ для всех заинтересованных физических и юридических лиц [9].
Обеспечение свободного доступа всех заинтересованных физических и юридических лиц к материалам ГКН, а также участие в межведомственном обмене данными невозможно без создания инфраструктуры пространственных данных (далее ИПД) ГКН, что предусмотрено подпрограммой "Создание системы кадастра недвижимости (2006 - 2011 годы)" федеральной целевой программы «Создание автоматизированной системы ведения государственного земельного кадастра и государственного учета объектов недвижимости (2002 - 2007 годы)», утвержденной постановлением Правительства РФ №560 от 13.09.2005г.
Вопросы создания ИПД в российской федерации изложены в «Концепции создания и развития инфраструктуры пространственных данных Российской Федерации» [9], одобренной Правительством РФ. Главной задачей любой национальной ИПД является обеспечение доступа всех заинтересованных лиц к пространственным данным. Пространственные данные представляют собой данные о пространственных объектах, под которыми понимаются цифровые модели материальных или абстрактных объектов реального или виртуального мира, содержащие идентификатор, координатное и атрибутивное описание объектов [12].
Область применения пространственных данных чрезвычайно широка. В связи с этим для решения различных задач разными ведомствами, юридическими и физическими лицами инициируются работы по их производству. Проблема несогласованности подобных работ приводит к дублированию расходов и затратам времени, которых можно было бы избежать, располагая информацией о готовых пространственных данных на необходимую территорию в нужном объеме и качестве. Таким образом, готовые пространственные данные требуют описания для организации их хранения, обеспечения доступа к ним и возможности оценки их пригодности
для потенциального потребителя. Для решения указанной задачи используются метаданные, являющиеся основным компонентом ИПД [9].
Актуальность выбранной темы обусловлена необходимостью описания в виде баз метаданных пространственных данных, используемых для ведения ГКН и государственного фонда данных, полученных в результате проведения землеустройства, что предусмотрено упомянутыми выше нормативно-правовыми документами, регламентирующими деятельность государства в управлении земельно-имущественным комплексом страны. На актуальность данного направления исследования указывают работы, выполняемые в рамках Европейского союза и ООН по разработке международных стандартов, описывающих состав метаданных и порядок создания и ведения баз метаданных [86-88].
В связи с этим, цель диссертационного исследования заключается в разработке состава метаданных (тематического профиля), необходимого для описания пространственных данных, используемых при ведении фонда данных землеустройства и ГКН, и проектирование на его основе базы метаданных.
Основные методы диссертационного исследования. Для разработки состава метаданных применялся метод объектно-ориентированного моделирования. Для проектирования базы метаданных использовались реляционные методы моделирования, в том числе теория нормальных форм. Указанные методы являются разновидностью логико-математического моделирования, основывающегося на теории моделей. Исходные данные для проведения моделирования были получены в результате аналитической систематизации и обобщения информации по литературным источникам.
Основными литературными источниками при написании диссертационной работы, в которых рассматривались вопросы содержания землеустроительных и кадастровых работ, состава землеустроительных и кадастровых сведений, организации автоматизированных информационных систем, являются работы российских и зарубежных авторов: Бездушного
A.M., Варламова A.A., Волкова С.Н., Гальченко С.А., Грейса М., Журкина И.Г., Кларка Д., Кислова B.C., Комова Н.В., Константинова А.Ю., Кошкарёва А.В., Лебедева П.П., Неумывакина Ю.К., Савиных В.П., Хлыстуна В.Н., Цветкова В.Я., Чена П., Шайтуры СВ. и многих других.
Научная новизна диссертационного исследования состоит в том, что классифицированы методами логико-математического моделирования элементы описания пространственных данных землеустройства и ГКН в виде тематического профиля метаданных. Так же в рамках диссертационного исследования разработан оптимальный алгоритм формирования исходных отношений реляционной модели тематических профилей пространственных метаданных на основе классов объектно-ориентированной модели национального профиля метаданных.
Научное значение выполненного исследования заключается в разработке и обосновании состава сведений фонда данных землеустройства и ГКН о пространственной информации, содержащейся в данных информационных ресурсах. Описывающий данный состав сведений тематический профиль метаданных является основой организации при ведении ГКН межведомственного обмена пространственными данными в том числе в автоматизированном электронном виде. Так же в рамках диссертационной работы разработана методика создания тематических профилей пространственных метаданных в виде реляционной модели данных на основе содержания объектно-ориентированной модели, что значительно упростит процесс создание баз метаданных отраслей, смежных с отраслью ведения ГКН, например отрасли градостроительного проектирования.
Основные положения, выносимые на защиту. Новыми и выносимыми на защиту являются следующие результаты диссертационного исследования:
состав метаданных, необходимый для ведения ГКН и проведения землеустройства, в виде тематического профиля;
реляционная модель базы метаданных землеустройства и ГКН;
правила и алгоритм формирования исходных отношений реляционной модели тематического профиля метаданных на основе классов объектно-ориентированной модели;
программный продукт «Метаданные ИПД ГКН и землеустройства», поддерживающий процессы сбора, документирования, накопления, обработки и хранения метаданных землеустройства и ГКН.
Все вышеизложенное определило структуру диссертационной работы.
Первая глава диссертационной работы, озаглавленная «Научно-методические основы моделирования структуры и создания баз метаданных», посвящена изучению теоретических вопросов определения и использования метаданных, отечественному и зарубежному опыту использования метаданных при операциях с пространственными данными, основных методов разработки структур и баз данных. Так же изучены вопросы использования метаданных при ведении фонда данных землеустройства и ГКН и обоснована необходимость установления их состава. В первой главе обоснован выбор основных методов исследования.
Во второй главе, озаглавленной «Разработка состава метаданных для ведения государственного фонда данных, полученных в результате проведения землеустройства, и создания Государственного кадастра недвижимости», по результатам аналитической систематизации и обобщения информации по литературным источникам с помощью методов объектно-ориентированного моделирования разработан тематический профиль метаданных фонда данных землеустройства и ГКН. В этой главе также приведен анализ разработанного состава метаданных и сделаны выводы о возможности его дальнейшего использования.
В третьей главе диссертационной работы, озаглавленной «Проектирование базы метаданных землеустройства и государственного кадастра недвижимости» с помощью методов реляционного моделирования и
СУБД Access рассмотрены вопросы создания базы метаданных землеустройства и ГКН. Кроме того, были сформулированы правила и алгоритм формирования исходных отношений реляционной модели на основе объектно-ориентированной модели. Так же рассмотрены вопросы реализации результатов исследований, в том числе на примере создания программного продукта «Метаданные ИПД ГКН и землеустройства».
Практическая значимость. Разработанные по результатам диссертационного исследования тематический профиль метаданных, реляционная модель тематического профиля и программный продукт «Метаданные ИПД ГКН и землеустройства», могут быть использованы для ведения фонда данных землеустройства и ГКН. Программный продукт «Метаданные ИПД ГКН и землеустройства» может быть применен для ведения архивов пространственных данных землеустроительных и кадастровых предприятий. Содержание тематического профиля метаданных может быть использовано при создании тематических профилей областей деятельности, связанных с землеустройством и ГКН, например, в территориальном планировании.
Основные положения диссертационной работы в части апробации докладывались:
На Всероссийском форуме «Рынок геоинформатики в России. Современное состояние и перспективы развития» (г.Москва, июнь 2007г.).
На Всероссийской научно-технической конференции «Роль и место дистанционного зондирования Земли в инфраструктуре пространственных данных» (г.Екатеринбург, июнь 2007г.).
На 5-ой Всероссийской конференции «Градостроительство и планирование территориального развития России» (г.Ростов-на-Дону, июль 2007г.).
На 12-ой и 13-ой Всероссийских учебно-практических конференциях «Организация, технологии и опыт ведения кадастровых работ» (г.Москва, ноябрь 2007г. и декабрь 2008г.).
На конференции молодых ученых Государственного университета по землеустройству (г.Москва, декабрь 2007г.).
В рамках научно-технического визита российской делегации в Испанию автором диссертации был сделан доклад об особенностях создания и развития инфраструктуры пространственных данных государственного кадастра недвижимости (Испания, апрель 2008г.).
Результаты исследований, изложенные в диссертационной работе, нашли отражения в опубликованных статьях автора [55-62]. По теме диссертации опубликованы 8 работ, в том числе одна статья в журнале, рекомендованном ВАК РФ.
Отечественный и зарубежный опыт использования метаданных
Мировой опыт использования метаданных сравнительно не велик и начинает свой отсчет с начала 90-х годов прошлого века. В этот период Федеральным комитетом по географическим данным США (FGDC) производились соответствующие исследования, по результатам которых был утвержден национальный стандарт FGDS-STD-001-1998, содержащий около 200 элементов описания пространственных данных [48,50,84].
В 1998 году Европейским комитетом по стандартизации был разработан и утвержден стандарт на содержание пространственных метаданных CEN ENV 12657, получивший большее распространение в Европе по сравнению с американским стандартом [81].
Однако, на сегодняшний день самым распространенным является международный стандарт ISO 19115:2003 «Geographic information -Metadata» (Географическая информация. Метаданные). Данный стандарт определяет ядро метаданных - минимальное подмножество элементов метаданных. Элементы ядра метаданных предоставляют достаточный объем информации, необходимый для того, чтобы понять природу и содержание описываемого набора данных, и применяются преимущественно в целях каталогизации [87].
Состав метаданных - элементов описания пространственных данных в данном стандарте представлен в виде диаграмм UML (Unified Modeling Language) - унифицированного языка моделирования [71]. Международный стандарт содержит более 400 элементов - атрибутов в нотации UML, каждому из которых соответствует значение обязательности документирования. За счет этого и наличия избыточного количества элементов достигается возможность создания национальных и тематических профилей с сохранением интероперабельности.
Отметим еще один международный стандарт семейства ISO -19139:2007 Geographic information - Metadata - XML schema implementation [88]. Данный стандарт регламентирует этап физической реализации работы с метаданными - кодирование метаданных с применением языка XML[36].
В подтверждение необходимости создания национальных профилей на основе международного стандарта ISO, можно отметить наличие профиля UK GEMINI, принятого в Великобритании и включающего 32 элемента метаданных [85,93]. Особый интерес вызывает региональный стандарт метаданных, применяемый в Австралии и Новой Зеландии [47,80]. Ядро данного стандарта изначально основывалось на американском стандарте FGDS-STD-001-1998, однако впоследствии описание 42 элементов были приведены в соответствие с ISO 19115.
Таким образом, можно отметить высокую степень согласованности международных стандартов в части состава пространственных метаданных. Не в последнюю очередь это подтверждает большая степень идентичности упомянутых выше стандартов ISO 19115 и FGDS-STD-001-1998, которые, как отмечалось, разрабатывались в разное время и независимыми группами экспертов.
Такая согласованность стандартов поддерживает возможность международного обмена пространственными данными, который лежит в основе ряда программ, таких как программы ООН GEOSS (Глобальная система систем наблюдений Земли) и программа «Устойчивое развитие», участником которых является также РФ. Другим примером являются программы Европейского Союза (далее ЕС), такие как CORINE и GMES.
Для поддержания выполнения работ этих программ, основанных на обмене пространственными данными с целью контроля показателей состояния окружающей среды, была разработана директива INSPIRE 2007/2/ЕС [83]. Директива излагает основные правила для создания инфраструктуры пространственной информации в Европе. Выполнение мероприятий, предусмотренных в директиве, должно обеспечить совместимость пространственной информации, созданной государствами-членами ЕС, и возможность ее использования для решения задач как Союза, так и международных проектов. Требования к составу метаданных в указанном документе стоят на первом месте и основным из них является интероперабельность. Выполнение действий в области определения и внедрения состава и структуры метаданных детально определено до 2011 года. Говоря о метаданных, как части создаваемой Европейской инфраструктуры пространственных данных, следует остановиться на примере действующей инфраструктуры. Наиболее ярким примером в данной области является инфраструктура пространственных данных (далее ИПД) Испании.
ИПД Испании, создание которой начато пять лет назад, в настоящее время представляет собой полномасштабную систему, которая продолжает развиваться [91, 92]. Среди особенностей ИПД Испании можно назвать поддержку линейки стандартов Open Geospatial Consortium (далее OGC), т.е. использование программных продуктов с открытым кодом [90]. Центральным звеном ИПД Испании является геопортал Испанского географического института, который был открыт для посещения в декабре 2003 г. в качестве бета-версии, а с июля 2004 г. он работает в штатном режиме. На геопортале размещено большое количество пространственных данных, которые открыты к свободному просмотру и скачиванию для нужд, не связанных с коммерческой деятельностью.
На геопортале представлены пространственные данные различной тематики от результатов европейской программы CORTNE, программ ООН GEOSS и «Устойчивое развитие», до фотопланов на всю территорию страны, кадастровых данных и пр. Тематические возможности геопортала Испании продемонстрированы на рисунке 1.1.
Однако, функционал ресурса не ограничивается визуальной работой с различной тематической информацией, так как набор сервисов позволяет представлять данные в удобном для пользователя виде, например, строить профили местности вдоль заданной прямой или ломаной линии или границы зон видимости из заданной точки обзора. Разумеется, функционирование рассматриваемого ресурса невозможно без определенного объема информации, охватывающей всю территорию страны и обладающей высокой степенью актуальности.
Определение необходимых к документированию элементов метаданных национального профиля для ведения фонда данных землеустройства и создания ГКН
Решение задачи создания тематического профиля метаданных фонда данных землеустройства и ГКН связано с возможностью определения обязательности документирования отдельных элементов метаданных национального профиля. Анализ необходимости документирования отдельных элементов метаданных будем производить с использованием графического языка моделирования.
В национальном профиле применено три способа описания пакетов метаданных, предлагаемых нотацией UML [17]: — общее описание пакетов метаданных; — UML-диаграммы пакетов метаданных; — детальное описание структуры и состава пакетов метаданных. Общее описание пакетов метаданных национального профиля представлено на рисунке 2.1.
Следует отметить, что при проведении диссертационного исследования кроме объектно-ориентированной модели нами были использованы методы реляционного моделирования для создания баз метаданных. В связи с тем, что в реляционном моделирование в отличии от объектно-ориентированного отсутствует понятие «пакетов», в дальнейшем исследовании будет использована общая диаграмма классов метаданных.
Общее описание пакетов метаданных. Рис.2.1 Кроме того, на UML диаграмме, приведенной в приложении 1 диссертации, нами обозначено значение признака обязательности документирования для каждого элемента метаданных. Значение признака обязательности документирования метаданных получено из приложения
MDSecurity Constraints Ограничения на доступ и использование набора данных или метаданных с целью соблюдения требований законодательства Российской Федерации о государственной тайне и устанавливаемых ограничений в связи с охраной коммерческой тайны Класс classification Категория информации по уровню доступа Класс MD_Maintenancelnfor mation Обновление набора данных или метаданных Класс maintenanceAndUpdat eFrequency Периодичность обновления набора данных или метаданных после их создания Класс Cl Citation Стандартизованная ссылка на описаниеданных Класс title Наименование объекта ссылки Текст date Дата создания объекта ссылки Дата Следует отметить, что перечисленные элементы являются обязательными к документированию для всех без исключения тематических профилей метаданных.
Как было установлено ранее, документирование условных классов и атрибутов метаданных является обязательным, если выполняется определенное условие. В таблице 2.2 приведены условные классы и атрибуты метаданных с формулировками условий обязательности документирования. Информация для составления таблицы 2.2 была получена нами также из «Словаря данных» национального профиля [17]. Условные классы и атрибуты метаданных Таблица 2. Наименованиекласса илиатрибута Описание Условие обязательности Тип данных language Язык, используемый длядокументированияметаданных Обязателен, если не утвержденоиспользование ISO/ IEC 10646-1 Текст characters et Наименование и обозначение стандарта кодировки метаданных Класс characters et Наименование и обозначение стандарта кодировки, используемого для описания данных Класс denominator Знаменатель численного масштаба, который определяет степень детализации, соответствующий масштабу твердой копии карты или плана Обязателен, если не указано расстояние на местности,соответствующее пикселю изображения Целое число distance Расстояние на местности, соответствующее пикселу изображения (с указанием единиц измерения) Обязателен, если не указан знаменатель численного масштаба Текст otherConstraints Ограничения на получение и использование по иным правовым основаниям Обязателен, если ограничения полностью не описаны правилами получения и использования Текст Обязательность документирования языка описания данных и применяемой при этом кодировки, связана с применением стандарта кодировки данных.
В России можно указать три действующих стандарта кодировки и еще два, потерявших актуальность. Так, например, кодировка символов русского языка, известная как кодировка Windows- СР 1251, была введена «извне» — компанией Microsoft, но, учитывая широкое распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение. Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) — ее происхождение относится ко временам действия Совета Экономической Взаимопомощи государств Восточной Европы. На компьютерах, работающих в операционных системах MS-DOS, могут действовать еще две кодировки. В связи с изобилием систем кодирования текстовых данных, действующих в России, возникает задача межсистемного преобразования данных — это одна из распространенных задач информатики.
Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов -256. В то же время очевидно, что если, например, кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной — UNICODE и описана международным стандартом ISO/ IEC10646-1. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов — этого поля достаточно для размещения в одной таблице символов большинства языков планеты.
Таким образом, в области ведения государственного фонда данных, полученных в результате землеустройства, и Государственного кадастра недвижимости отсутствует утвержденная система кодировки. В связи с этим документирования языка описания данных и применяемой при этом кодировки следует считать обязательным.
Обязательное документирование знаменателя численного масштаба пространственных данных при ведении ГКН предусмотрено в соответствии со статьей 12 Федерального закона «О государственном кадастре недвижимости» [5]. При ведении фонда данных землеустройства масштаб указывается в «Инвентарной книге учета и регистрации документов» [9] . В связи с этим документирование масштаба является обязательным, а разрешение растровых изображений нет.
При ведении ГКН устанавливаются ограничения в получении и использовании информации [5]. Пунктами 2.1.3 и 2.3 административного регламента также устанавливаются правила получения и использования информации [9]. Определенные данными документами ограничения связаны с конфиденциальностью информации о частной жизни, секретностью государственных сведений. Ограничений, связанных с иными обстоятельствами, в том числе с защитой интеллектуальной собственности в рассматриваемой области не предусмотрено. В связи с этим атрибут «ограничения на получение и использование по иным правовым основаниям» следует считать не обязательным к документированию.
Определение дополнительных элементов метаданных
Ранее была установлена обязательность документирования классов и атрибутов метаданных на основе содержания национального стандарта. Однако, национальный стандарт не в полной мере учитывает требования ведения метаданных фонда данных землеустройства и ГКН. В связи с этим необходимо документирование дополнительных характеристик пространственных данных, не описанных в национальном стандарте. Как было определено ранее возможность создания новых классов и атрибутов метаданных также является инструментом создания тематических профилей.
Данные характеристики не представляют интереса для внешних пользователей и не имеют ценности для организации межведомственного обмена. Однако, они необходимы для организации хранения, передачи данных между подразделения фондодержателя, контроля за предоставлением информации, своевременным обновлением и уничтожением, потерявшей ценность информации, определения ее ценности [58].
Указанные характеристики для полноценного функционирования базы метаданных фонда данных землеустройства и ГКН должны быть выявлены и описаны в виде классов и атрибутов метаданных. Данные классы и атрибуты должны использоваться исключительно фондодержателем для выполнения им возложенных на него функций. Использование данных классов и атрибутов при осуществлении межведомственного обмена в рамках Российской инфраструктуры пространственных данных приведет к ошибкам при обработке запросов. Данные ошибки будут вызваны несогласованностью данных, так как указные элементы отсутствуют в национальном стандарте [17], и, следовательно, формат их представления не согласован с другими пользователями пространственных данных.
Если в дальнейшем будет установлена ценность данной информации для иных целей, кроме ведения фонда данных землеустройства и ГКН, данные элементы будет необходимо включить в национальный стандарт. Отсутствие данных элементов в национальном стандарте в настоящий момент не является препятствием к их использованию для внутренней организации базы метаданных фонда данных землеустройства и ГКН.
Дополнительные элементы метаданных, необходимые для ведения фонда данных землеустройства и ГКН, были определены нами в ходе анализа нормативно-правовых документов, регулирующих данную область [1-9].
Ограничения на доступ и нспо льзование набора данных или метаданных с иетью соблюдения требовании- законодательства РФ о государственной тайне и устанавливаемых ограничений 8 связи с охраной коммерческой тайны категория информзшш па уровню достуги[1] Категории информации по уровню доступа и нспотьзоваиия
Выделенные таким образом элементы метаданных следует описать в виде атрибутов и классов объектно-ориентированной модели с использованием нотации UML. Правила создания атрибутов, классов и отношений были рассмотрены в ходе предыдущего исследования. Однако, необходимо определить, что в ходе проведенного анализа в рамках данной работы необязательные к документированию классы были исключены из состава метаданных, в связи с чем данное свойства при дальнейшем моделировании использоваться не будет.
Свойство множественности играет важную роль в моделировании структур данных и является основным инструментом использования реляционных моделей. В диссертационной работе данный метод моделирования будет применен, в связи с чем уделено особое внимание определению множественности класса в отношениях агрегации.
Дополнительные атрибуты, необходимые исключительно для функционирования фонда данных землеустройства и ГКН, на основе сказанного ранее внешними пользователями использоваться не могут, в связи с чем они будут объявлены далее закрытыми при определении свойства видимости атрибутов.
В предыдущем параграфе были определены дополнительные элементы метаданных, являющиеся соответственно атрибутами. Присвоим этим атрибутам имена и опишем их свойства.
«Подлинность документа» - имя атрибута, характеризующего принадлежность документа фонда данных к копии, оригиналу или страховой копии. Данный атрибут может принимать только одно из трех указанных значений. В связи с этим целесообразно для данного атрибута сформировать собственный тип данных, представляющий собой перечисление (enumeration) с именем «Подлинность». Каждый документ фонда данных должен и может иметь только одну характеристику подлинности, в связи с этим значение множественности для данного атрибута составляет «1».
«Вид документа» - имя атрибута, характеризующего принадлежность документа фонда данных к видам землеустроительных документов, указанных в приложении 1 административного регламента. Данный атрибут может принимать только указанные в приложении значения. В связи с этим целесообразно для данного атрибута сформировать собственный тип данных, представляющий собой перечисление (enumeration) возможных значений с именем «Виды землеустроительных документов». Каждый документ фонда данных должен относиться к одному или нескольким видам землеустроительной документации, в связи с этим значение множественности для данного атрибута составляет «1.. ».
«Сведения о передаче» - имя атрибута, содержащего информацию о передаче на хранение документа фонда из одного подразделения фонда держателя в другое. Передача документа сопровождается принятием акта о передаче, который характеризуется номером, датой утверждения, составом комиссии, принявшей акт или наименованием лица его утвердившего. Данные характеристики являются атрибутами, описывающими не только акты о передаче документов, но и акты об уничтожении и выделении к уничтожению, в связи с чем их целесообразно объединить в самостоятельный тип данных, который и будет соответствовать атрибуту «Сведения о передаче в другие подразделения». Данному типу присвоено имя «Сведения о статусе». Каждый документ фонда данных может как передаваться в другие подразделения неограниченное количество раз, так и не передаваться вовсе, в связи с этим значение множественности для данного атрибута составляет «0.. ».
Формирование исходных отношений и создание ER-диаграммы
В первой главе (с.37-46) было определено, что создание реляционной модели данных состоит из последовательного выполнения 10 этапов проектирования. При этом 8 этапов проектирования совпадают с этапами создания объектно-ориентированной модели. Эти этапы были выполнены в предыдущем исследовании при определении и описание дополнительных классов и атрибутов метаданных, необходимых при ведении фонда данных землеустройства и создании ГКН.
Так на этапе формирования круга задач и определения предметной области был выполнен анализ нормативно-правовых документов в области ведения фонда данных землеустройства и создания ГКН. На основе данного анализа были определен перечень дополнительных элементов метаданных, таких как физическое состояние документа, место его хранения в фонде данных, практическое назначение, комплектность и пр. На этапах формирования исходных отношений, выделения сущностей и связей между ними были определены наименования и свойства атрибутов, соответствующих выделенным элементам метаданных. Данные атрибуты были объединены в классы - сущности, которым также было присвоено имя и описаны их свойства. Этапу построения ER - диаграмм с учетом всех сущностей и связей соответствовало создание UML диаграммы дополнительных классов метаданных, приведенной на рисунке 2.3. На этапах специализации, генерализации и категоризации и создании полной концептуальной модели было определено, что описание документов фонда данных землеустройства и ГКН является разновидностью описания пространственных данных в наборе данных. Это выражается в отношении обобщения между классами «Характеристики документа фонда данных» и «Информация о наборе данных».
Таким образом, класс «Характеристики документа фонда данных» относится к пакету Identification Information, описанному в разделе 5 национального профиля метаданных. Диаграмма пакетов метаданных национального профиля соответствует 8 этапу проектирования — создание сокращенной концептуальной модели. На 9-ом этапе проектирования решается задача формирование набора отношений. Ранее приводилось 6 правил формирования отношений (с.45-46). Данные правила направлены на получение отношений «один ко множеству» или «множество к одному» с обязательностью на обоих концах отношений. В первой главе диссертации было определено, что при создании объектно-ориентированной модели используются отношения агрегации, ассоциации или обобщения. Все эти отношения, исходя из правил их формирования, характеризуются свойством множественности связанного класса, которое может принимать значения, указные на рисунке 1.4. Таким образом, отношения объектно-ориентированной модели характеризуются значением множественности «один ко множеству» или «один к одному». Это свойство отношений объектно-ориентированных моделей определяет их древовидную структуру. Отсутствие в объектно-ориентированной модели отношений «множество ко множеству» избавляет от необходимости использование 6 правила формирования отношений реляционной модели. 2 — 5 правила решают вопрос участия в отношении необязательных сущностей. Вопрос обязательности сущностей (классов) подробно рассматривался ранее. Было определено, что все элементы метаданных (атрибуты и классы), включенные в тематический профиль ведения фонда данных землеустройства и ГКН, являются " обязательными к документированию. При выявлении указанных отношений в соответствии с 1-ым правилом необходимо сформировать одно отношение, первичным ключом которого будет ключ любого из исходных отношений.
В первом случае формирование одного отношения является достаточно формальным, так как класс «Распространитель и способы получения набора данных» не содержит атрибутов. В тексте национального профиля данный класс являлся суперклассом и обобщал классы «Распространитель набора данных», «Технические характеристики набора данных и носители информации», «Формат представления данных». Так как последние две сущности в ходе проведенного анализа не были признаны обязательными к документированию, а, следовательно, не подлежащими включению в тематический профиль, класс «Распространитель набора данных» остался единственной разновидностью суперкласса «Распространитель и способы получения набора данных». В связи с этим класс «Распространитель и способы получения набора данных» подлежит исключению из содержания тематического профиля. Выявление данного факта стало возможно только при создании реляционной модели, что подтверждает ранее сделанный вывод о необходимости реализации тематических профилей в реляционной модели.
Во втором случае на основе отношений «Корневая сущность, определяющая метаданные» и «Обновление набора данных или метаданных» было сформировано одно отношение - атрибут «периодичность обновления набора данных или метаданных после их создания» был перенесен в класс «Корневая сущность, определяющая метаданные». После внесения соответствующих изменений все правила формирования отношений реляционной модели следует признать выполненными, а диаграмму классов объектно-ориентированной модели, -соответствующей ER-диаграмме отношений реляционной модели. Следующим этапом создания реляционной модели является ее проверка с помощью правил нормализации. Содержание данных правил было установлено в первой главе диссертации. Полученная нами модель в настоящий момент не соответствует 1-ой нормальной форме — никакое значение атрибута не может быть множеством или группой атрибутов. Обычно данное правило применяется на этапе формирования исходных отношений — в отношения (сущности) включаются атомарные атрибуты, принимающие единственное значение. Таким образом, атрибуты реляционной модели не могут обладать множественностью или представлять собой отдельный класс.
В отличие от реляционной модели в объектно-ориентированной модели атрибуты могут обладать множественностью и представлять собой класс, который является определенным пользователем типом данных. Так в ходе исследования нами были выделены атрибуты «сведения об уничтожении» и «сведения о выделении к уничтожению», описывающие состояние документа в фонде данных землеустройства, и «кадастровый номер», описывающий кадастровый номер земельного участка, отображенного в документе. Данные атрибуты могут принимать множество значений для одного и того же документа, и им соответствуют типы данных «Сведения о статусе» и «Кадастровый номер», представляющие собой классы.
Кроме сформированных в ходе проведенного анализа атрибутов, множественностью и типами данных, определенными как классы, обладают атрибуты тематического профиля, унаследованные им из национального профиля метаданных. Для устранения несоответствия модели 1-ой нормальной форме следует сформировать на основе исходного отношений, содержащего описанные атрибуты, несколько новых, таких атрибутов не содержащих.
При формировании новых отношений будем определять в них ключевые атрибуты, устраняя тем самым вторую причину несоответствия модели 1-ой нормальной форме. Данная причина также обусловлена особенностями объектно-ориентированной модели — отсутствие в ее содержании ключевых атрибутов. При определении ключевых атрибутов следует сразу использовать 2-ое и 3-е правило нормализации: полная, нетранзитивная зависимость всех атрибутов отношения от ключа (всех элементов составного ключа).