Содержание к диссертации
Введение
Глава 1. Обеспечение безопасности семантических баз данных 11
1.1. Семантические технологии Semantic Web 11
1.2. Семантические базы данных 24
1.3. Системы управления семантическими базами данных 27
1.4. Информационные системы на основе семантических баз данных 29
1.5. Проблемы обеспечения безопасности семантических баз данных 34
1.6. Выводы по главе 42
Глава 2. Архитектура системы безопасности семантических баз данных 44
2.1. Онтологические модели в семантической базе данных 44
2.2. Средства обеспечения безопасности семантических баз данных 48
2.3. Предлагаемая архитектура системы обеспечения безопасности семантических баз данных 55
2.4. Постановка задач 62
2.5. Выводы по главе 70
Глава 3. Алгоритмы обеспечения безопасности семантических баз данных 72
3.1. Алгоритмы согласования уровней безопасности элементов онтологий и метаданных 72
3.2. Алгоритм определения покрытия безопасности семантических баз данных 79
3.3. Алгоритм определения покрытия безопасности результатов логических выводов 83
3.4. Метод обнаружения нарушений результатов логических выводов 85
3.5. Алгоритм контроля выполнения запросов к семантическим базам данных 92
3.6. Пример контроля результатов логических выводов в СБД 95
3.7. Выводы по главе 101
Глава 4. Реализация и исследование алгоритмов обеспечения безопасности семантических баз данных 102
4.1. Реализация программного обеспечения 102
4.2. Исследование эффективности разработанных методов и алгоритмов 113
4.3. Описание внедрения 126
4.4. Выводы по главе 133
Заключение 134
Список сокращений и условных обозначений 136
Словарь терминов 137
Список иллюстративного материала 139
Литература 143
Приложения 154
- Системы управления семантическими базами данных
- Средства обеспечения безопасности семантических баз данных
- Алгоритм определения покрытия безопасности семантических баз данных
- Исследование эффективности разработанных методов и алгоритмов
Введение к работе
Актуальность исследования. В настоящее время современные информационные системы организаций создаются на основе реляционных баз данных (БД), в которых в основном описывается синтаксис данных. Использование реляционных БД имеет ряд недостатков, таких, как жёсткость схем, недостаточная выразительность, сложность интеграции БД и отсутствие возможности выполнения логических выводов на данных. В связи с этим начинают создаваться и использоваться информационные системы организаций, основанные на семантических технологиях, основной идеей которых является переход от работы только с синтаксисом (структурой) информации к работе с её семантикой (смыслом) и к семантическому моделированию (с помощью онтологий) различных предметных областей. С учётом этого основным элементом семантических информационных систем становятся семантические базы данных (СБД), которые включают не только данные, но и семантические модели, на основе которых эти данные формируются. Для практического использования подобных систем требуется исследовать и разработать модели и алгоритмы для набора базовых сервисов. Одним из таких сервисов является обеспечение безопасности работы семантических БД. Задача данного сервиса заключается в том, что только пользователи, имеющие соответствующие права, смогут получить доступ к данным, хранящимся в семантической БД, и они не должны иметь какой-либо возможности получить неразрешённые им элементы онтологий и метаданных с помощью логических правил.
В настоящее время разработано много методов обеспечения информационной безопасности операционных систем и реляционных баз данных. Но данные методы не могут использоваться для обеспечения безопасности семантических БД. Это связано с тем, что для СБД характерна сильная иерархическая связанность между элементами, а кроме этого, в них имеется возможность получения новой информации на основе известных фактов путём использования логических правил. Для решения задач обеспечения безопасности СБД уже разработаны отдельные методы и алгоритмы, такие, как, например: контроль доступа пользователей на основе именованных RDF-графов, контроль доступа пользователей на уровне триплетов в RDF-хранилище. Этому посвящены работы таких зарубежных учёных, как: R. Kienast, C. Baumgartner L. Qin, V. Atluri, N. Yialelis, E. Lupu, M. Sloman, L. Wang, D. Wijesekera, S. Jajodia, Reddivari, P. L. Kagal, T. Finin, A. Joshi, T . Bhavani и др. Но разработанные методы и алгоритмы имеют ряд недостатков, которые не позволяют эффективно обеспечить комплексную безопасность СБД.
Целью исследования является разработка согласованного набора методов и алгоритмов контроля прямого доступа пользователей к элементам семантических баз данных и контроля результатов логических выводов, позволяющих обеспечить комплексную безопасность семантических баз данных.
Задачи исследования. Для достижения поставленной цели в работе определены следующие задачи исследования:
-
Анализ существующих моделей, методов и алгоритмов обеспечения безопасности работы семантических БД.
-
Разработка алгоритмов формирования согласованных уровней безопасности всех элементов онтологий, хранящихся в СБД.
-
Создание алгоритма определения уровней безопасности триплетов в семантических БД.
-
Разработка алгоритма определения уровней безопасности результатов логических выводов.
-
Разработка метода обнаружения нарушений безопасности результатов логических выводов.
-
Разработка алгоритма контроля полученных результатов при выполнении запросов к семантическим БД.
-
Создание архитектуры системы обеспечения безопасности семантических БД.
-
Реализация программного обеспечения поддержки безопасности работы с семантическими БД.
Объектом исследования является безопасность семантических БД при выполнении пользователями различных операций.
Предметом исследования являются методы и алгоритмы поддержки безопасности работы с семантическими БД.
Методы исследования. При выполнении диссертационной работы были использованы модели и методы теории множеств, теории графов, семантического моделирования, объектно-ориентированного проектирования и программирования.
Соответствие диссертации паспорту специальности. Работа соответствует следующим пунктам паспорта специальности 05.13.19 «Методы и системы защиты информации, информационная безопасность»:
П.8. Модели противодействия угрозам нарушения информационной безопасности для любого вида информационных систем.
П.13. Принципы и решения (технические, математические, организационные и др.) по созданию новых и совершенствованию существующих средств защиты информации и обеспечения информационной безопасности.
П.15. Модели и методы управления информационной безопасностью.
Научная новизна работы.
-
Разработаны алгоритмы согласования уровней безопасности элементов семантических БД, отличающиеся использованием принципа согласования уровней безопасности классов, свойств и индивидов.
-
Создан алгоритм определения покрытия безопасности семантических БД, отличающийся возможностью согласования и определения уровней безопасности RDF-триплетов.
-
Предложен алгоритм определения покрытия безопасности результатов логических выводов семантических БД, отличающийся возможностью определить уровни безопасности всех результатов логических выводов, полученных путём использования логических правил.
-
Создан метод обнаружения нарушений результатов логических выводов в семантических БД, отличающийся возможностью представления СБД в виде RDF-графов и контроля раскрытых триплетов, на основе которых пользователи могут получить неразрешённые результаты логических выводов путём использования логических правил.
-
Разработан алгоритм контроля полученных результатов при выполнении запросов к семантическим БД, отличающийся управлением ответами на прямые и логические запросы.
Практическая значимость диссертационной работы заключается в создании архитектуры обеспечения безопасности семантических БД, позволяющей с допустимыми задержками обеспечить поддержку безопасности СБД при значительной нагрузке, и в возможности практического использования разработанных методов и алгоритмов для поддержки безопасности работы семантических БД в информационных системах организаций. Это подтверждено путём создания прототипов программного обеспечения, на которые были получены два свидетельства Роспатента: «ContrLSD – программа контроля логических выводов в семантических базах данных» и «SecWSD – программа поддержки безопасности работы с семантическими базами знаний».
Предложенные в диссертационной работе методы и алгоритмы (и их программная реализация) прошли опытную эксплуатацию в компаниях «BAVIMILK» (Вьетнам, г. Ханой) и ООО «Томский завод резиновой обуви» (Россия, г. Томск), что подтверждено соответствующими актами. Кроме этого, разработанные методы и алгоритмы используются в учебном процессе кафедры оптимизации систем управления Института кибернетики НИ ТПУ.
Основные положения, выносимые на защиту:
-
Предложенные алгоритмы согласования уровней безопасности элементов семантических БД позволяют надёжно контролировать доступ пользователей к элементам онтологических моделей, хранящихся в семантических БД.
-
Разработанный алгоритм определения покрытия безопасности семантических БД обеспечивает эффективное управление доступом пользователей к каждому RDF-триплету метаданных.
-
Предложенный алгоритм определения покрытия безопасности логических выводов, позволяет выполнять проверку соответствия уровней безопасности результатов логических выводов уровням доступа пользователей.
-
Предложенный метод обнаружения нарушений результатов логических выводов позволяет надёжно контролировать результаты логических выводов в СБД.
-
Алгоритм контроля полученных результатов при выполнении запросов к семантическим БД гарантирует получение пользователями только тех результатов, которые соответствуют их уровням доступа.
-
Созданная архитектура системы обеспечения безопасности семантических БД позволяет с допустимыми задержками обеспечить поддержку безопасности СБД при значительной нагрузке.
Личный вклад автора. Все выносимые на защиту результаты получены автором лично.
Апробация работы. Основные положения и отдельные результаты исследования докладывались и обсуждались на следующих конференциях:
-
VII и VIII Международная научно-практическая конференция «Электронные средства и системы управления» (Томск, 2011, 2012);
-
V, VI и VII Всероссийские научно-практические конференции иностранных студентов, магистрантов и аспирантов, обучающихся в ТПУ «Коммуникация иностранных студентов, магистрантов и аспирантов, в учебно-профессиональной и научной сферах» (Томск, 2011, 2012, 2013);
-
IX Всероссийская научно-практическая конференция студентов, аспирантов и молодых учёных с международным участием «Молодёжь и современные информационные технологии» (Томск, 2012);
-
XVIII Международная научно-практическая конференция студентов и молодых учёных «Современные техника и технологии» (СТТ-2012);
-
X Всероссийская научно-практическая конференция студентов, аспирантов и молодых учёных «Технологии Microsoft в теории и практике программирования» (Томск, 2013);
-
IV Всероссийская конференция с международным участием «ЗНАНИЯ – ОНТОЛОГИИ – ТЕОРИИ» (Новосибирск, 2013).
Публикации. Основные результаты диссертационного исследования изложены в 22 печатных работах, в том числе в 5 статьях из списка рецензируемых журналов, рекомендованных ВАК РФ.
Структура и объем диссертации. Диссертация содержит введение, 4 главы, заключение, список использованной литературы, содержащей 120 наименований. Общий объём диссертации составляет 180 страниц машинописного текста, включающих 57 рисунков, 15 таблиц и 7 приложений.
Системы управления семантическими базами данных
Под системой управления семантическими БД понимается совокупность программных средств, обеспечивающих управление созданием и использованием данных в таких БД. Системы управления семантическими БД имеют следующие возможности: организация хранения RDF-данных; предоставление программного интерфейса для извлечения информации из хранимых RDF-данных посредством языка структурированных запросов SPARQL или специального интерфейса программированного приложений (application programming interface - API); поддержка функций администрирования хранимых данных: добавление, удаление, модификация и распределение прав доступа. В настоящее время существует много различных систем управления семантическими БД, такие, как Redland [57], FreeBase [58], Sesame [38], Oracle 11g Release [50], Virtuoso Universal Server [52]. 1.3.1. Система Sesame Семантическая СУБД Sesame используется для хранения и выполнения запросов к наборам RDF-данных. Она создана с использованием языка Java и поддерживает следующие возможности: универсальный пользовательский интерфейс API; хранилище для RDF-данных; функции администрирования для работы с RDF и OWL-данными; среду разработки и выполнения Java; выполнение логических выводов для RDFS-данных; наличие встроенного Web-сервиса, называемого конечной SPARQL-точкой (SPARQL Endpoint), реализующего протокол выполнения SPARQL-запросов и поддерживающего стандарт сериализации результатов SPARQL-запросов в формате JSON [59].
Под Oracle 11g Release понимается объектно-реляционная система управления БД компании Oracle, в которой поддерживается подсистема управления семантическими БД, которая обладает следующими возможностями: предоставление интерфейса API для работы с клиентскими приложениями; поддержка хранилищ для RDF-триплетов; поддержка функций администрирования данных, хранимых для работы с данными в RDF-форматах, таких как RDF / XML, Nriple и Turtle; выполнение SPARQL-запросов и RDQL-запросов к RDF-данным; включение высокопроизводительной системы логического вывода для следующих предикатов: owl.sameAs, rdfs:subClassOf и rdfs:subPropertyOf; поддержка работы с языками Perl, PHP, Python и Ruby. Virtuoso Universal Server (VUS) [60] является одной из самых эффективных СУБД, в которую включается подсистема управления семантическими БД. По сравнению с другими СУБД в ней поддерживается возможность выполнения логических выводов для OWL-онтологий. Основными её возможностями являются следующие: универсальный пользовательский интерфейс; поддержка хранилищ Quad-based (данные хранятся в виде квадов - кортежей из четырёх элементов граф, субъект, предикат, объект ); поддержка функций администрирования данных, хранимых для работы с данными в RDF-форматах, таких, как RDF / XML, Nriple и Turtle; включение высокопроизводительной системы логического вывода с динамической материализацией, обрабатывающей следующие предикаты: owl.sameAs, owl:equivalentClass, owl:equivalentProperty, owl:InverseFmct-ionalProperty, rdfs:subClassOf, rdfs:subPropertyOf, owl:inverseOf, owl.SymmetricProperty и owl:TransitiveProperty; наличие встроенного Web-сервиса, называемого конечной SPARQL точкой (SPARQL Endpoint), реализующего протокол выполнения SPARQL-запросов и поддерживающего стандарт сериализации результатов SPARQL-запросов в формате JSON. поддержка протокола SPARQL/Update для редактирования триплетов в хранилище [60]; поддержка среды разработки и выполнения Java; возможность работы с большими объёмами данных (например, под управлением VUS работает одно из хранилищ Linked Open Data объёмом более 9 миллионов квадов).
На основе семантических БД и технологий разрабатываются новые разновидности информационных систем. Общая архитектура семантической информационной системы [61] логически разделена на 5 уровней (рисунок 1.7). В данной архитектуре: в соответствии с потоками управления и данных компоненты более высокого уровня используют и запрашивают данные у компонентов более низких уровней, и одна операция компонентов на более высоком уровне может запустить на выполнение несколько операций на более низком уровне; в соответствии со степенью абстрактности входящих компонентов в них компоненты с одинаковым уровнем абстрагирования включены в один и тот же уровень. 1) Уровень источников данных включает все виды источников данных, такие, как семантические БД, базы данных, файлы разного формата, Web-сервисы, любые внешние онтологии, доступные по URI, и т.д. Источники данных рассматриваются компонентами данного уровня, так как работа с ними может выполняться компонентам и более высокого уровня. Рисунок 1.7. Общая структура информационной системы на основе семантической базы данных 2) На уровне доступа к данным выполняется абстрагирование, позволяющее скрыть особенности реализации и различие форматов. Объектные модели данного уровня могут включать данные, поступающие из таких источников, как обычные источники данных (наиболее часто это реляционные БД) или источники семантических данных (онтологических источников). Данный уровень предоставляет API и специфические адаптеры. Под адаптерами источников данных понимаются системы, позволяющие в реальном времени выполнять преобразование данных из исходных форматов в RDF-модель. 3) Уровень базовых онтологических сервисов включает в себя следующие компоненты: Сервисы регистрации онтологий (публикация, поиск). Сервисы работы с онтологиями, такие, как получение и изменение элементов. Сервисы обработки запросов на получение данных. Сервисы логического вывода. Сервисы ведения журнала работы с онтологиями. Сервисы поддержки безопасности семантических БД. Сервисы поддержки безопасности семантических БД играют большую роль в процессе работы семантических информационных систем. Они должны обладать следующими возможностями: S обеспечения доступа пользователей к данным, хранящимся в хранилище; S контроля выполнения запросов к БД; S обеспечения логических выводов, полученных при выполнении отправленных запросов.
Средства обеспечения безопасности семантических баз данных
Для каждого пользователя U семантической БД в системе поддержки безопасности создаётся учётная запись, содержащая сведения, которые пользователь U сообщает о себе системе обеспечения безопасности. Основными элементами учётной записи пользователя являются имя пользователя и пароль доступа. Значение пароля доступа хранится в зашифрованном или хэшированном виде [101] для обеспечения его безопасности.
Учётная запись может содержать также дополнительные данные, описывающие информацию о пользователях, такие, как имя, фамилия, отчество, пол, дата рождения, e-mail адрес, домашний адрес, рабочий адрес, номер домашнего телефона и т.п. Учётная запись пользователей хранится в самой семантической БД. Каждый пользователь U относится к некоторой группе или имеет некоторую роль по работе с СБД. Группа – это именованная совокупность пользователей. Объединение пользователей в группу облегчает администрирование СБД и, как правило, строится на основе формальной или фактической структуры организации. Например, мно 49 жество групп может быть следующим: {разработчики программы, менеджменты проекта, директор компании} и т.д. Роль – это заранее определённая совокупность правил, устанавливающих допустимое взаимодействие между пользователями и защищаемой информацией. Под правами доступа понимается совокупность правил доступа к защищаемой информации, установленных правовыми документами или собственником, владельцем информации. Пример взаимосвязи ролей и прав доступа пользователей при работе с семантическими БД показан в таблице 2.1. Таблица 2.1. Роли и права доступа пользователей в СБД Роль Права доступа Владелец Просмотр, обновление, удаление и добавление данных Администратор Управление учётными записями пользователей в СБД. Просмотр, удаление и добавление данных Обычный пользователь Просмотр, обновление данных Гости Просмотр данных Владелец может просмотреть, удалить, добавить любые свои данные в СБД. Администратор может просмотреть, удалить, добавить любые данные в СБД, а также он может управлять учётными записями пользователей в СБД. Обычный пользователь может обновлять и просмотреть данные. Гость только имеет право на просмотр данных. Права доступа пользователей U могут задаваться в семантической БД разными способами, которые зависят от используемой в ней политики безопасности. Под политикой безопасности управления доступом (security policy ассеss control) понимается совокупность правил управления доступом пользователей к защищаемой информации (данным). В настоящее время существует много политик безопасности. Наиболее известными являются дискреционная, мандатная и ролевая политики безопасности [77]. На основе данных политик создаётся система обеспечения безопасности работы с семантическими БД [102], в которой политика безопасности основывается на следующих правилах: 1) существует набор ролей Ur и прав доступа Up; 2) создаётся множество меток уровней безопасности MS; 3) всем данным в DBS задаются уровни безопасности slD; 4) каждому пользователю U задаётся уровень доступа slU; 5) владелец может указать уровень безопасности slD для своих данных. 6) пользователь имеет доступ к данным тогда и только когда ему заданы права доступа к данным дискреционной политикой или slU slD. Для определения возможности получения доступа пользователей к данным СБД выполняется сравнение уровня доступа пользователей slU с уровнями безопасности данных slD, хранящихся в СБД. Под уровнем безопасности slD данных понимается уровень защищённости (секретности) данных, который определяет, в какой степени данные доступны для пользователей. Например, данные могут быть доступными всем пользователям или быть совершено секретными, к которым доступ имеет только очень ограниченная группа пользователей. Значение slD задаётся из множества меток уровней безопасности данных МS, которое может быть представлено в виде набора номеров, строк и т.д. Иерархические отношения между различными элементами MS (задаваемые символами " ", "", "" или " ") позволяют описать степень защищённости данных. Например, множество меток уровней безопасности может быть следующим: МS = {«совершенно секретно», «секретно», «конфиденциально», «несекретно»}, где «совершенно секретно» «секретно» «конфиденциально» «несекретно». Для разных систем значение элементов множества MS может различаться. Например, MS может выглядеть следующим образом: 1. Каждый элемент MS является словом: MS = {«совершенно секретно», «секретно», «конфиденциально», «несекретно»}. 2. Каждый элемент MS является номером: MS = {0, 1... 100} и т.д. В соответствии с уровнями безопасности данных каждому пользователю U задаётся уровень доступа slv, позволяющий ему иметь доступ к данным. Считается, что если slv slD, то пользователь U имеет доступ к данным D, иначе он не имеет доступа к этим данным. В семантических БД для обеспечения безопасности каждому элементу онтологии О и каждому триплету t семантических метаданных М могут задаваться уровни безопасности slDi Є MS. Тогда множество уровней безопасности SLDB элементов в СБД определяется как SLDB = {SL0, SLM}, где SLM - множество уровней безопасности триплетов в М, SL0 - множество уровней безопасности всех элементов онтологии О. Как было отмечено выше, в онтологии О содержатся множества классов С (понятий) и свойств Р; между классами существуют отношения подклассов (sub-ClassOf), а свойствами - отношение подсвойство (subPropertyOf). В связи с этим должно выполняться следующее согласование уровней безопасности элементов онтологии: slcSub slcsup, где slcSub - уровень безопасности подкласса, slCsub - уровень безопасности суперкласса. . slIx slCy, где slIx - уровень безопасности индивида іх (іх Є /, где 1= {іи… , ік) - множество индивидов класса су онтологии), slcy - уровень безопасности классов су, которым индивид ix принадлежит; slPsub slPsup, где slPsub - уровень безопасности подсвойства psub, slPsup - уровень безопасности других свойств psup, которым psub принадлежит.
Множество уровней безопасности всех элементов онтологии SL0 может быть определено как SL0 = {SLC, SLP}, где SLC = {slC\, ..., slCm) - множество всех уровней безопасности классов в онтологиях СБД, а SLP = {slPU ..., slPn) - множество уровней безопасности свойств онтологий СБД. Для контроля возможности выполнения логических правил ri R = {r1, ..., rk} каждому логическому правилу должен задаваться уровень безопасности slr. Тогда множество уровней безопасности результатов логических правил можно обозначить как SLR = {slr1, ..., slrk}, где slri – уровень безопасности логического правила ri. Пользователь может использовать логические правила ri для получения результатов логических выводов только в том случае, если slU slri.
Алгоритм определения покрытия безопасности семантических баз данных
В 2012-2013г.г. в информационной системе компании ООО «ТЗРО», в рамках инициативного проекта, специалистами института кибернетики ТПУ разработалась информационная система «Семантическая электронная библиотека организации», позволяющая усовершенствовать работу пользователей с разными видами электронных ресурсов. Разработка системы выполнялась на основе базы знаний, реализованной с помощью RDF-хранилища Virtuoso Universal Server [52]. Требовалось обеспечить безопасность хранящихся данных, путём контроля доступа к ним пользователей и результатов логических выводов.
В данном проекте была разработана подсистема «Семантическая база данных информационных ресурсов предприятия», общая структура которой состоит из следующих уровней (рис. 4.29): 1. Уровень клиента системы поддерживает взаимодействие с веб-браузерами клиентов. 2. Уровень представления данных позволяет клиентам просматривать данные в различных форматах. 3. Уровень подготовки данных содержит функции проверки доступа пользователей. 4. Уровень бизнеса-логики включает функции (сервисы) системы, такие, как навигация между ресурсами системы; рекомендация различных ресурсов в интересах пользователей; категоризация ресурсов по их содержанию; семантиче -ский поиск ресурсов по их контексту и контенту; профилирование пользователей для описания их свойств; аннотирование поступающих ресурсов в систему; администрирование системы; индексирование выполняется для полнотекстового поиска документов и для оптимизации процесса работы системы с учётом семантики; вычисление семантических близостей используется для оценки близостей между ресурсами с учётом семантики их содержания; ранжирование ресурсов проводится в соответствии с различными мерами близостей; ведение онтологической базы знаний предоставляет набор функций для работы с данными, хранимыми в RDF-хранилищах.
Общая архитектура семантической электронной библиотеки информационных ресурсов предприятия 5. Уровень абстрактных моделей объектов включает описания всех объектов, процессов, провайдеров к разным источникам данных и сервисов системы с помощью набора интерфейса, классов. 6. Уровень обеспечения безопасности данных позволяет контролировать доступ пользователей к отдельным элементам данных, результаты логических вы 131 водов. 7. Уровень источников данных семантической электронной библиотеки включает семантическую БД и базы индексов документов, URI-идентификаторов объектов знаний и предварительные оценки их семантической близости. В качестве RDF-хранилища выбрана система Virtuoso Universal Server [52].
В семантических БД компании было загружен набор онтологий, а также метаданные 158 профилей сотрудников и 850 документов. Общее количество понятий онтологий составило 169, количество отношений – 217, количество триплетов – 0.57 миллиона. На уровне обеспечения безопасности данных была реализована информационная подсистема «Обеспечение безопасности семантических баз данных ресурсов предприятия», в которой были использованы методы и алгоритмы, созданные в данной работе. Данная подсистема включает следующую функциональность: Задание уровней доступа пользователей и уровни безопасности триплетов в БД. Выполнение согласования уровней безопасности всех элементов онтологий, хранящихся в БД. Контроль доступа пользователей к элементам БД. Обнаружение нарушений результатов логических выводов. Выполнение SPARQL запросов с учётом прав доступа пользователей. Редактирование (удаление, добавление и модифицирование) триплетов семантических данных в зависимости от прав доступа пользователей. Разработанная программа позволяет контролировать результаты логических правил, показанных в Приложении 1.3. Акт внедрения результатов диссертационной работы в компании ООО «ТЗРО» приведён в Приложении 6. 1. Разработанная общая архитектура системы контроля доступа пользователей и контроля результатов логических выводов в семантических БД позволяет обеспечить надёжную безопасность работы пользователей с семантическими БД. 2. Время выполнения алгоритмов определения уровней безопасности триплетов семантических БД существенно зависит от количества понятий онтологий, и незначительно зависит от количества триплетов. 3. Время выполнения алгоритма определения уровней безопасности результатов логических выводов также существенно зависит от количества понятий онтологий и незначительно зависит от количества триплетов в СБД. 4. Метод обнаружения нарушений результатов логических выводов и алгоритм контроля полученных результатов при выполнении запросов позволяют контролировать результаты логических выводов в семантических БД. 5. Опытная эксплуатация разработанных программ показала надёжность обеспечения безопасности СБД и высокую эффективность разработанных алгоритмов. 6. Разработанные системы SecSWD и ContrLSD были зарегистрированы в Роспатенте (получены свидетельства).
Исследование эффективности разработанных методов и алгоритмов
Слова «семантические технологии» часто встречаются в описаниях концепции «Семантическая Паутина» (Semantic Web), предложенной Tim Berners-Lee, изобретателем Всемирной Паутины (Web) [4] в 2001 году. Цель Семантической Паутины состоит в добавлении структурированной метаинформации к существующим в Web-сети документам и данным для явного описания их семантики, что позволяет программам выполнять более качественную работу с этими данными. В дальнейшем в данной работе под семантическими технологиями будут пониматься семантические технологии концепции Semantic Web.
Онтологии начали использоваться в области информатики с 1980-х годов исследователями, работающими в области искусственного интеллекта. Сначала они использовались для обработки естественных языков, а затем и для представления знаний. В 1990-х годах началось исследование возможности использовать онтологии для интеграции и поиска информации в БД и сети Интернет. Позже онтологии становятся основными ключевыми элементами, используемыми для реализации концепции семантической веб-сети.
Существуют различные определения онтологии, одно из которых дал Tom Gruber [6]: «Онтология это формальное, точное описание (спецификация) согласованной концептуализации». В данном определении термин «формальная» означает то, что онтология является машиночитаемой структурой. Под термином «согласованная концептуализация» подразумевается, что данное концептуальное описание не является чьим-то частным мнением, а мнением, с которым согласна некоторая группа людей. А под термином «концептуализация» понимается структура реальности, рассматриваемая независимо от словаря предметной области и конкретной ситуации.
Онтология включает модель (схему), представляющую собой описание множества понятий и отношений между ними (онтологическая модель) и экземпляры понятий. Описание онтологий основывается на формальных логиках. В качестве таких логик используются дескрипционные логики [7]. Применение логик позволяет выполнять логический вывод.
В настоящее время используются 3 способа классификации онтологий: по степени формальности; по цели создания (назначению) и по содержанию. В свою очередь эти типы онтологий включают в себя дальнейшую классификацию.
Степень формальности онтологии отражает то, как описывается содержание онтологии. Все онтологии могут быть разделены по критерию формальности на следующие группы: неформальные, полуформальные, полуформальные на искусственном языке, формальные онтологии.
В рамках классификации онтологий по назначению выделяют 4 уровня: онтологии представления, онтологии верхнего уровня (например, Cyc, DOLCE, SUMO), онтологии предметных областей (например, в области медицины создано большое количество стандартных, структурированных словарей, таких, как например, SNOMED-CT и UMLS) и прикладные онтологии.
Классификация по содержанию очень похожа на классификацию онтологий по назначению, но в ней основное внимание уделяется реальному содержанию онтологий, а не абстрактной цели, преследуемой авторами при их создании. Основными видами онтологии по содержанию являются общие онтологии, онтологии задач, предметные онтологии. Языки OWL DL и OWL Lite расширяют словарь RDFS, но налагают ограничения на использование этого словаря для более эффективной программной обра 16 ботки. Эти ограничения гарантируют вычислительную полноту и разрешимость систем логических выводов с использованием таких систем, как FaCT++ и Pellet, которые могут выполнять логический вывод в OWL-онтологиях на основе выразительных дескрипционных логик (ДЛ). Основными компонентами OWL-онтологии являются экземпляры, классы (понятия), атрибуты и отношения [12]. Экземплярами {instances) или индивидами {individuals) являются основ ные компоненты онтологии, находящиеся на нижнем уровне. Они могут описы вать как физические объекты (машина, университет, магазин), так и абстрактные (слова, числа). Между индивидами существуют следующие отношения: два инди вида могут быть представлены как один и тот же (sameAs); индивид может быть представлен как отличающийся от других индивидов (differentFrom); множество индивидов могут быть представлены как взаимно отличающиеся друг от друга {AUDifferent). Индивиды в онтологии могут иметь атрибуты, имеющие, по крайней мере, название и значение, которые используются для хранения информации, специфичной для данного объекта и связанной с ним. Классами (class), или понятиями, являются абстрактные группы, коллекции или наборы объектов. Между классами существуют следующие отношения: есть встроенный самый общий класс по имени Thing, который является классом всех индивидов, и суперкласс для всех OWL-классов; классы могут быть организованы в иерархии с помощью отношения rdfs:subClassOf; два класса могут быть представлены как эквивалентные с использованием отношения equiva-lentClass. Класс может включать экземпляры, другие классы или их сочетания.