Содержание к диссертации
Введение
Глава 1. Проблемы построения автоматизированной системы управления информационными ресурсами электронной библиотеки 17
1.1. Основные тенденции в области разработки автоматизированных библиотечно-информационных систем 17
1.2. Обзор автоматизированных библиотечно-информационных систем 18
1.2.1. АБИС «Ирбис» 18
1.2.2. АБИС «Марк-SQL» 22
1.2.3. АБИС «Библиотека» 23
1.2.4. АБИС «Руслан» 24
1.2.5. АБИС «Фолиант» 26
1.3. Автоматизированные системы управления электронными библиотеками 31
1.3.1. Методы и модели построения электронных библиотек 31
1.3.2. Программное обеспечение ЭБ с открытым кодом 35
1.3.3. Российская практика построения распределенных электронных библиотек 36
1.4. Новое поколение систем автоматизации библиотек: от электронного каталога к электронным библиотекам 38
1.5. Выводы 40
Глава 2. Разработка структуры реляционной базы данных 41
2.1. Формализация задачи построения реляционной модели 41
2.2. Построение модели предметной области 41
2.3. Использование реляционной алгебры при приведении структуры базы данных к нормальной форме 44
2.4. Построение структуры автоматизированной системы управления информационными ресурсами электронной библиотеки 49
2.5. Проектирование автоматизированной системы управления информационными ресурсами электронной библиотеки 56
2.5.1. Построение модели информационной системы на основе CASE-технологий 56
2.5.2. Методика работы с Oracle Designer/2000 60
2.5.3. Использование Oracle Designer/2000 для разработки системы 67
2.6. Выводы 74
Глава 3. Оценка качества информационных образовательных ресурсов на основе теории нечетких множеств 75
3.1. Цели оценки качества информационных образовательных ресурсов.. 75
3.2. Нечеткие подходы качественного анализа математических моделей.. 80
3.3. Модель оценки качества образовательных информационных ресурсов 83
3.4. Выводы 86
Глава 4. Программная реализация системы управления информационными ресурсами электронной библиотеки 87
4.1. Основные функциональные возможности системы управления информационными ресурсами электронной библиотеки 87
4.2. Общее описание подсистем 90
4.2.1. Подсистема авторизации доступа кЭБ 91
4.2.2. Подсистема публикации описаний 92
4.2.3. Подсистема публикации внутренних источников 95
4.2.4. Подсистема сбора статистических данных 95
4.2.5. Подсистема поиска и визуализации документов 96
4.2.6. Подсистема рубрикации информационных ресурсов 97
4.3. Выводы 99
Основные результаты работы 100
Список использованных источников 101
Приложения 115
- АБИС «Фолиант»
- Методы и модели построения электронных библиотек
- Построение структуры автоматизированной системы управления информационными ресурсами электронной библиотеки
- Методика работы с Oracle Designer/2000
Введение к работе
На сегодняшний день решение главной задачи библиотек - обеспечение всем слоям населения равного доступа к любым типам информации - невозможно без внедрения информационно-коммуникационных технологии [16,22,23,41,67,107,118].
Создание систем управления электронными библиотеками - одно из наиболее перспективных направлений развития библиотек [4, 12, 35, 58, 67, 119]. Значимость электронных библиотек для информационного общества подтверждается тем, что проблема их создания поднимается на уровень государственной политики. Так, одной из важнейших задач Федеральной целевой программы «Развитие единой образовательной информационной среды на 2001-2005 годы» обозначена «разработка и тиражирование современных электронных средств обучения, интеграция их с традиционными учебными пособиями, организация электронных библиотек обучающих средств и обеспечение доступа к размещенным в них образовательным ресурсам, организация системы доставки электронных учебно-методических хматериалов, дистанционного обучения и консультирования учащихся учебных заведений различного уровня» [57].
Разработки и исследования в области электронных библиотек стали одним из актуальных и весьма привлекательных направлений развития информационных систем в последние годы. Уже появились первые монографии на эту тему (например, [5]). Многочисленными исследовательскими проектами и реализацией конкретных электронных библиотек занимаются специалисты различного профиля.
Специалисты в области библиотечного дела видят в электронных библиотеках новые возможности для совершенствования автоматизированных библиотечных систем, превращения их в публичные электронные библиотеки нового поколения с развитыми возможностями представления разнооб-
7 разных цифровых информационных ресурсов, платформу для интеграции издательских и библиотечных технологий.
Сотрудники образовательных учреждений совместно с библиотечными специалистами ведут большую работу по созданию принципиально новой технологии интерактивного обучения (например, Digital Libraries Education, DLE [134]), основанной на новой информационной инфраструктуре образовательного процесса, центром которой должны стать электронные библиотеки. При этом предусматриваются средства адаптации программ обучения к потребностям и возможностям конкретного учащегося [4].
Научных сотрудников, занимающихся исследованиями в различных областях знаний, технологии электронных библиотек привлекают возможностями обеспечения эффективного распространения результатов исследований в среде научного сообщества.
Специалисты в области информационных систем, в свою очередь, рассматривают электронные библиотеки как новый класс информационных систем [47], базирующихся на самых передовых достижениях информационных технологий и телекоммуникаций. Разработки таких систем порождают разнообразные сложные теоретические и технологические проблемы, требующие своего исследования.
Функциональные возможности электронных библиотек варьируются в довольно широком диапазоне. Предполагается, что они предоставляют пользователю глобальный доступ с помощью различного рода Интернет-сервисов к коллекциям цифровых информационных ресурсов, которые могут быть распределенными и в различных аспектах неоднородными. При этом могут обеспечиваться разнообразные возможности их интеграции на техническом и на семантическом уровне [9], развитые средства каталогизации и индексирования. В некоторых электронных библиотеках предусматриваются пользовательские интерфейсы с повышенным уровнем семантики, например, с возможностями семантического поиска требуемых информационных ресурсов.
8 Разнообразный характер могут иметь и информационные ресурсы электронных библиотек. Это могут быть, например, интегрированные коллекции информационных ресурсов, включающие полнотекстовые документы, числовые данные, графические, аудио- и видеоресурсы, геоданные и т.д. [132]
Направления исследований и разработок в рассматриваемой области охватывают технологические, лингвистические, экономические, правовые, социальные и другие аспекты электронных библиотек, а также непосредственно создание поддерживаемых в них коллекций разнообразных цифровых информационных ресурсов.
Разрабатываемые в настоящее время электронные библиотеки базируются на передовых достижениях:
Web-технологий (платформа XML [122], работы по созданию семантического Web [9, 22], в частности, языков описания онтологии [59, 137] и др.);
технологий баз данных (объектные и объектно-реляционные базы данных [46], базы данных XML [45]);
текстового поиска (полнотекстовый поиск, модели семантического поиска, новые подходы, ориентированные на текстовый поиск в Web [75]), в области методов представления и обнаружения знаний, технологий создания и поддержки электронных публикаций [1, 135];
моделирования данных и метаданных.
Поддержке метаданных и их использованию для повышения эффективности поиска требуемых информационных ресурсов, для разработки приложений высокого уровня, решения проблем интеграции ресурсов и для других целей уделяется при этом особое внимание.
В области представления метаданных информационных ресурсов электронных библиотек и ресурсов Интернет оказалось весьма привлекательным и получило широкое распространение довольно простое по своей сути реше-
9 ниє, названное Dublin Core [127]. Dublin Core - совокупность элементов метаданных, значения которых описывают содержание информационного ресурса. Спецификации Dublin Core, принятые в качестве рекомендации созданной для их разработки и развития организации Dublin Core Metadata Initiative (1998), включают пятнадцать элементов.
В 2001 г. эти спецификации получили статус американского национального стандарта Z39.85-2001 [121]. В настоящее время они представлены в ISO для рассмотрения по ускоренной процедуре с целью придания им статуса официального международного стандарта. Для элементов метаданных Dublin Core разрабатываются факультативные квалификаторы [122], уточняющие смысл некоторых элементов в ряде конкретных применений, а также свойства их значений. В документе [119] определены дальнейшие планы развития этого популярного стандарта.
Перечислим наиболее актуальные технологические проблемы электронных библиотек:
исследование архитектурных аспектов таких систем;
обеспечение интероперабельности информационной среды;
методы представления информационных ресурсов;
определение состава метаданных, независимых от применений и специфических для различных сфер приложения, а также средств их представления;
новые походы к каталогизации информационных ресурсов;
создание функционально развитых пользовательских интерфейсов (мультиязычный доступ, визуализация данных, персонализация функций, поддержка семантического уровня общения пользователей с системой);
разработка методов индексирования информационных ресурсов различной природы (текст, аудио, видео и т.п.);
поиск и обнаружение релевантных ресурсов, а также принципов и средств их анализа;
интеграция коллекций неоднородных информационных ресурсов;
использование техники семантических посредников;
безопасность информационных ресурсов;
разработка методов и средств автоматического аннотирования текстовых документов;
создание и исследование прототипов систем электронных библиотек.
Поскольку Интернет стал основой для создания электронных библиотек, на развитие информационных систем этого класса значительное влияние оказывают те радикальные технологические сдвиги, которые происходят в этой среде.
При этом важную роль играет не только техника представления информационных ресурсов и метаданных, но и интеграционный потенциал этой платформы, поддержка навигационного доступа, а теперь уже и технологий баз данных XML с использованием специально созданных языков запросов. Работы по созданию семантического Web и языка описания онтологии должны обеспечить новую интеллектуализированную среду представления информационных ресурсов электронных библиотек следующего поколения.
Свидетельством большого интереса к проблематике электронных библиотек служит регулярное проведение посвященных им многочисленных международных, региональных и национальных конференций. Крупнейшие из них - объединенная международная конференция АСМЛЕЕЕ Joint Conference on Digital Libraries [120] и Европейская региональная международная конференция European Conference on Digital Libraries [129]. В России этой тематике посвящена ежегодно проводимая при поддержке Российского фонда фундаментальных исследований национальная научная конференция
«Электронные библиотеки: перспективные методы и технологии, электронные коллекции».
Электронные библиотеки на принципиально новой технологической основе обеспечивают реализацию функций традиционных библиотечньж систем, значительно расширяя тем самым их возможности. Вместе с тем, используемые в них методы и технологии управления коллекциями информационных ресурсов открыли ранее недоступные возможности для новых приложений, прежде всего, в науке, образовании, архивном и музейном деле, в сохранении культурного наследия.
В диссертации разрабатываются модели и алгоритмы для реализации автоматизированной системы управления информационными ресурсами электронной библиотеки на платформе традиционной библиотечной системы. В качестве платформы для разработки выбрана автоматизированная информационно-библиотечная система «Фолиант 2.0», разрабатываемая в Петрозаводском государственном университете начиная с 1996 года. Принципиальная особенность системы, реализованной в рамках диссертационного исследования - модуль оценки качества образовательных информационных ресурсов, разработанный на основе теории нечетких множеств.
Актуальность работы подтверждается тем, что тематика диссертации связана с реализацией проектов в рамках:
АБИС «Фолиант»
Процесс автоматизации библиотек Республики Карелия начался в 1991 году, когда Научная библиотека Петрозаводского государственного университета НЪ ПетрГУ) совместно со специалистами Регионального Центра новых информационных технологий при ПетрГУ (РІД НИТ) начала внедрять автоматизированную информационно-библиотечную систему «Марк». Годом позже система была внедрена в Национальной библиотеке Республики Карелия (НБ РК). В течение следующих лет - в Юношеской библиотеке (ЮБ РК), Научной библиотеке Карельского Научного Центра РАН, Центральной городской библиотекой г. Петрозаводска и в некоторых других библиотеках Карелии. [1051
По мере роста электронного каталога АБИС «Марк» перестала удовлетворять возрастающим требованиям библиотек. Кроме того, стало ясно, что эффективная автоматизированная библиотечно-информационная система должна обеспечивать не только формирование и сопровождение электронного каталога, но и комплексную автоматизацию основных информационно-библиотечных процессов. Развитие электронных технологий и средств телекоммуникаций позволило принципиально по-новому организовывать в библиотеках процесс каталогизации изданий и создания электронных каталогов, сводя к минимуму многократное дублирование трудовых затрат и нерациональное расходование финансовых средств за счет разумного разделения труда каталогизаторов и совместного использования его результатов.
В связи с этим, начиная с 1996 года, РЦ НИТ ПетрГУ начал разработку АБИС «Фолиант» на базе СУБД Oracle в архитектуре «клиент-сервер». Постановщиками задачи выступили НБ ПетрГУ и НБ РК.
На сегодняшний день АБИС «Фолиант» - это программный комплекс, предоставляющий своим пользователям широкие возможности корпоративной работы, обладающий следующими функциональными характеристиками: комплектование, включая распределение литературы между отделами библиотеки, ведение инвентарного и суммарного учета поступлений;
обработка, включая поддержку различных видов обрабатываемых документов, редактирование ранее составленных или импортированных описаний, распечатку выходных форм, индексирование документов различными классификационными средствами;
поиск документов и данных, библиотечное и информационное обслуживание;
экспорт/импорт в форматы USMARC и RUSMARC;
удаленный доступ, включая поиск в электронном каталоге по протоколам http и Z39.50.
Уже в 1998 году АБИС «Фолиант» была внедрена в НБ РК и НБ Петр-ГУ, каталоги этих библиотек стали доступны друг другу в режиме он-лайн. С появлением Интернета начался обмен базами данных между крупнейшими библиотеками города и республики.
Функциональная схема АБИС «Фолиант» (Рисунок 1.1).
С точки зрения разработчиков работа библиотеки разбита на три основных направления: учет фонда и его использование, формирование электронного каталога, учет читателей. За каждое направления отвечает своя группа АРМов. За учет фонда - АРМы «Комплектование», «Движение фонда», «Книговыдача» (в рамках АРМа «Учет читателей и книговыдача»).
За формирование электронного каталога - АРМы «Администратор», «Каталогизатор», «Поиск в ЭК», за учет читателей -АРМ «Учет читателей и книговыдача». Форматы и стандарты
Внутренним форматом хранения данных в системе является формат RUSMARC, поддерживается экспорт/импорт библиографии в формате USMARC. Система поддерживает создание библиографий согласно ГОСТам:
ГОСТ 7.1-2003 СИБИД. Библиографическая запись. Библиографическое описание. Общие требования и правила составления.
ГОСТ 7.80-2000 СИБИД. Библиографическая запись. Заголовок. Общие требования и правила составления.
ГОСТ 7.82-2001 СИБИД. Библиографическая запись. Библиографическое описание электронных ресурсов.
ГОСТ 7.51-98 СИБИД. Карточки для каталогов и картотек. Каталогизация в издании. Состав, структура данных и издательское оформление.
ГОСТ 7.12-93 СИБИД. Библиографическая запись. Сокращения слов на русском языке. Общие требования и правила.
ГОСТ 7.11-78 СИБИД. Сокращения слов и словосочетаний на иностранных европейских языках в библиографическом описании произведений печати. ГОСТ 7.83-2001 СИБИД. Электронные издания. Основные виды и выходные сведения.
ГОСТ 7.59-90 СИБИД. Индексирование документов. Общие требования к систематизации и предметизации. Этот документ сейчас пересматривается и в ближайшее время будет заменен.
Система построена на основе архитектуры «клиент-сервер», в качестве ядра используется СУБД Oracle. Клиентами выступают приложения для Microsoft Windows (все АРМы, за исключением АРМ "Поиск") и для Linux (АРМ «Поиск», поддержка сервера Z39.50)
В силу того, что большая часть обработки данных производится SQL-сервером, не предъявляется высоких требований к телекоммуникациям (для комфортной работы библиотеки со штатом в 10-15 человек достаточно канала в 128 кбит/с).
Система спроектирована таким образом, что позволяет разделять серверный ресурс (несколько библиотек используют один SQL-сервер), что позволяет существенно снизить стоимость эксплуатации системы в небольших библиотеках. С другой стороны, возможно разделение задач системы на несколько SQL-серверов, что позволяет оптимизировать вложение средств при развитии системы в крупной библиотеке. Причем это разделение может быть произведено на любом этапе эксплуатации системы.
Система предполагает использование ряда корпоративных ресурсов.
Сервер обновлений - обеспечивает автоматическую смену версий программного обеспечения для всех библиотек, использующих АБИС «Фолиант».
Корпоративный SQL сервер - содержит перечень библиотек, использующих АБИС «Фолиант», сведения о библиографии, создаваемой в этих библиотеках, обеспечивает «быстрый» доступ к этой библиографии по ключу (ISBN, ISSN).
Состав системы (АРМы)
АРМ «Администратор» - управление основными параметрами системы: набором баз данных электронного каталога, поисковыми индексами, шаблонами документов, справочными словарями, регистрацией пользователей и определением их прав.
АРМ «Каталогизатор» - работа с электронными каталогами: создание, экспорт/импорт библиографических описаний, формирование каталожных карточек, библиографических списков и указателей, формуляров. АРМ «Поиск в ЭК» - работа читателей с электронными каталогами.
АРМ «Комплектование» — учет библиотечного фонда (поступление/списание), формирование актов на приход и списание, книги суммарного учета, инвентарных книг.
АРМ «Движение фонда» — учет распределения фонда по отделам библиотеки, сверка фонда.
АРМ «Учет читателей и книговыдача» - ведение реестра читателей и их формуляров, формирование статистики по посещению и книго-выдаче.
АРМ «МБА» - учет поступивших заказов, регистрация их исполнения и отслеживание отправленных/возвращенных документов библиотекой, выполняющей заявки; оформление заказов и контроль их выполнения библиотеками, подающими заявки.
АРМ «Книгообеспеченность» - формирование статистики по библиотечному фонду учебных заведений с учетом контингента студентов и их учебного плана.
Методы и модели построения электронных библиотек
Проведенный анализ позволяет сделать вывод о развитости рынка АБИС. Однако в последние годы наметился переход к качественно новому уровню АБИС - интеграции АБИС и электронных библиотек.
Под электронной библиотекой (ЭБ) понимают локальные или распределенные электронные ресурсы, объединенные единой идеологией структуризации и доступа [40]. Проанализировав развивающиеся сейчас направления библиотечных работ, связанных с Интернетом, можно заметить, что эта группа задач решается главным образом за счет:
обеспечения доступа к собственным электронным каталогам, проблемно-ориентированным библиографическим базам данных, сводным каталогам библиотек, а также организации доступа к каталогам различных библиотек по сетевым поисковым протоколам типа Z39.50;
публикации в Интернете электронных версий специализированных библиотечных изданий (журналов, библиографических списков, указателей литературы, каталогов выставок и т.д.);
создания полнотекстовых баз данных (включающих как издания самих библиотек, так и электронные версии книг и журналов из их библиотечных фондов) и обеспечения поиска в этих массивах через Интернет;
предоставления услуг по электронной доставке документов и электронному МБА.
Многие библиотеки публикуют на своих Web-страницах текстовые файлы со списками библиографических указателей различных типов, дают перечни предоставляемых продуктов и услуг, рекламируя собственные информационные ресурсы, издания, которые они могут поставлять в традиционных режимах, открывают так называемые «электронные магазины».
Однако накопление библиотеками таких ссылок и особенно поддержание их в актуальном состоянии весьма неэффективно. По опыту работы ряда библиотек средний срок нахождения информации по конкретному адресу -полгода [50]. Как правило, ссылки создаются на весь информационный ресурс или его крупные части, а этого явно недостаточно. Возможно, в скором времени станет практикой архивирование самих информационных ресурсов Интернета. Прежде всего, это работа по описанию, учету, а возможно, и сохранению резервных копий этого нового вида информационных ресурсов -так, как это делается с обычными печатными изданиями в библиотеках и архивных хранилищах.
Создание электронных библиотек пошло по пути оцифровывания печатных источников и приобретения прав на электронные источники у издателей. При этом электронные фонды таких библиотек, как правило, автономны, замкнуты и расширяются лишь за счет тех же списков ссылок на другие ресурсы.
Электронные библиотеки состоят из разнородных информационных массивов - электронных каталогов, библиографических, фактографических, полнотекстовых баз данных, справочно-нормативных массивов и т.д. Пользователь, попадая библиотеку такого рода, ограничен ее рамками и вынужден искать недостающую информацию (например, библиографические данные или полные тексты документов) за пределами коллекции, используя ссылки на некий совокупный ресурс. Создание подобного рода электронных библиотек является необходимым шагом, однако, разработка таких локальных информационных продуктов - тупиковый путь развития. Поэтому необходимо создание ЭБ, обеспечивающих пользователей связями между элементами как своих, так и совокупных ресурсов, находящихся за их пределами.
Модель, получившая развитие в последние годы, основывается на понятии распределенной электронной библиотеки. «В отличие от традиционных библиотечных хранилищ, где фонд источников отделен от справочно-поискового аппарата в виде карточных каталогов, электронные библиотеки составляют единое целое, части которого связаны друг с другом, например, ссылками - библиографические описания с полными текстами. Помимо этих внутренних ссылок, между частями отдельной электронной библиотеки создаются ссылки на внешние ресурсы, причем не на отдельный информационный ресурс Интернета в целом, а на составляющие его единицы, например, конкретную статью из электронного журнала или другую публикацию, хранящуюся в полнотекстовой базе данных. Например, журнальные статьи из нолнотекстовых баз данных с постатейными списками литературы должны иметь ссылки, связывающие данную статью с полными текстами источников, которые в ней упоминаются. Эти ссылки или связи могут быть установлены между источниками, хранящимися как внутри одного электронного фонда, так и в разных коллекциях» [67].
Такие ЭБ называют распределенными [67]. Распределенная ЭБ - это совокупность логически и технологически связанных между собой документов из различных электронных коллекций и отдельных информационных ресурсов, доступных через Интернет».
Распределенная электронная библиотека может характеризоваться:
принципами отбора документов (комплектования);
способами создания связей между элементами;
методами формирования электронного фонда.
Методы формирования распределенных электронных библиотек могут быть различными. Условно их можно назвать прямым и косвенным. Прямой метод заключается в том, что части таких библиотек формируются как результат совместной деятельности, т. е. целенаправленно создается распределенный электронный фонд. Так, при подготовке некоторых изданий, составляющих основу специализированной электронной библиотеки, могут быть оцифрованы источники, необходимые для их написания. Эти источники входят затем в состав электронного фонда копий публикаций другой электронной библиотеки и могут быть связаны ссылками с текстами первой коллекции. Такой метод формирования распределенного фонда наиболее продуктивен, поскольку повышается качество отбора документов в фонд библиотеки.
Косвенный метод заключается в том, что автоматически устанавливаются отсылки от документов фонда одной электронной библиотеки и их структурированных частей к документам других электронных библиотек. Для этого должны быть разработаны системы справочников, описывающих структуры этих библиотек и эвристические программы обнаружения электронных информационных ресурсов. В подобных библиотеках может существовать два вида ссылок - внутренние, связывающие части одной коллекции между собой, и внешние, которые устанавливаются хмежду элементами различных коллекций.
Построение структуры автоматизированной системы управления информационными ресурсами электронной библиотеки
Следует отметить, что при наличии существующих различных методик анализа предметных областей и построения моделей БД:
1. процесс определения окончательной структуры БД является циклическим, т.е. практически на каждом этапе проектирования информационной системы (ИС) приходится возвращаться к структуре БД и вносить в нее изменения;
2. в процессе моделирования предметной области помимо объективных факторов участвует и субъективный - прагматический подход разработчика.
Несмотря на это, процесс проектирования структуры БД может быть формализован, т.е. реляционная база данных должна быть подвергнута процедуре нормализации.
Процесс нормализации имеет своей целью устранение избыточности данных и заключается в приведении таблиц БД к ЗНФ.
Для рассмотрения процесса нормализации структуры БД используем пример проектирования части структуры таблиц АСУ ИР ЭБ. Задача состоит в организации процесса представления пользователям ИР, состоящего из различных разделов, и ведения статистики об использовании ИР.
Для того, чтобы описать одно использование ИР, необходимо определить следующую информацию: Название ИР, Права на копирование ИР, Размер ИР, URL ИР, Авторы ИР, ФИО Пользователя, E-mail Пользователя, Организация Пользователя, Дата использования ИР. Список, приведенный в примере, не является полным. (Рисунок 2.1) Применяя средство проектирования Entity Relationship Diagrammer, входящее в пакет Oracle Designer/2000, последовательно построим каноническую модель БД.
Существует несколько нормальных форм, из которых в практической разработке БД важны первые три - 1НФ, 2НФ, ЗНФ.
Первая нормальная форма (ШФ) требует, чтобы каждое поле таблицы БД было неделимым и не содержало повторяющихся групп столбцов. Неделимость поля означает, что значение поля не должно делиться на более мелкие значения. Повторяющимися являются поля, содержащие одинаковые по смыслу значения.
Можно заметить, что поле Авторы можно разделить на несколько более мелких значений. Кроме того, поле ФИО Пользователя можно разбить на поля Фамилия Пользователя, Имя Пользователя, Отчество Пользователя. Таким образом, таблица примет вид (Рисунок 2.2): Для того чтобы продолжить нормализацию данных, приведем данные ко второй нормальной форме (2НФ). Вторая нормальная форма (2НФ) требует, чтобы все поля таблицы зависели от первичного ключа, то есть, чтобы первичный ключ одновременно определял запись и не был избыточен. Те поля, которые зависят только от части первичного ключа, должны быть выделены в составе отдельных таблиц.
Для приведения к 2НФ выделим поля, которые входят в первичный ключ. Поля, связанные с определением характеристик ИР и Пользователя, не могут однозначно идентифицировать запись, поскольку их значения будут одинаковы для всех записей, относящихся к данному ИР и Пользователю. Проведя смысловой анализ зависимостей между полями таблицы, можно выделить поля в составе первичного ключа, которые однозначно определяют записи таблицы. Это означает, что первое требование 2НФ выполнено.
Ниже (Рисунок 2.3) приведена структура таблицы после выделения полей в составе первичного ключа (эти поля отчеркнуты от остальных полей линией и расположены в верхней части структуры таблицы). Второе требование 2НФ предполагает, что значения всех полей записи должны однозначно зависеть от совокупного значения первичного ключа, не должна иметь место ситуация, когда некоторые поля зависят только от части первичного ключа.
Анализируя структуру таблицы, можно увидеть, что поля Права на копирование ИР, Размер ИР, Авторы ИР зависят от значения поля Название ИР и не зависят от значения остальных полей первичного ключа. Поэтому выделяем данные поля в отдельную таблицу «Информационный ресурс» и определяем связь: поскольку один и тот же ИР может быть использован много раз, таблицы «ИР» и «Использование ИР» связаны отношением «один-ко-многим».
Также можно заметить, что поля, E-mail Пользователя, Организация Пользователя зависят от значения полей Фамилия Пользователя, Имя Пользователя и Отчество Пользователя не зависят от значения остальных полей первичного ключа. Поэтому выделяем данные поля в отдельную таблицу «Пользователь» и определяем связь: поскольку один и тот же Пользователь может использовать один и тот же ИР много раз, таблицы «Пользователь» и «Использование ИР» связаны отношением «один-ко-многим».
Теперь необходимо выделить таблицу Авторы. Один и тот же человек может быть автором нескольких ИР, и, наоборот, один и тот же ИР может относиться к разным авторам. То есть между таблицами Автор и ИР существует связь «многие - ко - многим». Стандартной операцией для этого является введение в структуру БД так называемых таблиц-пересечений. В нашем случае назовем таблицу «Автор - ИР». Полученная таблица показана на Рисунок 2.5. Третья нормальная форма (ЗНФ) требует, чтобы в таблице не имелось транзитивных зависимостей между неключевыми полями, то есть, чтобы значения полей таблицы, не входивших в первичный ключ, не зависели друг от друга.
В данном случае очевидно, что в полученных таблицах отсутствуют транзитивные зависимости между неключевыми полями. В результате получаем нормализованную (каноническую) модель базы данных.
Методика работы с Oracle Designer/2000
Пакет включает в себя довольно большое число самых разнообразных средств разработки самого различного уровня (от проведения системного анализа до генерации конечных клиентских приложений).
Особенностями данного пакета можно считать такие его черты, как:
применение методологии структурного нисходящего проектирования; охват практически всех этапов жизненного цикла ИС - от самых общих первоначальных описаний предметной области до получения конечных исполняемых модулей;
направленность на разработку приложений в архитектуре клиент/сервер с использованием всех возможностей современных серверов баз данных по описанию структуры и правил работы с данными;
наличие репозитария - централизованной базы данных, поддерживаемой сервером Oracle, и обеспечивающей хранение всей проектной информации с возможностью разделения ее по версиям и разрабатываемым системам;
возможность коллективной работы над проектом (обеспечивается наличием репозитария);
автоматизация перехода от одного этапа разработки к другому;
автоматизация различных стандартных рутинных операций, таких как генерация отчетов, проверка спецификаций на полноту и непротиворечивость и др.
Основными фазами, по Ричарду Баркеру [8], являются стратегия, анализ, разработка, построение, документирование, превращение и выпуск. При добавлении промежуточных фаз предварительного анализа и предварительной разработки к основной методологии, а также при включении тестирования, реализации и обслуживания в общий процесс, появился новый метод жизненного цикла разработки ИС - метод разработки приложений средствами CASE, называемый CADM (CASE Application Development Method).
Цикл разработки системы по методу CADM включает в себя следующие основные этапы:
Этап выработки стратегии является начальной стадией разработки системы. Цель этой фазы - получить четкое представление об объекте исследований. На этом этапе выявляются информационные потребности в указан 62
ной предметной области, создается план разработки, идентифицируются и проверяются ключевые требования к системе. Составляется документ по стратегии (Strategy document), включающий техническую схему, представляющую собой эскизный проект системы. На последующих этапах полученные данные подвергаются дополнениям и уточнениям.
Этап анализа включает две фазы: предварительный анализ и анализ. Цель фазы предварительного анализа состоит в планировании аналитических процессов и переходе к формированию стандартов. Документ по фазе предварительного анализа - аналитический план. Фаза анализа больше нацелена на пользователей, чем на саму систему.
На этапе анализа определяются детальные спецификации ИС в терминах функциональной схемы учреждения. Данная спецификация является основой согласованного с пользователем списка услуг и требуемых характеристик разрабатываемой ИС. На этом этапе осуществляется сбор всех пользовательских спецификаций и полное завершение детализации рассматриваемых бизнес-процессов. Это один из важнейших этапов проектирования системы.
Главное внимание на этапе анализа уделяется созданию документа о требованиях к системе.
Этап разработки тоже включает два этапа: предварительная разработка и разработка.
Предварительная разработка является промежуточным этапом между фазой анализа и разработкой системы. На этом этапе планируется оставшаяся часть системы. Задачей этого этапа является разработка плана, исследование структуры системы и логических связей ее элементов, формирование схемы потоков физических процессов, разработка стандартов, создание концептуальных прототипов экранов. Другими словами, на этом этапе определяется как итерационный процесс получения логической модели системы в соответствии со строго сформулированными целями, поставленными перед нею, а также написание спецификаций физической системы, удовлетворяющей этим требованиям.
Фаза разработки, в свою очередь, подразделяется на два этапа: разработка базы данных и разработка приложений (программирование). На этой фазе формируется черновой вариант системы, разрабатываются автономно тестируемые программы по спецификациям, подготовленным на предыдущих этапах.
Этап построения - это построение базы данных и приложений. Раньше этот этап называли этапом программирования, что утратило актуальность в связи с появлением большого количества программных средств разработки.
Тестирование. Предусматриваются две стадии тестирования: тест программ и тест всей системы. Планировать работы по тестированию желательно еще на этапе системного анализа. Системное тестирование должно демонстрировать надежность всей системы. Проверке подлежат все уровни реализации - от корректности работы со структурами данных до удобства пользовательского интерфейса.
Реализация (ввод в эксплуатацию). Этот этап предусматривает перенос новой ИС из тестовой в рабочую среду. Существуют два подхода к реализации: «большой удар» и поэтапная реализация.
Обслуживание - выявление, определение важности и управление возникающими вопросами для последующего изменения системы. На этом этапе появляются новые версии, осуществляются аварийные доработки.
Следует отметить то, что в пакете Oracle Designer/2000 отсутствует какая-либо жесткая последовательность в применении средств. Так, например, можно провести лишь структурный анализ, или ограничиться построением только информационной модели, или наметить структуру программных модулей на основе уже имеющихся описаний. Однако, существует определенная информационная зависимость последующих шагов от предыдущих. Дей 64 ствительно, вряд ли имеет смысл проектировать программные модули, не имея никакой структуры базы данных.
Кратко рассмотрим некоторые наиболее важные программные средства пакета, упоминающиеся выше.
Business Process Modeling (ВРМ, Моделирование бизнес-процессов). Как правило, это стартовая точка для разработки ИС и приложения в Designer/2000. BMP предназначен для документирования деловых процессов и информационных потоков. Process Modeler позволяет охватить наиболее существенные шаги в бизнес-процессе, понять и наглядно представить их взаимосвязь.
Process Modeler позволяет представить структуру предприятия (организации) практически с любой степенью декомпозиции, вплоть до конечных пользователей.
Entity Relationship Diagrammer (ER Diagrammer). С помощью этого средства разработчик может проектировать структуру базы данных практически любой сложности. Главные объекты, определяемые здесь - это сущности (entity) и их атрибуты (attributes).
Это средство проектирования позволяет задавать множества сущностей, множества атрибутов сущностей и устанавливать определенные связи между сущностями. Все операции, описанные математическим языком, здесь реализуются посредством графического интерфейса.
Представляемые данные по существу являются логическими, т. е. не имеют реальной физической таблицы или структуры. Диаграмма взаимосвязи элементов обычно содержит атрибуты для каждого объекта.