Введение к работе
Актуальность исследования. Интенсивное развитие информационных и телекоммуникационных технологий и открытых стандартов явилось технологической основой создания библиотечных корпораций, широкое распространение которых происходит во всем мире в последнее десятилетие Для читателей библиотечные корпорации предоставляют такие новые возможности, как поиск в виртуальном сводном каталоге, объединяющем информационные ресурсы участников корпорации, доступ к полнотекстовым документам из виртуального сводного каталога, заказ оцифрованных документов через службу электронной доставки, доступ к подписным базам данных и полнотекстовым изданиям, получаемым на основе корпоративного комплектования Для сотрудников библиотек корпоративные технологии дают возможности сократить рутинные операций и существенно снизить трудоемкость и затраты за счет использования технологии каталогизации путем заимствования записей
Современные технические решения позволяют любой крупной библиотеке создавать и поддерживать собственные порталы, использующие доступ к ресурсам библиотечных корпораций на основе протокола Z39 50, с целью более полного удовлетворения запросов поиска и получения информации для своей читательской аудитории и обеспечивающие передачу поисковых запросов в интерактивном режиме к любому числу серверов В зависимости от профиля библиотеки и назначения поискового портала число каталогов, входящих в виртуальный сводный каталог, может составлять от нескольких десятков до нескольких сотен Несмотря на очевидные преимущества распределенной информационной системы, время обработки поисковых запросов в ней может существенно превышать значения, получаемые при поиске в системах, использующих предварительную индексацию документов, - таких, как поисковые Инернет-порталы (Yandex, Google и т п ) Это обстоятельство создает ситуацию, когда задержки при обработке поисковых запросов, а также значительный объем информации при поиске по большому числу источников, препятствуют полноценному использованию корпоративных библиотечных порталов
Начавшийся поиск путей решения этой проблемы привел к идее создания целевых поисковых групп, сужающих охват информационных источников на основе тематических и географических критериев Такие решения реализованы, в частности, на портале Ассоциации российских библиотечных консорциумов (АРБИКОН)
Однако большинство поисковых порталов библиотечных корпораций, использующих решения на основе протокола Z39 50, не в полной мере используют его функциональные возможности, обеспечивающие параллельность обработки пользовательских запросов и представления результатов поиска, что приводит к возникновению значительных временных задержек при поиске по большому числу информационных источников
В связи с этим возникла потребность на базе портала корпоративной сети московских библиотек исследовать причины возникновения задержек при поиске по группе серверов Z39 50 и предложить программные и технологические решения, повышающие производительность поиска в корпоративных библиотечных сетях, что является актуальной научной и технической задачей
Одним из перспективных направлений развития корпоративных библиотечных порталов является интеграция поиска по электронным каталогам и полнотекстовым коллекциям документов Технические решения для поддержки такого комбинированного поиска, используемые, в частности, в проекте Европейской библиотеки (TEL), базируются на протоколе SRU, являющемся дальнейшим развитием протокола Z39 50 и позволяющем проводить поиск и по электронным коллекциям, поддерживающим технологию OAI-PMH
Однако значительное число российских библиотек, в том числе вузовских, в течение ряда лет используют программные решения ИРБИС для создания электронных каталогов полнотекстовых ресурсов Данные решения в сочетании с решениями системы автоматизации библиотек ИРБИС для поиска по массивам полнотекстовых документов образуют техническую среду для создания электронных библиотек Использование корпоративных технологий на основе протокола Z39 50 позволяет расширить число подключаемых информационных источников и повысить эффективность обработки поисковых запросов пользователей при работе с электронными библиотеками, использующими программные решения ИРБИС Таким образом, возникает потребность исследовать теоретические и практические аспекты создания и применения в библиотечной практике корпоративной технологии на базе протокола Z39 50 с целью дальнейшего ее совершенствования, что является актуальной научной и технической задачей
Разработанность темы исследования. Использование протокола Z39 50 в библиотечных корпорациях за последние несколько лет стало повседневной практикой, вопросы повышения эффективности технических
решений на основе этого протокола постоянно обсуждаются в специальной литературе и на различных российских и международных конференциях
Широкий комплекс вопросов проектирования корпоративных библиотечных систем был подробно рассмотрен в трудах ЯЛ Шрайберга, Ф С Воройского Вопросы использования протокола Z39 50 при разработке и реализации библиотечных Интернет-комплексов подробно исследованы в работах М В Гончарова Теоретические и технические аспекты построения распределенных информационных систем на основе протокола Z39 50 рассмотрены в трудах О Л Жижимова, в том числе в его докторской диссертации Вопросы построения распределенных информационных систем на основе СУБД CDS/ISIS и технологии Z39 50 изучались в работах Н А Мазова Проблемы создания распределенного электронного каталога библиотечного консорциума, использующего протокол Z39 50 для поиска информации, рассматривались в работах О С Колобова
Отдельные проблемы, касающиеся оптимизации обработки поисковых запросов в информационной системе, состоящей из шлюза HTTP-Z39 50 и группы серверов корпоративной библиотечной сети, уже были рассмотрены в научной литературе Так, в работах О Л Жижимова изучались вопросы оптимизации задержек при обработке запросов с использованием провайдера удаленного доступа сервера ZooPARK и уменьшения числа одновременных сеансов взаимодействия между клиентом и сервером Вопросы использования многопоточности при обработке поисковых запросов в информационной среде, состоящей из шлюза HTTP-Z39 50 и группы серверов Z39 50, рассматривались в работах А Ю Хохлова и впервые в российской практике были решены в разработанном им портале СИГЛА Использование мониторинга серверов Z39 50 с целью исключения неактивных серверов при обработке широковещательных поисковых запросов было предложено в работах Р Т Усманова и А А Кузнецова и реализовано в рабочей версии портала АРБИКОН
Однако до настоящего времени не проводилось комплексного исследования информационной системы, состоящей из шлюза HTTP-Z39 50 и группы серверов Z39 50 корпоративной библиотечной сети, с целью разработки комплекса технических решений, повышающих производительность поиска Кроме того, не исследовались вопросы создания типового решения электронной библиотеки вуза с использованием программных решений ИРБИС и шлюза HTTP-Z39 50 Данная диссертация предполагает восполнить этот пробел.
Объектом исследования является теория и практика программных и технических решений на основе протокола Z39 50 с позиции эффективности их использования при обслуживании пользователей информационных ресурсов корпоративных библиотечных систем
Предмет исследования: способы оптимизации программно-технических средств обработки поисковых запросов в корпоративных библиотечных сетях, использующих протокол Z39 50
Цель исследования: выявление и анализ совокупности причин увеличения временных задержек при поиске по большому числу серверов Z39 50 в библиотечной корпорации, а также определение путей повышения эффективности обработки поисковых запросов пользователей, в том числе при создании электронных библиотек вузов на основе программных решений ИРБИС и шлюза HTTP-Z39 50
Поставленная цель достигается путем решения следующих задач:
анализ программно-технических решений реализации корпоративных библиотечных порталов и выявление основных факторов, влияющие на временные задержки при обработке поисковых запросов пользователей,
разработка и анализ математической модели обработки поисковых запросов в системе, состоящей из шлюза HTTP-Z39 50 и группы серверов,
разработка обобщенных алгоритмов передачи поискового запроса серверам корпоративной сети и представления результатов на поисковом портале,
разработка типового решения портала электронной библиотеки на основе использования технологии Z39 50 и программных решений ИРБИС с возможностями интегрированного поиска по электронному каталогу библиографических описаний и массиву полнотекстовых документов
Методологической основой исследования явились положения, изложенные в трудах по основным принципам разработки и эксплуатации автоматизированных библиотечно-информационных систем библиотек Я Л Шрайберга, Ф С Воройского, Б И Маршака, М В Гончарова, А И Бродовского, разработки в области информатики, в частности - по созданию информационных систем и баз данных Дж Мартина, проектирования и эксплуатации региональных информационных систем и использования информационных ресурсов Н Е Каленова Существенной методологи-
ческой опорой для проведения исследования в области корпоративных сетей, использующих протокол Z39 50, стали положения, изложенные в работах О Л Жижимова, Н А Мазова, А И Племнека
Ввиду комплексного характера исследования в качестве инструментария для его проведения использовались метод сравнительного анализа, моделирование, анкетирование, инженерные методы анализа и синтеза информационных систем, положения теории систем и сетей массового обслуживания
Научная новизна. В результате анализа технологических решений современных российских библиотечных корпораций, использующих протокол Z39 50, в настоящей работе выявлены основные факторы, влияющие на эффективность обработки поисковых запросов пользователей Разработана математическая модель обработки поисковых запросов в корпоративной сети, позволяющая повысить функциональные характеристики корпоративного портала Предложено типовое решение для портала электронной библиотеки вуза на основе шлюза HTTP-Z39 50 Определен новый подход к интеграции поиска по электронному каталогу библиографических описаний и массиву полнотекстовых документов с использованием провайдера данных Z39 50 для полнотекстового модуля АБИС ИРБИС
На защиту выносятся следующие основные положения:
-
Шлюз HTTP-Z39 50 должен обеспечивать обработку поисковых запросов пользователей библиотечной корпорации с минимальными задержками
-
Решение задачи повышения характеристик порталов на основе шлюзов HTTP-Z39 50 может быть достигнуто за счет обеспечения фонового мониторинга библиотечной корпоративной сети с целью выявления неактивных серверов, а также с помощью навигации и уточнения поисковых запросов в пользовательском интерфейсе портала
-
Предложенная автором математическая модель обработки поискового запроса библиотечной корпоративной сети на основе шлюза Z39 50 позволяет сделать следующие выводы
функциональные возможности поискового портала на основе шлюза HTTP-Z39 50 могут быть существенно улучшены при исключении неактивных серверов из числа опрашиваемых,
при большом числе заданий в системе возрастают требования к производительности центрального узла - шлюза HTTP-Z39 50
-
Электронная библиотека вуза, созданная на основе шлюза НТТР-Z39 50 и программных решений ИРБИС, обеспечивает интегрированный поиск по электронным каталогам и полнотекстовым массивам документов
-
Порталы КСМБ и «Электронная библиотека МГУКИ» целесообразно строить на основе предложенных автором технических решений, использующих результаты исследования шлюза HTTP-Z39 50 и сервера Z32/Z64
Теоретическая значимость исследования состоит в развитии концепции создания поисковых порталов библиотечных корпораций, использующих технологию Z39 50, а также в определении технологических и организационных принципов их дальнейшего расширения для создания электронных библиотек
Практическая значимость и реализация результатов исследования заключаются в создании программного комплекса, состоящего из шлюза HTTP-Z39 50 и сервера Z32/Z64, входящего в состав АБИС ИРБИС, который используется для создания корпоративных библиотечных систем, в том числе и в Корпоративной сети московских библиотек, а также для создания электронных библиотек вузов, в частности, для пилотной версии электронной библиотеки МГУКИ
Апробация результатов проходила в ГПНТБ России Разработанное программное обеспечение используется в составе АБИС ИРБИС, что подтверждено свидетельством об официальной регистрации, выданным Федеральной службой по интеллектуальной собственности, патентам и товарным знакам Кроме того, результаты исследования реально используются в Корпоративной сети московских библиотек, ГПНТБ России, ВГБИЛ им М И Рудомино Основные положения диссертации изложены в 14 публикациях, в том числе в монографии (совместно с М В Гончаровым), неоднократно докладывались на международных конференциях «Крым» и ЛИБКОМ
Достоверность результатов исследования обусловлена использованием теоретических и эмпирических методов, адекватных целям и задачам исследования, апробацией идей диссертационного исследования на практике, на различных научных конференциях