Введение к работе
Актуальность исследования Глобальный процесс, получивший название "информатизация общества", оказывает влияние на все стороны жизни общества Главное, что отличает этот процесс, заключается в приобретении информацией статуса фундаментального фактора существования человечества Если ранее жизнь и прогресс человечества зависели, в основном, от материального производства, то теперь они невозможны без максимального использования информации во всех ее видах Информационный фактор быстро приобретает почти такую же значимость, как и материальный
Выросшая в "технотронном" обществе индустрия информации и информационного обслуживания приобрела настолько большой удельный вес в жизни государства и отдельного человека, что по числу занятых в ней людей приближается к сфере материального производства Само материальное производство попадает во все большую зависимость от индустрии информации
Изменились и общественные потребности в информации, одним из следствий чего стала коренная трансформация библиотечного дела Оно все более превращается в одну из мощных и важнейших отраслей индустрии информации, оснащаемую новейшей компьюникационной техникой, нетрадиционными носителями информации, высокоэффективными автоматизированными технологиями ее обработки и использования
Кардинальные социально-экономические и политические преобразования в России, ориентация на использование новых информационных технологий меняют положение библиотеки в обществе, расширяют и усложняют ее функции и задачи Библиотеки в настоящее время являются основой для создания в России новой информационной инфраструктуры
Современная библиотека является сложной информационной системой, состоящей как из традиционных, так и новых, нетрадиционных информационных подсистем Важную роль среди новых информационных подсистем библиотеки играет электронный каталог (ЭК), и его создание является приоритетной целью автоматизации библиотек Именно ЭК открывает быстрый и качественный доступ к информационным ресурсам
библиотеки Качество и эффективность библиотечного ЭК определяются комплексом методов и средств, составляющих технологию его создания и использования Несмотря на большие достижения в области практической реализации технологии создания электронных каталогов, осмысление их места в общей системе электронных коммуникаций заметно отстает от потребностей В настоящее время нет общепринятой теории библиотечного ЭК, и его развитие идет, преимущественно, эмпирическим путем Так, даже само понятие «электронный каталог» не имеет устоявшейся трактовки и, зачастую, трактуется разными авторами противоречиво, рассматривается как некоторый комплекс слабо связанных задач и решений
Таким образом, актуальна научная проблема, решению которой посвящено данное исследование повышение качества и эффективности создания и использования библиотечного электронного каталога путем разработки теории и методологии создания ЭК, соответствующих тенденциям развития информационных технологий и ориентированных на реальную практику их использования
Разработанность проблемы Начало процесса создания библиотечных ЭК относится к 1960-1962 гг, когда ряд средних и малых библиотек США, преимущественно в учебных заведениях, независимо друг от друга приступили к разработке систем машиночитаемых каталогов и средств доступа к ним В 1963 г с принятием программы MARC (MAchine-Readable Catalogumg — машиночитаемая каталогизация) в Библиотеке Конгресса США этот процесс приобретает упорядоченный и направленный характер
В России первые попытки создания библиотечных ЭК относятся к началу 1970-х годов, они связаны с исследованиями в области форматов по обмену библиографическими записями в ГПНТБ
Теоретические и практические проблемы создания библиотечного ЭК в течение длительного времени разрабатывают такие видные зарубежные ученые, как Hennette D. Avram, Hugh С Atkinson, Cyril Cleverdon, Donald S Culbertson, Richard de Gennaro, Franc W Lancaster, Gerard Saiton, L Syre и другие Крупномасштабные проекты по созданию ЭК реализованы и реализуются в Библиотеке Конгресса США, Британской библио-
теке, региональных и вузовских библиотеках США и стран Западной Европы Особо следует отметить достижения в этой области библиотеки университета штата Огайо, ставшей ядром крупнейшей библиотечной сети OCLC (Online Computer Library Center) и центром масштабного распределенного ЭК
В нашей стране основы решения проблемы создания библиотечного ЭК заложены в трудах Р С Гиляревского, Д Г Лахути, В П Леонова, А.В Соколова, Ю Н Столярова, А И Черного, Ю И Шемакина Теоретические и практические вопросы создания библиотечного ЭК рассматриваются в работах А Б Антопольского, Ф С Воройского, Б С Елепова, Н Е Каленова, О А Лавреновой, Я Л Шрайберга и др , постоянно обсуждаются на международных конференциях и семинарах, среди которых следует отметить ежегодную Крымскую конференцию и конференции, проводимые в РГБ и РНБ Масштабные проекты по созданию ЭК реализуют РГБ, РНБ, БАН, ГПНТБ, БЕН, ГПНТБ СО РАН, ВГБИЛ и другие крупнейшие библиотеки страны Координация проектов осуществляется в рамках федеральной программы Либнет и федеральной программы "Культура России"
В настоящее время в России разработано много автоматизированных библиотечных систем (АБИС) различного уровня сложности и масштаба Среди таких систем можно выделить ИРБИС, "Библиотека", МАРК, решающие задачу комплексной автоматизации библиотек и содержащие стандартные средства создания и ведения ЭК, принятые для библиографических баз данных Среди зарубежных массовых систем наиболее известны ALEPH, DYNIX (HORIZON), GEAC, INNOPAC, Liber, TinLib, VTLS Анализ описаний большинства из перечисленных АБИС показал, что в них, как правило, недостаточно развито лингвистическое обеспечение (ЛО), так, например, отсутствуют эффективные средства поиска и исправления ошибок и автоматизированного индексирования с учетом этой проблемы
Целью исследования является разработка теоретических основ и методологической базы создания и использования библиотечного электронного каталога, позволяющей ускорить и упростить его создание, по-
высить качество и облегчить использование Для ее достижения следует решить следующие задачи
-
Проанализировать современное состояние проблемы создания ЭК
-
Рассмотреть существующие методы и средства создания ЭК, выявить возникающие при этом проблемы и определить пути их решения
-
Проанализировать проблему повышения качества ЭК как сложную комплексную задачу, решаемую на всех этапах жизненного цикла электронного каталога
-
Предложить теоретические основы создания ЭК с учетом особенностей и тенденций развития информационных технологий
-
Создать модель жизненного цикла электронного каталога, позволяющую разработать методологию создания ЭК
-
Разработать на основе теоретических исследований методическое и программное обеспечение процесса создания и использования ЭК
Объектом исследования является библиотечный электронный каталог.
Предметом исследования являются теоретические и методологические основы создания и использования библиотечного электронного каталога
Методы исследования, используемые в работе, базируются на основных положениях теории систем и системного анализа, теории информации и информационных процессов, теории нечетких множеств, теории индексирования
Научная новизна диссертационной работы заключается в следующем.
-
Разработаны теоретические основы создания и использования библиотечного электронного каталога с учетом особенностей и тенденций развития информационных технологий
-
Впервые электронный каталог рассматривается как сложная самообучающаяся метаинформационная система в совокупности с методами и средствами его создания, поддержки и развития
-
Впервые дается характеристика жизненного цикла электрон-
ного каталога
-
Предложена модель жизненного цикла электронного каталога, реализующая системный подход к повышению качества ЭК на этапах разработки и эксплуатации
-
Разработана методологическая база, обеспечивающая повышение эффективности и качества электронного каталога
-
Предложена классификация ошибок, позволяющая разработать эффективные способы их предупреждения и устранения
-
Впервые для решения задачи повышения качества ЭК предложен и реализован комплексный подход, основанный на систематическом применении методов нечеткой логики и теории индексирования
-
Создано методическое и программное обеспечение технологии создания и использования ЭК
На зашиту выносятся следующие положения
-
Библиотечный электронный каталог является метаинформационной системой, обладающей свойством избыточности информации и устойчивостью к ошибкам
-
Представление ЭК как метаинформационной системы позволяет разработать теоретические основы его создания и использования
-
Жизненный цикл ЭК должен включать этапы разработки лингвистического обеспечения и переноса информации на следующий цикл
-
Наибольшее влияние на качество и эффективность электронного каталога оказывает лингвистическое обеспечение электронного каталога
-
Лингвистическое обеспечение электронного каталога должно содержать средства предупреждения, поиска и устранения ошибок
-
Информационный поиск в электронном каталоге следует рассматривать как процедуру сравнения строк, и повышение эффективности поиска при наличии ошибок обеспечивается совершенствованием этой процедуры
-
Средства создания электронного каталога должны включать в качестве обязательного компонента инструмент предупреждения ошибок ввода
-
Информационный поиск в библиотечном электронном каталоге должен выполняться с учетом наличия ошибок как в ЭК, так и запросах пользователей
-
Структурированное представление электронного каталога полностью раскрывает содержание электронного каталога и решает, таким образом, проблему "потерянных записей"
-
Предложенная методология и разработанное на ее основе программное обеспечение позволяет повысить качество и эффективность электронного каталога
Теоретическая значимость работы состоит в разработке теоретических и методологических основ создания и использования библиотечного электронного каталога Это создает предпосылки для перехода от эмпирического к научному этапу создания ЭК, отвечающего современному уровню развития информационных технологий
Практическая значимость работы и реализация результатов Полученные в работе теоретические и практические результаты являются основой разработанных алгоритмов и методик, а также компьютерных программных средств, включающих
программный комплекс обслуживания электронного каталога,
программу конверсии внешних баз данных,
программу ввода спецификаций журнальных изданий,
программу ведения каталога периодических изданий и поиска в нем,
программу статистического анализа библиографических баз данных,
программу создания и редактирования инвертированного файла электронного каталога с элементами индексирования,
программу автоматизированного индексирования библиографических баз данных,
программный интерфейс доступа к электронному каталогу,
программный комплекс для создания структурированного представления библиографических баз данных
Практическая ценность полученных результатов состоит в том, что
они обеспечивают каталогизатора, систематизатора, библиографа и рядового пользователя средствами, позволяющими
ускорить процесс создания электронного каталога за счет сокращения клавиатурного ввода,
снизить количество недоступных библиографических записей в электронном каталоге на основе применения метода нечеткого сравнения строк и записей,
обеспечить эффективный поиск в электронном каталоге с применением разработанных пользовательских интерфейсов и программных средств
Базой исследования являются электронные каталоги РГБ, РНБ, Библиотеки РАН и библиотек-отделов БАН при институтах Санкт-Петербургского Научного Центра РАН, российские и зарубежные библиографические базы данных и электронные каталоги в сети Интернет и на CD-ROM
Материалы диссертационной работы докладывались на международных и российских конференциях и семинарах-
-
Библиотеки и ассоциации в меняющемся мире новые технологии'и новые формы сотрудничества (Судак, 1998,1999,2005)
-
Библиотечное дело в России и за рубежом Наследие и современность (Краснодар, 1999)
-
Библиотечное дело и проблемы информатизации общества (Москва, 1999)
-
Библиотечное дело - 2000 программа формирования открытого информационного общества (Москва, 2000)
-
Информационные ресурсы библиотек и их кадровое обеспечение (Минск, 2000)
-
Библиотечное дело - 2001 Российские библиотеки в мировом информационном и интеллектуальном пространстве (Москва, 2001)
-
Библиотечное дело 2003 Гуманитарные и технологические аспекты развития (Москва, 2003)
-
Единое информационное пространство России федеральный и региональный компоненты (Краснодар-Геленджик, 2004)
-
Информационные технологии в образовании и науке (ИТОН-2006, Москва, 2006)
-
Современные пользователи автоматизированных информационно-библиотечных систем (Санкт-Петербург, 2006)
Разделы диссертации обсуждались на научно-технических семинарах отдела информатики и автоматизации БАН и на научных семинарах кафедры информатики и информационных технологий СПбГУКИ
По данной проблеме опубликовано свыше 50 научных работ, в том числе монография "Электронный каталог. Проблемы и решения", раздел в справочнике "Электронные документы создание и использование в публичных библиотеках" и 7 программ и программных комплексов для ПЭВМ, зарегистрированных в Государственном фонде алгоритмов и программ (г. Москва). Диссертационная работа обобщает исследования, выполнявшиеся в отделе информатики и автоматизации БАН в рамках бюджетной НИР "Разработка и внедрение автоматизированной библиотечной системы БАН (АС-БАН)" в период 1997-2002 гг и позднее, в рамках гранта РГНФ - Проект 00-05-12019в "Издания Санкт-Петербургской Академии наук и академической типографии в 18 веке", в рамках гранта Российского фонда фундаментальных исследований - Проект 01-07-90287-в "Создание базы данных по иностранным периодическим изданиям из фонда библиотеки Зоологического института РАН" (2001 -2002 годы), а также в рамках Федеральной целевой программы "Интеграция науки и высшего образования России на 2002-2006 годы", Проект № Б0120 "Оптика и научное приборостроение"
Структура и объем работы Работа состоит из введения, пяти глав, заключения и приложений, содержит 365 страниц и список использованной литературы, включающий 218 наименований