Введение к работе
В последние 5 лет самым большим и наиболее интенсивно используемым информационным ресурсом в мире стала глобальная информационная сеть Internet. Информационное обеспечение научной деятельности все больше опирается на информационные ресурсы этой сети. Кроме этого технологии Internet становятся основой построения информационных систем научных и других организаций (Intranet-системы).
Типовыми решениями в системах Internet/Intranets являются гипертекстовые системы, основанные на технологии World Wide Web и информационно-поисковые системы, которые позволяют находить ссылки на информационные источники, используя традиционный поиск по ключевым словам. Любая стратегия поиска в сети строится как совокупность поиска по ключевьш словам и навигационного поиска в гипертекстовой сети.
Актуальность темы. Разработка и эксплуатация информационной системы Internet/Intranets организации связана с двумя основными проблемами, которые определены смешанным характером поисковых стратегий в такого рода системах: применение традиционных алгоритмов поиска и применение навигационных алгоритмов поиска
При разработке информационно-поисковой системы следует учитывать динамичный, характер Internet. Число документов, которые составляют предмет поиска, быстро изменяется, так же быстро может изменяться а состав словаря, термины га которого используются при индексировании документов.
В этих условиях следует быть уверенным в прішенимости моделей, которые использованы для построения информационно-поисковой системы, В подавляющем большинстве случаев индексирование и поиск информации в системах Internet/Intranets опирается на линейную модель индексирования и поиска. Таким образом получение условий применимости данной модели является важной и актуальной задачей.
Многие информационные системы Internet/Intranets среди прочих стратегий поиска применяют стратегии коррекции запросов по релевантности. Результаты применения таких стратегий позволяют говорить об их зффективкости, однако условия применения стратегий коррекции запросов по релевантности для линейной модели индексирования и поиска до сих пор не были определены. В ряде случаев коррекция запросов не приводят к ожидаемым результатам.
В условиях применения смешанных стратегий поиска информации актуальна задача разработки единой модели поиска информация ках в навигационных системах, так и в информационно-поисковых. При этом желательно воспользоваться всеми теми результатами, которые были уже получены в рамках линейных моделей.
Модель навигационной системы должна решать вопросы связанные с сокращением числа гипертекстовых переходов от узла входа в систсму(домаишяя страница) до узла, который пользователь определяет как релевантный. При этом модель должна учіггьшать различные типы навигации в гипертекстовом графе, жизненный цикл документов(страниц) гипертекстовой базы AaHHbix(Website), а также динамику посещений документов пользователями.
Цель работы. Таким образом, целью данной работы является разработка комплексной модели информационной системы Internet/Intranets с с возможностью поиска информации как по ключевым словам, так и путем навигация в гипертекстовом графе системы.
В рамках данной цели определены следующие задачи:
Обоснование применимости линейной модели индексирования и поиска для информационных систем Internet/Intranets;
Обоснование, применимости процедур коррекции .загпюсов по релевантности в информационных системах. iBtemet/Intranets;
-, Разработка модели навигации в гипертекстовом графе информационной системы Internet/Intranets;
Разработка методики оценки, периодов жизненного цикла документов информационной системы Internet/Intranets;
Разработка методики структурного анализа гипертекстового графа системы на основе статистики посещений информациоцных узлов
Разработка гипертекстовой информационной системы Internet/Intranets для апробации моделей.
Научна» новизна работы состоит в разработке математического аппарата и методик анализа функционирования гипертекстовых информационных систем в глобальных информационных сетях.
В данной работе впервые определены границы применимости линейных моделей индексирования и поиска, аналитически обосновано применение процедур коррекции запросов по релевантности в рамках линейной модели индексирования и поиска, разработана линейная модель навигационного поиска и на ее основе предложены методики анализа и настройки гипертекстового графа информационной системы Internet/Intranets.
Апробация работы. Результаты диссертации были доложены и обсуждались на:
4-ой ежегодной научно-технической конференции Ядерного Общества, Нижний Новгород, 28 июня -2 июля 1993 года.
First International Conference of the European Commission, Belorus, Russian Federation and Ukraine on the radiological consequences of the Chernobyl Accident, Vol. 1, 1996.
II Европейском Восточно-Западном Симпозиуме по материалам и процессам, МАТТХ-91, 26-30 мая 1991г., сб. докл.
Международном Коллоквиуме "Новые информационные технологии", г.Москва, 8-10 октября 1991г., М., МЦНТИ, 1991.
конференции НТИ'96, ВИНИТИ, М., 1996.
3 сети Internet с 1994 года установлен и находится в эксплуатации Website "Полынь"
Публикации. По результатам работы опубликовано Н статей.
Структура работы. Диссертация состоит из - введении, четырех глав с выводами, заключения и списка использованной литературы, изложенных на 162 страницах с рисунками, а также приложений.