Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Трехуровневая система агентного поиска и обработки научно-технической информации Артамонов Алексей Анатольевич

Трехуровневая система агентного поиска и обработки научно-технической информации
<
Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации Трехуровневая система агентного поиска и обработки научно-технической информации
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Артамонов Алексей Анатольевич. Трехуровневая система агентного поиска и обработки научно-технической информации: диссертация ... кандидата Технических наук: 05.13.01 / Артамонов Алексей Анатольевич;[Место защиты: ФГАОУВО Национальный исследовательский ядерный университет МИФИ], 2017

Содержание к диссертации

Введение

Раздел 1. Методика структурно-параметрического синтеза агентных систем 4

1.1. Процессы роста, рассеивания и утраты единой структуры сетевых информационных ресурсов 12

1.2. Типология пользователей и агентов 16

1.3. Обоснование значений целевых параметров агентной системы 21

1.4. Трехуровневая архитектура агентного поиска и обработки научно-технической информации (нти) 26

1.5. Выбор технологической платформы для реализации трехуровневой модели 30

Результаты и выводы по разделу 1 36

Раздел 2. Структуризация научно-технической информации в мультиагентных системах 38

2.1. Исследование ресурсов интернет для построения тематических маршрутных баз данных для агентов-почтальонов 38

2.2. Анализ тематического направления для построения управляющей базы данных для агентов – курьеров 43

2.3. Персональные словари пользователей для управления агентом-референтом 48

2.4. Тематическое и лингвистическое масштабирование 53

Результаты и выводы по разделу 2 56

Раздел 3. Разработка и экспериментальные исследования регулярных агентных технологий 57

3.1. Автоматизированный выпуск новостных изданий 57

3.2. Создание досье динамических объектов 62

3.3. Формирование семантических сетей 66

3.4. Регулярные агентные технологии в практике информационно-аналитических работ

Результаты и выводы по разделу 3 77

Раздел 4. Агентные и диалоговые технологии в целевых информационно-аналитических исследованиях 79

4.1. Агентные технологии для подготовки к конференции 79

4.2. Анализ проекта «мезодинамические архитектуры» 82

4.3. Ситуационный экспресс анализ 87

4.4. Учебно – методические средства для подготовки специалистов по мультиагентным информационно-аналитическим системам 96

Результаты и выводы по разделу 4 101

Заключение 102

Список терминов, условных обозначений и сокращений 104

Список литературы 106

Введение к работе

Актуальность исследований. В диссертации разрабатывается трехуровневая модель агентного поиска и обработки тематической информации, а также

методы её программно-технической реализации. В диссертации обобщаются научные работы автора, выполненные в аспирантуре НИЯУ МИФИ на кафедре «Анализ конкурентных систем» за 2012 – 2016 года (теоретические и экспериментальные исследования проводились на примере таких тематических направлений как «Физика плазмы», «Лазерные промышленные технологии», «Фотоника», «GRID системы»). Работы выполнялись в рамках Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» по проекту «Мультиагентные информационно-аналитические системы по естественно-научным и технологическим направлениям» №16.740.11.0129 от 02 сентября 2010 года.

За последние пять лет актуальность работ по созданию агентных информационно-аналитических систем значительно выросла. Это связано с быстрым ростом в сети Интернет количества источников научно-технической информации, таких, например, как сайты университетов, научных центров, научных подразделений (кафедр и лабораторий) и, наконец, сайты известных специалистов и творческих групп.

Извлечение новостной информации из такого большого количества источников без использования агентных технологий стало практически невозможным. Поэтому тема диссертации, посвященной решению вопросов эффективного агентного поиска и обработки научно-технической информации, является актуальной.

Цель диссертационной работы состоит в разработке и экспериментальном исследовании научно-методических и инструментальных средств агент-ных технологий, обеспечивающих масштабируемость системы и высококачественное информационное обслуживание коллективных и персональных пользователей по параметрам полноты, точности и пертинентности.

В работе решаются следующие основные задачи:

  1. Разработка архитектуры трехуровневой агентной информационно-аналитической системы по естественно-научным и технологическим направлениям.

  2. Выбор инструментально-технологической платформы для программно-технической реализации трехуровневой модели тематического обслуживания коллективных и персональных пользователей.

  3. Реализация и экспериментальные исследования трехуровневой модели агентного поиска и обработки информации.

  4. Разработка и экспериментальные исследования методов тематического и лингвистического масштабирования агентной системы.

  5. Разработка и исследование технологий регулярного выпуска информационных продуктов, таких как дайджест, динамическое досье, семантическая сеть.

  6. Постановка и решение задач по экспериментальной оценке значений параметров качества информационного обслуживания пользователей, таких как полнота, точность, пертинентность.

  1. Разработка агентных и интерактивных методов решения типовых информационно-аналитических задач, таких как создание и ведение досье на объекты профессионального интереса; использование семантических сетей для выявления явных и неявных отношений между объектами; ситуационный экспресс анализ в заданных областях науки и техники.

  2. Создание учебного курса по использованию агентных технологий при поиске и обработке данных для проведения информационно-аналитических исследований.

Объектом исследования являются агентные технологии поиска и обработки информации в информационно-аналитических системах.

Предметом исследования являются методы и средства агрегирования тематической информации, а также средства обеспечения тематической и лингвистической масштабируемости мультиагентной системы.

Методы исследования. В работе используются методы системного анализа, структурно-параметрического синтеза, системного проектирования, многокритериальные методы количественной экспертной оценки сложных объектов с оценкой согласованности полученных экспертных данных, экспериментальные методы оценки поведения трех типов агентов: «агент-почтальон», «агент-курьер», «агент-референт». Временные характеристики выполнения поисковых операций и обработки данных оцениваются методом тестирования. Пертинентность информации, направляемой пользователю оценивается высококвалифицированными специалистами в тематической области.

Научная новизна. Новые научные результаты, полученные лично автором, состоят в следующем:

  1. Предложена трехуровневая модель агентного поиска информации для коллективных и персональных пользователей, обеспечивающая достижение высоких показателей полноты, тематической точности и пертинентности информации.

  2. Разработаны и обоснованы функции агентов, работающих на каждом из трех уровней системы, и методы формирования поисковых предписаний для «агентов-почтальонов», «агентов-курьеров», «агентов-референтов».

  3. Предложен и реализован метод агрегирования баз данных, управляющих агентным поиском, по каждому из тематических направлений.

  4. Предложены и экспериментально проверены методы лингвистического масштабирования с использованием международного стандарта TMX 1.4b Specification. Получены экспериментальные данные по агентному поиску научно-технической информации на русском, английском, китайском, испанском языках по различным тематическим направлениям («Физика плазмы», «Лазерные промышленные технологии», «Фотоника», «GRID – системы»).

  5. Предложен метод агрегирования тезаурусов для поиска информации по пограничным тематическим областям для сокращения объемов выдачи.

  6. Предложена методика проведения информационно-аналитических работ по ситуационному экспресс-анализу с помощью операционной карты в различных тематических областях.

7. Предложен новый подход к визуализации научно-технической информации, отражающий динамические свойства объектов для исследователей, принимающих решения.

Обоснованность и достоверность результатов работы подтверждается доказанностью выводов, полученных в результате экспериментов по агент-ным технологиям, апробацией основных результатов работ на российских и международных конференциях, публикациями, успешной реализацией предложенных методов в виде трёхуровневой модели поиска и обработки научно-технической информации.

Практическая значимость и реализация результатов работы

Теоретические и практические результаты диссертации использованы при создании Мультиагентной информационно-аналитической системы по естественно-научным и технологическим направлениям (МИАС), разработанной на кафедре «Анализ конкурентных систем» НИЯУ МИФИ.

Система внедрена в Научно-техническом институте межотраслевой информации (НТИМИ) для анализа развития отечественных и зарубежных технологий двойного назначения и в Центре плазменных и лазерных технологий НИЯУ МИФИ для информационно-аналитической поддержки научно-исследовательских и опытно-конструкторских работ (НИОКР), проводимых по данным тематическим направлениям.

Автором создан учебный курс «Информационно-аналитическая работа с использованием агентных технологий». Впервые курс прочитан в 2010/2011 годах как факультативный для студентов старших курсов, специализирующихся в области международного научно-технологического и промышленного сотрудничества (направление подготовки (специальность) – 41.03.05). В 2013/2014 учебном году курс дополнен обширным практикумом, реализованном в специально созданной учебно-научной лаборатории «Агентные информационно-аналитические системы». В 2014/2015 учебном году курс вошел в учебный план подготовки как обязательный. Практические занятия проводятся с использованием фактических данных, полученных при опытно-промышленной эксплуатации МИАС в упомянутых выше организациях.

Апробация результатов работы

Основные результаты исследований, проводимых в рамках данной работы, были представлены на следующих конференциях:

Международная конференция «Современные проблемы прикладной математики и информатики» (MPAMCS 2014), г Дубна, август 2014 г.;

IV конференция «Информационные технологии на службе оборонно-промышленного комплекса», г. Иннополис, май 2015 г.;

Международный военно-технический форум АРМИЯ-2015, г. Кубинка июнь 2015 г.;

XXXIV Межотраслевая научно-методическая конференция «Актуальные вопросы исследования и прогнозирования военного потенциала зарубежных стран в интересах вскрытия угроз безопасности Российской Федерации», г. Москва, октябрь 2015 г.;

XXV Международный симпозиум по ядерной электронике и компьютерным технологиям (Symposium on Nuclear Electronics and Computing (NEC 2015), г. Будва, октябрь 2015 г.;

VI школа CERN/ОИЯИ/МИФИ «GRID и Административные информационные системы», г. Дубна, ноябрь 2015 г.

Результаты работ также докладывались на Научной сессии НИЯУ МИФИ в 2010-2016 гг.

Публикация результатов

Основные положения диссертации опубликованы в 22 печатных работах, в том числе: 4 статьи опубликованы в журналах из списка рекомендованных Высшей аттестационной комиссией, 4 работы опубликованы в изданиях, индексируемых базой Scopus. По научно-техническим разработкам в составе коллектива авторов получены 4 свидетельства о регистрации баз данных, как в Федеральной службе по интеллектуальной собственности, так и в библиотеке Конгресса США.

Основные положения, выносимые на защиту:

  1. Трехуровневая модель агентного поиска и обработки научно-технической информации в сети Интернет, обеспечивающая одновременно высокие показатели полноты, точности и пертинентности информации.

  2. Система формирования поисковых предписаний для трех типов агентов, работающих в трехуровневой системе: «агентов-почтальонов», «агентов-курьеров», «агентов-референтов».

  3. Метод агрегирования тематических баз данных, управляющих агент-ным поиском.

  4. Метод лингвистического масштабирования агентной системы с использованием международного стандарта TMX 1.4b Specification.

  5. Технология формирования персональных тезаурусов для пользователей.

  6. Агентные и интерактивные методы решения типовых информационно-аналитических задач: создание и ведение досье на объекты профессионального интереса; использование семантических сетей для обнаружения явных и неявных отношений между объектами; ситуационный экспресс-анализ в заданных областях науки и техники.

  7. Учебный курс по использованию агентных технологий при поиске и обработке данных для проведения информационно-аналитических исследований.

Личный вклад автора. Основные научные результаты, полученные автором лично, заключаются в разработке трехуровневой модели агентного поиска и обработки научно-технической информации в сети Интернет; разработке методов управления агентами на трех уровнях системы агентного поиска научно-технической информации; разработке методов и программных средств тематического и лингвистического масштабирования агентной системы; проведении экспериментальных исследований эффективности агент-ных технологий на трех уровнях агентного поиска и обработки данных. Автор

внес существенный вклад во внедрение разработанной трехуровневой системы в практику информационно-аналитической деятельности НТИМИ. Автором лично проведена настройка трехуровневой агентной системы на решение задач по информационному анализу технологий двойного назначения. Автором лично разработан и впервые прочитан студентам старших курсов НИЯУ МИФИ учебный курс «Информационно-аналитические исследования с использованием интеллектуальных агентных систем».

Структура и объем диссертационной работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и 7 приложений. Общий объем работы составляет 115 страниц (без учета приложений). Работа содержит 24 иллюстрации и 27 таблиц. Список литературы состоит из 86 наименований.

Обоснование значений целевых параметров агентной системы

У каждой из перечисленных групп пользователей своя роль в науке и свои информационные интересы и требования к качеству информационного обслуживания.

Первая группа пользователей заинтересована в полноте поступающей научно-технической информации из всех мировых источников. Агентные технологии позволяют решать эту проблему путем автоматического сканирования всех источников.

Вторая группа пользователей заинтересована не только в полноте, но и в тематической точности информации. Высокий уровень этой характеристики агентные технологии обеспечивают за счет автоматической фильтрации всего входящего потока информации.

Качество обслуживания персонального пользователя характеризуется параметром пертинентности получаемой информации. Этот редко используемый параметр отражает степень удовлетворенности конкретного пользователя полученными из системы данными. Пертинентность обеспечивается персональными агентами, которые предоставляют специалисту информацию по различным тематическим направлениям, которые входят в область его профессиональных интересов.

Таким образом, устанавливается соответствие между типами пользователей и типами агентов, осуществляющих информационное обслуживание. Эти три типа агентов, выполняющих различные функции в агентных поисковых системах, в дальнейшем будем называть:

1. Агент-почтальон (P) – агент, взаимодействующий с информационными ресурсами сети Интернет по заданному расписанию и агрегирующий полученную информацию в текстовую базу данных.

2. Агент курьер (K) – агент, взаимодействующий с агентом-почтальоном и текстовой базой данных и систематизирующий информацию по соответствующим тематическим направлениям. 3. Агент-референт (R) – агент, взаимодействующий с пользователем и агентом-курьером в целях доставки пертинентной информации из баз данных системы пользователю.

Название агентов подчеркивает аналогию с почтовыми системами, проявившими свою надежность в течение длительного исторического периода.

Каждый из перечисленных выше типов агентов подразделяется на функциональный и целевой. Функциональный агент (индекс F, например, функциональный агент-курьер – ) выполняет стандартизированную операцию по заданному расписанию, целевой агент (индекс C, например, целевой агент-курьер – ) выполняет операцию по настроенным пользователем параметрам.

Обзор работ по агентным системам и технологиям показывает, что в настоящее время они достигли широкого практического применения в таких областях, как беспилотное управление движущимися объектами и роботами различного функционального назначения [2, 4].

Еще одно направление практического применения агентных технологий охватывает задачи концентрации различной деловой информации в системах принятия решений. Это делает возможным решение сложных информационно-поисковых задач внутри промышленных корпораций, реализующих и поддерживающих жизненный цикл больших технических систем – авиастроение, судостроение, реакторостроение и т.д.

Особенности применения агентных технологий в информационно-аналитических системах, рассматриваемые в данной диссертации, состоят в том, что в этих системах используются практически все типы языков: различные естественные национальные языки, как алфавитные, так и иероглифические; профессиональные подмножества естественных языков, описывающих различные научные и технологические направления; операционные языки различных компьютерных систем и сетей и, наконец, языки программирования инструментальных средств обработки и анализа данных. Эти объективные особенности информационно-аналитических систем по естественно-научным и технологическим направлениям определяют и методологические особенности их разработки, а именно: - создание ядра системы на примере одного-двух тематических направлений с использованием наиболее употребительного в современной науке английского языка и отечественного – русского; - запуск системы в опытную эксплуатацию, позволяющую экспериментально определить ее рациональные характеристики; - тематическое масштабирование (расширение) системы и лингвистическое масштабирование – введение нескольких национальных языков для мониторинга национальных источников научно-технической информации.

Ядро системы может быть разработано относительно быстро и со сравнительно небольшими финансовыми и трудовыми затратами [20]. Последующее масштабирование системы переводит её в стационарное состояние, в котором регулярно реализуются агентные информационные технологии и целевые информационно-аналитические исследования, поддерживаемые классическими технологиями диалогового типа.

В данной диссертации разрабатываются методики автоматизированного решения задач с использованием как агентных, так и диалоговых технологий поиска и обработки данных для возможности последующего решения всего разнообразия информационно-аналитических задач, возникающих у названных выше групп пользователей.

Анализ тематического направления для построения управляющей базы данных для агентов – курьеров

Одна из задач, решаемых на третьем уровне состоит в наблюдении за динамическим объектом, который представляет для пользователя персональный интерес.

В перечисленных выше разделах тематические тезаурусы рассматривались как управляющие базы для агентов-курьеров (.). В данном же случае агент-курьер () может управляться практически одним словом или набором слов, в явном виде задающих объект интереса с учетом синонимов и т.д., что приводит к необходимости формирования пользовательских наборов ключевых слов, в которых может содержаться как научная, так и технологическая информация.

При составлении пользовательских наборов ключевых слов есть свои особенности, а именно: весьма успешным методом является использование различных идентификаторов в качестве ключевых слов. Например, при поиске информации по объекту «проект» целесообразно использовать номер, который ему присваивается при объявлении конкурса. В этом случае в результате поиска можно получить техническую документацию на проект или иные связанные с ним документы. Другой пример связан с поиском полнотекстовых документов, в этом случае целесообразно использовать идентификатор DOI (digital object identifier) [32], который однозначно идентифицирует статьи в цифровом мире, и т.д.

При поиске информации в открытых источниках по заданному объекту возникает ряд сложностей, связанных с тем, что целевая информация может не храниться в полнотекстовой базе данных.

Агенты-почтальоны (), управляемые маршрутной базой данных, решают задачу сбора информации с заданного источника. Однако, получаемая информация не может в полной мере удовлетворить персонального пользователя, что связано с рассеиванием тематической информации по различным источникам. Для решения этой задачи используется целевой агент почтальон ().

Целевой агент-почтальон () – агент-почтальон, управляемый персональной тематической базой данных и целевыми характеристиками.

Целевой агент-почтальон () направлен на сбор целевой информации для персонального пользователя. Пользователь мультиагентной системы имеет возможность присваивать соответствующие целевые характеристики агенту-почтальону для решения перечисленных в данном подразделе задач.

При решении задач по наблюдению за определенным объектом возникает необходимость обращения уже не к конкретному доменному имени (заложенному в маршрутную базу данных), а ко всем документам, которые уже были проиндексированы такими информационно-поисковыми системами как Google и Яндекс.

Агенты-почтальоны () приносят текстовую информацию, размещенную на сайтах; в свою очередь информация, размещенная в файлах следующих форматов: .doc, .docx, .pdf, .xls, .xlsx, – оказывается неохваченной. Во многих источниках такую информацию называют глубинным вебом [33].

Ценность сбора такой информации, состоит в том, что итоговые отчеты по проектам, данные по контрактам и другая информация, необходимая для наблюдения за объектом, обычно появляется не на сайтах, а в прикрепленных документах формата .pdf. Финансовая отчетная документация также иногда появляется в сети в виде файлов формата как .pdf, так и .xlsx.

Агент-почтальон () при решении задачи сбора соответствующей информации руководствуется набором ключевых слов и целевой характеристикой – тип документа.

Например, при решении задачи поиска всех документов формата .pdf, в которых содержится хотя бы одно слово из тезауруса по «Лазерным промышленным технологиям», предписание для агента-почтальона () будет выглядеть следующим образом: (Thesaurus “Laser Industrial Technologies”) AND filetype:pdf . Руководствуясь приведенным выше примером, агент-почтальон () принесет огромное количество документов, большинство из которых не будут пертинентными для пользователя в связи тем, что содержат устаревшую информацию. В связи с этим необходимо ввести еще одну целевую характеристику – время опубликования документа, тогда предписание будет выглядеть следующим образом: timespan: 01.02.2015-07.02.2015 AND (Thesaurus “Laser Industrial Technologies”) AND filetype:pdf , где timespan определяет промежуток времени опубликования документа; в приведенном примере – первая неделя февраля 2015 года.

Существенное отличие использования агента-почтальона () от существующих информационно-поисковых систем состоит в том, что в персональной базе данных может быть неограниченное количество слов. В свою очередь количество слов в информационном запросе Google ограничено 32 словами.

Поэтому в диалоговом режиме пользователю необходимо было бы создавать большое количество однотипных запросов. При агентном поиске процедура формирования поисковых предписаний выполняется автоматически, что избавляет пользователя от однотипной трудоемкой работы.

При использовании системы одновременно по нескольким тематическим направлениям возникли определенные сложности, связанные с тем, что если в начале предполагалось формировать маршрутную базу данных для каждого тематического направления, то при масштабировании выяснилось, что многие источники являются политематическими, и с них поступает информация по широкому кругу тематических направлений. Например, источник – Phys.org [34].

Наличие таких источников, с одной стороны, положительно сказывается при начальном запуске тематических направлений в разработку, так как в системе уже существует первоначальный набор информационных источников и информация поступает в полнотекстовую базу данных.

С другой стороны, при формировании группы информационных источников для мониторинга по тематическому направлению велика вероятность добавления дубликатов источников информации. Это связано с тем, что оператор не в состоянии помнить все источники, которые уже заведены в систему по всем тематическим направлениям.

При этом возникает следующая задача: исключение дублирования информационных источников в маршрутной базе данных. Для решения этой задачи тематические маршрутные базы данных были агрегированы в единую маршрутную базу данных в соответствие с перечисленными в 2.3 типами источников.

Формирование семантических сетей

Удовлетворение последнего требования возможно с использованием в отчете средств визуализации результатов.

Для большей определенности экспресс-анализа выбрана и описана одна из реальных задач по оценке ситуации в области «Лазерных промышленных технологий». Задача появилась в связи с необходимостью оценки перспективности работ и объемов финансирования конкретной университетской лаборатории в составе кафедры «Лазерной физики».

Ситуационный анализ, как и любая другая деятельность, может быть представлен последовательностью операций [45]. Существует большое количество моделей и программных средств, отражающих последовательность операций. Особенность решаемой задачи состоит в том, что в некоторой карте необходимо представить следующую информацию: информационные ресурсы, которые будут использованы в описании и анализе некоторой ситуации; инструментальные средства, необходимые для работы с выбранными информационными ресурсами; специалистов, которые отвечают за выполнение аналитической работы; логическую последовательность и интерпретацию результатов анализа. Графический документ, отражающий описанную выше информацию, будем называть операционной картой. Общий вид Операционной карты представлен на рис. 4.5.

Операционная карта экспресс-анализа Для успешного формирования итогового документа необходимо сформировать коллектив исполнителей, а именно операционную группу в составе четырёх человек, со следующими обязанностями:

Системный администратор – взаимодействует с заказчиком, координирует работу всех членов операционной группы;

Системный аналитик – выстраивает общую схему связи всех процессов, требуемых для решения задачи, подбирает ресурсы и инструменты для каждого из них, и в дальнейшем, пользуясь выбранными средствами, осуществляет аналитическое исследование; Системный программист – занимается разработкой или настройкой программного инструментария, оказанием технической поддержки;

Компьютерный дизайнер – отвечает за структуризацию материала, визуализацию результатов и формирование финального отчета.

Из операционной карты видно, что, исходя из особенностей задачи, необходимо рассмотреть и проанализировать научную и промышленную составляющую современных лазерных технологий. Эти два процесса являются параллельными и в явном виде не зависят друг от друга. Собранные материалы обрабатываются системным аналитиком при помощи настраиваемого инструментария с целью получения пертинентной информации. Сводный документ поступает к компьютерному дизайнеру для графической визуализации, исходя из соответствующего уровня принятия решений, на которые он представляется.

Существо ситуационного анализа состоит в поиске ответа на вопросы, которые интересуют заказчика и предоставлении необходимого объема информации в максимально сжатые сроки. Использование операционной карты и формирование команды исполнителей с соответствующим распределением обязанностей способствует автоматизации процессов на всех этапах создания документа.

Идеология использования агентных технологий состоит в максимальной автоматизации механизмов поиска и структуризации информации. Основываясь на трехуровневой модели структуризации научно-технической информации необходимо было определить группу информационных источников как с открытым, так и с ограниченным доступом, на которые следовало настроить агентов-почтальонов.

В данном случае источниками информации стали: материалы конференций, периодические научные издания, специализированные сайты, патенты и так далее.

В связи с невозможностью оперативной настройки системы на все организации, работающие по тематическому направлению, было принято решение о получении информации из таких реферативных баз данных, как Web of Science и Scopus [46, 47]. В качестве источника информации по патентам была выбрана база данных Espacenet [48].

Существенным ограничением для выполнения работы стала невозможность использования уже имеющегося в системе тезауруса по «Лазерным промышленным технологиям», так как он ориентирован на информационную поддержку конкретной области, а в данном случае задача состоит в анализе всего направления.

С перечисленных выше источников была получена репрезентативная выборка по публикациям и патентам за 2006-2015 года по тематическому направлению «Лазерные технологии» (табл. 27).

В результате анализа и систематизации собранного материала был построен график, отражающий динамику публикационной и патентной деятельности за период с 2006 по 2015 год. Линии тренда, расположенные в верхней части графика, отражают направление развития лазерных технологий и дают прогноз на краткосрочную перспективу (рис. 4.6.).

Ситуационный экспресс анализ

Помимо технологических процедур агентного поиска тематической информации учебный курс «Информационно-аналитические исследования с использованием интеллектуальных агентных систем» содержит учебные материалы для освоения высокоавтоматизированных методов формирования таких выходных документов, как многоязычные дайджесты, семантические сети, динамические досье, аналитические материалы. Дисциплина развивает у студентов навыки информационно-аналитической работы, проведения анализа информационных источников на достоверность и актуальность, а также дает возможность получения углубленных знаний по подготовке аналитических материалов, необходимых для принятия решений, направленных на повышение эффективности деятельности организаций в сфере международного научно-технологического и промышленного сотрудничества.

Учебный курс по агентным системам на этапе факультативного использования привлек в 2010/2011 учебном году 23 студента. Интерес к факультативу привлек не только студентов старших курсов, но и студентов младших курсов [51].

Успешное проведение факультативного курса явилось основанием для его доработки и включения в рабочий учебный план специальности 41.03.05 «Международные отношения», специализация «Международное-научно-технологическое и промышленное сотрудничество». Автором была составлена программа дисциплины в соответствии с требованиями ФГОС ВПО. Курс состоит из 17 семинаров и общий объем курса составляет 72 часа.

Для успешного прохождения данного курса студентам необходимо получить знания и навыки таких дисциплин как – «Информатика и базы данных» (первый семестр), «Информатика: поиск и обработка информации» (второй семестр), «Инструментальные средства моделирования бизнес-процессов» (третий семестр).

Первая часть курса посвящена повторению и углублению пройденного материала по проектированию баз данных и поиску информации. Студенты получают знания по понятийно-категориальному аппарату в области Информационно-аналитической работы (ИАР), знакомится с современными информационно-аналитическими тенденциями, связанными с поиском, хранением и передачей информации. В данной части предусматривается работа с информационными ресурсами различной степени доступности и построением сложных поисковых запросов к различным компонентам распределенных сетей.

В рамках второй части курса студенты знакомятся с агентными технологиями и методами автоматизации своей информационно-аналитической работы с использованием современных инструментальных средств. Студенты составляют тезаурусы по одному из заданных естественнонаучных или технологических направлений, рассчитывают значения индекса общности. После выполнения данной работы студенты формируют первичный набор информационных источников со всего мира на различных языках, проводят анализ их на достоверность предоставляемой информации, после чего формируют маршрутные базы данных для агентного поиска. Студенты проводят эксперименты по количеству времени, затрачиваемому на обработку больших массивов информации, вручную и с применением агентных технологий.

Учащиеся формируют маршрутную базу данных, дают предписания персональным агентам-почтальонам и решают различные задачи по структуризации информации для различных групп пользователей. Из полученных информационных материалов студенты формируют итоговые документы, а именно дайджесты и семантические сети по выбранному направлению. На последних семинарах проводятся публичные защиты работ перед сотрудниками кафедры и специалистами, которые обладают компетентностью в соответствующих естественно-научных и технологических направлениях.

Занятия проходят в специализированной учебно-научной лаборатории, в которой также развернут стенд для испытания агентных систем по программно-техническому инструментарию для решения информационно-аналитических задач. Оснащение лаборатории способствует наглядному восприятию теоретического материала посредством современных информационных технологий. Эмпирически установлено, что оптимальное количество студентов в учебной группе – 24 человека, каждому из которых предоставлено компьютерное и совещательное место.