Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Рабинович Борис Ильич

Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей
<
Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Рабинович Борис Ильич. Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей : диссертация ... кандидата технических наук : 05.13.17 / Рабинович Борис Ильич; [Место защиты: Ин-т проблем информатики]. - Москва, 2008. - 194 с. : ил. РГБ ОД, 61:08-5/1163

Содержание к диссертации

Введение

ГЛАВА I. Особенности систем, основанных на технологии БЗ 8

1. Основные сущности предметной области 8

2. Анализ возможностей существующих систем 22

Выводы к главе I 54

ГЛАВА II. Логико-аналитическая обработка разнородной информации 56

1. Режимы анализа текстов на естественном языке и детализаций 56

2. Кластерный анализ детализаций телефонных переговоров 82

Выводы к главе II 104

ГЛАВА III. Оптимизация информационной компоненты Системы : 105

1. Перенос хранилища знаний из плоских файлов в СУБД Oracle 105

2. Интеграция Системы с внешними базами данных 124

Выводы к главе III 138

ГЛАВА IV. Программная реализация разработанной технологии 139

1. Основные компоненты Системы : 139

2. Интерфейс взаимодействия пользователя с Системой 152

Выводы к главе IV 158

Заключение 159

Литература

Введение к работе

Актуальность работы. В настоящее время наблюдается повсеместный лавинообразный рост потоков разнородной информации, состоящей из сложноорганизованных документов, различных отчетов, электронных писем и пр. [3]. В связи с этим актуальным является разработка технологий и программных средств комплексной обработки разнородной информации. Например, в криминальной милиции примером разнородной'информации могут быть тексты на естественном языке (сводки происшествий, обвинительные заключения, справки по уголовным делам), данные из различных справочников (телефоны, адреса), биллинги телефонных переговоров и др. Информация может храниться в файлах, в Базах Данных (БД) или извлекаться из сети Интернет. Её обработка должна быть максимально автоматизирована, что зачастую предполагает решение сложных логико-аналитических задач (поиск объектов, анализ их связей и др.). Перспективным является разработка технологии и систем, позволяющих осуществить на единой основе агрегацию, хранение и логико-аналитическую обработку разнородной информации достаточно унифицированными средствами [91].

Такая система, ориентированная на обработку текстов естественного языка (ЕЯ), разработана в Институте Проблем Информатики Российской Академии Наук в рамках проекта «Аналитик» и связанных с ним проектов «Криминал», «Икс», «Поток». Созданная система «Аналитик» нашла применение в ГУВД, МВД, в области управления персоналом и анализа СМИ.

Ее особенность заключается в использовании семантико-ориентированного лингвистического процессора, позволяющего отобразить тексты на ЕЯ на структуры знаний, которые образуют Базу Знаний (БЗ). Для представления информации в БЗ используются расширенные семантические сети (РСС). Их отличие от обычных семантических сетей состоит в использовании многоместных фрагментов, связывающих вершины, и кодов фрагментов, которые тоже являются вершинами. Такие сети позволяют с достаточной

точностью представлять объекты и их связи, которые выражаются в ЕЯ с помощью различных форм, в том числе форм с отглагольными существительными, оборотами с инфинитивами, сложноподчиненными предложениями. Связанными могут быть не только объекты, но и сами действия, в которых эти объекты принимают участие.

Обработка информации в системе «Аналитик» осуществляется с помощью специального языка манипуляции знаниями Декл, созданного для обработки структур знаний (РСС). На языке Декл разработано много уникальных программ семантического поиска в БЗ (поиск похожих объектов и ситуаций, поиск по связям и по приметам), программ аналитической обработки и экспертных оценок (семейство оболочек экспертных систем). Использование в качестве БЗ обычных семантических сетей, языков логики предикатов, фреймов приводит к существенной потере информации, содержащейся в текстах на ЕЯ, и соответственно, к ограничению круга решаемых задач.

Представляется перспективным дальнейшее развитие систем, основанных на структурах знаний в виде РСС. Основными направлениями их развития должны быть:

обработка разнородной информации в рамках, единой БЗ с использованием уже имеющихся средств;

разработка средств решения новых логико-аналитических задач;

обеспечение взаимодействия таких систем с внешними БД.

В этом случае пользователь-аналитик будет получать из одного источника полную информацию в наиболее удобном виде.

В тоже время в системе «Аналитик» имеется ряд проблем. Во-первых, для хранения структур знаний используется своя внутренняя БД, основанная на плоских файлах. Структуры знаний подкачиваются по мере необходимости, образуя активную часть БЗ, в которой осуществляется обработка. Т.е. БД играет роль хранилища знаний. Учитывая объемы существующих потоков данных, возникает необходимость использовать в качестве хранилища знаний

6 современные СУБД, обеспечивающие работу с большими объемами информации (например, Oracle, MSSQL).

Во-вторых, не реализовано взаимодействие с внешними источниками данных: телефонными справочниками, адресными книгами и другими данными, введенными в соответствующие БД ("Кронос", "МГТС", "ГИБДД") и широко используемыми в криминальной милиции. В этом случае, используя внешние БД, следователь-аналитик сможет получить наиболее полную информацию об интересующем его объекте. В тоже время перекачать всю эту информацию в БЗ не представляется возможным из-за ее большого объема, ограниченного доступа и др. Отсюда необходимость организации эффективного взаимодействия внешних БД с БЗ системы.

В-третьих, не реализована аналитическая обработка

слабоструктурированной информации, а именно биллингов телефонных переговоров и банковских переводов. В органах внутренних дел есть потребность в разработке автоматизированных средств аналитической обработки этой информации. Биллинги предоставляются, соответственно, операторами сотовой связи или банками. В зависимости от оператора биллинг может иметь различную структуру. Возникает задача - разработки интегрированного универсального средства извлечения и представления в БЗ информации из биллингов, а также логико-аналитических режимов для ее анализа.

Для решения перечисленных задач необходимо развитие существующей технологии в направлениях комплексной и логико-аналитической обработки. Эти задачи решаются в рамках данной диссертационной работы.

Целью диссертации является разработка информационной технологии комплексной обработки разнородной информации большого объема в рамках системы, основанной на структурах знаний в виде РСС (далее Система).

Основными задачами исследования являются:

  1. Анализ современных аналитических комплексов, основанных на технологии БЗ и обеспечивающих обработку на единой основе разнородной информации (Глава I).

  2. Анализ существующих методов обработки разнородной информации, которые возможно реализовать в Системе (Глава I).

  3. Исследование структур биллингов телефонных переговоров и банковских счетов с целью создания унифицированного процессора для их преобразования в единую форму на уровне структур знаний — РСС (Глава II).

  4. Обеспечение возможности совместного использования структур знаний, представляющих тексты на ЕЯ, биллинги телефонных переговоров и банковских переводов для решения существующих задач Системы (Глава II).

  5. Изучение специальных задач пользователей, основанных на информации о телефонных переговорах и банковских переводах, для разработки новых средств для их решения в рамках Системы (Глава II).

  6. Разработка новых логико-аналитических режимов обработки информации, представленной в виде структур знаний, в рамках Системы (Глава II).

  7. Исследование особенностей представления информации в БЗ и разработка методов представления структур знаний в СУБД Oracle, для повышения эффективности хранилища знаний Системы (Глава III).

  8. Исследование информационных процессов, связанных с задачей интеграции данных, и разработка технологии интеграции БЗ Системы с внешними БД, для расширения пространства поиска Системы (Глава III).

Программная реализация компонент информационной технологии комплексной обработки разнородной информации представлена в Главе IV.

Анализ возможностей существующих систем

Подробнее рассмотрим системы, обладающие схожим с системой «Аналитик» функционалом. В качестве аналогов выступают следующие существующие системы [63]: 1) «Арион» компании «Сайтек» (http://www.sytech.ru); 2) «Интегрум» компании «Интегрум-Медиа» (http://www.integrum.ru); 3) «Медиалогия» компании «ИБС» (http://www.medialogia.ru); 4) «SynSys SEMANTIX» компании «Синергетические Системы» (http://www.synsys.rn); 5) аналитические комплексы на базе процессора «RCO» компании «ЭР СИ О» (http://www.rco.ru); 6) система «ВААЛ» (http://www.vaal.ru); 7) система «RetrievalWare» компании «Convera» (http://www.convera.ru); 8) система «Невод» компании «Релэкс» (http ://www. linter.ru/nevod_rus.php); 9) лингвистический процессор «FASTUS» (http://www.ai.sri.com /natural-language/projects/fastus.html).

Все эти системы основаны на собственных лингвистических процессорах, предназначенных для работы с текстами на естественном языке. Основным требованием к ним является возможность автоматического выделения из текста определенного класса объектов с их последующей обработкой. Кроме этих систем также получили распространение следующие системы анализа текстов на ЕЯ: «Парк» («Парк.Ру»); электронный киоск «Russian Story»; «Национальная электронная библиотека» от НСН; «Университетская информационная система РОССИЯ» (www.cir.ru); каталог СМИ («СМИ.Ру»); «Астарта» (www.cognitive.ru/products/astarta.htm); «Галактика-Zoom» (zoom.galaktika.ru); Технологии Hummingbird (www.hbsltd.biz/products_km.asp); «TextAnalyst» (www.analyst.ru); «Semantic Explorer» (www.neurok.ru/products); «TopSOM» (research.metric.ru); «IntellSoft. Vision» (www.intellsoft.ru/vision) и пр. Эти системы либо не отвечают предъявленным требованиям, либо имеют менее развитый функционал, нежели рассматриваемые аналоги.

Основной проблемой при сравнении является сложность получения достоверной информации о функциональности и производительности перечисленных систем, т.к. все эти системы распространяются на платной основе. По этой причине в анализе будет использоваться информация, носящая рекламный характер, полученная из свободных источников и распространяемая разработчиками систем.

Зарубежные системы в сравнении представлены системами «FASTUS» (не работающая с русским языком) и «RetrievalWare» (работающая с русским языком). Присутствие в сравнение небольшого количества зарубежных систем связано с тем, что программные продукты подобного рода сильно привязаны к языку, на котором написан анализируемый текст. В русском же языке много сложностей несвойственных большинству европейских языков — наличие большого количества словоформ, свободный порядок слов в русском языке, а также явления омонимии, полисемии и т.п. [52]. По этой причине в сравнении участвуют в основном отечественные разработки.

Системы «Интегрум» и «Медиалогия» предназначены для решения отдельного класса задач - анализа материалов средств массовой информации. В рамках анализа решаются задачи извлечения значимой для системы информации из различных источников (печатных и электронных СМИ, медиа данные), ее загрузки в хранилище, аналитической обработки и выдачей результатов в удобном для пользователя виде.

Функциональные возможности системы «Интегрум»

В основе системы лежит разработка советских ученых, получившая название «Артефакт». Информационно-поисковая система (ИПС) «Артефакт» — основа большинства инструментов работы с электронными архивам «Интегрума». Она позволяет вести одновременный поиск по разнородным группам источников - например, по СМИ, справочникам, реестрам компаний, базам статистики. Ответ на запрос по всему массиву данных размером около 300 млн. документов из пяти тысяч источников система выдает за несколько секунд.

Простой поиск в «Артефакте» похож на работу с широко известными интернет-поисковыми машинами. Задав простой запрос из двух-трех слов, пользователь получит набор документов, где встречаются эти слова. Профессиональным пользователям «Артефакта» предоставляется в распоряжение один из наиболее богатых языков запросов, содержащий все логические операторы, скобки, контекстные ограничения на расстояния в терминах слов, предложений и абзацев, усечение слов, операторы следования, точного поиска, поиска с опечатками и поиска по большой парадигме.

Использование морфологического анализа позволяет находить в документах любые формы искомых слов. Помимо сложных модулей графематики - разбиения текста на слова и предложения, морфологии, снятия омонимии, обработчиков собственных имен, «Артефакт» содержит средства для выделения специальных объектов из текстов на естественном языке: упоминаний людей, компаний, чисел и дат в любых формах и вариантах написания.

Результаты поиска при помощи «Артефакта» выдаются пользователю в виде набора ссылок на документы, с фрагментами текстов, показывающими соответствие документа запросу, и указанием на выходные данные самого документа. Набор ссылок имеет вид либо сквозных списков документов, упорядоченных по релевантности запросу или по дате, либо списков с разбиением по источникам. Далее пользователь может открыть полные тексты заинтересовавших его документов.

Помимо полнотекстового поиска ИПС «Артефакт» содержит также ряд дополнительных инструментов, позволяющих: - искать все упоминания в текстах определенного человека; - вести поиск по отдельным полям документов - заголовкам, авторам, источникам, дате загрузки или публикации; - пользоваться шаблонами поиска — специальными типовыми запросами; - составлять коллекции источников для поиска; - просматривать номера газет и журналов; - переводить полученные документы (немецкий-английский-русский).

Для работы с результатами поиска предлагается использовать средство, получившее название "Корзина Артефакта". Она одновременно является персональным хранилищем документов и рабочим столом для их редактуры и переформатирования, составления отчетов, упаковки и скачивания материалов на локальный компьютер.

Кластерный анализ детализаций телефонных переговоров

Пусть множество І—{Іи І2, , 1п} состоит из п объектов (индивидов), принадлежащих, некоторой популяции л\. Предположим также, что существует некоторое множество наблюдаемых показателей или атрибутов С= (С], Со, ..., Cz) , которыми обладает каждый индивид из 7. Наблюдаемые атрибуты могут быть как количественными, так и качественными. Как отмечено в работах [93; 98; 102; 106], кроме количественных атрибутов выделяют атрибуты состояний (например, цвета), двоичные атрибуты (да/нет), вероятностное распределение. В российских изданиях [11, стр. 268 - 290; 72] кроме количественных атрибутов выделяют номинальные и порядковые атрибуты (признаки).

Однако, основная часть исследования будет посвящена количественным данным, которые иногда будем называть измерениями. Результат измерения а-й характеристики 1Ь объекта будем обозначать через хаь, а вектор Хь=[х]ь, Х2ь,---, х=ь\ размерности zxl будет отвечать каждому ряду измерений (для Ъ-го индивида). Таким образом, для множества индивидов I исследователь располагает множеством векторов измерений X={Xh Х2, ..., Хп}, которые описывают множество I. Отметим, что множество X может быть представлено как п точек в z-мерном евклидовом пространстве Ег [18].

Пусть т — целое число, меньшее, чем п. Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся в множестве X, разбить множество объектов I на т кластеров (подмножеств) л\, л2, ..., пт так, чтобы каждый объект Ib принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными.

Решением задачи кластерного анализа является разбиение, удовлетворяющее некоторому критерию оптимальности. Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности различных разбиений и группировок. Этот функционал часто называют целевой функцией. Например, в качестве целевой функции может быть взята внутригрупповая сумма квадратов отклонений. В работе [134] рассмотрены целевые функции Крамера — фон Мизеса [100], Колмогорова — Смирнова [74], Дивиргенции [112], Джеффриса - Матусита [120], Махаланобиса [119] и др.

Теперь необходимо ввести понятие "расстояние между объектами". Это понятие должно отражать меру сходства, близости объектов между собой по всей совокупности используемых признаков. Иными словами служить интегральной мерой сходства объектов между собой. Расстоянием между объектами в пространстве признаков называется такая величина d(X,,X), которая удовлетворяет следующим аксиомам: 1. d(X,, Xj) 0, аёу апаб X, ё Xj ё$ Е, (неотрицательность расстояния); 2. d(X„XJ) = d(XyXl) (пёпаобёу ); 3. d(X„ Xj) d(X„ Xk) + d(Xk, X , aaa X„ X} ё Xk ё айа обе aaeoida e? Es (неравенство треугольника); 4. d(Xt, Xj) = 0 тогда и только тогда, когда Х{ = Xj (неразличимость тождественных объектов);

Значение d(X,, XJ для заданных Xt и Х называется расстоянием между Х{ и Х} и эквивалентно расстоянию между /, и 7,- соответственно выбранным атрибутам С= (С і, С2, ..., С J .

Меру близости (сходства) объектов удобно представить как обратную величину от расстояния между объектами. В многочисленных изданиях посвященных кластерному анализу описано более 50 различных способов вычисления расстояния между объектами. Кроме термина "расстояние" в литературе часто встречается и другой термин — "метрика", который подразумевает метод вычисления того или иного конкретного расстояния. Наиболее распространенный способ в случае количественных признаков является так называемое "евклидово расстояние" или "евклидова метрика": d(xi Xj) i {Xki- 9)2. v К — і Выражение (1) весьма напоминает так называемое обобщенное степенное расстояние Минковского [53], в котором в степенях вместо двойки используется другая величина. В общем случае эта величина обозначается символом "р". При р—2 мы получаем обычное евклидово расстояние. Выражение для обобщенной метрики Минковского имеет вид: d(X„Xj) = ( I

Используются также такие метрики, как манхэттенское расстояние (расстояние городских кварталов или city-block), метрика «доминирования» (Sup-метрика или супремум-норма). Метрика Минковского представляет собой большое семейство метрик, включающее и наиболее популярные метрики. Однако существуют методы вычисления расстояния между объектами, принципиально отличающиеся от метрик Минковского. Наиболее важное из них — так называемое расстояние Махаланобиса [118, стр. 301-310]. В работе [11]

Интеграция Системы с внешними базами данных

Основным требованием к интеграции СпБД с Системой является то, что перед разработкой интерфейсов взаимодействия эти БД должны быть загружены в БД Системы. Эта задача должна быть решена администратором баз данных. Поскольку в настоящее время БД реализована в Oracle, рассмотрим некоторые способы загрузки данных из различных баз данных в эту СУБД:

1) Если СпБД реализована в Oracle - в Oracle существует внутренний механизм экспорта и импорта схем данных. Т.е. достаточно сделать экспорт необходимых таблиц из существующей схемы, а затем сделать их импорт в схему данных Системы [99].

2) BDE (Borland Database Engine) и DBExpress компании Borland. С помощью этих механизмов можно, написав соответствующую программу перекодировки данных, осуществить загрузку данных в Oracle. В этих механизмах реализованы средства соединения с наиболее популярными СУБД, с помощью которых можно как выгружать данные, так и загружать их напрямую в БД.

3) Механизм ADO (ActiveX Data Objects) - доступ к данным осуществляется при помощи OLE DB (Object Linking and Embedding Data Base) и ODBC (Open Database Connectivity) [82].

4) Специальные драйверы для прямого доступа к источникам данных. Такие драйверы компании-разработчики СУБД создают для разработчиков приложений. Они отличаются от выше описанных способов соединения с БД более высокой скоростью соединения и надежностью, т.к. разработаны под определенную СУБД.

5) Перенос данных с помощью ПСИД, таких как Power Center от Informatica или DataStage от IBM. Эти средства позволяют извлекать данные из различных источников (включая XML и Excel файлы), очищать их и загружать в практически любую современную широко распространенную СУБД.

6) Если источник данных храниться в специфической БД, для которой не подходит ни один из вышеописанных способов соединения, загрузка данных из него представляется наиболее проблематичной. В этом случае необходимо реализовать выгрузку данных в текстовый файл механизмами этой БД. Из этого файла с помощью внутренней утилиты Oracle sqlloader можно загрузить данные в Систему. Эта утилита разработана для обеспечения загрузки данных в Oracle из текстовых файлов с р аз дел ителями.

После того, как СпБД загружена в Oracle, в Системе должен быть реализован интерфейс взаимодействия с этой базой. В зависимости от сложности базы интерфейс настраивается по-разному. Классифицируем условно все базы на одноранговые и многоранговые. Базы, которые состоят из одной или двух таблиц, в которых содержится вся необходимая информация, и связь между которыми прямая, будем называть одноранговыми. Многоранговыми будем называть базы, состоящие из нескольких взаимосвязанных таблиц, в которых находятся необходимые для анализа данные.

Опишем один из возможных методов взаимодействия Системы с СпБД, имеющими многоранговую структуру. Для подобных баз возможно частное, кастомизированное решение, заключающееся в жесткой фиксации структуры такой БД и интерфейса взаимодействия с нею в коде программы (бесшовная интеграция). Подобное решение требует больших временных затрат и знания структуры этой базы разработчиком. Интерфейс реализовывается для каждой базы отдельно и, соответственно, не является универсальным. Такое решение рационально только в том случае, когда для конкретной области применения Системы крайне необходимо иметь связь с какой-либо многоранговой БД этой области. В этом случае эта СпБД может быть не загружена во ВБД, что накладывает ряд ограничений на процесс взаимодействия с ней: - Если связь с этой СпБД может быть реализована в Oracle, то в этом случае сервер БД должен иметь постоянное сетевое соединение с СпБД. - Если связь с СпБД может быть реализована с помощью способов 2-4, описанных ранее, то в этом случае постоянное соединение с СпБД должна иметь клиентская станция.

Другим же способ взаимодействия с многоранговыми БД является использование ПСИД или сервисных шин. Используя эти средства, можно организовать бесшовную интеграцию с подобными БД. Преимуществом этого способа является его универсальность. Т.е. любое ПСИД или сервисную шину можно использовать с практически неограниченным количество многоранговых БД. В этих средствах реализованы механизмы автоматического взаимодействия со всеми современными распространенными БД, плоскими файлами и XML-файлами. Разработаны эргономичные интерфейсы для разработки спецификаций взаимодействия.

Интерфейс взаимодействия пользователя с Системой

После запуска на экране появится форма, представленная на рисунке 4.13. Эта форма состоит из верхнего и нижнего меню. В верхнем меню есть три пункта: «Файл», «Сервис» и «Справка».

В пункте «Файл» у пользователя есть возможность сохранить результаты работы и вывести их на принтер. В пункте «Сервис» есть возможность вызвать редакторы WinWord, Lexicon и Fine Reader. В пункте «Справка» вы можете узнать информацию о том, сколько оперативной памяти используется в текущий момент времени, сколько свободного пространства на вашем диске, сколько файлов открыто и т.п.

Первый пункт нижнего меню - «Выход» - выход из программы. «Запрос-ЕЯ» - это запрос на естественном языке. «Задачи» - перечень решаемых системой задач. «Каталоги» - здесь находятся каталоги всех найденных в документах объектов. «Настройки» — настройки на все режимы аналитики, ввод данных через анкеты, настройки администратора. «База знаний» — пункт для работы с БЗ.

Под нижним меню выдается информация об уровне доступа текущего пользователя и о количестве загруженных в БЗ документов.

Окно загрузки документов указано на рисунке 4.14. Для загрузки документов в БЗ надо зайти в пункт нижнего меню «База Знаний», выбрать пункт «Загрузка док-ов в БЗ», после этого появиться экран загрузки. В левом окне необходимо выбрать документ или набор документов, затем выбрать тип загружаемых документов (окно «тип документа»), затем нажать на кнопку «Добавить к списку». В окне «Список файлов для загрузки в БЗ» появится список выбранных документов с параметрами. После нажатия на кнопку

«Загрузка списка в БЗ» начнется загрузка списка в БЗ. Результатом удачной загрузки является правильное, без выдачи сообщений об ошибке, завершение загрузки и изменение индикатора загруженных документов.

Чтобы попасть в режим «Ввод данных через анкеты» пользователю необходимо выбрать пункт нижнего меню «Настройки», затем в появившемся меню выбрать пункт «Ввод данных через анкеты», затем «Ввод телефонных переговоров». После этого появиться меню из трех пунктов: «Ввод информации о владельце», «Ввод записей», «Сохранить в файл». На рисунке 4.15 представлено окно для ввода информации о владельце детализации телефонных переговоров.

Окно ввода записей детализации имеет примерно такой же вид. После ввода информации о владельце необходимо нажать клавишу «F2», на экран будет выдано сообщение: «Информация сохранена». Если выйти из этого окна, нажав «ESC», на экран выдается сообщение: «Информация не сохранена!!!». В этом случае пользователю надо заново войти в это окно и ввести эту информацию заново. После ввода всей необходимой информации, следует выбрать пункт «Сохранить в файл». После чего пользователю будет предложено ввести имя файла. Если выбранное имя уже существует, на экран будет выдано сообщение: «Такой файл уже существует! Введите другое имя». Следует ввести другое имя. На экране появится сообщение об удачном сохранении.

Чтобы попасть в режим «Настройки пользователя», где осуществляется настройки на все аналитические документы пользователю необходимо выбрать пункт нижнего меню «Настройки», затем в появившемся меню выбрать пункт «Пользователь», затем, поскольку мы рассматривает режимы, связанные со структурированной информацией, выбрать пункт «На детализацию телефонных переговоров», либо «На детализацию банковских счетов». Поскольку настройки на оба эти режима одинаковые, рассмотрим только настройки на режим «Детализация телефонных переговоров». На рисунке 4.16 представлено окно настроек на этот режим. После ввода всех настроек, следует нажать клавишу «F2», вам будет предложено сохранить настройки. Для сохранения изменений следует нажать кнопку «Запомнить». После этого вы вернетесь в предыдущее меню.

Похожие диссертации на Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей