Содержание к диссертации
Введение
Раздел 1. Анализ системы оперативного управления органами внутренних дел как объекта логико-лингвистического моделирования 14
1.1. Роль и место оперативного управления в системе управления органами внутренних дел 14
1.2. Методы и средства обеспечения эффективности функционирования системы оперативного управления органами внутренних дел 32
1.3. Анализ методов и моделей отбора релевантной информации в системах информационного обеспечения управления 37
1.4. Методы формирования словаря предметной области (тезауруса) на основе огико-лингвистического моделирования 49
Выводы по разделу 1: 67
Раздел 2. Теоретико-прикладные основы построения логико-лингвистической модели в системе оперативного управления органами внутренних дел и метода идентификации/аутентификации процессов, пользователей и устройств в метрике ортогональных преобразований 69
2.1. Разработка методики формирования словаря предметной области 69
2.2. Разработка методики формирования поискового образа документа на основе дескрипторного индексирования ключевых слов 91
2.3. Разработка методики формирования поискового образа запроса 100
2.4. Разработка методики поиска релевантных источников информации 105
2.5. Методика идентификации и аутентификации документов и их поисковых образов в ортогональном базисе 108
2.5.1.Структурная схема процесса вычисления функции свертки в ртогональном базисе с использованием модифицированного множества кусочно-постоянных ортогональных функций Уолша 111
2.6. Распознавание санкционированных пользователей в корпоративных сетевых структурах на основе ортогонального кодирования 117
Выводы по разделу 2: 126
Раздел 3. Экспериментальная оценка качественных показателей отбора релевантных источников в информационной системе оперативного управления 128
3.1. Индексирование терминов словаря-тезауруса оперативного управления 128
3.2.Индексирование документов 140
3.3.Индексирование запросов 144
3.4. Оценка результатов поиска 146
3.5. Экспериментальное моделирование процессов аутентификации исходных документов и их поисковых образов в ортогональном базисе 149
Выводы по разделу 3: 161
Заключение 162
Список сокращений 165
Список использованной литературы 167
- Анализ методов и моделей отбора релевантной информации в системах информационного обеспечения управления
- Методы формирования словаря предметной области (тезауруса) на основе огико-лингвистического моделирования
- Разработка методики формирования поискового образа документа на основе дескрипторного индексирования ключевых слов
- Экспериментальное моделирование процессов аутентификации исходных документов и их поисковых образов в ортогональном базисе
Анализ методов и моделей отбора релевантной информации в системах информационного обеспечения управления
Установление межфасетного взаимодействия приводит к организации эффективного управления приданными силами и средствами по реагированию на оперативную обстановку. Временной дефицит приводит, в свою очередь, к необходимости такой организации системы оперативного информационного обеспечения, при которой за минимальный временной интервал необходимо получить данные с достаточной степенью полноты и точности и малым информационным шумом для ввода в систему поддержки принятия решений и выработки ЛПР альтернативных вариантов поведения для управляемых подразделений и служб. Следовательно, на выработку рациональных вариантов управления необходимо обеспечить структуру ЛПР своевременной, полной и достоверной информацией. Эту задачу надо решать, учитывая как современные особенности управления, так и особенности его информационного обеспечения
Внутри любой организационной системы принято рассматривать управляющую систему - систему, реализующую функцию управления (в системе оперативного управления органами внутренних дел - начальник, его управленческий аппарат, штаб, дежурная часть, методы принятия управленческих решений) и управляемую систему - (функциональные подразделения, ресурсы, в том числе и кадровые, методы обработки информации).
Управленческая и исполнительская деятельность в организованных социальных структурах, к которым относятся органы внутренних дел, протекает циклически, с соответствующими фазами и стадиями.1
В основе выделения управленческого цикла лежит отображение процесса управления в виде последовательности действий, совершаемых субъектом управления для решения управленческой задачи, которое включает в себя как поиск и выбор адекватных решений, так и их непосредственную реализацию.
Классический подход цикла системы управления позволяет сформировать основные этапы оперативного управления как единой структуры взаимосвязанных элементов, объединенных единством цели. Такие этапы в отображении к системе оперативного управления ОВД могут быть агрегированы по следующим направлениям: Процедура сбора и обработки информации с целью оценки оперативной обстановки с учетом территориальной и функциональной направленности (Х ; Хфунк); Процедура оценки релевантных источников информации и на ее основе принятие альтернативных решений о наиболее целесообразных действиях вверенных сил и средств (Хоц; X ); Винер Н. Кибернетика, или Управление и связь в животном и машине. 2-е изд. М.,1968. С.160. 3. Отдача распоряжений, формирование и реализация управляющих команд по исполнению принятого решения (Хком); Контроль исполнения принятых управленческих решений и коррегирование управляющих воздействий в процессе управления силами и средствами ОВД по решению поставленных задач. Эффективность решения задач оперативного управления подразделениями и службами ОВД во многом определяется эффективностью функционирования механизма сбора и обработки информации. Этот этап является определяющим для формирования и реализации последующих трех этапов единого управленческого цикла. Разделение задач оперативного управления можно дифференцировать на одноэтапные или одношаговые задачи и задачи многошаговых процессов управления (Ходн ; Хмног ). Формирование независимых одношаговых задач оперативного управления ОВД практически невозможно из-за распределенности функциональной нагрузки и появления логически связей межфасетного и внутрифасетного взаимодействия. Поэтому целесообразно рассматривать процесс оперативного управления ОВД как многошаговый процесс, т.е. оценка оперативной ситуации и формирование управляющих воздействий должны проводиться, сообразуясь с изменениями оперативной обстановки и ситуации, ориентировать систему оперативного управления ОВД на структуру с непрерывными динамическими процессами управления. Эффективность системы управления во многом зависит от надежного функционирования системы информационного обеспечения. Недостаточная полнота и достоверность поступающей информации не устраняет ЛПР от необходимости выработки управляющих воздействий, в связи с чем возникает целый комплекс задач управления по принятию решений в условиях неопределенности. Следовательно, весьма важным фактором в контуре оперативного управления является уменьшение или устранение такой неопределенности за счет обеспечения соответствующей полноты и точности информации об объектах оперативного интереса, т.е. от эффективности информационного обеспечения процесса управления. Таким образом, система оперативного управления органами внутренних дел может быть представлена в виде следующего функционала: Фсоу{(Фі,Ф2,-Фі);ХТер Дфунк; Х0Ц,Хальт; Хк; Хкрг,УП0СТ; Гпер,Г0Сн; Пел; Пдм} (1.1.1) где Упост - постоянные управляющие воздействия; Гпер, - переменные воздействия (по обстановке); Госн - основные методы (способы) воздействия; Гвсп - дополнительные (вспомогательные) методы; адм – административные методы управления. С позиций выбранной нами для исследования методологии системного анализа информацию, используемую при управлении органами внутренних дел, будем рассматривать в единстве кибернетического и социального аспектов.
В теории управления существует множество моделей управленческого цикла, их трактовка теоретиками не всегда однозначна. Одни авторы рассматривают управленческий цикл, подробно детализируя его этапы, другие предлагают рассматривать этапы управления интегрировано, объединяя несколько функций управления на одном этапе. Большинство авторов при построении модели управленческого цикла выделяют цикл руководителя (непосредственно управленческий цикл) и цикл исполнителей (исполнительский цикл).
Методы формирования словаря предметной области (тезауруса) на основе огико-лингвистического моделирования
В процессе автоматического индексирования ключевые слова формализованного запроса сначала проверяются на вхождение в предметный тезаурус (поиск «вниз»), а термины тезауруса проверяются на вхождение в совокупность ключевых слов запроса (поиск «вверх»). В последнем случае требуется полное совпадение терминов тезауруса и ключевых слов запроса, При поиске «вниз» такого совпадения не требуется. Такое правило поиска введено в связи с тем, что включение в поисковый образ запроса более узких по смыслу терминов, ассоциированных с исходными, приводит к увеличению полноты поиска при незначительном повышении уровня «шума».
Термины, найденные в результате поиска по тезаурусу «вниз» и «вверх», заменяются соответствующими кодами словаря-тезауруса, объединяются в группы по числу исходных ключевых слов или по числу их групп, соединенных знаком дизъюнкции.
Идеальным случаем замены исходных понятий на понятия тезауруса является эквивалентная замена. Если она невозможна, то необходимо стремиться к замене исходных понятий на наиболее узкие понятия из числа родовых или ассоциированных. В случае замены исходных понятий на понятия, более широкие по объему, происходит обобщение информации. Это явление нежелательное, т.к. оно приводит к увеличению информационного шума при отборе релевантных документов.
Для выявления среди найденных понятий наиболее узких по смыслу используется тезаурус. Также можно для этой цели применить процедуру, заключающуюся в том, чтобы например, заменять каждую лексему запроса только такими терминами из тезауруса, которые содержат в своем составе максимальное количество слов. Известно, что словосочетания, имеющие большую длину, выражают более узкие по объему понятия.
Рассмотрим подробнее процесс индексирования запроса специалистом-индексатором.
При поступлении в ИПС пользовательского запроса, вводимые понятия проходят процесс нормализации, результатом которого является образование лексем и приведение их к каноническому виду. Затем каждая лексема анализируется на вхождение в тезаурус, т.е. сопоставляется с единицами тезауруса - терминами, представляющими группы условной эквивалентности. Результатом такого сопоставления является замена ключевых слов запроса соответствующими номерами дескрипторов тезауруса. При этом вводится следующее условие ограничения: любой лексеме запроса всегда найдется соответствие в виде дескриптора тезауруса данной предметной области, так как термины словаря в полной мере описывают строго детерминированную предметную область. В случае отсутствия искомого понятия среди терминов словаря, оно может быть либо заменено на родственное, значение которого присутствует в тезаурусе, либо внесено в словарь-тезаурус, в соответствии с алгоритмом его актуализации.
Таким образом, получается тезаурусная проекция запроса или поисковый образ запроса (ПОЗ).
POZ - формализованное представление / - го запроса в поисковой системе (ПОЗ), в виде кортежа, элементами которого являются номера (коды) дескрипторов тезауруса поисковой системы;
Поисковый образ запроса POZ представляет множество, элементы которого выстроены в виде кортежа, являются кодами дескрипторов словаря, соединенных между собой знаками булевых операций. Количество элементов ПОЗ Nt определяется возможностями информационно-поискового языка системы -тезауруса.
В рассматриваемом исследовании запросы на поиск информации являются формализованными. Целью формализации поисковых запросов является не только их представление в виде последовательностей наименований понятий (именных словосочетаний или отдельных слов), но и в указании логических связей между понятиями и между группами понятий (конъюнктивных и дизъюнктивных связей).
Дескрипторы словаря являются единицами информационного языка (ИПЯ) и порождают двуместные смысловые отношения. Каждый дескриптор представляет собой одно слово или группу терминов естественного языка (ЕЯ) и описывается семантическими признаками, частично упорядоченными отношениями включения. Смысловые отношения могут устанавливаться на множестве дескрипторов и их логико-семантических взаимосвязей. Любое высказывание ЕЯ переводится на ИПЯ в виде
В булевой модели поиска в поисковом образе запроса эти отношения, прежде всего, выражены как булевы, позволяя выразить пользовательский запрос, введенный на естественном языке, в виде совокупности кодов дескрипторов, соединенных знаками булевых функций. Приведем иллюстрацию данного утверждения.
Семантически это означает, что релевантными документами в информационном массиве будут считаться документы, поисковые образы которых находятся в логическом взаимосочетании с поисковыми образами запроса по следующей булевой зависимости: результат операции пересечения множеств документов, содержащих дескрипторы &хіл. d2ud3 — (d-іЛ d2 Л d3), операции пересечения множеств документов, содержащих дескрипторы d4n d5 и исключением множества документов, содержащих дескриптор d6 — (d4 Л d5 Л d6 ), и объединения результатов полученных пересечений.
Необходимо подробнее рассмотреть вопрос об использовании родовидовых связей при индексировании. Если какое-либо понятие, описываемое в документе, заменяется родовым дескриптором, то очевидно, что данный факт значительно расширяет при проведении процедуры поиска область, к которой можно отнести данный документ. В этом есть и преимущества и недостатки одновременно. Если целью поиска является отбор всех документов, касающихся определенной темы, то факт включения родового дескриптора в поисковый образ документа расширяет сферу поиска. Однако это может привести к появлению «информационного шума» при выдаче, так как находится большое количество документов, имеющих лишь косвенное отношение к информационному запросу пользователя. Если целью поиска является снижение информационного шума, то необходимо включать в поисковый образ запроса видовые дескрипторы.
Разработка методики формирования поискового образа документа на основе дескрипторного индексирования ключевых слов
Практическая реализация процесса аутентификации электронных документов и сообщений на основе ортогональных преобразований при вычислении их хэш-значений подтвердила достоверность выдвинутых предположений и показала практическую работоспособность системы аутентификации электронных документов на основе модифицированного множества кусочно-постоянных ортогональных функций Уолша. Функциональные возможности разработанной системы позволили проводить идентификацию санкционированных пользователей в единой корпоративной информационной системе, что исключает несанкционированное взаимодействие незарегистрированных пользователей.
Диссертационное исследование направлено на совершенствование обеспечивающей составляющей управления социальными и экономическими процессами, в частности, на совершенствование функционирования информационной инфраструктуры оперативного управления органами внутренних дел на основе логико-лингвистического моделирования, идентификации/аутентификации процессов, пользователей и устройств единого информационного контура. С учетом задач диссертационной работы, е основными результатами являются:
Проанализирована структура системы управления органами внутренних дел Российской Федерации, в том числе система оперативного управления, в которой определены основные действующие информационные потоки и команды управления; выявлен специализированный лингвистический базис оперативного управления органами внутренних дел, составляющий его понятийно-терминологический аппарат.
На основе проведенного логико-семантического анализа лингвистического базиса предметной области с использованием программного обеспечения, свободно распространяемого в сети Интернет, выявлены устойчивые семантические связи между отдельными понятиями, определен состав, структура, объем словаря-тезауруса оперативного управления, позволяющий определить объем текстового материала для его формирования;
Проведена классификация лексических единиц специальной предметной области, выявлены группы условной эквивалентности терминов, определены дескрипторы, сформирован тезаурус оперативного управления органами внутренних дел;
Разработана методика формирования системы информационно-лингвистического обеспечения как системы с развитой структурой базисных отношений в виде прикладного тезауруса, являющегося формализованным представлением предметной области оперативного управления органами внутренних дел, позволяющая формировать и поддерживать тезаурус оперативного управления в актуальном состоянии;
Разработана математическая модель отбора релевантных информационных источников в автоматизированной информационной системе оперативного управления органов внутренних дел с использованием базисного опорного словаря (тезауруса) на основе методов инверсной реализации и логико лингвистического моделирования;
Проведены эксперименты, исследующие эффективность поиска с использованием контроля по словарю-тезаурусу, произведена количественная оценка результатов поиска, позволяющая обосновать необходимость совершенствования информационного обеспечения системы оперативного управления органами внутренних дел на основе методов логико-лингвистического моделирования.
Разработана методика аутентификации электронных документов с использованием модифицированного множества кусочно-постоянных ортогональных функций Уолша, на основе которой выработаны предложения по идентификации санкционированных пользователей в системе электронного документооборота контура оперативного управления органами внутренних дел. Достижение поставленной цели и решение соответствующих задач позволило создать эффективный инструментарий для совершенствования информационного обеспечения оперативного управления. Дальнейшее использование полученных результатов возможно как в практической деятельности по созданию автоматизированных информационно-поисковых систем и систем поддержки принятия управленческих решений для органов внутренних дел России и иных социально-экономических структур в силу универсальности разработанных методик логико-лингвистического обеспечения информационных процессов, так и в рамках теоретических исследований соответствующей направленности.
Экспериментальное моделирование процессов аутентификации исходных документов и их поисковых образов в ортогональном базисе
В соответствии с методикой, представленной в разделе 2.6., автором разработана модель аутентификации электронных документов и их поисковых образов, реализованная на высокоуровневом языке программирования Delphi-7, условно названной OrPr_new. Процесс такой аутентификации в предложенной системе представлен следующим образом:
В приведенной таблице ключа преобразования каждая строка отображает закрепление ортогональных функций за элементами дискретного семантического символа, например, первый символ первой строки означает, что за первым разрядом первого семантического символа закреплена ортогональная функция Y2, за вторым разрядом первого семантического символа – функция Y16, за третьим разрядом первого семантического символа – функция Y30 и т.д. до восьмого разряда (последний разряд первого семантического символа).
Вторая строка аналогичным образом отображает закрепление ортогональных функций за разрядами второго семантического символа исходного сообщения. В данном примере приведена таблица закрепления ортогональных функций одновременно за семью семантическими символами. В результате такого процесса будет сформирован сумматором ортогональных преобразований сложный составной многоуровневый сигнал, форма которого одновременно отображает семь семантических символов естественного алфавита.
Указанная таблица представляет закрепление кодовых комбинаций за отдельными уровнями суммарного сложного составного ортогонального сигнала, отображающего одновременно семь семантических символов естественного алфавита. Такое закрепление производится в соответствии с ключом псевдоаналогового преобразования суммарного ортогонального сигнала в двоичный код.
Активизацией исполняемого файла OrPr_new_exe открывается окно системы для вычисления хэш-значений исходного сообщения М. Исходный текст вводится в окно системы для вычисления функции хэширования, системой производится вычисление хэш-значения текста, результат которого отображается в нижнем окне. Это хэш-значение сохраняется в специальной папке «Хэш-значения» (см. рисунок 3.5.1).
Для аутентификации электронного документа исходный текст документа вводится в верхнее окно системы, в нижнее окно вводится его вычисленное хэш-значение из ранее сформированной папки «Хэш-значения».
В случае если электронный документ не был модифицирован, в нижней части системного интерфейса появляется сообщение: «Текст не был изменн» (рисунок 3.5.2).
Хэш-значение модифицированного документа – Федерального закона Российской Федерации от 27.07.2006г. №149-ФЗ «Об информации, информационных технологиях и о защите информации». Сравнительный анализ хэш-значений исходного и модифицированного документов показал значительное отличие их образов в виде функций свертки, что позволило сделать вывод о чувствительности хэш-значения исходного документа к различного рода модификациям. Кроме того, по вычисленным значениям функции свертки восстановление исходного сообщения является вычислительно неразрешимой задачей, исключается возможность подбора двух разных сообщений, имеющих одинаковые функции свертки.
Таким образом, сформированные хэш-значения исходных сообщений и документов в ортогональном базисе являются их однозначными образами, что исключает возможность несанкционированной модификации.
С помощью данной системы в метрике ортогональных преобразований производится идентификация санкционированных пользователей корпоративной информационной системы по методике, изложенной во втором разделе диссертационного исследования. Такое преобразование включено в функциональные возможности разработанной системы, т.к. по вводимым ключам, кроме вычисления хэш-значений производится кодирование и декодирование исходных электронных документов и сообщений.
Процесс идентификация санкционированных абонентов, процессов и устройств в открытых сетевых технологиях органов внутренних дел в метрике ортогональных преобразований можно представить следующим образом:
1. Изначально случайным образом формируется ключ закрепления ортогональных сигналов за разрядами идентифицируемого сообщения, согласно методике, представленной в разделе 2.6. По этой же методике этот ключ по специальным каналам или на основе трехпроходного метода Шамира через удостоверяющий центр передается парному абоненту связи.
2. Абонент-инициатор процесса идентификации (абонент А) формирует случайное сообщение М, например: «Провести идентификацию абонента А в метрике ортогональных преобразований». Далее, производит шифрование исходного сообщения на парном ключе шифрования КАВ . В результате формируется криптограмма исходного сообщения М - САВ, как показано на рисунке 3.5.4: