Введение к работе
Актуальность работы. Для современных информационно-управляющих систем (ИУС) характерен значительный рост объемов многоязычной (мультилингвистической) информации, хранящейся в банках данных предприятий и корпораций В мультинациональных корпорациях требуется своевременное предоставление управленческому персоналу документов, принадлежащих различным языковым множествам, в процессе подготовки и принятия решения Значительно возрастают требования к оперативности и качеству функционирования систем поиска мультилингвитсической информации, используемых лицом, принимающим решения (ЛПР) в различных экономических и производственных ситуациях
Известно, что в процессе управления дискретными техническими и человеко-машинными системами предприятия часто возникает необходимость найти и предоставить ЛПР все хранимые документы и данные (в общем случае, подготовленные и выполненные на разных языках), имеющие отношение к сложившейся производственной ситуации, предварительно упорядочив их по степени важности выдаваемой информации
Предлагаемые ранее методы решения поставленных задач зачастую оказываются недостаточно эффективными, так как, во-первых, не позволяют осуществить поиск и сортировку больших объемов разнородной информации, характеризующей сложившиеся производственные ситуации, во-вторых, не обеспечивают возможность мультилингвистического поиска данных для подготовки и принятия решения в ИУС
Указанное обстоятельство требует разработки новых эффективных моделей и алгоритмов поиска мультилингвистической информации, используемой при реализации поддержки принятия решений в ИУС современных предприятий и корпораций - корпоративных ИУС (КИУС) Это обусловливает актуальность, экономическую целесообразность и практическую значимость данного исследования
Необходимо разработать модельно-алгоритмическое обеспечение систем мультилингвистического поиска данных в ИУС, позволяющее на ограниченном интервале времени, отведенном на принятие решения, определить данные и документы, которыми в возникшей ситуации должен руководствоваться ЛПР При этом данные и документы должны быть упорядочены по степени важности предоставляемой информации Как правило, с этой целью используются такие характеристики, как ранг документа и данного, характеризующий степень важности их информационного содержания, и количество данных и документов, используемых в конкретной производственной ситуации
В работе основное внимание уделено разработке новых математических моделей и алгоритмов реализации мультилингвистического поиска данных о ситуациях, возникающих в ИУС, и требующих подготовки и принятия решения в режиме реальных временных ограничений
Объектом диссертационного исследования являются процессы подготовки и принятия решения в информационно-управляющих системах
Предмет исследований - модели и алгоритмы поиска мультилингвистической информации, используемой при реализации поддержки принятия решений в ИУС современных предприятий и корпораций.
Цель диссертационного исследования состоит в повышении эффективности поиска мультилингвистической информации для поддержки принятия решений в корпоративных информационно-управляющих системах.
Поставленная цель достигается путем решения следующих задач.
выявления специфики формирования и функционирования мультилингвистических поисковых систем, анализа существующих подходов к организации подготовки и принятия решения в ИУС,
моделирования запросов ЛПР с учетом его информационных потребностей в конкретных производственных ситуациях, возникающих в системе,
разработки алгоритма непрерывной корректировки модели ЛПР в рамках мультилингвистической технологии поиска данных и документов с учетом новых информационных запросов ЛПР и характеристик производственных ситуаций,
модификации существующих алгоритмов мультилингвистического поиска данных и документов в ИУС, разработки новых методик, обеспечивающих заданный уровень релевантности электронных документов ИУС требуемой производственной ситуации,
разработки алгоритма ранжирования и определения уровня релевантности электронных документов в ИУС требуемой производственной ситуации, использующего мультилингвистический информационно-терминологический базис
реализации разработанных моделей и алгоритмов в реальных проектах систем поддержки принятия решений в ИУС
Методы исследования. Основные теоретические и прикладные результаты работы получены на основе методологии системного анализа, статистических методов обработки данных, информационных и коммуникационных технологий и методов прикладной математики
Научная новизна работы.
Разработан новый алгоритм формирования и непрерывной корректировки параметров модели ЛПР на основе методологии вероятностного латентно-семантического анализа, позволяющий учесть семантическую близость терминологического состава последовательных запросов ЛПР при реализации поддержки принятия решений в ИУС современных предприятий и корпораций
Разработана новая модель мультилингвистического поиска данных для подготовки и принятия решения в КИУС, отличающаяся от известных процедурами формирования запросов и обработкой Отклика, которая базируется на узкоспециализированных многоязычных частотных словарях
Предложена оригинальная методика обеспечения заданного уровня релевантности электронных документов ИУС требуемой производственной ситуации, использующая мультилингвистический информационно-терминологический базис
Разработан новый алгоритм ранжирования данных и документов в ИУС, позволивший реализовать мультилингвистическую метапоисковую технологию для подготовки и принятия решения в ИУС корпоративного типа
Значение для теории. Результаты, полученные при выполнении диссертационной работы, имеют существенное значение для развития моделей и методов поиска и обработки мультилингвистической информации при управлении сложными информационно-управляющими системами производственного назначения
Практическая ценность. Разработанный в диссертации подход к моделированию информационных запросов лица, принимающего решение, позволяет учесть его информационные потребности в конкретной производственной ситуации, поскольку основной задачей управляющего персонала КИУС является поиск необходимой информации для принятия решения Это создает основу для разработки методов и алгоритмов формирования персонализированных программно-информационных сред взаимодействия ЛПР с распределенными информационными ресурсами системы управления
Разработанные в диссертации модели могут использоваться для повышения эффективности процессов подготовки и принятия решения в корпоративных информационно-управляющих системах
Мультилингвистическая технология поиска данных позволяет эффективно решать практические задачи интерактивного формирования многоязычных информационных ресурсов
Достоверность полученных результатов подтверждается корректным использованием методологии системного анализа и методов поиска и обработки информации при обосновании полученных результатов, выводов,
рекомендаций, а также успешной апробацией и демонстрацией возможностей разработанной системы при проведении экспериментов на базе информационно-управляющей среды в ФГУП ЦКБ «Геофизика»
Реализация результатов работы.
Диссертационная работа выполнялась в рамках проекта РНП 2 2 2 3.9676 «Модельно-алгоритмическое обеспечение мультилингвистической технологии интерактивного формирования многоязычных информационных ресурсов» аналитической ведомственной целевой программы "Развитие научного потенциала высшей школы (2006-2008 годы)".
Полученные в диссертационной работе результаты внедрены в учебный процесс Политехнического института ФГОУ ВПО «Сибирский федеральный университет»
На основе моделей и математических методов была разработана программная система «Multi-Lmgvo ver 10», предназначенная для мультилингвистического анализа информационно-терминологического базиса в области системного анализа Программная система прошла экспертизу и зарегистрирована в Отраслевом фонде алгоритмов и программ (ОФАП), что делает ее доступной широкому кругу специалистов по системному анализу и специалистов, занимающихся техническим переводом и занимающихся формированием тематических коллекций для информационного обеспечения корпоративных информационно-управляющих систем
Апробация работы. Основные положения и результаты работы прошли
апробацию на 47-49-й научно-технических конференциях преподавателей,
аспирантов и студентов Красноярского государственного технического
университета (2005-2007), на Пленарном заседании Второй Всероссийской
конференции «Молодежь и наука начало 21-го века», посвященной 50-летию
КГТУ (2006), на VI-й Всероссийской научно-практической конференции
«Инновационные недра Кузбасса 1Т-технологии» (2007), на IV-m
Международном технологическом конгрессе «ВТТВ-Омск» (2007), на
ежегодной заочной конференции РАЕН «Современные
телекоммуникационные и информационные технологии» (2006) Диссертационная работа в целом обсуждалась на научных семинарах Красноярского государственного технического университета, НИИ Систем управления, волновых процессов и технологий (2005-2007 гг)
Публикации. По материалам диссертации опубликовано 10 работ (в тома числе, одна работа - в издании по списку ВАК РФ), из них 3 без соавторов Полный список публикаций представлен в конце автореферата
Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения, списка литературы из 93 наименований