Введение к работе
Актуальность темы. Современные информационные технологии воплощаются в виде разнообразных информационно-коммуникационных систем (ИКС), которые можно определить как взаимосвязанную совокупность информационных ресурсов, математических алгоритмов, программных и технических средств, процессов и технологий, собирающих, преобразующих, распространяющих и отображающих информацию, необходимую для принятия управленческих решений в конкретных проблемных областях. Типичными примерами крупномасштабных ИКС, обладающих указанными свойствами, являются Государственные автоматизированные системы Российской Федерации «Выборы» и «Правосудие».
Неотъемлемой составной частью современных и перспективных ИКС этого типа являются интеллектуальные базы знаний. Однако существует реальное противоречие между потребностью внедрения и использования баз знаний в составе ИКС и несовершенством технологий их создания. При этом главная причина существования этого противоречия состоит в том, что в рамках традиционной технологии для представления знаний используются два типа языков: естественный язык, которым оперирует конечный пользователь и математико-программный язык, который используют разработчики баз знаний. Если исключить из рассмотрения многочисленные подробности «технического» плана, то смысл и сущность традиционной технологии заключается в непосредственном переводе описаний предметной области с естественного языка на математико-программный язык, «понятный» компьютеру. А такой перевод фактически ограничивает экспертов -специалистов в конкретной области при процессе проектирования баз знаний. Ограниченность используемых языковых средств обусловливает все те трудности, которые приходится преодолевать разработчикам проектов по созданию баз знаний.
В современной теории искусственного интеллекта происходит интенсивное развитие новых языковых средств, в частности реляционного и ролевого типов. Эти языки позволяют записывать и генерировать правила логического вывода, создавать управляющие структуры, оперировать с процедурными знаниями. Их
использование открывает возможности по описанию фактов и закономерностей предметной области, позволяет разработать современную технологию поддержки проектных решений по созданию баз знаний.
Цель диссертационного исследования заключается в повышении качества разработки и поддержки проектных решений по созданию баз знаний в составе крупномасштабных ИКС за счет разработанных алгоритмов и методов интеллектуальной поддержки и их практической реализации применительно к проекту ГАС РФ «Правосудие». Таким образом, объектом исследования является процесс создания базы знаний (БЗ), предметом - методы, обеспечивающие поддержку при управлении этим процессом. Задачи исследования:
исследование принципов организации общения между пользователем и базой знаний, выбор концептуальной модели машинного понимания входных текстов;
анализ существующих и перспективных языков и методов представления знаний при выборе проектных решений по созданию баз знаний;
разработка общего и частных алгоритмов интеллектуальной поддержки проектных решений по созданию баз знаний на основе логико-лингвистического подхода;
определение критериев оценки качества баз знаний и выбор методов оценки качества проектных решений по созданию баз знаний;
реализация теоретических положений применительно к поддержке проектных решений при создании базы знаний для подсистемы Банк судебных решений (судебной практики) в составе ГАС РФ «Правосудие».
Методологическую базу исследования составляют положения теории системного анализа, искусственного интеллекта, а также методы логико-лингвистического моделирования и экспертных оценок.
Научная новизна. В диссертации получены следующие результаты, обладающие научной новизной:
- предложена концептуальная модель машинного понимания
входных текстов, направленная на активный поиск в тексте
ключевых объектов, стимулирующих базу знаний к реакции, в
отличие от традиционной ненаправленной лингвистической обработки текстовых предложений, ориентированной на пассивную регистрацию того, «что есть в предложении»;
исследованы языковые средства с учетом особенностей крупномасштабных ИКС систем. Рекомендован перечень языковых средств для представления знаний о предметной области при реализации баз знаний в составе ИКС;
разработаны алгоритмы интеллектуальной поддержки решений по созданию баз знаний, которые позволяют формализовать знания о предметной области с использованием методов задания единиц знаний;
решена проблема оценки качества проектных решений по созданию баз знаний путем комплексной оценки базы знаний по показателям качества, учитывающим социальную, функциональную, эргономическую, прагматическую, техническую и технологическую составляющие.
На защиту выносятся:
концептуальная модель машинного понимания входных текстов, ориентированная на активный поиск во входном тексте ключевых объектов базы знаний;
алгоритмы интеллектуальной поддержки решений по созданию баз знаний, в том числе:
общий алгоритм поддержки проектных решений по созданию базы знаний в составе ИКС;
алгоритм представления знаний с помощью ролевых фреймов;
алгоритм представления знаний с помощью концептуальной и терминальной семантических сетей;
алгоритм построения процедурного компонента базы знаний;
система критериев и комплексная оценка качества базы знаний с использованием методов интегральной свертки;
технические решения по созданию базы знаний в проекте ГАС РФ «Правосудие».
Достоверность выводов и положений диссертационной работы определяется комплексным подходом к постановке задач исследования, а также подтверждается положительными
результатами практического применения разработанных методов и алгоритмов.
Практическая значимость работы. Разработанные и реализованные алгоритмы интеллектуальной поддержки решений по созданию баз знаний целесообразно использовать при решении проблем для интеллектуальных экспертных систем социально-экономического профиля. Кроме того материалы диссертации могут быть использованы магистрантами ВУЗов в учебном процессе для выполнения курсовых и магистерских диссертаций.
Результаты внедрения. Методы, алгоритмы, выводы и положения, обоснованные в диссертации использованы во ФГУП НИИ «Восход» при проведении плановых научно-исследовательских и опытно-конструкторских работ по созданию БЗ подсистемы «Банк судебных решений» ГАС РФ «Правосудие». При рассмотрении и оценке основных мероприятий по подготовке технических заданий на развитие ГАС РФ «Правосудие» подход, основанный на совместном использовании идей логико-лингвистического моделирования и методов экспертных оценок, позволил повысить обоснованность параметров проекта и более точно оценить затраты на проведение работ в Судебном департаменте при Верховном Суде Российской Федерации, что подтверждено соответствующим актом.
Апробация работы. Материалы диссертации докладывались и обсуждались на выездном заседании совета судей (Астрахань, 2009); первой Всероссийской научно-технической конференции «Системы организационного поведения» (Воронеж, 2009); межрегиональной научно-технической конференции «Модели и алгоритмы интеллектуальной поддержки решений при управлении проектами» (Москва, 2009); межрегиональной научно-технической конференции «Проблемы управления в социальных и экономических системах» (Москва, 2010); Всероссийской научно-технической конференции «Управление в системах организационного поведения» (Москва, 2010); научно-практической конференции «Современные информационные технологии в управлении и образовании» (Москва, 2011); научно-практической конференции «Электронное законодательство: доступ к нормативно-правовой информации в электронной среде» (Санкт-Петербург, 2011); заседании научно-технического совета ФГУП НИИ «Восход» (Москва, 2012).
Публикации. Результаты диссертационного исследования опубликованы в 16 печатных работах, в том числе 2 работы в издании, включенном в перечень ВАК РФ и в одной монографии. В работах, написанных в соавторстве, лично соискателю принадлежат: в [1,8] - состав и алгоритм функционирования модели, в [5] - языки представления знаний, в [4,7] - схема и содержание этапов алгоритмов, в [10] - математические алгоритмы оптимизации, в [11] -алгоритмическая реализации базы знаний, в [14] - критерии и методы оценки проектных решений, в [12] - алгоритм обезличивания и публикации текстов, в том числе алгоритм обезличивания подтвержден патентом № 119485 от 03.05.2012.
Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, заключения и списка литературы из 65 наименований. Материал диссертации изложен на 122 страницах машинописного текста, включая 39 иллюстраций и 9 таблиц.