Введение к работе
Актуальность проблемы.
Построение модели предметной области имеет своей целью решение практически важных задач: управления, поддержки принятия решений и т.д. Конкретизация целевой задачи неизбежно приводит к необходимости различной глубины формализации предметной области, т.е. приближению в модели к адекватному отображению реальных отношений, их свойств, состояний и проявлений. Эта проблема значительно осложняется, когда речь идет о предметной области, плохо или мало поддающейся формализации. Кроме того, следует учесть несовпадение вербальных сообщений эксперта предметной области с его профессиональной интеллектуальной активностью.
К классу предметных областей, трудно формализуемых, следует отнести образование, представляющее стратегический ресурс любой страны и поэтому требующее постоянного мониторинга, принятия решений с целью эффективного управления. В дальнейшем будем именовать предметную область образования объектом исследования. Для него в настоящее время отсутствуют надёжные методы анализа данных оперативного моЕШторинга. Класс таких объектов характеризуется:
-
Невозможностью организации активного эксперимента с целью создания математической модели;
-
Большим числом параметров (как внутренних, так и внешних - межотраслевых, социальных и пр.), влияющих на качество образовательного процесса;
-
«Дрейфом» во времени отдельных параметров, переводящих объект в класс динамических нестационарных, поэтому усложняющих выбор стратегий управления;
-
Отсутствием обоснований для выбора парам;тров в кместве значимых;
-
Отсутствием точных данных о взаимосвязях между параметрами и их влиянии на качество наблюдаемых процессов.
В таких условиях построение модели с использованием аналитических методов невозможно. Поэтому мы приходим к необходимости применения подходов, базирующихся на знаниях о предметной области. Адекватность модели теперь будет зависеть от привлечения новых знаний, их аксиоматического, формального описания, логических отношений и т.д., образующих теорию. Очевидно, этому этапу должен предшествовать этап извлечения, приобретения знаний.
Таким образом, формируется триада: приобретение знаний (data mining), представление знаний и обработка знаний. Настоящая диссертациоішая работа посвящена разработке средств, реализующих два этапа: извлечение знаний и построение некоторой модели пред-
4 метной области (объекта) и создание прикладной системы, сочетающей средства автоматизации построения статистических моделей и некоторые черты экспертное, способствующей принятию решений на основе анализа моделей.
Лишь сравнительно недавно интеллектуальный анализ данных с целью извлечения знаний (Data Mining) стал мультидисциплинарным научным направлением, возникшим и развивающимся на базе достижений прикладЕюй статистики, методов искусственного интеллекта, теории баз данных (Holshcimer М., siebes А.Р 1996)'. Традиционная математическая статистика, долгое время претендовавшая на роль основного инструмента анализа данных, перестала удовлетворять требованиям содержательности результатов обработки в условиях неограниченных объемов информации, сложнейших скрытых причинно-следственных отношений между отдельными содержательными ее компонентами. Методы математической статистики оказались полезными, в основном, для проверки заранее сформулированных гипотез и первичного анализа, составляющего основу оперативной аналитической обработки данных (Online Analitica] Processing - OLAP).
В качестве примеров успешного применения методов интеллектуального анализа к проблемам из различных предметных областей служат работы: прогнозирования фьючерсных котировок (Богданов К.С, 2001 )2, оперативного мониторинга атомных станций' (Ерома А.А., 2004)3, в телекоммуникационных сетях (Manila Н.,2002) .
В связи с этим актуальной является задача разработки программной системы многоаспектного анализа и обработки данных с целью построения модели прогноза оценки состояния образовательного потенциала России. Полученные результаты прогноза необходимы для принятия управленческих и организационных решений. Эта тема затрагивает также проблемы профаммы модернизации системы образования, утвержденной правительством РФ на период 2007-2010 годы.
Цели и задачи исследования.
Целью работы является совершенствование методов анализа и программных инструментальных средств, расширяющих интеллектуальные возможности систем поддержки принятия решений в сложных плохо формализуемых системах.
1 Holsheimer М., Siebes А.Р. Data Mining: the search for knowledge in databases. //Report CS-R9406, Computer Science. Department of Algorithmic and Architecture, CWI, 1996.
* Богданов К.С. Интеллектуальная система программирования дія представления знаний и принятия решений. Диссертация на соискание ученой степени кандидата наук., -М,: 2001
" Ерома А.А. Средства интеллектуального анализа структуры связей по данным мониторинга сложных технологических объектов Диссертация на соискание ученой степени кандидата наук., -М.: 2004. 4 Manila И. Local and Global Methods in Data Mining: Basic Techniques and Open problems.,'/ 1CALP 2002, 29-th Int. Colloquium on Automata? Languages and Programming. Malaga, Spain. July 2002
5 Для достижения указанной цели в работе решаются следующие задачи:
-
Создание прогностических моделей оценки состояния образовательного потенциала России как на федеральном, так и на региональном уровнях.
-
На основе полученных моделей разработать теоретические положения для конструирования правил логического вывода.
-
Создание программного комплекса автоматизации формирования прогностических оценок и принятия решений.
-
Разработка методов и программных средств создания базы знаний и средств ее управления.
Научная новизна исследования
-
Применение для прогнозирования независимых от статистических характеристик методов настройки нейронных сетей, является более предпочтительным и обосновывают новизну в анализе данных
-
На основе экспертных знаний предложена методика построения правил вывода принимаемых решений.
-
Система принятия решений основана на нечетких методах. Построенные на базе нечеткой лотке системы принятия решений дают обоснованные и практически применимые советующие решения.
-
В целях построения базы знаний и интеграции ее с пассивной базой данных предложен метод, на основе которого решается проблема классификации данных и формирования правил вывода.
Методы исследований, примененные в диссертационной работе, опираются на теоретические и методологические основы статистики, теории машинного обучения, теории баз данных и методы интеллектуального анализа данных.
Практическая значимость результатов исследования и их внедрение в практику Практическая значимость работы заключается в создании программного инструментального средства, предназначенного для принятия решений и базирующегося на предложенных алгоритмах логического вывода на основе системы правил, сформированных в условиях не полностью определенной информации.
Программное инструментальное средство применено для решения задач прогноза процессов, определяющих состояние системы образования, формирования правил на основе нечетких рассуждений и вывода советующих решений с заданной степенью достоверности.
Полученные результаты являются инструментом для принятия решений федеральными и региональными органами управления образованием.
Программная система внедрена в практику оперативного управления и планирования в Центре по формированию и конкурсному размещению государственного задания на подготовку специалистов с высшим профессиональным образованием при Московском Государственном Университете Приборостроения и Информатики и в Научно-Исследовательском Институте Высшего Образования при выполнении проекта.
Апробация работы
Основные результаты диссертационной работы докладывались на конференциях:
-
VI Всероссийская научно-техническая конференция с докладом по теме диссертационного исследования.
-
VII Всероссийская научно-техническая конференции с докладом по теме диссертационного исследования.
-
В учебном процессе на кафедре «ИТ-7» Московского Государственного Университета Приборостроения и Информатике.
Публика юні
По теме диссертации опубликовано 6 научных работ.
Объём н структура диссертации.
Диссертационная работа изложена на 108 страницах машинописного текста, состоит из введения, четырех глав, заключения, библиографического указателя, включающего 57 источников, иллюстрирована 18 рисунками и 10 таблицами.