Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности Пименов Виктор Игоревич

Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности
<
Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности
>

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Пименов Виктор Игоревич. Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности : диссертация ... доктора технических наук : 05.13.01 / Пименов Виктор Игоревич; [Место защиты: С.-Петерб. гос. технол. ин-т].- Санкт-Петербург, 2009.- 319 с.: ил. РГБ ОД, 71 10-5/367

Введение к работе

Актуальность проблемы целенаправленного создания обучающей системы, адекватно соответствующей спектру потребностей пользователя, обоснована современным уровнем информатизации общества, объективной потребностью развития дистанционных форм и распространением электронных средств обучения, созданием учебных ресурсов, образовательных Интернет-порталов и внедрением инновационных педагогических технологий.

Не затрагивая этапы, которые прошли в своем развитии обучающие ситемы, их классификацию и набор целевых показателей, рассмотрим вопросы, которые требуется решать на стадии концептуального проектирования для повышения качества создаваемой системы.

Определяющее значение имеет разработка информационной модели, обеспечивающей логическое упорядочивание информации, ее систематизацию и структурирование. Эти задачи обладают творческим характером и являются трудноформализуемыми. Недостаточное развитие научно обоснованных принципов информационно-образовательного обеспечения учебного процесса, подходы к построению моделей, инвариантных к предметной области, жесткое структурирование материала дисциплины, используемое во многих разработках, неоправданное дублирование учебных элементов и сведение методов создания обучающих систем к воспроизведению бумажных оригиналов не позволяют решать данный вопрос в полном объеме.

Задача расширения функциональных возможностей обучающей системы, обеспечивающих достижение целей обучения оптимальным образом, решается в настоящее время за счет ее интеллектуализации, на основе моделей предметной области, обучаемого и процесса обучения.

Очертим класс разрабатываемых обучающих систем областью технологии и дизайна. Технологические процессы, в которых осуществляется преобразование одних объектов в другие с целью создания материального или информационного продукта, – один из самых сложных для формализации разделов человеческих знаний. В условиях расширения ассортимента исходного сырья, создания новых материалов и объектов дизайна непростая и актуальная задача выявления и представления знаний о технологиях должна быть решена с помощью алгоритмов автоматического построения обобщающих правил.

Помимо перечисленных задач при создании обучающей системы решаются следующие вопросы: выбор инструментария и среды для хранения и наполнения данных и знаний, проектирование онтологии предметной области, разработка схемы пользовательского интерфейса и модели навигации по структурным единицам, сопряжение гипертекстовых и интеллектуальных составляющих в единую систему. Для интеллектуального наполнения обучающих систем существует не так много доступных оболочек с развитым программным интерфейсом, а представление знаний на специализированном языке доступно в основном профессиональным инженерам по знаниям.

Таким образом, представляет существенный интерес разработка такой методики использования обобщающих правил, которая позволяет повысить эффективность разработки логических схем обучающих систем и обеспечивает интеграцию знаний для различных моделей обучения – от обычных линейных и гипертекстовых структур до интеллектуальных разветвленных сценариев.

В большинстве работ рассматриваются научно-методические основы создания систем учебного назначения. Однако методика интеллектуального анализа и преобразования эксплицированных данных при построении модели знаний обучающей системы изложена пока недостаточно.

В отраслях текстильной и легкой промышленности весьма много трудноформализуемых задач (формирование свойств инструментальных сталей для машинных швейных игл, подбор рецептур крашения, оценка качества синтетических нитей и др.), отличающихся многомерностью, функционированием в нескольких устойчивых режимах, большим числом неявных нелинейных внутренних взаимосвязей между переменными. Слабоформализованные отношения – представление конструкторских приемов при создании объекта дизайна, гармонизация художником-дизайнером композиционных и цветовых решений характерны для задач, связанных с формированием проектно-художественной концепции изделия.

Формализующий базой для широкой совокупности промышленных технологий может служить теория распознавания образов. Описание технологического процесса массивом “объект–атрибуты–значения” позволяет представить задачу построения модели знаний как обучение распознаванию образов, когда из баз данных извлекается система решающих правил, описывающих порядок изготовления продукции заданных классов. В настоящее время известно несколько сотен алгоритмов распознавания. Тем не менее, остаются теоретические и прикладные вопросы, связанные с задачей обучения распознаванию образов (ОРО), которые еще полностью не решены: алгоритм ОРО, формирующий на основе обучающих выборок решающие правила, обычно задается заранее из эвристических соображений и целиком зависит от опыта и интуиции разработчика либо выбирается из узкого класса “согласованных” с исходными данными алгоритмов. Недостаточность обучающих выборок при создании ряда трудноформализуемых технологических систем в условиях часто меняющегося ассортимента предъявляет особые требования к их прогностическим свойствам, что заставляет подходить более строго к решению задачи выбора типа решающих правил при построении модели знаний.

Таким образом, системный анализ задач проектирования для класса обучающих систем технологической направленности – формализованное описание конкретного технологического процесса и построение информационной модели обучающей системы – показал их взаимозависимость. Оба круга задач в совокупности образуют одну крупную научную проблему. Следовательно, разработка методологических основ построения модели знаний интеллектуальных обучающих систем в области технологии и дизайна, включающей разнотипные знания, является актуальной крупной научной проблемой.

Объектом исследования является процесс синтеза модели знаний компьютерных обучающих систем в области технологии и дизайна.

Цель диссертационной работы – решение научной проблемы разработки методологических основ создания обучающих систем, основанных на знаниях технологического профиля, описывающих слабоформализованные отношения и различные модели обучения, за счет автоматического построения решающих правил, что позволит повысить эффективность разработки логических схем систем рассматриваемого класса.

Для достижения поставленной цели в работе решены следующие задачи:

проведен анализ современного состояния проблемы структурирования учебных элементов и построения интеллектуальных обучающих систем, выявлены их основные компоненты и тенденции развития;

разработана методология формализации знаний о технологических процессах, базирующаяся на автоматическом построении решающих правил методами обучения распознаванию образов;

в рамках методологии разработан подход к синтезу модели знаний на основе комплексного применения дискриминантных алгоритмов;

исследованы экстраполирующие свойства решающих правил, отличающихся легкой семантической интерпретацией при представлении технологических знаний в виде набора продукций, предложены и реализованы новые методы обучения и распознавания для различных видов априорной неопределенности;

исследованы способы повышения точности описания классов объектов, разработаны новые методы и алгоритмы оптимизации систем описания, позволяющие повысить степень сжатия информации при построении правил вывода на знаниях;

разработана методика структуризации обучающих систем технологической направленности на основе применения результатов интеллектуального анализа данных;

выполнена проверка эффективности предложенных методов и алгоритмов при разработке ряда обучающих систем в области технологии и дизайна.

Основные методы исследований. Методической и теоретической основой диссертационного исследования явились научные труды по теории распознавания образов, имитационному моделированию, структурному анализу. Широко использовались современные методы искусственного интеллекта, теории вероятностей и математической статистики, теории нечеткой логики, математического программирования, последовательного анализа. Компьютерная реализация разработанных алгоритмов производилась на основе объектно-ориентированного подхода с применением средств мультимедиа, компьютерной графики, и трудов по текстильным технологиям. Исследования предложенных методов комплексного применения множества дискриминантных алгоритмов для построения поля знаний технологического процесса проводились с использованием пакета прикладных программ, разработанного автором. Достоверность полученных результатов обеспечивалась корректностью исходных предпосылок, математической строгостью доказанных утверждений и преобразований при получении аналитических зависимостей, а также результатами практической реализации.

Научная новизна работы заключается в том, что в ней предложена, развита и реализована концепция построения модели знаний обучающих систем технологической направленности, основанная на использовании ранее не применявшихся к данной предметной области методов обучения распознаванию образов, в частности, разработаны:

новая методология рационального выбора и построения системы решающих правил, учитывающая виды априорной неопределенности, объем выборки, сложность систем описания объектов, емкость формируемого правила и количество классов;

модель знаний обучающей системы, эксплицированных специалистами и извлеченных из массива данных, в виде набора решающих правил, основанная на предложенной классификации методов обучения распознаванию образов;

совокупность теоретических оценок прогностических свойств решающих правил различной емкости, служащих для повышения эффективности базы знаний интеллектуальных обучающих систем;

новый комплексный подход к применению дискриминантных алгоритмов для синтеза модели знаний при ограниченном объеме исходных данных, позволяющий добиться более глубокого минимума гарантированной оценки риска по сравнению с известными методами обучения;

методика применения результатов интеллектуального анализа данных для описания трудноформализуемых технологических процессов, автоматизации построения модели знаний интеллектуальных обучающих систем и создания информационной модели обучающих систем, которая позволяет структурировать базовые понятия, декларативные фрагменты, процедурные блоки, выявлять дублирующие данные, повторяющиеся для различных технологических процессов, а также устанавливать связи-гиперссылки;

разработанные в рамках предложенной методологии новые методы обучения и распознавания, позволяющие легко реализовать семантическую интерпретацию решающих правил, предназначенные для различных видов априорной неопределенности, – в форме бинарной решающей матрицы, многоградационной матрицы степеней принадлежности и на основе упрощенного последовательного критерия отношения вероятностей;

разработанные в рамках комплексного подхода новые критерии и методы обработки информации, предназначенные для сжатия описаний классов объектов и позволяющие увеличить экстраполирующую силу известных решающих правил, а именно: методы уточнения многогранных логических классификаторов, аддитивный метод выбора рабочего словаря признаков, метод кодирования по методу минимального числа порогов, интервальный критерий информативности;

модель многофункциональной обучающей системы, основанная на системе решающих правил, управляющих процессом обучения, в которую заложены разные уровни усвоения учебного материала.

На защиту выносится совокупность научных результатов в области создания моделей знаний о технологических процессах.

1. Принципы рационального выбора и построения решающих правил при формировании модели знаний о технологических процессах.

2. Сравнительный анализ экстраполирующих свойств решающих правил различной сложности и методология комплексного применения дискриминантных алгоритмов в условиях ограниченных ОВ.

3. Алгоритмы обучения, формирующие логическую и нечеткую решающие матрицы; упрощенный последовательный алгоритм выделения класса с новыми потребительскими свойствами.

4. Алгоритмы кодирования, выбора информативных признаков и уточнения описаний классов при построении правил вывода на знаниях.

5. Методика структуризации и синтеза продуктивной составляющей гипертекстовых и интеллектуальных обучающих систем.

6. Результаты практического применения методов и алгоритмов обработки информации в ряде гипертекстовых и интеллектуальных обучающих систем в области технологии и дизайна.

Практическая значимость. Разработанная в диссертационной работе методология синтеза на основе комплексного применения дискриминантных алгоритмов может повысить качество модели знаний интеллектуальных систем при ограниченном обучающем материале за счет повышения экстраполирующей силы решающих правил при принятии решения по новым данным.

Методика структуризации гипертекстовых обучающих систем технологической направленности позволяет формировать гибкую, индивидуальную цепочку учебных элементов, выявляя дублирующие информационные блоки, повторяющихся для различных технологических процессов, устанавливать логические связи-гиперссылки и формировать систему правил, которые могут использоваться в обучающих системах на различных уровнях освоения учебного материала, например, в режимах тестирования или тренажера.

Формализация технологических процессов с помощью автоматического построения решающих правил позволяет решать практическую задачу эффективной семантической коммуникации между непрограммирующими авторами-педагогами и разработчиками информационной системы, являющимися специалистами в разных предметных областях, при работе над общим проектом – сценарием и наполнением обучающей системы по специальной дисциплине.

Предложенный в работе спектр методов и алгоритмов позволяет осуществлять интеллектуализацию обучающих систем по технологии и дизайну при реализации различных моделей процесса обучения. Разработанная система дизайн-программирования ассортимента производственной одежды, в которую заложены знания профессионального дизайнера, позволяет пользователю самостоятельно осуществлять проектирование одежды в соответствии с его потребностями.

Разработанная методология применения методов и алгоритмов интеллектуального анализа данных на основе выделения классов и этапности выполнения процедур может использоваться при создании обучающих систем в различных предметных областях, например, посвященных изучению технических систем, в которых последовательность действий реализуется для изменения состояния системы.

Основные результаты, полученные в работе, доведены до уровня расчетных формул, вычислительных алгоритмов или методик, что облегчает их применение при создании обучающих систем.

Реализация результатов работы. Результаты диссертационной работы реализованы, внедрены и используются в виде методологии построения модели знаний обучающих систем, методов и алгоритмов интеллектуального анализа больших массивов даных, мультимедийных программ в Санкт-Петербургском государственном университете технологии и дизайна, Балтийском государственном техническом университете “ВОЕНМЕХ”, Санкт-Петербургской Государственной Лесотехнической академии им. С.М. Кирова, что подтверждено соответствующими актами.

Разработанные обучающие системы широко используются в учебном процессе СПГУТД в курсах “Методы и средства исследований”, “Компьютерное проектирование одежды”, “Механико-технологические процессы текстильной промышленности”, “Информационное обеспечение дизайн-проектирования”, “Информационные системы в дизайне изделий легкой промышленности”, “Математическое моделирование”, “Интеллектуальные информационные системы” для студентов различных специальностей.

Связь исследований с научными программами. Работа поддерживалась следующими грантами: “Разработка аудиовизуальных компьютерных систем обучения иностранным языкам на основе новых информационных технологий” по программе "Перспективные информационные технологии" (1995–1996 г.г.); “Речевой адаптер для ЭВМ: верификация оператора и оценка его эмоционального состояния” (1995–1997 г.г.); персональным грантом “Разработка аудиовизуальной компьютерной системы обучения специалистов в области текстильной и легкой промышленности” по межвузовской комплексной программе "Наукоемкие технологии образования" (МКП НТО, 1998–1999 г.г.); “Разработка экспертных систем для оценки конкурентов” по программе Европейского Союза Tacis ERDUS 9706 “Развитие образовательных связей и инициатив в области высшего и профессионального образования”, проект Delphi – IV “Развитие ресурсов открытого и дистанционного образования” (1999–2001г.г.); грантом “Лентек № 1.5.01. Разработка теоретических основ построения интеллектуализированных компьютерных энциклопедий технологий текстильных материалов” (2001–2003 г.г.), грантом “Разработка информационно-методического и конструкторско-технологического обеспечения дизайн-программирования и изготовления ассортимента производственной одежды для служб городского хозяйства Санкт-Петербурга” по конкурсу инновационных проектов “Знания–инновации” к 300-летию Санкт-Петербурга (2003–2005 г.г.,); разработкой “Виртуальное представительство Санкт-Петербургского университета технологии и дизайна” в рамках комплексного мультимедиа и Internet проекта “Высшая школа Санкт-Петербурга в киберпространстве”, при построении комплекса инновационных разработок для образовательных учреждений высшего профессионального образования “Образовательные виртуальные миры Петербурга”, за создание которого ректору СПГУТД Романову В.Е. присуждена премия президента РФ в области образования за 2003 год (Указ № 79 от 25 января 2005 года).

Апробация работы. Основные результаты работы докладывались, одобрены и опубликованы в материалах 16 международных, 9 всероссийских и всесоюзных научных конференциях, отраженных в списке публикаций.

Личный вклад автора. Постановка основных задач и направлений исследования, отраженных в монографии [1], выполнена совместно с научным консультантом Ипатовым О.С. Выбор методов исследования, анализ и обобщение полученных результатов, теоретические положения и выводы диссертации осуществлены и получены автором единолично (без соавторов). Разработка обучающих систем выполнялась под его руководством или при его участии.

Публикации. По теме диссертации опубликовано 55 работ, в том числе 9 статей в рецензируемых центральных журналах, входящих в перечень ВАК, 1 монография, 4 учебных пособия с грифом УМО, 6 свидетельств о регистрации программ.

Структура и объем работы. Диссертация состоит из введения, пяти разделов, заключения, списка использованных источников из 241 наименований. Общий объем работы – 319 страниц, в том числе основной текст – 278 страниц, 9 таблиц, 64 рисунка.

Похожие диссертации на Методы, модели и алгоритмы интеллектуального анализа данных при создании обучающих систем в текстильной и легкой промышленности