Содержание к диссертации
Введение
Глава 1. Обзор технологий сетевых обучающих систем 11
1.1. История развития систем сетевых обучающих систем ДО 11
1.2. Классификация систем автоматизированного обучения 13
1.3. Классификация существующих сетевых обучающих систем ДО в России 18
1.4. Использование интеллектуальных технологий для дистанционного обучения 26
Выводы по Главе 1 34
Глава 2. Разработка интеллектуальных технологий обучающих систем 36
2.1. Выработка критериев для определения уровней сложности заданий в Уроках и тестах 36
2.2. Методика оценивания качества ответа 50
2.3. Адаптивный модуль настройки системы на уровень обучающегося. Определение профиля пользователя 58
2.4. Методика динамической реструктуризации классов ситуаций в БЗ аварийных ситуаций 64
Выводы по Главе 2 70
Глава 3. Алгоритмизация адаптивной системы автоматизированного технического обучения работников станции 71
3.1. Архитектура системы обучения 71
3.2. Разработка алгоритмов, реализующих механизм адаптивного обучения на основе профиля пользователя 77
3.3. Разработка алгоритмов, обеспечивающих возможность моделирования поведения специалиста при решении задач предметных областей 92
3.4. Обработка массива документов и создание базы аварийных ситуации модулем структурной согласованности 95
Выводы по Главе 3 103
Глава 4. Программная реализация алгоритмов адаптивной системы дистанционного обучения «безопасность» 106
4.1.Структура АСО 106
4.2. Интерфейс АСО 106
4.3. Технические требования 139
4.4. Архитектура АСО 139 Выводы по Главе 4 143 Заключение 144 Литература
- Классификация систем автоматизированного обучения
- Использование интеллектуальных технологий для дистанционного обучения
- Адаптивный модуль настройки системы на уровень обучающегося. Определение профиля пользователя
- Разработка алгоритмов, реализующих механизм адаптивного обучения на основе профиля пользователя
Введение к работе
Современная ситуация практически во всех сферах деятельности человека отмечена настолько бурным их развитием, что использование в процессе трудовой деятельности только базовых знаний, полученных в среднем или высшем учебном заведении, заведомо недостаточно. Этот фактор определяет мотивацию каждого участника производственного процесса на регулярное получение новых знаний, необходимых для поддержания собственной работоспособности. Кроме того, развитие рыночных отношений требует неизбежной переквалификации для значительного слоя работников, высвобождающихся в результате структурной перестройки всей экономики страны, причем этот процесс несет в себе, как правило, негативный социальный фактор. Решение возникающих в результате этих процессов проблем лежит в русле развития концепции непрерывного образования.
Концепция непрерывного образования, разработанная в развитых странах в 70-х годах, стала для этих стран одним из эффективных инструментов, позволяющих решать проблемы соответствия квалификации специалистов и быстро растущего уровня знаний, умений и навыков, которого требует технический прогресс. Это, с одной стороны, обеспечение должного качества получаемых знаний, и, с другой стороны, достижение минимальных затрат всех участников образовательного процесса (преподавателей, обучаемых, а также организаций и предприятий, вынужденных тратить подчас значительные средства для поддержания высокого профессионального потенциала своих кадров, обеспечивая тем самым высокую конкурентоспособность своей продукции и услуг). Вот почему задача совершенствования процесса переподготовки кадров становится сегодня ключевой в реализации намеченных в стране реформ.
Однако процесс организации переподготовки работников организаций и предприятий в настоящее время недостаточно обеспечен как методически, так и технологически. Дефицит современных эффективных технологий затрудняет развитие процесса переподготовки работников различных
отраслей промышленности, что, несомненно, сказывается на продвижении страны по пути реформ и устранении социальной напряженности в обществе.
Для обеспечения безопасности движения - важнейшего показателя перевозочного процесса - в ОАО «Российские железные дороги» в настоящее время разрабатывается функциональная стратегия. Ее разработка базируется на ряде принципов, среди которых - приоритетное выполнение условий безопасности перед другими показателями качества перевозок (комфортности, стоимости и др.); приоритетное развитие технических систем и средств предупреждения крушений, аварий, браков перед другими техническими системами и средствами; учет международных рекомендаций в вопросах обеспечения безопасности на железнодорожном транспорте (ИСО 9000).
Повторение из года в год крушений, аварий, сходов в грузовых и пассажирских поездах и предпосылок к ним практически по одним и тем же причинам свидетельствует о том, что действующая в настоящее время система управления безопасностью перевозок недостаточно эффективна. Она не обеспечивает сегодня самого главного - необходимой заинтересованности работников в качественном и своевременном исполнении технологических процессов, не вскрывает нарушения и не предотвращает их последствия.
Поэтому стратегическая цель деятельности ОАО «РЖД» в области безопасности движения должна заключаться в достижении гарантий выполнения всеми работниками компании обязательных норм и правил, сформулированных в нормативной документации и направленных на предотвращение нарушений безопасности движения.
Одним из путей решения этой задачи могло бы стать широкое внедрение новых информационно-образовательных технологий. Их основу составляет использование новейших компьютерных технологий, в совокупности с современными методиками и приемами, для создания обучающих систем (далее ОС), включающих фундаментальные и
специальные дисциплины, которые в комплексе позволяют организовать учебный процесс, максимально наполнив его элементами, обеспечивающими высокое качество и эффективность обучения, в том числе и в дистанционной форме.
В настоящее время ряд известных коммерческих компаний разрабатывает высококачественные, с точки зрения технических, программных, эргономических и других требований, программные продукты учебного назначения. Методической основой данных разработок являются исследования Бруснецова Н. П., Брусиловского П. Л., Васильева В. В., Растригина Л. А., Савельева А. Я., Слипченко В. Г. Среди зарубежных исследователей необходимо отметить работы Р. Бартона (R. Burton), А. Борка (A. Bork), Д. Брауна (J. S. Brown), Э. Венгера (Е. Wenger), Д. Карбонелла (J. Carbonell), С. Паперта (S. Papart), Э. Солоуэя (Е. Soloway).
Однако, несмотря на заметные успехи в этом направлении, существует ряд причин, препятствующих широкому использованию подобного рода программ. Главной среди них является неполное соответствие предлагаемого в ОС материала идеям и методам преподавания той или иной дисциплины. Это связано, прежде всего, с низкой адаптивностью как самих обучающих систем, так и средств их разработки к индивидуальным особенностям обучаемых, предметной области, решаемым задачам и навыкам разработчика.
Использование адаптивных систем дистанционного обучения при подготовке оперативных работников хозяйства перевозок железных дорог позволяет повысить уровень практической подготовленности к безопасному управлению движением, сократить сроки переподготовки специалистов не снижая её качества. Анализ процесса обучения позволяет дать объективную оценку степени обученности и при необходимости осуществлять профессиональный отбор.
Адаптивной обучающей системой в дальнейшем будем называть [20] -систему, отражающую некоторые характеристики пользователя в модели пользователя и применяющую данную модель для адаптации различных
аспектов программированного обучения и контроля знаний.
Обучаемыми в данной работе являются оперативные работники хозяйства службы перевозок железных дорог Российской Федерации.
Актуальность темы исследования определяется необходимостью совершенствования систем дистанционного обучения и контроля знаний за счет совершенствования описания моделей обучаемого, позволяющих отслеживать динамику успеваемости на всех этапах обучения, разработки необходимого алгоритмического и математического обеспечения программных средств, в целях повышения качества дистанционного обучения.
Целью диссертационной работы является разработка, программная реализация и внедрение программного средства разработки обучающих систем дистанционного обучения с применением интеллектуального интерфейса на основе геоинформационных технологий и модели обучаемого.
Для достижения поставленной цели в работе решаются следующие задачи:
исследование методик определения профессиональной пригодности оперативных работников хозяйства службы перевозок железных дорог Российской Федерации на основе факторов, обуславливающих наличие крушений, аварий, особых случаев брака в поездной и маневровой работе на станции;
формализация и классификация механизмов, лежащих в основе существующих программных систем дистанционного обучения;
классификация методов и технологий адаптивных алгоритмов обучения;
анализ инструментов программной реализации обучающих систем, оценка их эффективности и возможного применения в рамках задач интеллектуализации дистанционного обучения;
разработка и программная реализация модели адаптивного обучения, учитывающей специфику стиля преподавания и позволяющая автоматически модифицировать учебный материал в зависимости от текущей успеваемости обучаемого;
разработка и программная реализация модели обучаемого, позволяющей проводить оценивание, классификацию и хранение как текущих, так и заключительных знаний обучаемого;
программная реализация группируемости (классификации) аварийных ситуаций на основе аппарата структурной согласованности.
разработка программного модуля, позволяющего выполнять моделирование хода рассуждения специалиста при решении прикладных задач определенного класса;
внедрение разработанного автоматизированного комплекса на сети железных дорог для организации профилактической работы по безопасности движения и охране труда на станциях в условиях их функционирования;
Объектом исследования являются автоматизированные обучающие системы, обеспечивающие дистанционное обучение и контроль уровня знаний обучаемых.
Предметом исследования является методическое, математическое, алгоритмическое и программное обеспечения ОС.
Методы исследования. Методологической основой и общетеоретической базой исследования являются принципы системного анализа и проектирования, теория нечетких множеств и нечетной логики, статистические методы, алгебра логики, теория искусственного интеллекта, теория информации, геоинформационные технологии.
Научная новизна работы:
интеграция алгоритмов представления знаний, геоинформационных технологий и средств построения адаптивных управляющих средств в единую инструментальную среду дистанционного обучения и контроля уровня знаний обучаемого;
разработка адаптивной программной системы на основе использования двух моделей: модели уровня знаний обучаемого (модели пользователя) и ее взаимодействия с контрольными обучающими материалами на основе стереотипных моделей и модели адаптивного обучения;
разработка интеллектуального интерфейса для обеспечения и корректировки процесса обучения дежурных по станции.
Практическая ценность работы заключается в создании системы
дистанционного обучения и контроля знаний, позволяющей создавать
электронные учебные курсы как для выполнения задач дистанционного
образования, так и для проведения промежуточного и итогового
тестирования обучаемых; создании особых заданий - "Уроков", в которых
используются интеллектуальные алгоритмы обработки
слабоструктурированных массивов информации и геоинформационные технологии.
Реализация и внедрение. Значительная часть результатов, полученных в ходе выполнения данной работы, вошла в проект Российского фонда фундаментальных исследований № 03-01-00457 «Интеллектуальная система формирования согласованной многоуровневой базы знаний».
Разработанные методы и алгоритмы использованы при создании программного комплекса "Автоматизированная система дистанционного обучения оперативных работников станций "Безопасность" (АСДО). Данный программный комплекс был внедрен на сети железных дорог ОАО "Российские железные дороги". АСДО является составной частью
Комплексной системы повышения безопасности движения (КС БД ЦД) в хозяйстве перевозок. Основным назначением «Комплексной системы повышения безопасности движения в хозяйстве перевозок» является оценка уровня безопасности на станции, организация сбора, систематизация справочной и текущей актуальной информации, необходимой станции для планирования и проведения профилактической работы по предотвращению случаев брака в поездной и маневровой работе, а также производственного травматизма работников станции.
Апробация работы. Содержание диссертации было доложено на Девятой национальной конференции по искусственному интеллекту с международным участием КИИ-2004, Научной сессии МИФИ-2005, Научной сессии МИФИ-2006, Первой Всероссийской конференции студентов, аспирантов и молодых ученых, МИРЭА - 2006, VI-й научно-практической конференции «Безопасность движения поездов», Десятой национальной конференции по искусственному интеллекту с международным участием КИИ-2006, VI Международном социальном конгрессе, VII научно-практической конференции «Безопасность движения поездов».
Классификация систем автоматизированного обучения
В разомкнутых АОС не учитываются отклики учащихся на поставленные вопросы и не корректируется последовательность предъявления учебного материала в функции степени усвоения учащимся изучаемой темы. Здесь лишь выполняется определенная заранее заданная программным путем последовательность изложения урока или контрольных вопросов. При этом наиболее простыми из числа разомкнутых АСО являются системы с презентационной структурой, поскольку присутствует только прямая информационная связь между системой и обучаемыми, которому последовательно предоставляется визуальная информация с монитора ЭВМ. При этом обучаемый находится в режиме пассивного наблюдателя, от которого не требуется ни каких откликов по взаимодействию с АСО.
В контролирующих АСО без обратной связи основной упор делается на выявление уровня знаний учащихся в определенный период учебного процесса. По результатам опроса выставляется определенный балл, который служит критерием для результирующей оценки по степени усвоения учащимся требуемого учебного материала.
Наиболее широкими функциональными возможностями и высокой эффективностью в учебном процессе обладают АСО, где организована обратная связь между учащимся и обучающей системой. Процесс взаимодействия учащегося с АСО может быть представлен в виде системы с внешней обратной связью, где АСО направлена на повышение уровня знаний пользователя, и тем самым уменьшение количество ошибок им совершаемых.
Весьма распространенным типом АСО среди замкнутых систем являются имитационные автоматизированные обучающие системы. Здесь функции ведущего "элемента" выполняет фактор моделирования реальной ситуации в той или иной сфере предметной области.
Таким образом, является очевидным, что наиболее широкими возможностями с учетом современных требований к АСО обладают замкнутые обучающие системы, обеспечивающие максимальную гибкость в общении с пользователем. Классификация АСО по принципам алгоритмического построения
Классификация АСО по принципам алгоритмического построения представлена на рис 3.
При использовании линейных алгоритмов АСО обучаемому, согласно заложенной методике, последовательно предъявляются учебные материалы (электронный текст лекций, слайды и т.д.). В качестве достоинств линейного алгоритма АСО можно отметить простоту разработки такой системы, а в качестве недостатков - трудоемкость раскрытия некоторых тем. Кроме того, стоит отметить что построение СО на базе только линейных алгоритмов влечет за собой невозможность организации обратной связи с пользователем.
В АСО построенных с использованием нелинейных алгоритмов появляется возможность изменять последовательность предъявления информационного воздействия.
Нелинейные алгоритмы, в свою очередь, делятся на циклические, направленные и комбинированные. Циклические алгоритмы предполагают повторный возврат к учебным материалам, отражающим темы, которые обучаемый недостаточно усвоил. Алгоритмическое построение систем обучения Без обратной связи :
Направленные алгоритмы предполагают наличие материалов для тестирования, однако вне зависимости от результатов тестирования возврата к плохо усвоенному материалу не предполагается, а модифицируется продолжение учебного материала. В комбинированных алгоритмах используется оба принципа.
Таким образом, каждая из представленных структур позволяет предъявлять учебный материал, в соответствии с последовательностью, который обеспечивает приемлемое предъявление учебного материала в соответствии с требованием предметной области, поэтому в универсальной обучающей системе должны присутствовать механизмы, обеспечивающие возможность реализации электронных учебных курсов с использованием всех перечисленных алгоритмов.
1.3 Классификация существующих сетевых обучающих систем ДО в России.
В отличие от других стран Европы, в России сравнительно недавно началось интенсивное развитие систем дистанционного обучения. В настоящее время уже определились лидирующие компании по производству систем ДО в России, но так как цели создания подобных систем сильно отличаются, то соответственно и сами системы имеют ряд существенных отличий. Далее приведена таблица сравнения основных параметров наиболее известных систем ДО.
Система Net School - разработка компании «РООС». Net School представляет собой комплексную сетевую систему автоматизации для средней школы. Программа работает как с любого компьютера, включенного в локальную сеть учебного заведения, так и через Интернет.
Система Юниар-Доцент - разработана компанией «UNIAR». Программа представляет собой комплекс программно-методических средств дистанционного обучения, переподготовки и тестирования слушателей, основанный на Интернет/Интранет.
Система 1С Образование - разработана компанией 1С. Данная система представляет собой набор различных программных продуктов, разработанных на основе общей технологии.
Система Хронобус.Хронограф - разработана компанией Хронобус. Предназначена для заведующих учебных частей, сотрудников средних общеобразовательных школ, отвечающих за составление расписания учебных занятий.
Использование интеллектуальных технологий для дистанционного обучения
В общем понимании можно говорить, что адаптивная обучающая система [20] - система, отражающая некоторые характеристики пользователя в модели пользователя и применяющая данную модель для адаптации различных аспектов программированного обучения и контроля знаний.
Адаптивные обучающие системы можно классифицировать со следующих точек зрения: с точки зрения ресурса адаптации, т.е. какие характеристики пользователя используются в качестве ресурса адаптации; с точки зрения того, что может быть адаптировано с помощью конкретного приема адаптации, а также какие особенности системы могут быть различны для различных групп пользователей.
Подавляющее большинство приемов адаптивного представления пользователя в системе используют знания обучаемого как источник адаптации. Уровень знаний является переменной величиной для каждого конкретного пользователя. Это в свою очередь означает, что адаптивная обучающая система (АОС), использующая знания пользователя, должна фиксировать изменения уровня этих знаний и соответствующим образом модифицировать модель пользователя [33,36,48].
Знание пользователя в какой-либо области наиболее часто представляется оверлейной моделью [89] , которая основана на структурной модели предметной области (ПО). Вообще, структурная модель ПО представляется в виде концептов, взаимосвязанных друг с другом, формируя концептуальную сеть. В ряде случаев более эффективным признается использование упрощенной формы модели области [90], без каких-либо связей между концептами.
Идея оверлейной (перекрывающейся) модели состоит в том, чтобы представить знания пользователя по определенной теме как перекрытие, наложение на модель ПО. Для каждого концепта модели ПО, индивидуальная оверлейная модель сохраняет некоторое значение, которое является оценкой уровня знаний пользователем этого концепта. Это может быть булева переменная (известно / не известно), качественная оценка (хорошо / удовлетворительно / плохо) или количественное значение (например вероятность того факта, что пользователь знает концепт). Оверлейная модель знаний пользователя может быть представлена как набор пар «концепт - значение», одна пара для каждого концепта ПО.
К более простым механизмам реализации адаптивного обучения можно отнести создание стереотипной модели пользователя. Стереотипная модель пользователя различает несколько типичных или "стереотипных" пользователей. Для каждого направления моделирования пользователя система может иметь набор возможных стереотипов. Стереотипная модель пользователя также может быть представлена как набор пар «стереотип -значение», где значение может быть не только «истина» или «ложь» (как показатель того, что пользователь принадлежит или не принадлежит к данному стереотипу), но также может быть представлено некоторой вероятностной величиной (отражающей вероятность того факта, что пользователь принадлежит данному стереотипу). Основная идея всех технических приемов адаптивного представления состоит в том, чтобы адаптировать содержание материала, к которому обращается пользователь, к его текущему уровню знаний. В настоящее время все исследования в области адаптивного представления в действительности ограничиваются адаптивным представлением текста [100].
Непосредственное руководство - наиболее простая технология адаптивной поддержки навигации. Непосредственное руководство может применяться в любой системе, способной определить, какой узел является "наилучшим" узлом для очередного перемещения пользователя, в соответствии с целью пользователя и другими параметрами, представленными в модели пользователя.
Суть технологии адаптивной сортировки состоит в том, чтобы упорядочить все ссылки страницы в соответствии с моделью пользователя и некоторым оценочным критерием, отражающим степень релевантности ссылки.
Сокрытие ссылок является наиболее часто используемой в настоящее время технологией адаптивной поддержки навигации. Смысл поддержки навигации методом сокрытия состоит в том, чтобы ограничить пространство навигации, скрыв ссылки к "ненужным в данный момент" (нерелевантным) обучающим материалам.
Адаптивный модуль настройки системы на уровень обучающегося. Определение профиля пользователя
В настоящее время моделирование обучаемого является развивающимся направлением искусственного интеллекта в обучении, под которым понимают новую методологию психологических, дидактических и педагогических исследований по моделированию поведения человека в процессе обучения, опирающуюся на методы инженерии знаний.
Модель обучаемого является одним из центральных понятий современной дидактики. Потребность в её введении была вызвана необходимостью формализовать представления об обучаемом. Эти представления начали вырабатываться задолго до возникновения компьютеров, вместе с появлением самих обучаемых, но именно компьютерные технологии обучения дали новый импульс развития этих представлений, превратили их в объект глубоких исследований, перевели на качественно новый уровень [19,76]. В широком смысле под моделью обучаемого МОд понимают знания об обучаемом, используемые для организации процесса обучения. Это множество точно представленных фактов об обучаемом, которые описывают различные стороны его состояния: знания, личностные характеристики [21], профессиональные качества и др.
Построение любой модели - всегда неформальная процедура, она очень сильно зависит от исследователя, его опыта, таланта, т.е. можно утверждать, что процесс моделирования имеет феноменологическую основу.
При моделировании обучаемого важной является проблема определения параметров (характеристик) обучаемого.
До настоящего времени в большинстве СО модель обучаемого представляет собой лишь оверлейную модель знаний обучаемого [19], в результате, ее иногда называют оверлейной моделью обучаемого.
Идея оверлейной (перекрывающейся) модели состоит в том, чтобы представить знания обучаемого по определенной теме как перекрытие, наложение на модель ПО. Для каждого концепта модели ПО, индивидуальная оверлейная модель сохраняет некоторое значение, которое является оценкой уровня знаний обучаемым этого концепта. Это может быть булева переменная (известно/не известно), качественная оценка (хорошо/удовлетворительно/плохо) или количественное значение (например, вероятность того факта, что обучаемый знает концепт). В оверлейной модели знания обучаемого представлены как набор пар «концепт-значение», одна пара для каждого концепта ПО, что позволяет осуществлять независимое измерение уровня знаний обучаемого по различным темам.
Основной проблемой использования оверлейной модели является ее инициализация [10].
Наряду с оверлейной, часто используется более простая, стереотипная модель обучаемого, которая может различать несколько типичных или «стереотипных» пользователей. Для каждого направления моделирования обучаемого задается набор возможных стереотипов, т.е. каждый обучаемый моделируется отнесением к одному из стереотипов для каждого направления.
Стереотипная модель обучаемого может быть представлена как набор пар «стереотип-значение», где значение может быть не только «истина» или «ложь» (как показатель того, что обучаемый принадлежит или не принадлежит к данному стереотипу), но также может быть представлено некоторой вероятностной величиной (отражающей вероятность того факта, что обучаемый принадлежит данному стереотипу). Стереотипная модель - более простой и менее мощный механизм, нежели оверлейная модель. Однако, она более универсальна, и ее намного проще инициализировать и поддерживать.
Диагностика знаний, умений и навыков. Структурирование диагностических знаний (создание вопросов различного типа) достаточно подробно и полно изложено в ряде работ [3,17,58]. Однако, не менее важное значение, имеет используемая модель тестирования (диагностики уровня знаний, умений и навыков), которая определяет порядок предъявления диагностических знаний обучаемому и метод определения уровня знаний по результатам тестирования. Анализ существующих систем обучения позволяет выделить несколько моделей проведения тестирования. Классическая модель
Имеется множество заданий Т по некоторой предметной области (N мощность множества). В процессе тестирования из множества Т случайным образом выбирается к заданий (k N), которые предлагаются обучаемому. Результат ответа на каждое задание оценивается как «правильно» или «неправильно». Результатом тестирования является процент правильных ответов обучаемого.
Единственным достоинством данной модели является простота реализации; недостатки: из-за случайной выборки нельзя заранее определить, какие задания (по «сложности») достанутся обучаемому. В результате одному обучаемому могут достаться, например, только «легкие» задания, а другому -«сложные»; итоговая оценка зависит только от количества правильных ответов и не учитывает «сложность» задания. Данная модель имеет самую низкую надежность, так как отсутствие учета параметров задания не позволяет объективно проверить знания обучаемого. Однако, не смотря на это, она довольно широко используется в инструментариях обучающих систем.
Разработка алгоритмов, реализующих механизм адаптивного обучения на основе профиля пользователя
Установленные взаимосвязи между документами удобно проиллюстрировать с помощью матрицы связности. Это диагонально-симметричная квадратная матрица, размеры которой соответствуют количеству документов в проекте. Ячейка в і-ой строке и j-ом столбце матрицы содержит коэффициент сходства между соответствующими документами (рис. 47). На основе анализа ячеек модуль INTELLEGER определяет так называемый порог сходства, который служит для трансляции количественного показателя сходства в качественный. Например, пару документов, коэффициент сходства которых не превышает порогового значения, система рассматривает как «слабо связанные» или «непохожие» (соответствующие ячейки в матрице связности имеют светлый красный оттенок). Наоборот, если пара документов имеет коэффициент сходства, превышающий пороговое значение, то их можно рассматривать как документы «достаточно близкие» по своему содержанию (соответствующие ячейки в матрице связности имеют темный синий оттенок).
Поскольку вес того или иного ключевого слова, найденного в документе, определяется не только на основе частоты его встречаемости в данном документе, но и на основе его «популярности» во всем множестве документов, то при изменении состава документов в проекте, необходимо заново осуществлять расчет всех взаимосвязей. С одной стороны, это порождает для пользователя определенные неудобства, но с другой стороны - это всегда гарантирует получение качественного результата.
Классификация документов модулем INTELLEGER осуществляется на основе анализа взаимосвязей между документами, установленными на предыдущем этапе. Цель осуществляемой классификации - распределить все документы на несколько групп, соблюдая два ключевых принципа:
Документы из одной группы должны быть максимально "близки" по своему содержанию. Документы из разных групп должны обладать минимальным сходством. Понятия максимального и минимального сходства могут носить, конечно, субъективный характер. В модуле INTELLEGER эти понятия соизмеряются с порогом сходства, который рассчитывается на этапе определения взаимосвязей. Поэтому, осуществляя классификацию, модуль старается объединить в одну группу документы, взаимосвязи между которыми превышают порог сходства и распределить по разным группам документы с меньшими коэффициентами сходства.
Алгоритм, с помощью которого осуществляется классификация, описан во второй главе.
Результат классификации множества документов в модуле INTELLEGER - разбиение этого множества на группы по тематическому признаку. Однако этого было бы, вероятно, недостаточно, если бы пользователь сталкивался с необходимостью анализа документов, попавших в ту или иную группу для того, что бы определить ее тематическую направленность. Для решения этой проблемы в модуле INTELLEGER служат так называемые словарные группы. Словарная группа - это множество ключевых слов, которое ставится в соответствие образованной в результате классификации группе документов и которое в наибольшей степени соответствует тематике этих документов. Такие словарные группы могут быть определены как для всех групп документов, так и для конкретной группы, указанной пользователем. Ключевые слова в словарной группе имеют соответствующие им весовые коэффициенты, определяющие значимость соответствующего слова для данной группы. Необходимо отметить, что из небольшого весового коэффициента того или иного слова совершенно не следует, что это слово не имеет значения для рассматриваемой группы документов. Поскольку это слово отнесено системой к словарной группе, оно уже имеет значение, а весовой коэффициент служит во многом для упорядочивания слов в одной словарной группе. UDDI описывает способ опубликования и обнаружения информации о Web-службах. UDDI-регистр (UDDI registry cloud), или бизнес-регистр, предоставляет доступ к информации о Web-службах по схеме "зарегистрируйся один раз, будешь опубликован везде".
Стандарт UDDI предлагает механизм, с помощью которого компании могут "описывать" самих себя и свои услуги, а затем регистрировать и публиковать себя в UDDI-регистре. Другие организации могут искать такие опубликованные компании, обращаться к ним с запросом, или же "обнаруживать" их посредством SOAP-сообщений. После обнаружения подходящих партнеров организации, используя этот механизм, могут "интегрировать" с будущими партнерами свои услуги и предоставлять их своим клиентам.