Введение к работе
705^/-
Актуальность работы.
Роль информационных технологий и компьютерных интерактивных
средств обучения занимает все более существенное место в образовании.
Одной из областей, в большой мере приветствующих применение
компьютерных обучающих технологий, является изучение иностранных
языков. Новые информационные технологии изучения иностранных
языков, в частности, иностранной лексики и пополнение словарного
запаса особенно востребованы в последнее время в связи с расширением
сотрудничества российских и зарубежных специалистов. Кроме того, в
последние годы отмечается рост количества студентов, слушающих
лекции на иностранных языках, либо готовящихся к обучению в
' зарубежных ВУЗах. Следует отметить новые возможности участия в
международных конференциях как молодых ученых, так и студентов. Развитие дистанционного образования и возросшие возможности подключения к сети Интернет расширили области внедрения компьютерных систем обучения иностранной терминологической лексике и обусловили повышение спроса на разработку новых адаптивно-обучающих технологий.
Практика показывает, что специалистам, сотрудничающим с иностранными коллегами и работающим со специализированной иностранной литературой, студентам, а также лицам, изучающим языки для своих профессиональных целей, приходится часто сталкиваться с проблемой недостаточного иностранного профессионально-ориентированного словарного запаса.
Последние исследования показывают, что одним из новых эффективных путей решения проблемы интенсивного накопления иностранного профессионально-ориентированного словарного запаса является применение мультилингвистической адаптивно-обучающей технологии, информационным базисом которой являются частотные словари.
При разработке аппарата алгоритмической поддержки компьютерных обучающих технологий проблеме построения модели обучаемого и модификаций ранее известных моделей в настоящее время уделяется значительное внимание. Однако, во многих алгоритмах обучения, реализуемых в компьютерных обучающих системах, не всегда отражены индивидуальность подхода к обучаемому, учет конкретных параметров процессов запоминания и забывания и формирования ассоциативного поля вокруг запоминаемых понятий. Наличие указанных факторов в сочетании с возможностью представления ученика как сложного объекта управления расширяет рамки исследования и определяет актуальность темы диссертационной работы. Одним из перспективных направлений в данной области является модификация -модели, обучения, предложенной профессором Растригиным Л.А., і *ft НАЦ^окдщцщ^йстического информационно-терминологического бариса. библиотека, і
Недостаточная автоматизация процесса формирования частотных словарей, которые являются информационно-терминологическим базисом мультилингвистической адаптивно-обучающей технологии существенно затрудняет дальнейшее исследование алгоритмов обучения. Работы в этом направлении ведутся непрерывно уже в течение ряда лет и можно особо отметить работы Усачева А. В. и Карасевой М.В. Для решения поставленных проблем Усачевым А.В. предлагается использовать прикладные технологии систем искусственного интеллекта, а именно нейронных сетей. В работе Карасевой М.В. предлагается модель формирования и структура мультилингвистического частотного словаря для трехъязычного случая. Однако не решенными остаются проблемы поиска, подбора мультилингвистической информации, ее дальнейшего анализа и обработки при формировании многоязычных словарей.
Объект исследования - процесс формирования
мультилингвистического информационного базиса систем адаптивного обучения терминологической лексике.
Предмет исследования - метапоисковая технология
автоматизированного формирования мультилингвистического
информационно-терминологического базиса.
Целью диссертационной работы является совершенствование методов автоматизации процесса формирования мультилингвистического информационного базиса систем адаптивного обучения терминологической лексике. Задачи исследования
Поставленная цель достигается путем решения следующих задач: анализ компьютерных систем обучения иностранной терминологической лексике и развитие мультилингвистической адаптивно-обучающей технологии;
анализ систем и алгоритмов поиска и метапоиска
мультилингвистической информации в сети Internet;
модификация существующих алгоритмов поиска информации,
разработка новых алгоритмов для формирования и актуализации
многоязычных (мультилингвистических) частотных словарей,
являющихся информационно-терминологическим базисом
мультилингвистической адаптивно-обучающей технологии; разработка алгоритма определения уровня релевантности Internet-отклика запросу, удовлетворяющему предметной области, с использованием частотных словарей;
модификация существующей системы адаптивного обучения с учетом новой структуры мультилингвистического информационно-терминологического базиса в виде многоязычных частотных словарей, ее программная реализация и внедрение в практику. Методы исследования. При выполнении работы использовались методы структурного системного анализа, методы измерения количественных и качественных показателей, методы оптимизации, статистические методы обработки данных, методы поиска и обработки
информации.
Научная новизна исследования состоит в следующем: разработана новая модель поиска мультилингвистической информации в глобальной сети Internet, отличающаяся от известных процедурами формирования запросов и обработкой отклика, которые базируются на узкоспециализированных многоязычных частотных словарях;
впервые предложена методика обеспечения заданного уровня релевантности электронных документов требуемой предметной области, использующая мультилингвистический информационно-терминологический базис;
разработан новый алгоритм ранжирования информации для мультилингвистической метапоисковой технологии, отличающийся тем, что при ранжировании используется ранг сайта в системе, ранг документа внутри сайта, а также изменение ранга сайта для системы в целом;
разработан алгоритм анализа и обработки мультилингвистической информации, позволяющий эффективно формировать частотные словари как для структурированных, так и неструктурированных языков.
Значение для теории: теоретически обоснована возможность
применения метапоисковой технологии автоматизированного
формирования мультилингвистического информационно-
терминологического базиса для систем адаптивного обучения терминологической лексике.
Результаты, полученные при выполнении диссертационной работы, создают теоретическую основу как для повышения эффективности функционирования адаптивных систем обучения, так и для улучшения качества компьютерной обработки информации при формировании информационно-терминологического базиса данного класса систем. Это возможно в рамках нового направления в метапоисковой технологии анализа и обработки информации в Internet, основанного на коллекциях узкоспециализированных мультилингвистических частотных словарей.
Практическая ценность. Разработанные в диссертации программные системы поиска и формирования частотных словарей поддержки мультилингвистической адаптивно-обучающей технологии применены при создании компьютерных интерактивных средств изучения профессионально-ориентированной иностранной лексики на базе системы "Virtual Teacher 1.2".
Использование мультилингвистической информационной базы и ассоциативных параметров мультилингвистической модели способствует эффективному применению алгоритма обучения, позволяя при этом интенсивно пополнять иностранный профессионально-ориентированный словарный запас. Предложенная модель поиска и определения релевантности предметной области включена в модель поисковой подсистемы АСУ ГУЦМиЗ.
Использование системы позволяет:
эффективно формировать и актуализировать информационно-терминологический базис адаптивно-обучающей технологии;
интенсивно пополнять иностранный профессионально-
ориентированный словарный запас при использовании новой структуры
многоязычного информационно-терминологического базиса
мультилингвистической адаптивно обучающей технологии.
Реализация результатов работы.
Разработанная автором диссертации компьютерная система обучения принята в опытную эксплуатацию на кафедре информатики Красноярского государственного технического университета, в Государственном университете цветных металлов и золота, в корпоративном университете РУСАЛа при обучении студентов по курсам "Системный анализ", "Проектирование информационных систем", "Открытые системы, сети и телекоммуникации" и "Интеллектуальные информационные технологии".
На представленные разработки получен сертификат, подтверждающий авторские права, в федеральной службе по интеллектуальной собственности, патентам и товарным знакам Российской Федерации № 2005620057 от 21.02.2005.
Две авторские разработки прошли регистрацию в отраслевом фонде алгоритмов и программ:
№ 02067913.00022-01. Per. № ОФАП 3818 от 09.03.2004 г.
№ 03534577.00913-01. Per. № ОФАП 4359 от 03.02.2005 г. Основные тезисы, выносимые на защиту
-
Разработанный алгоритм и методика формирования мультилингвистических частотных словарей, основанная на использовании Internet ресурсов и средств метапоисковой технологии, позволяет повысить скорость построения информационно-терминологического базиса и превосходит по эффективности существующие методики.
-
Разработанный мультилингвистический частотный словарь администратора системы позволяет ускорить процесс актуализации словарей пользователя, структурирующих рабочую информацию.
-
Предлагаемые принципы работы алгоритмов и процедур поиска информации и составления словарей администратора и пользователя системы обучения обеспечивают эффективную и комплексную информационно-алгоритмическую поддержку мультилингвистической адаптивно-обучающей технологии.
-
Адаптация существующей системы обучения к новой структуре словаря пользователя обеспечивает языковую универсальность системы обучения.
-
Использование мультилингвистических частотных словарей в рамках предлагаемых алгоритмов и процедур поиска и ранжирования информации повышает эффективность сетевых поисковых систем, реализующих процедуры определения релевантности и ранжирования
электронных документов.
Апробация работы. Основные положения и результаты работы прошли всестороннюю апробацию на всероссийских и международных конференциях, научных семинарах и научно-практических конференциях. В том числе:
на второй региональной научной конференции «Формирование информационного общества на рубеже XX-XXI веков»;
на всероссийской научно-практической конференции «Воспитание молодого российского интеллигента: проблемы, тенденции, пути решения»;
на V всероссийской очно-заочной научно-практичной
конференции «Интеграция методической работы и системы повышения квалификации кадров»;
на международной открытой научной конференции «Современные проблемы информатизации в технике и технологиях»;
на XIV международной конференции выставке «Информационные технологии в образовании» (Москва 2004 г.);
на международной конференции «14th 1ST Mobile & Wireless Communications Summit» (Дрезден - Германия 2005 г.).
Диссертационная работа в целом обсуждалась на научных семинарах кафедры Информационных технологий Государственного Университета Цветных Металлов и Золота (2002-2005 гг.), семинарах НИИ СУВПТ (2002-2005 гг.), кафедры Информатики Красноярского Государственного Технического Университета (2003-2005 гг.), совместных семинарах международных отделов КГТУ и ГУЦМиЗ.
Основные результаты исследований были отмечены следующими научными грантами:
грант ГУЦМиЗ по системе автоматизации процесса обучения
(2003-2005 гг.);
грант SITE project - «Siberia, Information Technologies and Europe»
ITS-004123 (2005 г.).
Публикации. Основные результаты диссертационной работы опубликованы в 15 работах автора (7 из них - статьи), список которых помещен в конце автореферата.
Структура и объем работы. Диссертационная работа состоит из введения, четырех разделов, заключения, списка литературы.