Содержание к диссертации
Введение
Глава 1. Обзор современных систем и программ обучения иностранным языкам с помощью новых информационных технологий .
1.1. Краткая история преподавания английского языка как иностранного 10
1.2. Компьютерное обучение языкам (Computer Assisted Language Learning-CALL) 12
1.3. Некоторые аспекты применения новых информационных технологий (ИНТ) в образовании 19
1.3.1. Сетевые технологии и телекоммуникации 19
1.4. Характер и педагогические возможности компьютера как посредника в овладении основными функциями преподавания и обучения языкам 27
1.4.1. Возможности компьютера и обучение чтению 27
1.4.2. Компьютер в обучении письму 28
1.4.3. Компьютеры и обучение слушанию и говорению 29
1.5. Основные проблемы и их решения 30
Выводы 45
Глава 2. Алгоритмическое разрешение лексической многозначности общеупотребительной и терминологической лексики
2.1 Проблема лексической неоднозначности 47
2.2 Теория детерминант 51
2.3 Контекстологический словарь 53
2.3.1 Основные типы словарей 53
2.3.2. Словарь для учебных целей как разновидность терминологи- ческого словаря 60
2.3.3 Основные параметры словаря для учебных целей 61
2.3.4 Контекстологический словарь как словарей для учебных целей 67
2.3.5 Основные отличия машинных словарей от обычных 71
2.4 Современные представления о корпусной лингвистике и ее методы в разрешении лексической многозначности 73
2.4.1 Разбивка текста на предложения 77
2.4.2 Типы лингвистической информации в размеченном тексте 78
2.4.3 Применение аннотированного корпуса в задачах автоматической обработки текстов 79
2.5 Алгоритм перевода многозначного слова 79
Выводы 83
Глава 3. Составление словаря терминов (спортивная терминология) в англо-персидской языковой паре
3.1.Определение назначения спортивного словаря 85
3.2. Проблема описания термина 88
3.3. Общий порядок составления англо-персидского словаря спортивных терминов 95
3.4. Основные характеристики контекстологического спортивного словаря 100
3.5 Проверка эффективности словаря 104
3.6. Использование контекстологического словаря в обучении английскому языку как второму языку 119
Выводы 112
Заключение 113
Список литературы 115
Приложения 125
- Компьютерное обучение языкам (Computer Assisted Language Learning-CALL)
- Характер и педагогические возможности компьютера как посредника в овладении основными функциями преподавания и обучения языкам
- Словарь для учебных целей как разновидность терминологи- ческого словаря
- Общий порядок составления англо-персидского словаря спортивных терминов
Введение к работе
Актуальность исследования
За последние годы компьютерное обучение языкам (Computer Assisted Language Learning -CALL) превратилось в отдельную, специфическую область знаний со своей методикой, программными средствами, целями и задачами. В громадной индустрии развитых стран, где количество программ насчитывает тысячи, поставщиками программ являются частные фирмы, учебные заведения и методические центры.
В самой типологии компьютерных обучающих программ воплощены в динамике развития идеи когнитивной психологии, искусственного интеллекта, методики и педагогики. Среди различных дисциплин в компьютерном обучении иностранным языкам отводится особая роль. Одна из причин заключается в том, что в изучении языка усматривается процесс, использующий весь спектр человеческих возможностей познания.
Развитие типологии систем CALL отражает изменение самого процесса обучения: от подхода, ориентированного на преподавателя (teacher-oriented approach) в первых бихевиористических программах — тренажерах, до подхода, полностью ориентированного на обучающегося (student-oriented approach), или другими словами, от программ, где обучающемуся отводилась пассивная роль, до программ, которые давали полную свободу творчества. Компьютер при этом призван выполнять роль вспомогательного средства.
Овладение любым видом деятельности реализуется только лишь в результате активных действий обучающегося в данном виде деятельности, что связано также с фактором самостоятельности. Образовательная деятельность должна быть личностно-ориентированной, то есть дифференцированной с учетом различных свойств и качеств личности.
По мнению ряда специалистов, личностно-ориентированное обучение предполагает, прежде всего, смену парадигмы образования. Если
раньше приоритет в системе обучения принадлежал деятельности обучающего, то в наши дни приоритет как бы «сдвинут» в сторону деятельности обучающегося. Старая парадигма образования: обучающий - информация -обучающийся с приходом новых информационных технологий в ряде случаев постепенно заменяется на новую: обучающийся - информация - обучающий. При этом последний приобретает новый статус, не менее значимый, но иной. Задача обучающего - организовать познавательную (когнитивную) деятельность обучающегося, научить его самостоятельно добывать знания, свободно ориентироваться в них, применять полученные знания на практике, формировать собственное мнение, использовать ранее полученные знания для получения новых знаний в качестве основы. Поэтому во всех технологически развитых странах мира поворот в развитии дидактических технологий в ходе реформирования систем образования сделан в сторону обучения умению работать с нужной информацией творчески и самостоятельно, критически анализировать получаемые знания и применять их для решения практически важных задач [Потапова 2002].
Одним из условий успешной работы компьютерных обучающих систем является наличие в них двуязычного словаря, не только покрывающего весь лексический объем изучаемых текстов, но и позволяющего вводить новые тексты. Таким словарем может являться контекстологический словарь, впервые разработанный и созданный Ю.Н. Марчуком. Несмотря на то, что прошло значительное время после появления первого словаря такого типа, в практике прикладной лингвистики эти идеи используются явно недостаточно.
Среди разнообразных форм применения контекстологического словаря Ю.Н. Марчук выделил также и возможность применения его в качестве справочного пособия при обучении английскому языку (Marchuk 1979). Существующие контекстологические словари используются в основном в качестве пособий переводчикам. Составление словаря терминов (спортивная терминология) в
6 англо-персидской языковой паре может использоваться в качестве учебного словаря как самостоятельно, так и в составе компьютерных обучающих систем. Контекстологический словарь обладает всеми функциями, присущими учебным словарям. Контекстологический словарь, объединяющий словарноцентрический и текстоцентрический подходы, полезен при изучении устанавливающейся предметной области (в данном случае речь идет о современном направлении в методике преподавания иностранных языков -обучение языку с помощью компьютера - Computer Assisted Language Learning (CALL)), т.к. значение любого термина уточняется решающим образом именно посредством контекста [Potapova & Shigina 2003].
Объект исследования
Описываемый в нашем диссертационном исследовании лексикон спорта является очень молодым, он находится в стадии формирования в персидском языке. Таким образом, объект нашего исследования представляет собой интерес в том плане, что в отличие от изучения и описания давно сформировавшихся подъязыков и специальных лексиконов (например, подъязык медицины) профессиональный лексикон спорта находится в стадии становления.
Целью данного исследования является изучение структуры лексикона спорта и создание контекстологического словаря для использования в компьютерной системе обучения персидскоговорящих учащихся английскому языку на материале терминов спорта. При этом мы исходим из следующих положений:
современные системы машинного перевода будут совершенствоваться и давать лучший перевод;
эффективность систем зависит от полноты и эффективности работы словарей системы;
3. в рамках определенной предметной области возможно методом
контекстного анализа и с помощью автоматического контекстологического словаря разрешать лексическую многозначность слов-терминов;
4. модель перевода на уровне переводных соответствий применима также и к языкам различной морфологической и грамматической структуры -восточным языкам.
Задачи исследования
1. Отобрать представительный массив спортивных текстов на английском
языке для составления словаря англо-персидских спортивных терминов, а также
выбрать из существующих англо-персидских словарей современные для
корректировки перевода спортивных терминов.
2. Составить контекстологический словарь для перевода спортивных
терминов с английского языка на персидский, опираясь на контексты для
перевода многозначных терминов и давая толкования для однозначных
терминов.
3. Проверить эффективность работы составленного контекстологического
словаря англо-персидских спортивных терминов на новых текстах, не
участвовавших в составлении словаря.
4.Дать рекомендации о порядке использования составленного словаря в обучении английскому языку персоговорящих студентов в рамках технологии современного компьютерного обучения языку.
Методика исследования
В исследовании использовались различные методы и приемы лингвистического анализа: экспериментальные, компонентный анализ, анализ параллельных текстов, контрастивная лингвистика, алгоритмы перевода терминов.
Научная новизна исследования заключается в том, что: 1.Впервые подвергнут комплексному анализу формирующийся профессиональный лексикон предметной области спорта как новой сферы деятельности, находящейся в стадии становления.
Впервые выбрана языковая пара в области спорта "европейский-восточный языки".
Выявлена специфика терминов вышеуказанной области на лексическом и семантическом уровнях.
Предложен аналитический подход к организации и подаче лексического материала в структуре созданного в ходе исследования автоматического словаря для учебных целей, который позволяет расширить его функции и предоставляет большие потенциальные возможности для совершенствования лингвометодической организации лексики.
Теоретическая значимость диссертации заключается в том, она способствует дальнейшему развитию теоретических аспектов лексикографии и вносит существенный вклад в изучение язьжовых подсистем. Результаты структурно-семантического и тематического анализа профессиональных лексиконов могут быть использованы для изучения других терминологий, их семантических полей, лингвистической и методической типологии словарного материала. По результатам исследования могут быть сделаны рекомендации по разработке переводных словарей любой отрасли науки и техники.
Положения, выносимые на защиту
Профессиональный лексикон предметной области спорта может быть описан в терминах контекстных употреблений и быть представлен в виде контекстологического словаря англо-персидской языковой пары.
Система алгоритмов такого словаря может быть запрограммирована в рамках компьютерного обучения английскому языку персоговорящих учащихся.
Система контекстологического представления терминов спорта является открытой и допускает пополнения и совершенствование в рамках модели перевода по переводным соответствиям.
Дальнейшее развитие контекстологического представления терминов в
англо-персидской языковой паре позволит выделить структурные особенности такого соответствия для применения полученных результатов в решении других задач алгоритмизации обработки текстов.
5. Полученный словарь может использоваться и в других системах машинного перевода и автоматической обработки текстов. Структура исследования
Диссертационное исследование состоит из введения, трех глав, заключения, списка литературы и приложений.
Библиография включает в себя список использованной в настоящем диссертационном исследовании отечественной и зарубежной литературы, а также список использованных словарей и список источников, из которых были взяты текстовые массивы для выполнения практической части исследования.
Первая глава посвящена рассмотрению современных систем компьютерного обучения иностранным языкам.
Во второй главе проводится исследование алгоритмического разрешения лексической многозначности общеупотребительной и терминологической лексики анализируется Контекстологический словарь и его роль как словаря для учебных целей в разрешении лексической многозначности.
Третья глава посвящена составлению словаря терминов (спортивная терминология) в англо-персидской языковой паре и проверке эффективности словаря. В ней определяется состав исходного массива текстов (сколько словоупотреблений), описывается методика отбора текстов контекстные связи терминов, разрабатываются алгоритмы перевода терминов, а также проводится проверка эффективности перевода терминов на новом материале.
В заключении подведены итоги исследования и сформулированы основные выводы.
Компьютерное обучение языкам (Computer Assisted Language Learning-CALL)
За последние годы компьютерное обучение языкам (Computer Assisted Language Learning -CALL) превратилось в отдельную, специфическую область знаний со своей методикой, программными средствами, целями и задачами. В громадной индустрии развитых стран, где количество программ насчитывает тысячи, поставщиками программ являются частные фирмы, учебные заведения и методические центры. В этих условиях в CALL воплощается и проверяется большое число идей как новых, так уже известных в традиционных формах обучения. Экспериментальная и поисковая направленность в разработке программ прослеживается также в позиции методистов и преподавателей. Вероятно, в процесс обучения должны быть включены когнитивные, аффективные (эмоциональные) и бихевиористические (поведенческие) аспекты, и каждый из них может быть источником новых: идей [Потапова 2002; 1990, Penington 1989, Розин 2004].
В самой типологии компьютерных обучающих программ воплощены в динамике развития идеи когнитивной психологии, искусственного интеллекта, методики и педагогики. Среди различных дисциплин в компьютерном обучении иностранным языкам отводится особая роль. Одна из причин заключается в том, что в изучении языка усматривается процесс, использующий весь спектр человеческих возможностей познания. Однако к признанию этого факта пришли не сразу. Первыми обучающими программами были программы, построенные по жесткой бихевиористической формуле «стимул - реакция», где обучающемуся отводилась пассивная роль (роль объекта, а не творческого субъекта обучения). Когнитивные же процессы вообще не являлись предметом обучения или анализа [Беляева 2002]. Разработке альтернативных бихевиористической модели методов обучения способствовали идеи ряда ученых, которые не только привлекли / внимание к проблемам поиска оптимальных способов обучения, но и сформулировали главную задачу - воспитание в процессе обучения личности, саморегулирующейся, самоуправляемой, способной на творческую деятельность. Методология CALL обогатилась понятиями «обучение через познавательную деятельность», «обучение через открытие», «обучение через озарение» или «инсайт». Появились новые типы программ, использующих когнитивные принципы.
Таким образом, развитие типологии систем CALL отражает изменение самого процесса обучения: от подхода, ориентированного на преподавателя (teacher-oriented approach) в первых бихевиористических программах — тренажерах, до подхода, полностью ориентированного на обучающегося (student-oriented approach), или другими словами, от программ, где обучающемуся отводилась пассивная роль, до программ, которые давали полную свободу творчества. Компьютер при этом призван выполнять роль вспомогательного средства [Потапова 2000].
В настоящее время за рубежом проблемы CALL решаются совместными усилиями различных специалистов: психологов, методистов, программистов, лингвистов, а также специалистов в области компьютерной технологии. Обмен опытом происходит и в международном масштабе. Процессы синтеза идей создают условия для новых оригинальных подходов в методике компьютерного обучения. Обогащение происходит в настоящее время за счет заимствования идей и методов из сферы искусственного интеллекта (ИИ). Эта динамическая интеграция уже породила качественно новое направление в разработке интеллектуального компьютерного обучения языку (Intelligent Computer Assisted Language Learning- 1С ALL ) [Потапова 2002, 2003].
В настоящее время поиск применения ICALL развертывается и в направлении менее структурированных гуманитарных областей знаний. В этом смысле идеология ICALL в перспективе может представлять значительный интерес как для специалистов - филологов, разрабатывающих курсы обучения теории языка, так для преподавателей иностранных языков.
Системы CALL в своем развитии прошли несколько этапов, которые оказали большое влияние на разработку программ и их типологию. На первых этапах была создана теоретическая основа для методологии линейного программированного обучения. Принципы линейного программированного обучения легли в основу первых программ CALL [Bader 2000].
Отбросив те негативные коннотации, которые несет в себе термин «бихевиоризм», необходимо отметить, что в целом при применении этих программ в учебном процессе получены положительные результаты, что отмечалось в ряде фундаментальных работ, в том числе и по обучению иностранному языку. В частности, указывалось на то, что ограниченное применение этих программ в учебном процессе с использованием ЭВМ значительно улучшает степень освоения обучающимися базовых навыков.
Основными отличиями программ такого рода на ранних этапах развития CALL были следующие характеристики: - ориентация на освоение простых навыков; - линейность структуры; - статистическое моделирование учебного процесса с недифференцированным представлением знаний; - примитивная модель обучающегося, заключающаяся в бинарной оценке его деятельности; - отсутствие учета когнитивных задач. Дальнейшим этапом в развитии компьютерных обучающих языку систем (CALL) стало воплощение в жизнь проектов по разработке автоматизированных обучающих систем.
CALL воплотили в себе простую, но оптимальную структуру обучения, применимую к различным областям знаний и профессиональных навыков. Громадным преимуществом CALL специалисты считают тот факт, что простота эксплуатации и программирования сделала их в короткий срок доступным для большого числа людей - пользователей и разработчиков. Специально для CALL были разработаны «авторские» процедурно ориентированные языки, создающие условия для легкого программирования, доступного для разработчиков, не имеющих профессиональных навыков программирования. Структура этих языков специально ориентирована на использование в обучающих системах и содержит макрокоманды, упрощающие операции ввода- вывода задания, вопроса и оценки ответа обучаемого на экран дисплея.
Характер и педагогические возможности компьютера как посредника в овладении основными функциями преподавания и обучения языкам
В нынешних условиях быстро совершенствующегося программного и технического обеспечения новых технологий компьютер стал играть большую роль в освоении и развитии навыков чтения. На самом простом уровне компьютер может быть использован для освоения и развития навыков распознавания текстов в новом алфавите. На более высоком уровне компьютеры могут быть использованы для реализации большого диапазона упражнений как механического, так и осознанного чтения и могут оказать помощь в развитии и контроле осуществления навыков понимания на уровне дискурса. Можно различать три типа чтения в рамках CALL: чтение, которое точно соответствует знакомым парадигмам различения печатного текста или других средств; чтение, которое представляет собой интересное расширение известных методов и действий и чтение, которое осуществляет значительные новые возможности в компьютерной среде.
Один общий принцип в некоторых подходах к развитию новыков чтения заключается в том, что студентам дается материал для чтения на уровне, несколько превышающем их текущие способности к чтению, с тем, чтобы поставить перед ними некоторую задачу и при этом не вызывать контрпродуктивного чувства неспособности. Второй принцип заключается в том, чтобы дать возможность выбора материалов для чтения, с тем, чтобы студенты выбрали материал, наиболее интересный для них. Третий принцип заключается в том, чтобы дать возможность каждому студенту осуществлять чтение и любую другую деятельность, связанную с чтением, на чисто индивидуальной основе. Лаборатории обучения чтению с помощью компьютера развивают методы отхода от напечатанных учебников в сторону названных выше информационных обучающих технологий. Несмотря на то, что имеется определенное сходство компьютерного обучения с существовавшим ранее методом печатных карт для обучения чтению, варианты методик CALL представляют интерес с той точки зрения, что они обеспечивают резкое возрастание возможностей. Компьютерные лаборатории могут предложить весьма обширный диапазон тем для учащихся любого уровня подготовки. Там, где это необходимо, каждый текст для чтения может быть предоставлен в весьма обширном диапазоне вариантов, от аутентичной оригинальной прозы до весьма упрощенной версии для начинающих. Таким образом студент, который встретил большое количество реальных трудностей, пытаясь прочесть текст в его оригинальной версии, получает возможность начать с упрощенной, адаптированной версии. С помощью компьютера могут быть реализованы следующие варианты чтения: аннотация, моделирование, творческое чтение, чтение без подготовки [Warshauer 1995].
Польза от применения компьютера в обучении письму оказалась не такая уж большая, как ранее об этом полагали. Главной выгодой от применения компьютера в обучении письму является: улучшение в отношении к английскому языку и вообще к письму, мотивация к письму, время, расходуемое на письмо, и представления относительно способностей письма для индивида. Для студентов, изучающих второй язык, компьютер помогает уменьшить боязнь ошибок и сократить беспокойство относительно правильности. Однако без специальных наставлений относительно использования компьютера для облегчения процесса письма, от предварительной записи до редактирования, сам компьютер, повидимому, оказывает незначительное влияние на совершенствование навыков письма у обучаемых, независимо от того, учат ли они свой первый или второй язык. Улучшение отношения к английскому языку и к письму безусловно является похвальной целью, заслуживающей того, чтобы достигать ее с помощью электронных средств, но оправдывает ли эта цель расходы по установке компьютерной лаборатории обучения письму и тренировки преподавателей в использовании новой технологии? К счастью, компьютер может также использоваться как партнер при собеседовании, как аудитория, и в меньшей степени как критик, а также помощник в отработке чтения и редактирования. Несмотря на традиционный взгляд на компьютер как на механического тренера и тренажера, он также может работать со студентом в открытом диалоге по поводу текста на любой стадии, от предварительной подготовки до редактирования. Для студентов, изучающих второй язык, эти возможности особенно полезны, когда они направлены на удовлетворение собственных потребностей [Pennington 1989].
Польза от компьютеров в обучении устной речи не менее важна и естественна, чем в программах, основанных на текстах. Как и другие средства, такие как звукозапись или книги, компьютеры осуществляют два основных способа обучения говорению и слушанию: (1) они могут создать обстановку, которая способствует обучению, и (2) они могут обеспечить тренировку в произношении и понимании устной речи. Работа в классе по обучению устной речи может быть классифицирована на пять типов заданий: свободный разговор; дискуссия под руководством учителя, направленная на решение какой-либо проблемы, деятельность, направленная на преодоление информационного разрыва и другая деятельность в рамках двух говорящих или некоторой небольшой группы, которая требует обсуждения и переговоров относительно значений; воссоздание некоторой ситуации или разыгрывание ролей; высоко структурированный разговор, такой, например, как завершение некоторого диалога, который может потребовать или не потребовать действительного говорения или слушания (например, это может быть письменное упражнение), и различные типы основанных на устной речи упражнений, не требующих взаимодействия или диалога, такие как хоровое или индивидуальное повторение, монологи или лекции, даваемые в качестве устной речи и записанные на магнитофон (например, студентами для последующего анализа с преподавателем) или используемые как стимул для упражнений в слушании (например, небольшие отрывки речи или различные типы упражнений на правильное слушание). Последний тип заданий, в отличие от других, не основан на двустороннем разговорном взаимодействии. Для первых четырех типов компьютеры могут создавать условия для взаимодействия с различными степенями контроля. Поскольку тип задания пятый (5) отличается от других в том, что он не основан на разговоре, компьютер предоставляет уникальные возможности анализировать содержание символов для обеспечения анализа и обратной связи на индивидуальной основе пользователя [Pennington 1989, Warshauer and others 1999].
Словарь для учебных целей как разновидность терминологи- ческого словаря
Учебный словарь по специальности, так же, как и терминологический словарь, ставит перед собой задачу предоставить читателю материал какой-либо конкретной терминологии, но эта задача решается ими по-разному. Создание специальных словарей в России начинается еще в 18 веке, тогда происходит формирование различных терминологий. В наше время язык науки развивается в ускоренном темпе, что ведет к совершенствованию информационно-справочного аппарата. В.Г.Гак отмечает, что лексикографии свойственны четыре группы функций, связанных с межъязыковым общением, с обучением языку, с разъяснением непонятных слов, с описанием и нормализацией родного языка, с научным изучением языка [Гак 1977], которые обслуживаются различными типами словарей, возникающими по мере необходимости. Подобного рода закономерности можно обнаружить и в научно-технической лексикографии. Здесь также применим тезис о том, что по мере развития уровня науки и, соответственно, языка науки в той или иной стране появляется первоначально двуязычный словарь пассивного типа, а затем словарь активного типа, еще позднее - толковые одноязычные словари. Научно-техническая лексикография в настоящее время представлена следующими видами лексикографических изданий: предметные указатели, являющиеся приложениями к монографиям, учебникам; списки ключевых слов; классификаторы и рубрикаторы; одноязычные терминологические словари, которые подразделяются по содержанию и по функциям; многоязычные терминологические словари; тезаурусы; сборники рекомендуемых терминов; терминологические стандарты; глоссарии (одно-, двух- и многоязычные), прилагаемые к различным работам. Частично они служат основой для создания учебного словаря по специальности [Варинская 2005]
Учебный словарь по специальности призван быть справочным пособием обучающего характера, что ведет в процессе формирования теоретических основ его построения к объединению нескольких типов словарей. Он должен образовывать, совмещая в себе свойства «чистых» типов, промежуточный тип, характеризующийся выраженной обучающей направленностью.
Комплексный учебный словарь по специальности коммуникативной направленности, как и любой другой учебный словарь, не может быть составлен без учета опыта лексикографической работы как теоретического, так и практического характера. Ощущается настоятельная необходимость обобщения опыта составления учебных словарей с целью определения основных параметров учебных словарей, что во многом облегчит и организует работу по их составлению, исключит возможность дублирования изданий, подскажет оптимальные пути в процессе работы [Саморукова 2001].
Создание типологии словарей предполагает выделение определенных лексикографических характеристик, параметров, служащих основаниями для классификации, описания и оценки словарей, а также их проектирования. Выделение таких параметров дает возможность формализации и некоторого упрощения технологии создания словарей и унификации их композиционных средств. Такая унификация облегчает пользователям переход от одного словаря к другому, является одним из условий автоматизации процесса подготовки и издания словарей, позволяет автору - ученому, специалисту облегчить процесс подготовки словаря и повысить его качество [Королёва 2005].
Значительная часть параметров словарей традиционно выделяется в общей лексикографии. Так, Л.В.Щерба выделял такие параметры, как нормативность, исчерпываемость описания лексики языка, принцип презентации лексики (алфавитный или идеографический), назначение словаря (толковый или переводной), хронологическая ориентация (исторический или неисторический словарь) [Щерба 1971]. Автор учебника по лексикографии Л.Згуста к этим параметрам, из которых хронологический он несколько детализировал, добавил такие, как ориентированность на определенный пласт лексики (говоря о диалектных словарях, словарях профессий и сленга), ориентированность на определенные источники (словари цитат и конкордансов), выбор единиц описания и уровня описания (словари сокращений, идиом, пословиц и поговорок; орфографические и орфоэпические словари), объем словаря [Zgusta 1971]. В дальнейшем к этим параметрам добавляются такие, как тематическая ориентация (словари многоотраслевые, отраслевые и узкоотраслевые) [Лейчик 1981], ориентация на определенных авторов [Борисова 1985], адресация к определенным группам пользователей [Игнатьев 1974], критерии отбора единиц описания, а также различные параметры, основывающиеся на строении и наполнении словарной статьи [Анюшкина 1985]. Также наметилась тенденция к выделению лексикографических параметров на основе информации, даваемой словарями, и составлению перечней таких параметров [Андрющенко 1985, Городецкий 1983, Караулов 1982, и др.]. При этом под лексикографическим параметром в самом общем виде понимается способ лексикографической интерпретации того или иного структурного элемента или функционального явления языка и их экстралингвистических соответствий.
Общий порядок составления англо-персидского словаря спортивных терминов
Спорт - это средство, сближающее людей разных национальностей, культур и религий, дающее возможность общаться даже без знания языка. Но, не смотря на это, и здесь перевод, в общем, и перевод спортивной терминологии является немаловажной задачей для осуществления коммуникации, для более точного понимания и восприятия.
Термины, т. е. специальные слова, которые используются для точного выражения понятий и называния вещей в данной отрасли производства, деятельности, знания играют немаловажную роль при переводе. Ошибки при переводе терминов обычно приводят к серьезным смысловым искажениям подлинника. Чтобы избежать подобных ошибок, переводчик должен стремиться детально изучить ту область науки и техники, в которой он работает. Это даст ему возможность добиться исчерпывающего понимания содержания понятий, выражаемых терминами, и позволит успешно пользоваться соответствующими терминологическими словарями. На персидском языке нет спортивного словаря. Поэтому письменному переводчику приходится использовать основные приемы перевода терминов для создания адекватного и точного варианта перевода.
1. Первым шагом к составлению словаря было определение базового корпуса текстов, подлежащих переводу. Было отобрано несколько сотен страниц текстов, которые содержали большинство обычно употребляемых слов в различных относящихся к спорту и физическому воспитанию текстах. Наш подход текстоориентирванныи, то есть, словарь основан на результатах анализа различных типов текстов, а именно: а. тексты видов спорта, такие как футбол, волейбол и т.п. (на пример, Be a Sport: American English Idioms 1989). б. несколько текстов по спортивной медицине. в. репортажи о спорте по телевидению, обзоры и интервью. г. новости спорта и репортажи из Интернета (FIFA .com) и газет US Today 2005г. д. детские игры на спортивную тематику, такие как футбол, игры на CD и DVD(Mrpbi: Fifa 2004,2005). е. различные тексты по физическому воспитанию (Aquatic Exercise Therapy 2003). Следующим шагом было выписать различные слова (лексемы), которые относятся к спорту и физическому воспитанию и встречаются в отобранных оригинальных текстах. Из 300 текстов было извлечено свыше 1000 слов и затем был составлен входной словник. Для перевода и уточнения значения слов были использованы следующие словари: he Great American Heritage Dictionary -Oxford Advanced English to English Collegiate Dictionary -Webster s Sports Dictionary -Electronic Dictionary: Babylon-pro -Electronic Dictionary: ABBY Lingvo 10 Multilingual Dictionary he Arianpur Progressive English-Persian Dictionary -Контекстологический словарь для машинного перевода многозначных слов с английского языка на русский. Каждому входному слову давалась следующая информация: а - указание на часть речи. Некоторые слова оказывались омографами, в этом случае им придавался специальный индекс омографии. Например: существительное-глагол или существительное-прилагательное и т.п. В приписывании этих индексов использовался анализ исходных текстов. б - внутри каждой части речи обозначались дистрибутивные и семантические подклассы. Под этим понимаются специальные характеристики слов, окружающих данное слово в контекстах, представленных в исходном корпусе текстов. При этом мы руководствовались также особенностями персидского морфологического и синтаксического синтеза. Эти характеристики, которые влияли на синтез персидских переводных эквивалентов и порядок слов в выходном предложении, отражались в информации, приписываемой английскому слову во входном словаре. Когда вся эта информация была определена, она подвергалась специальному кодированию, т.е отражалась в специальном ярлыке, который приписывался каждому входному слову во входном словаре. В системе машинного перевода СПРИНТ этот ярлык называется "цифровым эквивалентом" и он заменяет буквенный код каждого слова в последующем анализе и синтезе. Однако выбор ярлыка находится на усмотрении программистов. Они могут предпочесть сохранить буквенный код входного слова и найти другие пути фиксирования необходимой информации. Эта информация сохраняется до конца процесса перевода.
2. Второй шаг. Он состоит из составления словаря идиом и идиоматических выражений. В алгоритме перевода это второй этап анализа входного текста. Весьма важно выделить реально существующие фразеологические единицы и не включать в словарь идиом и неразложимых оборотов такие комбинации слов, составляющие которых могут использоваться свободно от других компонентов. Идиомы анализируются окончательно и не участвуют далее в каком-либо анализе. Они получают соответствующую синтаксическую функцию из тех, которые существуют в синтаксическом анализе (обычно адвербиальную) и получают также соответствующий перевод, который записывается в информационной ячейке слова и в алгоритме перевода на этой и всех последующих стадиях представляется некоторым номером в выходном словаре.
3.Третий шаг. На этом этапе обычно составляются алгоритмы, которые анализируют и обрабатывают специфические языковые явления, принадлежащие только англо-персидскому переводу. Например, в англо 98 русском переводе специальное внимание уделяется анализу английских (-ing) форм, поскольку в английском языке они выполняют самые различные грамматические и синтаксические функции и переводятся весьма по-разному. Для выделения определенных фактов английского языка в таком аспекте требуется применить критерий перевода. В случае если каких-либо особенностей с этой точки зрения не замечено, этот этап может быть опущен. В нашем случае при составлении нашего словаря этот шаг был опущен.
4.Четвертым шагом является разрешение омонимии частей речи. Пример: "course" может быть существительным или глаголом. Все случаи омонимии были выделены в исходном корпусе текстов, систематизированы, классифицированы, и для каждого вида омонимии был составлен алгоритм ее разрешения. Эффективность этих алгоритмов весьма важна для последующего анализа.
Во входном словаре все омонимы (омографы) получают специальные индексы, или же тип омографии указывается величиной цифрового эквивалента. После работы блока общего алгоритма, разрешающего омографию, составляющим слова-омографа даются специальные цифровые эквиваленты, соответствующие реальной части речи, в качестве которой они выступают в данном контексте. Ни один из омографов не переходит на последующие этапы общего алгоритма машинного перевода.
5. Пятый шаг заключается в составлении алгоритмов грамматического анализа до перевода, Из этих алгоритмов наиболее важными и необходимыми для любой языковой пары в последующем анализе являются следующие: а) Алгоритмы определения синтаксической функции для каждого слова анализируемого предложения. Такой алгоритм начинает свою работу с выбора первого в предложении слова заданной части речи и затем анализирует контекст с целью приписать этому слову признак определенной синтаксической функции. Пример: - выбрать первое существительное в предложении - проверить, нет ли перед ним предлога - нет - проверить, не следует ли за ним глагол в личной форме - да - дать выбранному существительному признак синтаксической функции подлежащее - выбрать следующее по порядку существительное в предложении. И т.д. б) Алгоритмы для определения грамматических категорий для каждого слова определенной части речи. Например, для каждого существительного должна быть определена информация относительно того, в каком числе, единственном или множественном, оно находится, каждому выбранному глаголу должна быть определена информация относительно времени, наклонения, рода, лица, числа и т.п. в) Другие алгоритмы, которые необходимы для того, чтобы определить по входному тексту грамматическую информацию, нужную для правильного синтеза на персидском языке переводящего предложения. 6. Шестой шаг. Перевод. Каждое входное слово получает переводной эквивалент. Многозначные слова на этом этапе экспериментального алгоритма могут стать однозначными. После этой стадии обработки все последующие алгоритмы анализа и синтеза могут использовать информацию о персидском переводе текущих английских словоформ.