Содержание к диссертации
Введение
ГЛАВА I. Проявление лексической амбивалентности естественного языка в официально-деловой документации 10
1.1 Категория неоднозначности в естественном языке сквозь призму лексической амбивалентности 10
1.2 Отличительные черты официально-делового стиля как механизм порождения в нем амбивалентности 24
1.3 Лексика официально-делового стиля как источник амбивалентности при переводе и модель ее разрешения естественным интеллектом 39
Выводы по первой главе 49
ГЛАВА II. Источники лексической амбивалентности в естественном языке 51
2.1 Общие вопросы омонимии как источника лексической амбивалентности 51
2.2 Акронимизация как частный случай омонимии 65
2.3 Общие вопросы полисемии как источника лексической амбивалентности 71
2.4 Проблема дифференциации между источниками лексическойамбивалентности 83
Выводы по второй главе 93
ГЛАВА III. Системы машинного перевода как среда функционирования амбивалентной лексики 95
3.1 Машинный перевод как пример систем искусственного интеллекта... 95
3.2 Классификация систем машинного перевода и методы оценки эффективности их работы 101
3.3 Обработка амбивалентной лексики системами машинного перевода и особенности ее функционирования 121
Выводы по третьей главе 184
Заключение 186
Принятые сокращения 189
Список литературы
- Отличительные черты официально-делового стиля как механизм порождения в нем амбивалентности
- Лексика официально-делового стиля как источник амбивалентности при переводе и модель ее разрешения естественным интеллектом
- Общие вопросы полисемии как источника лексической амбивалентности
- Обработка амбивалентной лексики системами машинного перевода и особенности ее функционирования
Отличительные черты официально-делового стиля как механизм порождения в нем амбивалентности
Существование неоднозначности как категории присуще в качестве характерной черты любой концепции, идее, утверждению и пр. Так, неоднозначность проявляется при написании функций и выражений в таких научных дисциплинах, как физика и математика, несмотря на использование в них четкой системы особых обозначений и уникального языка. Она встречается в социологии и социальной психологии, где может применяться к неопределенным, с точки зрения их восприятия, ситуациям поведения и реакции человеческих индивидов в социуме. Кроме этого, неоднозначность встречается в музыкальных произведениях и визуальном искусстве (живопись, фотография), где примером может послужить знаменитый Куб Неккера (см. рис. 1) как оптическая иллюзия и феномен «мультиустойчивого восприятия» [186]. Термин же «неоднозначность» является междисциплинарным и обозначает такую ситуацию, при которой информация, слово, данные, изображение, параметр, поступок и пр. не имеют определенной интерпретации и требуют принятия ряда шагов, иногда связанных в алгоритм, с целью сведения возникшего ряда значений толкования неоднозначности к единственно верному в данной конкретной ситуации.
Существует преднамеренное и непреднамеренное применение неоднозначности в высказываниях, спорах, аргументах в философии, политике, логике, риторике, что соотносит неоднозначность со смыслоразличительной стороной человеческого языка и, как следствие, разделом языкознания — семантикой.
В словаре «Неоднозначный — могущий принимать разные значения / допускающий различное понимание, оценку и т. п.» . Если обратиться к зарубежным англоязычным словарным статьям, то, согласно Oxford Dictionary of English, "ambiguity — the quality of being open to more than one interpretation; inexactness"3. Collins Cobuild Advanced Learner s English Dictionary трактует этот термин так: "If you say that there is ambiguity in something, you mean that it is unclear or confusing, or it can be understood in more than one way"4. А само слово "ambiguity" в английском языке (неоднозначность, неопределенность, неясность, двусмысленность) имеет следующее происхождение: "late Middle English: from Old French ambiguite or Latin ambiguitas, from ambiguus — doubtful". Где слово "doubtful" имеет значения: «неопределенный, неясный, сомнительный»5. Следует отметить, что термин «неоднозначность» не претендует на универсальность, и существует несколько так или иначе связанных параллельных аналогов. Пожалуй, одним из них является «амфиболия». Данный термин восходит к философии И. Канта6. Под амфиболией в лингвистике понимается двойственность (двусмысленность), получающаяся от того или иного расположения слов или от употребления их в различных смыслах, смешение понятий. У амфиболии множество причин: многозначность, омонимы, омофоны, омоформы и многое другое .
Еще одним междисциплинарным термином, соотносимым с неоднозначностью, является «эквивокация» — «логическая ошибка, заключающаяся в том, что одно и то же слово используется в разных значениях в одном рассуждении. Слова естественного языка, как правило, многозначны, поэтому всегда существует опасность совершить эквивокацию в рассуждении или в понимании рассуждения»8.
Об этом же говорит и термин «неопределенность» — многозначность и свободность (свобода) толкования в контексте отдельного термина или целого выражения, смысл которого может быть установлен только после доопределения9.
Впервые вопрос неоднозначности как по-настоящему актуальная и знаковая проблема в лингвистике возник в 60-е годы XX столетия, когда исследователи приступили к решению задачи по использованию компьютеров для анализа языка. Немедленно выяснилось, что любой фрагмент речи, который кажется непротиворечивым для человека, обладает высокой степенью неоднозначности для машины, даже когда иные его интерпретации не являются очевидными для носителя данного языка. Связано это с тем, что система машинного перевода, обладая большим объемом грамматических правил и обширным словарем, может найти сотни и тысячи интерпретаций для предложения, которое внешне кажется совершенно обыкновенным для человека, чей разум способен моментально отсечь побочные варианты интерпретации того или иного высказывания и выбрать правильное понимание по контексту, избегая неудачи коммуникации.
Неоднозначность в языке заставляет ученых искать пути к ее разрешению, а значит требует от них глубокого понимания вопроса. Не секрет, что компьютерные науки оказывают огромное влияние на лингвистику и основной целью тех, кто занимается исследованиями на стыке этих двух дисциплин, является обработка естественного языка (ОЕЯ)10.
Некоторые зарубежные авторы (Е. Gibson, К. Mahowald, Е. Fedorenko, S. Т. Piantadosi) полагают, что «источником неоднозначности в коммуникации могут послужить короткие, часто используемые слова, которые со временем «обрастают» все новыми значениями. Вместе с тем потенциал каждого нового контекста, в котором они употребляются, решает проблему в их понимании и снимает неоднозначность, позволяя нам использовать их снова и снова, тем самым экономя речевые усилия, донося желаемую информацию до адресата в общении без опаски быть непонятыми» [177, pp. 313-318].
Говоря о неоднозначности в языке, в первую очередь следует отметить лексическую неоднозначность, которая возникает в том случае, когда лексическая единица, обладающая более чем одним значением, будучи используемой в речи может вызвать проблему лексической смысловой идентификации. «Неоднозначность проявляется в том, что одному означающему соответствуют разные означаемые. Речь идет о наличии у языкового знака двух или более значений. Языковой знак является двусторонней единицей языка, представляющей собой единство плана содержания (означаемого) и плана выражения (означающего)» [123].
Лексика официально-делового стиля как источник амбивалентности при переводе и модель ее разрешения естественным интеллектом
Процессы экономического и политического развития общества с каждым годом становятся все более интенсивными. Новые технологии расширяют области их применения и занимают места на международной арене. Устанавливается постоянный рост и развитие экономических контактов и связей между странами в рамках стремительной глобализации, влекущей обмен опытом, знаниями, а также сотрудничество различных государств. Для разрушения языковых барьеров между сторонами, принимающими участие в коммуникации, требуется профессиональный устный или письменный перевод. При этом профессионализм переводчиков оценивается на основе их личной специализации в разных сферах: экономика, финансы, право, медицина и т. д.
На современном этапе развития общества как наиболее перспективный и востребованный видится перевод официально-деловой документации в силу широкого распространения деловых контактов между партнерами, говорящими на разных языках. Как правило, такая документация существует в письменной регламентированной форме и служит для регулирования правовых и деловых отношений юридических и физических лиц.
Отсюда следует, что на первое место выносится максимальная адекватность и полнота передачи смыслового содержания, поскольку, например, существенной стороной перевода документов физических лиц является их дальнейшая легализация, наличие у них юридической силы для предъявления за пределами родного государства.
Поэтому основные требования к переводу официально-деловых текстов в современной коммуникации является довольно жесткими. К ним относят: 1) точность (все положения, трактуемые в оригинале, должны быть изложены в переводе); 2) сжатость (все положения оригинала должны быть изложены кратко и лаконично); 3) ясность (условия предыдущего пункта не должны искажать понимание лексики); 4) литературность (текст перевода должен удовлетворять общепринятым нормам литературного языка, без употребления синтаксических конструкций языка оригинала) [140].
М. В. Умерова отмечает также, что «перевод заголовка документа, если он раскрывает сущность вопроса, должен быть максимально близок к оригиналу, если же он отличается краткостью или носит рекламный характер, то переводчик добавляет краткую аннотацию в информационных целях. Все сокращения, встречающиеся в тексте оригинала, должны быть расшифрованы в соответствии с общепринятыми и специальными сокращениями. Сокращения, не поддающиеся расшифровке, остаются на языке оригинала» [121, с. 132-137].
Но, несмотря на наличие четко сформулированных требований к переводу для ОДС, существуют случаи, вызывающие затруднения у переводчика с английского языка на русский, а порой приводящие к ошибкам. Связаны они с возникающей лексической амбивалентностью. Чтобы проиллюстрировать механизм ее функционирования в официально-деловой документации, воспользуемся какой-либо классификацией типичной для ОДС лексики, то есть лексических единиц, часто используемых в данном стиле. Для этого обратимся, например, к классификации Ф. М. Ярмухамедовой, в которой автор выделяет:
Например, addresser — addressee = адресант — адресат. Амбивалентность на этом уровне отсутствует, поскольку может возникнуть, только если рассматривать такие пары как паронимы (слова близкие по звучанию друг другу). Однако надо отметить, что речь идет исключительно о письменном переводе.
Употребление аббревиатур и сокращений может носить амбивалентный характер, вызывая сложности при работе с ними, особенно при омонимичности аббревиатур и акронимов.
Полисемичностъ, или многозначность, будучи источником амбивалентности — черта, свойственная различным терминам, употребляемым в текстах ОДС. Например, subject — 1) подданный; 2) предмет (договора, иска и т. д.); 3) субъект; 4) объект; 5) тема, вопрос, предмет; 6) подвергать; 7) подчинять / подчиненный, зависимый, подвластный; 8) подлежащий, зависящий19.
Традиционно в английском языке «парные синонимы», например, terms and conditions — постановления и условия (договора), используются в ОДС для достижения наибольшей точности, следовательно, на этом уровне амбивалентность не может быть зафиксирована.
Об общеупотребительных словах и словосочетаниях было сказано в предыдущем параграфе, где отмечалась свойственная им амбивалентность.
Специфические английские обороты, такие как to make default — не исполнять обязанности или in good faith — добросовестно, могут порождать амбивалентность на переводящем языке, но только в том случае, когда они переводятся дословно или калькируются переводчиками. Поскольку же это не является профессиональной компетенцией, то и не может всерьез рассматриваться как источник амбивалентности.
Американский и британский английский могут стать проблемой с порождением амбивалентности на лексическом уровне для переводчика, практикующего какой-то один вариант в своей работе.
Латинские и французские заимствования не сказываются на возникновении амбивалентности и не создают каких-либо проблем с интерпретацией фрагмента текста, в котором они употребляются.
Подводя итог, можно отметить, что при работе с английскими деловыми текстами переводчик сталкивается с лексической амбивалентностью, которая функционирует на: уровне различных вариантов одного языка, когда разница семантики слов играет существенную роль для конечного результата перевода.
Далее рассмотрим модель работы механизмов естественного интеллекта человека, которые помогают ему решать проблему амбивалентной лексики и избегать провалов при коммуникативных актах, в том числе и в упомянутых выше случаях проявления амбивалентности в текстах официально-деловой документации.
Данный вопрос требует пояснения и поиска подходящей модели, способной описать и проиллюстрировать работу подобных механизмов. Мы считаем, что ключом к снятию возникающей в речи амбивалентности является способность нашего мозга визуализировать письменный или устный коммуникативный акт.
Общие вопросы полисемии как источника лексической амбивалентности
Говоря о системах машинного перевода (СМП), следует вначале обратиться к толкованию термина «искусственный интеллект» (ИИ) и определить, чем он отличается от интеллекта естественного. Искусственный интеллект, во-первых, это теория создания программных и аппаратных средств, способных осуществлять интеллектуальную деятельность, сопоставимую с интеллектуальной деятельностью человека; во-вторых, это сами программные аппаратные средства, а также выполняемая с их помощью деятельность.
Необходимо также рассмотреть определение термина искусственный интеллект: «1) научное направление, ставящее целью моделирование процессов познания и мышления, использование применяемых человеком методов решения задач для повышения производительности вычислительной техники; различные устройства, механизмы, программы, которые по тем или иным критериям могут быть названы «интеллектуальными»; 3) совокупность представлений о познании, разуме и человеке, делающих возможным саму постановку вопроса о моделировании интеллекта»75.
«Большой психологический словарь» трактует этот термин следующим образом: «направление в компьютерной технологии, ставящее перед собой цель создания компьютеризованных систем с использованием аналогов интеллектуальных функций человека»76.
С другой стороны, термин естественный интеллект определяется как «интегральный продукт, результат творческой умственной деятельности, формирующейся в процессе индивидуального развития личности и содержащий элементы нетривиального продуктивного мышления, многозначной логики, механизмы формирования биологически и социально значимой информации» [130].
На современном этапе развития науки и технологий человеку под силу создать такую систему искусственного интеллекта, работа которой может быть практически не отличимой от деятельности человеческого интеллекта. Можно предположить, что искусственное и естественное — не противопоставленные понятия. Они взаимодополняют друг друга, облегчая сосуществование человека и окружающей действительности, обеспечивают единство и взаимосвязь его деятельности и методов познания окружающего мира.
Для нас такая взаимосвязь представляет особый интерес, когда речь идет об использовании программ машинного перевода как примера искусственных интеллектуальных систем и их влияния на повседневную жизнь человека. Актуальным вопросом видится то, как системы машинного перевода формируют образ мышления homo sapiens, меняя его отношение к познанию иностранных языков и роль их изучения в его жизни, к переводу и т. д.
Программы машинного перевода разрушили все языковые барьеры. Современный автоматический перевод позволяет «на лету» переводить целые веб-страницы, сообщения электронной почты и в социальных сетях. Это значительно упрощает процессы коммуникации в современном мире. «Машинный перевод становится характерной чертой повседневного быта современного человека: общение с носителями иностранного языка, доступ к всевозможным иноязычным источникам информации и т. д. Основная задача этих систем — сделать их средством повышения уровня комфорта человека» [62, с. 61-63].
«Однако в последнее время эти средства делают человека своим заложником. Основная причина — нехватка времени для постоянно растущего объема информации, который также связан с развитием технологий в современном мире и абсолютной информационной децентрализацией. Эти технологии уже сейчас обладают основными свойствами биологического организма: веб-серверы, электронные библиотеки, базы данных и пр. «заменяют» человеку естественную память. Нет возможности усвоить весь тот объем информации, который они предоставляют. Необходим постоянный доступ к сети и возможность получать информацию на всех языках мира» [там же].
Системы искусственного интеллекта видятся своеобразной «ловушкой» для человека, который в последнее время начинает все чаще отдавать им право принятия решения. Так, например, он, не зная какого-либо иностранного языка, будет полагаться на машину, которая выполнит для него перевод, что создает среду, которая управляется уже не им, а машиной.
«При этом также следует понимать, что достаточная степень автономности и неконтролируемости программ машинного перевода со стороны человека порождает проблемы, связанные с доверием к результатам информационно-перерабатывающей деятельности. В силу невозможности личной проверки принятых машиной решений в области перевода, вызванных недостатком собственных знаний и, следовательно, полного контроля над ее деятельностью, человек в той или иной степени вынужден как бы перекладывать часть ответственности на машину» [там же].
Следовательно, степень ответственности, возлагаемой на машину, напрямую связана с уровнем знаний индивида. Это справедливо как для систем машинного перевода, так и для любой другой системы искусственного интеллекта.
Рассмотрим принципиальное отличие естественного интеллекта переводчика от искусственного интеллекта машины. В след за Д. В. Балагановым мы полагаем, что «важными в восприятии текста на иностранном языке и переводческом процессе для человеческого сознания будут являться определенные факторы, влияющие на адекватную обработку информации» [16].
Среди них можно выделить некоторые субъективные (1) и объективные факторы (2): 1) мотивация переводчика, цели, задачи, желания, настроения и пр. 2) характеристики текста: степень смысловой организованности воспринимаемого материала, зависимость между результативностью осмысления и плотностью смысловой связности предложений в тексте, соотношение ИЯ и ПЯ, графический вид текста, звуковое воздействие, освещение и пр. [там же].
«К субъективным факторам, влияющим на понимание исходного текста, также относятся такие, как личность самого переводчика, наличие в тексте незнакомых слов, знание реципиентом грамматических явлений, прошлый опыт и знания переводчика. К числу объективных факторов, оказывающих влияние на понимание текстового сообщения, относится группа, связанная с характером исходного текста. В нее входят такие моменты, как структурные и стилистические особенности исходного текста, его специфичность и сложность для понимания, композиционно-смысловая структура и информационная насыщенность текста, языковая выраженность смысловых отношений. Нельзя исключать и влияние ситуации, в которой выполняется перевод, а именно: психологическую атмосферу, в условиях которой осуществляется данная профессиональная деятельность, наличие справочной литературы и т. д.» [там же].
«Любая мыслительная деятельность человека — невероятно сложный и глубокий процесс, требующий всестороннего изучения. Процесс мышления человека, направленный на решение поставленной задачи, носит алгоритмичный характер. В определенные моменты могут протекать те или иные изменения как в нем самом, так и в порождении новых алгоритмов. Мышление людей, занимающихся какой-то конкретной профессиональной деятельностью, например, переводческой, основано на применении инвариантных методов воспроизведения и запоминания информации, которые создают условия для практической деятельности и предполагают принятие соответствующих решений» [62: с. 61-63].
«Программы, имитирующие определенные системные виды умственной деятельности человека, не могут служить базой для создания новых алгоритмов. Например, программа, которая имитирует умственную деятельность письменного переводчика, не способна создать что-то новое в этой области, отыскать принципиально новые подходы и методы перевода. Она может повторить только то, что уже было создано ранее» [90].
Обработка амбивалентной лексики системами машинного перевода и особенности ее функционирования
Социальное развитие становится стабильным только в том случае, если опорой ему будет само общество. Если обратиться к омонимии "spring": /. весна, рассвет, время зарождения; II. пружина, рессора; III возникать, брать начало, происходить (откуда-л.); IV. прыгать, скакать164 — то можно отметить, что это один из примеров максимальной лексической амбивалентности: четыре равноименные и одновременно многозначные единицы, совпадающие как по написанию, так и по произношению.
Несмотря на это, SMT и RBMT системы выполняют корректный, сопоставимый с HAT перевод, в котором, вместе с тем, присутствует применение трансформации: «глагол+предлог» на ИЯ подвергается замене на «существительное».
Из вышеприведенных примеров видно, что, несмотря на отдельные редкие ошибки, каких-либо систематически происходящих семантических нарушений при работе машины с омонимичной лексикой не наблюдается.
Интерес представляет Пример 2, в котором слово "better" пропущено при переводе. Это может свидетельствовать о том, что при возникающей неразрешимой для компьютера лексической амбивалентности происходит «пропуск» такой единицы. В Примере 12 "letter" в обоих случаях соответствует слову «письмо», однако машина не справилась с поставленной задачей снять возникшую амбивалентность ввиду невозможности полного охвата всего фрагмента (58 слов), что позволило бы разрешить амбивалентность контекстом. Это доказывает прямую зависимость «понимания» СМП фрагментов от их словной продолжительности, что усугубляется амбивалентной лексикой.
В целом функционирование омонимичной лексики в системах машинного перевода можно представить следующим образом: 1) перевод для моносемичных омонимов выполняется верно — СМП снимают омонимию (см. Примеры 16, 23, 26, 28); 2) перевод для моносемичных омонимов выполняется неверно — СМП не снимают омонимию (см. Примеры 17, 25, 27); 3) перевод для полисемичных омонимов выполняется верно — СМП снимают омонимию, корректно выбирают правильный вариант перевода из нескольких значений (см. Примеры 19, 29, 30); 4) перевод для полисемичных омонимов выполняется частично верно — СМП снимают омонимию, стилистически не корректно выбирают правильный вариант перевода из нескольких значений (см. Пример 22); 5) перевод для полисемичных омонимов выполняется неверно — СМП не снимают омонимию (см. Пример 21).
Можно также отметить еще одну частную ситуацию для случаев функционирования омонимичной лексики — разрешение амбивалентности оригинала (снятие омонимии) и создание новой амбивалентности на целевом языке через выбор эквивалента, являющегося в этом языке омонимом (см. Примеры 18, 20, 24).
Проведенный анализ дает возможность утверждать следующее: в переводах текстов официально-делового стиля, содержащих полисемию, наблюдается очень невысокая степень отклонений на семантическом уровне без нарушения смысловой части фрагмента. Кроме того, установлены отклонения на синтаксическом уровне, как в плане сочетаемости слов, так и в плане изменения роли слова в предложении. Последнее не представляется критическим, поскольку синтаксические трансформации наблюдаются и в HAT и не противоречит случаям, когда человек-переводчик применяет трансформации.
Омонимия в большинстве случаев снимается самой машиной, что может свидетельствовать: 1) о достаточном уровне «ориентирования» машины в предложенном официально-деловом контексте; 2) о вероятном наличии выбранных фрагментов текста в базе корпуса SMT, так как выбранные для исследования двуязычные корпусы являются свободными и открытыми, а СМП вполне может иметь к ним доступ и осуществлять «машинный перевод по человеческому переводу». С другой стороны, и RBMT системы машинного перевода не уступают статистическому, показывая удовлетворительные результаты, несмотря на характерные им дословность и буквализм.
Это дает право утверждать, что СМП, работающие с двуязычными корпусами (SMT), обширным словарем и «знаниями» о грамматике языка, (RBMT) являются достаточно эффективными в своей деятельности и качество их переводов является удовлетворительным для текстов официально-делового стиля.
Случаи, когда машине не удается снять омонимию, вполне вероятны и частотны, тогда, так же, как и в случае с полисемией, возникают нарушения на семантическом уровне. Принципиальность четкого разграничения двух языковых явлений (омонимии и полисемии) для машинного перевода не является существенной для моносемичных омонимов, поскольку эти категории лексики в равной степени функционируют и воспринимаются машинной. В случае с полисемичными омонимами любой СМП приходится выполнять двойное снятие амбивалентности: сначала на уровне омонимии, а затем на уровне многозначности. Но в целом оба этих явления для СМП любого типа расцениваются как «амбивалентная лексика».
Закономерности функционирования эврисемичной лексики в системах машинного перевода Далее рассмотрим закономерности функционирования широкозначной лексики (эврисемии) в среде систем машинного перевода. В качестве примеров приемом сплошной выборки из материала исследования будем отбирать лексические единицы по критерию архилексемы в дихотомии гипероним - гипоним. В качестве справочного материала будем использовать «Advanced English & Thesaurus»165.
Под гиперонимом в лингвистике понимается «слово с более широким значением (объемом понятия) по отношению к слову с менее широким значением»166. Гипоним рассматривается как «слово с более узким значением (объемом понятия) по отношению к слову с более широким значением» [там же].