Содержание к диссертации
Введение
Глава 1. Теоретические аспекты определения словосочетаний 15
1.1. «Синтагмоцентрический» подход: развитие взглядов Ф. де Соссюра 17
1.2. «Словоцентрический» подход: развитие взглядов В.В. Виноградова 31
1.3. Комбинированный подход: теория «Смысл - Текст» и концепция лексических функций 48
Выводы по Главе 1 64
Глава 2. Принципы изучения лексической функции Magn: вероятностный аспект 67
2.1. Методы изучения и отбор языкового материала 67
2.1.1. Исходные рассуждения 67
2.1.2. Толково-комбинаторный словарь 68
2.1.3. Отбор языкового материала для эксперимента 71
2.2. Экспериментальное и корпусное исследование 72
2.2.1. Ход эксперимента 72
2.2.2. Обработка результатов эксперимента 74
2.2.3. Корпусное исследование 81
2.3. Лексическая функция Magn: отражение в различных источниках 86
2.3.1. Словарь усилительных словосочетаний 86
2.3.2. Сопоставление лексикографических, экспериментальных и корпусных данных 88
2.4. Лексическая функция Magn: вероятностный подход 107
Выводы по Главе 2 115
Глава 3. Средства выражения лексической функции Magn в современном русском языке: морфологический, синтаксический, семантический аспекты 118
3.1. Определение критериев описания 118
3.2. Морфологический аспект 125
3.3. Синтаксический аспект 131
3.3.1. Классификация словосочетаний 131
3.3.1.1. Адвербиальные словосочетания 134
3.3.1.2. Адъективные словосочетания 139
3.3.2. Позиционные характеристики средств выражения лексической функции Magn 141
3.4. Семантический аспект 145
3.4.1. «Склеенные выражения» лексической функции Magn 145
3.4.2. Семантико-синтаксические модели средств усиления 148
3.4.3. Семантические области средств усиления 150
3.4.4. О зависимости средств усиления от семантической близости опорных слов 170
Выводы по Главе 3 173
Заключение 177
Список литературы 180
Список словарей 193
- «Синтагмоцентрический» подход: развитие взглядов Ф. де Соссюра
- Толково-комбинаторный словарь
- Лексическая функция Magn: вероятностный подход
- О зависимости средств усиления от семантической близости опорных слов
Введение к работе
Реферируемая диссертационная работа посвящена исследованию лексической функции Magn в современном русском языке
В каждом естественном языке есть довольно обширная группа словосочетаний (типа железная воля, суровая правда, нанести визит, бежать стремглав и т п), которые явно характеризуются устойчивостью, но не обладают при этом (по крайней мере, в существенной степени) фразеологическим характером, свойственным общепризнанно устойчивым единицам - идиомам В настоящее время не существует терминологического единообразия в этой области, лингвисты называют такого рода словосочетания по-разному «фразеологическими группами» (Ш Балли), «фразеологическими сочетаниями» (В В Виноградов), «аналитическими конструкциями» (Р Р Асфандияров), «лексико-аналитическими структурами» (В Г Гак), «рестриктивами» (С Г Гаврин), «традиционными сочетаниями» (А И Смирницкий), «фразеолоидами» (Н Н Амосова), «фразеоматическими сочетаниями» (В Л Дашевская, А В Кунин, Л А Уралова), «коллокациями» (Е Г Борисова, Л Н Иорданская, И А Мельчук) и др
Указанные термины были введены в рамках различных концепций, так или иначе развивающих один раздел науки о языке - фразеологию При всех отличиях концепций общим для них является то, что фразеологические единицы, что бы под ними ни понималось, противопоставляются свободным сочетаниям языка
Несколько иной подход предлагается В М Савицким На основе оригинальных идей, выдвинутых И Е Аничковым еще в 1927 г, В М Савицкий разработал основы общей теории идиоматики, не предполагающей названного выше противопоставления Идиоматичность, понимаемая максимально близко к исходному своему смыслу - как «своеобразие», представляет собой «важное и широко распространенное свойство единиц различных уровней языковой системы (слов, устойчивых сочетаний слов, устойчивых высказываний), а также языковых систем в целом» (Савицкий 2006) Идиоматичность, в рамках которой в основном и помещаются традиционные фразеологические единицы, подразделяется на межъязыковую и внутриязыковую Пронизывая всю языковую систему, идиоматичность является свойством и ее элементов, и их сочетаний, и всей системы в целом При этом под идиоматичностью языка, проявляющейся в речи его носителя, понимается, естественно, не обилие фразеологизмов, а «соблюдение национального своеобразия формы выражения мысли на данном языке, воспринимаемое как естественность и подлинность речи» (Савицкий 2006)
В реферируемой работе исследуется один специфический класс выражений, которые характеризуются двумя основными признаками а) логической бинарностью структуры и б) усилением зависимым компонентом значения главного компонента Как любые единицы в рамках своей языковой системы, эти выражения в той или иной мере являются идиоматичными Кроме того, они могут включать в свой состав очевидно фразеологические в традиционном понимании единицы
Такие выражения в истории лингвистики называются по-разному Одно из названий предложил в свое время создатель фразеологии женевский лингвист Ш Балли, обративший внимание на «фразеологические группы с усиливающим определением» В современных работах отечественных лингвистов встречаются и другие определения таких выражений, например, «усилительные словосочетания» (И И Убин)
Здесь необходимо отметить некоторое противоречие, поскольку по сложившимся в отечественной лингвистике представлениям фразеологические единицы не могут относиться к (свободным) словосочетаниям Как указывают А Н Баранов и Д О Добровольский, «выражение проливной дождь идиоматично, а сильный дождь - нет, поскольку первое лексически связано, а второе порождается по регулярным правилам семантической сочетаемости» (Баранов, Добровольский 2008) Однако и в том, и в другом выражении зависимый компонент усиливает значение главного компонента Рассматривать словосочетания такого рода вместе, с единых позиций, позволяет теория лексических функций
В этой теории, разработанной в трудах И А Мельчука и А К Жолковского, понятие лексических функций (далее - ЛФ) опирается на математическое понимание функции как средства описания постоянных логических отношений между различными переменными, в данном случае - между лексическими единицами, ср «Лексическая функция - это весьма общий и достаточно абстрактный смысл f, который выражается особым образом, т е особой лексемой у в зависимости от лексемы х, при которой он выражается F(jc) = у» (Мельчук 1995) Ключевое слово х называется аргументом функции, а выражающее заданный смысл f зависимое слово у является значением функции Выражение, в котором реализуется какая-либо лексическая функция, принято называть лексико-функционалъным выражением
Лексическая функция Magn (лат magnus «большой») соответствует значению интенсификации, высокой степени проявленности признака или «далеко зашедшей» ситуации
И А Мельчук иллюстрирует реализацию ЛФ Magn следующими примерами Magn {болезнь) = тяжелая, Magn {мчаться) = сломя голову, Magn {аплодисменты) = бурные, Magn {вопить) = как резаный, Magn {сон) = глубокий, Magn {беречь) = как зеницу ока, Magn {дождь) = проливной, Magn {пьян) = в доску, в стельку, Magn {белый) = как снег, Magn {отличник) = круглый
При этом авторы концепции ЛФ указывают на возможную множественность значений лексической функции от одного и того же аргумента (опорного слова) Так, например, в созданном ими «Толково-комбинаторном словаре современного русского языка» представлены следующие значения ЛФ Magn от аргумента дождь - как из ведра, проливной, сильный, обложной, затяжной и другие, от аргумента бояться -ужасно, жутко, до смерти, как огня, как черт ладана и другие, от аргумента дружный - необычайно, удивительно, на редкость, на удивление и другие
Однако все указанные значения не могут быть одновременно употреблены в речи, а сведений о частотности (вероятности, предпочтительности) того или иного средства выражения этот ориентированный на синтез речи словарь
не дает Как отмечает В Б Касевич, «более полным описанием лексической функции было 6ы/(х) = у с вероятностью Р Из последнего, в свою очередь, вытекает, что если мы хотим получить надежные данные о реализации лексических функций, то необходимо располагать информацией о распределении конкретных вероятностей» (Касевич 2006) Такого рода исследования, насколько нам известно, еще не проводились
Кроме того, разнородность лексико-функциональных выражений предоставляет большие возможности для изучения Авторы концепции лексических функций отмечают «В числе элементов множества, представляющего собой значения ЛФ, т е множества f(L), могут быть элементы разной природы лексические единицы (лексемы или фраземы), морфологические единицы (компоненты сложных слов или аффиксы) и даже свободные словосочетания Эти элементы необязательно должны быть строгими синонимами, они должны быть лишь более или менее синонимичны - включать в себя достаточно объемный и важный общий семантический фрагмент, отвечающий данной функции f» (Иорданская, Мельчук 2007)
Исходя из сказанного, актуальность настоящего исследования определяется необходимостью получения информации о распределении конкретных вероятностей употребления тех или иных средств выражения ЛФ Magn в современном русском языке, а также заложенными в комментарии к определению функции возможностями их количественного, качественного и структурного анализа
В качестве объекта диссертационного исследования выступали усилительные словосочетания русского языка, то есть такие сочетания, в которых значение главного слова усиливается с помощью зависимого слова или выражения Предметом исследования явились грамматические, семантические и частотные характеристики средств выражения ЛФ Magn
Исходным языковым материалом исследования послужили 30 опорных слов из «Толково-комбинаторного словаря современного русского языка», на которые в ходе психолингвистического эксперимента было получено 4200 слов-реакций, образующих с опорными словами 1538 разных усилительных словосочетаний Анализ специальных словарей выявил дополнительно 184 разных средства усиления Потученные 1722 усилительных словосочетания, составившие основной языковой материал исследования, проверялись по Национальному корпусу русского языка (www ruscorpora га) Всего было просмотрено более 25 тысяч контекстов, из которых 21996 были признаны «положительными», то есть реализующими ЛФ Magn именно в сочетании запрашиваемых слов Цель исследования заключалась в изучении ЛФ Magn в современном русском языке с точки зрения грамматических, семантических и частотных характеристик средств ее выражения Для достижения поставленной цели необходимо было решить следующие задачи
1) уточнить и обосновать содержание термина «словосочетание» с точки зрения теории лексических функций, в частности, установить соответствие между терминами «усилительное словосочетание» и «ЛФ Magn»,
изучить лексикографические источники и отобрать языковой материал для дальнейшего исследования,
разработать экспериментальные процедуры для изучения ЛФ Magn и провести психолингвистический эксперимент с носителями русского языка,
установить критерии обработки экспериментального материала и проанализировать полученные данные,
верифицировать лексикографические и экспериментальные данные с помощью корпуса русского языка,
изучить лексикографические, экспериментальные и корпусные данные с точки зрения частотных характеристик средств выражения ЛФ Magn и сопоставить полученные результаты,
разработать методику вычисления вероятности употребления разных средств выражения ЛФ Magn при одном опорном слове и на основе выявленных по трем источникам (лексикографическому, экспериментальному, корпусному) частотных характеристик произвести вычисление конкретных вероятностей,
определить принципы описания средств выражения ЛФ Magn с точки зрения их грамматических и семантических характеристик,
выполнить описание полученных в ходе исследования средств выражения ЛФ Magn в морфологическом, синтаксическом и семантическом аспектах Теоретической базой настоящего исследования послужили, в первую
очередь, теория «Смысл<->Текст» И А Мельчука, А К Жолковского, грамматическое учение о слове и учение о словосочетании В В Виноградова, а также структурно-функциональная классификация словосочетаний И Е Аничкова
В работе были использованы следующие методы: методы обобщения, анализа и интерпретации данных, полученных другими учеными, метод компонентного анализа, статистический, сопоставительный, метод психолингвистического эксперимента и метод корпусного исследования
Научная новизна исследования состоит в комплексной квантитативной оценке частотности средств выражения ЛФ Magn (без учета их фразеологической связанности) с обязательным использованием одновременно корпусного и экспериментального методов, а также словарных данных, в применении для этой оценки положений математической теории вероятностей Кроме того, для описания средств выражения ЛФ Magn были впервые применены положения структурно-функциональной классификации словосочетаний И Е Аничкова
На защиту выносятся следующие положения:
1) Лексико-функциональные выражения, реализующие ЛФ Magn, которые в некоторых исследованиях, включая настоящее, называются «усилительными словосочетаниями», выходят за рамки традиционного (по В В Виноградову) понимания словосочетаний К основным причинам этого относится способность аргумента и значения ЛФ Magn превращать глубинную атрибутивную связь между ними в поверхностные предикативные отношения, отрицаемые у традиционных словосочетаний Кроме того, ЛФ Magn, как и другие ЛФ, может быть представлена фразеологически связанным выражением, что также противоречит традиционному пониманию словосочетания При изу-
чении лексических функций представляется оправданной более широкая трактовка словосочетания
Противопоставление фразеологически связанных выражений свободным с точки зрения лексических функций представляется нерелевантным (хотя изначально теория ЛФ разрабатывалась для описания именно несвободных сочетаний) При выражении значения усиления заданного опорного слова носитель языка не учитывает параметр фразеологической связанности К существенным параметрам относятся семантика (оттенок усилительного значения) и частотность средства усиления
Надежные данные о вероятности употребления того или иного средства усиления с конкретным опорным словом можно получить на основании сложения частоты их совместного употребления в максимальном количестве источников с использованием положений математической теории вероятностей Эти источники должны относиться к трем основным типам лексикографическому, корпусному и экспериментальному Под последним подразумеваются данные экспериментов с носителями языка на выражение заданного смысла при изучаемых опорных словах. Кроме того, при проведении корпусного исследования необходимо учитывать позицию средства усиления по отношению к опорному слову, так как средства усиления, расположенные в препозиции и постпозиции к опорному слову, представлены в корпусе с разной частотой встречаемости, вплоть до нулевой по одной из позиций
Выделяемые авторами концепции лексических функций особые случаи выражения ЛФ Magn одним словом той же части речи, что и опорное, так называемые «склеенные выражения» ЛФ Magn, фактически являются синонимической заменой опорного слова, выполняющей функцию его уточнения по признаку увеличения интенсивности Это соответствует сути ЛФ Magn, однако противоречит ее формальным признакам Magn является функцией синтагматической, а синонимия относится к сфере парадигматики Для синонимов в данной теории введена соответствующая (парадигматическая) лексическая функция Syn, допускающая наличие синонимов с более узким, более широким и пересекающимся значением В реферируемом исследовании предлагается ввести в терминологическую систему лексических функций обозначение SynMagn для «склеенных» выражений ЛФ Magn
Теоретически значимыми результатами, полученными в ходе исследования, можно считать
определение методики изучения распределения конкретных вероятностей средств выражения лексических функций,
уточнение терминологического аппарата лексических функций в области «склеенных выражений»,
выявление семантических областей в русском языке, соответствующих значению усиления, и ранжирование их по частоте встречаемости,
выявление значимости позиции средства усиления по отношению к опорному слову для определения вероятности их совместного употребления,
- обоснование возможности и необходимости раздельного изучения семантически близких, однокоренных опорных слов
Практическая значимость исследования определяется тем, что полученные результаты могут быть использованы в построении вузовских курсов по семантике, лексикологии и фразеологии русского языка, лексикографии, синтаксису, психолингвистике, корпусной лингвистике, при разработке статей для толково-комбинаторного словаря русского языка В ходе исследования была получена информация о распределении конкретных вероятностей средств выражения ЛФ Magn от изучаемых опорных слов Такая информация может использоваться в ориентированных на синтез текста словарях, компьютерных программах машинного перевода и синтеза речи, в преподавании русского языка как родного и иностранного и других прикладных направлениях
Основные положения работы апробированы на XXXVII, XXXVIII Международной филологической конференции (2008-2009 гг, Санкт-Петербург), на Всероссийской научной конференции «Слово Словарь Словесность Петербургский контекст русистики» (2007 г, Санкт-Петербург), на Всероссийской научной конференции «Слово Словарь Словесность (к 225-летию основания Российской Академии)» (2008 г, Санкт-Петербург), на VIII Межвузовской конференции молодых ученых (2007 г, Череповец), на XVII, XVIII Межвузовской военно-научной конференции (2006, 2008 гг, Череповец), на Шестой, Седьмой выездной школе-семинаре «Порождение и восприятие речи (2007-2008 гт, Череповец), а также на аспирантских семинарах и заседаниях кафедры русского языка и общего языкознания Череповецкого государственного университета (2006-2009 гг )
«Синтагмоцентрический» подход: развитие взглядов Ф. де Соссюра
Невозможность дать исчерпывающее определение слова осознана уже давно. Ф. де Соссюр, указывая на противоречия при попытках определить слово, приходит к выводу: «Не в слове следует искать конкретную единицу языка» (Соссюр 1998: 103). Сравнив язык с шахматной игрой, состоящей не из фигур, но из различных комбинаций их положений, он определяет основное направление, в котором следует изучать язык: «Великим заблуждением является взгляд на языковый член просто как на соединение некоего звука с неким понятием. Определить его так, значило бы изолировать его от системы, в состав которой он входит; это повело бы к ложной мысли, будто возможно начинать с языковых членов и из их суммы строить систему, тогда как на самом деле надо, отправляясь от совокупного целого, путём анализа доходить до заключённых в нём элементов» (там же: 110).
В отечественном языкознании подобные мысли также высказывались, в частности, академик А.А. Шахматов писал: «В языке бытие получили сначала предложения; позже путём расчленения предложений, основанного на взаимном их сопоставлении и влиянии, из них выделились словосочетания и слова для самостоятельного (хотя весьма ограниченного и случайного) бытия и употребления (обычно же слова и словосочетания обретаются в составе предложения)» (Шахматов 1941: 17). Ранее подобные рассуждения можно найти и у А.А. Потебни.
Однако наиболее систематично изложенными такие взгляды представляются всё же в трудах Ф. де Соссюра. Основой языка он считает постоянное взаимодействие и противопоставление между собой его элементов, то есть отношения, среди которых им выделяется два вида: «синтагматические» , основанные на линейном характере языка, исключающем возможность произнесения двух элементов сразу, и «ассоциативные»5, составляющие в мозгу индивида тот запас слов, который и образует язык.
Сочетания элементов языка, опирающиеся на протяжённость, Соссюр называет «синтагмами». Синтагмы всегда состоят из двух или нескольких последовательных единиц, которые получают ценность лишь в меру своего противопоставления предшествующему или последующему элементу, или тому и другому. Понятие синтагмы Соссюр относит и к словам, и к сочетаниям слов, и к сложным единицам всякого размера и всякого рода (сложные слова, производные слова, части предложения, целые предложения) . Наиболее ярко роль синтагмы в системе языка Ф. де Соссюр обозначил во втором курсе лекций по общей лингвистике, прочитанном им в 1908-1909 гг.: «Мы говорим исключительно синтагмами7, и вероятный механизм состоит в том, что мы имеем типы синтагм в голове, и в момент их использования мы приводим в действие группу ассоциаций» (цит. по: Кузнецов 2006: 115).
Ученик Ф. де Соссюра и один из издателей его трудов Шарль Балли подходит к синтагме через логическую структуру предложения: «Всякое высказывание логически состоит из двух членов: того, о чём говорят, и того, что об этом говорят; то, что об этом говорят, составляет повод, или (в широком смысле) предикат; член же, представляющий собой причину повода, является темой, или (в широком смысле) субъектом » (Балли 1955: 114). Обозначив субъект буквой А, а предикат - буквой Z, Балли даёт определение синтагмы: «Любая совокупность знаков, отвечающая формуле AZ, называется синтагмой; следовательно, синтагмой являются как предложение, так и любая большая или меньшая группа знаков, которую можно свести к форме предложения» (там же: 115). На основе этого подхода Балли уточняет структурную особенность синтагмы - она всегда бинарна, то есть обязательно состоит из двух элементов (которые, в свою очередь, могут раздваиваться на единицы всё более низких уровней, образуя в линейном ряду многоэлементные «цепочки»). Образующие предложение синтагмы Балли называет «полными», а не образующие - «частичными».
Другой ученик Ф. де Соссюра СИ. Карцевский, учившийся в Женевском университете и слушавший в 1911-1912 гг. ряд его курсов, в начале 1918 г. участвовал в семинаре по теории словосочетания, организованном Московским лингвистическим кружком, и первым озвучил идеи Соссюра в России. Карцевский отмечал, что основой взаимосвязи элементов в синтагме являются отношения «определяемого и определяющего». Не только между словами, но и внутри одного слова возможны несколько уровней таких отношений. Так, во-довозишка - это «скверный водовоз»: здесь суффикс является определением к основе, которая, в свою очередь, распадается на синтагму «возящий воду», где первая часть основы служит определением ко второй. Такие синтагмы СИ. Карцевский назвал «внутренними».
На уровне фразы синтагмы, названные им «внешними», также образуют многоуровневые конструкции. Например, в предложении Маленький мальчик читает большую книгу синтагма большую книгу определяет собой слово читает и образует сложную синтагму читает большую книгу, которая в свою очередь определяет синтагму маленький мальчик и создаёт вместе с ней ещё более сложную синтагму, равную всему предложению (примеры взяты из: Карцев-ский 1928: 25). Образующая предложение (или в любой момент способная его образовать) синтагма является предикативной, остальные - непредикативными.
Описанные взаимоотношения синтагм можно изобразить графически. На рисунке 1 мы попытались показать в соответствии со взглядами СИ. Карцевского многоуровневость и направления определительных отношений в рамках общей синтагматической структуры предложения. A.M. Пешковский, разделявший подобные взгляды, также соединял слова стрелками для наглядного различения синтагм в синтаксически омонимичных предложениях (Пешковский 2001: 44-45). Подход, приведший его к «стрелочным диаграммам», которым он, по всей видимости, не придавал большого значения, в западной лингвистике вылился в распространённые сейчас «деревья зависимостей» (например, Теньер 1988) и «деревья непосредственно составляющих (НС)» (например, Блумфилд 1968).
Толково-комбинаторный словарь
Первичным лексикографическим источником, как уже говорилось выше, послужил для нас «Толково-комбинаторный словарь современного русского языка» (Мельчук, Жолковский 1984), или, сокращённо, ТКС. К сожалению, этот словарь, предназначенный для филологов, мало известен даже в профессиональной среде. Так, в современном издании «Вселенная в алфавитном порядке: Очерки о словарях русского языка» (Козырев, Черняк 2000) среди более чем 700 описываемых словарей ТКС не встречается. Поэтому мы считаем необходимым остановиться на его кратком описании.
Соответствуя своему названию, данный словарь сочетает в себе задачи толкования слов и максимально полного описания их синтаксической и лексической сочетаемости с точки зрения как норм и правил комбинирования, так и практической реализации. Это словарь нового типа, нацеленный в первую очередь на синтез, то есть на производство текста, хотя может использоваться и для его анализа, как обычный толковый словарь.
Словарная статья имеет достаточно сложную структуру, включающую в себя 10 зон:
1. Морфологические сведения о заглавном слове (склонение, спряжение, род, вид, отсутствие тех или иных форм и т.п.).
2. Стилистическая помета (спец., разг., прост., арх. и т.п.).
3. Толкование, даваемое с помощью элементарных или промежуточных понятий и переменных (X, Y и т.п.), а также неформальных пояснений и коннотаций.
4. Модель управления в виде таблицы, в каждом столбце которой указан один семантический актант лексемы, а в каждой строке - один способ реализации соответствующего актанта.
5. Ограничения к модели управления, в которых перечислены возможные условия совместного употребления семантических актантов и возможные особенности их соединения с самой лексемой.
6. Примеры возможного и невозможного употребления актантов с лексемой.
7. Лексические функции - основная часть словарной статьи. Здесь перечисляются все обнаруженные средства выражения всех применимых к данной лексеме лексических функций.
8. Иллюстрации, то есть языковые примеры.
9. Энциклопедическая информация, необходимая для осознанного использования заглавной лексемы.
10. Идиомы, в которых используется заглавная лексема, за исключением идиом, выступающих средством выражения лексических функций, - они указаны в соответствующей зоне (Мельчук, Жолковский 1984: 79-93; образец словарной статьи на слово борьба см. в Приложении 1).
Работа над теорией «Смысл - Текст», неотъемлемым элементом и практическим воплощением которой является ТКС, продолжается до сих пор. По современным взглядам авторов данной теории, зоны словарной статьи должны группироваться для отражения триединой сущности языкового знака - означаемого, означающего и синтактики. Если означаемое и синтактика в перечисленных выше зонах явно просматриваются, то сведения об означающем не выражены эксплицитно, хотя они, безусловно, должны присутствовать в словаре -это информация о произношении (с указанием разбиения на слоги), нестандартные просодические свойства, а также орфографическая запись. Кроме того, к синтактике необходимо относить и «прагматические» сведения, то есть долж ны приводиться выражения с участием заглавной лексемы, характерные для определенных ситуаций, к примеру, типовые объявления, надписи и т.п. (Иорданская, Мельчук 2007: 28-29).
Как уже упоминалось, словарь содержит всего 282 словарные статьи (на без малого тысяче страниц) и является, по сути, экспериментальным фрагментом будущего полного словаря, а представленная в нём лексика выбиралась авторами не по признаку употребительности и распространённости, а с точки зрения максимального типологического разнообразия с целью репрезентации, по возможности, всех слоев лексики и всех текстов.
На принципах отбора лексики в ТКС необходимо остановиться подробнее, так как качественный состав словника данного словаря напрямую связан с качественным составом языкового материала, отобранного нами для эксперимента.
В ТКС описаны:
- глаголы думанья, типа считать (= полагать ), понимать, сомневаться;
- перформативные глаголы, типа предлагать и приглашать;
- глаголы чувства, типа чувствовать, удивляться, гневаться;
- глаголы физического воздействия, типарезатъ или жарить;
- глаголы информационного действия, типа рассматривать, описывать, экспериментировать;
- названия учреждений, инструментов, устройств, транспортных средств и т.п.: больница, кинотеатр, виселица, печь , очки, судно , сосуд ...;
- названия величин, типа скорость, высота, температура;
- названия деятелей, типа лыжник или пассажир;
- название абстрактных состояний - такие, как победа и поражение (а также борьба);
- названия абстрактных качеств, типа безграмотность, надёжность;
- названия веществ, типа чай, кофе;
- названия физических объектов, животных, частей тела и т.п.: окно, доска, свинья, сердце; - названия общественных институтов (типа брак ) и явлений общественной жизни {авторитет, агрессия и т.д.).
При этом при отборе слов в словарь должны были выполняться следующие четыре требования:
а) отражение, по возможности, максимального числа семантических типов слов (см. выше);
б) отражение, по возможности, полнозначных слов и фразем всех частей речи. Кроме глаголов и существительных, в ТКС представлены прилагательные: достаточный, грамотный, стрелковый...; наречия: замуж, замужем, наизусть...; и местоимения: ты и вы. В то же время представлены различные классы фразем: «существительные» (учебное заведение, административный восторг, дырявая башка), «глаголы» (колоть глаза), «наречия» (из любви к искусству) и т.п.;
в) отражение, по возможности, всех значений многозначных слов;
г) отражение, по возможности, целых семантических групп, т.е. слов, связанных родо-видовыми и тому подобными отношениями: ср. резать — вырезать - зарезать - прорезать -разрезать и т.д.; учебное заведение — вуз -учиться; чайник - чай - сосуд; обед - завтрак - ужин, а также жарить - печь - варить; температура - термометр; считать - мнение; борьба - победа - поражение; искусство - кино и т.п. (Мельчук, Жолковский 1984: 75-76).
Лексическая функция Magn: вероятностный подход
Вся теория лексических функций основана на математической аналогии. Для определения конкретной вероятности употребления той или иной лексической единицы на основе информации о частоте её встречаемости в разных источниках нам также придётся воспользоваться математическими средствами -некоторыми понятиями и формулами теории вероятностей.
Как уже указывалось ранее, понятие частоты события является кардинально важным в теории вероятностей. Ещё в начале XX века Р. Мизес предложил постулировать свойства не вероятностей, а частот; некоторые авторы и в настоящее время предпочитают излагать теорию вероятности на частотной основе. В отечественной науке наиболее современным считается аксиоматический теоретико-множественный подход, связанный с идеями А.Н. Колмогорова (Вентцель, Овчаров 2003: 30).
Понятие множества вполне применимо и к совокупности лексических средств языка, и к нашим данным.
Выясним, что исследуем мы. Объектом исследования, как ранее указывалось, являются словосочетания русского языка. В словосочетании может быть и больше двух слов, но всегда один элемент является главным, второй - зависимым. На этом основании мы их и разделим, обозначив такое словосочетание как х + у. В нашем случае семантическая зависимость одного элемента от другого выражается через функцию f(x) =у или, конкретно, Magn (х) =у; соответственно, словосочетание х + у может иметь вид х + Magn (х).
Всё множество М словосочетаний языка L, реализующих лексическую функцию Magn, может быть записано в таком виде: ML = {XJ + Magn (xj), x2 + Magn (x2), ..., xn + Magn (х„)} Мы изучали ЛФ Magn на примере тридцати опорных слов, поэтому п в нашем случае равно 30. Поскольку конкретному аргументу функции в математике соответствует единственное её значение , элементов множества (усилительных словосочетаний) при п = 30 должно быть также тридцать. Но в действительности их гораздо больше. Математическая аналогия здесь, на первый взгляд, входит в противоречие с реальностью.
Однако необходимо помнить, что мы изучаем языковые средства в семантическом аспекте. Семантически слово практически никогда не бывает цельно и однородно. Оно само является множеством - сем, составляющих различные аспекты значения слова. В разных ситуациях употребления одни и те же семы в составе слова могут иметь разный вес, отражая зависимость от (являясь функцией от) ситуации. Поэтому функция Magn (х) по сути является функцией от множества, и значения её сами также являются множеством. В математике множества обычно обозначаются большими латинскими буквами, соответственно, множество изучаемых нами усилительных словосочетаний на основе тридцати опорных слов (обозначим его Ms) должно иметь вид: Ms = { X, + Magn (X,), Х2 + Magn (Х2), ..., Х30 + Magn (Х30)}
Изучаемое нами множество Ms является подмножеством всех словосочетаний языка ML. Другими словами, Ms полностью входит в (принадлежит) ML.
В свою очередь изучаемое нами множество Ms также делится на пересекающиеся подмножества усилительных словосочетаний, представленных в словаре (Mv), в эксперименте (МЕ) и в корпусе (Мс). Геометрически отношения этих подмножеств уже были представлены на рисунке 7, где они назывались областями данных.
Теперь перейдём непосредственно к теории вероятностей. Она оперирует событиями. В нашем случае событием будет считаться факт употребления определённого средства усиления с конкретным опорным словом. Зная число опытов п (то есть возможных случаев наступления события А) и число наступивших событий МА, можно определить статистическую вероятность события Р по формуле59:
Применительно к проведённому нами эксперименту частота (статистическая вероятность) употребления конкретного средства выражения ЛФ Magn будет равна отношению числа испытуемых, давших такой ответ на данное опорное слово, к общему числу ответов на это опорное слово, включая повторяющиеся. Например, на слово ветер 26 испытуемых дали ответ сильный. Всего на это слово было зафиксировано 153 ответа, реализующих ЛФ Magn. Таким образом, вероятность употребления слова сильный со словом ветер по данным эксперимента составила 26 : 153 = 0,17. Эти данные приведены в Приложениях 5, 6, 7 в 4-ой графе в виде доли (в процентах) от общего числа ответов с реализацией ЛФ Magn (то есть не 0,17, а 17 %).
Применительно к корпусному исследованию статистическая вероятность вычислялась следующим образом. За число опытов п была принята сумма полученных в корпусе положительных контекстов всех средств выражения ЛФ Magn на данное опорное слово за вычетом числа контекстов «склеенных» выражений; числом наступивших событий МА считалось количество положительных контекстов у данного средства выражения. Например, сумма контекстов всех усилителей к слову ветер по данным корпуса составила 951, из них слово сильный получило 296 контекстов. В результате, вероятность употребления слова сильный со словом ветер по данным корпуса оказалась равна 296 : 951 = 0,31.
Применительно к лексикографическим источникам статистическая вероятность основывается на данных всего двух словарей61. Соответственно, число опытов п будет равно общему количеству средств усиления конкретного опорного слова, приведённому в этих двух словарях, возможным событием А следует считать наличие слова хотя бы в одном из них, и число наступивших событий МА может принимать значения лишь 0 (нет ни в одном словаре), 1 (слово зафиксировано в одном словаре) и 2 (слово зафиксировано в двух словарях). Например, на слово ветер в двух словарях приведено в общей сложности 38 средств усиления. Слово сильный зафиксировано в обоих словарях. Таким образом, вероятность употребления слова сильный со словом ветер по данным словарей составила 2:38 = 0,05.
Описав то, что нам дано, перейдём к тому, что нам требуется найти.
Мы ищем общую вероятность употребления конкретных средств выражения ЛФ Magn от конкретных опорных слов в целом в языке, то есть на множестве ML. Это множество если теоретически и конечно, то практически бессчётно. Оценить присутствующие в нём вероятности мы можем лишь на его фрагменте (который, на наш взгляд, можно считать и его моделью), то есть на подмножестве изучаемых нами опорных слов и средств выражения к ним Ms, которое, как уже говорилось, в свою очередь состоит из трёх пересекающихся подмножеств Mv (словари), МЕ (эксперимент) и Мс (корпус).
О зависимости средств усиления от семантической близости опорных слов
Завершая рассмотрение средств выражения ЛФ Magn в семантическом аспекте, обратим внимание на один специфический момент взаимоотношений между средствами усиления и опорными словами.
В пункте 2.1.3 мы отмечали, что на отбор материала для эксперимента (опорных слов) наложили свой отпечаток принципы составления ТКС, в частности, желание авторов словаря описать максимальное количество лексем одной семантической группы и разных частей речи. В результате среди опорных слов, отобранных нами для эксперимента (по признаку представленности для них в ТКС максимального количества значений ЛФ Magn) оказалось пять групп не просто семантически близких, а однокоренных слов: 1) грамотный, неграмотный, безграмотный; 2) надежда, надеяться, надёжный, безнадёжный; 3) друг, дружба, дружный; 4) борьба, бороться; 5) агрессия, агрессивный. Возникали опасения, особенно в отношении некоторых слов (например, неграмотный - безграмотный), что доля данных для них в эксперименте одинаковых средств выражения будет приближаться к ста процентам.
Мы подсчитали число общих средств выражения ЛФ Magn для каждой пары представленных однокоренных слов. Общими считались семантически близкие, то есть также образованные от одного корня средства выражения, например, безумная, безумно, до безумия и т.п. Данные показывают, что средняя доля х общих средств усиления максимально составляет немногим более трети (38,9 %), минимум - 2 %, что подтверждает допустимость и обоснованность включения однокоренных слов в эксперимент (см. табл. 10).
Данные были также проанализированы с точки зрения частеречной принадлежности однокоренных опорных слов. Высокий процент общих средств усиления предсказуемо показывают пары опорных слов одной части речи: прилагательных {неграмотный / безграмотный - 38,9 %, грамотный / безграмотный - 38,4 %, грамотный / неграмотный - 25,5 %, надёжный / безнадёжный — 28,2 %), существительных {друг / дружба - 34,9 %).
Однако пары опорных слов разных частей речи не демонстрируют устойчивой зависимости от частеречной принадлежности. Например, пары существительное / прилагательное дают весьма различные результаты: от 23,6 % (агрессия / агрессивный) до десятикратного снижения в 2,3 % {надежда / безнадёжный) и 2,0 % (надежда / надёжный). Результат в парах глагол / существительное достаточно высок: борьба / бороться - 35,7 %, надежда / надеяться -21,0 %, в парах глагол / прилагательное - скорее средний: надеяться / безнадёжный - 19,8 %, надеяться / надёжный - 11,4 %.
В связи с этим необходимо отметить (вспоминая теорию семантических полей), что внутри рассматриваемых нами групп опорных слов присутствуют парадигматические и ассоциативно-деривационные отношения, между опорными словами и средствами их усиления - синтагматические, между общими для каждой группы средствами усиления - вновь парадигматические и ассоциативно-деривационные (см. рис. 15).
Зависимость второй линии парадигматических отношений от первой опосредована синтагматикой и не является прямой. Синтагматика - законы лексической, семантической, синтаксической сочетаемости - существенным образом влияет на предсказуемость и неизменность семантических парадигм. Для слов одной части речи синтаксическая сочетаемость их со своими распространителями в значительной мере может совпадать, для слов разных частей речи, соответственно, не совпадать, что, возможно, и объясняет отмеченные выше различия.
На наш взгляд, колебание доли общих средств усиления даже для самых семантически близких однокоренных опорных слов в пределах от 38,9 % до 2 % убедительно подтверждает возможность и необходимость их раздельного изучения.