Содержание к диссертации
Введение
ГЛАВА 1. Квантитативные аспекты многозначности 10
1.1. Изучение многозначности 10
1.3. Частотные семантические словари 17
1.4. Частотно-семантический словарь Э. Торндайка и И.Лорджа . 26
1.5. Выводы 29
ГЛАВА 2. Распределение функциональной нагрузки между значениями многозначных слов (по данным словаря торндайка-лорджа) 30
2.1. Выбор метода для изучения функциональной нагрузки многозначных слов 30
2.2. Исследование распределения функциональной нагрузки многозначного слова 32
2.3. Распределение функциональной нагрузки между значениями двухзначных слов 33
2.4 . Распределение функциональной нагрузки между значениями трехзначных слов 35
2.5. Распределение функциональной нагрузки между значениями четырехзначных слов 37
2.6. Распределение функциональной нагрузки между значениями пятизначных слов 39
2.7. Распределение функциональной нагрузки между значениями шестизначных слов 41
2.8. Распределение функциональной нагрузки между значениями семизначных слов 44
2.9. Распределение функциональной нагрузки между значениями восьмизначных слов 47
2.10. Распределение функциональной нагрузки между значениями девятизначных слов 49
2.11. Анализ результатов аппроксимации данных частотно-семантического словаря Э. Торндайка- И. Лорджа 51
2.12. Распределение функциональной нагрузки в сверхмногозначных словах 61
2.13. Верификация распределения данными «Словаря языка А.С. Пушкина» 109
2.14. Выводы 116
ГЛАВА 3. Время и распределение функциональной нагрузки между значениями многозначных слов 118
3.1. Фактор времени и распределение функциональной нагрузки между значениями двузначных слов 118
3.2. Фактор времени и распределение функциональной нагрузки между значениями трехзначных слов 126
3.3 Фактор времени и распределение функциональной нагрузки между значениями четырёхзначных слов 141
3.4. Анализ корреляции между хронологической и функциональной характеристиками значений 176
3.4. Выводы 186
Заключение 188
Список использованной литературы 190
- Частотные семантические словари
- Частотно-семантический словарь Э. Торндайка и И.Лорджа
- . Распределение функциональной нагрузки между значениями трехзначных слов
- Фактор времени и распределение функциональной нагрузки между значениями трехзначных слов
Введение к работе
Диссертация посвящена исследованию распределения функциональной нагрузки между значениями многозначных слов и выявлению закономерностей, управляющих функционированием значений таких слов, а также выявлению взаимосвязи между древностью и употребительностью значений многозначных слов.
Под функциональной нагрузкой (ФН) на значение многозначного слова понимается доля реализаций слова в данном значении от общего числа употреблений слова в выборке.
Многочисленны исследования, посвящённые распределению слов по числу значений в словарях или текстах того или иного языка. Их можно назвать «внешним» исследованием полисемии. «Внутренние» же исследования полисемии, посвящённые распределению в тексте частот между различными значениями многозначного слова, практически отсутствуют в силу сложности получения необходимой информации. П.М. Алексеев назвал получение такой информации «оценкой толкового словаря по тексту» [Алексеев 1973]. Информацию такого рода даёт весьма редкий вид частотных словарей - частотно-семантический словарь. Самым полным в мировой лексикографии источником информации о распределении частот между значениями многозначных слов являются словари Э. Торндайка и И. Лорджа: Semantic Count of English Words [Lorge 1938] и The semantic count of 570 Commonest English Words [Lorge 1949]. По существу, это один словарь, изданный в двух книгах. Но именно этот словарь в силу свой малодоступности до сих пор не являлся объектом научного исследования.
Актуальность нашей диссертации обусловлена не только крайне малым количеством работ по исследованию распределения функциональной нагрузки между значениями многозначных слов, но и чрезвычайной важностью проблемы многозначности как в теоретическом, так и в прикладном аспектах.
Текущий век можно назвать веком информации, а информация, накопленная человечеством, хранится в основном в виде текстов на естественных языках. Одним из главных препятствий на пути доступа к этой информации является неоднозначность слов в текстах на естественных языках, снятие которой является непременным условием создания информационных систем нового поколения. В связи с этим исследование количественного аспекта многозначности по данным текстов на естественном языке, способствующее более глубокому познанию многозначности и приближающее тем самым к решению проблемы неоднозначности слов в тексте, представляется актуальным.
Объектом данного диссертационного исследования являются частотно- семантические словари Э. Торндайка и И. Лорджа: Semantic Count of English Words [Lorge 1938] объёмом 20350 слов и The semantic count of 570 Commonest English Words [Lorge 1949] (570 слов), представляющие собой публикацию результатов одного исследовательского проекта в двух книгах. В целях верификации выявленных в них закономерностей привлекаются данные «Словаря языка Пушкина». Сведения о первой фиксации значений берутся из электронной версии словаря Oxford English Dictionary on CD-ROM. Version 3.1. (2009). Oxford: Oxford University Press [OED 2009].
Предмет исследования - распределение функциональной нагрузки между значениями многозначных слов в частотно-семантическом словаре Торндайка-Лорджа и его зависимость от временного фактора.
Цель исследования состоит в обнаружении закономерностей в функционировании значений многозначных слов в статике и динамике.
Достижение цели потребовало решения целого ряда задач:
-
введения в научный оборот частотно-семантических данных проекта Э. Торндайка и И. Лорджа;
-
создания электронной версии частотно-семантического словаря Э. Торндайка и И. Лорджа и дополнения к нему;
-
превращения электронной версии словаря в компьютерную базу данных;
-
разделения многозначных слов на группы по числу значений и анализа этих групп;
-
внесения в базу данных сведений о дате первой фиксации каждого значения каждого слова согласно Oxford English Dictionary [OED 2009];
-
аппроксимации полученных данных различными типами вероятностных распределений и выявления наиболее подходящего распределения;
-
получения численных значений параметров соответствующих распределений;
-
установления зависимостей между функциональными и хронологическими характеристиками значений.
Методика исследования обусловлена целями и задачами диссертации. В работе использовались новые информационные технологии, методы количественной обработки материала, а также описательный и сопоставительный методы.
Научная новизна диссертации состоит в том, что в ней, благодаря созданию компьютерной базы данных, впервые в полном объёме вводятся в научный оборот данные словарей Э. Торндайка и И. Лорджа, на большом (более 70.000 значений) и достоверном (5.000.000 словоупотреблений) материале выявлено и формально смоделировано распределение функциональной нагрузки между значениями многозначных слов, получены данные о зависимости ФН на каждое значение многозначного слова от его возраста, найден способ оценки относительной хронологии значений одного многозначного слова по их ФН.
Теоретическая значимость исследования заключается в том, что оно представляет собой первый опыт фронтального исследования внутрисловной эпидигматики с помощью квантитативных методов, позволивший выявить и формализовать статистические закономерности, управляющие распределением ФН между значениями многозначных слов и численные значения параметров этих закономерностей. Полученные данные о зависимости между ФН и возрастом значений позволяют по расхождению в ФН судить о расхождении в возрасте значений многозначных слов, что открывает новые возможности перед относительной хронологией в лексической семантике.
Практическая значимость исследования состоит в получении сведений о закономерностях функционирования значений многозначных слов и их зависимости от времени, которые могут найти применение в курсах «Введение в языкознание», «Общее языкознание», «Теория языка», «Общая лексикология», «Английская лексикология», а также - оптимизировать практику анализа текстов на естественном языке и способствовать разработке информационно-поисковых систем нового поколения. Выявленные закономерности могут найти применение в практике ранжировки значений многозначных слов при создании толковых словарей.
Созданная автором база данных о частотах значений многозначных слов и датах их первой фиксации может найти самое широкое применение в практике преподавания английского языка, подготовке учебных пособий и методических материалов.
Положения, выносимые на защиту:
-
-
данные, представленные в словаре Торндайка-Лорджа, подчиняются общему закону неравномерности распределения функциональной нагрузки, действующему в природе и обществе; исключения представлены в статистически недостоверной лексике с малым количеством степеней свободы;
-
распределение функциональной нагрузки на значения многозначных слов лучше всего описывается экспоненциальным
распределением: Ni = A exp(-ai), где i - номер значения слова, а A, а -
подбираемые коэффициенты, достоверность аппроксимации R2 = 99,5%;
-
-
на основании проведенного исследования с уровнем надежности 98,4 % установлено, что динамика а описывается формулой ц = -0,465 ln(z')+1,4243, где i - количество значений у слова;
-
на основании проведенного исследования с уровнем надежности 99 % установлено, что коэффициент А описывается формулой: A1 = 3511,5/ 0799 ,
где i - количество значений у слова;
-
-
проанализированный материал свидетельствует, что чаще всего максимальная функциональная нагрузка приходится на наиболее древнее значение слова;
-
среди редких случаев встречаются все теоретически возможные комбинации;
-
чем больше расхождение в функциональной нагрузке, тем больше разница возрасте между значениями многозначных слов;
-
вероятность терминальных (самого старого и самого молодого) значений занимать по ФН 1 -ый и последний ранг выше, чем вероятность для медиальных значений занимать ранги ФН «по возрасту»;
-
вероятность занять соседний ранг для значения слова выше, чем вероятность «прыгнуть» через ранг;
-
при прочих равных вероятность понижения ФН на значение больше, чем вероятность ее повышения.
Апробация результатов исследования. Результаты исследования опубликованы в 7 статьях, докладывались на 5 международных конференциях (Проблемы компьютерной лингвистики 2009, Информатика: проблемы, методология, технологии: материалы 2010, Проблемы лексико- семантической типологии 2010, Проблемы компьютерной лингвистики 2011, Перевод: язык и культура 2011).
Структура работы. Диссертационное исследование состоит из введения, 3 глав, заключения, списка использованной литературы и приложения.
Частотные семантические словари
Изучение многозначности имеет важное прикладное значение в системах по обработке естественного языка:
1. Для создания словарей и различных грамматик. Получить такое описание исследуемых единиц, которое бы предсказывало поведение этих единиц в речи [Селиверстова 1975; Кретов 1992; Кретов 2004];
2. Для создания разметки в Национальном корпусе русского языка [Кобрицов Б.П. 200; Кобрицов Б.П., Ляшевская О.Н. 2004, 2005; Кустова Г.И. и др. 2005]. Эта задача в Корпусе решается при помощи создания правил-фильтров. Действие таких правил основано на том, что в контексте слово имеет только одно значение. Соответственно, если для каждого из значений данного слова удастся задать параметры контекста, в котором это значение реализуется, то эту информацию можно затем использовать для автоматического определения слова в тексте [Рахилина Е.В., Карпова О.С., Резникова Т.И. 2009];
3. Проблема распределения частот многозначных слов в тезаурусе лексики русского языка Russnet [Филиппов 2010]. Отдельно стоящая работа А.К. Филиппова заслуживает специального рассмотрения в силу того, что она является своего рода индикатором насущной практической потребности в исследовании распределения частот между значениями многозначных слов. Задача данной работы состоит в том, чтобы установить связь распределения частот с семантикой глагола в разных его значениях и с множеством его моделей управления. Слова в структуре Russnet объединяются в группы (синсеты) на основании сходства значений; каждое значение считается отдельной лексемой; лексемы в синсете упорядочиваются по частотности. Выделение значений происходит на основе словарных дефиниций Малого академического словаря (МАС).
Исследование проводилось на материале лексико-семантической группы глаголов мышления русского языка, количество исследуемых глаголов невелико – 22. Суть работы состояла в доказательстве того, что в структуре глагола на основании частотных параметров должно выделяться ведущее значение, которое реализуется в контекстах намного чаще остальных.
Другими исследователями были выявлены некоторые закономерности, характеризующие многозначность:
1. Закономерность о зависимости развития лексической полисемии от типа и характера семантики слова сформулирована И.Г. Ольшанским на материале немецкого языка как импликация: "чем больше семантических компонентов включает значение данного типа словесных знаков, чем содержательнее аспект ЛЗ, тем активнее полисемические потенции слова и выше уровень его многозначности" [Ольшанский 1995, С. 393];
2. Полисемия в большей степени характерна для слов, семантика которых включает конкретные признаки объектов, свойств и действий, данная закономерность соотносится с данными сопоставительного исследования немецкой и французской лексики - отмечено, что в немецком языке преобладают конкретные слова с "частными" значениями, обладающие высокой степенью мотивированности [Ульман 1970, С. 261-262].
Контекстологический метод основан на точном и тщательном, хотя и не вполне формальном, анализе фразеологических единиц, текста. Наиболее всего данная теория изучена в трудах Н.Н. Амосовой. Основным понятием в этой концепции является «указательный минимум», который может быть пяти видов: лексическим, синтаксическим и лексико-синтаксическим, а также одно- и многочленным. Исследование компонентов, которые составляют указательный минимум, позволяет выделить «контекстуальный набор», допустимый в рамках одного значения данного семантически реализуемого слова. В этой теории различают переменный и постоянный контекст. Переменный контекст делится на лексический и синтаксический. Лексический контекст – это «контекст, содержащий такой указательный минимум, который способствует реализации значения слова посредством самой семантики, составляющего этот указательный минимум слова или комплекса слов» [Амосова, 1963, С. 34]. Синтаксическим контекстом называется такой контекст, где указательным минимумом является сама синтаксическая конструкция, элементом которой является семантически реализуемое слово, независимо от лексических значений, которые входят в эту конструкцию слов.
Кроме представленных Н.Н. Амосовой разновидностей контекста может использоваться и морфологический контекст - например, разные формы множественного числа существительных могут актуализировать различные значения слова (зуб - зубы - зубья) [Левицкий, 1989, С. 18].
Статистические исследования полисемии, в основе которых лежит утверждение, что язык – это система, предполагает и системность лексики, как одного из уровней языка. Лексика является системой особого рода. Законы, которые действуют в этой системе, не являются строго детерминированными, а выступают как тенденции, которые характеризуют массовые явления. Они могут не выполняться в отдельных случаях, или выполняются в большинстве случаев, пробиваясь через случайные отклонения и исключения [Сафронова 1986, С. 130]. Самый достоверный способ познания лексико-семантической системы языка предусматривает возможность ее исследования с помощью статистических методов, в частности, исследования различных видов количественных характеристик объектов. Начиная с работ Дж. Ципфа [Zipf 1945; 1949], статистический анализ многозначности направлен, в основном, на выявление следующих характеристик:
Частотно-семантический словарь Э. Торндайка и И.Лорджа
Из частотно-семантического словаря Э. Торндайка - И. Лорджа были выбраны все двузначные слова и помещены в отдельную группу. Общее количество таких слов составило – 4367. Примеры слов с двумя значениями: anything; dangerous; December; June; financial; suddenly; afterward; everywhere; enormous; February; young man; partly; September; usually; effort; inhabitant; museum; Jewish; output; likewise; datum; solve; thou; admirable; decade; excitement; franc; lad; satisfactory; fort; gallon; mere; previously; crisis; foreigner; oxygen; excommunicate; astonishment; duration; pavilion; permanent; electric; expensive; cooperate; forever; temperament; bureau; destination; efficiency; regiment; unrest; astronomy; john; philosopher; popularity; Saturn; adversary; assassination; imprisonment; mayor; ratify; superintendent; tribunal; accessible; descendant; primarily; tonight; trader; aloud; aunt; gulch; indignation; monk; obstacle; odour/odor; outbreak; document; Jew; messenger; salesman; distinctive; galaxy; geographical; obtain; tartan; murderer; solely; width; eighteen; bough; chin; independence; domination; extremely; goodnight; practically; threat; anyhow; architect; medical; miscellaneous; ordinarily; precision; spectrum; astronomical; elsewhere; graceful; resentment; rite; sidereal; appendix; appliance; depreciation; electrical; paragraph; burner; deplore; janissary; thereby; schoolmaster; goblet; grasshopper; advisable; Christianity; foreman; glider; October; poem; somehow; steamer; trend; banker; cataract; decidedly; gambler; generator; humorous; ingenuity; perilous; vengeance; adversity; assassinate; diligence; drunkenness; expulsion; greenback; manager; violation; whereupon; almanac; anemone; colonist; eagerness; elevator; inspection; naturalist; scarcely; propaganda; telegram; carpenter; coyote; hesitation; inquest; prologue; spokesman; tit-bit; annexation; canto; cigar; federation; garage; juncture; mariner; peninsula; preacher; quaff; seller; warehouse; effuse; eighty; elimination; hastily; innovation; owl; sunlight; photographic; superiority; desperation; gait; niece; uneasiness.
Далее для каждого значения была получена среднеарифметическая ФН, и она составила 707 для первого значения и 293 для второго.
Так как нам важны только статистически достоверные сведения словаря Э. Торндайка-И. Лорджа, то мы выбрали для нашего дальнейшего исследования следующие слова: 1. Слова, в которых сумма ФН на значения лежит в интервале 1000±10; 2. Слова, в которых ФН ни на одно из значений не равна 0; 3. Слова, в которых ФН последовательно убывает. Таким образом, у нас осталось 1418 слов с двумя значениями. ФН распределяется следующим образом: 815 для первого значения и 185 для второго.
Аппроксимация экспериментальных данных осуществляется путем построения графика зависимости количества значений слова от ФН для каждого значения многозначного слова с последующим подбором подходящей аппроксимирующей функции.
Для экспоненциального распределения точность составляет 100%. Коэффициенты: A = 3590, = 1,483. На графике 1 показано, как экспонента аппроксимирует данные словаря Э. Торндайка-И. Лоржда.
Качество аппроксимации функциональной нагрузки двузначных слов Хотя мы и получили очень высокую точность данных, надо иметь в виду, что мы анализировали двузначные слова, а они имеют всего лишь две точки на плоскости. Как и в случае с двузначными, все трехзначные слова были помещены в отдельную группу, для каждого из трех значений была получена среднеарифметическая ФН. Она составила 618 для первого значения, 243 для второго значения и 137 для третьего. Общее количество слов с тремя значениями – 2060.
Примеры слов с тремя значениями: already; tom; candidate; available; therefore; planet; per cent; husband; earl; anybody; hardly; robin; importance; exclaim; eliminate; teacher; grove; damsel; sailor; presently; electricity; currency; w; isle; goddess; dynasty; politician; editor; japan; warrior; occasional; statesmen; canal; telescope; pope; elephant; queer; inscription; wide-spread; harp; treasurer; laughter; troy; thereupon; marvelous; badger; dominant; helpless; appropriation; alliance; proposal; numerous; whenever; nobody; committee; augment; manufacturer; orbit; ere; vegetation; happiness; moist; toad; august; sermon; lantern; advent; glisten; anchorage; traitor; particle; invasion; earthly; akin; predict; afternoon; zinc; situate; frankly; sixth; relatively; grassy; modify; dimension; attorney; regain; civilization; lance; hedge; tentacle; implement; however; hog; foolish; evident; equipment; inflation; hitherto; dusty; archer; prospective; oar; colonial; balloon; salary; deport; constructive; assailant; q; notable; abolish; grandmother; cartoon; locality; continually; naught; exert; stove; artisan; reconstruction; mountainous; lens; fungus; dungeon; deliverance; brutal; transcript; overall; lichen; investigate; tenderness; hunter; glee; customary; candy; blanket; systematic; subsequent; outer; singer; festival; alp; ninth; statute; lamp; arbitration; anyway; anecdote; typical; purely; sheriff; seminary; furniture; fertility; earthquake; dependency; chairman; beef; barn; assassin; prosperity; formally; detector; transaction; disclose; mood; donkey; stool; personality; ordinance; emigrate; deduce; surpass; shilling; republic; emphasis; pistol; gratitude; trudge; superfluous; sect; rough-rider; jumper; gorilla; feasible; consistently; antler; dealer; huge; municipal; nonsense; ancestor; predecessor; foretell; ; dialect; spoon; pulpit; prominence; oust; mouse; locally; justifiable; disagreeable; dice; confluence; prominent; wireless; thence; painter; debtor; intervention; principally; forehead; cathedral; vaguely; upside down; squall; sinner; secondly; secession; roam; raven; quart; metropolitan; inhabit; indispensable; importation; geology; dancer; autonomous; anxiety; alpha; instead; enable; armistice; hospital; common sense; meanwhile; overboard; medusa; lung; diverse; weird; tranquil; second hand; sausage; influenza; fern; constellation; coldly; birthday; abridge; ultimately; strenuous; stair; fun; extravagance; deficient; consist. После того, как был удален статистически не достоверный материал, у нас осталось 1035 слов. И ФН стала распределяться следующим образом: 1 значение – 676, 2 – 238, 3 – 86.
. Распределение функциональной нагрузки между значениями трехзначных слов
Все восьмизначные слова из словаря были помещены в отдельную группу, для каждого из восьми значений была получена среднеарифметическая ФН. Она составила 486 для первого значения, 201 для второго значения, 112 для третьего значения, 72 для четвертого значения, 47 для пятого значения, 34 для шестого значения, 26 для седьмого значения и 22 для восьмого. Общее количество восьмизначных слов составляет 359.
Слова с восемью значениями: aboard; accept; administration; admire; afford; afore; aggravate; agitate; alien; alive; allege; amber; among; analysis; anatomy; annual; appropriate; arrow; artist; aspect; assail; assist; association; assumption; attract; audience; author; authorize; avoid; avow; baby; bag; bang; bark; basin; bathe; batter; beast; beauty; bellow; berth; beseech; blank; breach; brick; bristle; bruise; bump; car; cash; catholic; cell; ceremony; champion; chancellor; chapter; cheap; cheat; chimney; clip; clutch; collect; complain; comprehend; compress; condemn; conflict; conquest; consciousness; constitute; contrary; coral; cork; cradle; craft; crash; cushion; dam; deceive; decide; decree; defile; define; depend; describe; designate; despite; devote; den; diet; difference; directly; dirt; dirty; discourse; dissent; distant; distinct; dive; divert; dizzy; dodge; dole; domestic; dope; dragon; dwarf; ebb; either; elect; embarrass; engine; English; enlarge; eternity; exalt; example; exclude; exclusive; expect; expense; experiment; external; fabric; fact; faculty; fade; falter; fee; fever; flank; flit; flock; fond; forego; forgive; fourth; fret; fur; future; gaze; gesture; globe; glove; grab; gracious; graft; groom; guilty; gulf; hall; heap; hiss; historical; hitch; holy; honest; honorable; hum; humor; hurl; immortal; imperial; impress; incense; incorporate; indeed; innocent; institute; instruct; intelligence; intent; intimate; intrigue; invite; jaw; jet; jewel; jolly; kindly; knee; league; lease; lightly; likely; limb; local; loosen; lovely; mantle; marriage; mat; mature; meat; mechanic; medium; mellow; melody; mercy; mineral; minute; mob; modern; moment; monument; mortal; myself; naturally; naval; nearly; needle; neighbor; neighborhood; neither; notch; overwork; owe; passionate; pencil; penny; per; perch; perfection; petition; pink; plot; ply; politic; pot; pour; praise; prayer; president; pretence/se; prince; property; proposition; prostrate; provoke; prune; radiate; reasonable; rebel; recoil; recommend; regularly; relate; relish; remote; remember; require; restoration; retain; revolve; rhythm; ridge; ripen; roast; robe; rout; rust; sacred; sad; saddle; sage; sanctuary; scratch; semi; series; serious; session; sew; shield; shore; shriek; shy; silent; sin; skill; slate; slay; slope; snarl; sole; sometime; sooth; sorry; species; spike; sprinkle; squeak; staple; stare; stark; steep; stony; strap; straw; strictly; subordinate; subsistence; sugar; suggest; summer; sweeten; sweetly; tan; taper; tax; tension; text; than; their; these; thirty; though; thrash; thrill; throne; tile; title; torture; transport; traverse; treasure; tremble; trench; troop; trot; trumpet; twilight; ultimate; uncover; undermine; undertake; unhappy; unit; vanish; vapor; variable; variation; vex; vile; wagon; wane; ward; warp; waver; wealth; wed; whom; wicked; wife; window; winter; worker; wriggle; zone.
После того как были убраны статистически недостоверные данные, ФН стала распределяться следующим образом: 412 для первого значения, 245 для второго значения, 147 для третьего значения, 86 для четвертого значения, 52 для пятого, 35 для шестого значения, 15 для седьмого и 7 для восьмого значения. Всего осталось 29 слов.
Качество аппроксимации показано на рисунке 7. Качество аппроксимации функциональной нагрузки восьмизначных слов У экспоненциального распределения точность аппроксимации экспериментальных данных из словаря Э. Торндайка и И. Лорджа составляет 99%. Коэффициенты: A = 792; = 0,563. 2.10. Распределение функциональной нагрузки между значениями девятизначных слов
Все девятизначные слова из словаря были помещены в отдельную группу, для каждого из девяти значений была получена среднеарифметическая ФН. Она составила 426 для первого значения, 202 для второго значения, 125 для третьего значения, 79 для четвертого значения, 55 для пятого значения, 34 для шестого значения, 29 для седьмого значения, 23 для восьмого и 20 для девятого. Общее количество девятизначных слов – 277.
Слова с девятью значениями: absorb; abuse; accommodation; accompany; accomplish; advantage; aid; allure; ally; altar; amuse; anti; apart; argument; assimilate; assurance; attain; attraction; avail; awaken; ay, aye; bait; bat; bluff; boast; boot; brace; brain; brand; brave; bridge; cake; cat; chair; chill; choice; circuit; circular; classic; collapse; combination; commander; comprise; confirm; conscious; consecrate; construction; contest; conversion; convey; convict; core; counter; counterfeit; crude; cultivate; culture; cunning; curtain; damage; dazzle; deadly; debt; deeply; default; defense; delight; delivery; demonstration; depress; deserve; determination; diminish; disarm; disk; dismiss; disorder; disperse; distinction; distribute; dock; dome; driver; dumb; dwell; elevation; embrace; establish; estate; estimate; evening; exceed; excite; execute; execution; exhibit; fate; fence; finance; flag; flicker; forge; formal; frequent; gallant; gallop; garrison; gem; gipsy; glaze; goose; grapple; gravity; greet; grieve; happen; harness; haste; hatch; haunt; height; herd; hire; history; host; howl; ice; imagine; improve; impulse; individual; interior; invert; knowledge; lack; lime; limit; link; lively; lumber; male; manoeuvre; martyr; memory; menace; mess; mingle; mission; moderate; multiply; muse; nerve; observation; operate; opposite; opposition; outline; outward; palm; parcel; pardon; patch; peak; pillar; platform; plead; plunder; poll; possible; precipitate; pretty; prevail; priest; principal; proof; protest; publish; pulse; puzzle; qualify; quality; quantity; realize; recall; reconcile; reel; refer; rejoice; relation; relieve; remembrance; reputation; residence; respectable; revenue; revival; rhyme; rig; riot; ripple; romantic; rug; rumble; sack; sacrifice; saint; savage; scrap; seed; sensible; settlement; seven; severity; shallow; shop; shower; shuffle; silence; situation; sling; soar; sour; southern; sovereign; span; spiritual; squat; stem; stifle; strangle; struggle; stumble; sudden; superficial; suppress; sustain; sweetness; swift; tack; telegraph; thank; throat; toe; toll; too; tow; toy; track; traffic; transfer; twelve; twin; twine; ugly; un-; unequal; uphold; varnish; vast; vault; vegetable; vigorous; vigor; vision; vocal; warrant; web; weed; wine; wither; yard; yes; delicacy; purple; rivet; shroud; structure.
Фактор времени и распределение функциональной нагрузки между значениями трехзначных слов
Возраст знаковых единиц – фундаментальная характеристика, значимость которой до сих пор недооценивается в лингвистике. Возраст любой знаковой единицы язык определяет тот этап жизненного цикла единицы, на котором она находится, определяет степень ее продвинутости по ряду системных характеристик (в первую очередь тех, которые рассматривались в настоящем исследовании). Под жизненным циклом подразумеваются закономерные, направленные изменения, свойственные в виде тенденции каждому языковому знаку - от его рождения до смерти. Жизненный цикл слова, реализующийся в результате коммуникативного обращения лексического знака, означает закономерное использование, трату того потенциала изменения-развития, который заложен в нем при рождении [Поликарпов 1998].
А.А. Поликарпов говорит о том, что в развитии лексических единиц лежат несколько типов изменений [Поликарпов 1998]. Наиболее важные из них: 1. процессы абстрактивизации каждого из значений знака, тенденция к постепенной потере постепенной потере ряда присущих каждому из значений признаков; 2. процессы приобретения словом в ходе его истории новых, преимущественно относительно более абстрактных в сравнении с материнскими значений. Нас интересует, как именно происходил процесс развития значений многозначного слова, а именно – как распределялась нагрузка среди этих значений.
Распределение слов по их этимологическому источнику в зависимости от ранга уже изучалось, впервые данные о распределении по частотному словарю Торндайка [Thorndike 1921] слов англосаксонского и романского происхождения привел еще в 20-е годы Линдсей [Lindsey 1925]. Позднее более подробные данные по этимологическому составу английского языка представил Робертс [Roberts 1965], он использовал уже другой частотный словарь – Хорна [Horn 1926]. Но первым, кто сопоставил частоту слова и время его возникновения, был Дж. Ципф. В опубликованной в 1947 году заметке [Zipf 1947], используя частотный словарь Элдриджа [Eldridge 1911], Ципф показал, что возраст слова и его частота коррелированы, причем среди наиболее частых слов больше всего слов наиболее древнего происхождения [Арапов, Херц 1974].
Взаимосвязь функциональной нагрузки и возраста значений еще не становилась предметом изучения в лингвистике.
Если рассмотреть теоретически процесс вытеснения одного значения другим, то вначале в языке было однозначное слово, и на него приходилось 100 % функциональной нагрузки. Затем появляется новое (второе) значение, и его функциональная нагрузка поначалу невелика. Если употребительность этого значения начинает расти, то автоматически уменьшается употребительность первого значения. В итоге этот процесс может окончиться полным вытеснением первого значения. (См. рис. 28).
Хронология изменения функциональной нагрузки на значения двузначного слова Значения слов на шкале времени распределены согласно данным Oxford English Dictionary [OED 2009] (см. рис. 29), а относительная частота употребительности значения слова была взята из частотно-семантического словаря И. Лорджа и Э. Торндайка и указана в промилле. Рис. 29. Скриншот электронной версии словаря Oxford English Dictionary
Общее количество двузначных слов составляет – 4367. Следующий этап работы – указание для каждого значения даты его первой фиксации согласно Oxford English Dictionary. Однако мы понимаем, что дата первой фиксации слова не всегда является датой его рождения: «внешняя хронология достоверна лишь тогда, когда она современна фиксируемым ею лингвистическим процессам» [Кретов 2006, С. 43] (ср. также Кретов 2002). «Древние памятники для установления возраста того или иного слова далеко не всегда дают серьезную опору, поскольку в силу тематической и прагматической ограниченности текстов (как правило это конфессиональная литература, деловые документы, хроники) широко распространенная лексика бытовой референтной отнесенности может появляться в письме очень поздно. Также не всегда первое фиксируемое памятниками значение слова является самым ранним» [Краткий понятийно-терминологический справочник 1998, С. 34]. В результате сопоставления хронологии первой фиксации значений с их относительной частотой мы получили 2112 слов, у которых функциональная нагрузка более древнего значения выше, чем функциональная нагрузка вторичного значения.
Теперь рассмотрим каждую группу подробней. В первой группе у всех слов большую функциональную нагрузку имеют более древние значения. В среднем разница между функциональной нагрузкой значений первого и второго рангов составляет 551 . Разница в возрасте между значениями первого и второго рангов составляет в среднем 187 лет. Максимальная разница в возрасте равна 1079 годам, а минимальная – 1 год.
Похожие диссертации на Распределение функциональной нагрузки между значениями многозначных слов
-
-
-