Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Основания лингвистической теории тезауруса Осокина Светлана Анатольевна

Основания лингвистической теории тезауруса
<
Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса Основания лингвистической теории тезауруса
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Осокина Светлана Анатольевна. Основания лингвистической теории тезауруса: диссертация ... доктора филологических наук: 10.02.19 / Осокина Светлана Анатольевна;[Место защиты: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Челябинский государственный университет"].- Челябинск, 2015.- 467 с.

Содержание к диссертации

Введение

ГЛАВА 1. Истоки теории тезауруса 21

1.1. Лингвистические истоки теории тезауруса 24

1.1.1. Печатные тезаурусные словари 24

1.1.2. Электронные тезаурусы 48

1.1.3. Ассоциативные тезаурусы 63

1.1.4. Тезаурус как система знания в лексикографическом аспекте

1.2. Естественно-научные истоки теории тезауруса 77

1.3. Философско-методологические истоки теории тезауруса ... 105

1.4. Место тезауруса в системе «человек - язык - знание -реальность». Междисциплинарный подход 130

Выводы по Главе 1 159

ГЛАВА 2. Языковая структура и принципы организации тезауруса 161

2.1. Непосредственный объект наблюдения 162

2.2. Единицы тезауруса 171

2.2.1. Что собой представляет вербальная единица знания?

Вводные замечания 172

2.2.2. Система лингвистических взглядов на устойчивое сочетание слов 175

2.2.3. Доказательства объективного существования устойчивых сочетаний слов как самостоятельных языковых данностей 187

2.2.4. Устойчивые сочетания слов -языковые единицы знания 212

2.3. Системные отношения единиц тезауруса 220

2.3.1. Межтекстовые отношения в системе тезауруса 228

2.3.2. Серийное устройство системы тезауруса 246

2.4. Модель системы тезауруса - тезаурусная сеть 258

2.4.1. Иерархия - поле - сеть 259

2.4.2. Структурные свойства языкового тезауруса как словесной сети 286

2.5. Метод тезаурусного анализа в лингвистике 295

Выводы по Главе 2 308

ГЛАВА 3. Экспланаторныи и прогностический потенциал лингвистической теории тезауруса 311

3.1. Объяснительные возможности теории тезауруса 311

3.1.1. Тезаурусный подход к объяснению становления языковых знаний у ребенка 314

3.1.2. Тезаурусный подход к объяснению процессов вербальной коммуникации на разных языках 331

3.1.3. Тезаурусный подход к объяснению принципов языкового упорядочивания мира 345 3.2. Прогнозирующие возможности теории тезауруса 362

3.2.1. Прогностические потенции теории, основанные на

изучении внутренней организации системы тезауруса... 363

3.2.2. Прогностические потенции теории, основанные на

локальных исследованиях тезаурусной сети 372

Выводы по Главе 3 392

Заключение 394

Библиографический список

Ассоциативные тезаурусы

Условно можно выделить три этапа в истории создания идеографических словарей в зависимости от методологических основ, на которых базировались данные словари: древние идеографические словари, словари эпохи Нового времени, современные словари, изданные в XX-XXI веках.

Первые попытки построения подобных словарей относятся к II в. н.э. Как считает В.В. Морковкин: «На заре цивилизации, когда люди могли выразить свои мысли на письме при помощи идеограмм и символов, единственно возможным словарем был, вероятно, такой, в котором слова располагались по тематическим группам» [Морковкин, 1970, с. 10]. Основная идея создания таких словарей состояла в том, чтобы определить какими конкретными словами языка выражается тот или иной смысл, или идея (поэтому такие словари называют иногда «идеологическими», как, например, в книге Ш. Балли [Балли, 2001, с. 151]).

Из дошедших до нас словарей известен словарь Ю. Поллукса «Ономастикой», II в., состоящий из 10 книг, в каждой из которых содержаться слова, относящиеся к той или иной теме.

Между II и III в.в. появляется словарь санскритского языка «Амарок-ша» (в переводе - «Сокровища Амара»), описывающем 10 тыс. слов в трех книгах, каждая из которых разбивается на общие и частные темы, рассуждение о которых изложено в стихах, например, первая книга посвящена небу, богам, и всему, что с этим связано. Словарь несколько раз переиздавался и переводился на европейские языки.

Данные словари представляют собой первые попытки системного представления лексики, базирующие на особенностях мировоззрения того времени [Щербинин, 1987, с. 66].

В эпоху Нового времени возникает идея создания единого философского языка, который отражал бы общие мыслительные категории человека. Эта идея, ставшая методологической основой практически всех исследований языка того времени, постулируется в трудах Р. Декарта и других мыслителей. В 1668 г. епископ Дж. Уилкинс создает словарь под названием «Опыт о реальном выражении в философском языке», в котором слова языка делятся на шесть классов - трансцендентальные понятия, субстанции, количества, качества, движения, отношения - каждый из которых делится на 40 классов. Каждому слову присваивается определенный буквенный индекс, в соответствии с его классом, например, класс «стихия» имеет индекс De, вид стихии «огонь» - Deb, вид огня «пламя» - Deba. [Морковкин, 1970, с. 17] Наиболее известным тезаурусом Нового времени, который не потерял свою актуальность до сих пор, регулярно переиздается и переведен на несколько языков, является «Тезаурус английских слов и выражений» Питера Марка Роже (1852 г.), в котором максимально учтены идеи составителей предшествующих словарей. Слова разделены на шесть классов - абстрактные понятия, пространство, материя, разум, воля, чувства - которые делятся на логические группы и подгруппы. Роже не ставил себе целью дать дефиницию слов или описание смысла слов, но считал необходимым привести синонимы и антонимы, так как, по его мнению, это помогает лучше найти слово в словаре и служит подсказкой памяти, если невозможно вспомнить, какие еще слова выражают определенное понятие. Слова снабжены цифровыми указателями на соответствующие рубрики, слова, встречающиеся в нескольких рубриках, выделены курсивом, например, так выглядит комплекс слов, с заглавным словом existence {бытие): existence being, entity; absolute being, the absolute 965 divineness; aseity, self-existence; monad, a being, an entity, ens, essence, quiddity; Platonic idea, universal; subsistence 360 life; survival, eternity 115 perpetuity, preexistence 119 priority, this life 121 present time; existence in space, prevalence 189 presence; entelechy, realization, becoming, evolution 147 conversion; creation 164 production; potentiality 469 possibility, ontology, metaphysics; realism, materialism, idealism, existentialism 449 philosophy [Roget, 2004].

Главными недостатками тезауруса Роже является чрезмерная схематичность при отнесении слов в рубрики - стремясь по максимуму воспроизвести логические отношения слов языка, главным образом родо-видовые, Роже упускал из виду множество других отношений, которыми связаны слова, например, «пространство» выделено в отдельную категорию, а «время» входит в категорию «абстрактные понятия», слово музыка входит в группу «звук» и далее - в большую категорию «материя», а живопись - в категорию «разум» [Морковкин, 1970, с. 23-24]. Также словарь критикуется за запутанность схемы поиска нужного слова, хотя сам Роже постулировал в качестве основной задачи своего тезауруса возможность нахождения слов, которые человек в данный момент по каким-то причинам не может вспомнить, для выражения того или иного смысла [Luts, 1994]. Однако, по мнению других авторов, именно фундаментальная логическая схема является залогом его долговременного использования и актуальности до нашего времени, поскольку, пользователю словаря предоставляется обширнейший материал для раздумий [Merrim-Webster s Collegiate Thesaurus, 1993].

Работа над словарем была продолжена сыном и внуком П. Роже, и в последствии словарь неоднократно исправлялся и дополнялся. Современные издания словаря значительно отличаются от оригинального.

Еще один словарь, оказавший воздействие на современные представления об идеографических словарях - «Аналогический словарь французского языка» П. Буасьера. Принципиальным отличием данного словаря является отказ от логической схемы представления словесного материала и использование алфавитного принципа для облегчения поиска слов - этим составитель словаря стремился преодолеть недостатки тезауруса Роже. В алфавитном порядке излагаются ок. 2000 слов, представляющие собой, по мнению Буасьера, активный слой французского языка, и являются «центральными» в группе других слов (из пассивного слоя), которые приводятся рядом с данным словом [Морковкин, 1970, с. 25-26]. Словарь Буасьера, по сути, является прототипом большинства современных тезаурусов.

Философско-методологические истоки теории тезауруса

Среди концепций, связанных с культуролого-социологической теорией тезауруса в трактовке Вал.А. и Вл.А. Луковых и их коллег являются теория фреймов И. Гофмана, теория социальных практик Ю. Хабермаса, идеи отечественных ученых А.А. Зиновьева, П.К. Анохина, К.В. Судакова [Луков Вал. А., 2011; 20126]. В рамках данного подхода исследуются тезаурусы отдельных индивидов [Гайдин, 2013; Загороднюк, 2013; Захаров, 2011; Ясинская, 2012], тезаурусы определенных социальных групп [Агранат, 2012; Луков Вал.А., 2012а; ], тезаурус культуры [Аронин, 2012; Шустова, 2012], а также тезаурусные системы различных направлений науки и научных дисциплин [Тезаурусный анализ мировой культуры, 2005; 2006; 2007; 2008; 2009; 2010; 2011; 2012; 2013].

В данной концепции, как и в охарактеризованных выше лингвистических трудах, тезаурус рассматривается как присущая субъекту когнитивная система знания о мире, поэтому тезаурус сравнивается с понятием «картина мира»: ««Картиномирная» теория (КМ-теория) стала частью тезаурусной научной концепции» [Луков Вл.А., 2010]. Имеются работы, в которых понятия «тезаурус» и «картина мира» отождествляются [Есин, 2005]. Однако в более поздних исследованиях намечаются способы дифференциации данных понятий: «Иными словами, картина мира — это образ мира, а тезаурус — это знание о мире (как объективное, так и субъективное, как научное, так и ненаучное), накопленное и систематизированное в соответствии с этим образом» [Костина, 2008, с. 96].

Тем не менее, во всех рассмотренных концепциях ставится акцент на когнитивной сущности тезауруса как системы знания, поэтому для изучения тезауруса привлекаются термины, понятия и модели, выработанные в рамках когнитивной парадигмы (концепт, фрейм, картина мира). Внешнее существование тезауруса как системы знания, закрепленной в материальных объектах культуры, не отрицается, но и не получает достаточного рассмотрения, ви 154 димо, в силу всеобщего представления, что материальная сторона языковых знаков не имеет прямой связи с понятийной стороной.

Отличие предлагаемой нами концепции состоит в понимании тезауруса как системы знания, объективированной в виде материальных языковых знаков, поскольку мы полагаем, что суть лингвистической концепции тезауруса должна состоять в исследовании собственно языковых объектов, а не их ментальных соответствий (мы считаем, что исследование ментальной составляющей знания в большей степени является предметом ведения таких наук, как психология и философия, нежели языкознания). Мы рассматриваем тезаурус как внешнюю - языковую - знаниевую систему, воздействующую на человека и влияющую на преобразование его интериоризированного знания.

Мы обращаемся к понятию «тезаурус», поскольку оно в более очевидной форме по сравнению с когнитивными понятиями подчеркивает вербальную составляющую знания, ведь тезаурус, это, прежде всего словарь, и единицами тезауруса в исходном понимании являются слова, а не ментальные сущности.

С точки зрения эпистемологической деятельности человека тезаурусом можно признать особым образом организованную систему слов, которой человек не просто пользуется в процессе получения и продуцирования вербальной информации, то есть обмена знанием, но и которая в силу своей особой организации ориентирует человека в информационном пространстве. Ориентирование осуществляется за счет того, что человек не создает семантические связи между словами, а получает уже оформленную систему связей от предшествующих поколений. Эта система складывается в процессе постоянной вербальной коммуникации людей, и у человека не остается другого выбора, кроме как принять ее и жить в ней.

Рассмотрев доминирующие в современном языкознании научные модели, так или иначе интерпретирующие эпистемологическую функцию языка, мы пришли к выводу о необходимости более тщательного осмысления принципов существования знания в самом языке и наметили некоторые пер 155 спективы исследований в этом плане. Наиболее удачной моделью для обозначения системы знания, заложенной в языке, представляется тезаурус. Тезаурус в таком понимании - не хранилище знаний в сознании человека, а вполне материальная информационная система, воздействующая на сознание из вне. Предложены некоторые направления изучения тезауруса, которые вполне последовательно развивают некоторые идеи когнитивной лингвистики, но в ином эпистемологическом ракурсе. Само представление о тезаурусе как об информационной системе, формирующейся с развитием языкового опыта человека, спроецировано когнитивными исследованиями. Принципиально новым в выдвигаемой концепции тезауруса как организуемой языком системы знания является то, что подчеркивается языковая (не ментальная) природа тезауруса, а также то, что признается эпистемологическая вторич-ность некоторых ментальных сущностей по отношению к языковым.

Мы полагаем, что, моделируемые учеными ментальные сущности в эпистемологическом плане являются вторичными по отношению к языку (подчеркнем, с точки зрения онтогенеза ментальные структуры знания предшествуют усвоению языка и обеспечивают овладение им, но так как конструируемые модели выводятся из языка, то в эпистемологическом плане они вторичны), необходимо более тщательно изучить, как знание существует в самом языке, что оно собой представляет, как развивается, каковы собственно языковые единицы знания и способы их хранения, упорядочивания, организации, развития и функционирования.

Суммируя все изложенное в данном параграфе, можно сделать вывод, что в современной науке понятие «тезаурус» является одним из наиболее перспективных, с которым ученые различных отраслей науки связывают надежды на постижение феномена знания, называя тезаурусный подход «эври-стичным» [Луков, 2005]. Однако подходы к интерпретации данного понятия настолько различны, что не удается сформировать единого представления о сущности тезауруса.

Система лингвистических взглядов на устойчивое сочетание слов

На этом фоне представление о сущности ассоциативной связи между элементами языка, изначально приписываемой Соссюром парадигматическим отношениям, также претерпело некоторые модификации, результатом которых стала возможность рассмотрения синтагматических оснований ассоциаций.

В настоящее время термин «ассоциация» используется столь широко совершенно различными направлениями науки, что несколько теряется исходный смысл этого слова. Семантика латинского слова associatia подсказываем что в любом случае имеется в виду некая связь, объединение нескольких элементов, однако, каких именно и на какой основе - предмет отдельного представления в каждом направлении науки. Поскольку Ф.де Соссюр понимал под ассоциативными связями принципы объединения слов на уровне психики человека, языкознание унаследовало психологическое токование сущности ассоциаций.

Унифицируя определения ассоциации по данным нескольких психологических словарей можно сделать вывод, что ассоциация представляет собой закономерную связь двух и более психических элементов, возникшую в результате опыта и обусловливающую при актуализации одного элемента появление другого. Ассоциативные отношения лежат в основе механизма памяти.

Применяя эти положения к лингвистике, можно сказать, что ассоциация есть воспроизведение некогда состоявшегося языкового опыта в памяти, так что актуализация одного элемента (например, слова) предполагает «оживление» в памяти связанного с ним элемента (другого слова). Однакоt совершенно не обязательно, чтобы восстанавливалась связь с элементом того же класса, иначе говоря, ассоциативная связь - это не обязательно связь между инвариантами внутри варианта, что предполагается парадигматическими отношениями, согласно учению Ф.де Соссюра.

Ассоциативная связь может осуществляться на отношениях сходства, контраста и смежности. В языке примером ассоциативной связи на основе сходства может служить синонимический ряд (это парадигма), примером связи по контрасту - антонимический ряд (тоже парадигма), примером ассоциации по смежности могут выступать такие пары слов, как цветок - роза, туча - дождь, стол - стул и др. (не парадигма; Дженкинс называет такие ассоциации синтагматическими, а связи, типа небо - голубое - парадигматическими [Леонтьев, 2007, с. 50]). Ассоциации по смежности вызваны близким существованием предметов во времени и пространстве, по свидетельству ученых, они представляют собой более сложный тип ассоциаций на основе родо-видовых, причинно-следственных или других видов отношений [Морковкин, 1970, с. 35].

Примеры ассоциаций по сходству, контрасту и смежности можно найти в классической теории тропов, где в качестве первых выступают метафоры, вторых - оксюмороны, третьих метонимии. Таким образом, выделяемые в психологии типы ассоциаций вполне могут найти свое воплощение в лингвистических отношениях, но не всегда эти отношения имеют парадигматический характер. Так, чтобы понять, является ли, например, слово живой метафорой или употребляется в своем прямом значении, необходимо проанализировать контекст, т.е. синтагматическое образование с данным словом, и тогда понятно, что в синтагме живые звери оно употребляется в прямом значении, в синтагме живое слово - в метафорическом, в синтагме живой звук - в метонимическом, а в синтагме живой труп образует оксюморон.

Таким образом, ассоциативная связь не представляет собой нечто, противопоставляемое синтагматической связи. Следовательно, ассоциативные и парадигматические отношения - не взаимозаменяемые сущности. Ассоциативные отношения могут проявляться как отношения между классами слов (парадигматические), но, поскольку в основе ассоциаций лежат связи, восстанавливаемые в памяти исходя из имеющегося опыта, логично предположить, что ассоциативные отношения между словами языка строятся на основе опыта использования языка, т.е. речевого опыта. В таком случае парадигматические отношения языка представляют собой следствие его синтагматического существования в речи. И в концепции Ф.де Соссюра тому имеется достаточное подтверждение: коль скоро язык - лингвистический конструкт, то и собственно языковые связи (парадигматические) - также плод целенаправленного лингвистического конструирования, но не объективная данность.

Поскольку любой конструкт в принципе не может полностью воплотить реальный объект, результаты конструирования, как правило, довольно уязвимы.

В частности, одной из вершин развития структурализма, начало которому было положено в трудах Ф. де Соссюра, является конструктивный синтаксис языка. Если спроецировать представления о сущности парадигматических и синтагматических связей языка на учение о типах связей в конструктивном синтаксисе, то связью синтагматического характера стоит признать подчинение (согласование, управление, примыкание), и именно этот тип связи реализуется в сочетании.

Сочинительная связь не рассматривается как свойственная уровню словосочетания - это синтаксическая связь на уровне предложения, при которой происходит объединение, как правило, равноправных членов предложения или неравноправных по выполняемой в предложении функции (например, никто и никогда, все и всячески), но, в то же время, не обнаруживающих свидетельств зависимости [Русская грамматика, 19806]. Представление о ряде равноправных элементов, объединенных на основе некоторой связи, вполне согласуется с представлениями о парадигматических отношениях языка.

Тезаурусный подход к объяснению процессов вербальной коммуникации на разных языках

Прежде всего, прогностический потенциал теории заложен в самой сущности тезаурусных единиц знания. Так как единицей знания в системе тезауруса является синтагматическое объединение слов, воспроизводящееся в многочисленных текстах, что позволяет ей фигурировать как готовой коммуникативной единице, имеются основания предугадывать окончание фразы, если задано определенное ее начало. Синтагматическое единство тезаурусной единицы обусловливает человеческую способность узнавания фразы и прогнозирование ее лексического развертывания в последовательность конкретных слов - способность предполагать появление каждого последующего слова в высказывании.

На этом свойстве тезаурусной единицы знания основывается работа наиболее используемых поисковых систем интернета. Так, крупнейшая российская поисковая система и интернет-портал Яндекс, при введении в поисковой строке слова теория, приводит список наиболее часто запрашиваемых в последнее время сочетаний со словом теория, облегчая поиск пользователя: теория большого взрыва, теория образования, теория крошечного взрыва, теория заговора, теория лжи, теория безработицы, теория национального счетоводства (по состоянию содержания системы Яндекс на 25.07.11).

Поскольку в основе поискового алгоритма лежат только измерительные параметры, материалом для которых является материальная оболочка слов, расширяющие поиск сочетания слов никак не связаны между собой, кроме наличия в них запрашиваемого слова, например, при вводе слова хороший параметры поиска расширяются сочетаниями хороший фильм, хороший статус, хороший плохой злой (название фильма), хороший год, хороший фотошоп, хороший переводчик с английского на русский, хороший коньяк, хороший клей для ресниц. Нельзя не заметить, что расширяющие поиск сочетания образуют собой не что иное, как серию тезаурусных единиц, - основной параметр систематизации тезаурусной сети, - объективное существование которых обна ружено в настоящем исследовании методом лингвистического наблюдения, а в поисковой системе Яндекс складывается в результате количественного подсчета наиболее актуальных запросов пользователей. Это, с одной стороны, доказывает объективность существования серий устойчивых сочетаний слов как способа параметризации тезаурусной сети, с другой - раскрывает прогностический потенциал лингвистической теории тезауруса.

Расширение критериев поиска, предлагаемое пользователю системой Яндекс, служит в целях оптимизации и увеличения скорости поиска путем предложения пользователю более конкретных последовательностей слов, которые с большей долей вероятности встретятся ему в имеющихся в системе текстах. Далее система предлагает перечень ссылок на известные ей страницы, в тексте которых (а также в метатегах или в ссылках на эти сайты) содержатся слова из запроса. В большинстве случаев таких страниц очень много — настолько, что пользователь не сможет просмотреть их все. Поэтому система упорядочивает их таким образом, чтобы сверху оказались те, которые лучше всего подходят для ответа на заданный запрос — то есть, наиболее релевантные запросу. Релевантность в таком случае — это наилучшее соответствие последовательностей слов в найденных текстах тому запросу, который был введен в строке ввода. Формулы ранжирования информации в соответствии с ее релевантностью также строятся автоматически [http://company.yandex.ru]. Аналогичным образом устроена работа других поисковых систем (Google, Rambler, Yahoo и др.). Конечно, каждая из них ставит акцент на определенные критерии при организации предлагаемой информации по релевантности, но все они построены на принципе предвосхищения поискового запроса пользователя по принципу предложения ему списка наиболее актуальных запросов, связанных с первым введенным в строку поиска словом, выведенных автоматическим способом.

Если до таких возможностей предвосхищения ожиданий пользователя смогли дойти автоматизированные поисковые системы, созданные человеком, то трудно усомнится в том, что и сам человек в состоянии предвидеть с

определенной долей вероятности, какое слово будет в воспринимаемом потоке речи следующим.

Благодаря объективному существованию тезаурусных единиц, оцениваемому как проверенное знание, человек оказывается в состоянии прогнозировать словесное развертывание воспринимаемого высказывания. Особенно это касается общеизвестных прецедентных текстов, формулировки которых существуют как самостоятельные блоки информации. Не составляет труда достроить такие высказывания, как: Мой дядя..., Быть или..., Семь раз..., Куда уехал..., Альфа..., Прыг..., Тик... и подобные общеизвестные выражения (фразы взяты из рекламного ролика системы Google Chrome, транслировавшегося по телевидению).

Мы полагаем, что автоматизированные устройства поиска информации, целенаправленно выведенные разработчиками поисковых систем путем математического исчисления наиболее частотных материальных языковых форм, отвечающих словесному критерию (материальные формы на уровне слов), соотносятся с объективно заложенными в системе языкового тезауруса принципами организации информации и могут объясняться с лингвистических позиций.

Прогностический потенциал теории тезауруса связан с осмыслением идеи частотности появления определенных последовательностей слов и возможности их количественного исчисления. Предполагаем, что частотность воспроизведения единиц тезауруса и их количественный состав являются необходимыми условиями их закрепления в языковом тезаурусе как единиц знания.

Похожие диссертации на Основания лингвистической теории тезауруса