Введение к работе
Реферируемая работа посвящена изучению квантитативных (количественных) и квалитативных (качественных) характеристик ядерных1 служебных слов, функционирующих в русском подъязыке информатики2, и выявлению соотношения (корреляций) этих свойств исследуемых единиц
Развитие лингвистики предполагает не только появление новых аспектов исследования, но и возврат к давно описанным категориям языка, которые, однако, в свете современных представлений и при использовании современных методик способны дать новые знания об уже известных явлениях
В частности, «категории служебных слов давно ждут серьезных исследований в рамках современной научной парадигмы» [Всеволодова и др 2003 17] Об этом свидетельствует открытие в 2003 году дискуссии по проблеме «Категории служебных слов в современной лингвистической парадигме» на страницах Вестника Московского университета [Всеволодова и др 2003 17], открытие международного проекта «Описание служебных слов русского языка», поддержанного Национальным центром научных исследований Франции [Исследование по семантике предлогов 2000 11] и республиками Беларусь и Украиной [Зашитко 2003 92]
К нашим дням выявлено, что «для языка несомненным является квантитативный фактор» [Николаева 2000 14], который стал «сильным ходом на пути поиска научной истины в науке о языке» [Борисов 1999 33], «мощным инструментом для выявления сущности лингвистических явлений» [Марчук 2007. 232] Потому исходным положением данного исследования является сочетание количественного и качественного подхода к анализу ядерных служебных слов, поскольку именно такое сочетание «позволяет более глубоко познать лингвистический объект во всей его многогранности» [Поликарпов 1989 159]
Актуальность исследования обусловлена рядом лингвистических и экстралингвистических факторов
неизученностью подъязыка информатики в целом и его служебных слов как «крепежных деталей, без которых нельзя создать ни одного текста» [Арапов 1988 25];
необходимостью расширения и углубления лингвистических исследований служебных слов на базе надежной экспериментальной мето-
' По полевой методике [Полевые структуры в системе языка 1989 8] и на основе градуально-сти служебности/знаменательности в служебной лексике выделяем ядро (предлоги, союзы, абстрактные связки и цетеры), которые подлежат нашему изучению
2 Помимо объективных факторов «союза информатики и языкознания» и неизученности этого подъязыка с позиций лингвостатистики, субъективный фактор выбора подъязыка информатики, состоит в том, что непосредственно с информатикой связана преподавательская деятельность автора
дики, дающей возможность изучения скрытых от прямого наблюдения лингвистических объектов и их связей,
острой необходимостью оптимизации естественных информационно-коммуникативных систем и естественного человеческого языка как самой мощной и универсальной системы,
запросами информационно-вычислительной индустрии, обусловленными потребностью оперативно перерабатывать научно-технические и деловые документы написанные на русском и других языках
необходимостью статистической оптимизации преподавания родного и иностранных языков, для чего нужны лексические минимумы и частотные словари
Объектом данного исследования являются ядерные служебные слова русского подъязыка информатики
Предмет исследования - квантитативные и квалитативные характеристики ядерных служебных слов русского подъязыка информатики
Цель диссертации — охарактеризовать квантитативные и квалитативные свойства ядерных служебных слов русского подъязыка информатики и вскрыть отношения (корреляции) между ними
Для достижения поставленной цели в работе решаются следующие задачи
обосновать методологическую базу исследования и его понятийно-терминологический инструментарий,
уточнить методику квантитативно-квалитативного исследования ядерных служебных слов,
выявить и описать частотные характеристики ядерных служебных слов русского подъязыка информатики.
охарактеризовать квалитативные свойства ядерных служебных слов исследуемого подъязыка (многозначность синонимию омонимию и антонимию)
установить корреляции между квантитативными и квалитативными свойствами ядерных служебных слов в данном подъязыке
Гипотезой, положенной в основу настоящего исследования, является предположение о том. что частотные характеристики изучаемых слов и их типовые лексико-грамматические и семантические признаки находятся в отношениях взаимообусловленности
В качестве эмпирической базы исследования выступает корпус текстов по информатике (100 текстов по 1000 словоупотреблений, то есть сто тысяч словоупотреблений), сформированный в соответствии с методикой системно-квантитативного анализа (см Библиографию раздел III Источники материала)
Методика формирования корпуса текстов описана в разделе 1 4 1 первой главы
Методы исследования В соответствии с целью и задачами исследованиями в качестве основного метода используется экспериментальное лингвостатистическое моделирование Для решения частных задач привлекаются как общенаучные методики и приемы (анализ, синтез, сопоставление, аналогия, классификация), так и лингвистические полевая методика, методика концептуализации, грамматико-семантический и словообразовательный анализы и методика «глубинных падежей» в интерпретации ГА Золотовой
Методологическую базу исследования составляют следующие основные концепции 1)концепция асимметрии, которая проявляется в двух феноменах во-первых, в асимметрическом дуализме языкового знака, что в парадигматическом плане порождает полисемию, синонимию, омонимию и синкретизм языковых единиц, во-вторых, в различении центра, ядра (типичные, прототипические формы и значения) и периферии (отклоняющиеся от этих моделей нетипичные формы и значения) 2) теория вариативности/инвариантности, рассматривающая вариативность как фундаментальное конститутивное свойство языка, характеризующее языки и их единицы как способы существования и функционирования,
-
социолингвистическая концепция стратификации языка, бытующего в единстве функционально-стилистических, предметно-тематических (подъязыков) и других форм существования, исходя из чего русский язык рассматривается в качестве субстрата подъязыка информатики,
-
концепция системной и вероятностной организации языка.
-
общефилософский приницип комплиментарное количественной и качественной сторон любых объектов, в том числе - и лингвистических
-
антиномия языка и речи, на которой базируется теория текста, речевая стилистика и речеведение в целом, 7)концепция интегративного, синтезирующего характера современной лингвистики, что позволяет реализовать комплексный, междисциплинарный подход к объекту и предмету исследования, 8) русская грамматическая традиция, в наиболее яркой форме воплотившаяся в общетеоретической концепции В В Виноградова, в центр которой поставлено слово «во всем объеме его лексико-семантических свойств, синтагматических связей, грамматических форм и функций» [Виноградов 1972 18], то есть слово как общий объект изучения лексикологии, морфологии и синтаксиса
Научная новизна диссертации заключается прежде всего в самом объекте и предмете исследования, а, исходя из этого — в предложенной перспективной методологии и методике, а также - во введении в научный оборот квантитативных и квалитативных свойств и их корреляций - нового ранее не изученного материала (служебной лексики подъязыка информатики), полученного не по вторичным источникам (сфера фиксации -
словари и справочники), а по первичным (сфера функционирования - тексты по информатике)1
Теоретическая значимость работы состоит в том. что предложенное в диссертации квантитативно-квалитативное решение проблемы подъязыка информатики вносит определенный вклад в теорию квантитативной лингвистики, типологии подъязыков и отраслевой лингвистики, углубляет наши представления не только в названных областях, но и способствует более глубокому проникновению в сущность русского этнического языка в целом, характеризуя наиболее функционально значимые его единицы Разработанная методология и методика исследования может быть использована при изучении других подъязыков русского языка, других этнических языков и в сопоставительных исследованиях
Практическая ценность работы определяется тем что представленный в диссертации материал и результаты его анализа могут быть использованы во-первых в лингводидактике - при обучению языку специальности, в спецкурсах и спецсеминарах при создании учебников, учебных пособий и учебных лексических минимумов для русского языка как неродного и как иностранного, во-вторых, в практике редактирования текстов по информатике и при создании первичных и вторичных текстов в этой предметной области в-третьих, в лексикографической работе при создании частотного словаря по информатике Некоторые результаты могут оказаться полезными в других областях прикладною языкознания и термино-ведения
Основные положения, выносимые на защиту.
-
Экспериментальное лингвостатистическое моделирование, осуществленное по четырехэтапной методике выявило объективную квантитативно-типологическую характеристику подъязыка информатики служебный лексикон исследуемого подъязыка по своей системно-функциональной значимости включает три основные зоны высокоранжируе-мые единицы-73 служебных высокочастотных слова, то есть 12.1% всех служебных (в основном — первичных древних), среднеранжируемые единицы - 74 служебных средиечастотных слова (12.3%) вторичного происхождения и низ ко ранжируемые единицы - 454 низкочастотных слова (75,6%), среди которых господствуют вторичные идиоматизирован-ные слова - эквиваленты и аналоги предлогов и союзов
-
Частотно-ранговая структура служебного лексикона подъязыка обладает ярко выраженным эффектом концентрации/рассеяния небольшое
' Корпусный подход реализует принцип первичности эмпирических данных, который обеспечивает «доступ к статистическому распределению событий по значениям параметров влияющих на эти события» [Кибрик 2006 16]
«ядро» высокочастотных слов являет собой нормированное устойчивое и жестко организованное употребление — «метрополию» подъязыка, в которой нет условий выбора в использовании языковых единиц тогда как большая «периферия» (среднечастотные и низкочастотные слова - «новый» и «новейший» лексикон) дает возможность выбора и авторских предпочтений
-
Сравнение средних частот слов подзоны уникальной частотности (то есть подзоны, имеющей статус лингвостатистической универсалии) в подъязыке информатики (7^=2687) и в русском литературном языке (по частотному словарю С А. Шарова: Fq)=1480) показывает, что эффект концентрации в подъязыке информатики почти в 2 раза выше, чем в общем русском языке Сопоставление средних частот слов этой подзоны по частотному словарю под редакцией Л.Н Засориной (1977 год - позднесовет-ский период) — Fcp= 1579 и словарю С А Шарова (2002 год- постсоветский период) -/^,=1480 выявляет в русском языке тенденцию к снижению концентрации и повышению эффекта рассеяния служебных единиц, в то время как в обследуемом подъязыке такая тенденция не просматривается />=2867
-
Многозначность как универсальная языковая категория манифестируется в служебном лексиконе подъязыка шестистепенной иерархией в ее соотношении с частотностью- пятая степень полисемичности (более 15 значений) - 12 высокочастотных единиц, четвертая степень (15-11 значений)-8 высокочастотных слов, третья степень (10-8 значений)-25 высокочастотных единиц, вторая степень (7-5 значений) — 46 высоко- и средне-частотных единиц, первая степень (4-2 значения) —381 средне- и низкочастотная единица, «нулевая» степень полисемичности - слова с одним значением - 229 низкочастотных служебных слов
При этом статистическая закономерность увеличения количества слов (на данную частоту) с падением частотности проявляется непоследовательно с «перепадами» между 5-ой и 4-ой степенью полисемичности, на границе подзон уникальной и центральной частотности, и между 1-ой и «нулевой» степенью полисемичности, на границе средней и низкой зон частотности
-
Корреляция частотности и полисемичности по абсолютным частотам служебных слов проявляется лишь вероятностно, более регулярно статистическая закономерность снижения полисемичности в связи с падением частотности выявляется только на основе средних частот служебных слов по зонам и подзонам частотности
-
В отличие от высокой внутрисловной деривационной активности (полисемичности). служебные слова оказались почти инертными в меж-
1 В квантитативной лингвистике норма подъязыка определяется как наиболее частотно-вероятностный состав элементов и наиболее вероятностные отношения между элементами [Тулдава 1987 24]
словной деривационной продуктивности большинство служебных слов подъязыка, даже высокочастотных, за небольшим исключением, имеют нулевые или небольшие словообразовательные парадигмы
-
Корреляция частотности и широкой синонимичности служебных слов проявляется слабо и опосредовано, через полисемию, причем параметры синонимических и полисемичных распределений находятся во взаимно-дополнительных отношениях
-
Грамматическая омонимия и антонимия служебных слов, не являясь облигаторной, проявляется в подъязыке «мозаично» и «точечно», вследствие чего корреляция частотности с грамматической омонимией и антонимией служебных слов, вероятно, имеет такую же природу, обусловленную «зернистостью», или «квантовостью» информационной структуры текстов
Апробация работы Основные результаты исследования обсуждены на объединенном заседании кафедр общей лингвистики и теории перевода Института международных связей (июнь 2006), кафедры теоретической и прикладной лингвистики Уральского государственного педагогического университета (июнь 2007), освещались в докладах на международной научно-практической конференции «Лингвистика, перевод и межкультурная коммуникация» (ИМС, 2005 2006), Всероссийской научной конференции «Язык Система Личность» (УрГПУ. 2006) I Международной научной конференции «Изменяющаяся Россия новые парадигмы и новые решения в лингвистике» (Кемерово, 2006) региональной научно-практической конференции «Язык и культура» (УГТУ-УПИ. 2006)
Материалы диссертации используются в практике преподавания информатики студентам-лингвистам Института международных связей
Основное содержание исследования отражено в 13 публикациях (10 статьях и 3 тезисах) в том числе в изданиях, рекомендованных ВАК
Структура диссертации Диссертация состоит из введения трех глав, заключения, библиографии включающей 390 источников а также семи приложений В тексте диссертации содержатся 3 схемы, 19 таблиц, 8 диаграмм