Введение к работе
Актуальность проблемы. Необходимость применения количественных методов *при изучении языковых явлений диктуется самой природой языка,- так как любому языку присущи количественные характеристики: в языке ограниченное количество букв,
фонем, типов слогов, грамматических и лексических морфей, синтаксических конструкций, каждый из.которых встречается с определенной частотой и обладает индивидуальными способностями сочетаться с другими единицами. Во многих случаях количественные характеристики могут служить сигналом, направляющим внимание исследователя на некоторые скрытые от "простого наблюдения качественные особенности и закономерности языко-
^вых явлений. Следует 'отметить, что в зарубежном и .отечественном языкознании накоплен большой опыт применения*количественных методов в исследовании языковых явлений. Эти исследования получили статус отдельной науки под названием '"квантитативная лингвистика", основной задачей^которой является применение количественных методов для раскрытия закономерностей функционирования единиц языка в речи, а также.установление закономерностей построения текста. По мере развития квантитативной лингвистики как отдельной науки, вероятностно-статистические методы математики стали' использоваться для характеристики функциональных стилей различных язтаов.
До сих пор в татарском языкознании исследования в области стилистики проводились на базе традиционного 'анализа языкового состава отдельных функциональных стилей. Это.- работы Х.Р.Курбатива/1/, В.X.Хакова/2/, Ф.С.Сафиуллиной/З/,'
1. Курбатов Х.Р. Татар теленец синтаксис пэм стилистика' мэсьэлэлэре. - Казан: Тат. кит. нэшрияты, 1956. - 176 б. Курбатов Х.Р. Хэзерге татар эдэби теленец стилистик система-сы. - Казан: Тат. кит. нэшрияты, 1971. - 192 б.
2: Хаков В.Х. Татар теле стилистикасына кереш. - Казан: Казан'ун-ты нэшрияты, 1963. - 168 б. Хаков В.Х Матур эдэбйят тел стиле. - Казан: Казан ун-ты.нэшрияты, 1967. - 53 с.
3. Сафиуллина Ф.С. Синтаксис татарской разговорной речи. - Казань: Изд-во Казан, ун-та, 1978. - 254 с.
И.Башировой/1/, И.Низамова/2/, И.Абдуллина/3/, в которых определяется^ арсенал изобразительных средств, характерных для того или иного стиля татарского языка. Известно, что функциональные стили язьта отличаются друг от друга прежде всего устойчивыми -частотами лексических и . грамматических единиц/4/. Исходя из этого, в данном исследовании к истолкованию языковых стилей татарского языка мы подходим с позиций количественных представлений и характеристик.
Актуальность изучения данной проблемы определяется современным статусом татарского языка, как государственного. В рамках реализации "Закона о языках народов Республики Татарстан" существует необходимость в расширении учебно-методической базы татарского языка, которое предполагает создание словарей-минимумов татарского языка, составление школьных и вузовских учебникоз, , учебных словарей и методических пособий по татарскому языку с учетом принципа частотного распределения лексических и грамматических единиц языка. Данное исследование является в.определенной степени научной базой Частотного словаря татарского языка.
О потребности в таких разработках можно судить по инте
ресу, проявленному к данному исследозанию во время апробации
его фрагментов на презентации программной продукции совмест
ной научно-исследовательской лаборатории АНТ и КГУ "Проблемы
искусственного интеллекта" в' АН Татарстана в декабре 1994
года, на международном симпозиуме "Компьютерный фонд терми
нов тюркских языков" в г.Шымкенте (Казахстан) в ноябре 1995
года. ' "
- Цель исследования заключается в'выявлении дифференциальных и интегральных признаков отдельных функциональных стилей татарского языка методами лингвистической статистики.
1. Баширова И.Б. Суз белэн сурат ясау. - Казан: Тат. кит.
нэшрияты, 1974. - 176 б.
2. Низамов И.М. Уем - тел очында. - Казан: Тат. китап
нэшр., 1995. - 287 б.
-3. Абдуллин И.А. Г.Камал драмаларынын теле. - Казан: Татарстан китап нэшрияты, 1968. - 198 -б.
4. Головин Б.Н. Язык и статистика. - М.: Просвещение, 1971. - с.121.
Поставленная цель определяет следующие конкретные задачи, которые решаются в работе:
анализ работ, посвященных проблемам квантитативно-системного исследования языковых явлений;
уточнение круга понятий и единиц анализа, которыми оперирует современная квантитативная лингвистика;
определение объема репрезентативной выборки, необходимой для квантитативного исследования татарского языка;
изучение возможностей автоматизации процессов, связанных с обработкой татарских"текстов, с помощью компьютерных программ;
исследование статистической структуры татарского языка: выявление таких статистических характеристик текста, как средняя частота словоформы (СФ), покрываемость Текста, доля высокочастотных и низкочастотных СФ.-в тексте, длина СФ в буквах и слогах;
изучение поведения данных статистических характеристик в отдельных функциональных стилях татарского языка;
сравнительный лингвостатистический анализ лексики отдельных жанров стиля xyдoecтвeннoй литературы (проза и поэзии) и информационного жанра газеты на базе полученных частотных словарей;- ' "'
изучение общеупотребительной лексики, характерной для всех исследуемых жанров языка;
' - выявление лингвостатистических закономерностей употребляемости отдельных грамматических категорий имен существительных и глаголов в зависимости от функционального стиля. Объектом исследования стали татарские тексты общим объемом в 500 тысяч словоупотреблений, представляющие собой одинаковые выборки из художественных произведений 36 татарских писателей, 58 поэтов и информационных сообщений трех ведущих'республиканских газет: "Ватаным Татарстан", "Татарстан хэбэрлэре", "Шэпри Казан", периода 1993-1995 годов.
Степень изученности проблемы. Мысль об использовании количественных методов при изучении стилистического варьирования языка была высказане задолго до начала развития кванти-
тативной лингвистики/1/.
- Одним из первых осноеы вероятнс зтно-статистйческого подхода к пониманию стилей языка заложил Б.Н, Головин. С этих позиций он дал "обновленное" определение.понятию функционального стиля языка: "Функциональные стили языка - это' типы его функционирования, соответствующие различиям социальной практики коллектива и отличающиеся друг от друга существенными различиями вероятностей языковых единиц и их категорий, достаточными для их совокупного качественного опознавания людьми на интуитивном уровне восприятия речи"/2/.
Начиная с 60-х годов, статистические методы все шире применялись в решении сложнейших проблем языковых и речевых стилей. В работах Б.Н.Головина/2/, Н.Д.АндрееЕ.а/3/, Г.Г.Бе-лоногова/4/, Р.М.Фрумкиной/5/, украинского коллектива под руководством В.И.Перебейнос/6/ и других исследователей собраны статистические данные, раскрывающие особенности функциональных и индивидуальных стилей различных языков. Возникшее
1. Виноградов"В.В. Современный русский язык. -_М., 1938.
— вып 1. - с. 155-156.
-
Головин Б.Н. Язык и статистика. -'М:: Просвещение, 1971. - с.121. ' .
-
Андреев Н.Д. Статистико-комбинаторные методы в теоретическом и прикладном языковедении:- Л.: Наука, 1967.- 403 с
-
Белоногов Г.Г. Автоматизированная , обработка научно-технической информации. - М., 1984. - 315 с*
-
Фрумкина P.M. Роль статистических методов в лингвистических исследованиях. - М. : Изд-во Моск.. ин-та иностр. яз., 1982. - Вып.15. - с.5~34. Фрумкина P.M. Автоматизация исследовательских работ в лексикографии //-ВЯ.- 1964.- N2.- с. 114.
-
Перебейнос В.И. 1<""0б установлении статистических параметров авторскихстилей // Частотные словари автоматическая переработка лингвистических текстов.- Минск, 1968.- с. 84-91. Перебейнос B.C. Опыт и принципы составления частотного словаря современного украинского языка // Статистическое ' и информационное изучение тюркских языков; - Алма-Ата, 1969.
- с. 7-Ю.
на стыке лингвистической науки и литературоведения, с Одной стороны, и математической статистики, с другой, это направление впоследствии получило статус самостоятельной дисциплины под названием "стилеметрия" /1/.
Научная новизна данного исследования заключается в том, что в татарском языкознании.это - первая попытка применения статистических методов к изучению функциональных стилей языка. В исследовании:
- разработаны конкретные подходы и методы лингвостатис-
тического анализа татарских текстов;
— определены и обоснованы критерии отбора текстов для лингвостатистического анализа татарского языка;
определены возможности автоматизг.ции многих процессов, связанных с обработкой татарских текстов;
выработаны принципы лингвостатистического анализа лексических v: грамматических единиц татарского языка на базе частотных словарей.
Теоретическая и практическая значимость диссертации состоит в том, что результаты, полученные в процессе исследования, могут быть использованы при сопоставлении большого статистического.материала, накопленного по индоевропейским языкам флективно-аналитического строя, с новым статистическим материалом по языкам агглютинативного строя, при сравнительно-сопоставительном изучении дистрибутивных характеристик самих тюркских языков (например,' татарского, башкирского, .казахского, узбекского и т.д.). Данное исследование позволит решить такие теоретические.проблемы, как например, выявление статистической структуры татарского текста, определение словарного состава татарского языка, описание некоторых общелингвистических особенностей стилей языка, выделяющих ее в ряде других стилей. В связи,с этим, возможно, иное освещение получили бы -важные проблемы общей лексикологии:
1. Алексеев П.М., Лудин Д.М. Опыт количественного исследования в Афганистике // Статистическое изучение стилей языка и стилей речи /Тезисы докладов и сообщений к республиканской научной конференции/. - Горький, 1970. - с.5.
проблема современной языковой нормы, функциональных стилей, индивидуальногостиля отдельных авторов. Статистические результаты диссертации могут быть использованы при решении проблем построения формальной модели татарского языка, а также при построении лингвопроцессора на основе выявленных количественных показателей татарского языка.
Наши результаты могут найти практическое применение при усовершенствовании лексикографических методов составления различных частотных словарей, словарей-минимумов татарского Языка, при составлении учебников и учебных словарей, при разработке систем! машинного перевода и различногорода информационных языков и систем.машинного поиска, при создании Машинного фонда татарского языка.
Апробация результатов исследования. Материалы диссертации представлены на: итоговых научных конференциях Казанского государственного университета в 1993-1996 г.г.; Всероссийской научной конференции "Проблемы двуязычия в современных условиях" (КГПУ, ,1994 г.), международном семинаре "Компьютерная лингвистика и ее приложения"(Казань, 1995 г.), международном симпозиуме "Компьютерный фонд терминов тюркских языков" (г.Шымкент, 1995 г.), Всероссийской конференции, посвященной проблемам развития и преподавания-современной татарской литературы (АНТ, 1995 г.), научно-практической конференции "Проблемы обучения татарскому языку учащихся старших классов школ, средних специальных и высших учебных заведений" (КТУ, 1996 г.), международной конференции '-'Тукай и духовная культура XX века" (АНТ, май 1996 г.), научном семинаре "Формально-логические и компьютерные модели языков", проходившем в рамках российской конференции по искусственному интеллекту "КИИ-96" (АНТ, октябрь 1996 г.).
Диссертация обсуждена и одобрена на заседании кафедры "Татарский язык в. иноязычной аудитории"
Структура диссертации. Работа состоит из введения, основной части, содержащей четыре главы,- заключения,' списка использованных источников и литературы, приложения, где представлены таблицы, частотные словари исследуемых жанров.