Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Новиков Анатолий Иванович

Структура содержания текста и возможности ее формализации (на материале научно-технических текстов)
<
Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) Структура содержания текста и возможности ее формализации (на материале научно-технических текстов)
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Новиков Анатолий Иванович. Структура содержания текста и возможности ее формализации (на материале научно-технических текстов) : ил РГБ ОД 71:85-10/39

Содержание к диссертации

Введение

Глава первая. Текст как объект лингвистического анализа 34

Текст - языковая единица 34

Общие свойства текста как речевой единицы 48

Глава вторая. Психологические закономерности сшслобых преобразований текста 68

Понимание как процесс свертывания информации в основные этапы порождения текста 84

Глава третья. Содержание мышления и его соотношение с текстом 97

Три уровня организации содержания мышления 97

Межуровневое взаимодействие подсистем знания 110

Глава четвертая. Переход от единиц языка к элементам содержания 118

Функциональный аспект языкового знака 118

Соотношение лингвистических и экстралингвисти ческих компонентов содержания текста 135

Внутренние закономерности перехода от языковых единиц к содержанию текста 153

Глава пятая. Денотатная структура текста 174

Типы структурного описания текста 174

Денотативный анализ текста 189

Методика построения денотатнои структуры 216

Глава шестая. Экспериментальное исследование структуры содержания и ее практическое применение 228

Экспериментальная проверка психологической

реальности денотатнои структуры 228

Применение денотатной структуры в решении задач прикладной лингвистики 244

Глава седьмая. Формализация семантики текста 268

Основные трудности формализации 268

Возможный подход к формализованному выделению содержания текста 302

Заклшение , 332

Литература 344

Введение к работе

Основные цели и задачи работы

Современный этап научно-технического прогресса характеризуется всё увеличивающейся степенью автоматизации, которая внедряется не только в производственные процессы,, но и в сферу науки, управления, экономики и т.д., где она базируется на электронно-вычислительной технике. Это означает, что объектом автоматизации становится умственная деятельность человека.

Успешность моделирования интеллектуальных процессов с помощью электронно-вычислительных машин во многом определяется возможностями формализации процесса переработки смысловой информации, лежащего в их основе. Смысловая информация - это информация, выраженная да естественном языке и содержащаяся в различного рода сообщениях или документах.

Диссертация посвящена исследованию данного процесса и возможностей его формализации, рассматриваемого применительно к автоматизированным информационно-поисковым системам, машинному переводу, автоматическому индексированию ж реферированию, системам искусственного интеллекта и др.

Разработка и совершенствование указанного типа систем и алгоритмических процедур связана с постоянным преодолением противоречия, заключающегося в несоответствии семантического характера результата переработки информации и формальными средствами получения этого результата.

Это объясняется тем, что основной принцип формализации требует максимального отвлечения от содержания и предполагает оперирование элементами внешнего выражения этого содержания, т.е. его формой. В рамках естественного языка в качестве такой формы выступает материальная сторона языковых единиц. Но вследствие существенней ассиыетрии языковых знаков элементы их внешнего выражения не могут быть непосредственно использованы в качестве средства формализации. Для этой цели применяются специальные формализованные информационные языки, предназначенные для представления информации в виде, удобном для "восприятия" и ппонимавдя"машиной.

Информационные языки, как правило, создаются на основе ее- -тественного языка. Они характеризуются энсплицитностью и однозначностью, но значительно уступают естественному языку по своей "семантической силе". Существуют такие языки в виде словарей, где за каждой их единицей закрепляется только одно значение, а правила оперирования с ними допускают только однозначные действия.

Каким же образом преодолевается указанное выше противоречие? Для ответа на этот вопрос рассмотрим следующий пример.

В автоматизированных информационно-поисковых системах задача поиска документов, соответствующих запросу, заключается в установлении между наш смыслового соответствия, определении содержательной близости. Решение же самой задачи осуществляется формально. Это выражается в том, что сопоставляются между собой не сами документы и запросы, не элементы их смысла, а некоторые наборы их характеристик, называемые "поисковыми образами". В качестве таких характеристик выступают "ключевые слова", "дескрипторы", индексы некоторой классификации, т.е. единицы информационно-поискового языка. Эти единицы сами по себе не являются элементами содержания. Они определённым образом отображают его, служат сигналом о нём, причём не всего содержания, а,как яра вило, только основного. Для машины это лишь символы, которые она может сопоставлять, сравнивать, запоминать и т.д. Поэтому сама процедура установления соответствия между документом и запросом осуществляется без участия какого-либо смысла или содержания. Она заключается в поэлементном сравнении поисковых образов документа и запроса и подсчёте совпавших элементов. В зависимости от принятого в конкретной системе "критерия смыслового соответствия" в ответ на запрос будут выданы документы, поисковые образы которых или полностью совпадают с поисковым образом запроса, или только частично,

He-смотря на формальность процедуры поиска, документы, выданные в ответ на запрос, действительно, хотя и не все, соответ-\ ствуют ему по смыслу. Но это достигается не в самом процессе по-1 иска, а главным образом за счёт предварительной обработки документов, осуществляемой человеком. Эта обработка производится как на уровне создания информационного языка, тав и на уровне формирования поисковых образов конкретных документов. И в том, и в другом случае производится отбор элементов, наиболее значимых, существенных в содержательном плане. А это возможно только в случае понимания содержания документов, входящих в данную предметно-тематическую область. Понятое содержание диктует отбор языковых средств при создании информационного языка и ещё в большей степени - при формировании поискового образа конкретного документа. Именно понимание даёт возможность при необходимости включать в поисковый образ такие дескрипторы, которые хотя и не содержатся в документе, но необходимы для более точного отражения его содержания. Особенно наглядно это демонстрируется в случае применения классификационного языка, где индекс некото рого класса (рубрики) ставится в соответствие не отдельным язы-ковым единицам документа, а всему его содержанию в целом.

Таким образом, процесс предварительной обработки документов, обеспечивающий выполнение формальных процедур, например, информационного поиска, заключается в переходе от языковых средств документа к общему его содержанию, а от этого содержания - к основному содержанию и к отображающим его элементам информационного языка.

В процессе такого перехода, человек, понимая содержание в целом, стремится найти оптимальные способы отражения этого содержания средствами формализованного языка и тем самым в какой-то степени преодолевает противоречие между семантическим характером ожидаемого результата и формальными средствами его получения. Но в силу ограниченности такого языка, жёсткой заданно-сти его элементов преодолеть данное противоречие в достаточной мере не удаётся, следствием чего являются неизбежные потери документов при поиске, а также выдача в ответ на запрос нерелевантных документов.

Всё это приводит к необходимости совершенствования методов и средств формализации, которое идёт главным образом по линии увеличения "семантической силы" применяемых формализованных языков. Основным способом увеличения "семантической силы" языка является экспликация семантических явлений и отображение их специальными средствами в составе этого языка. Такой процесс представляет собой как бы выведение содержательных компонентов на формальный уровень, т.е. превращение внутреннего во внешнее.

Частичное выражение это находит в создании, например, дескриптор ных словарей или тезаурусов, где фиксируются сложные се 11 мантические отношения между единицами языка (Шемакин 1972, Ни китина 1978 и др.). Более полно такая тенденция виражена в языках типа "семантических кодов", где не только отражаются семантические отношения, но и сами единицы языка являются как бы элементами смысла. Сюда относится язык семантических кодов Перри - Кента (Перри, Кент 1958), язык RX - кодов, разработанный Э.Ф. Скороходько (Скороходько, Пшеничная 1968), "семантических множителей" (трейдер 1963) и др. В системах машинного перевода это находит выражение в приписывании словарным единицам не только грамматической, но и семантической информации, в попытках применения языков - посредников семантического типа.

Но такой подход, связанный с экспликацией семантических явлений, как показывает опыт их разработки и практика применения, наталкивается на значительные трудности, вследствие чего они не нашли в настоящее время широкого применения в действующих системах. Как правило, причину этого видят в том, что мы еще не-до-статочно хорошо знаем язык, выступающий в качестве основного объекта моделирования и формализации. В этом отношении характерна оценка, сделанная Э.Ф. Скороходько относительно возможностей перевода с естественного языка на язык ВХ - кодов в системе "ШЛ", Он считает, что перевод на логико-семантический уровень языка "BIT", требующий тщательного семантического анализа с установлением вида отношений, связывающих все слова текста, представляет собой принципиальную сложность и в полном объеме не-вы-полаим. Причину этого он ВИДИТ В "недостаточном нашем знании о языке" (Скороходько 1969, 6).

Таким образом, можно констатировать, что моделирование интеллектуальной деятельности в рассматриваемых нами системах за ключается преимущественно в моделировании языка, в его формализации. В зтом направлении сосредотачиваются основные усилия исследователей и разработчиков алгоритмических процедур переработки смысловой информации (Ланкастер 1968), (Михайлов, Чер , :, ный 1968), (Белоногов, Котов 1968), (Мидоу 1970), (Сэлтон 1973), (Якушин 1975), (Котов, Якушин 1979).

По нашему мнению, такой подход является необходимым, но не может быть достаточным для моделирования процесса переработки смысловой информации, поскольку информация создаётся и передаётся в речи, где язык служит лишь средством выражения этой ин \ 1 формации. Следовательно,в ранках рассматриваемых систем язык . . не может быть единственным объектом моделирования. Это предполагает необходимость учёта речевых явлений, находящих вырааение в теисте, который, хотя и состоит из языковых единиц, имеет свои закономерности строения и функционирования.

Основанием для данного утверждения может служить и то обстоятельство, что именно текст является основным объектом обработки в автоматизированных информационных системах. Он подвергается аналитико-синтегической обработке, свертывается, переводится на информационно-поисковый язык, вводится в память машины, хранится, извлекается, преобразуется в соответствии с теми или иными конкретными задачами системы, на основе анализа тев-стов строится информационно-поисковый язык, например, дескрип-торного типа.

В системах машинного перевода также именно текст в целом является объектом перевода, а не отдельные слова, предложения, т.е. единицы языка. Объектом анализа и преобразования текст является и в алгоритмических процедурах индексирования и реферирования.

Вследствие этого адекватное моделирование процесса переработки смысловой информации должно базироваться на закономерностях строения и функционирования текста как единицы, качественно отличной от составляющих его единиц. Семантический характер V рассматриваемых наш задач свидетельствует о том, что формали-! зация текста должна осуществляться не на поверхностном его уров j не, а на уровне его семантики. Поэтому основной задачей здесь І является определение структуры содержания, что предполагает адекватное выделение содержательных единиц и отношений между ними.

Между тем в настоящее время отсутствует достаточно однозначное представление о том, что составляет внутреннюю содержательную сторону текста. Во многих случаях представление об этом явлении имеет интуитивный характер и находит выражение в таких понятиях, как "смысл текста", "общий смысл", "смысловое содержание" и др.

В тех же случаях, когда предпринимаются попытки формального отображения семантического плана текста, то в качестве элементов его структуры выбираются единицы различных уровней, вследствие чего одному и тому же тексту могут быть поставлены в соответствие различные его структуры. Это единицы типа "субъект -предикат"» "тема - рема", различного рода "маркеры" и т.п. В известном методе семантического представления (СемД), разработан-ного для нужд машинного перевода, применяются единицы, относящиеся к уровню глубинного синтаксиса отдельного предложения. Структуры, базирующиеся на этих элементах, соответственно могут отражать структуру логического суждения в тексте, его логино- композиционную структуру, структуру отдельного предложения и т.д. Всё это позволяет считать, что такого рода подходы позволяют отображать то, какими способами выражается содержание в тексте! но не затрагивают, как правило, структуру самого содеркания, соответствующего наиболее глубинному уровни текста.

Причина здесь кроется, по нашему мнению, в том, что текст, как правило, рассматривается как готовый продукт, как некоторый результат.

Между тем текст должен рассматриваться не только как готовый продукт, но также и как процесс. Это объясняется тем, что содержание текста формируется в интеллекте человека как результат осмысления языковых единиц, составляющих текст, и понимания текста в целом. Следовательно, оно может быть выявлено при учёте основных закономерностей процесса восприятия и понимания текста, осуществляющегося на разных уровнях его организации и проходящего ряд этапов. Для определения структуры содержания необходимо выявить такие единицы мыслительного плана, которыми оперирует мышление на заключительных этапах понимания. Основная сложность здесь заключается в том, что понимание непосредственно не заканчивается на анализе текста. Мыслительное образование, сформированное в результате осмысления языковых единиц, включаясь в общую систему знания,существующую в интеллекте, может подвергаться дальнейшему осмыслению и преобразованию уже независимо от данного конкретного текста. )

Поэтому собственно содержанию текста должно соответствовать такое мыслительное образование, которое", с одной стороны, образуется на наиболее глубинном этапе понимания, а с другой -яйляется непосредственным результатом воздействиями интеллект совокупности языковых средств, составляющих данный текст. Такое мыслительное образование назовем внутренней формой текста.

Подход к тексту как процессу позволяет считать, что основные типы структур, выделяемых на основе существувдих методов, представляют собой не просто различные подходы, а отражают структуру текста на определенных этапах его преобразования. Но, очевидно, не все из них соответствуют семантическому уровню текста.

Общую задачу данной работы составляет определение внутренней формы текста. Но поскольку, как было показано выше, она реализуется в процессе восприятия и понимания, то в задачу нашей работы входит также исследование закономерностей перехода от внешней формы текста к его внутренней форме.

При этом под внешней формой понимается совокупность языковых средств, включая их содержательную сторону, реализующая замысел автора. Это то, что дано непосредственному восприятию и что долхно быть осмыслено и понято. То, что понимается, составляет внутреннюю форму. Это мыслительное образование, которое формируется в интеллекте человека и соотносится с внешней формой не поэлементно, а в целом соответствует всей совокупности данных языковых средств.

Решение поставленных нами задач имеет две основные цеди.

Первая из них, имеющая прикладной аспект, заключается в определении возможностей формализации семантических явлений. Она определяется следующими соображениями.

Как уже отмечалось, совершенствование средств формализации естественного языка сдерживается возникающими на этом пути многочисленными трудностями. Существует довольно распространенное мнение, что это связано с недостаточным нашим знанием о языке. Отсюда следует неявный вывод, что трудности эти имеют временный и непринципиальный характер. Но можно предположить и другое.

Возможно, некоторые из этих трудностей являются принципиальными, а потому определяют некоторый порог возможностей формализации семантических явлений. В связи с этим нам представляется, что наиболее актуальной проблемой в этой области является выявление хотя бы некоторых причин трудностей, возникающих в процессе формализации, и определение их характера. Оставаясь в рамках задачи формализации языка, очевидно, эту проблему нельзя решить достаточно полно. Бе необходимо включить в более широкий контекст, в качестве которого и выступает текст как объект формализации.

Это тем более оправданно, что, как было показано выше, реальный процесс переработки смысловой информации осуществляется на уровне осмысления и понимания текста. Возможно, что те трудности, которые возникают при форыализации языка, являются не языковыми, а речевыми, мыслительными.

Данная цель может быть достигнута в результате сопоставления закономерностей реального процесса переработки смысловой информации, который во многом совпадает с процессом перехода от внешней формы текста к его внутренней форме, с основными принципами формализации.

Полученные данные, как мы надеемся, будут способствовать более осознанному и целенаправленному подходу к моделированию семантических явлений.

Вторая цель, имеющая общелингвистический характер, заключается в раскрытии тех аспектов текста, которые определяют его как область функционирования языковых единиц, как сферу их употребления, где они получают своё конкретное значение, за счёт чего наиболее полно раскрывается их содержательная сторона.

Если первая цель имеет направленность от языковых единиц к тексту и его содержанию, то вторая-от текста в целом к языковшя единицам, состав лящим его.

Решение поставленных нами задач ориентировано на те виды текста, которые являются или могут быть объектом формализации в связи с необходимостью их обработки с помощью электронно-вычислительной техники. Это прежде всего тексты научно-технических документов.

Сюда, естественно, не включаются поэтические тексты и художественная проза, поскольку их формализация не диктуется какой-либо практической необходимостью.

Основной подход к исследованию текста Будучи основным объектом обработки в автоматизированных информационно-поисковых системах» текст как целостная речемые-лительная единица тем не менее не стал объектом всестороннего теоретического исследования в работах этого направления, где, как ухе отмечалось, основное внимание было сосредоточено на формализации языка. Это же относится и к задаче машинного перевода, в которой все формализованные процедуры рассчитаны на отдельное предложение, являющееся языковой единицей и основной единицей перевода.

Исключение в этом отношении составляет направление, связанное с решением задачи автоматического индексирования и реферирования, в особенности те направления, которые базируются на использовании не статистических, а лексико-грамматических и структурных особенностей тенета (Баксендейл 1965)» (Стивенс19б5 ), (СевбоГі965? ), (Новиков Якушин 1972).

В то же время, как показывает анализ этих работ, здесь рассматриваются преимущественно те аспекты текста, которые связаны с формальными его свойствами, что далеко не исчерпывает проблемы текста в целом.

В настоящее время текст, наряду с традиционными языковыми единицами,включается в компетенцию лингвистики. Выделилось самостоятельное направление, получившее название "лингвистика текста".

Кроме лингвистики, исследованием текста занимаются и другие дисциплины, каждая иг которых в соответствии со своими задачами рассматривает его под соответствующим углом зрения, применяя различные подходы в его изучению.

Так, например, если для общей лингвистики текст представляет собой область существования языковых фактов, которые и находятся в центре её внимания, то для лингвистики текста доминирующими являются суперсинтаксические единицы, образующиеся в самом тексте. При этом, как в первом, так и во втором случае текст рассматривается как готовый продукт, как результат рече-мыслительного процесса. Это приводит к тому, что в центре вни . мания этих дисциплин находятся поверхностные уровни организации

Речемнслительный процесс порождения и понимания текста исследуется психологией, для которой презде всего представляют интерес внутренние механизмы умственной деятельности, реализующиеся в этих процессах. Психолингвистика, для которой исследование текста является относительно новой задачей, сосредотачивает своё внимание преимущественно на различного рода коммуникативных, социальных условиях функционирования текста, шкалировании текста с целью выявления различных параметров измерения его свойств, а также его связности и целостности (Сорокин, Тарасов, Шахнаро-вич, 1979 ), (Леонтьев 1979 ) и др.

і Всё это свидетельствует о том, что исследование текста ведётся в настоящее время достаточно широко и разносторонне. Но следствием такой разносторонности является разообщённость, дискретность тех явлений и свойств текста, неразрывное единство \ которых, их взаимодействие и определяет природу текста, его \ внутреннюю смысловую сущность. Такой подход, акцентируя внимание на отдельных сторонах текста, выделяя одни аспекты без необ і ходимого учёта других, приводит к разрыву диалектического един ства языка и речи, речи и мышления, внешнего и внутреннего, формального и содержательного, что не позволяет сформировать достаточно полное и адекватное представление о тексте как целостном речемыслительном образовании.

В отличие от этого, в данной работе принят подход, заключающийся в том, что текст рассматривается не ..в.. отдельных его аспектах, а как единый комплекс лингвистических и психологических явлений, в котором реализуется взаимодействие языка, речи и мышления.

Особенностью нашего подхода является также и то, что в се- j мантическом механизме взаимодействия языка и мышления ведущая ; роль отводится интеллекту, отражающему реальную действительность формирующему знание об этой действительности и активно использующему это знание, как будет показано в работе, не только в процессе формирования образа содержания текста, но и в процессе означивания на уровне языковых единиц.

Такой подход противопоставляется нами тем лингвистическим концепциям, в которых абсолютизируется роль языка. Эти концепции различны, но в основе их лежит ряд общих положений. Одним из основных таких положений является полное отождествление языка и мышления и отрыв их от реальной действительности, которая как бы задаётся и формируется языком.

Основоположником такого подхода, как известно, является В. Гумбольдт (Гумбольдт 1848 Г который признавал вслед за Кан-том независимость сознания от материального мира, рассматривал его как некоторую изначальную сущность, находящую своё выражение в языке. По мнению В. Гумбольдта, в языке фиксируется определённое л овоззрение отражаадеедух народа, нации. Особенности ми- Цитируется по (Кондратов 1979).

ровоззрения определяют и различия национальных языков. Бели это так, то язык, будучи посредником между человеком и внешним миром, целиком определяет отношение человека к предметам реальной действительности. Эти идеи нашли развитие в концепции Сешра -Уорфа (Сепир.1934), (Уорф I960 ). Согласно этой концепции каж-дни язык по-своему членит окружающую действительность и навязывает этот способ всем говорящим на этом языке людям. Вследствие этого люди, говорящие на разных языках, видят мир по-разному.

Логическим завершением круга этих идей является концепция Д. Вейсгербера, который также исходит из того, что язык превращает окружающий мир в идеи, "вербализирует" мир. Вследствие этого характер познания зависит от языка, который является "ключом к миру". Поэтому язык - это сетка, которую человек набрасывает на внешний мир в процессе познания, но человек познаёт лишь то, что создаёт язык (Кондратов 1979).

Таким образом, отождествляя мышление и язык, гипертрофируя роль последнего, рассмотренные выше подходы как бы исключают процесс познания реальной действительности, который подменяется познанием языка. При этом, признавая, что, если в языке нет специального обозначения, то л нет и соответствующего содержания (Вейсгербер 1950 ), исключается также вообще процесс коммуникации как творческий процесс, направленный на порождение и передачу новой информации, а следовательно и мыслительная деятельность, являющаяся основным средством реализации этого процесса.

Хотя и с иных позиций, но также к абсолютизации языка приводит и концепция Ф. де Соссюра.

Совершенно правильно разделив язык и речь, считая, что язык является средством, применяемым в речи для передачи сообщений.

Ф. де Соссюр исключил совершенно ив рассмотрения речевой процесс, не считая его предметом внутренней лингвистики, т.е. собственно лингвистики.

"единственным и истинным объектом лингвистики является язык, рассматриваемый в самом себе и для себя," - считает Ф. де Соссюр (Ф. де Соссюр 1977,207).

Реализация этого принципа приводит к пониманию языка как некоторой имманетной системы, выключенной из процесса коммуникации, вследствие чего в рамках таной системы не может быть решён вопрос о том, за счёт чего же язык выполняет свою основную функцию - быть средством передачи мыслительного содержания.

Природа знака и его основные свойства, как это становится всё более ясным, могут быть поняты при включении его в процесс функционирования, в акт коммуникации, где он получает своё осмысление и наполнение конкретным содержанием:. Осмысление, пере-ход к конкретному содержанию, как будет показано в работе, базируется не только на особенностях устройства самого знака, на так называемой языковой компетенции, языковом знании, а на активном привлечении экстралингвистического знания, актуализируе- . мого и организуемого продуктивным мышлением.

Наш подход, учитывающий эти факторы, предполагает обращение к психологическим закономерностям, характеризующим мехааиям та і кого перехода.

В то же время это не имеет ничего общего с так называемым "психологизмом". Как известно,для этого направления было характерно отождествление сущности языка с понятием психофизиологических процессов, осуществляющихся в индивидуальном акте речи и выражающих индивидуальное сознание (Штеятайль 1855 ). Вследст виє этого происходит 5-лишнация языка как социального явления \ и как средства опосредованного выражения мыслительного содержа-) ния и передачи его в процессе коммуникации.

В отличие от этого, мы считаем, что хотя всякий речевой акт -действительно индивидуален, в нем всегда содержатся такие закономерности, которые являются общими для большинства людей, несмотря на их индивидуальные различия. Например, одно и то. же сообщение или текст разными людьми может быть понят по-разному. Различия могут заключаться в глубине понимания, его полноте и т.д. Но тем не менее понимание базируется на выполнении некоторых обязательных для всех умственных операциях (осмысление, свер-тывание, обобщение и др.), без которых нет понимания. Такого рода закономерности являются общими, и именно они, а не индивидуальные особенности предлагается учитывать в нашем подходе. Кроме того, психологическая ориентация не затрагивает язык как систему. Язык - общественное явление, которое для каждого индивида предстает как некоторая данность, которую он застаёт уже в готовом виде. Другое дело - использование языка как средства общения. Этот процесс подчиняется не только тем нормам, которые существуют в языке, но также и общим закономерностям речемнсли-тельного плана, где ведущую роль играет интеллект, соответствующие мыслительные операции.

Структура работы и ее основное содержание

Диссертация состоит из данного Введения, семи,- глав и Заключения.

В СВЯЗИ с отсутствием в настоящее время достаточно точного определения текста в первой главе решается вопрос о его выдели- мости как дискретной целостной единит. С этой целью проводится анализ тех приёмов и методов, которые используются в лингвистике текста для определения его формальных признаков, выделяющих текст как суперсинтаксичеокую единицу. \ Делается вывод, что текст - ато не языковая единица, как считается в лингвистике текста, аГречемыслительная, включённая/ і не в систему языка, а в процесс коммуникации. Вследствие этого ; вопрос о его вцделимооти не может быть решён на уровне его формальной организации, а требует подхода со стороны содержания текста, внутренней его организации.

Описывается ряд общих овойотв текста как речемнслительного образования, среди которых основным можно считать наличие глубинной перспективы, задаваемой процессом перехода от линейной развертки текста к иерархической структуре содержания, образующего внутреннюю форму текста. Делается вывод, что текст представляет собой единство его внешней и внутренней формы, между которыми, однако, нет однозначного соответствия.

Необходимость определения соотношения внешней и внутренней формы текста требует обращения к анализу процесса перехода, су-ществуюццэго между ними и практически тождественного процессу восприятия и понимания текста. В связи с этим вторая глава дио -сертации посвящена рассмотрению существующих экспериментальных данных, характеризующих процесс понимания текста и его порождения в психологическом плане. Анализ этих данных позволяет определить основные закономерности протекания этого процесса, учёт которых необходим для решения поставленной нами задачи. Сюда прежде всего относятся те сведения, которые характеризуют поди-мание как процесс преобразования текста и его свертывания, завершающегося синтезом на уровне внутренней речи выделенных из ti текста "контекстных объединителей" (смысловых вех") в единый семантический комплекс.

Решается вопрос, соответствует ли уровень внутренней речи, элементами которой являются "контекстные объединители", конечному этапу, понимания, а получаемые семантические комплексы - внутренней форме или содержанию текста. В результате привлечения других экспериментальных данных и дополнительного анализа делается вывод, что необходим переход к более глубинным образованиям типа "предметно-схемного кода" Н.И. Жинкина. Исходя из ха-, рактеристики общих свойств этого кода, делается вывод, что содержание текста соответствует денотативному уровню отражения, т.е. его составляет определённый моделируемый мьшлениеы фрагмент : действительности, выраженный в тексте соответствующей совокупностью языковых средств. Это результат понимания. Результат же понимания должен быть инвариантом замысла, поскольку его экспликация и является основной целью понимания Анализ данных, характеризующих процесс порождения текста, особенно на начальных его этапах, подтверждает предположение о денотативном характере содержания. Основной единицей его, как можно считать, является денотат. - :- Существует представление, что содержание мышления составляют -элементы типа представлений (вторичные образы) и понятий» кото рые рассматриваются как основные единицы знания о реальной действительности. В таком случае возникает вопрос, чему в содержании мышления соответствует денотат, и как он соотносится с системой представлений и понятий. Решению этого вопроса посвящена третья глава. В этой главе высказывается и обосновывается положение о том, что денотативному уровню отражения соответствуют не только вторичные образы предметов, но и модели предметов и предметных комплексов, формирующиеся в интеллекте наряду с системой понятий.

Обоснование этого положения осуществляется яа материале данных, полученных гештальт - психологией, исследовавшей так называемые "проблемные ситуации", которые лежат в основе формирования указанных моделей.

Особенностью этих моделей является то, что в их формировании принимают участие как представления, так и понятия, но сами они не сводятся ни к тем, ни к другим, представляя собой особый уровень организации содержания мышления, ориентированный на решение определённого круга жизненных задач, в том числе и коммуникативных.

В соответствии с этим высказывается гипотеза, что свернутые образы этих моделей являются формой существования денотатов в интеллекте наряду со вторичными образами.

Система денотатов, формирующаяся в интеллекте и характеризую- -щаяся определённой стабильностью, а следовательно и относительной статичностью, противопоставляется динамической модели ситуации, задаваемой текстом и составляющей его содержание, которое может содержать новые денотаты и отношения между ними. Но это новое мо хет быть воспринято и понято только в контексте имеющегося опыта, т.е. системы денотатов, предварительно сформированной в интеллекте.

Характерной особенностью такой динамической модели ситуации является её инвариантность относительно языковых способов её выражения.

В этой же главе описывается психологический эксперимент, проведённый нами для проверни гипотезы о существовании в интеллекте системы денотатов как особого уровня организации мыслительного содержания и её роли в порождении и понимании текста.

Четвертая глава обобщает предшествующее рассмотрение текста и является в работе центральной. В ней формулируются основные теоретические положения, определяющие процесс перехода от языковых единиц, составляющих текст, к его содержанию, а также само это содержание, его структуру.

В отличие от предшествующих глав, здесь процесс перехода рассматривается преимущественно в лингвистическом плане, хотя также учитываются коммуникативные, психологические аспекты тенета.

Центральным в этой главе является вопрос о функциональном аспекте языкового знака, где раскрывается механизм того процесса, который в языкознании иногда называют фазой "вторичного означивания" .

В связи о этим возникает необходимость в обращении к таким традиционным проблемам лингвистической семантики, как определение характера связи материальной стороны языкового знака с его значением, природа значения, его соотношение с понятийной и денотативной сферой мышления и др.

Однако решение этих вопросов осуществляется здесь не в рамках "имманентной" лингвистики, а на основе закономерностей функционирования знака в речи, в частности, в тексте.

Основное внимание уделяется выявлению роли продуктивного мышления, находящего выражение в установлении непосредственно не данного отношения между значениями сочетающихся слов, в перестройке их предметной отнесённости и определении их денотатов как результата этой перестройки.

Всё это позволяет более полно и конструктивно определить структуру содержания, которую составляет совокупность денотатов," выявленных в результате осмысления и декодирования не только отдельных языковых выражений, но и отрезков текста большей величины, текста в делом, а также в результате привлечения знания, необходимого для заполнения так называемых "смыоловых скважин". Здесь же анализируются важнейшие коммуникативные условия адекватного понимания и порождения текста.

Данная глава содержит также описание эксперимента, проведённого нами для выявления закономерностей, характеризующих процесс осмысления языковых средств через соотнесённость их с экстралин-гвистдческими данными.

Б следующей (пятой) главе решаются вопросы, связанные с оп-ределением способа формального отображения структуры содержания. В связи с этим проводится возможный вариант денотативного анализа текста, описывается способ графического представления дено-татной структуры, а также методика её построения, включающая принципы определения имён денотатов и их отношений.

Последняя глава посвящена сопоставительному анализу существующих принципов формализации с закономерностями перехода от языковых единиц, составляющих текст, к его содержанию, выявленными в процессе проведённого нами исследования.

Это позволяет определить те основные противоречия и трудности, которые возникают при формализации семантических явлений. Они относятся главным образом не к языковому уровню текста, а в его речемыслительяому компоненту. Главное противоречие заключается в жёсткой заданности, конечности элементов формализованной системы и отсутствие предварительной заданности элементов речевого компонента, которые формируются в живом творческом процессе речи, опирающемся на эвристические способности мышления, на сформированное в опыте знание о реальной действительности. В связи с этим содержательные единицы текста являются динамически-: ми единицами, задаваемыми различными комбинациями языковых зна" ков . Поэтому они не могут быть заранее поставлены в жёсткое соответствие некоторым конкретным языковым единицам, т.е. элемен-\ там внешней формы, а следовательно,не могут быть формализованы.

Поскольку такое соответствие устанавливается в мышлении, то выходом из этого положения было бы моделирование самого процесса перехода к содержанию, что,кстати,и предполагается при решении таких задач, как автоматическое индексирование, реферирование, в системах искусственного интеллекта и др. С этой целью в данной главе производится выделение некоторых мыслительных операций, необходимых для построения денотат ной структуры текста, и той информации, которая необходима для их выполнения. Анализ этих операций показывает, что большинство из них имеет не формальный, а содержательный, творческий характер. Для их выполнения необходимо формальное представление знаний о тех фрагментах реальной действительности, которые находят выражение в тексте. А это опять же связано с теми трудностями, о которых говорилось выше.

" Вследствие этого делается вывод о том, что формализация струк-\ туры содержания и процесса перехода к нему возможна в рамках силь-ных ограничений, накладываемых на предметно-тематическую область j текстов, их виды, а также яа класс задач, предполагающих формализацию семантики текста.

Глава завершается описанием принципиальной схемы возможного алгоритма, моделирующего процесс перехода от внешней формы текста к его содержанию в виде системы денотатов, разработанного с учётом необходимых ограничений. Хотя и предполагается, что данный алгоритм принципиально реализуем, вместе с тем он демонстрирует всю сложность этой проблемы, и даёт представление о возможной "пене" этой реализации.

В "заключении" подводятся общие итоги работы, делаются основные выводы и намечаются перспективы дальнейшего исследования семантики текста и вопросов, связанных с её формализацией.

Характеристика основных понятии

Одним иа основных понятий в данной работе является понятие внутренней формы текста, которое частично было определено при формулировке общей задачи исследования. Здесь необходимо подчеркнуть некоторые его дополнительные аспекты. Понятие внутренней формы не является новым. Впервые оно было введено Гумбольд- том (Гумбольдт 1848 ), рассматривалось в работах Потебни (По-І тебня 1913 ), и др. Но во всех этих случаях речь, как правило, идёт о внутренней форме языка, а не текста, что не одно и то же, по нашему мнению.

Гумбольдт понятие внутренней формы рассматривал в нескольких аспектах. Прежде всего, это способ соединения понятия со звучанием, это "выражение народного духа", который через посредство внутренней формы реализуется в языке и, наконец, - это совокупность всего того, что "создано и обработано речью, совокупность всех основных языковых структур, всех элементов языка, взятых в системе, это абстрактная структура языка в целом" (Амирова, и др. 1981).

Внутренняя форма текста - это явление не языковое, а речевое. Внутреннюю форму текста мы отождествляем с его содержанием, в связи с чем оба эти понятия употребляется практически как синонимы. О внутренней форме мн говорим в том случае, когда необходимо подчеркнуть противопоставленность этого мыслительного образования, возникающего в интеллекте как результат понимания, внешней, т.е. языковой форме текста. Такое противопоставление базируется на том, что внутренняя форма, будучи интегративным мыслительным образованием, не сводится к сумме лексических значений слов, со-ст-авляющих внешнюю форму, а представляет собой качественно иное целостное образование. Если внутренняя форма представляет собой динамическую модель некоторой реальной ситуации, задаваемую текстом, и подчиняющуюся логике предметных отношений, то внешняя форма организуется на основе лексико-грамматических и логико-композиционных закономерностей. Вследствие этого структуры этих уровней текста не являются изоморфными друг другу»

В то же время ни одно из этих образований само по cede не составляет текст. Мыслительное образование, соответствующее внутренней форме, не выраженное языковыми средствами,будет представлять собой некоторый фрагмент мыслительного содержания, не имеющий непосредственного отношения к тексту, а последовательность языковых единиц, не приводящая к некоторому целостному содержанию, есть не что иное, как цепочка неосмысленных символов, которая также не может считаться текстом. Поэтому наряду с противопоставлением мы также подчёркиваем и их единство.

Понятие "содержание текста"употребляется преимущественно в тех случаях, когда внутренняя форма рассматривается самостоятельно, т.е. безотносительно к внешней форме. Понятие "содержание текста" отграничивается нами от понятия "смысл". Оно формируется на основе смысла и может затем трансформироваться в смысл , но само как непосредственный результат понимания не является тождественным ему. В первом случае имеет место "речевой смысл" во втором - "личностный смысл".

Речевой смысл - это результат осознания непосредственно не данного отношения между значением сочетающихся слов, а также между различными фрагментами текста. Он базируется как на знании об употреблении языковых единиц, так и на знании соответствующих предметных отношений, формирующихся в опыте человека.

Личностный смысл есть результат дальнейшей интерпретации со держания яри включении erq в общую систему знания, формирующуюся в интеллекте человека, которое совершается уже независимо от данного текста.

Основной единицей содержания является денотат. В данной работе это понятие имеет также не совсем традиционное употребление, в связи с чем оно требует некоторых пояснений.

Как известно, понятие денотата пришло в лингваотику из логики, где оно было введено Г. Фреге в связи с решением проблемы "истинности - ложности" высказывания. Рассматривая структуру знака, Г, Фреге выделяет в нём имя, значение имени и его смысл. Под значением он понимает предмет, обозначаемый данным именем, т.е. денотат, а под смыслом - то, что отражает способ представления денотата,

В лингвистике это представление находит выражение в том, что денотат довольно часто непосредственно связывается с языковым знаком даже в том случае, если он не отождествляется о его значением.

По нашему представлению, между словом как элементом языковой системы и денотатом существует не заранее заданная связь, а переход, который осуществляется в речи, в процессе коммуникации, который осуществляется на основе речевого смысла, представляющего собой результат взаимодействия значений сочетающихся слов. Поэтому нахождение денотата не есть простая его актуализация или репродукция, а творческий ант, совершаемый в процессе продуктивного мышления.

Здесь, очевидно, необходимо более чётко разграничивать генезис языкового знака и процесс его функционирования. В первом случае, несомненно, денотат имеет непосредственную соотнесенность с тем ма териальным объектом, который после установления семиотического отношения начинает выступать в качестве знака.

Б этом отношении представляет интерес точка зрения Г.П.Мельникова, полагающего, что внутренний денотат (образ денотата) яв-ляется той основой, на которой формируется значение знака и сам знак как двусторонняя сущность. Превращение денотата в значение, по мнению Г.П.Мельникова, осуществляется за счёт того, что его образ при регулярном воспроизведении в сознании интерпретатора в связи с образом знака утрачивает свои специфические свойства, становится "обеднённым" и тем самым приобретает абстрагированный характер.

В то же время трудно согласиться с Г.П.Мельниковым в том, что исходный денотат, превращаясь, с одной стороны, в значение знака, с другой - в смысл, как бы утрачивает своё существование и фактически не принимает участия в процессе функционирования ! знака.

По нашему представлению, денотат не исчезает. Совокупность денотатов, образуя определённую систему, соответствует одному из уровней организации содержания мышления, на базе которого формируется замысел текста, а также его содержание как непосредственный результат понимания.

Довольно часто денотат донимается как реальный предмет, вещь. Поскольку реальный предмет не может непосредственно выступать в качестве элемента содержания мышления, то вводятся такие понятия, как "идеальный" денотат, "внутренний" денотат и т.п., что представляется нам не совсем оправданным.

В связи с тем, что в мышлении могуї существовать только образы реальных предметов, то следует считать, что денотат - это -мыслительное образование, формирующееся в процессе познания. Такая трактовка денотата согласуется с представлением Г.Фреге, который считал, что денотат - это не материальный объект, а "вещь, данная нам в ощущеяияхп (Фреге 1978, 187). В то же время отсюда не следует, что денотаты - это только образы, существующие в виде представлений. Есть основания считать, что денотатам в большей степени соответствуют модели предметов, а так/же свернутые модели предметных комплексов или ситуаций. Это такие образы, которые прошли определённую мыслительную "обработку", включаясь в решение жизненных задач типа "проблемных ситуаций", где они как бы "обогащаются" новыми свойствами и отношениями, непосредственно не данными в восприятии, за счёт чего они приобретают свою однозначность и целостность.

Денотат, будучи единицей содержания, в разных текстах может выполнять различную функцию, в зависимости от того, какая роль отводится ему автором в реализации замысла. Он может выступать в роли главного предмета описания, а также использоваться в качестве средства описания этого предмета, соответствуя определённому его аспекту или подаспекту. Для обозначения роли денотата в работе употребляются такие термины, как тема, подтема и субподтема.

В соответствии с этим при отображении структуры содержания одновременно учитывается как общее соотношение денотатов, отражающее ситуацию, задаваемую текстом, так и иерархия подтем и субподтем.

Актуальность, новизна и научная значимость рабояы,

Акту альность работы определяется, с одной стороны, практической потребностью в разработке адекватных методов моделирования интеллектуальных процессов, учитывающих речемысли-телыше аспекты текста, с другой - неразработанностью проблемы перехода от языковых единиц, составляющих речевое сообщение, текст, к его внутренней форме, а также проблемы формализации этого перехода и содержания в целом.

Но актуальность данной работы не исчерпывается потребностями,связанными с решением практических задач автоматизации. Она определяется также и тем, что развитие языкознания в настоящее время приводит к необходимости исследования языка "в действии", что предполагает выход за рамки собственно языковой системы и обращение к речевым, мыслительным, коммуникативным явлениям, к так называемому "человеческому фактору" в языке и т.п.

Поскольку текст представляет собой область функционирования языковых единиц, сферу их употребления, то проведённое нами исследование семантики текста является актуальным также и в плане теоретического языкознания.

Новизна работы состоит в том, что в ней впервые осуществлено комплексное исследование текста, проведённое с учётом взаимосвязи и взаимодействия языковых, речевых, интеллектуальных и коммуникативных его аспектов, определяющих текст как целостную речемыслительную единицу коммуникативного процесса.

Комплексность исследования выражается также и в том, что текст рассматривается не только как статическое образование, как результат речемыслительной деятельности, но и как процесс, обеспечивающий соотнесённость его внешней и внутренней формы.

Новым и важным представляется также и то, что в работе дано конструктивное определение содержания текста и его основной структурной единицы, сформулированы основные закономерности осмысления языковых единиц в процессе их декодирования и перехода к содержанию, а таяже принципы выделения единиц содержания, разработана методика эксплицитного представления структуры содержания, выявлены основные трудности формализации семантики текста, причины и характер этих трудностей.

Научная значимость работы определяется тем, что её результаты могут служить существенным вкладом в построение общей теории текста, необходимость которой диктуется как внутренними закономерностями развития теоретического языкознания, так и задачами, решаемыми в рамках таких дисциплин, как прикладная лингвистика, психолингвистика , информатика и др.

Текст - языковая единица

Текст в настоящее время выступает в качестве полноправного объекта лингвистических исследований. Лингвистика, сделав текст предметом своего рассмотрения, как бы возвела его в статус языковой единицы наряду со словом, словосочетанием, предложением.

Обычно необходимость обращения к отрезкам, большим, чем предложение, и к целому тексту связывают с внутренними закономерностями развития теории синтаксиса. Однако причины данного явления не сводятся только к этому. Они связаны также о обращением к исследованию содержательной стороны языковых единиц, с развитием общей лингвистической семантики. Б связи с этим, вероятно, не случайным является тот факт, что в период интенсивной разработки вопросов синтаксиса необходимость обращения к тексту по существу только постулировалась, а фактическое обращение к проблеме текста совпало с периодом широкого развертывания семантических исследований на всех уровнях языковой системы. Необходимость обращения к текстовой проблематике является объективным и закономерным явлением, базирующимся на всеобщей связи и взаимен-действии языковых единиц в процессе их функционирования.

Результатом этого взаимодействия является то обстоятельство, что при определении содержательной стороны языковых единиц одного уровня требуется обращение к единицам более высокого уровня вплоть до текста, представляющего собой предельную единицу конкретного коммуникативного процесса. Все это делает необходимым при решении семантических вопросов учитывать сферу функ ционирования языковых единиц, т.е. текста. Но означает ли это, что текст - языковая единица?

Если текст является языковой единицей, то он должен обладать такими же формальными характеристиками, выделяющими его как целостное дискретное образование из общего речевого потока, какими обладают другие языковые единицы. Другими словами, должны существовать какие-то объективные критерии, позволяющие определять границы текста.

Вопрос о признаках, выделяющих текст как самостоятельную единицу, является принципиальным, так как от его решения зависит определение текста, постановка задач и выбор методов исследования. Отсутствие достаточно общего и однозначного подхода к этому вопросу в настоящее время приводит к тому, что под текстом понимается как одно предложение, так и некоторая их совокупность, образующая целостные единства внутри более сложного целого, а также само это целое. Текстом также может быть вся совокупность высказываний, представляющая собой открытую систему, не имеющую границ.

Особенно актуальным этот вопрос является для лингвистики текста - дисциплины, которая ставит своей задачей выявление общих закономерностей, касающихся текста в целом. При этом текст понимается как языковая единица.

Д.С.Бархударов считает, что текст, являясь единицей языка, представляет собой то общее, что лежит в основе отдельных кон кретных текстов, т.е. схемы построения или "формулы11 строения текста. В связи с этим задача лингвистики текста определяется им как выявление и установление этих "схем" или "формул", т.е. правил текстообразования (Бархударов, 1974 ). Задачу линг вистики текста в установлении правил текстообразования видит

Б.А.Маслов (Маслов 1975). Текст понимается как "абстрактная единица языка наивысшего уровня". И.Р.Гальпериным (Гальперин 1977). При этом правила текс то образования трактуются как синтак-сические закономерности построения текста из предложений, что составляет "высший синтаксис, который следует за учением о простом и сложном предложении" (Севбо 1969,9).

В связи с этим вводится понятие "грамматика" текста. Л.Г. Фридман считает, что одним из основных аспектов исследования единиц больших, чем предложение, является грамматический аспект, заключающийся в установлении грамматических признаков подобных образований, позволяющих рассматривать их как грамматические, синтаксические единицы и характеристики этих единиц. Грамматика текста, по его мнению, должна обеспечивать рассмотрение единиц разных уровней в их взаимосвязи, взаимообусловленности и взаимодействии и включается в общую грамматику как один из ее разделов (Фридман 1979).

В.И.Карабан выделяет грамматику текста в самостоятельное направление, противопоставляя его лингвистике текста в целом. Такая грамматика текста, по его мнению, в отличие от лингвистики текста, имеет конкретную цель, заключающуюся в полном описании и объяснении языковой способности носителя языка. Достигается эта цель в результате решения ряда задач, связанных, главным образом, с выделением связанных цепочек предложений, представляющих собой текст, со структурным описанием текста, с определением межфразовой и глобальной связности текста (Карабан 1979).

При определении грамматики текста существует два основных подхода. В первом случае эта грамматика понимается практически в буквальном значении этого выражения, во втором - этот термин носит скорее условный характер. Это различие выражается в подходе к выделению основных структурных единиц текста. Как в первом, так и во втором случае основной единицей является некоторый отрезок текста, включающий в себя последовательность связанных между собой предложений. Обычно такая единица называется сверхфразовым единством (СФЕ), сложным синтаксическим целым (ССЦ) и Т.П.

В качестве характерных особенностей сверхфразовых единств чаще всего указывается их структурная целостность, самостоятельность, независимость от контекста, спаянность составляющих их частей. Обычно СФЕ определяется как цепь предложений, объединенных общностью значения, определенными синтаксическими и интонационными связями и образующих относительно независимые от контекста смысловые единства (Серкова 1968), группа тесно взаимо-связанных по смыслу и синтаксически предложений, выражающих более полное по сравнению с отдельным предложением развитие мысли (Солганик 1973), а также как "качественно особая целостная едд-ница, обладающая своими специфическими делимитационными, структурными и смысловыми признаками" (Фридман 1979).

Понимание как процесс свертывания информации в основные этапы порождения текста

Если бы мышление осуществлялось только с помощью слов, то трудно было бы понять характер тех затруднений, которые часто возникают при составлении разверцутого текста, т.е. то явление, которое обычно называют "муками слова .

Начиная составлять текст, автор, как правило, знает, о чем будет этот текст, а также то, что надо сказать об этом. Обычно он знает, зачем пишется текст, коцу он адресован и т.д. Тем не менее процесс составления текста характеризуется значительными трудностями, которне связаны преимущественно с выбором необходимых языковых средств для адекватного .выражения задуманного содержания. Эти трудности объясняются отсутствием формальных правил, регулирующих выбор этих языковых средств. В то же время известно, что если необходимые слова отобраны, то предложение строится почти автоматически по определенное стереотипу, т.е# формально. Здесь порождение текста опирается на грамматические правила. В связи с этим в процессе порождения можно вьщелить как мишщум два этапа. Первый связан с отбором элементов и является семантическим. Второй - с оформлением высказываний в соответствии с грамматической нормой языка. Следовательно» порождение, так же как и понимание, характеризуется ступенчатостью, этапно-стью. идея многоуровневости, фазности порождения речевого высказывания была высказана еще Л С,Выготским (Выготский 1956). Он выделяет в этом процессе следующие три уровня: 1) мысль или синтаксис словесных значений; 2) словесный синтаксис и грамматика слов; 3) фазическая звучащая речь. ч—" Первые два уровня, по мнению Л С.Выготского, составляют внутреннюю речь, третий - внешнюю.

Представление об этапности, многоуровневоети этого цроцесса, лежит в основе практически всех существующих в настоящее время моделей порождения текста, которые различаются между собой количеством выделения таких уровней, степенью их дробности, интерпретацией тех или иных этапов.

Поскольку в нашу задачу де входит детальный анализ всех существующих подходов к этой проблеме, рассмотрим некоторые из них, характеризующие общую тенденцию.

К проблеме порождения текста неоднократно обращался в своих работах Н.И.Жинкин. Для его подхода характерно различение произвольного и непроизвольного управления речевым процессом (ІЕНКИН 1932) К непроизвольному управлению относятся операции рефлекторного, стереотипного, автоматизированного типа, такие, например, как произнесение звука, соединение звуков, связь слов в предложении и т.д. К произвольному - операции, выполнение которых предполагает цредвзрительно составленный план, своего рода программу. В роли такого плана у Н.ИДинкина выступает речевой замысел (ЇЇинкин 1967). Б соответствии с этим он выделяет два основных уровня: грамматический и смысловой Исследуя процесс пороадения текста, Н.И Кинклн ставит задачу; найти такие звенья этой цепи, которые являлись бы общими для всех уровней.

Н.И.Жинкин приходит к вывод?, что таким наиболее общим зве- ном является механизм отбора, который включает в себя: а) элементы отбора; б) операции отбора. Кроме того, вьщеляются такие X общие мыслительные операции, как "удерживание" и "упревдение", также функщюнирующие на всех уровнях порождения текста Именно на этих явлениях сосредотачивает свое внимание И.И.Жинкин.

Анализ исследуемого процесса Н.ИЛинкин начинает со слова,4 так как оно является "пунктом связи звена составления слов из звуков и звена составления сообщения из слов" (ЇЇинкин I960 ,144). Он считает, что слова, хранятся в памяти в неполном виде, благодаря двум устройствам: фонемной решетке и надстраивающейся над ней решетке морфем. Полное же слово формируется только в процессе составления сообщения в результате применения того или иного синтаксического правила, которое "появляется сразу, как некоторая законченная схема сочетания слов" (їїинкин 1960.1 )

В результате удерживания в оперативной памяти одних элементов и упреждения других появляется возможность одновременного синтеза последовательности полных слов. При этом такая сочетательная синтаксическая схема не зависит ни от звуковой последовательности слов» ш от их значения, т.е. она формальна» а потому позволяет использовать любые слова.

Рассмотренная процедура является схемой отбора элементов для формирования слова, но не отбора самого слова. Эта схема может реализоваться только после того, как станет известно, для ртбор какого конкретного слова необходийГШонем и морфем. Таким образом, этой схеме должен предшествовать отбор конкретного слова. Поскольку в памяти не хранятся полные слова, то этот процесс начинается не с отбора звуковой формы слова, а с отбора его значения, что осуществляется на другом, семантическом уровне.

В основе реализации смыслового этапа порождения текста, как уже было сказано, лежит замысел, представление о котором у Н.И. Жинкияа связывается с "предметно=схемщш кодом основные свойства которого были рассмотрены выше (Жинкин 1964). Следователь-но, замысел понимается- как некоторое семиотическое образование, не выракенаое в словах конкретного языка, но способное развернуться в речевое сообщение. Характерной особенностью замысла, по мнению Н.й.Жинкияа, является то, что в нем не различается смысл и значение. При этом смысл и значение трактуется в соответствии с концепцией Г.Фреге, где значение - это обозначаемый предмет действительности - денотат, а смысл - различные способы называния этого денотата, т.е. различные его имена.

Функциональный аспект языкового знака

Анализ системы знаний, формирующейся в интеллекте человека, позволил определить, что содержание текста как результат его понимания возникает в мышлении на основе соотнесения языковых выражений со зшанйем действительности,.. . базирующемся на моделях предметов и ситуаций- В связи с этим и содержание текста представляет собой некоторую динамическую модель определенного фрагмента действительности.

Будучи оперативными элементами мышления, такого рода модели являются субъективными мыслительными образованиями, непередаваемыми в том ввде, в котором они существуют, другому. С их помощью могут осуществляться внутренние мыслительные процессы, где не требуется линейное развертывание, экспликация связей, отношений, поскольку они уже существуют в интеллекте и постоянно подразумеваются Для передачи этого мыслительного содержания друго- му необходимо, чтобы оно было объективировано, что может быть сделано только с помощью естественного языка, являющегося универсальным средством передачи информации в процессе общения» Такое объективированиэ содержания осуществляется в речи, где оно задается интеллектом, а язык служит средством выражения этого содержания.

В связи с решаемой нами задачей первостепенное значение имеет вопрос о том, как же осуществляется переход от материальных знаков языка к мыслительному содержанию и наоборот. Рассмотренные вше закономерности такого перехода носят психологический характер и касаются главным образом внутренних механизмов переработки информации, не затрагивая знакового уровня. Лингвистические аспекты этого процесса остаются несколько в стороне» что не позволяет составить достаточно полное представление об этом вопросе.

Переход от материальной стороны языковых единиц к их содержательной стороне исследуется лингвистической семантикой. Центральное место здесь занимает исследование лексического значения основной языковой единицы - слова.

Иметь значение - это свойство всякого знака. Знак выполняет свою функцию именно потому, что в качестве второй своей стороны имеет значение. Через значение осуществляется возможность репрезентации действительности. "Способность представлять (репрезентировать) объективную действительность есть способность устанавливать отношение значения между какой-то одной вещью и какой-то другой вещью" (Бенвенист, 1974).

В качестве одной такой вещи выступает сам знак, который в данном случае существует в виде звукоряда или последовательности букв, составляя форму слова. Другая же вещь - это та действительность, которую представляет знак. Эта действительность существует и в своем объективном, материальном виде и как отраженная в сознании материальная сущность. В связи с этим, пытаясь определить сущность значения, его помещают то в сферу мышления, то в сферу реалий, то относят к сфере языка.

Соответственно изменяется локализация остальных вершин семантического треугольника. Б.В.Якушин считает, что количество возможных гипотез, различающихся располонением вершин этого треуголь Q ника, равно числу размещений, т.е. 2=512 и высказывает предположение, что большинство из этих комбинаций было реально использовано. (Якушин 1979),

Наиболее расцространенным подходом к определению значения является отождествление его с понятием- Кроме того, существуют теории, которые отождествляют значение с предметом реальной действительности, с отношением мезду знаком и означаемым, будь то предмет или понятие» а также с отношением мезду словами, Б настоящее время обсуждается гипотеза значения, заключащаяся в том, что значению приписывается функция отражения.

Каждый из этих подходов имеет свои достоинства и недостатки, что не позволяет безоговорочно принять ту или иную концепцию значения. Распространенность первого подхода объясняется его ясностью и определенностью. Ф.М.Березин и Б.Н.Головин связывают это с тем, что в основе данного подхода лежит следующая достаточно четкая схема рассуждения: "Язык связан с мышлением, предложение выражает единицу мышления - суждение, слово выражает элемент суждения - понятие" (Березин 1Э79). Но эта теория значения содержит в себе противоречие, заключающееся в том, что в ней не находит объяснения вопрос, как выражаются в языке элементы мыслительного содержания, не являющиеся понятиями. Как было показано, понятия составляют не единственный уровень отражения действительности. Больше того, понятия составляют, очевидно, меньшую часть среди элементов системы знания, если учесть, что память фиксирует большое количество эмпирической информации.

Но даже если бы это было не так, все равно возникает вопрос, зачем необходимо иметь две разные единицы, значение и понятие, если они тождественны друг другу? Следствием такого отождествления является также то, что знак превращается в одностороннюю сущность, поскольку значение как бы отрывается от него, помещаясь в сферу мышления. В результате этого "словом можно признать лзшь звуковую материю, или набор звуков, звуковой комплекс, слово по -лучается сущностью односторонне материальной, а не двусторонней, материально-идеальной" (Березин 1979). Этот же недостаток свойственен и подходу, где значение отождествляется непосредственно с предметом реальной действительности, вследствие чего оно отрывается от слова, превращая его в одностороннюю сущность.

Понимание значения как отношения к означаемому соответствует представлению о знаке как о двусторонней сущности. Но здесь имеются свои трудности. Одной из них является то, что значение теряет свою субстанцию, а потому становится неясным механизм связи слова с тем, что оно выражает как языковой знак.

Характерной особенностью определения сферы значения слова является то, что значение или прямо, непосредственно соотносится с обозначаемым и тем самым оно становится тождественным ему, или устанавливается опосредствованная связь с означаемым, где значение выступает в качестве промежуточного звена между фонетическим словом и означаемым.

В качестве примера первого подхода можно привести концепцию, развиваемую А.А.Уфимцевой- Она считает, что "результаты объективации реальной действительности... находят свое прямое отражение в значении словесных знаков" (Уфимцева 1380,20). При этом значе-ние отождествляется непосредственно с понятием и денотатом одновременно, в результате чего в нем выделяются денотативши и сигнификативный компоненты.

Типы структурного описания текста

Языковые единицы, составляющие внешнюю, материальную сторону текста, выполняют управляющую функцию в процессе понимания на этапе "вхождения в текст", что позволяет совершить предварительный этап перехода к общему плану содержания. Но окончательный переход к конкретному содержанию определенного текста возможен при взаимодействии языковше и внеязыковых явлений, где активную роль играет интеллект. Область такого взаимодействия составляет семантическую сферу текста. Для определения соотношения этих факторов при переходе к содержанию и их роли в этом ггроцессе наші был проведен эксперимент. Он заключался в том, что испытуемым предъявлялись списки слов, полученные в результате обработки исходных текстов. Ставилась задача составить полный связный текст из слов, содержащихся в предъявляемом списке. Слова в таком списке поставлены в исходную грамматическую форму. Их совокупность представляет собой текст, из которого устранены все формальные показатели связности, а также разбиение на отдельные предложения. Здесь был сохранен отбор, так как в каждый список входили все слова текста, кроме служебных, и распределение, поскольку слова фиксировались в той последовательности, в которой они следовали в тексте- Эти два параметра были теми основными переменными, которые варьировались в различных сериях эксперимента.

Устранение грамматических средств связности ставило испытуемых в такие условия, где они должны были устанавливать связь значений, привлекая для. этой цели знание о внеязыковой действительности, прогнозируя ситуацию, выраженную в тексте При этом определенную роль в этом процессе играет отбор и распределение слов. Предполагалось» что в результате взаимодействия всех этих факторов испытуемые смогут определить тему текста, которая в дальнейшем начнет выступать в роли замысла. На основе этого замысла и должен быть составлен требуемый условиями эксперимента текст. Если полученные исдытуемнда тексты будут достаточно близ-ними по содержанию к исходным, то это должно означать, что при осмыслении предъявленных слов была произведена адекватная их предметная соотнесенность.

Таким образом, данный эксперимент является исследованием понимания через порождение текста, поскольку оценка результата -осуществляется по построенным текстам, а получить текст, адекватный исходному, можно лишь при правильном понимании, т.е, определении темы исходного текста.

Длл эксперимента были отобраны три текста, примерно одинаковые по объему, но различающиеся как по тематике, так и по своему типу. Эксперимент состоял из трех серий. В первой серии испытуемым предъявлялся полный список слов, расположенных в том порядке, в каком эти слова находились в исходном тексте. Во второй серии слова в списке распологались в алфавитном порядке, т.е. случайным образом. Таким образом, в этих двух сериях варьируется распределение слов при постоянном отборе. При этом во второй серии, где исходное распределение слов нарушено, еще большую роль приобретает адекватное прогнозирование ситуации.

В третьей серии кавдому исходному тексту соответствовало несколько списков слов, где сохранялось естественное распределение, но варьировался отбор за счет того, что из списка исключались определенные группы слов. Но фактически распределение также нарушалось, так как после изъятия некоторых слов из списка рядом оказывались слова, ранее разделенные другими словами.

Прежде чем перейти к анализу полученных результатов, следует остановиться на принципе формирования групп слов, которые изымались из списка. В его основе лежат следующие соображения. Как уже было сказано, в данном эксперименте нас интересует только содержательная связь слов, которая имеет значительные отличия от формальной грамматической. Это отличие дрезде всего заключается в том, что грамматическая связь реализуется только в пределах отдельного предложения, в то время как содержательная - в бо-. лее крупных отрезках текста. Слова на этом уровне связи могут . взаимодействовать между собой, находясь в разных предложениях и , даже тогда, когда грамматическая связь между ниш никак не выражена. Поэтому это взаимодействие слов необходимо рассматривать , глобально в рамках целого текста. Назовем этот уровень взаимодействия семантическим пространством текста, которое очерчивается, с одной стороны, кругом отобранных слов» с другой - определяется темой текста» которой соответствует данный отбор слов. Поэтому можно сказать, что определение темы текста есть результат взаимодействия, взаимовлияния всех слов, вошедших в текст, вследствие авторского отбора. При этом, конечно, все слова имеют различные зоны взаимодействия, а потому выполняют различную роль в процессе осмысления. В связи с этим возникает вопрос, как будет влиять на определение темы текста отсутствие того или иного слова. Чтобы ответить на этот вопрос, наиболее естественно было бы удалять из исходного списка по одному слову в порядке их следования и каждый такой список предъявлять испытуемым. Те изменения, которые произойдут при порождении текста испытуемым, а следовательно и при определении темы, следует считать следствием удаления данного слова. Анализ-этих изменений может дать материал, характеризующий роль данного слова в общей связи слов в семантическом пространстве. Но такой подход практически нереализуем, поскольку для этого потребовалось бы огромное количество испытуемых, а главным образом потому, что нет достаточно тонких средств фиксации такого рода изменений.

Похожие диссертации на Структура содержания текста и возможности ее формализации (на материале научно-технических текстов)