Содержание к диссертации
Введение
ГЛАВА 1. Электронная коммуникация как объект лингвистического исследования 13
1.1. Особенности формирования лингвистики электронной коммуникации как исследовательской области 13
1.1.1. Экстралингвистические факторы современных преобразований в языке 13
1.1.2. Терминологическая база исследования электронной коммуникации 16
1.2. Типология видов электронной коммуникации 24
1.2.1. Общая характеристика электронной коммуникации 24
1.2.2. Разграничение видов электронной коммуникации. Соотношение понятий жанр, формат и сервис электронной коммуникации 27
1.2.3. Принципы классификации жанров электронной коммуникации 33
1.2.4. Проблема актуальности классификаций жанров электронной коммуникации 36
1.3. Поликодовость электронной коммуникации 40
1.3.1. Невербальный компонент электронной коммуникации 40
1.3.2. Вербальный компонент электронной коммуникации 47
1.4. Многоязычность как характеристика электронной коммуникации 58
1.4.1. Предпосылки контактирования языков в сети 58
1.4.2. Влияние англоязычной традиции на язык общения в национальных сегментах сети Интернет 62
Выводы по главе 1 з
ГЛАВА 2. Корпусный подход в исследовании коммуникации в системе микроблогов твиттер 72
2.1. Применение методов корпусной лингвистики в исследовании электронной коммуникации 72
2.1.1. Предпосылки использования методов корпусной лингвистики в исследовании электронной коммуникации 72
2.1.2. Принципы построения и анализа корпусов текстов электронной коммуникации 79
2.2. Твиттер как вид электронной коммуникации 89
2.2.1. Структурные особенности системы микроблогов Твиттер 89
2.2.2. Функциональная и содержательная характеристика системы Твиттер 95
2.3. Характеристика исследовательского корпуса и программы
обработки и анализа текстов сообщений системы микроблогов Твиттер 105
2.3.1. Состав и назначение исследовательского корпуса текстов сообщений Твиттер 105
2.3.2. Характеристика программы обработки и анализа текстов сообщений Твиттер 111
ГЛАВА 3. Механизмы компрессии сообщений в твиттере 124
3.1. Компрессия сообщений в Твиттере под взаимным влиянием русского и английского языков 124
3.1.1. Графематический уровень анализа текстов коммуникации в Твиттере 124
3.1.2. Лексический уровень анализа текстов коммуникации в Твиттере 136
3.2 Компрессия сообщений при коммуникации в Твиттере как
результат синтеза устной и письменной речи 140
3.2.1. Графематический уровень анализа текстов коммуникации в Твиттере 140
3.2.2. Лексический уровень анализа текстов коммуникации в Твиттере 154
3.2.3. Синтаксический уровень анализа текстов коммуникации в Твиттере 165
Выводы по главе 3 169
Заключение 171
Словарь терминов 176
Список использованной литературы 180
- Типология видов электронной коммуникации
- Вербальный компонент электронной коммуникации
- Принципы построения и анализа корпусов текстов электронной коммуникации
- Лексический уровень анализа текстов коммуникации в Твиттере
Типология видов электронной коммуникации
Исследование особенностей языка электронной коммуникации подразумевает учет внешних, экстралингвистических факторов, под влиянием которых язык меняется и приспосабливается к новым условиям общения. Зачастую именно экстралингвистические факторы становятся первоначальным источником изменений, тогда как внутренние, реагируя на внешний импульс, начинают адаптировать систему языка к новым условиям существования. К внешним факторам языковых изменений Е. Г. Кошкина и Б. А. Серебренников относят все условия, создаваемые окружающей язык средой и связанные с особенностями исторического развития общества, миграциями, контактом языков, объединением и распадом речевых коллективов, сменой поколений, отношениями внутри коллектива носителей языка, изменением форм общения, прогрессом культуры и техники и т. п. [81; 130].
Поворотным моментом в становлении современного общества экономики знаний стала произошедшая в семидесятые годы двадцатого века четвертая научно-техническая (информационная) революция, связанная с появлением микропроцессорной техники и технологии, интегральных схем, персональных компьютеров, компьютерных сетей, систем передачи данных. Она привела к изменению общественного производства, социальной, экономической и политической жизни общества, всех сфер деятельности человека, росту потребностей в информации, знаниях и созданию новых средств и способов удовлетворения этих потребностей [5]. Ссылаясь на мнение американского социолога Дэниела Белла, можно утверждать, что появление и распространение компьютерной техники и информационных технологий послужило толчком к развитию общества, построенного на использовании различной информации, и получившего название информационного общества, создающего, в первую очередь, информационный, а не материальный продукт [19].
Идея информационного общества была сформулирована в конце шестидесятых – начале семидесятых годов двадцатого века. Термин «информационное общество» ввел Ю. Хаяши, профессор Токийского технологического института. Исследователями и разработчиками теории информационного общества являются также М. Кастельс [71]; Ф. Уэбстер [264]; А. Тоффлер [143]; Д. Белл [184]; З. Бжезинский [191]; А. Кинг [74]; Р. Абдеев [2]; Д. Иванов [63]; А. Ракитов [126]; В. Иноземцев [68] и др.
Информационное общество – это новый этап развития человеческой цивилизации. Такой тип общественного устройства характеризуется, как сформулировано в работе Е. А. Путиловой, не только скоростью экономических и социальных преобразований, но, в первую очередь, высокой скоростью коммуникационных процессов, которая обеспечивается наукоемкими, высокотехнологичными средствами (микропроцессорными технологиями и компьютерной сетью Интернет) и в котором информация и знания приобретают новое качество, становясь основными продуктами жизнедеятельности индивидов и социальных групп [125].
В рамках настоящего исследования концепция информационного общества используется как целостное представление о современном состоянии социума, в контексте которого рассматриваются общие проблемы современной коммуникации и объясняются происходящие в языке преобразования. Из работ М. Кастельса, Э. Тоффлера, М.Постера следует, что для современного этапа развития общества, которое является одновременно носителем исследуемого языка и создателем Интернета как уникальной коммуникативной среды, ставшей основной приметой современной эпохи, характерно следующее: - интенсивное развитие информационно-компьютерных технологий и средств коммуникации; - глобализация мировых процессов; - сближение и взаимопроникновение культур; - стирание пространственных и временных границ; - интенсивное внедрение инноваций во все сферы человеческой деятельности; - непрерывный рост объемов новых знаний; - ускорение коммуникативных процессов [71; 143; 240]. Следует отметить, что по мере того, как положения классических теорий информационного общества проверялись на практике, концепция информационного общества претерпевала изменения. Исследователи, среди которых Д. И. Кутюгин, У. Дж. Мартин и др., стали признавать, что главным отличием нового социума от индустриального общества является возникновение принципиально новых форм коммуникации. Не информация, а коммуникация оказывается ключевым элементом информационного общества, ядром, определяющим сущностную и качественную сторону современного общества [86; 95].
Как отмечает Л. А. Вербицкая, сегодня интегрированным информационным и коммуникативным пространством стал Интернет, в котором реализуются основные принципы постиндустриального общества, а именно: широкий и свободный доступ к различного рода информации, виртуальный характер объектов, интеграция и глобализация мирового сообщества, компьютеризация общественных процессов, возможность межличностного общения без границ посредством различных сетевых служб и т. д. [32; 86].
Несмотря на то, что о переходе к постиндустриальному обществу во всем мире говорить еще рано, в глобальной сети модель информационного общества реализуется в полной мере. Следовательно, язык коммуникации в Интернете как в современной среде общения первым подвергается изменениям, сопровождающим социальные трансформации, и отражает зарождающиеся тенденции. К настоящему моменту вместе со многими областями человеческой деятельности в электронную плоскость перешло и межличностное общение, осуществляющееся теперь с помощью принципиально иных средств коммуникации. Такой способ коммуникации обозначается как «компьютерно-опосредованная коммуникация» («computer-mediated communication»), например, в работах Е. И Горошко, Л. Ю. Щипициной, S. Herring и др. [45; 166; 216; 252], или «электронная коммуникация» («electronic communication», «digitally mediated communication») – в работах К. А. Гиляровой, D. Crystal, L. Schneider и др. – и является объектом исследований в рамках различных дисциплин, в том числе лингвистики [39; 51; 199; 205; 216; 242].
Вербальный компонент электронной коммуникации
Кроме перечисленных сервисов не нужно забывать и о возможностях самого сайта twitter.com, предлагающего услуги расширенного поиска по ключевым словам с указанием языка, по людям, местам и даже по типу сообщения (вопросительное, утвердительное, отрицательное).
Таким образом, Твиттер является не только актуальным и обширным, но также исключительно удобным полем для различных исследований, в том числе и лингвистических. Твиттер обладает большим исследовательским потенциалом, подкрепленным немалым количеством аналитических приложений и служб, позволяющих применять новые способы в проведении исследований, использовать новые структуры организации данных в среде Интернет, новые источники данных, а также формы и инструменты запроса информации.
Современный исследователь вооружен множеством инструментов для сбора и анализа текстов системы микроблогов Твиттер, являющихся ценным лингвистическим материалом, отражающим современные тенденции развития языка. Любой человек и в любое время может присоединиться к общению в предлагаемых в нем формах коммуникации; высказывания участников виртуальной беседы последовательно появляются на мониторе в виде текста, который может быть сохранен в памяти компьютера, а впоследствии при желании распечатан или отредактирован. По этой причине не наблюдается потерь информации из-за трудностей при чтении, шумов или, например, фонетических дефектов, которые обычно осложняют лингвистические исследования в других сферах.
Наряду с указанными структурными особенностями системы микроблогов Твиттер при проведении корпусного исследования языка, функционирующего в этом сервисе коммуникации, учитывались содержательные и функциональные характеристики Твиттера, позволяющие дать более точное описание рассматриваемой коммуникативной среды и, опираясь на него, адекватно интерпретировать результаты исследования.
Языковая специфика коммуникации зависит не только от того, как происходит общение, но и от того, кто ведет общение и с какой целью. Иными словами, для выбора языковых средств важна не только форма общения, связанная в нашем случае с техническим сопровождением процесса электронной коммуникации, но и функционально-содержательный аспект коммуникации в Твиттере.
С точки зрения функций и содержания общения в Твиттере в полной мере реализуются основные характеристики электронной коммуникации, рассмотренные в первой главе. Так, в рамках настоящего исследования следует особенно подчеркнуть, что многоязычность как черта электронной коммуникации свойственна и общению в Твиттере. Система микроблогов Твиттер представляет собой открытую коммуникативную среду, то есть сообщения поступают из любого уголка планеты, носят в основном публичный характер и доступны для просмотра и комментирования любыми пользователями. Таким образом, в Твиттере созданы все условия для многоязычной коммуникации.
По данным исследования компании GNIP, специализирующейся на сборе и анализе социальных данных, проведенного в 2012 году, большинство сообщений в Твиттере написаны на следующих языках:
Лидерство английского языка не является неожиданным в свете общей языковой ситуации в сети, рассмотренной в первой главе. Доля же русскоязычных сообщений в Твиттере, хоть и мала по сравнению с долей англоязычных сообщений, но занимает далеко не последнее место в списке наиболее распространенных языков в Твиттере.
Интересно, что сравнение результатов исследования сообщений Твиттера с данными о распространенности языков в целом по сети Интернет показывает, что китайский язык, являющийся вторым по популярности в сети, мало распространен в Твиттере. На первый взгляд это объясняется многолетним запретом рассматриваемой системы микроблогов в Китае1. Однако данные исследования компании GlobalWebIndex того же года опровергают мнение о том,
Твиттер запрещен в Китае с 2009 года [243]. что китайцы не пользуются Твиттером, следуя официальному запрету. Так, число активных1 пользователей сервиса Твиттер во втором квартале 2012 года в разных странах составило: активными пользователями Твиттера. Это противоречие можно объяснить либо ошибкой в анализе языка сообщений, либо тем, что китайцы используют для общения в Твиттере другой, скорее всего, английский язык. Поскольку нет причин сомневаться в объективности результатов указанных исследований, будем придерживаться той точки зрения, что пользователи Твиттера используют для коммуникации не только родные языки, но и другие мировые языки, в первую очередь, английский.
Таким образом, языковое оформление Твиттера вполне разнообразно: общение ведется на многих мировых языках при сохранении доминирующей роли английского языка. На данный момент интерфейс сервиса доступен на 33 языках [233]. Многоязычность ресурса обусловливает активные языковые контакты в рассматриваемой коммуникативной среде.
Принципы построения и анализа корпусов текстов электронной коммуникации
Согласно данным таблицы 10 средняя длина сообщения в корпусе, то есть сообщения, включающего в себя, помимо вербальной составляющей, одну или несколько ссылок, не превышает восьмидесяти символов. Следовательно, пользователям не приходится вынужденно прибегать к сокращениям в связи со строгим ограничением длины сообщения. Количественный анализ показал, что лишь небольшая часть сообщений в Твиттере приближается к верхней границе объема сообщения в сто сорок символов. Это означает, что тенденция к компрессии языковых средств вызвана иными причинами, нежели ограничениями, связанными с форматом коммуникации, а, следовательно, тенденция может распространяться и на другие форматы и сервисы электронной коммуникации.
Факторами, которые могут влиять на сокращение длины предложений при коммуникации в Твиттере, как и в устной коммуникации, являются - относительная спонтанность коммуникации, - действие закона экономии усилий, подкрепленное непринужденным характером коммуникации, и - экспрессивность неофициального межличностного общения. Рассмотрим, каким образом язык электронной коммуникации реагирует на перечисленные экстралингвистические факторы.
Отсутствие непосредственного контакта коммуникантов в процессе электронного общения приводит к появлению особых средств передачи невербальной информации на письме. На графематическом уровне анализа текстов коммуникации в Твиттере наиболее отчетливо проявляется стремление пользователей к реализации выразительных возможностей письменной коммуникации.
Таким образом, пользователи находят средства компенсировать отсутствие непосредственного контакта с собеседником, не прибегая к вербальному описанию переживаемых эмоций. За счет нестандартного использования пунктуационных знаков происходит упрощение структуры предложений, входящих в сообщение и минимизация количества используемых языковых средств. Вместе с таким упрощением, несомненно, теряется и точность передачи невербальной информации, заложенной в сообщение.
Однако, наряду с пунктуационными знаками, в распоряжении пользователя сервиса электронной коммуникации есть довольно широкая палитра эмотиконов, также позволяющих оформлять на письме невербальную составляющую сообщения (см. частотный список эмотиконов в исследовательском корпусе в приложении Ж).
Эмотиконы начали заимствоваться русскоязычными пользователями из английского и японского языка одновременно с распространением сети Интернет в России. К настоящему моменту многие эмотиконы, содержащие буквы латиницы, транслитерированы в кириллические эквиваленты (например, хд, т.т, О_о и пр.). Те же эмотиконы, которые не содержат букв, а составлены только из знаков пунктуации и различных типографских символов, используются в неизмененном виде.
Хотя выбор эмотиконов гораздо шире, чем выбор пунктуационных знаков, выражение эмоций и передача жестов и мимики с их помощью стандартизированы в довольно большой степени. Это связано как с ограниченными возможностями письменных средств, так и с необходимым уровнем конвенциональности этой знаковой системы, поскольку при использовании неизвестного эмотикона присутствует риск быть непонятым собеседником.
Статистические данные показывают, что в русскоязычной коммуникации в сочетаний знаков препинания связано со стремлением пользователей преодолеть опосредованность общения и передать свои эмоции, жесты и мимику на письме. Для непринужденной электронной коммуникации, как и для неофициального устного общения, характерна эмоциональность и экспрессивность. При этом информативная коммуникация часто уступает место фатическому общению, взаимодействие собеседников сводится к обмену краткими описаниями собственного эмоционального состояния, отношения к тому или иному предмету разговора. Поэтому именно в этом виде электронной коммуникации особенно распространено использование эмотиконов. Замещение вербального описания эмоций эмотиконами также является одним из механизмов компрессии и упрощения структуры текстов электронной коммуникации.
Передать невербальную информацию средствами письменной речи позволяет и нестандартное использование параграфемных средств, например, произвольное варьирование регистров. Так, например, использование прописных букв является одним из способов передачи эмоций и интонации устной речи.
Прописные буквы используются для передачи крика, увеличения громкости голоса, логического ударения, иронии. В сообщениях, представленных в исследовательском корпусе, прописные буквы используются, среди прочего, для передачи следующих характеристик сообщения:
Лексический уровень анализа текстов коммуникации в Твиттере
Установлено, что действие указанных механизмов обусловливает приспособление языка к новой среде общения, сопровождающееся формированием отклонений от внесетевых языковых норм. Формирование таких отклонений от норм при электронной коммуникации направлено на снижение трудоемкости коммуникации в целом и компрессию сообщений в частности. Во-первых, механизмы компрессии сообщений складываются под влиянием интерференции русского и английского языков, связанной, среди прочего, с особенностями ввода текста с клавиатуры. Во-вторых, указанные механизмы формируются в условиях сближения языка электронной коммуникации с разговорной речью: стремление пользователей к экономии приводит к использованию минимума речевых средств и структурных компонентов, необходимых для выражения определенного содержания, к повышению экспрессивности текста в целом, к пренебрежению нормами оформления письменной речи.
Таким образом, гипотеза исследования о действии в языке электронной коммуникации особых механизмов, обусловливающих приспособление языка к новой среде общения, что приводит к компрессии сообщений, подтверждена.
Итак, данное диссертационное исследование позволило выявить и классифицировать особенности языка электронной коммуникации, сформировавшегося в условиях современных научно-технических и социальных изменений, установить связь между условиями общения в сети и выявленными языковыми особенностями, а также описать механизмы компрессии сообщений, действующие при формировании выявленных отклонений от внесетевых языковых норм в текстах электронной коммуникации.
Дальнейшее изучение электронной коммуникации возможно в нескольких направлениях: 1) на материале сформированного в ходе работы над диссертацией корпуса возможно более глубокое исследование принципов автоматического анализа и разметки текстов электронной коммуникации; 2) поскольку в работе не ставилась задача оценить степень успешности восприятия сообщений, подвергшихся компрессии, реципиентом, исследование особенностей восприятия и понимания таких текстов электронной коммуникации представляется перспективным направлением психолингвистики; 3) дальнейшие исследования в области письменной разговорной речи будут способствовать развитию стилистики в этом направлении; 4) в свете современного интенсивного развития технологий и новых средств коммуникации перспективным является исследование поликодовой электронной коммуникации.
Любые языковые изменения, обусловленные контактом языков и включающие в себя как языковой сдвиг, т.е. отклонения от языковых норм, так и заимствования при сохранении языка [13; 27]. компрессивное словообразование: Построение слов, которые представляют собой разного рода сокращения имеющихся в языке номинативных единиц – слов и словосочетаний [61, с. 87]. компрессия сообщений: Термин, предложенный в работе для обозначения языковых изменений, ведущих к сокращению объема и упрощению структуры сообщения. Целью компрессии в первую очередь является снижение трудоемкости коммуникации и экономия усилий и времени пишущего, то есть того, кто порождает высказывание. корпус: Большой, представленный в машиночитаемом виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач [58, с. 7]. Корпус также можно рассматривать как специальным образом построенную семиотическую систему, поскольку он включает в себя не только разнообразную информацию о составе и структуре своего речевого материала, но также и другие формализованные методы его представления (индексирование слов, морфологическую информацию и т. д.) [129]. лингвистические данные: Cведения о языке, фиксируемые текстами и словарями разных типов, которые могут служить основой для разного рода лингвистических исследований. мем: Идея, образ, нематериальный объект культуры, который известен и распространен среди членов интернет-сообщества [172, с. 162]. норма языковая (норма внесетевая): Результат целенаправленной кодификации языка, т.е. внесения определенных правил употребления языковых средств в словари и грамматики [84, с. 5]. парцелляция: Прием экспрессивного синтаксиса, сущность которого заключается в расчленении синтаксически связанного текста на интонационно обособленные отрезки, отделяемые финальными знаками препинания [66, с. 279]. плеоназм: Выражение, содержащее однозначные и тем самым излишние слова (если только это не связано со стилистическим заданием, например в градации, построенной на синонимах) [274]. поликодовость (письменной коммуникации): Сочетание в едином графическом пространстве семиотически гетерогенных составляющих – вербального текста, изображения, а также знаков иной природы [136, с. 117]. прецедентные конструкции: Конструкции, известные значительной части представителей национально-лингвокультурного сообщества, актуальные в познавательном и эмоциональном плане, обращение к которым обнаруживается в речи представителей соответствующего национально-лингвокультурного сообщества. Использование прецедентных конструкций связано с их реализацией в стереотипизированной форме в типичных ситуациях общения [37, с. 69]. разметка корпуса: Дополнительная лингвистическая и экстралингвистическая информация о текстах корпуса, полученная в результате проведения графематического, морфологического, синтаксического и др. анализа [58]. сбалансированность (репрезентативность) корпуса:
Необходимо-достаточное и пропорциональное представление в корпусе текстов различных периодов, жанров, стилей, авторов и т. д., то есть способность отражать все свойства проблемной области [58, с. 18]. сервис электронного общения: Термин, предложенный в работе для обозначения конкретного программного средства или коммерческого/некоммерческого проекта, позволяющего осуществлять электронную коммуникацию. Сервис существует в рамках определенного формата или сочетает в себе различные форматы. структура сообщения: Количество языковых знаков, присутствующих в сообщении, и их организация [28, с. 141]. твиттер: Сервис, предназначенный для обмена короткими текстовыми сообщениями (твитами) через веб-интерфейс, службу коротких сообщений (СМС), службы мгновенного обмена сообщениями или сторонние программы-клиенты [44]. токен: Минимальный лингвистически значимый элемент текста, синтагматически идентифицируемая графематическая единица типа орфографического слова [156, с. 110]. универбация: Способ компрессивного словообразования, образование слова на базе словосочетания, которому оно синонимично. Используется не для обозначения словом нового понятия, а для однословного обозначения понятия, уже имеющего в языке устойчивое наименование, но неоднословное [69, с. 556]. усечение: Образование новых слов путем сокращения, Русск. метро метрополитен, кило килограмм, сальто сальто-мортале [11];