Введение к работе
Актуальность исследования обусловлена необходимостью изучения вербального проявления агрессии в сети Интернет, её влияния на пользователей с учётом фактора анонимности во Всемирной сети.
Вербальная коммуникация в условиях анонимных интернет-форумов является объектом данного исследования.
Предметом диссертационного исследования являются вербальные корреляты состояния “агрессия” на анонимных форумах с позиций межъязыковой сопоставительной лингвистики.
Цель исследования состоит в выявлении связи между фактором анонимности и вербальными коррелятами состояния агрессии для носителей английского, немецкого, испанского и русского языков; создании на основе полученных данных и знаний представительного корпуса текстов анонимных форумов вербальных единиц и разработке программного продукта для автоматизации анализа вербального проявления агрессии для разных типов текстов на анонимных интернет-форумах.
Достижению данной цели служит решение следующих задач:
-
Проведение анализа способов вербального проявления агрессии применительно к различным языковым уровням
-
Выявление наличия или отсутствия корреляции между фактором анонимности и проявлением состояния агрессии в сети Интернет для носителей разных языков
-
Определение наличия или отсутствия корреляции между употреблением
инвективных единиц и проявлением агрессии
-
Создание репрезентативной базы данных вербальных единиц
-
Разработка программного приложения для анализа вербального проявления агрессии в текстах анонимных форумов Методологической основой данной работы являются исследования в области
социально-сетевого дискурса, который выделяется в отдельный вид дискурса (Р.К. Потапова); классические и современные работы по теории коммуникации с учётом влияния сетевого дискурса (Дж. Вольтер, О.В. Дедова, М. Ли, Р.К. Потапова, В.В. Потапов, Р. Спирс, Р.О. Якобсон); исследования проявления вербальной агрессии с позиций психо- и социолингвистики (Е.Н. Басовская, Л.Р. Комалова, А.А. Леонтьев, В.В. Потапов, Р.К. Потапова, Т.Ю. Шерстинова, Ю.В. Щербинина), психологии (А. Бандура, А. Басс, Л. Берковиц, Р. Бэрон, Дж. Доллард, Д. Ричардсон, Х. Хекхаузен) и семиотики (Р. Барт), работы в области изучения влияния анонимности на коммуникацию в сети Интернет (М. Бернштайн, Т.А. Воронцова, Дж. Дули, Д. Инфант, Д. Ольвиус, Л. Хагман), исследования обсценной и инвективной лексики (В.Ю. Апресян, В.И. Жельвис), а также исследования в области статистического подхода к исследованию текстов на естественном языке (В.А. Баранов, В.В. Налимов, Й. Ким, Т. Миколов, К. Мэннинг, Дж. Хинтон).
Методика данной работы основывалась на исследованиях семантического поля «агрессия», проведенных Р.К. Потаповой, и на программно-алгоритмических работах, выполненных С. Бердом, Й. Кимом, Т. Миколовым, Р. Рехуреком и П. Сойкой; заключалась в контент-анализе текстов анонимных форумов для семантического поля «агрессия», проведении и руководстве аннотацией текстов анонимных форумов и социальных сетей на разных языках с учетом наличия или отсутствии вербальной агрессии, автоматическом сборе текстовых данных из разных источников, проведении автоматической классификации текстов по признаку наличия проявления вербальной агрессии с помощью сверточных нейронных сетей и методов векторизации словарных текстовых единиц; статистическом анализе обсценной лексики в сообщениях.
Научная новизна данной работы заключается в исследовании влияния фактора анонимности на вербальное проявление агрессии и реализацию инвективных единиц в речи применительно к вышеназванным языкам, что является вкладом в дальнейшее развитие технологий.
Теоретическая значимость диссертационного исследования состоит в возможности дальнейшей разработки теории вербализации состояния агрессии в сети Интернет, а также теории сопоставительных (кросслингвистических) парадигм с учётом фактора анонимности и обсценной лексики.
Практическая ценность исследования заключается в возможности использования полученных данных в лекциях по теории речевой коммуникации в социальных сетях, а также в разработке программного продукта, предназначенного для анализа социально-сетевых текстов, содержащих инвективную лексику, соотносящуюся с семантическим полем агрессии.
Экспериментальный корпус – языковой материал на русском, английском, немецком и испанском языках, автоматически собиравшийся с анонимных форумов (имиджбордов) в сети Интернет с помощью разработанного нами программного продукта на языке программирования Python, который осуществлял парсинг HTML-страниц и работу с прокси-серверами. Объем собранного корпуса составляет примерно 1050.5 Мб текстового массива.
Достоверность полученных результатов и надежность выводов
обеспечиваются представительностью базы данных (более 30 млн. словоупотреблений для русского и английского языков, более 10 млн. словоупотреблений для немецкого и испанского языков) и, следовательно, её репрезентативностью (для данной медиасреды), наличием в выборке материала не только с анонимных форумов, но и данных из социальных сетей; разделением на тестовую, тренировочную и кросс-валидационную выборку данных для классификации с помощью методов машинного обучения; учётом не только относительных характеристик, но и других метрик (F-score).
Апробация результатов исследования проводилась на различных
конференциях: SPECOM-2015 (г. Афины, Греция, 20-24 сентября 2015г.), ConCorT Junior ("Корпусные технологии и компьютерные методы в современной гуманитарной науке") (г. Москва, 9-11 октября 2015 г.), «Коммуникации в мультикультурном обществе» (г. Москва 6-8 декабря 2015 г.), SPECOM-2016 (г. Будапешт, Венгрия, 23-27 августа 2016г.); в отчётах в рамках проекта № 14-18-01059 Российского научного Фонда (РНФ) на базе МГЛУ (науч. рук. доктор фил. наук, профессор Р. К. Потапова).
На защиту выносятся следующие положения:
-
анонимность в сети Интернет не всегда коррелирует с вербальной агрессией, в ряде случаев полная анонимность не повышает уровень проявления вербальной агрессии
-
существует способ автоматического определения вербальной агрессии с помощью методов машинного обучения
-
употребление инвективных единиц не в полной мере коррелирует с проявлением вербальной агрессии
-
некоторые культуры более склонны к проявлению вербальной агрессии
-
полиязычные векторные модели представления слов могут предпочтительнее моноязычных из-за более широкого контекста употребления именованных сущностей (named entities) Структура и объем диссертации. Диссертация состоит из введения, двух глав
(каждая глава включает выводы), заключения, содержащего основные результаты исследования, списка литературы из 169 источников и 7 приложений. Объем основного текста диссертации изложен на 155 с, содержит 22 рисунка и 14 таблиц.