Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Автоматизация лингвистического анализа поэтического наследия таджикской литературы (на примере газелей Хафиза) Джаъфарова Давлатхоним Файзалиевна

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Джаъфарова Давлатхоним Файзалиевна. Автоматизация лингвистического анализа поэтического наследия таджикской литературы (на примере газелей Хафиза): автореферат дис. ... кандидата филологических наук: 10.02.22 / Джаъфарова Давлатхоним Файзалиевна;[Место защиты: Институте языка, литературы, востоковедения и письменного наследия им. Рудаки Академии наук Республики Таджикистан].- Душанбе, 2012.- 26 с.

Введение к работе

Актуальность темы. Развитие любой отрасли науки наряду с фундаментальными ее понятиями, структурой внутреннего динамизма и другими факторами находится в прямой зависимости от применения в ней средств и методов ряда смежных прикладных отраслей. В настоящее время использование в языкознании, литературоведении, лингвистике и других направлениях современной филологической науки, аппарата математики, и в первую очередь статистических методов и средств, бурно развивающихся компьютерных и коммуникационных технологий, стало уже традиционным и обычным явлением. С другой стороны, огромное наследие таджикско-персидской классической литературы до сих пор недостаточно изучено с позиции статистического анализа. Имеющиеся отдельные исследования явно не достаточны для охвата хотя бы определенной части всего объема этого огромного наследия, а использование статистических методов дают наилучшие результаты в стилистике, которая может избавиться от субъективных оценок при помощи подсчета и строгой систематизации материала. При исследовании таджикско-персидской классической поэзии, кроме атрибуции, которая является, несомненно, одной из важнейших задач стилистики, огромный интерес представляет также установление закономерностей и по другим параметрам поэтического материала. Значительную часть исследовательского процесса в этом направлении составляет рутинная работа по обработке текстового материала.

На современном этапе бурно развивается такая отрасль в прикладной лингвистике, как компьютерная лингвистика. Под компьютерной лингвистикой обычно понимается широкая область использования компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных областях, а также сфера применения компьютерных моделей языка не только в лингвистике, но и в смежных с ней дисциплинах.

Достижения в области компьютерной лингвистики находят все большее применение для анализа поэтических материалов. Очевидно, что компьютерная программа ещё долго не будет способна делать полноценный анализ поэтического текста: ей не под силу определить жанр, тему, сюжет, образную часть и т.д. И тем более, компьютер, в отличие от человека, никогда не сможет понять художественную ценность произведения. Однако в настоящее время сложился определённый минимум, из которого можно получить начальные сведения о стихах.

Лексикография, будучи прикладной дисциплиной в области языкознания, изучает в основном методы создания (составления) словарей. Обычно под словарем понимается определенным образом организованное собрание слов, как правило, с приписанными им комментариями, в которых в стандартной для данного словаря форме описываются особенности их структуры и/или функционирования. Помимо слов, объектами словарного описания могут выступать их компоненты, а также словосочетания различных типов – фразеологизмы, цитаты и т.п. К компетенции лексикографии относится также задача разработки технологий составления словарей. Использование современных методов разработки программных продуктов позволяет автоматизировать многие процессы технологий составления словарей, поскольку современные технологии программирования дает возможность разрабатывать разнообразные приложения, которые находят свое применение в различных предметных областях.

Методологическую основу этих технологий составляют: теория алгоритмов и методы алгоритмизации; методы структурного программирования; методы объектно-ориентированного программирования; методы визуального моделирования и технологии обмена информацией и доступа к данным.

В связи с этим возникает естественная необходимость в создании такого инструментария, который автоматизирует все основные рутинные работы как в процессе исследования статистических закономерностей поэтического материала, так и в технологии составления словарей.

Для решения поставленной задачи нами разработан программный комплекс для составления частотных словарей с учетом следующих требований:

приложение должно быть интерактивным;

содержать функциональные точки, позволяющие выполнить процедуру редактирования (до, в процессе и после выполнения возложенных на приложение функций);

базироваться на доступной для конечных пользователей платформе.

Разработанный программный комплекс использован для статистического исследования произведения Хафиза Ширази и изучения закономерностей лингвистических элементов и стилистических особенностей на основе автоматизированного составления частотного словаря сборника его газелей.

Теоретическими основами для решения поставленной в работе задачи явились научные работы в области проектирования информационных систем, методы визуального моделирования и технологии программирования, а также методы математической статистики.

Степень разработанности проблемы.

А) В настоящее время имеется очень мало частотных словарей произведений классиков таджикско-персидской литературы. Имеющиеся единичные частотные словари составлены традиционным способом и представлены, в основном, в виде конкорданса. Автору известны лишь следующие работы:

  1. Османов М.Н. Частотный словарь Унсури.- М.: Наука, 1970,

  2. . : : -

Б) Диссертанту не известна ни одна работа по комплексному статистическому анализу материалов того или иного автора.

В) Вопросы классической поэтики, прежде всего касающиеся метрической системы аруз, изучены в работах:

  1. Шамсиддин Муаммад бинни айси Розї. Ал-мъам фї маойри ашъор-ил-Аам. – Тегеран, 1338/1960.

  2. Насириддини Тсї. Меъёр-ул-ашъор. – Тегеран, 1334/1956.

  3. Фаранги омори куллиёти уръони Карим.Таълиф ва таии доктор Мамуди Ронї.- Тегеран, 1990 м.

  4. Парвиз Нотили Хонларї. Вазни шеъри форсї. - Тегеран, 1345/1967.

  5. Траул Зенї. Санъати сухан. - Душанбе: Ирфон, 1979.

  6. Баром Сирус. Арзи тоикї. - Душанбе: Таджикгосиздат, 1963.

  7. Нарзиул М. ойгои сухан.- Душанбе: Адиб, 2007.

Г) Автором диссертации изучены отдельные работы, в которых поэтические материалы исследуются с помощью компьютерной технологии (напр. А.В.Козьмин Автоматический анализ стиха в системе STARLING // Тр. Международной конф. «Диалог-2006». – М, 2006; Бабенко И.И. Коммуникативный потенциал слова и его отражение в лирике М.И. Цветаевой: Автореф. дис. … канд. филол. наук. - Томск, 2001. - 25 с.; Орлова О.В. Коммуникативные аспекты лексической репрезентации концепта язык в лирике И. Бродского: Автореф. дис. … канд. филол. наук. - Томск, 2002. - 25 с.). Однако по проблемам автоматизации анализа таджикской поэзии исследования не проводились.

Цель работы. Цели исследования - на основе использования современных технологий проектирования информационных систем и методов визуального моделирования разработать и реализовать программный комплекс составления частотных словарей и применить его в процессе решения конкретной задачи статистического анализа поэтических материалов.

Достижение поставленной цели осуществляется путем решения следующих задач:

  1. Анализ и систематизация существующих научных знаний в области математической и компьютерной лингвистики.

  2. Исследование стилистических закономерностей поэтических материалов, в частности, исследование закономерностей образования стихотворных размеров.

  3. Разработка и обоснование моделей с использованием стандартных систем обозначений программного комплекса.

  4. Разработка, обоснование и тестирование комплекса эффективных алгоритмов автоматизированного составления частотных словарей и их реализация в виде проблемно-ориентированного программного обеспечения.

  5. Проведение вычислительных экспериментов с целью тестирования и верификации разработанных программных средств и разработка научно-технических предложений по их практическому использованию и дальнейшему совершенствованию.

Методы исследования, достоверность и обоснованность результатов. Методологическую основу работы при построении и исследовании моделей и алгоритмов составляют методы теории алгоритмов, теории множеств, математического моделирования, теории информации, математической статистики, теории вероятностей и методы проектирования информационных систем. Для разработки программных средств применялись методы визуального моделирования (UML) и технологии объектно-ориентированного программирования, а также САSЕ-средства.

Теоретические результаты получены методом дедуктивных рассуждений. Достоверность также подтверждается численным экспериментом.

Научная новизна работы обусловлена:

  1. Применением методов современной технологии проектирования информационных систем в рассматриваемой предметной области;

  2. Разработкой технологии составления частотных словарей;

  3. Применением нового подхода к лингвистическому исследованию для статистического анализа текстовой информации с целью определения стилистических закономерностей;

  4. Проведением комплексного статистического анализа множества словоформ исследуемого поэтического материала, позволившего получить перечни и статистические распределения для различных морфологических лингвистических элементов.

Практическая значимость работы состоит в возможности широкого внедрения созданных средств составления частотных словарей в лингвистических исследованиях, а также в качестве одного из элементов системы разработок в области компьютерной лингвистики.

Полученные результаты используются в учебном процессе Российско-Таджикского (славянского) университета и Таджикского технологического университета при разработке курсов лекций и программ по дисциплинам «Компьютерная лингвистика», «Технологии проектирования информационных систем».

Теоретическая ценность работы состоит в том, что разработанный подход к моделированию проблемно-ориентированных программных комплексов и реализации вычислительных алгоритмов в области лингвистических исследований может эффективно применяться при решении широкого круга задач по изучению таджикско-персидского литературного наследия.

Источники исследования. Объектом данного исследования послужили следующие работы:

  1. Шамсиддин Мухаммад Хофизи Шерози. Куллиёт // Под ред. М.Бори – Тегеран: Иктисодиёти чахон, 1379/2001 (основной).

  2. Насириддини Тсї. Меъёр-ул-ашъор. – Тегеран, 1334.

  3. Хофизи Шерози. Куллиёт // Ред. и автор предисл. Дж. Шамбезода. - Душанбе: Адиб, 1983.

  4. : :

  5. Фаранги омори куллиёти уръони Карим // Сост. и ред. доктор Мамуди Ронї.- Терон, 1990 м.,1410 ирї.

  6. Нарзиул М. ойгои сухан.- Душанбе: Адиб, 2007.

Апробация работы. Диссертационное исследование обсуждено на совместном заседании отделов таджикской классической литературы и таджикского языка Института языка и литературы им. Рудаки Академии наук Республики Таджикистан (24.01.2012, протокол №9) и рекомендовано к защите.

Основное содержание работы отражено в научных статьях, опубликованных в различных научных сборниках. По материалам исследования диссертант выступала на научно–теоретических семинарах, международных конференциях, в том числе на Международном конференции (забони тоикї-форсї ва технологияои иттилоотї) 28-29-мая 2008г. АНРТ);

Структура и объем диссертации. Работа состоит из введения, трёх глав, заключения и приложений. Библиография насчитывает 161 источника. Объем работы 111 страниц, в тексте основной части имеется 23 рисунков и 16 таблиц.

Похожие диссертации на Автоматизация лингвистического анализа поэтического наследия таджикской литературы (на примере газелей Хафиза)