Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Моделирование процесса перевода с таджикского языка на английский язык словоформ, образованных от имен числительных Исмоилова, Рано Мизробовна

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Исмоилова, Рано Мизробовна. Моделирование процесса перевода с таджикского языка на английский язык словоформ, образованных от имен числительных : диссертация ... кандидата физико-математических наук : 05.13.16.- Душанбе, 1997.- 92 с.: ил. РГБ ОД, 61 99-1/164-4

Введение к работе

Актуальность темы. По данным ЮНЕСКО более половины всего занятого населения промышленно-развитых стран прямо или косвенно принимает участие в процессе производства или распространения информации. Современная цивилизация достигла такого уровня развития, при котором сумма человеческих знаний удваивается каждые 1-2 года. В такой же степени возрастает необходимость увеличения реального освоения накопленной и вновь создаваемой информации. Так как практически вся информация организована средствами естественных языков, любая нация традиционно решает эту проблему посредством перевода.

Потребности в переводе и спрос на него резко возросли, существенно опередив при этом темпы роста контингента квалифицированных переводчиков. Классический закон "соответствия спроса и предложения" по каким-то причинам пока не сработал: нехватка переводчиков - это реальный факт, наблюдаемый повсеместно в мире; предотвратить дальнейшее усугубление ситуации пока никакими средствами не удается; и похоже, что никакие средства, кроме повышения производительности переводческого труда за счет использования новых информационных технологий не помогут. В настоящее время такой технологией является компьютеризация. Из всех средств компьютеризации наиболее полно проблему перевода с одного естественного языка на другой решают системы автоматического перевода.

Системы автоматического перевода предназначены для осуществления перевода без вмешательства человека. Это не исключает ни предварительной подготовки текста, ни постредактирования. Однако, весь процесс перевода - с того момента, как введен входной текст, и до выхода выходного текста - целиком обеспечивается самой системой автоматического перевода без какого-либо участия человека.

Созданием систем автоматического перевода занято научное направление, называемое автоматическим переводом (АП).

Проблеме АП посвящено немало работ. В то же время работ, где бы в качестве объекта перевода рассматривался современный таджикский язык, нет. Поэтому формализация грамматики таджикского языка (как и любого другого естественного языка) с точки зрения АП представляет как практический, так и теоретический интерес.

В связи с обретением государственной самостоятельности задача построения систем автоматического перевода, в которых входным или выходным языком являлся бы таджикский язык, для Таджикистана становится особо актуальной.

Диссертационная работа выполнена в рамках плана научно- исследовательских работ Математического института о ВЦ Академии наук Республики Таджикистан и Постановлений Совета Министров Республики Таджикистан о дальнейшем развитии таджикского языка.

Цель работы. Целью диссертационной работы является разработка и реализация системы автоматического перевода с таджикского на английской на примере слов таджикского языка, основы которых являются именами числительными.

В дальнейшем будем обозначать множество всех слов таджикского языка, основы которых являются именами числительными, через С.

Методы исследования. При разработке системы АП использовались методы теории формальных языков (для формализации грамматик) и методологический подход СУБД (для формирования базовых словарей).

Научная новизна и результаты. Для слов таджикского языка, основы которых являются числительными, автором построены:

база данных морфологии;

модель морфологического синтеза;

модель морфологического анализа;

модель синтеза семантически-эквивалентных словам сєС выражений' таджикского языка на основе правил синтаксиса таджикского языка, соответствующих правилам морфологии;

модели синтеза переводов на английский язык слов, составляющих семантически-эквивалентные словам сєС выражения таджикского языка.

Реализована система автоматического перевода слов сєС с таджикского на английский язык на персональном компьютере PC AT.

Все полученные результаты - новые.

Практическая и теоретическая ценность. Выбор в качестве объекта перевода слов сєС позволяет наиболее полно проверить концепцию АП слов таджикского языка, т.к. слова сєС объединяют в себе свойства слов, основы которых являются именными частями речи.

В основу реализованной системы АП положен принцип, согласно которому анализ текста на входном и синтез текста на выходном языке представляют собой принципиально независимые процедуры. Поэтому полученные результаты могут быть использованы для построения систем автоматического перевода, в которых входным или выходным языком являлся бы таджикский язык, и во всех областях, где рассматривается проблема переработки машинами текстов на таджикском языке.

Публикации. Основные результаты работы отражены в трех статьях автора. [1-3].

Структура работы. Диссертация состоит из введения, четырех глав и приложения.