Введение к работе
Актуальность темы. Прогресс в области науки и техники во многом зависит от своевременного сбора, обработки и распространения научно—технической информации. Вааным элементом этой большой работы является обслуживание потребителей переводами. Увеличение объема переводов заставляет информационных работников искать пути ускорения и удешевления переводов» Одним из них является автоматизация процесса.перевода и, в частности, создание систем машинного перевода (Ш), облегчающих труд переводчика и обеспечивающих оперативное' удовлетворение практических потребностей специалистов.
Современный этап развития прикладной лингвистики характери--зуется растущим интересом к созданию эффективных систем машинного перевода (СМИ), работающих в промышленном режиме. Одной из важнейших характеристик промышленных СМИ является технологичность, которая наряду с другими аспектами включает удобство эксплуатации, с одной стороны, и удобство пополнения и корректирования - с другой. Несовершенство технологии пополнения и. корректирования системы становится серьезным тормозом развития и может привести к ухудшению других параметров системы МП и, в первую очередь, качества перевода.
Вопросы технологичности особенно остро встают в тех случаях, когда СШ передаются в пользовательские организации для самостоятельной эксплуатации. В этой ситуации усовершенствование организации словарей а упрощение работы с ними приобретает первостепенное значение, т.к. словари более других компонентов системы нуждаются в изменениях.
Цели и задачи исследования. Цель настоящей работы состоит -в построении модели морфологического синтеза словоформ русского языка, ориентированной на ее машинную реализацию в качестве компонента промышленной СШ и обеспечивающей технологическую
- I -
гибкость программной реализации, высокое быстродействие» эффективное взаимодействие с другими компонентами системы, легкость внесения исправлений и изменений. Задачи исследования;
-
Сформулировать требования к морфологическому компоненту промышленных систем МП и выработать принципы его построения.
-
Разработать принципы соотнесения морфологической модели и словаря.
-
Разработать систему классов словоизменения для русского языка.и таблицы окончаний.
-
Дать мнемонические обозначения каждому словоизменивель^ ному классу, такие, чтобы пополнение и коррекция словаря ьє тре бовали от его составителя специальных знаний в области автомати ческой переработки текстовой информации.
5» Построить морфологический словарь с использованием разработанной классификации и мнемоники.
Материалом исследования послужил "Грамматический словарь" А.А.Зализняка.
Предмет исследования - русская морфология в аспекте построения системы словоизменения, учитывающей парадигматику всех час тей речи я ориентированной на машинную реализацию.русского морфологического синтеза. В качестве методики исследования был использован метод лингвистического моделирования с проверкой на ЭВМ.
Научная новизна исследования заключается в том, что в немг I) выявлены и изучены различия между промышленными я эксперимен тальными СМИ в морфологическом аспекте и сформулированы требова ния к морфологическому компоненту промышленных СМП} 2) разрабо» таны принципы кодирования словоизменительных классов, позволяющие пользователю, не имеющему специальной подготовки, заносить в словарные статьи непротиворечивые сведения о морфологических особенностях любого слова, 3) на основании этих принципов разработана система мнемонических обозначений для словоизменительных классов русского языка; 4) делается попытка осмыслить и . обобщить все лучшее, что накопила теория и практика машинного перевода, что в целом должно обеспечить высокую эффективность морфологического компонента.
Практическое значение исследования. Разработанная в диссертации система классов словоизменения с их мнемоническими обозна'
чениями,-таблицы окончаний, русский морфологический словарь объемом около тридцати тысяч словарных статей и система автоматического синтеза статей словосочетаний составляют морфологический компонент СМИ ЛИНГРАН, разрабатываемой в ВЦП а внедрены в СМИ АВРАЛ, работающую в промышленном рекиме.
Апробация работы. Основные положения диссертации и результаты исследования излагались в докладах на Международной конференции "Теория и практика научно-технического перевода" (1985 г») и на ІУ Международном.семинаре по машинному переводу "ЭВМ и перевод -.89" (1989 г.)о
Структура работы. Диссертация состоит из введения, трех глав, заключения, а такае четырех прилоаений и библиографии.