Введение к работе
Настоящая диссертация посвяшена теоретическим и практическим вопросам разработки лингвистического обеспечения (ЛО) информационных сетей, конкретно автоматический и автоматизированным средствам взаимодействия с лингвистической базой данных (ЛБД). Для обозначения этих средств в диссертации используется термин "лингвистические процессоры".
Актуальность исследования лингвистических процессоров (ЛП) определяется рядом Факторов. Наиболее важными из них являются тенденции развития отечественной информатики.
за последние десять лет в связи с внедрением новых информационных технологий обработки и поиска информации (автоматическое индексирование, обмен информацией в сетях, использование полнотекстовых БД) значительно расширились наши представления о видах языковых средств в ИПС. Появились новые языковые средства - естественный язык, обьектографический язык, различного рода операционные языки (языки обшения с СУБД) и т. п. , сформировалось представление о лингвистическом банке данных (ЛБД) АС как машиночитаемом хранилише языковых средств системы, обеспечивающем единство лексической информации, а также единство процедур, обеспечивающих их ведение и эксплуатацию.
Кроме того, в настоящее время идет активная интеграция понятий об отдельных видах информационных систем в единое
представление на базе такого понятия как "базы (банки) данных". В связи с этим Форнируется и представление о единой ЛО баз (банков) данных и УІБЛ как его компоненте. В практике создания информационных систем этот процесс находит отрахение в том, что расширяется сфера использования УШД, включая кроме традиционных АСНТИ разновидности АСУ, САПР, экспертные системы.
Обмен информацией в сетях, а также обмен БД на ИЛ, ведет к тому, что возникают распределенные или интегрированные БД большого объема, комплектуемые как за счет систем, входящих в сеть, так и за счет разнообразных внешних источников.
Как для распределенных БД в сетях, так и для интегрированных БД важнейшей задачей становится обеспечение информационной и лингвистической совместимости БД, входящих в распределенную или интегрированную БД.
Одним из направлений, обеспечивающих лингвистическую совместимость, является использование единых внутрисистемных языков.
Примерами таких сетей являются АСНТИ "Электротехника", "Реферат" и ИИАС, в рамках которой разрабатывалась практическая часть диссертации.
Очевидно, что для систем указанного типа жизненно важными являются проблемы, связанные с разработкой автоматических и автоматизированных средств создания и ведения языков системы, а также вопросы, связанные с автоматическим преобразованием внешних БД, представленных на внешних, по отношению к системеt языках.
С другой стороны, отечественная информатика находится сейчас в таком периоде развития, когда осуществляется массовое внедрение персональных компьютеров в различные сферы деятельности. В этих условиях огромное число необученных
пользователей получает возможность обращения к различным базам и банкам данных. Это ставит проблему создания удобных интерфейсов - диалоговых систем общения конечного пользователя как непосредственно с тематической БД. так и с ЛБД, ее обслуживающей.
Кроме того, круг явлений, которые мы в рамках АСНТИ предлагаем обозначить термином "ЛИ", не исследован в теоретическом плане. Это обстоятельство является еше одним Фактором, определяющим актуальность исследования, проведенного в диссертации.
Таким образом, актуальность темы диссертации определяется такими тенденциями и потребностями развития отечественной информатики как:
появлением новых представлений о едином ЛО баз и банков данных и необходимостью их теоретического обобщения;
расширением сферы применения ЛБД;
разработкой /10 для информационных сетей, функционирующих на основе лингвистической совместимости ее звеньев;
разработкой удобных диалоговых систем общения с ЛБД и тематической БД.
Цель настоящей работы - создание нетодологии проектирования ЛП. базирующейся на специально разработанной типологии ЛП, и ее экспериментальная отработка в ходе проектирования комплекса взаимосвязанных ЛП, обеспечивающих все функции ЛБД НИАС.
Методика проведения диссертационного исследования включает следующие методы:
анализа существующего опыта в типологии и практических разработках лингвистических процессоров;
-Б-
применения теоретических результатов в проектно-конструкторских разработках;
разработки содержательных алгоритмов.
Научная новизна работы заключается в том, что впервые систематизировались представления о лингвистических процессорах как части лингвистического обеспечения АСНТИ. В результате систематизации предложена первая типология ЛП АСНТИ. На базе типологии ЛП АСНТИ разработана методология построения ЛП в рамках АСНТИ.
Предметом исследования в диссертации являются средства взаимодействия с ЛБД АСНТИ (лингвистические процессоры), их типология и проектирование в условиях взаимодействия информационных центров.
Практическая значимость работы заключается в том, что создан ряд промышленных программных средств пакетного и диалогового типов (по нашей терминологии - "ЛП"), с помощью которых задачи обработки лексики в НИАС решаются оптимальным образом.
Автор диссертации занимался разработкой модальной части ЛП - сценариев диалога, включая алгоритмы обработки.
Разработанные ЛП находятся в промышленной эксплуатации с 1985 года.
За это время с их помощью созданы:
терминологический словарь НИАС объемом 150 тас. ЛЕ;
фактографический словарь объемом 10 тыс. ЛЕ.
Апробация работы. Основние положения диссертации докладывались автором на IV Всесоюзной конференции "Проблемы автоматизированной обработки научно-технической информации" (Суздаль, 1964 г. ), XV и XVI всесоюзных научных семинарах "Системные исследования ГАСНТИ" (Рига, 1965 г., Ярославль,
-е-
1987 г.). Межотраслевом научном семинаре "Проблемы автоматизированной обработки информации (Москва, 1985 г. ), V Межотраслевой конференции молодых ученых ЕСНТИ (Москва, 1987 г. ). всесоюзной конференции "Базы производственно-экономических данных межотраслевого применения" (Суздаль. 1990 г. >.
По теме диссертации опубликовано 9 работ, из них 3 статьи, остальные - тезисы докладов. Диссертация состоит из
введения, трех глав, заключения и приложений. Список литературы содержит 70 наименований.
Обший объем работы - 178 страниц, основной текст -144 страницы.