Введение к работе
Актуальность проблемы
Вопросы, сбора, хранения и обработки различной, в тШ~числе и документальной, информации являются ванныаи-составляющими геологических исследований и в значительной мере определяют возмояность успешного их проведения. Рассматривая отрасль под данным углом зрения, следует признать, что основной если не единственной ее продукцией является информация. Именно к этой категории ценностей, создаваемых человеком, долееы быть отнесены все получаемые геологами сведения о составе горных пород и руд, строении и истории развития отдельных регионов И ЗЄ!.'ЛИ 3 целом, закономерностях размещения, строении, размерах и условиях формирования месторондений п т.д. и- т.п., Создазтся эта информация, в значительной мере, путем рассмотрения под необходимым углоы-зрения и преобразования узе имеющейся, накопленной в ходе предшествующих исследований соответствующих объектов. Специфическими -чертами геологии, определяющими большие объемы накапливаемой информации являются размеры объекта исследования (Земля), разнообразие применяемых методов и средств его изучения , а также величина отрезка времени изучаемого геологами (4,0-4,5 млрд.лет). Специальными исследованиями установлено, что в ое-редине 80-х годов в Шре насчитывалось 5128 периодических изданий по геологии. Сотеягли тысяч измеряются количества еаегод- ' но производимых в стране анализов горных пород и руд, а такге результатов других видов их изучения: описаний в естественном залегании и горных выработках, лабораторного изучения их разнообразных свойств.
— У-
Обилие ее и насущная необходимость использования этой информации в повседневной работе геологов создавали и создают мощный социальный заказ на разработку различных ЩО используемых многочисленными абонентами, являющимися одновременно и генераторами информации. По-видимому не случайно именно в геологии получили широкое развитие информационно-поисзозые системы на кар-» тах с краевой, информацией, хорошо зарекомендовавшие себя при решении самых различных геологических задач. Раньше и шире, .чем в смеаншс горнодобывающих отраслях, появляются в геологии современные средства обработки. НГИ - автоматизированные .системы.
Актуальность темы диссертационной работы, в определенной степени.вытекает из той роли, которую играет в АСЖЙ ее линг-вивтическое обеспечение (ЛО), а такае специфики современного этапа развития автоматизированных систем обработки НГИ. ..
Подводя итоги десятилетнего периода проведения Есследова- . ний, по автоматизированной обработке информации з СССР A.H.'.fe- " хайлов, А.ИЛерный и Р.С.Гиляревскай писали, что: "оснознне проблемы создания'и соверпекстзозания АСБП1 имеют логико-семан- ', тическпй34' и социально-психологический характер". Несмотря на солидный возраст этого высказывания, оно не потеряло актуальности и в настоящее время. Доказательством язляется практика создания многочисленных АІШС з прозедппй с этого момента период времени. Ввод их в действие всегда созпадает с завершением работ по созданию главного элемента ЛО - информационно-поискового тезауруса.
Специфическими чертами текущего этапа развития АСНПІ являются широкое развитие практики проведения ретроспективных поиске ' Термины "семантическое" и "лингвистическое" (обеспечение) являются синонимами. В 70-х годах был более распространен первый из указанных вариантов, а с начала 80-х - второй.
-'А-
коз з крупных банках данные, в тої.: числе з рекпме теледоступа, а такяе широкое знедренпе персональных ЭЗ.М. Пользователи создают с их помощью разнообразные, в том числе л документальные, система. Успех реализации обеих операций в значительной і.:ере, определяется наличием праззи и пособий для создания эффективного ЛО систем различных рангов, тезаурусов высокой семантической силы, четких сразил формирования поисковых предписаний.
Цель работы
Глазными целями работы были:
-
Создание оптимального типового комплекса лингвистических средстз обеспечивающего эффективную работу крупной полпте-матической АСНП! отраслевого ранга, еозмоености быстрого ввода ее в действие и дальнейшего совершенствования.'
-
Разработка теоретического обоснования, приемов и средстз создания отдельных составляющих этого комплекса, а также типовых элементоз, которые могли бы быть использованы з других АСНГИ непосредственно или после незначительной модификации. Наиболее ванной задачей является создание КЇЇТ высокой семантической силы..-Для ее решения требуются эффективные правила и приемы выбора ключевых слов, их лексикографической обработки и установления менду еими парадигматических отношений.
-
Ликвидация иесоотзетстзия менду возможностями расширения поисковых предписаний в большинстве действующих в стране ІІШІ и требуемого для проведения эффективных информационных поисков по запросам специалистов-геологоз. Главной причиной возникновения указанного несоответствия в геологических АШЮ является обилие тер.миноз определяющих пространственное и временное положение объектов изучения и запросов.
— 3-
4.Определение оптимальных путей дальнейшего совершенствования отраслевой АСНГИ. Создание предпосылок, для ее развитая в плане лингвистического обеспечения.
Научная новизна работы
В диссертации иачонены результаты суммирования и анализа обширного опыта, накопленного в процессе создания и совершенствования ОАСНШ Мннгео СССР и сменных отраслей, а такае исследований в области теории информатики. Отдельные положения и выводы предыдущих исследований .были развиты и использованы для получения новых вывбдов и направлений использования. К их числу относятся:
применение фасетно-категориальной схемы для разработки типологии лексических единиц ИНГ, установления менду ниш парадигматических отношений, оптимизации процесса создания тезауруса; "'.--"""'.
пспользозание результатов изучения информационных потребностей абонентов'для совершенствования общей структуры АСНТИ, контроля полноте лексики ИНГ и ограничения глубины его иерархии:
- разработка толкового дескрипторного слозаря морфем
.. (смыслокесуцж частей слодннх слов);
К полностью оригинальным теоретическим разработка!!, азтора
прішадлеаат: -
- разграничение сфер использования дескрипторных п класси
фикационных языков. Область» обязательного использования первых
являются термины категорій! "Штерпя"; с помощью вторых успешно р<
иаются задачи передачи аспектов документов и запросов, относя
щихся к категорій! "Пространство" и "Время";
~h-
- разработка принципов создания и форм специализированных
.рубрикаторов "Пространства" и "Времени";
создание вариантов методики анализа геологической информации в АСЫГИ;
установление системной природы лингвистического обеспечения АСНТИ;
вывод формулы количественного определения семантической силы ИНГ.
Апробация работы
Основные пслскенпя работы докладывались и обсуждались в
І979-І99І гг. на Всесоюзных, межотраслевых конференциях и семіна
рах, з топ числе на: ^
симпозиуме "Диалоговые и фактографические системы информационного обслузивания. І.І., (Звенигород), 1979 г.
П Всесоюзной Еаучно-технической конференции. М., 1978 г.
- 17 Всесоюзной научно-технической конференции. г.Москва
(Суздаль), 1983 г. -
- П Всесоюзной конференции "Систешшй подход в геологии".
М., ШНГ, 1986 г.
- Всесоюзной конференции "Информатизация геологической отрасли". Суздаль, 1991 г.
Практическая реализация результатов
Комплекс лингвистических средств, перечисленных в табл.1, yse много лет (с 1985 г.) обеспечивает функционирование Отраслевой АСНТИ Ылнгео СССР. Все они созданы под руководством и при непосредственном участии автора, с использованием его теоретических разработок.
С помощью указанных средств были оперативно введены в действие новые специализированные и региональные центры Отраслевой системы (по гидрогеологии при ВСЕГИНГЕО, пос. Зеленый; по геофизическим методам поисков при институтах "йагеофизика" в г. Баку и "ВНИИгеофиэика" в Москве; региональные центры при ПГО Центргеология, Якутгеологая, Запсибгеология). В 1988 г. автором и руководимым, им небольшим коллективом была введена в промышленную эксплуатацию, модернизированная по его предложениям,система автоматического индексирования документов Скобки ОС ЕС с развитым комплексом лингвистических средств. Это кардинально улучшило технологические параметры и возможности комплектования ОАСНГИ, обеспечило совместимость всех входящих в ее состав ЧАИПС специализированных и региональных центров. Создание высокоэффективного Ж) и введение его в режим промышленной эксплуатации позволили начать решение ряда принципиально новых задач: организации и проведения наукометрических исследований, двуязычного индексирования документов, установления случаев дублирования геологических исследований.
Публикации по теме диссертации
Основные результаты полученные в процессе работ, послуживших основой диссертации, изложены в 30 публикациях /1-30/.
Структура и объем работы .
Диссертация состоит из вводной главы, содержащей общую ее характеристику, шести глав, заключения и списка литературы. Общий объем - 266 страниц. В тексте имеется 32 таблицы и 40 рисунков.