Введение к работе
Актуальность работы. Применение компьютеров в клинической медицине до настоящего времени наталкивается па ряд проблем, носящих как объективный, так и субъективный характер. Одной из них остается проблема наиболее полного и быстрого обеспечения спсциалист'ов медицинской информацией. В силу сложности и неоднозначности представления данных в соответствующих документальных массивах, процесс их переработки несомненно следует рассматривать как творческий акт взаимодействия потребителя информации с ее источником. Тем не менее возможности современных ЭВМ могут быть использованы н подобной ситуации для моделирования некоторых закономерностей чтения специалистами научной и технической литературы. Соответствующая технология получила название гипертекстовой. При этом подразумевается, что процесс чтения состоит в мысленном расчленении печатной работы на отдельные относительно самостоятельные смысловые блоки и прослеживании связей между ними, опираясь на какие-либо неформальные, полезные для потребителя информации в данный момент критерии. Таким образом, если предоставить пользователю доступ к сети объединенных перекрестными связями фрагментов текста и структурированных данных (гипертексту) и возможность обрабатывать ее, то есть строить на ее основе различные линейные тексты, двигаясь от одного узла сети к другому, то можно отчасти решить проблему быстрого поиска сложно организованной и представленной преимущественно па естественном языке медицинской информации.
Естественно, что разработка гипертекстовой системы в конкретной области и для конкретного употребления требует на первоначальном этапе ее концептуального оформления, в виде обоснованных на фактическом материале предложений о типах узлов сети, хранящих те или иные сведения по тематике выбранного научного направления, типах связей между ними, способе
навигации в достаточно сложном гипертекстовом пространстве, методе выделения подструктур сети и т. п. Ответить на подобные вопросы можно только после тщательного анализа потока научно-технической документации на макро- и микроуровне, отделения главного от второстепенного в выявленных закономерностях и уяснения специфики данной предметной области.
Цель и задачи исследования. Целью работы является наукометрический и структурный анализ документального информационного потока (ДИП) в одной из традиционных областей клинической медицины — дерматологии — и выработка на основе полученных данных концептуального подхода к организации медицинского гипертекста.
В соответствии с поставленной целью работа посвящена решению следующих основных задач:
структурно-динамическому по Е. В. Стась и статистическому анализу ДИП по дерматологии для установления качественных и количественных особенностей развития данной тематической области на современном этапе;
терминологическому и композиционному анализу текстов научно-технических публикаций с целью выделения наиболее употребительных медицинских и прочих понятий и определения структуры документов с учетом их внутренних и внешних взаимосвязей;
выработке на базе полученных данных специфической концепции медицинского гипертекста, позволяющей перейти на очередном этапе к формированию системы поиска информации в подходящей аппаратно-программной среде.
Методы исследования. В диссертационной работе применялись методы математического моделирования и статистики.
Научная новизна. В работе получены следующие научные результаты:
— осуществлен структурно-динамический анализ по
Е. В. Стась системы ДИП по дерматологии на современном эта
пе, на основе которого получены данные о качественных особен
ностях ее развития на выделенном временном промежутке и ус
ловиях перехода системы из одного состояния в другое;
проведено статистическое исследование ДИП в той же тематической области, выделены наиболее бурно развивающиеся в настоящее время научные направления, определены тенденции их дальнейшего развития;
получены данные по терминологическому анализу массивов отечественных и зарубежных документов по дерматологии, произведено их сравнение, установлены классы наиболее упот-
ребительпых понятий, а также различия в их употребительности и наиболее вероятные причины этих различий;
проанализирована композиционная структура и структура связей наиболее распространенных видов публикаций в данной области медицины, что позволило выделить основные типы смысловых фрагментов текстов журнальных статей различной тематики и соотнести их с таковыми патентных описаний, определить относительный вес каждого в общей структуре текста, а также типы и относительный вес связей между фрагментами и публикациями в целом;
на базе полученных данных предложены перечни основных типов узлов н связей медицинского гипертекста, концептуальная схема целостной гипертекстовой сети, способ определения степени узла для облегчения навигации в сложном гипертекстовом пространстве и прокладывания маршрута в нем, метод выделения подструктур сети, некоторые виды операций п пей; произведена оценка объемов внешней памяти, требующейся для хранения текстовой и структурированной информации в данной тематической обасти.
Практическая ценность. Полученные и работе результаты позволяют:
рационально осуществлять управление формированием информационных массивов автоматизированных систем в выделенном научном направлении, группе направлений или тематической области в целом, ориентируясь на входные и выходные характеристики системы ДИП;
совершенствовать лингвистическое обеспечение систем на основе данных анализа терминологической лексики;
разрабатывать экспериментальные версии гипертекстовых систем, опираясь па предложенную концепцию медицинского гипертекста и способов работы с ним.
Реализация результатов исследования. Результаты наукометрического анализа ДИП по дерматологии внедрены в виде 2 информационных писем в 7 учебных, научных и практических учреждениях Российской Федерации, в том числе в городах Москве, Ижевске, Самаре, Казани и других.
Апробация работы. Содержание работы, основные выводы и результаты докладывались: на заседании кафедры патентной информации и систем поиска Института промышленной собственности и инноватики Комитета по патентам и товарным знакам Министерства науки, высшей школы и технической политики РФ (1989 г.), на научном семинаре кафедры информатики Российского государственного гуманитарного университета того же министерства (1991 г.), на ученом совете Нижегородского
научно-исследовательского кожно-вёнерологического института Министерства здравоохранения РФ (1992 г.).
Публикации. По теме исследования в НПО «Союзмедин-форм» депонировано 4 рукописи общим объемом 2,5 печатных листа.
Объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы. Работа содержит 104 страницы машинописного текста, список литературы включает 44 наименования.