Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Климов Юрий Николаевич

Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства
<
Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Климов Юрий Николаевич. Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства : диссертация ... доктора технических наук : 05.25.05 / Климов Юрий Николаевич; [Место защиты: ГОУВПО "Российская академия государственной службы"].- Москва, 2009.- 315 с.: ил.

Содержание к диссертации

Введение

Глава 1. Проблема системного описания и формирования потоков научно-технической информации 15

1.1. Моделирование потоков научно-технической информации при планировании основных направлений развития технологических процессов 15

1.2. Прогнозирование развития технологических процессов для получения новых данных с учетом объективной неопределенности исходной информации 27

1.3. Методология анализа и генерации потока научно-технической информации в условиях развития новых технологических процессов 58

Глава 2. Системный анализ и обработка потоков научно-технической информации по тематическим областям 74

2.1. Системный анализ при обработке числа публикаций в потоках научно-технической информации по информатике 75

2.1.1. Моделирование и прогнозирование числа публикаций в потоках научно-технической информации в мировом информационном пространстве 75

2.1.2. Анализ, моделирование и прогнозирование числа публикаций в потоках научно-технической информации по промышленной экологии и охране окружающей среды 107

2.1.3. Моделирование и прогнозирование числа публикаций в потоках научно-технической информации по автоматике и вычислительной технике 115

2.2. Системный анализ при обработке числа публикаций в потоках научно-технической информации в энергетике 126

2.2.1. Исследование числа публикаций в потоках научно-технической информации и моделей их роста в базах данных по энергетике 126

2.2.2. Обработка и анализ информации по концентрации и рассеянию в потоках научно-технической информации 143

2.2.3. Обработка и анализ потоков научно-технической информации в условиях их старения 151

2.2.4. Моделирование и прогнозирование числа публикаций в потоках научно-технической информации по атомной энергетике 171

2.3. Системный анализ при обработке числа публикаций в потоках научно-технической информации по металлургии 179

2.3.1. Исследование числа публикаций в потоках научно-технической информации и моделей их роста в базах данных по металлургии 179

2.3.2. Обработка и анализ информации для выявления концентрации и рассеяния публикаций в потоках научно-технической информации по материаловедению и термической обработке металлов 182

2.3.3. Обработка и анализ числа публикаций в потоках научно-технической информации по материаловедению и термической обработке металлов в условиях их старения 184

2.3.4. Моделирование и прогнозирование числа публикаций в потоках научно-технической информации по металлургии 188

2.4. Системный анализ при обработке числа публикаций в потоках научно-технической информации в области нанонауки, нанома-териалов и нанотехнологии 192

2.4.1. Исследование числа публикаций в потоках научно-технической информации по нанонауке, наноматериалам и нанотехнологиям на основе Science Citation Index: моделирование и прогнозирование 192

2.4.2. Исследование потоков научно-технической информации по нанонауке, наноматериалам и нанотехнологии на основе отечественной библиографии: моделирование и прогнозирование 203

Глава 3. Реализация системного анализа научно-технической информации с использованием автоматизированных информационных систем 211

3.1. Применение моделирования и прогнозирования числа публикаций для анализа лингвистического обеспечения в металлургии и в атомной энергетике 211

3.2. Исследование отечественных автоматизированных информа ционно-поисковых систем 226

3.3. Реализация системного анализа при создании автоматизированных информационно-поисковых систем документального и фактогра фического типов по атомной энергетике 233

Основные результаты работы 286

Литература 289

Приложение

Введение к работе

Актуальность проблемы. Государственный оборонный заказ и деятельность организаций и предприятий оборонно-промышленного комплекса (ОПК) Российской Федерации предъявляют особые требования к федеральным органам исполнительной власти в отношении организации взаимодействия субъектов и объектов управления — подготовки и реализации решений в области обороны и безопасности страны, развития и воспроизводства ее военно-экономического потенциала. Важным фактом является зависимость эффективности управления от качества информационных ресурсов у лиц, принимающих организационные, программные, технические, технологические и правовые решения [25].

Контроль и надзор в сфере государственного оборонного заказа можно рассматривать как информационный контур в деятельности военно-промышленной организации государства, который идентифицирует имеющиеся в ней достоинства и недостатки независимо от других субъектов и объектов управления.

Передача в ведение Агентства Рособоронзаказа Федерального государственного унитарного предприятия (ФГУП) "ВИМИ" направлено на усиление этого важного для страны оборонного направления. Использование информационно-аналитического потенциала ФГУП "ВИМИ" и дальнейшее его развитие с адаптацией к научной среде мирового информационного пространства, к новым задачам должно быть тесно связано с экономикой, правовыми аспектами информатики, наукой и современными технологиями.

Вместе с тем, использование новых возможностей технологий в этой среде требует обеспечения совместимости информационных ресурсов, созданных в стране и в мировом информационном пространстве.

Использование объектов интеллектуальной собственности на основе выбранных приоритетов предполагает инновационный путь развития

экономики. В этом случае регистрация, учет и правовая охрана результатов интеллектуальной деятельности, в том числе получаемых при реализации государственного оборонного заказа, а также защита государственных интересов является главной задачей государственных заказчиков федерального и регионального уровней. Формы собственности, связанные с организацией введения в хозяйственный оборот результатов интеллектуальной деятельности, расширяют содержание информационных ресурсов федерального уровня.

В настоящее время произошли изменения в организации государственной регистрации и учете вновь начинаемых, ведущихся и законченных научно-исследовательских, опытно-конструкторских и технологических работ (НИОКР) по тематике военного, специального, двойного и гражданского назначения.

Поэтому предъявляются повышенные требования к специалистам, участвующим в решении задач экспертизы заявок и размещения заказов, а также к информационным ресурсам и системам, применяемым в обеспечении соответствующих процессов.

Однако имеются факторы, осложняющие устойчивое

функционирование больших информационных систем:

динамичные структурные преобразования органов государственного управления;

государственная политика в области науки и техники;

хозяйственная самостоятельность большинства научных организаций и предприятий; изменения в хозяйственной среде под влиянием законодательного регулирования;

тарифное давление естественных монополий;

политика повышения оплаты труда работников организаций и предприятий ОПК.

Как центральное межотраслевое звено системы научно-технической информации (НТИ) отраслей отечественной оборонной промышленности

ФГУП "ВИМИ" было создано в 1968 году. На ФГУП "ВИМИ" по Положению о государственной системе научно-технической информации, утвержденному Постановлением Правительства Российской Федерации от 24 июля 1997 года № 950, возложены функции формирования, ведения и организации использования федеральных информационных фондов, баз и банков данных (БД) по научно-исследовательским, опытно-конструкторским работам и результатам научно-технической деятельности оборонного комплекса, в целях комплексного информационного обеспечения разработок и производства в оборонной промышленности, а также для передачи и внедрения научно-технических достижений оборонной промышленности в другие отрасли экономики страны.

В ФГУП "ВИМИ" для обеспечения выполнения указанных функции созданы: межотраслевая информационная автоматизированная система (МИАС) и федеральный фонд первоисточников уникальной неопубликованной информации по результатам научных исследований и опытно-конструкторских разработок, выполненных организациями ОПК.

Эта система предназначается для сбора отечественной НТИ и комплексного информационного обеспечения специалистов и руководителей ОПК от уровня предприятий до уровня органов государственного управления при решении задач разработки и производства средств вооружения и военной техники и другой продукции ОПК.

Основными задачами системы МИАС являются:

формирование федеральных фондов, баз и банков данных НТИ по результатам научно-технической деятельности оборонной промышленности;

подготовка аналитических, сопоставительных и прогнозных сведений; комплексное информационное обеспечение предприятий и организаций оборонных отраслей промышленности; информационное обеспечение процессов формирования и выполнения федеральных целевых программ;

экспертиза, оценка и отбор НИОКР, продукции и услуг для включения в государственный заказ;

информационное сопровождение процессов создания сложной наукоемкой продукции;

отбор научно-технических достижений, технологий двойного назначения и их передача в другие отрасли экономики.

Основным источниками формирования БД МИАС являются сведения о
научно-исследовательских, опытно-конструкторских разработках,

технологиях, изобретениях и других данных, полученных по результатам научно-технической деятельности НИИ, КБ и на серийных заводах ОПК.

Потребность в прогнозировании, как части системно-семантической методологии анализа сложных процессов различной природы, возникает во многих областях человеческой деятельности: в науке, технике, экономике и т.д. В ряде случаев процедура прогнозирования сводится к предсказанию вероятностного процесса, определенного для дискретных моментов времени, порождаемого некоторой динамической системой.

При этом система понимается как совокупность человеко-машинных комплексов, объединенных обработкой НТИ, семантика выражает связь научно-технических текстов с их содержанием, а методология - есть нормированная информационная технология сложного человеко-машинного комплекса [191].

В настоящее время в отечественной и зарубежной литературе имеется значительное число публикаций (ЧП), в которых рассмотрены различные аспекты проблемы прогнозирования потоков НТИ (ПНТИ) в процессе создания перспективных технологий.

Теоретические основы прогнозирования случайных процессов статистическими методами с учетом обработки ПНТИ были заложены в работах отечественных ученых (С.А. Айвазян, B.C. Мхитарян, Е.М. Четыркин [1-2, 148, 192]) и зарубежных (Н. Винер, Р. Калман, Т. Андерсон [3, 27, 65]). Проблеме системного анализа в промышленности уделено

большое внимание в трудах В.Д. Ивченко, Я.Л. Львовича, С.Н. Музыкина,
Б.Н. Никульчева, Б.И. Рабиновича, М.Н. Сорокина. При этом

методологические принципы анализа-синтеза потока НТИ были представлены в трудах отечественных ученых: Ю.М. Арского, Г.Т. Белоногова, Р.С. Гиляревского, В.И. Горьковой, И.В. Маршаковой, А.А. Полтева, И.И. Попова, В.А. Цветковой, А.И. Черного, Ю.И. Шемакина [19-20,60-61, 134-136, 146-147, 152-153, 158-160].

Большинство известных методов обработки информации применяется для прогнозирования динамических систем. В ряде публикаций последних лет предлагается использовать перспективные для решения задачи прогнозирования ПНТИ кумулятивные методы анализа данных. Однако в этом случае предполагается, что ПНТИ - системно-семантическая категория, которая может быть описана нелинейной моделью.

В большинстве случаев генерируемые ПНТИ представляют собой сложные системы, прогнозирование которых в условиях отсутствия или неполноты знания о структуре потока НТИ при помощи существующих методов обработки информации часто не позволяет получить приемлемые результаты. Известные методы обработки информации, используемые для прогнозирования, не в полной мере учитывают многоаспектность требуемых знаний в ПНТИ. Это приводит к снижению качества прогнозирования.

Поэтому актуальной научной проблемой, имеющей важное теоретическое и практическое значение, является:

разработка семантической методологии удовлетворения информационных потребностей в знаниях специалистов при создании новой техники на базе мирового универсума и ее реализации;

создание лингвистического обеспечения отраслевой, межотраслевой и Государственной систем научно-технической информации.

Повышение эффективности применения информации при анализе ПНТИ в процессе создания перспективных технологических решений

основано на одновременной разработке приемов и методов комплексного учета количественных и качественных характеристик ПНТИ.

Автором решена крупная научная проблема, имеющая важное народно-хозяйственное значение в области информационного обеспечения инновационной деятельности предприятий и организаций оборонно-промышленного комплекса.

Объект исследования: ПНТИ в среде мирового информационного пространства и информационное обеспечение создания новой техники.

Предмет исследования:

Реальные потоки ПНТИ в среде мирового информационного пространства.

Лингвистическое обеспечение отраслевой, межотраслевой и Государственной систем научно - технической информации.

Информационное обеспечение разработчиков новой техники на основе отраслевой и межотраслевой систем научно-технической информации.

Цель и основные задачи исследования. Цель исследования -разработка качественного и количественного анализа ЧП в ПНТИ для формирования входного и выходного потоков в БД МИАС, для создания перспективных технических решений и получения нового знания на основе системной методологии.

В соответствии с поставленной целью в диссертации решены следующие задачи:

1. Исследование современных подходов системной методологии анализа
входных и выходных потоков в БД МИАС по кумулятивному ЧП в ПНТИ в
среде мирового информационного пространства.

2. Анализ закономерностей кумулятивного ЧП в информационных
макро- и микропотоков, относящихся к ОПК.

3. Создание лингвистического обеспечения документальных
информационно-поисковых и информационно-фактографических систем
для проведения анализа мировых информационных потоков в процессе

выявления и разработки перспективных научных направлений, в частности БДМИАС.

4. Практическая реализация системной методологии анализа кумулятивного числа публикаций в ПНТИ в процессе создания перспективных технологий и новых знаний.

Методы исследования - методы системного анализа, математической статистики, математического моделирования, принятия решения и обработки информации.

Научную новизну определяет системная методология анализа входных и выходных ПНТИ, инвариантная к тематическим областям.

Научные результаты, полученные лично соискателем и имеющие научное значение:

Системный анализ и обработка числа публикаций в ПНТИ по информатике, промышленной экологии, охране окружающей среды, автоматике, вычислительной технике, радиоэлектронике, атомной науке и технике, металлургии, нанонауке, наноматериалам и нанотехнологиям.

Лингвистическое обеспечение для созданных автоматизированных информационно-поисковых систем отраслевого института, отраслевой и межотраслевой систем НТИ.

Практическая реализация системной методологии анализа кумулятивного ЧП в потоках информации при выявлении и создании перспективных технологий и новых знаний.

Разработка стандартов в области информационного обеспечения курируемых промышленных предприятий, системы информационного обеспечения предприятия и патентно-информационных исследований.

Достоверность научных положений, рекомендаций и выводов Обоснованность научных результатов, выводов и рекомендаций, изложенных в работе, определена корректным применением методов

системного анализа, математической статистики, моделирования,

прогнозирования, принятия решений, обработки информации и управления.

Достоверность положений и выводов диссертации подтверждена 35-летними практическими работами по формированию реальных ПНТИ и положительными результатами внедрения на предприятиях, организациях и в учебном процессе.

Теоретическая значимость исследования состоит в разработке автором методологической базы системных анализа и обработки входного и выходного потоков БД МИАС ФГУП "ВИМИ", их моделирования, прогнозирования и информационного обеспечения потребителей оборонной промышленности.

Практическая значимость исследования

Существенно расширены возможности количественных методов решения задач моделирования и прогнозирования. Разработанные на основе системного анализа-синтеза и обработки ЧП в виде реальных ПНТИ в ОПК научные результаты диссертационной работы доведены до практического применения, что существенно расширяют возможности компьютерных методов решения задач прогнозирования.

Это позволило разработать и внедрить методы моделирования и
прогнозирования во Всероссийском научно-исследовательском институте
неорганических материалов им. А.А. Бочвара, во Всероссийском институте
межотраслевой информации и в Российской экономической академии им.
Г.В. Плеханова. Созданы нормативно-технические документы по информа
ционному обеспечению металловедов и материаловедов в режиме
избирательного распределения информации и проведению патентно-
информационных исследований. Разработаны и внедрены
автоматизированные информационные поисковые системы (АИПС) в
отраслевом институте по отчетам НИОКР в области: автоматики,
телемеханики, программного обеспечения, информатики, атомной
энергетики (материаловедения, ядерного топлива, тепловыделяющих

элементов, конструкционных материалов, сверхпроводимости, сверхпластичности), промышленной экологии и металлургии. Создано лингвистическое обеспечение информационных систем (тезаурусы, классификаторы, рубрикаторы) для обработки и анализа НИОКР.

Реализация результатов работы. Теоретические и практические результаты диссертации получены автором при выполнении ряда федеральных целевых программ и планов научно-исследовательского ГНЦ "Всероссийский научно-исследовательский институт неорганических материалов им. акад. А.А. Бочвара", ФГУП "ВИМИ", ООО "Стройпроект-сервис", ООО "Строй Тэк", ООО "Инжстрой - плюс", ООО "Ластком", ООО "БизнесСтройИндустрия", "Стройиндустрия", ООО "Альянс Академ" и в Российской экономической академии им. Г.В. Плеханова. Некоторые полученные способы, вещества и устройства по атомной науке и технике защищены авторскими свидетельствами в ГНЦ "Всероссийский научно-исследовательский институт неорганических материалов им. А.А. Бочвара". Научные и практические результаты применены в учебном процессе в Российской экономической академии им. Г.В. Плеханова.

Апробация работы. Основные научные результаты и положения докладывались и обсуждались на семинарах, совещаниях и научно-технических конференциях: 4-е отраслевое совещание по научно-технической информации и пропаганде (Обнинск, 1975); совещание по организации и исследованию валютных журналов (Москва, 1976); совещание по использованию отчетов НИОКР (Силламяэ, 1977); совещания по изготовлению ядерного топлива (Москва, 1977, 1979); международная конференция по реакторному материаловедению (Алушта, 1978); 4-е отраслевое совещание по созданию и развитию автоматизированной системы НТИ (Обнинск, 1979); выставка - смотр "НТИ-80" (Москва, 1980); 5-ое и 6-ое отраслевое совещание по НТИ (Обнинск, 1981, 1986); 14-й международный семинар стран-членов СЭВ по фактографической информации в области атомной науки и техники (Юрмала, 1988); всесоюзное

совещание специалистов в области НТИ (Москва, 1989); международные конференции "НТИ-2000", "НТИ-2002" и "НТИ-2007" (Москва, 2000, 2002, 2007); международные научно-практические конференции "Производство -технология - экология" ПРОТЭК (Москва, 2002, 2003, 2004, 2005, 2006, 2007); отраслевое совещание по вопросам использования ресурсов развития национального центра ИНИС "Перспективы использования предприятиями отрасли русскоязычных средств обработки информации применительно к задачам сохранения знаний и кодификации научных публикаций и фактографических данных" (Москва, 2003). На "НТИ-80" автоматизированные информационные системы ГНЦ ВНИИНМ им. А.А. Бочвара удостоены серебряной и тремя бронзовыми медалями ВДНХ СССР. В 2007 году за доклады в области нанонауки, наноматериалов и нанотехнологии и динамики публикаций по химии диссертант стал дипломантом международной конференции "НТИ-2007".

Публикации. По тематике диссертации опубликовано 109 научных и учебно-методических работ: две монографии, 14 учебно-методических разработок, 84 статей, в том числе 51 (21 статья по информатике) - в изданиях, рекомендованных Высшей аттестационной комиссией Министерства образования и науки Российской Федерации для публикации результатов исследований докторских диссертаций - объемом 118,0 п.л. (общий объем 217,0 п.л.), три стандарта, четыре тезиса докладов, два авторских свидетельства. Это представляет собой вклад диссертанта в проблематику диссертационного исследования.

Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы из 222 наименований. Общий объем диссертации 311 страниц.

Прогнозирование развития технологических процессов для получения новых данных с учетом объективной неопределенности исходной информации

Наличие огромных объемов НТИ, результатов многолетнего практического опыта исследователя, традиционных средств и методов исследования конкретных наук в настоящее время является недостаточным для создания перспективных технологий [35, 43, 45, 69, 76-77, 91].

Современное понимание прогнозирования рассматривается как специфический вид опережающего отображения - формой взаимодействия объектов, процессов, при котором отражаемый объект сохраняет качественную определенность, создавая специфический продукт [4].

Прогнозирование хода событий, выдвижение гипотез учеными и планирование их деятельности опирается на знание закономерностей, зафиксированных в обобщенной форме в системе знаний, в знаках и знаковых системах.

Гипотеза используется при поиске и принятии решений в сфере наглядно-образного и практического интеллекта. Формирование гипотез в области практического интеллекта с использованием ПЭВМ (или при моделировании этого процесса) доведено до уровня практической реализации. Изучены и некоторые другие методы автоматического формирования гипотез (например, методы, родственные методам распознавания образов).

В решении задач с неопределенными условиями роль гипотез состоит в поиске условий. Решение на ПЭВМ этих задач требуют применения семантических знаний и логических исчислений. Когда во всех строках плана оказываются заполненными реквизиты, появляется полный состав тематики для прогноза. По отношению к выделенным событиям предстоит предсказать временные интервалы их наступления и дать причинно-логическое обоснование. Таким образом, определяют элементы прогноза, который может быть оформлен в виде текста сценария прогнозируемых событий.

В условиях функциональной специализации в планировании и прогнозировании принимают участие специалисты разного профиля: плановики и прогнозисты. Работа по составлению сценария не свойственна плановикам, умеющим строить сложные структуры волевых процессов. В предметных различных областях сценарий прогноза составляют специалисты другого рода: синоптики, политологи, сейсмологи и т.п., способные предвидеть возможность наступления событий и условий, влияющих на выполнение плана.

Ознакомившись с объективно составленным сценарием-прогнозом развития обстановки, плановики могут пересмотреть план и заменить некоторые его строки альтернативными. Но эти вновь сформулированные строки плана тоже содержат показатели. Процедуры прогнозирования повторяются, но в гораздо меньшем объеме, после чего могут последовать еще менее значительные коррекции плана и т.п. Этот процесс согласования плана и прогноза, продолжается как стационарный на этапе реализации плана, когда требуются коррекции плана и прогноза по совершающимся фактам. Является общепризнанной необходимость учета результатов прогнозов при составлении планов, а данных планов - при разработке прогнозов.

Однако при реализации этого требования возникает много проблем, связанных с различиями в понятийном аппарате прогнозирования и планирования. Эти различия обусловлены нетождественностью целей, выдвигаемых в указанных процессах.

Существует реальная избыточность в терминах, понятиях и определениях, которая полезна в определенном смысле. Подобное явление имеет место при определении понятий прогнозирования и планирования. Обычно их представляют как последовательные фазы общего процесса управления. Но это оно не отражает всей многогранности указанных процессов и их взаимосвязей. При составлении плана и выборе соответствующего способа действия нередко возникает потребность в выполнении прогностических работ. Поэтому планирование и прогнозирование можно рассматривать как фазы управления и как виды управленческой деятельности.

Прежде, чем перейти к проблеме прогнозирования технологических процессов, рассмотрим его место в системе управления, с точки зрения информатики.

Управление - особый вид взаимодействия человека с окружающей средой, включающий формирование цели, планирование некоторых операций для ее достижения и осуществление. При этом цель определяет результат воздействия, а управление - принятие решения на основе полученной информации и его реализации путем выполнения определенных действий. Система информационного обеспечения передает органу управления сведения для формирования целей и программ управления, а также данные о состоянии управляемых объектов и окружающей среде. Оно основано на преобразовании исходной информации и выступает как отражение окружающей среды, потребности и цели самой системы [22, 36-37,41,54,57].

В этом случае имеющаяся информация требует переработки и приводит к сравнению и оценке действительного и целевого состояния системы, конечным результатом которого является новая информация, необходимая для принятия решений, ведущих к положительному конечному результату в процессе управления. Процесс управления состоит из четырех блоков: прогнозирование, планирование, принятие решений, контроль и регулирование. Прогнозирование - есть формирование целей планирования. При этом нормативное прогнозирование состоит из объективной и субъективной составляющей. Следующим этапом является принятие решений.

Наличие множества параметров при реализации технического решения затрудняет процесс прогнозирования. Это связано с разнокачественной оценкой параметров новых технологических решений. В этом случае необходимо разработать общие критерии, характеризующие перспективность научных направлений и конкурентоспособность создаваемых объектов. Следовательно, НТИ обрабатывают для прогнозирования. Процесс принятия решений является процессом выбора адекватной ситуации варианта из выделенных альтернатив, предполагающий возможность их разрешения по степени различения.

Так как прогнозирование связано с количественными изменениями, то они описываются элементами общей теории статистики. Перейдем к общим закономерностям и представлениям данной теории.

Системный анализ при обработке числа публикаций в потоках научно-технической информации в энергетике

Состояние проблемы представлено в литературном обзоре следующих основных работ [71, 78, 91, 95]. В настоящее время оживились исследования свойств и закономерностей НТИ как составной части социальной системы научной коммуникации. Постепенно выявляются общие закономерности внутренней связи научных изданий и научных исследований, а также количественные зависимости между ЧП и показателями роста науки. Соотношение между продуктивно и непродуктивно работающими авторами подчиняется зависимости между продуктивными и непродуктивными журналами и публикациями с определенным числом ссылок.

Приведенное распределение показывает, что большинство авторов за всю жизнь публикует лишь одну или две статьи, тогда как небольшая группа авторов отличается плодовитостью - по несколько десятков или даже сотен работ. Прекращают выходить в свет издания с периодичностью до двух номеров в год, тогда как небольшое число периодических изданий составляет основную долю всех публикуемых статей. Около половины опубликованной НТИ создана таким числом авторов и опубликована в таком числе журналов, которые составляют квадратный корень из общего их числа. Если в мире выходит 30x103 журналов по естественным, точным и прикладным наукам или в какой-либо стране имеется 106 научных работников, то 175 журналов и 103 ученых создают 50% всей НТИ, а по актуальности содержания - 70-80%.

В настоящее время важными закономерностями развития НТИ являются закономерности роста, старения, концентрации и рассеяния научных публикаций.

Стабильное увеличение числа появляющихся периодических и продолжающихся изданий характеризует рост НТИ. Рост отдельных видов НТИ измеряется числом ежегодно выпускаемых изданий. Этим примером являются крупные научные библиотеки, комплектующие НТИ по широкому профилю и выполняющие функции архивного хранения.

Известный график Прайса иллюстрирует экспоненциальный рост кумулятивного числа названий лсурналов, включая издания, прекратившие свое существование. Если определять рост научной литературы по числу ежегодно выходящих изданий, то он характеризуется не геометрической, а арифметической прогрессией.

Два фактора: увеличение ассигнований на научные исследования и увеличение численности ученых оказывают влияние на рост НТИ. При этом необходимо учитывать, что все большая часть средств, выделяемых на научные исследования, расходуется на оснащение исследований сложной и дорогостоящей техникой. В настоящее время усиливается коллективность в науке, которая характеризуется увеличением среднего числа авторов на одну публикацию. В последнее время происходит рост ЧП двух, трех и более авторов и снижение ЧП одного автора.

От этих причин рост НТИ происходит медленнее, чем увеличение ассигнований на развитие науки и рост числа научных работников. При этом стоимость научного исследования возрастает пропорционально квадрату числа всех занятых ученых, а выход научного продукта увеличивается лишь пропорционально квадратному корню из этого числа.

Рассмотрим модели и динамические характеристики роста ЧП в ПНТИ [38]. В НТИ по наукометрии, библиометрии, информетрии дискутируется вопрос об экспоненциальном росте ЧП. Многие исследователи, представляя науку как единую систему и, отмечая экспоненциальный рост ЧП в ПНТИ, подразумевают не рост числа документов, а рост самого знания в соответствии с законом, управляющим накоплением знаний.

Рост ЧП характеризуется функцией распределения ПНТИ во времени, аппроксимируемой экспонентой S(t) = a-Qbt, где S(t) - поток публикаций в момент времени t, а — поток публикаций в начальный момент времени -начало отсчета (год) временного периода; b - эмпирический коэффициент.

В этом случае каждый элемент ПНТИ способствует появлению с постоянной скоростью новых элементов. В экспоненциальной зависимости эмпирический коэффициент скорости роста Ъ является коэффициентом ежегодного приращения элементов b = In (S(t)/S0)/t, при b = const и t = 1,2,..., ,tn, где t — число элементов в начальный момент времени, S0 = а при t = 0.

В ряде случаев обосновано применение этой модели. При любых вариантах исследований ПНТИ зависимость роста ЧП и других элементов ПНТИ (наименований журналов, авторов, цитирований публикаций и их авторов, рефератов и т.п.) по экспоненте не наблюдается. На параметры роста элементов ПНТИ влияют следующие факторы: число журналов, трудов, книг по тематическим направлениям, качество, объемы и язык публикаций, доступность изданий, стоимость, тираж и т.п.

При снижении ежегодного прироста элементов ПНТИ применяется логистическая зависимость, что обусловлено научными связями ученых. Для этой зависимости характерна -образная кривая. Для вычисления снижения ежегодного приращения ЧП в ПНТИ используется логистическая зависимость вида S(t) = к/(\ + a-e bt), где к — предельное значение числа элементов ПНТИ.

Предлагают проводить расчет нового значения исходного числа элементов ПНТИ для логистической зависимости совмещением двух функций - экспоненты и логисты - при Ъ = const корректировкой начального потока элементов экспоненты So.

Исследование отечественных автоматизированных информа ционно-поисковых систем

Исследования методологических основ создания АИПС и АФИПС для проведения анализа кумулятивных документальных ПЯТИ, выявления и создания перспективных технологических решений предполагали дальнейшее развитие комплексной системы информационного обеспечения и сопровождения технологической цепочки создания объектов новой техники на основе проведения следующих работ: создание лингвистического обеспечения для АИПС и АФИПС на основе информационного анализа лексики тематического направления исследований и проблемных разработок; разработка, внедрение и эксплуатация АИПС по непубликуемым документам "Документ-1"; проведение тематических поисков НТИ, прототипов и аналогов объектов новой техники, способов, веществ и устройств для выявления и создания перспективных технических решений.

Лингвистическое обеспечение поиска НТИ в АИПС осуществляют с помощью разработанных тезаурусов, классификаторов и рубрикаторов [12, 32, 71, 97, 166-167], а также базовых тематических словарей системы (БТСС).

Общее между этими видами лингвистического обеспечения состоит в их применении для поиска и индексирования входного ГШТИ в АИПС, а различия - в структуре.

Известно, что тезаурус содержит дескрипторные статьи, построенные на родо-видовых, видо-родовых и других типах отношений. Термины имеют ссылки типа смотри, выбери более узкий термин и т.п. При применении тезауруса может создаваться кольцевая структура, в которой осуществляется приписывание родственных терминов к уже имеющимся терминам, что создает дополнительные потери при поиске НТИ.

Помимо этого БТСС, в отличие от тезаурусов ИНИС, представлен систематическим перечнем всех понятий с иерархически фиксированной структурой родовидовых отношений. Причем нормирование терминологии осуществлялось фиксированным местонахождением понятия в общей иерархической структуре словаря, а в алфавитном перечне - упорядочением терминов специализированного тематического словаря.

До 1974 г. в атомной науке и технике не существовало тезауруса для АИПС. В 1974 г. созданный в ЦНИИАИ рубрикатор по атомной науке и технике [12] содержал недостатки, указанные для тезаурусов. Для БТСС ВИМИ на 12 заседаниях рабочих групп от отрасли было откорректировано 50 базовых тематических словарей. Только от ВНИИНМ было предложено около 3,5Т03 терминов, а от всей отрасли - около 104.

Базовый тематический словарь системы ВИМИ имеет полииерархическую структуру для координатного индексирования с однократным фиксированным местоположением термина и многократным его применением при индексировании и тематическом поиске.

Для качественного и оперативного обеспечения поиска непубликуемой информации во ВНИИНМ разработаны два тезауруса по ядерно-физическим методам контроля, применяемые в АИПС "Документ-1".

Результаты анализа структуры разработанного тезауруса показали его отличие по общему числу, по числу родовых и ассоциативных дескрипторов, а также числу дескрипторных связей. Полученные результаты анализа структуры тезаурусов в области атомной науки и техники приведены в табл. 3.1, где TV; - общее число дескрипторов; N2 - число родовых дескрипторов; N3 - число видовых дескрипторов; N4 - число ассоциативных дескрипторов; N5 -число дескрипторов без связей.

Видно, что структура тезаурусов по атомной науке и технике "МАТЕРИАЛЫ" ТАНТ-М и "РЕАКТОРЫ" ТАНТ-Р различна. Однако по кумулятивному числу видовых и ассоциативных дескрипторов они практически одинаковы (54,5 и 56,4%). По сравнению с тезаурусом ИНИС ТАНТ-Р и ТАНТ-М имеют меньшее число дескрипторов без связей. Созданный нами тезаурус по тепловыделяющим элементам и ядерному топливу (ТТЯТ) для узко тематического поиска отчетов НИОКР почти в 10 раз меньше Тезауруса научно-технических терминов (ТНТТ) [186] и более чем в два раза меньше тезауруса ТАНТ-М и в 1,5 раза меньше, чем ТАНТ-Р. Применение такого специализированного тезауруса облегчает задачи поиска НТИ и формирование входного и выходного ПНТИ по локальным направлениям науки и техники, что особенно важно при создании новых технических устройств и разработке принципиально новых технологических решений.

Близость изученных тезаурусов оценивается коэффициентом иерархии J [128]. Для изученных тезаурусов он составляет: JTHTT 3,18; JTAHT-M = 4,55; JTAHT-P = 4,36 и J-ггят = 3,36. Подтверждается близость между тезаурусами: ТНТТ, ТТЯТ и ТАНТ-М, ТАНТ-Р. Показателем эффективности тезаурусов является коэффициент синонимии S„. Расчет коэффициента синонимии для тезаурусов ИНИС представлен в табл. 3.2, где t - год издания тезауруса; D число принятых к употреблению дескрипторов; S„ - коэффициент синонимии). Полученный коэффициент синонимии Sfl составил S„ инис — 0,283- 0,340. Он плавно растет для указанных тезаурусов. Для тезауруса ТНТТ он составляет Sn= 0,22, S„ ттят= 0,23; S„ тлнт-м= 0,04 и Sn ТАНТ-Р = 0,15, что значительно ниже, чем для тезауруса ИНИС.

Реализация системного анализа при создании автоматизированных информационно-поисковых систем документального и фактогра фического типов по атомной энергетике

Основой АИПС является НТИ, которую генерируются в крупнейших научно-исследовательских центрах России: в ВИНИТИ, ВНТИЦ, ВИМИ, БЕН и т.п. [25, 47, 69, 78, 91, 169-170, 182]. В последнее десятилетие выходит большое число не только традиционных РЖ, но и в электронной форме. В указателе - "Directory of Electronic Journals Newsletters and Academic Discussion List" (7h ed., 1999) представлено более 3,4-103 изданий. В указателе периодических и продолжающихся изданий - "Ulrich s International Periodicals Directory" (37h ed., 1999) содержится 103,5-103 изданий. Из них 3,4-103 изданий - на CD-ROM. Однако только голландское издательство Reed Elsevier выпускает в печатной и электронной формах 1,2-103 научных журналов.

В США выпускается Current Contens по различным областям науки и техники: биология, сельское хозяйство, охрана окружающей среды, физика, химия, науки о земле, клиническая медицина, машиностроение, компьютерная технология, общественные и поведенческие науки, искусство и гуманитарные науки. В нем представлено 6,5-103 научных журналов. Библиографические бюллетени играют также важную роль: "Current Papers in Physics", "Current Papers in Electrical and Electronic Engineers" и "Current Papers in Computer and Control", которые выпускает INSPEC с 1966 года по настоящее время. Для информационного обеспечения потребителей создаются новые информационные технологии, которые оперативно публикуют оглавления научных журналов. Наиболее доступны - UN Cover (США, 1988 г. - по настоящее время) с объемом свыше 17-10 журналов; "Current Contens" (США, 1993 г. - по настоящее время) с объемом свыше 14-103 журналов; "Contens First" (США, 1993 г. - по настоящее время) с объемом свыше 11,5-103 журналов; "Inside" (Великобритания, 1993 г. - по настоящее время) с объемом свыше 14-Ю3 журналов и "Sweet Scan" (Нидерланды, 1943 г. - по настоящее время) с объемом свыше 14-103 журналов. Отбор релевантных журналов по точным и прикладным наукам по тематическим профилям ВИНИТИ проводят по электронной версии указателя "Ulrich s International Periodicals Directory" (33 - the ed., 1994-1995 гг.) на CD-ROM. В указателе каждый журнал представлен 42 стандартными признаками. Научную значимость периодики оценивали взвешиванием и интегрированием весов. По этой методике для РЖ ВИНИТИ составлена коллекция из 4,4-103 журналов из 147-103 публикаций и дополнена иностранной периодикой из SCI и Social Science Citation по информатике, психологии и экономике.

Сканированием число журналов для РЖ ВИНИТИ доведено до 5,6-103 наименований. Проблема поиска информации становится актуальной с появлением полнотекстовых БД. Проведение поиска НТИ по дескрипторам имеет невысокую точность выдачи. Это приводит к выдаче большого числа формально релевантных документов. Потребителю становится труднее отобрать для работы по фактической релевантности необходимые документы, что приводит к информационной перегрузке, которая становится серьезной проблемой. Поиск НТИ по всему документу повышает точность выдачи при учете других характеристик документов, например ссылки, имена, организации работы авторов и т.п. Вместе с этим информационные технологии связаны с внедрением эффективных методов автоматического индексирования и реферирования. Обсудив создание АИПС, перейдем к интегральным информационным системам (ИИС), в которых объединены специализированные системы или совокупность средств и методов однократной аналитико-синтетической переработки НТИ специалистами высокой квалификации, однократный ввод в ПЭВМ и многократное использование ИИС от подготовки БД до ретроспективного поиска. В ИИС ВИНИТИ хранятся следующие сведения: тип документов, заглавие, имена авторов, сведения о месте работы авторов, выходные данные документа, язык публикаций, шифры рубрик, УДК, МКИ и НКИ для описания патентов, шифры специальных классификаций (биологической, химической и т.п.), ключевые слова и дескрипторы, реферат или аннотация. Информационная система ВИНИТИ создана для выполнения следующих функций: подготовки сигнальной информации в печатной и в электронной формах; подготовки и выпуска печатных РЖ; формирования БД; избирательного распространения информации по тематике ВИНИТИ; ретроспективный поиск; выдачи пользователям полных копий НТИ. В ИИС ВИНИТИ разработаны четыре подсистемы: аналитико-синтетической переработки документов; полиграфического размножения и рассылки информационных изданий; справочно-информационного обслуживания; выдачи копий документов. В ВИНИТИ разработана ИИС "АССИСТЕНТ-3", ориентированная на создание БД. Основой этой системы является единая технологическая БД, которая служит для подготовки отраслевой и межотраслевой БД, для автоматической подготовки разных серий и выпусков РЖ ВИНИТИ и других изданий. Отдельные части созданной ИИС находятся в промышленной эксплуатации в ВИНИТИ и в его производственно-издательском комбинате.

Полнота комплектования БД ВИНИТИ должны соответствовать 700-103 статьям, около 200-103 описаниям изобретений и заявок, 105 докладов и 104 монографий. В это время выходит во всем мире 40-103 научных журналов с 2-Ю6 статей. Федеральные информационные фонды ВНТИЦ формирует по неопубликованным источникам НТИ, выполняя функцию комплектования обязательного экземпляра, его государственную регистрацию и учет, выпуск информационных бюллетеней, обеспечение сохранности фонда и его использования. Информационной основой ВНТИЦ является фонд микрокопий первоисточников НТИ, содержащий полные тексты отчетов о НИОКР, кандидатских и докторских диссертаций и БД с реквизитами вторичных научных документов и рефератами для проведения тематического, фактографического поиска и ретроспективного анализа в режиме теледоступа со статистической обработкой данных о состоянии науки и техники в Российской федерации. На начало 1999 года фонд микрокопий первоисточников составил 1,16-106 документов: 700-Ю3 отчетов о НИОКР (1984-1998 гг.); более 37000 диссертаций (1980-1998 гг.); более 13-Ю3 описаний алгоритмов и программ (1980-1998 гг.); более 76-103 переводов НТИ и документации. Основная ретроспектива в 18 лет БД ВНТИЦ на конец 1998 г. составила более 2,5-106 документов по всем рубрикам ГРНТИ. К началу 1999 г. полная ретроспективная БД ВНТИЦ подготовлена для установки на www -сервере в режиме он-лайн. Вводом этого режима в промышленную эксплуатацию можно было получить большой экономический эффект. Ввод сдерживается отсутствием у ВНТИЦ средств развития конфигурации сервера. Федеральным информационно-аналитическим центром оборонной промышленности является ВИМИ, который обеспечивает формирование, ведение и организацию использования фондов, БД по НИОКР и результатам научно-исследовательской деятельности ОПК, имеющим общенациональное значение. Он объединяет 10 отраслевых органов научной информации и базовые отделы научной информации предприятий, НИИ, КБ и других организаций оборонной промышленности. АИПС МИАС в ВИМИ обеспечивает оперативную обработку научной информации и выдачу по запросам в режиме диалога.

Похожие диссертации на Системная методология исследования реальных потоков научно-технической информации в среде мирового информационного пространства