Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Галочкин Сергей Александрович

Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК
<
Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Галочкин Сергей Александрович. Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК : Дис. ... канд. техн. наук : 05.13.18 : Москва, 2003 198 c. РГБ ОД, 61:04-5/792-6

Содержание к диссертации

Введение

Глава 1: Системы накопления и обработки научно-технической информации (НТИ).

1.1. Общие цели и задачи накопления и обработки НТИ 12

1.2. Методы и средства анализа НТИ для формализованной оценки тенденций, перспектив развития научных исследований и отбора инновационных проектов 18

1.3. Постановка задачи создания информационной технологии обработки научно-технических публикаций с целью выявления тенденций развития науки и техники в перерабатывающих отраслях АПК 31

Глава 2: Формализация и математическое моделирование процесса анализа НТИ с целью выявления тенденций развития .

2.1. Формализованные характеристики научных направлений и тенденций развития 33

2.2. Продукционная математическая модель терминологической классификации 41

Глава 3: Алгоритмическое и информационное обеспечение автоматизированной экспертной системы анализа научно-технических публикаций .

3.1. Алгоритм формирования терминологических формул и построения семантического графа тенденций научно-технического развития 56

3.2. Структура информационных банков данных по научно- техническим публикациям 75

3.3. Диалоговый алгоритм обработки данных в задаче выявления тенденций развития перерабатывающих отраслей АПК 88

Глава4: Экспертная система анализа научно-технических публикаций и выявления тенденций научно-технического развития в перерабатываю-щих отраслях АПК.

4.1. Функциональная структура экспертной системы 92

4.2. Программное обеспечение 97

4.3. Процедура принятия решений на примерах анализа научно-технических публикаций в перерабатывающих отраслях АПК 100

Выводы и заключения 110

Список литературы 111

Приложения

Введение к работе

В условиях сложившейся конъюнктуры рынка, жесткой конкуренции между отечественными производителями продуктов питания и импортерами, перед перерабатывающими отраслями агропромышленного комплекса (АПК) выдвигается ряд важнейших народнохозяйственных задач по совершенствованию технологических процессов переработки биосырья животного происхождения, повышению эффективности производственных процессов с внедрением ресурсо- и энергосберегающих технологий, обеспечению качества и безопасности биологического сырья, полуфабрикатов и готовой продукции.

Разработка и внедрение новых технологий производства биологически безопасных и высококачественных продуктов питания является одной из основных задач перерабатывающих отраслей АПК [6], для решение которой привлекается значительная часть научного потенциала отрасли.

Определяющим фактором создания современной технологии производства мясных и молочных продуктов является постоянное развитие фундаментальных и прикладных исследований по изучению природы процессов, увеличению полноты и глубины переработки биоресурсов, управлению качеством продукции [75]. Подобные исследования, а также разработка принципиально новых методов являются основой научно-технического прогресса с ростом производительности и экономической эффективности производства.

Дальнейшее развитие техники и технологий переработки биосырья животного и растительного происхождения в широкий ассортимент продуктов питания, медицинских препаратов и технических фабрикатов связан с внедрением наукоемких технологий, обеспечивающих высокое качество и безопасность выпускаемого продукта, снижение его себестоимости и затрат на производство, и вследствие этого расширение рынка сбыта и увеличение прибыли.

Решить данную стратегически важную задачу можно только путем целенаправленного инвестирования в соответствующие инновационные проекты и научно-исследовательские работы институтов и предприятий отрасли. В связи с этим важнейшим условием обеспечения эффективного научно-технического развития является обоснованный выбор приоритетов и концентрация научного потенциала, финансовых и материальных ресурсов на их реализации. Этот принцип положен в основу Доктрины развития российской науки и действующего Федерального закона «О науке и государственной научно-технической политике» [28]. Исходя из этих основополагающих документов, в России определяются приоритетные направления развития науки и техники. Правительственной комиссией по научно-технической политике было признано необходимым периодически (раз в 2-3 года) уточнять перечни приоритетных направлений развития науки и техники, каждое из которых объединяет совокупность структурообразующих технологий, определяющих научно-технический уровень промышленности.

Серьезный прогресс в формировании реального сектора экономики, ориентированного на выпуск инновационной продукции, может быть достигнут только на основе реализации крупномасштабных наукоемких проектов, нацеленных на реализацию передовых технологий [6]. Однако такие проекты требуют привлечения значительных инвестиций. В то же время серьезные инвесторы вкладывают свои ресурсы только при условии определенных гарантий их окупаемости. Это означает, что формируемые проекты должны быть ориентированы на получение конкретных практических результатов, производство высокотехнологичной, конкурентоспособной продукции и, таким образом, быть максимально привлекательными для инвесторов.

С другой стороны, выполнение этих проектов должно гарантировать крупные сдвиги в технологическом преобразовании отечественного производства, увеличение выпуска конкурентоспособной продукции российскими предприятиями на внутреннем и мировом рынке, решение острых

социальных проблем, т.е. в полной мере ориентироваться на реализацию национальных приоритетов [7].

В связи с этим, важной составной частью государственной социально-экономической политики является инновационная политика, которая определяет цели инновационной стратегии и механизмы поддержки приоритетных инновационных программ и проектов [19,29]. Главными и наиболее острыми проблемами являются проблемы повышения эффективности использования научных разработок и внедрения результатов фундаментальных и прикладных исследований в производство.

В настоящее время в мясной и молочной промышленности наблюдается снижение инновационной активности под влиянием низкой платежеспособности как со стороны государства, так и со стороны негосударственного сектора экономики. В этих условиях предприятия и организации в первую очередь сокращают объемы производства наукоемкой продукции в пользу более дешевой и упрощенной технологии, не всегда обеспечивающей должный уровень качества [6].

Инвестиционные проекты предприятий и организаций получают финансирование в основном через систему целевых программ, создаваемых при поддержке государственных структур и распределяющих инвестиционные кредиты на льготных условиях в важные для государства проекты [7,61,75]. Активная роль государства в финансировании НИР неизбежна, так как степень развития и глубина проникновения научных идей и разработок в производство становится решающим фактором конкурентоспособности страны на мировом рынке. Государственная поддержка НИР, особенно в сфере фундаментальных исследований, а также при распространении научно-технических идей, является важнейшей финансовой составляющей инновационного процесса.

Одна из основных форм передачи государственных средств на научные исследования в тех случаях, когда они выполняются частными фирмами, институтами и лабораториями, - заключение контрактов. Финансовые ресурсы правительства представляются, как правило, наиболее перспективным

организациям, могущим эффективно распорядиться кредитными ресурсами. С целью выбора кредитуемой организации проводится конкурс целевых программ фирм, подавших заявки на государственное финансирование [6,28].

Конкурсная основа создает конкуренцию за получение финансовых средств, заставляет фирмы и институты разрабатывать наиболее экономичные и эффективные проекты. Для систем государственной поддержки инновационного процесса последних лет характерно распространение программы целевого финансирования, когда финансовые ресурсы сосредотачиваются на приоритетных направлениях, наиболее значимых для экономического развития страны в целом. С этой целью используются средства специальных правительственных организаций, которые идут для финансирования нововведений, по большей части фундаментального характера, не дающих быстрой прибыли [75].

Повышение эффективности использования ограниченных ресурсов при проведении научно-исследовательских работ, финансируемых из средств государственного бюджета, является одной из важных стратегических целей управления наукой. Для достижения данной цели при распределении финансирования требуется принимать решения основанные на [28]:

экспертном прогнозе развития науки на ближайшую перспективу;

экономических целях;

достигнутом мировом уровне научных исследований;

предлагаемых к разработке научных темах;

актуальных задачах и проблемах.

На этапе выбора приоритетных направлений развития, отбора инновационных проектов и распределения финансирования одной из главных задача является выявление складывающихся тенденций развития науки и техники в различных областях знаний, решение которой, в настоящее время, достигается привлечением большого количества специалистов-экспертов для

анализа имеющейся информации и принятия решений на основе накопленного опыта и знаний в конкретной области.

При этом лицам, принимающим решения на разных уровнях управления необходима компьютерная поддержка в определении объективно складывающихся тенденций развития науки, основанная на анализе больших потоков научно-технической информации с последующим выявлением правильности вложения средств, рациональности политических, социальных или экономических мероприятий.

В связи с этим задача создания информационной технологии, быстро оценивающей большие объемы данных по научно-техническим публикациям и позволяющей выявить необходимые знания для обоснованного принятия решения является социально значимой и актуальной.

Цель диссертационной работы заключалась в моделировании и алгоритмизации процессов анализа научно-технической информации с накоплением формализованных знаний и создании знание-ориентированной компьютерной технологии, выявляющей складывающиеся тенденции развития науки и техники в выбранной области знаний.

Для достижения поставленной цели необходимо решение следующих задач:

анализ существующих систем и методов обработки научно-технической информации с формализацией целей, задач, условий и принципов отбора инновационных проектов в перерабатывающих отраслях АПК;

формализация информационных характеристик, параметров и структуры реляционной базы данных по научно-техническим публикациям;

разработка математической модели идентификации научного направления и тенденции развития на множестве ключевых слов и семантических связей;

разработка метода и алгоритма выявления семантически связанных ключевых слов в массиве научно-технических публикаций с формированием терминологической формулы научного направления;

разработка диалогового алгоритма и программного комплекса идентификации тенденций научных исследований и технических проектов в перерабатывающих отраслях АПК в экспертной системе поддержки принятия решений.

При выполнении диссертационного исследования получены следующие научные результаты:

  1. Разработана математическая модель и алгоритм анализа потоков научно-технической информации, обеспечивающие формализацию знаний с помощью ключевых слов и терминологических формул.

  2. Разработан алгоритм ассоциативного поиска семантически связанных ключевых слов в массивах текстовой научно-технической информации с формированием терминологических формул.

  3. Предложен критерий оценки информативности терминологических формул.

  4. Разработана информационная технология выявления тенденций развития научных исследований и технических проектов в предметной области знаний.

Практическая значимость работы.

  1. На основе разработанных моделей и алгоритмов создан программный комплекс «REVEALTEN», реализующий предложенные методы анализа текстовой информации с формированием множества семантически связанных ключевых слов и терминологических формул.

  2. Разработано программное обеспечение и демонстрационная версия экспертной системы определения тенденций развития в перерабатывающих отраслях АПК, информационно- и программно-совместимые с экспертной системой ForeCaster.

  3. Разработана структура и программный аппарат поддержки реляционной базы данных по регистрационным и информационным картам для накопления научно-технической информации и последующего использования в ОНТИ МГУПБ.

Структура диссертационной работы включает четыре главы и приложения:

Первая глава диссертации посвящена описанию и систематизации существующих систем и методов накопления и обработки научно-технической информации с постановкой задачи создания информационной технологии анализа публикаций с целью выявления складывающихся тенденций развития науки и техники в перерабатывающих отраслях АПК.

Во второй главе рассматриваются этапы математического моделирования процессов обработки научно-технической информации, интеллектуального анализа данных и формализованного представления результатов исследования.

В третьей главе приводится алгоритм формирования терминологических наборов семантически связанных ключевых слов (терминологических формул), изложена концепция проектирования баз данных по научно-техническим публикациям, приведена структура базы данных FSTA в качестве объекта выявления тенденций научно-технического развития, а также алгоритм нормализации исходных данных с целью их приведения к бинарному виду.

В четвертой главе дается описание экспертной системы анализа научно-технических публикаций и выявления тенденций развития науки и техники в перерабатывающих отраслях АПК, а также описание и результаты апробации пакета программ на реальных примерах в процессе принятия решения в диалоговом режиме.

В приложениях представлены: фрагмент используемой базы данных по научно-техническим публикациям, листинги всех модулей программного комплекса, руководство по эксплуатации разработанного пакета программ.

Предложенная информационная технология позволяет проводить оценку состояния и перспектив развития научных исследований, а также в значительной степени облегчает для специалиста-эксперта процедуру выбора

приоритетных направлений развития науки и техники в перерабатывающих отраслях АПК.

Работа выполнялась по программе Миннауки Российской Федерации на 1998-200 Іг.г. в рамках госбюджетной тематики «Разработать компьютерные технологии определения тенденций развития производства безопасных пищевых продуктов» (коды по Государственному рубрикатору научно-технической информации-50.53.19, 50.41.25)

Основное содержание диссертации представлено на следующих конференциях:

IV-ой международной научно-технической конференции «Пища. Экология. Человек.» - Москва, 2001г.;

И-ой Всероссийской научно-технической конференции. - Воронеж, 2002г.;

а также в Вестнике Международной Академии Системных Исследований. «Информатика, Экология, Экономика». Том 5. Часть IV, М., 2001г. и отчете о научно-исследовательской работе на тему «Разработать компьютерные технологии производства безопасных пищевых продуктов» № госрегистрации 01990010643.

Методы и средства анализа НТИ для формализованной оценки тенденций, перспектив развития научных исследований и отбора инновационных проектов

Решение задач выявления тенденций и направлений научно-технического развития сводится к методологии прогнозирования, суть которого заключается в предвидении тенденций будущего развития исследуемого объекта на основе глубоко изучения закономерностей, взаимодействия внутренних и внешних факторов, определяющих его динамику, для обоснования плановых, проектных и экономических решений, выявления возможных их последствий [28].

Целью прогнозирования является определение вероятностных данных о будущем состоянии объекта прогнозирования (науки, технологии т.п.) на основании исследования механизма его изменения в прошлом и настоящем времени. Разработка прогнозов включает [10]: 1. Аналитический этап, на котором проводится ретроспективный анализ по проблеме, изучение тенденций развития науки и техники в прошлом и их современное состояние, уточняются параметры объекта прогнозирования, цели и задачи прогноза. В связи с тем, что точность результатов исследования обусловлена полнотой и достоверностью исходных данных, большое значение имеет подбор и систематизация исходной информации, а также методы и модели ее обработки, обеспечивающие точность прогноза. В настоящее время практически отсутствует автоматизированный подход к выявлению складывающихся тенденций развития науки и техники, а формирование гипотез о наличии тех или иных тенденций осуществляется методом экспертного опроса. 2. Исследовательский этап, базирующийся на конкретном опыте, изученных тенденциях и закономерностях. Включает формирование возможных состояний научно-технического прогноза на определенный период прогнозирования с указанием альтернатив и сроков решения проблемы. 3. Программно-организационный этап, на котором определяется потребность в ресурсах, выбирается оптимальный путь (пути) решения проблемы, разрабатываются рекомендации по масштабам и сферам использования результатов прогноза, проводится оценка социально-экономических последствий их использования.

Отражая различные альтернативные представления о будущем, прогноз должен определять на перспективу решающие условия и факторы прогресса общества, включая демографическую и экологическую ситуацию в стране и отдельных ее регионах, состояние сырьевых ресурсов, ожидаемые качественно новые технологические решения и обусловленные ими коренные структурные сдвиги в экономике, возможные экономические и социальные рубежи, место и роль отрасли и страны в системе мировых хозяйственных связей [69]. Таким образом, научно-техническое прогнозирование на современном этапе развития страны должно опираться на выявление, измерение и предвидение динамики науки, технологии и техники во взаимосвязи с цикличными колебаниями в смежных и отдаленных сферах. Все методы прогнозирования по степени формализации делятся на интуитивные и формализованные (рис. 1.2) [28]. Интуитивные (эвристические) методы прогнозирования используются в тех случаях, когда невозможно учесть влияние многих факторов из-за значительной сложности объекта прогнозирования, и основаны главным образом на методах экспертной оценки. При этом различают индивидуальные и коллективные экспертные оценки. В состав индивидуальных экспертных оценок входят: метод «интервью», при котором осуществляется непосредственный контакт эксперта со специалистом по схеме «вопрос — ответ»; аналитический метод, при котором осуществляется логический анализ какой-либо прогнозируемой ситуации, составляются аналитические докладные записки; метод написания сценария, который основан на определении логики процесса или явления во времени при различных условиях. Методы коллективных экспертных оценок можно отнести к комплексным системам прогнозирования, поскольку в последних сочетаются методы индивидуальных экспертных оценок и статистические методы их обработки. Группа коллективных экспертных оценок включает методы анкетирования, "комиссий", «коллективной генерации идей» («мозговая атака»), "суда", Делфи [10,62]. Эта группа методов основана на том, что при коллективном мышлении, во-первых, выше точность результата во-вторых, при обработке индивидуальных независимых оценок, выносимых экспертами, по меньшей мере могут возникнуть продуктивные идеи. В группу формализованных методов входят две подгруппы: экстраполяции и системно-структурные методы. К первой подгруппе относятся методы: наименьших квадратов, экспоненциального сглаживания, скользящих средних [5,10]. Ко второй — методы: функционально-иерархического моделирования, семантического и факторного анализа, матричный, аналогий, циклов.

Основные методы прогнозирования изложены в фундаментальных исследованиях как отечественных ученых — Чабровский В.А. [62], Лисичкин В.А. [32], Бражников A.M. [10] и др., так и зарубежных исследователей — Эйрес Р. [69],ЯнгЭ. [70]. В настоящее время, для реализации вышеперечисленных методов прогнозирования развития науки и техники (рис. 1.2) в основном применяются следующие модели, позволяющей оценить степень пригодности каждой на практике: Регрессионные (вероятностно-статистические) модели применимы для прогнозирования при условии отсутствия структурных сдвигов в науке, экономике и т.д. Под термином регрессионные в данном случае подразумеваются модели, получаемые на основе реализации метода регрессионного анализа [46].

Продукционная математическая модель терминологической классификации

Формализация извлекаемых знаний достигается посредством построения продукционной математической модели [59] эвристических выводов по принципу выявления ассоциативных правил с оценкой изменения неопределенности на очередном шаге идентификации.

Получение продуктивных знаний осуществляется разбиением общего количества научно-технических публикаций анализируемой предметной области в зависимости от содержимого на определенные рубрики некоторой классификации, разделяющей пространство предметной области на непересекающиеся классы [56]. Каждый класс характеризуется набором признаков - специфических для него ключевых слов (терминов), выражающих основные понятия и отношения между ними.

Таким образом, формализация знаний сводится к представлению их в виде ограниченного набора наиболее вероятных последовательностей ключевых слов (терминологических формул), представляющих терминологические классы и построению классификационного семантического графа.

Формализованная постановка задачи для информационной базы данных q научно-технических публикаций сводится к следующему:

Задано множество ключевых слов (терминов) W = {Wb W2, ..., Wn}9 используемых в рассматриваемой предметной области. Пусть D — множество публикаций, где каждая публикация Р — это набор терминов из W, Р dW .

Если публикация Р содержит X, некоторый набор ключевых слов из W - X с Р, то ассоциативным правилом является импликация (2.1):

Правило X = Y имеет поддержку S (support), если S процентов публикаций из D, содержат XuF (2.2). Вероятность того, что из X следует Y характеризует достоверность правила. Правило X = Y справедливо с достоверностью С (confidence), если С процентов публикаций из D, содержащих X, также содержат Y:

Пусть 20% публикаций в анализируемой области знаний, содержащих ключевое слово Мясо , также содержат ключевое слово Безопасность пищи и 0,02% от общего числа всех публикаций содержат оба ключевых слова. Тогда, в данном случае, 20% - это достоверность (confidence) С правила, а 0,02% - это поддержка (support) S.

Другими словами, целью анализа является установление следующих зависимостей: если в публикации встретился некоторый набор ключевых слов X, то на основании этого можно сделать вывод о том, что также же должен появиться другой набор ключевых слов Y в этой публикации. Установление таких зависимостей дает возможность находить достаточно простые и интуитивно понятные правила, представляющие собой семантически взаимосвязанные последовательности терминов.

Алгоритм поиска ассоциативных правил предназначен для нахождения всех правил X = Y, при заданных пороговых значениях поддержки S и достоверности С, называемых соответственно минимальной поддержкой (minsupport) 5min и минимальной достоверностью (minconfidence) Cmin [64].

Задача нахождения ассоциативных правил разбивается на три этапа: 1. Нахождение всех наборов ключевых слов, которые удовлетворяют порогу (minsupport) Sm\n- Такие наборы называются часто встречающимися. 2. Генерация правил из наборов ключевых слов, найденных согласно п. 1. с достоверностью, удовлетворяющей порогу (minconfidence) Cmin. 3. Оптимизация сгенерированных правил, с целью последующего представления полученных результатов в виде классификационного семантического графа. Таким образом, необходимо найти часто встречающиеся наборы ключевых слов, извлечь из них правила и провести оптимизацию. Значения минимальной поддержки «Smin и минимальной достоверности Cmin выбираются таким образом, чтобы ограничить количество найденных правил. Если поддержка имеет большое значение, то алгоритмы будут находить правила, хорошо известные экспертам-аналитикам или настолько очевидные, что нет никакого смысла проводить такой анализ. С другой стороны, низкое значение поддержки ведет к генерации огромного количества правил, что, конечно, потребует существенных вычислительных ресурсов. Тем не менее, большинство интересных правил находится именно при низком значении порога поддержки. Хотя, и слишком низкое значение поддержки ведет к генерации статистически необоснованных правил. Выполнение задачи поиска ассоциативных правил приводит к формированию т терминологических наборов (формул), представляющих собой наиболее вероятные последовательности ключевых слов, характеризующих отдельные аспекты рассматриваемого научного направления или тенденцию научно-технического развития

Структура информационных банков данных по научно- техническим публикациям

Основные аспекты организации баз данных по научно-техническим публикациям связаны с полнотой информации, необходимой для адекватного описания предметной области. Для этого в принципе может использоваться и естественный язык (в виде текста первоисточников), но его применение имеет много недостатков, основными из них являются громоздкость описания и сложность компьютерного анализа семантических связей в полнотекстовых документах.

Поэтому для этих целей используются формализованные средства структурного описания информационных документов. Любые категории научных документов описываются с помощью нескольких десятков полей, где указываются основные библиографические данные о данной публикации: авторы, год издания, название, краткая аннотация, ключевые слова и т.д.

Основная информация, которую несет база данных с ключевыми словами, помимо значения самих ключевых слов, это частота их появления и частота совместной встречаемости терминов. На основании этих характеристик можно проводить достаточно сложный анализ документов.

В данной работе обработке и анализу подвергались зарубежные базы данных по научно-техническим публикациям FSTA и AGRIS [36], а также разработанная база данных по регистрационными и информационными картам научных исследований.

Банк данных и прикладное программное обеспечение по регистрационным и информационным картам разработаны по заказу отдела научно-технической информации МГУПБ и в течение 3-х лет успешно используются сотрудниками отдела для регистрации научных работ университета.

Заполнение баз данных осуществляется по мере формирования регистрационных и информационных карт. Составляются регистрационные карты в результате проведения системного исследования по выявлению и формированию инновационных проектов и программ.

Информационные и регистрационные карты по своей структурной форме отражают цели и задачи проекта, его место в решении отраслевых проблем, а также основные характеристики проекта [29]: ориентировочные сроки реализации проекта; приблизительные общие затраты на проведение научных исследований и разработок; ориентировочную экономическую эффективность результатов НИОКР при максимальном масштабе их внедрения; актуальность проекта; предполагаемую научную новизну проекта; характеристику рынка потребления создаваемой научно-технической продукции; ожидаемый результат реализации проекта; область и масштабы применения результатов научных исследований и разработок; уровень обеспеченности проекта материально-техническими, кадровыми и информационными ресурсами; факторы поддержки, необходимые для реализации проекта.

Составленные по вышеуказанным и другим обосновывающим характеристикам регистрационные и информационные карты являются основой для создания базы данных о научных, инновационных проектах с целью оценки их значимости и перспективности, а также выявления тенденций развития науки и техники в перерабатывающих отраслях АПК.

Банк данных по регистрационным и информационным картам функционирует под управлением СУБД FoxPro2.5 [47]. Для обеспечения организации ввода, обработки и хранения данных, а также обработки запросов разработано прикладное программное обеспечение, предоставляющее удобный пользовательский интерфейс. Листинг и руководство по эксплуатации программы обработки и оформления регистрационных и информационных карт приведены в приложениях №3 и №4.

Банк данных по регистрационным и информационным картам научных публикаций состоит из нескольких индексированных реляционных баз данных. Структура основной индексированной базы (файл: inf.dbf) представлена в таблице 3.1.

Процедура принятия решений на примерах анализа научно-технических публикаций в перерабатывающих отраслях АПК

Процесс принятия решения о складывающихся тенденциях научно-технического развития в перерабатывающих отраслях АПК на основе анализа научных публикаций сводится к следующим этапам: 1. Формирование набора терминологических формул в исследуемой области знаний с использованием разработанного программного комплекса поддержки принятия решения «REVEALTEN» по критериям, заданным пользователем-экспертом. 2. Экспертное решение о тенденциях научно-технического развития перерабатывающих отраслей АПК, выявленных в результате семантического анализа терминологических формул. При выполнении процедуры принятия решения регламентируется последовательность действий пользователя-эксперта в диалоговом режиме работы с программным комплексом REVEALTEN. При выполнении первого этапа - анализа научно-технической информации и составления терминологических формул необходимо: - выбрать исследуемую базу данных, которая будет приведена к нормализованному виду, или готовую (ранее нормализованную с помощью конвертера) базу данных; — настроить рабочую среду (т.е. задать все необходимые для выполнения основной процедуры параметры, критерии и опции). Апробацию программного комплекса «REVEALTEN» проведем с использованием базы данных по проблемам пищевой науки и технологии FSTA 1990-09.1996г.

При выборе и открытии исходной базы данных выполняется процедура нормализации, время выполнения которой в зависимости от количества данных может достигать нескольких десятков минут (в случае базы FSTA — 15 минут). Однако процедура нормализации выполняется только при первом использовании базы данных.

Нормализованная база данных сохраняется на жестком диске и может быть использована при последующем обращении. Выбор базы данных научно-технической информации осуществляется с помощью диалогового окна (рис.4.3.). Далее пользователь-эксперт должен настроить рабочую среду для выполнения основной процедуры формирования терминологических формул. С этой целью необходимо определить следующие параметры, обеспечивающие поиск и формирование результатов в соответствии с задачей и целями анализа: - предметную область знаний; - минимальную достоверность терминологических наборов Cmin ; - минимальную поддержку выявляемых терминологических связей Smin; - минимальное и максимальное количество терминов в формуле (минимальный и максимальный уровень терминологической идентификации); - способ сортировки терминологических формул: по значению величины количества информации или в иерархическом порядке. Установка вышеперечисленных параметров осуществляется с помощью диалогового окна Настройка формул (рис.4.4).

Похожие диссертации на Моделирование и алгоритмизация процессов анализа научно-технической информации с целью выявления тенденций развития в перерабатывающих отраслях АПК