Содержание к диссертации
Введение
Глава 1. Проблематика поддержки принятия решений в образовательной деятельности и в производственных процессах научно-инновационной деятельности 12
1.1 Поддержка принятия решений в образовательном учреждении 12
1.2 Поддержка принятия решений в научно-исследовательской деятельности 17
1.3 Поддержка принятия решений в области образовательных и научных 19
1.4 Поддержка принятия решений в области администрирования учебного процесса21
1.5 Поддержка принятия решений в области производственных процессов научно-инновационной деятельности 24
1.6 Методология построения систем поддержки принятия решений в сфере научно-исследовательской деятельности 26
1.6.1 Общий алгоритм поддержки принятия решений 26
1.6.2 Жизненный цикл и процессы поддержки принятия решений 28
1.6.3 Реализация методологии построения систем поддержки принятия решений в сфере научно-исследовательской деятельности 29
1.7 Выводы по первой главе 31
Глава 2. Информационные модели и методы интеллектуализации поддержки принятия решений в области научно-исследовательской деятельности 32
2.1.1 Спецификация процесса выполнениня научно-исследовательской части индивидуального плана 32
2.1.2 Спецификация задачи интеллектуализации поддержки принятия решений 34
2.2 Разработка метода поддержки принятия решений в области научно-исследовательской деятельности 35
2.2.1 Разработка общей структуры метода поддержки принятия решений 35
2.2.2 Разработка алгоритма многокритериального анализа альтернативных решений 38
2.3 Разработка информационных моделей поддержки принятия решений в области научно-исследовательской деятельности 43
2.3.1 Состав и взаимосвязь информационных моделей поддержки принятия решений 43
2.3.2 Модель научных интересов участника научно-инновационного процесса 47
2.3.3 Модель авторского профилея 50
2.3.4 Модель научных коллективов 51
2.3.5 Модель публикации 52
2.3.6 Модель научного мероприятия 53
2.4 Разработка метода автоматического построения информационной модели научных интересов участников научно-инновационной деятельности 53
2.5 Разработка алгоритма многокритериального анализа соответствия индексируемых периодических изданий, научных мероприятий и конкурсов научным интересам пользователя 58
2.6 Разработка методики анализа и оценки связанности научных интересов участников научно-инновационной деятельности 59
2.7 Выводы по второй главе 60
Глава 3. Реализация поддержки принятия решений в области научно-исследовательской деятельности 61
3.1 Разработка онтологической модели поддержки принятия решений 61
3.2 Разработка процессов поддержки принятия решений 63
3.3 Программная реализация процессов поддержки принятия решений 74
3.3.1 Реализация алгоритма совместной фильтрации 74
3.3.2 Реализация метода расчета матрицы решений 79
3.4 Реализация системы поддержки принятия решений в ИСУ университета ИТМО 82
3.4.1 Модель данных 82
3.4.2 Функционально-логическая модель 84
3.4.3 Интеграционная модель 86
3.4.4 Структурная модель 87
Глава 4. Экспериментальные исследования системы интеллектуальной поддержки принятия решений в составе ИСУ университета ИТМО 90
4.1 Описание моделируемых элементов процессов деятельности обучающихся в аспирантуре и магистратуре вуза 90
4.2 Применение системы интеллектуальной поддержки принятия решений для выполнения научно-исследовательской части индивидуального плана 96
4.2.1 Настройка шаблонов системы поддержки принятия решений 96
4.2.2 Пример представления рекомендаций в ИСУ университета 97
4.3 Пример работы системы интеллектуальной поддержки принятия решений при выборе конкурсов, программ и фондов 99
4.4 Экспериментальные исследования 100
4.4.1 Оценка системы поддержки принятия решений на тестовой группе обучающихся.. 100
4.4.2 Оценка системы поддержки принятия решений на тестовой группе аспирантов 101
4.4.3 Оценка системы поддержки принятия решений на основе статистики выполнения индивидуальных планов 102
4.4.4 Оценки системы поддержки принятия решений на основе статистики работы тестовой группы аспирантов в ИСУ университета 103
4.4.5 Оценка системы поддержки принятия решений на основе общей статистики использования отдельных модулей всеми пользователями ИСУ университета ИТМО 109
4.4.6 Оценка системы поддержки принятия решения на основе виляния рекомендательно сервиса на успеваемость и участие в проектной деятельности 112
4.5 Выводы по четвертой главе 116
Заключение 117
Список используемых сокращений 120
Список рисунков 121
Список таблиц 124
Литература 125
Приложение 1. Функция расчета схожести объектов на основе коэффициента Жакара 135
Приложение 2. Наполнение профилей пользователей на основе данных наукометрических БД 137
Приложение 3. Онтология предметной области 146
- Поддержка принятия решений в области производственных процессов научно-инновационной деятельности
- Разработка метода автоматического построения информационной модели научных интересов участников научно-инновационной деятельности
- Разработка процессов поддержки принятия решений
- Оценки системы поддержки принятия решений на основе статистики работы тестовой группы аспирантов в ИСУ университета
Поддержка принятия решений в области производственных процессов научно-инновационной деятельности
Рассмотрим производственный процесс научно-инновационной деятельности на примере МИП. Каждое МИП проходит в своей жизни различные стадии хозяйственной и инновационной деятельности. Их можно представить следующим образом [67]:
возникновение
формирование инновационной идеи;
патентная литературная оценка идеи;
оценка инновационных потребностей и финансовых возможностей;
маркетинговые исследования и подготовка к учреждению МИП;
формальное учреждение МИП;
определение цели деятельности и разработка предпринимательской концепции;
развитие, проведение и исследование разработок;
патентование нововведений, защита авторам прав;
маркетинговые исследования и подготовка рынка;
организационно-правовая подготовка производства;
начальное производство инновационного продукта;
рост и наращивание производственной мощности;
увеличение объема продаж;
освоение новых рынков;
формирование устойчивости сети поставщиков;
совершенствование технологии, организации производства и менеджмента;
увеличение численности работающих и повышение специализации работающих;
зрелость
стабилизация поставщиков;
модернизация и индивидуализация инновационного продукта;
поиск новых рынков;
проведение исследований и разработок;
поиск новых сфер приложения инновационных идей;
модернизация предпринимательской концепции;
затухание – реформирование
модернизация производственной базы;
сокращение производственной инфраструктуры;
сокращение численности работников;
ликвидация запасов;
продажа собственных ноу-хау, лицензии, патента;
приобретение чужих производств, лицензий, патентов.
На основе представленного жизненного цикла МИП можно выделить следующие области, требующие использования методов поддержки принятия решений:
поиск публикаций по заданным тематикам;
поиск результатов интеллектуальной деятельности по заданным тематикам;
поиск конкурсов на материальное стимулирование;
подбор кадров;
выбор наиболее подходящих изданий для публикации.
Данные области схожи с областями, определенными в рамках выполнения научно-исследовательской части индивидуального плана обучающихся.
Разработка метода автоматического построения информационной модели научных интересов участников научно-инновационной деятельности
Формирование области научных интересов является основополагающей задачей для дальнейшего анализа и разработки инструмента построения рекомендаций. Научная область формируется двумя путями (см. рис. 16):
Одним из главных плюсов является формирование описания интересов пользователя без его непосредственного участия. Минусом данного подхода является появление побочных ключевых слов, описывающих область научных интересов. Для автоматического формирования научной области были определены следующие источники информации:
корпоративный портал информационной системы университета. Отслеживается информация о посещении пользователем страниц, которые содержат ключевые слова и тематики. Информация о посещенных страницах, полученных тематиках и ключевых словах собирается для дальнейшего анализа;
пользователи информационной системы управления университета;
сторонние источники, такие как Scopus, Web of Science, РИНЦ.
Информационная система управления университета является большой современной системой и с большим количеством пользователей [14]. При ежедневной работе с порталом, пользователи посещают большое количество страниц. Данные посещения позволяют определить область научных интересов пользователя. Регулярный мониторинг посещения страниц позволяет определить не только потенциальную область научных интересов, но и пользователей, посещающих одинаковые страницы. Анализ интересов пользователей, посетивших одинаковые страницы, позволяет выявить наиболее схожих по областям научных интересов пользователей. Такое определение пользователей позволяет взаимно дополнить научные области их интересов потенциальными ключевыми словами.
С целью устранения недостатка, связанного с появлением побочных ключевых слов, которые не соответствуют интересам пользователей, все автоматически собранные ключевые слова ранжируются и только после этого включаются в область научных интересов.
В качестве основной метрики бинарной меры сходства был выбран коэффициент Жаккара. Его преимуществами является относительно релевантная выдача результатов [15].
Большинство выражений для вычисления индексов сходства основаны на общих положениях теории множеств, которые могут быть представлены в виде диаграммы Венна (см. рис. 17):
Для вычисления схожести двух пользователей между собой с помощью коэффициента Жаккара воспользуемся формулой [14, 15]:
К = г а + b — с где с - количество ключевых слов, с которыми связан и первый и второй пользователь, а - количество ключевых слов, с которыми связан только первый пользователь, Ь - количество ключевых слов, с которыми связан только второй пользователь.
Для расчета коэффициента Жаккара был разработан алгоритм, состоящий из следующей последовательности шагов:
Шаг 1. На вход алгоритма подаются два идентификатора пользователя, схожесть которых необходимо рассчитать. Данные идентификаторы сохраняются в переменные pi и р2.
Шаг 2. Рассчитывается количество записей в таблице связей ключевых слов и пользователей по условию равенства идентификатора пользователя значению pi.
Шаг 3. Рассчитывается количество записей в таблице связей ключевых слов и пользователей по условию равенства идентификатора пользователя значению р2.
Шаг 4. Строится пересечение таблицы связей пользователей и ключевых слов с самой собой по условию равенства идентификаторов ключевых слов. Полученные строки сохраняются в выборку pi.
Шаг 5. Рассчитывается количество строк в выборке pi по двум условиям: идентификатор первого пользователя равен значению р2, а идентификатор второго пользователя равен значению р2. Расчет выполняется при помощи счетчика. Итоговое значение счетчика сохраняется в переменную р5.
Принцип определения схожести научных интересов основан на нескольких последовательных шагах:
определяется круг интересов пользователя в виде набора ключевых слов;
определяется круг интересов других пользователей и рассчитывается схожесть их интересов с интересами данного пользователя;
схожесть интересов рассчитывается при помощи метрики Жаккара в виде дробного коэффициента, лежащего в пределах от 0 до 1;
ранжирование списка пользователей в соответствии с полученными значениями от большего значения к меньшему;
в соответствии с порядком пользователей им сопоставляются их интересы и ранжируются в том же порядке, что и авторы;
в случае наличия ключевого слова у двух разных пользователей с различным показателем схожести – приоритет отдается пользователю с наибольшим коэффициентом. То есть ключевое слово занимает наиболее высокую позицию при ранжировании;
первые N ключевых слов, полученных в результате ранжирования, возвращаются в качестве искомых.
С целью исключения дублирования научных интересов (ключевых слов), при их занесении в информационную систему, используется алгоритм определения их схожести на основе расстояния Левенштейна. Пример реализации данного алгоритма представлен на рисунке 18.
Разработка процессов поддержки принятия решений
Иерархия процессов поддержки принятия решений представлена в виде дерева процессов на рисунке 20.
Ключевыми ветками дерева процессов являются:
обогащение данных;
формирование требований;
поиск;
построение рекомендаций.
Процесс обогащения данных пользователей состоит из следующих процессов:
анализ посещения научных страниц;
анализ публикационной активности пользователя;
анализ профилей наукометрических БД.
Алгоритм анализа посещения научных страниц пользователя.
Входные данные: Множество научных интересов К пользователя Р, а также идентификатор научной страницы.
Выходные данные: Обогащенное множество научных интересов К пользователя Р.
1. Определение множества ключевых слов L посещенной страницы.
2. Определение множества пользователей V посетивших данную страницу.
3. Определение множества научных интересов пользователей посетивших данную страницу, у которых схожие научные интересы с пользователем Р. Алгоритм анализа профилей наукометрических БД.
Входные данные: Множество написаний на иностранном языке W пользователя Р.
Выходные данные: Обогащенное множество научных интересов К пользователя Р.
1. Определение множества авторских профилей Apr наукометрических БД, удовлетворяющих множеству написаний на иностранном языке W пользователя Р.
2. Идентификация авторских профилей Apr на основе сопоставления множества публикаций Ррг авторского профиля и множества публикаций At пользователя Р, а также используя модель научных коллективов Akl1.
3. Утверждение сотрудниками библиотеки новых авторских профилей Apr , Apr Є Apr.
4. Обновление научных интересов пользователя Р, К = \JYL±Kapr ., где Карг . - множество ключевых слов і - того утвержденного библиотекой авторского профиля наукометрической БД, т. - количество утвержденных авторских профилей.
Процесс обогащения данных модели публикаций состоит из следующий процессов:
обновление данных пользователями ИСУ университета;
автоматизированное обновление данных.
Процесс обогащения профиля публикации на основе обновления данных пользователями ИСУ университета представлен на рисунке 24.
Доступ к редактированию публикаций в ИСУ университета весьма ограничен, что позволяет избежать исправлений некомпетентными пользователями. Доступ к редактированию доступен только для пользователя, который внес публикацию в ИСУ университета. С целью осуществления проверки и исключения дублирующихся публикаций, предусмотрено визирование публикаций сотрудниками библиотеки. После визирования публикаций, любые исправления возможны только через сотрудников библиотеки.
На рисунке 25 представлен автоматизированный процесс обновления модели публикации. Данный процесс состоит из следующих этапов:
получение данных из наукометрических БД;
обработка полученных данных;
сопоставление обработанных данных с данными ИСУ университета;
формирование обновлений и информирование сотрудников библиотеки;
визирование сотрудниками библиотеки новых поступлений.
Процесс формирования требований — это редактирование предустановленного шаблона по формированию рекомендаций. В ИСУ университета настроены шаблоны в соответствии с требованиями индивидуального плана. Возможность редактирования данных шаблонов позволяет настраивать индивидуальные шаблоны с указанием необходимых критериев и их весов.
Оценки системы поддержки принятия решений на основе статистики работы тестовой группы аспирантов в ИСУ университета
Данная статистика позволяет оценить реальную работу тестовой группы аспирантов с рекомендательным сервисом в ИСУ университета. Для оценки работы рекомендательного сервиса были поставлены следующие цели:
Оценка влияния автоматического наполнения научных интересов на количество полученных рекомендаций при одинаково настроенных критериях
Оценка использования полученных рекомендаций на примере посещения страниц с информацией о конкурсах и фондах. В качестве оценки алгоритмов автоматического наполнения научных интересов пользователя на примере тестовой группы аспирантов был проведен сравнительный анализ наполнения научных интересов самими аспирантами и автоматического наполнения. Статистика по наполнению профилей тестовой группы аспирантов ключевыми словами и тематиками представлена в таблице 8.
В среднем для тестовой группы аспирантов увеличение ключевых слов и тематик за счет автоматического наполнения составило 65%.
Оценка формирования рекомендаций по выбору периодических изданий для тестовой группы аспирантов осуществлялась путем сравнительного анализа полученных рекомендаций с учетом автоматического наполнения профиля пользователя ключевыми словами и тематиками и без автоматического наполнения представлена в таблице. В качестве показателей для оценки периодических изданий были выбраны:
периодические издания, индексируемые в ВАК;
периодические издания, индексируемые в Scopus и WoS;
периодические издания, индексируемые в РИНЦ. В списках показателей, показатель, который рассчитывался с учетом автоматического наполнения ключевыми словами и тематиками отмечен . Оценка формирования рекомендаций по выбору научного консультанта или коллег занимающихся научной работой в данном направлении для тестовой группы аспирантов осуществлялась путем сравнения получения рекомендаций с учетом автоматического наполнения профиля пользователя ключевыми словами и тематиками (в таблице столбец отмечен ) и без автоматического наполнения. При формировании рекомендации учитывались следующие критерии:
количество публикаций, соответствующие ключевым словам и тематикам тестовой группы аспирантов;
наличие ученой степени;
наличие ученого звания;
количество защитившихся студентов;
количество защитившихся аспирантов;
количество студентов под руководством пользователя;
количество аспирантов под руководством пользователя;
участие в проектной деятельности;
владение иностранным языком.
Оценка формирования рекомендаций по выбору научного консультанта для тестовой группы аспирантов представлена в таблице В среднем на 81% увеличилось число полученных рекомендаций по выбору научного консультанта или коллег занимающихся научной деятельностью по схожим направлениям. Столь высокий показатель является результатом значительного обогащения научных интересов по итогам их автоматического наполнения как у обучающихся, так и у преподавателей.
Оценка формирования рекомендаций по выбору конкурсов на материальное стимулирование для тестовой группы аспирантов осуществлялась путем сравнения полученных рекомендаций по конкурсам с учетом автоматического наполнения профиля пользователя ключевыми словами и тематиками (в таблице столбец отмечен ) и без автоматического наполнения, а также сравнения по посещению страниц по полученным рекомендациям. При формировании рекомендаций учитывались следующие критерии:
владение иностранном языком;
сумма финансирования;
близость страны.
Оценка формирования рекомендаций по выбору конкурсов на материальное стимулирование для тестовой группы аспирантов представлена в таблице.
Как видно из таблицы, увеличение количества рекомендаций по конкурсам на материальное стимулирование, в среднем на 78%, повлияло на посещение страниц с информацией о данных конкурсах и возросло в среднем на 77%.
Сравнительный анализ рекомендательного сервиса по выбору конкурсов на материальное стимулирование и инструмента ИСУ университета по подписки на конкурсы и фонды представлена в таблице.
Подписка на конкурсы и фонды осуществляется путем указания интересующих ключевых слов, ГРНТ, а также подразделение конкурсов и фондов подписки на конкурсы и фонды, которые могли заинтересовать пользователя.
По итогу апробации методов ИППР видно, что автоматическое обогащение научных интересов позволило увеличить количество рекомендаций, а метод многокритериальной оценки позволил предоставлять более качественные рекомендации, что показывает сравнительный анализ посещений страниц конкурсов по итогу подписки на рассылку и по итогу работы ИППР.