Содержание к диссертации
Введение
Раздел 1. Теоретические основы исследования инновационного развития 12
1.1 Обзор индексов инновационного развития 12
1.2 Параллельные координаты 34
Заключение по Разделу 1 36
Раздел 2. Методы формирования индексов неоднородности инновационного развития 38
2.1 Анализ паттернов. Ординальная парно-сопоставительная модель 38
2.2 Порядково-фиксированная паттерн-кластеризация 44
2.3 Порядково-инвариантная паттерн-кластеризация 47
2.4 Диффузионно-инвариантная паттерн-кластеризация
2.5 Применение новых методов анализа паттернов на классических тестовых данных «Anderson-Fisher Iris Data» 66
2.6 Применение новых методов анализа паттернов на классических тестовых данных «Balance Scale Data Set»
2.7 Численные методы расчета индексов неоднородности инновационного развития 73
2.8 Разработка комплекса программ на основе новой ординальной парно-сопоставительной модели .78
Заключение по Разделу 2 81
Раздел 3. Исследование неоднородности инновационного развития
3.1 Исследование входных показателей Глобального индекса инноваций .83
3.2 Исследование выходных показателей Глобального индекса инноваций 129
3.3 Исследование данных образования и патентной активности .132
3.4 Исследование показателей, входящих в Индекс инновативности 136
3.5 Расчт индексов неоднородности инновационного развития .138
Заключение по Разделу 3 143
Заключение .144
Литература
- Параллельные координаты
- Порядково-фиксированная паттерн-кластеризация
- Применение новых методов анализа паттернов на классических тестовых данных «Anderson-Fisher Iris Data»
- Исследование выходных показателей Глобального индекса инноваций
Параллельные координаты
Глобальный индекс инноваций [25-29, 60-62] – совместная работа Cornell University, Бизнес школы INSEAD и Всемирной организации интеллектуальной
В некоторых источниках [12] GII переводится как «Глобальный индекс инновационного развития» собственности (WIPO). Данный индекс рассчитывается с 2007 года. К 2015 году охватывает 141 страну (143 в 2014), что соответствует 98,6% мирового ВВП и 95,1% населения Земли. Топ-10 стран составляют (2015 год, в порядке убывания): Швейцария, Великобритания, Швеция, Нидерланды, США, Финляндия, Сингапур, Ирландия, Люксембург, Дания. Россия в данном рейтинге занимает 48 место. Последнее место (141) занимает Судан.
Несмотря на тот факт, что GII рассчитывается почти 10 лет, в дальнейшем исследовании использованы данные 2012-2015гг., отчты [26-29]. Из [28]: «... начиная с 2011 года, GII подвергнут независимой статистической проверке, проведенной Объединенным исследовательским центром Европейского Союза». Данная проверка привела к определенной корректировке и унификации формы представления данных в ежегодных отчетах GII. Именно поэтому в дальнейшей работе анализируются данные с 2012 года по настоящее время. Отметим, что унификация формы данных в отчтах не означает их идентичность. Таким образом, проведение динамического анализа GII представляет собой весьма трудную задачу.
Ежегодно в отчетах GII делается упор на определенный аспект инновационного развития. Так, в последних отчетах особенно отмечаются местные динамики инноваций, человеческий фактор в области инноваций, политика в области инновационного развития.
Опишем концептуальную основу GII. Данный индекс опирается на два субиндекса: - Innovation Input Sub-Index (Инновационный входной субиндекс, IIS который в смысловом контексте можно трактовать как «субиндекс инновационных затрат»). Охватывает элементы национальной экономики, способствующие инновационной деятельности. Рассчитывается на основе 5 агрегированных показателей: 1. Учреждения (обозначим как для j-ой страны); 2. Человеческий капитал и исследования ( ); 3. Инфраструктура ( ); 4. Развитость и удобство внутреннего рынка( ); 5. Развитость и удобство ведения бизнеса ( ). Численное значение Инновационного входного субиндекса для j-ой страны вычисляется по формуле - Innovation Output Sub-Index (Инновационный выходной субиндекс, IOS, который в смысловом контексте можно трактовать как «субиндекс инновационных результатов»). Охватывает достигнутые практические результаты инновационной деятельности в рамках конкретной страны/экономики. Рассчитывается на основе 2 агрегированных показателей: 1. Выход знаний и технологий ( ) – охватывает результаты развития технологий и экономики знаний (Knowledge and technology outputs); 2. Выход созидание/творчество ( ) – охватывает результаты креативной деятельности (Creative outputs). Численное значение Инновационного выходного субиндекса для j-ой страны вычисляется по формуле Каждый из 7 агрегированных показателей (5 для Innovation input Sub-Index и 2 для Innovation Output Sub-Index), в свою очередь, формируется как средневзвешенное из 3 показателей. Всего используется 79 показателей (81 в 2014).
Приведем более подробное описание используемых данных2. Для удобства, применяемые для расчта каждого из 7 агрегированных показателей, назовм «показателями 2-ого уровня». Исходные данные, соответственно, «показателями 3-его уровня».
Описаны данные из отчта GII-2015 [29]. 1-ый агрегированный показатель «Учреждения» содержит 3 показателя 2-ого уровня, описывающих политическую обстановку, нормативно-правовую базу и бизнес среду. Показателей 3-его уровня 8 (2 описывают политическую обстановку, 3 – нормативно-правовой базы, и 3 – бизнес среду).
Агрегированный показатель «Человеческий капитал и исследования» содержит 3 показателя 2-ого уровня, характеризующих системы среднего и высшего образования, а также сферу R&D. Показателей 3-его уровня 11 (5 описывают систему среднего образования, 3 – высшего образования, 3 – сферу R&D). Агрегированный показатель «Инфраструктура» состоит из 3 показателей 2-ого уровня, описывающих экологию, общее состояние инфраструктуры и ИТ технологии. Показателей 3-его уровня 10 (3 описывают экологию, 3 – общее состояние инфраструктуры, 4 – ИТ технологии). «Развитость и удобство внутреннего рынка» описывается 3 показателями 2-ого уровня (кредиты, инвестиции и торговля, конкуренция). Показателей 3-его уровня 9 (3 описывают кредиты, 4 – инвестиции и торговлю, 2 – конкуренцию). «Развитость и удобство ведения бизнеса» описывается 3 показателями 2-ого уровня, характеризующих работников интеллектуальной сферы, усвоение знаний и инновационные связи. Показателей 3-его уровня 14 (5 описывают работников интеллектуальной сферы, 4 – усвоение знаний, 5 – инновационные связи).
Агрегированный показатель «Выход знаний и технологий» также состоит из 3 показателей 2-ого уровня, описывающих создание, влияние и распространение знаний. Показателей 3-его уровня 14 3 (5 описывают создание знаний, 5 – влияние знаний, 4 – распространение знаний).
Порядково-фиксированная паттерн-кластеризация
В данном подразделе предлагается к рассмотрению второй оригинальный метод анализа паттернов, на котором базируется ординальная парно-сопоставительная модель. Данный метод также основан на парном сравнении исследуемых показателей. Как было показано выше, метод анализа паттернов является эффективным инструментарием анализа информации. Вместе с тем, ряд исследований указывают на необходимость «крайне осторожного выбора последовательности анализируемых показателей» при его использовании, поскольку она влияет на форму образуемых паттернов [31]. Потому, актуальной является задача развития данного метода с целью устранения указанной особенности. В работе предложена модификация метода анализа паттернов, позволяющая формировать паттерны объектов вне зависимости от порядка анализируемых показателей. Модификация получила название «порядково-инвариантной паттерн-кластеризации». Разработан алгоритм ее компьютерной реализации, проведена апробация метода с использованием известных наборов данных. Подробное описание предложенного метода приведено в [11].
Опишем основную идею, на которой базируется предложенный метод. Для этого рассмотрим множество из 3 объектов, исследуемое по 3 показателям, значения которых приведены в таблице 5. Данные значения, как и в примере с данными таблицы 3, не требуют нормировки, т.к. их сравнение и визуализация не представляет собой особых трудностей.
Далее, проверим возможность соотнесения объектов 1-3 в единый кластер при рассмотрении других возможных последовательностей показателей A,B,C (на рисунке 6 приведены последовательности A,C,B и B,C,A).
На рисунке 6 наглядно видно, что, в общем случае, кусочно-линейные функции теряют схожесть при изменении последовательности исследуемых показателей. При использовании порядково-фиксированной паттерн кластеризации, получим аналогичный вывод. Порядково-инвариантная паттерн-кластеризации базируется на идеи объединения объектов, не меняющих свою принадлежность к определнному кластеру при изменении последовательности исследуемых показателей. Следует отметить, что существование подобных кластеров не является очевидным. Подобную возможность продемонстрируем на примере данных таблицы
Определение 2. Кластеризацию, результат которой не зависит от последовательности показателей исследуемых объектов, будем называть «порядково-инвариантной паттерн-кластеризацией», а кластеры, полученные в результаты ее применения, соответственно, порядко-инвариантными паттерн-кластерами.
Для использования всех возможных перестановок потребуется исследовать m! перестановок, что потребует значительных временных затрат. Поэтому предлагается альтернативный метод. Для начала, проводится порядково-фиксированная паттерн-кластеризация, разделяющая множество X на порядково-фиксированных паттерн-кластеров. Это позволяет уменьшить необходимое в дальнейшем количество операций. Далее, каждому объекту ставим во взаимно однозначное соответствие полный взвешенный орграф , вершины которого соответствуют значениям показателей , а вес рбер определяется соотношениями соответствующих вершин. Количество необходимых парных сравнений показателей определяется общим количество рбер соответствующего графа (учитывая что 2 показателя соединяются единственным ребром) по формуле
Применение новых методов анализа паттернов на классических тестовых данных «Anderson-Fisher Iris Data»
При дальнейшем анализе можно отметить, что хотя все объекты порядково инвариантного паттерн-кластера и обладают схожей внутренней структурой, однако показатели первого и второго объектов существенно ниже аналогичных показателей четвертого и пятого объектов. В некоторых задачах данный факт может иметь существенное значение. В связи с этим, выше описан алгоритм, позволяющий выделять группы объектов не только схожих по структуре исследуемых показателей, но и по близости их значений. Для решения подобной задачи возможно использовать метрические соотношения. В работе предложен альтернативный подход: общности структуры объектов определяются с целью выделения «функционально близких». В связи с этим, в работе предлагается использование весьма распространенного в технических системах понятия «функциональной взаимозаменяемости» [59], определяемой как «связь в определенных пределах между функциональными параметрами деталей и узлов (блоков) и их экономическими оптимальными эксплуатационными показателями».
Применительно к решаемой в рамках данной работы задаче, функциональную взаимозаменяемость будем определять как способность двух и более объектов оставаться в рамках одного кластера при взаимном обмене значениями соответствующих показателей.
Продолжим рассмотрение порядково-инвариантного паттерн-кластера . Последовательно обменяем значения показателей A, B и С объектов 4 и 5 (см. Рисунок 14), и рассмотрим, как меняются соответствующие объектам кусочно линейные функции. На первом шаге имеем и , на втором – и , на третьем – и Рисунок 14. Кусочно-линейные функции объектов и при взаимном обмене показателей. На рисунке выше наглядно видно, что, несмотря на взаимный обмен соответствующих показателей объектов и , все кусочно-линейные функции по-прежнему остаются весьма схожими. Доминирующее в количественном значении положение занимает показатель «А», затем – показатель «С». Наименьшее значение у показателя «В».
Проведем аналогичный обмен показателей объектов 1 и 2. На первом шаге получаем и , на втором – и , на третьем – и . Кусочно линейные функции объектов изображены на рисунке 15. Рисунок 15. Кусочно-линейные функции объектов и при взаимном обмене показателей. При взаимном обмене данных показателей по-прежнему наблюдается схожее соотношение показателей исследуемых объектов: наибольшее значение у показателя «А», затем следуют показатели «С» и «В». Таким образом, взаимный обмен значениями показателей объектов и , а также объектов и существенным образом не влияет на характер кусочно-линейных функций. Однако, ситуация кардинальным образом изменится при взаимном обмене показателей второго (или первого) объекта с показателями пятого (или четвртого) объектов. Для наглядности, изобразим на рисунке 16 подобный обмен показателей объектов и На первом шаге получаем и , на втором – и , на третьем –
Для первого и четвертого объектов при взаимном обмене соответствующих показателей ситуация является аналогичной. Таким образом, в порядково-инвариантном паттерн-кластере можно выделить два подкластера: и . Объекты каждого из подкластеров обладают не только схожей структурой показателей, но и весьма близкими количественными значениями, поскольку взаимный обмен соответствующих показателей не приводит к существенному изменению кусочно линейных функций. Данные подкластеры предлагается называть «диффузионно инвариантными паттерн-кластерами», а общее их количество обозначать . На рисунке 17 изображено разбиение порядково-инвариантного паттерн-кластера на 2 диффузионно-инвариантных паттерн-кластера: и . Рисунок 17. Слева направо: , и . Далее, рассмотрим порядково-инвариантный паттерн-кластер ={ , }. На шаге 1 получим и ; на шаге 2 – и ; на шаге 3 – Кусочно-линейные функции изображены на рисунке 18.
Исходя из формы кусочно-линейных функций, изображенных на рисунке 18, объекты и не теряют своей схожести при взаимном обмене показателей. При использовании порядково-инвариантной паттерн-кластеризации на каждом описанном выше шаге исследуемые объекты остаются в едином кластере. Таким образом, данные объекты образуют диффузионно-инвариантный паттерн-кластер. Рассмотрим следующую теорему [10]. Теорема 3. Пусть два объекта х1=(х11,х12,...,х1т) и х2=(х21, х22,...,х2т) принадлежат одному кластеру v, построенному с использованием евклидова расстояния - d x,z ) RV между объектами и центром кластера z = (z1,z2,...,zn), где Rv - радиус кластера. Образуем новые объекты х1 и х 2 , обменяв соответствующие значения одной из координат исходных объектов х1 и х2
Исследование выходных показателей Глобального индекса инноваций
Паттерн-2_«ИИ», как и в предыдущем случае, характерен для 3 регионов России. Отличительными особенностями данного паттерна являются крайне низкие значения показателей «Наука» и «Население», и относительно низкие значения остальных показателей. Наивысшие значения демонстрирует показатель «Студенты», далее – показатель «Связь». Дальнейшее описание полученных результатов приведено в приложении 6.
В данном разделе описаны итоговые расчты индексов. Для этого использованы результаты, приведенные ранее в разделе 3, и на их базе вычислены предложенные в разделе 2 индексы. Для начала, приведем построение порядково-инвариантного инновационного индекса согласно формуле Поскольку для всех рассматриваемых в разделе случаях, очевидно, что, в каждом исследуемом периоде времени t 0.
Основываясь на результатах, полученных на базе входных показателей Глобального индекса инноваций за 2015 год, проведем расчеты соответствующего индекса. Всего исследовалась 141 страна, получено 30 паттернов, 16 стран характеризуются уникальными кусочно-линейными функциями. Таким образом, порядково-инвариантный инновационный индекс рассчитывается как Фактически, рассчитанный выше индекс дает общее представление о количественном различии внутренних структур исследуемых объектов. Как описано в разделе 1, основные подходы к измерению инноваций предполагают агрегирование некоторого количества показателей к одному конкретному индексу, позволяющему оценить уровень инновационного развития страны/региона. Предложенные в работе индексы позволяют дать общую оценку неоднородности всей исследуемой системы. Заметим, что значение весьма схоже с результатом, полученным в 2.7 при рассмотрении простого примера с множеством и разбиением его на и (исходные значения показателей исследуемых объектов приведены ранее в таблице 6). В простом примере . Однако, ситуации весьма различны. Следует рассматривать не только конечный индекс, но и минимальное возможное его значение (кроме 0; предполагая, что количество порядково-инвариантных паттерн-кластеров равно 2). Обозначим данные минимальные значения как и соответственно. Точность вычисления увеличим для сравнения в динамике. Таким образом, Очевидно, что при уменьшении количества исходных объектов увеличивается минимально возможное значение индекса (кроме 0), что необходимо учитывать при исследовании неоднородности инновационного развития.
Приведем расчеты других порядково-инвариантных инновационных индексов для входных показателей GII 2012-2014 гг.
В 2014 году всего исследовались 143 страны, получено 26 паттернов, 21 страна характеризуются уникальными кусочно-линейными функциями. Таким образом, Заметим, что при составлении GII-2014 исследовалось на 2 страны больше. Таким, образом, Наглядно видно, что , поскольку в GII-2015 исследуется меньшее число стран. В Глобальном индексе инноваций 2013 года исследуется 142 страны. На базе входных показателей построены 21 паттерн, у 17 стран уникальные кусочно-линейные функции.
Порядково-инвариантные инновационные индексы 2013-2016гг. показывают схожие значения, что частично можно объяснить большим территориальным охватом и относительно небольшим временным промежутком. Однако, в связи с некоторыми особенностями показателей GII-2012, описанными в разделе 1, можно предположить, что порядко-инвариантный инновационный индекс за 2012 год будет отличаться. Также отметим, что большое количество стран отличается уникальными кусочно-линейными функциями (57 за 2012 год). Аналогично, проведем расчеты порядково-фиксированных инновационных индексов. Данные использования порядково-фиксированной паттерн кластеризации относительно входных данных Глобального индекса инноваций приведены в приложениях 1-4. Отметим, что при анализе соответствующих порядково-фиксированных паттерн-кластеров было выявлено, что наиболее предпочтительным, в данном случае, является использование порядково-инвариантной паттерн-кластеризации в связи с большей точностью конечных результатов. Однако, порядково-фиксированная паттерн-кластеризация может являться инструментом предварительного анализа данных.
Расчет порядково-фиксированного инновационного индекса производится согласно формуле Для всего рассматриваемого периода количество полученных порядково-фиксированных паттерн-кластеров больше 1. В 2015 году получено 9 паттернов, 10-ый является уникальным (характерен для Боливарианской Республики Венесуэла). Следовательно,
Таким образом, выполняется соотношение, описанное в разделе 2: . В 2014 году получено 8 паттернов, 4 исследуемые страны описываются уникальными кусочно-линейными функциями (в т.ч. и Боливарианская Республика Венесуэла). При расчете порядково-фиксированного инновационного индекса получим 0,08. В 2013 году на базе входных показателей Глобального индекса инноваций построены 7 паттернов и 3 уникальных кусочно-линейных функции. 0,07. В 2012 году получено 16 паттернов, 7 уникальных объектов. Следовательно, 0,16. Как и в случае вычисления порядково-инвариантного инновационного индекса, порядково-фиксированный инновацинный индекс 2012 года существенным образом отличается от 2013-2015гг. Таким образом, проведен расчет предложенных в работе индексов неоднородности инновационного развития. Аналогичным образом может быть произведен расчет на других данных.
Отметим, что Л.М. Гохбергом и В.В. Поляковой в [28] указывалось, что трудно найти унифицированный подход к оценке взаимосвязей между социальными ценностями, навыками и инновациями, а также разработке политики, направленной на укрепление общественного доверия. Схожую идею высказал генеральный директор Всемирной организации интеллектуальной собственности (ВОИС) 28 Ф.Гарри: «каждый народ должен найти правильное сочетание политики, направленной на мобилизацию врожденного инновационного и творческого потенциала в своих странах» [67]. Предложенные индексы могут использоваться в качестве дополнительного метода оценки качества инновационного развития на национальном уровне. К примеру, в работе использованы новые методы анализа паттернов для World Intellectual Property Organization. исследования входных данных Индекса инновативности (методика Независимого института социальной политики). На базе полученных результатов можно исследовать не только неоднородность инновационного развития на территории РФ, но и определять, насколько однороден каждый административный округ с точки зрения исследуемых показателей, что позволяет, в случае необходимости, давать практические рекомендации по выбору инновационной стратегии.
В данном разделе к агрегированным показателям Глобального индекса инноваций, показателям индекса инновативности, а также к мировым данным образования и патентной активности применены новые методы анализа паттернов, описанные в разделе 2. На основе всех исследуемых данных построены паттерны, приведено их описание.
Построены индексы неоднородности инновационного развития, основанные на новой ординарной парно-сопоставительной модели. Расчеты индексов приведены на конкретных примерах.