Содержание к диссертации
Введение
Глава 1 Региональная социально-экономическая система, предпосылки совершенствования методологии управления 19
1.1. Базовые императивы организации процессов управления экономических систем мезоуровня 19
1.2. Проблемы исследования закономерностей функционирования и оценки реального уровня и состояния СЭС 36
1.3. Системный подход и требования к методологии исследования СЭС 50
1.4. Методологические принципы управления СЭС с использованием слабоструктурированной информации 57
Глава 2 Методология формирования модельного базиса процессов принятия решений в управлении СЭС мезоуровня 76
2.1. Когнитивное моделирование слабоструктурированных проблем 77
2.2. Разработка системы построения моделей районных и региональных СЭС 106
2.3. Разработка методики прогнозирования социально-экономических процессов с использованием метода группового учёта аргументов (МГУА) 117
Глава 3. Концептуальный подход применения классических методов анализа структурированных данных при управлении в социально-экономических системах
3.1. Измерения в социально-экономических исследованиях 129
3.2. Особенности применения современных методов статистического моделирования 145
3.3. Аспекты практического использования статистических моделей в СЭС 181
Глава 4. Перспективы использования информационных систем анализа структурированных данных в СЭС для повышения эффективности управления и перехода к «экономике знаний» 196
4.1. Системы статистического анализа данных, возможности и ограничения 196
4.2. Новая парадигма в анализе данных 202
4.3. Поддержка принятия управленческих решений в СЭС с использованием систем интеллектуального анализа данных 210
Глава 5. Моделирование сложных систем на примере АПК и рынка труда Краснодарского края 242
5.1. Ретроспективный анализ СЭС Краснодарского края 243
5.2. Когнитивное моделирование АПК Краснодарского края и его подсистем 249
5.3. Статистический анализ данных в СЭС 261
5.4. Многомерный анализ данных службы занятости 285
5.5. Интеллектуальный анализ данных службы занятости . 298
Заключение 318
Литература 326
Приложения 3 59
- Проблемы исследования закономерностей функционирования и оценки реального уровня и состояния СЭС
- Разработка системы построения моделей районных и региональных СЭС
- Особенности применения современных методов статистического моделирования
- Поддержка принятия управленческих решений в СЭС с использованием систем интеллектуального анализа данных
Введение к работе
Актуальность темы исследования. Трансформация в сфере экономики России, произошедшая в последние десятилетия, привела к переходу от командно-административного к либерально-рыночному управлению и повлекла за собой необходимость адекватного изменения структуры и алгоритмов управления различными по масштабам и уровням агрегации систем мезоуровня. Общая интеллектуализация воспроизводственных процессов актуализирует исследования подходов, методов и технологий принятия управленческих решений, соответствующих требованиям точности, адекватности и своевременности, что определяет необходимость совершенствования информационного обеспечения процессов управления социально-экономическими системами (СЭС) мезоуровня, сформированного на основе принципиально новых идей, основанного на использовании всей наличной информации, современных методов интеллектуального анализа данных, системно активизирующих потенциал современных инструментарно-аналитических и программных средств, повышающих эффективность труда управленцев. Вместе с тем, существующая в настоящее время сфера их применения ограничивается лишь достаточно узким спектром хорошо формализованных задач управления. Данный факт обусловливает актуальность разработки специализированных, совершенствования и адаптации существующих способов организации взаимодействий в эргатических системах управления. Несмотря на целый ряд системных исследований СЭС мезоуровня в настоящее время отсутствует методология использования количественно-качественной информации для поддержки процесса принятия управленческих решений. Современное состояние национальной экономики требуют дальнейшей разработки концептуальных и методологических основ анализа данных и оптимизации деятельности структур управления в условиях неопределенности, а также разработки соответствующих информационных систем поддержки принятия решений. Наличие большой совокупности нерешенных проблем в указанной области определило выбор направления, цели и задачи исследования.
Степень разработанности проблемы. В диссертации степень разработанности проблемы рассматривалась в четырех аспектах: с практических позиций (как изучены вопросы связи различных экономических систем мезоуровня и какими методами возможно проведение необходимых для этого исследований); с точки зрения имеющихся знаний в этой области в современной экономике; с позиций ее теоретической и методологической разработанности в современной теории сложных систем и их слабоструктурированных проблем; а также с позиций применения современного аппарата интеллектуального анализа данных в исследованиях состояния СЭС и информационного обеспечения поддержки управленческих решений для обеспечения устойчивого и безопасного их развития.
Обзор доступных к рассмотрению работ по исследованиям, связанным с совершенствованием управления социальными и экономическими системами, показал, что имеются исследования отдельных аспектов изучения СЭС и их эффективного развития, но они не доведены до возможности практической реализации. Существуют методологические и информационные основы оценки их текущего состояния и системного подхода к определению перспективных направлений развития.
Методологические аспекты управления экономическими системами на различных уровнях отражены в работах зарубежных (М. Альберта, И. Ансоффа, У. Баумоля, П. Друкера, Б. Карлоффа, Ф. Котлера, М. Мескона, Д. Сакса, А. Файоля, Ф. Хедоури и др.) и отечественных (Л.И. Абалкина, С.С. Алексеева, В.М. Белоусова, М.А. Боровской, С.В. Глазьева, А.Г. Зельднера, Н.П. Кетовой, Ю.С. Колесникова, С.В. Крюкова, А.Я. Лифшица, Б.З. Мильнера, В.Н. Овчинникова, В.Ф. Яковлева и др.) ученых.
Важность анализа современного состояния теории измерений и необходимости разработки методологии эконометрического моделирования можно подтвердить многочисленными публикациями ведущих ученых, таких как Б.В. Гнеденко, В.В. Налимов, А.И. Орлов, Ю.Н. Толстова и др.
Системному исследованию сложных систем посвятили свои работы
В.Н. Волкова, А.А. Денисов, Ф.И. Перегудов, Ф.П. Тарасенко и др.; когнитивному моделированию – Г.В. Горелова, Е.Н. Захарова, Е.К. Корноушенко, В.И. Максимов, А.Н. Райков, Р. Солсо и др.
Вопросам управления сложными объектами на основе информационных механизмов посвящены труды В.Н. Буркова, Т.П. Барановской, А.К. Еналеева, В.А. Ирикова, В.И. Лойко, Е.В. Луценко, Н.Н. Лябаха, Л.Г. Матвеевой, Д.А. Новикова, Н.Н. Пушкарева, М.И. Семенова, В.Н. Тренева и др. При исследовании проблем управления СЭС мезоуровня использовались исследования известных экономистов (А.И. Алтухова, А.А. Багмута, А.И. Костяева, В.И. Нечаева, А.Н. Голубева, Е.С. Оглоблина, П.Ф. Парамонова, Л.Г. Раменского,
Г.А. Романенко, Х.О. Реппа, Б.А. Рунова, А.А. Семенова, П.С. Федорука,
И.Т. Трубилина и др.); а также зарубежных и российских ученых, посвятивших свои работы изучению проблем занятости населения, таких как Ham, Sveinar and Terrell; Lubyova, Van Ours, Earl, Pauna, Micklewright, Nagy, Sollogub, Pascal, Foley, Т. Четвернина, Л.И. Ниворожкина, Е.М. Ниворожкин, А.Г. Шухмин.
Теоретической и методологической базой исследования послужили работы таких зарубежных ученых, как С. Бир, К. Гёдель, К. Доугерти, Н. Дрейпер,
Л. Заде, Л. Закс, Дж. Касти, В. Каплан, М. Кендэл, М. Клайн, Г. Крамер,
Т. Кун, К. Пирсон, Г. Пятецкий-Шапиро, Р. Солсо, А. Стюарт, Дж. Тьюки,
В. Феллер, Р. Фишер, Ф. Фишер, Г. Фогель, Г. Харман и др., а также российских ученых, таких как С.А. Айвазян, С.Б. Арсеньев, В.М. Бухштабер,
А.М. Гатаулин, В. Дюк, И.С. Енюков, А.Г. Ивахненко, М. Киселев, Н. Кречетов, Ю.В. Линник, А.А. Макаров, А. Масалович, Л.Д. Мешалкин, В.С. Мхитарян, А.О. Недосекин, Н.Б. Паклин, Л.И. Трошин, Ю.Н. Тюрин и др.
Цели и задачи исследования. Целью настоящей работы является разработка теоретико-методологических основ и построение информационного обеспечения исследования состояния и динамики социально-экономических систем мезоуровня для принятия управленческих решений на основе применения разведочного, многомерного, интеллектуального анализа данных и когнитивного моделирования.
В соответствии с целью в работе поставлены и решены следующие задачи:
-
Обосновать концепцию исследования и управления СЭС на основании использования структурированной и слабоструктурированной информации; провести анализ состояния систем управления СЭС, что необходимо для теоретического обоснования разрабатываемой методологии изучения и совершенствования управления СЭС.
-
Провести формализацию проблемы принятия управленческих решений в виде комплекса математических моделей, основываясь на принципах системного анализа, теории управления и когнитивного анализа; адаптировать известные методы когнитивного анализа к решению задач управления и принятия решений в экономических системах мезоуровня, что необходимо для разработки методологии поддержки принятия управленческих решений в СЭС.
-
Разработать методологию, основанную на синтезе когнитивного подхода и интеллектуального анализа данных, и инструментарий формирования информационного обеспечения исследования состоянии СЭС мезоуровня на основе структуры интеллектуальной информационной системы построения моделей задач принятия решений, состоящей из баз данных, аналитического инструментария, что необходимо для поддержки принятия управленческих решений в СЭС.
-
Обосновать концептуальные подходы применения классических и современных методов анализа данных для моделирования СЭС – это позволит реально оценить возможности указанных методов для исследования экономических систем мезоуровня; перспективы использования современных прикладных программ по анализу информации (данных), что необходимо для включения средств интеллектуального анализа данных (ИАД) в состав структуры информационной системы построения моделей, для поддержки управленческих решений в СЭС и перехода к экономике «знаний».
-
Разработать программное обеспечение для построения моделей в виде решения задачи непараметрической идентификации на основании метода группового учета аргументов, что необходимо для прогнозирования развития процессов в СЭС.
-
Разработать на основе проведения статистического и экспертного анализа состояния социально-экономической системы АПК Краснодарского края и результатов ее диагностики систему когнитивных моделей, реализующую иерархическое описание взаимосвязанных подсистем механизма СЭС на мезоуровне (взаимодействия производственной и непроизводственной сфер производства продукции растениеводства; рынка труда в АПК; схемы работы службы занятости (СЗ) населения), что необходимо для представления механизма функционирования региональной экономической системы как в целом, так и отдельных ее подсистем и провести когнитивное моделирование, включающее анализ устойчивости, сценарное моделирование, необходимые для выявления среди различных структур экономического механизма устойчивых вариантов и разработки принятия управленческих решений.
-
Разработать модели влияния материально-денежных затрат на производство продукции растениеводства для повышения урожайности зерновых культур, выявления резервов снижения себестоимости и обеспечения конкурентоспособности продукции.
-
Провести оценку эффективности агротехнологий по результатам многолетних многофакторных опытов в Кубанском НИИСХ, что необходимо для реализации управленческих решений при производстве зерновых.
-
Разработать статистические, многомерные и интеллектуальные модели, объясняющие процессы перехода из категории безработных в занятое население по данным одной из районных служб занятости, что необходимо для оценки зависимости уровня занятости населения от влияния различных социальных и экономических факторов.
Объект и предмет исследования. Объект исследования – процессы управления развитием СЭС мезоуровня, основанные на реализации потенциала информационно-аналитических средств в разработке и адаптации технологий, обеспечивающих принятие управленческих решений.
Предмет исследования – информационные и аналитические технологии в управлении социально-экономическими системами; методологические, теоретические, методические и практические проблемы анализа информации, для принятия обоснованных управленческих решений.
Работа произведена в рамках пунктов паспорта специальности 05.13.10 – Управление в социальных и экономических системах:
6. «Разработка и совершенствование методов получения и обработки информации для задач управления социальными и экономическими системами»;
7. «Разработка методов идентификации в организационных системах на основе ретроспективной, текущей и экспертной информации».
Концепция диссертационного исследования. Авторская концепция рассматриваемой проблемы представлена системой следующих взаимосвязанных положений.
Совершенствование управления в экономических системах невозможно без исследования, «содержательной» обработки данных о социально-экономическом состоянии и разработке на основе этого эффективных управленческих решений.
Концептуальные особенности применения современных методов анализа структурированных данных (прикладной статистики и интеллектуального анализа данных) обусловливают ограничения и особенности применения при изучении экономических систем мезоуровня. Отсутствует методология исследования и принятия решений, основанная на информационном обеспечении процесса управления, системном подходе к слабоструктурированным проблемам и когнитивном моделировании, а также методах интеллектуального анализа данных (методология – это основа разработки интеллектуальной системы поддержки управленческих решений, без которой невозможно в современных условиях совершенствование управления).
Теоретико-методологическая основа исследования. В работе использованы положения экономической теории, теории систем и системного анализа, теории управления, методы и модели когнитивного анализа, многомерного статистического анализа.
Инструментально-методический аппарат. В исследовании использованы методы прикладной статистики, многомерного представления данных в виде кубов OLAP, интеллектуального анализа данных и т. д., а также пакеты прикладных программ по анализу структурированной (Statistica, PolyAnalyst, Deductor) и слабоструктурированной (ПС КМ – программная система когнитивного моделирования) информации.
Информационной базой исследования послужили информационные источники Федеральной службы государственной статистики по отчетности предприятий АПК Краснодарского края, служб занятости населения за период 2000–2007 гг., данные российских и зарубежных порталов.
Научная новизна заключается в разработке методологии исследования и принятия решений, основанной на информационном обеспечении процесса управления при наличии слабоструктурированной и структурированной информации, предложении схемы получения математических моделей на основе синтеза методов когнитивного моделирования и анализа структурированной информации, базирующихся на современных информационных технологиях, которая может быть положена в основу структуры системы поддержки принятия решений в СЭС мезоуровня. Конкретно элементы научной новизны заключаются в следующем:
– обосновании применения методов и подходов к управлению СЭС, которые отличаются рассмотрением влияния на систему внешней среды («пограничного слоя системы»), а также свойств системы не только на уровне качественных или усредненных количественных признаков, но и использующих знания, заключающиеся в данных, что дает возможность научно диагностировать состояние СЭС и обосновывать эффективные управленческие решения;
– разработке теоретико-множественной модели метанабора системы исследования и принятия управленческих решений СЭС, характеризующей не только описание системы, но и окружающей среды, отличающейся от близких по смыслу возможностью выполнить основные требования системности;
– разработке методологии и инструментария формирования информационного обеспечения исследования состояния СЭС мезоуровня и принятия управленческих решений, позволяющих перейти на инструментально-технологический уровень извлечения знаний из имеющейся количественно-качественной информации, что предоставило возможность реализовать системный подход к изучению сложных систем и рассмотреть не только саму систему, но и «пограничный слой», характеризующий взаимоотношения с внешней средой;
– оценке современного состояния моделирования систем на основании статистической информации, отличающейся сравнительным обзором методов, традиционно относящихся к методам математической статистики, с методами разведочного анализа данных, что позволило выявить границы применимости указанных методов, заключающиеся в априорном предположении о виде изучаемой зависимости (обычно линейной), природе изучаемых данных (вероятностной или геометрической); оценке современных систем анализа структурированной информации, отличающейся обоснованием методов интеллектуального анализа данных на основе формулировки «новой парадигмы» в анализе данных, соответствующей принципам научного подхода к изучаемым системам и объектам, основанного на знаниях, предположительно содержащихся в данных; это дало возможность рассматривать данные как информационную модель объекта, которая может описываться в трех основных вариантах – вероятностном, геометрическом и когнитивном (основанном на знаниях – экспертных либо содержащихся в данных);
– разработке программного обеспечения для прогнозирования социально-экономических процессов, позволяющего получать адекватные прогнозы в виде нелинейных моделей авторегрессии, с удобным интерфейсом, соответствующим идеологии Windows;
– разработке системы когнитивных моделей в виде укрупненной когнитивной карты социально-экономического механизма АПК Краснодарского края и когнитивных карт различных подсистем ее социально-экономической системы, отличающейся целью построения (повышение эффективности управления) и содержанием от известной обобщенной модели регионального экономического механизма Гранберга (адаптация к конкретным условиям края), а также детальной проработкой отдельных его блоков (когнитивные карты подсистем); это дало возможность целостно представлять СЭС, не теряя деталей, объяснять механизм ее функционирования и решать различные системные задачи, проводя когнитивное моделирование и анализ данных, реализующих описание объекта в виде функционального графа;
– разработке системы моделей, характеризующей влияние затрат на производство продукции растениеводства, отличающейся расширением диапазона априорных предположений о природе изучаемых данных; это дало возможность разностороннего описания изучаемых зависимостей как базы для эффективного управления производством;
– разработке моделей ковариационного анализа, включающих помимо технологических факторов климатические; это позволило осуществлять прогноз урожайности зерновых в северной зоне Краснодарского края и рационально управлять материальными и трудовыми ресурсами;
– разработке рекомендаций по формированию стратегии управления СЭС мезоуровня (в том числе АПК и рынком труда), отличающейся примененной методологией, основанной на синтезе когнитивных, многомерных, статистических моделей, проведенной диагностикой состояния, что дало возможность на примере АПК предложить приоритетную на данном периоде систему направлений развития: первоочередное – развитие агропромышленного комплекса с его специализацией на производстве зерна, технических культур и продукции животноводства; другое направление – создание и развитие в районах информационно-консультационных служб, которым рекомендуется использование систем поддержки принятия решений (СППР) на основе предлагаемой методологии.
Теоретическая ценность результатов исследования определяется актуальностью исследования, научной новизной и заключается в разработке методологии и методического обеспечения при изучении социально-экономических систем и позволяет развивать научные и методологические основы создания систем поддержки принятия управленческих решений для изучения социально-экономических систем при наличии слабоструктурированных и структурированых данных.
Практическая значимость проведенных исследований состоит в том, что на основе обобщения известных научных результатов, а также научных результатов, полученных автором, появилась возможность развивать научные и методологические основы создания систем поддержки принятия управленческих решений для изучения социально-экономических систем при наличии слабоструктурированных и структурированных данных. Разработанная автором методология может быть реализована как с помощью известных программных средств, так и создана под реальные СЭС (например, АПК, рынка труда), включена в процесс разработки управленческих решений на мезоуровне и доведена до инструментально-технологического уровня.
Предложения и рекомендации, сформулированные в результате исследования по диагностике состояния АПК и рынка труда, построения сценариев развития и прогнозирования, нашли применение при разработке мероприятий департаментом сельского хозяйства и продовольствия муниципального образования г. Краснодар, в работе Кубанского НИИСХ им. П.П. Лукьяненко, а также при выполнении исследований по гранту РНП 3.4.1.8107 № 01.2.006 10857 Министерства образования и науки РФ «Интеграция молодежи в отношения труда и занятости» (2006–2007 гг.).
Учебные пособия «Теория вероятностей и математическая статистика в примерах и задачах с применением Excel», «Практикум по анализу данных на компьютере» имеют грифы Министерства образования РФ и УМО по прикладной информатике соответственно и используются в учебном процессе при изучении курсов «Теория вероятностей и математическая статистика», «Эконометрика», а также спецкурсов, при подготовке специалистов по прикладной информатике в экономике, другим специальностям и являются базовыми для подготовки аналитиков в области обработки данных для принятия управленческих решений в экономике и используются в учебном процессе Кубанского государственного аграрного университета (г. Краснодар), Технологического института ЮФУ (г. Таганрог) и Ростовского государственного университета путей сообщения (г. Ростов-на-Дону).
Основные положения диссертации, выносимые на защиту
-
Концепция исследования и управления СЭС мезоуровня на основании структурированной и слабоструктурированной информации в соответствии с принципом «мягких вычислений» для решения задач принятия управленческих решений, что позволяет теоретически обосновать использование всей количественно-качественной информации о функционировании СЭС, основываясь на синтезе когнитивного подхода и методов интеллектуального анализа данных.
-
Модель метанабора системы исследования и принятия решений по управлению СЭС, состоящая из различных моделей объекта, полученных в результате параметрической и структурной идентификации; моделей окружающей среды; моделей взаимодействия объекта и окружающей среды; когнитивных моделей, реализующих внешнее описание системы, полученное на основании структуризации знаний экспертов; моделей управления системой; моделей получения сценариев развития на основе импульсного моделирования, что позволяет реализовать системный подход при изучении СЭС и использовать знания о законах и закономерностях развития сложных систем.
-
Методология формирования информационного обеспечения исследования состояния СЭС мезоуровня, состоящая из источников информации, информационно-аналитического инструментария оценки состояния социально-экономической системы, основанного на применении разведочного, многомерного, интеллектуального анализа данных и когнитивного моделирования, что позволило осуществить алгоритмический подход к построению математических моделей СЭС для решения задач управления.
-
Концептуальный подход к моделированию СЭС мезоуровня, основанный на синтезе когнитивного моделирования и методов изучения структурированных данных, ориентированный на предположение о вероятностной или геометрической природе данных и априорной линейности изучаемых моделей (что позволило показать изоморфность указанных методов задаче параметрической идентификации), а также использовании систем интеллектуального анализа данных (ИАД) для объективного моделирования деятельности СЭС (содержательно-целевой подход), что позволяет перейти к экономике «знаний».
-
Программное обеспечение получения моделей по методу группового учета аргументов в виде полиномов авторегрессии второго порядка, позволяющее получать прогноз согласно принципам свободы выбора решений, множественности математических моделей, идеологии бутстреп метода, и получения модели прогноза в виде решения задачи непараметрической идентификации.
-
Система когнитивных моделей, идентифицирующих объект исследования, состоящая из укрупненной когнитивной карты экономического механизма АПК Краснодарского края, отражающей взаимосвязь и взаимодействие между вершинами когнитивной карты – блоками внешней среды (федеральные регулирующие системы, межрегиональный и внешнеэкономический обмен, природная среда) с блоками внутренней среды (производство, валовое накопление, конечное потребление, региональная финансовая система, занятость, социальная сфера, население и др.) и блоками-подсистемами внутренней среды (когнитивные карты «Взаимодействие производственной и непроизводственной сфер производства продукции растениеводства», «Рынок труда в АПК», «Схема работы службы занятости населения»), что позволило моделировать на качественном уровне (сценарный анализ) тенденции развития экономики в региональных социально-экономических условиях на когнитивных картах, а при наличии количественных концептов строить модели, реализующие модель в виде функционального графа.
-
Система математических моделей взаимосвязи факторных и результативных признаков производства, построенных на основе методов регрессионного анализа и эволюционного программирования, что позволило провести разносторонний анализ влияния производственных затрат и разработать обоснованные управленческие решения по повышению экономической эффективности отрасли растениеводства.
-
Выводы об экономической эффективности агротехнологий, полученные на основании математических моделей по результатам многолетних, многофакторных опытов в Кубанском НИИСХ, что позволяет обоснованно принимать управленческие решения (ресурсосберегающие технологии, использование высокоурожайных сортов, комплексное применение удобрений) и на разных стадиях возделывания прогнозировать урожайность зерновых.
-
Результаты изучения процессов трудоустройства по данным одной из служб занятости Краснодарского края; это позволяет на современном научном уровне оценивать и выявлять проблемы занятости, социально-экономические структуры и сценарии развития, обосновывать выбор управленческих решений по снижению безработицы, что необходимо для обеспечения роста занятости, приводящего к повышению благосостояния населения края.
Апробация и внедрение результатов исследования. Результаты исследований опубликованы в 56 публикациях (общий объем свыше 139 печ. л., из которых 85,6 печ. л. – это авторский вклад).
Основные результаты диссертационного исследования наиболее полно отражены в монографии «Структура и инструментарий системы информационного обеспечения рынка труда и занятости молодежи», а также в целом ряде статей в научных и научно-производственных журналах, сборниках, учебных и методических пособиях.
Результаты исследований на различных этапах представлялись в научных докладах на Первой научно-практической конференции МГТИ (г. Майкоп, 1996), научных конференциях КГАУ (1997–2007 гг.), 4-й региональной научно-практической конференции молодых ученых «Научное обеспечение агропромышленного комплекса» (г. Краснодар, 2002), конференции «Экология, город, почвы» (г. Краснодар, 2003), III Международной научно-практической конференции «Проблемы регионального управления, экономики, права и инновационных процессов в образовании» (г. Таганрог, 2003), IV Международной конференции «Новые технологии в управлении, бизнесе и праве» (г. Невинномысск, 2004), X Международной конференции «Системный анализ в проектировании и управлении» (г. Санкт-Петербург, 2006), Международной конференции «International Conference on Artificial Intelligent Systems. AIS-2006», (г. Таганрог, 2006), XIV Международной конференции «Проблемы управления безопасностью сложных систем» (г. Москва, 2006), XI Международной конференции «Системный анализ в проектировании и управлении» (г. Санкт-Петербург, 2007), XV Международной конференции «Проблемы управления безопасностью сложных систем» (г. Москва, 2007).
Структура работы. Диссертационная работа состоит из введения, пяти глав, заключения, списка литературы. Работа изложена на 379страницах машинописного текста, включает 19 таблиц, 79 рисунков. Список литературы содержит 352 наименования (в том числе 36 – зарубежных авторов). Данная структура отражена в оглавлении диссертации.
Проблемы исследования закономерностей функционирования и оценки реального уровня и состояния СЭС
Большое количество подобных структур, отсутствие взаимодействия между ними приводят к проблемам обмена информацией, согласования интересов, объединения, унификации форм учёта незанятого населения, создания объединённых информационных ресурсов. Многие государственные, частные и общественные организации имеют соответствующие интернет-ресурсы. Возникает проблема согласования потребностей рынка труда в определённых специалистах и имеющихся вакансий. Существующие подходы ориентируются на небольшие объёмы информации и предполагают.
Одним из возможных решений проблемы занятости, а точнее ускорения согласования спроса и предложения на рынке труда является создание единой информационной системы - базы данных рынка труда. Вопросы прав на ту или иную информацию могут оговариваться дополнительно и здесь не рассматриваются.
Имеет место проблема согласования интересов работодателей и субъектов рынка труда. Возможный вариант - это унификация анкет, заполняемых безработными и работодателями. При сравнении можно говорить о полном или о частичном соответствии. Эти проблемы можно решать методами прикладной статистики.
В сфере рынка труда наряду с макроэкономическими решениями, формирующими экономическую, правовую среду и рыночную среду в сфере трудовых отношений, в 88 регионах России созданы центры занятости населения, главная цель которых - достижение оптимальной занятости. Прежде всего, это касается молодёжи, ещё только начинающей трудовые отношения. Для повышения эффективности работы служб занятости и превращению их из посредника по найму и выплате пособий в эффективный регулятор безработицы необходимо создать эффективную систему трудоустройства граждан - предоставление им услуг по поиску подходящей работы, а работодателям - в подборе персонала. Это во многом зависит от внедрения и использования современных информационных технологий по анализу данных, скапливающихся в центрах занятости населения [218].
Формирование отчётности в центрах занятости населения. Стандартной программой по вводу, хранению и обработке данных в центрах занятости населения страны является программный комплекс (ПК) «Катарсис» - многофункциональная система, предназначенная для автоматизации основных направлений деятельности Департамента федеральной государственной службы занятости населения субъектов Российской Федерации, их структурных подразделений и филиалов. ПК «Катарсис» реализован под Dos ещё в 1991 году и периодически обновляется. Система ориентирована на автоматизацию технических и сетевых решений отделов трудоустройства, профессионального обучения и центров занятости населения. ПК позволяет формировать стандартные отчёты в виде 16 стандартных форм (одна месячная форма и 15 квартальных форм), а также с использованием SQL-запросов получать отчёты по требованию вышестоящих организаций. Несмотря на очевидные достоинства, ПК «Катарсис» -это постоянные обновления, механизм разрешения противоречий, исправление ошибок, наличие подсистем анализа и принятия решений и т. д. Система имеет и недостатки: отсутствие привычного интерфейса Windows, доступные операции анализа данных (задание констант - дат, выполнение SQL-запросов, объединение данных, создание таблиц, отчётов, графиков и др.) затрудняют их более глубокий анализ, ориентированный на изучение вероятностной и геометрической природы данных, а также на поиск знаний в данных и т. д.
Систему «Катарсис» можно отнести к классу систем поддержки принятия решений (DSS, Decision Support System). Как известно [28], выделяется три класса задач анализа, решаемых СППР: информационно-поисковый (на основании заранее определённых запросов); оперативно-аналитический (запросы могут формироваться в процессе анализа в виде, необходимом аналитику); интеллектуальный (поиск знаний в данных). Следовательно, «Катарсис» позволяет решать только информационно-поисковые задачи.
В настоящее время основным подходом к изучению сложных систем является системный подход. Необходимость системного описания проблем СЭС мезоуровня (региональных рынков и, в частности, рынка труда) давно озвучивается, но нет примеров конкретных системных исследований. Существуют два подхода к описанию систем: как некоторое преобразование входных воздействий в выходные величины (причинно-следственный подход); как достижение системой некоторой цели или выполнение некоторой функции (подход с точки зрения целенаправленности или принятия решений). Как и всякая сложная система, СЭС характеризуется рядом особенностей, а также черт, присущих всем сложным системам. Практически все они (например, АПК и рынок труда) характеризуются высокой степенью неопределённости. Именно поэтому затруднена возможность построения детальной математической модели системы (даже зная причинно-следственные связи). Тем не менее, в этом случае возможно построить когнитивную модель системы, оперируя самыми общими фактами, не требующими уточнения, которая в дальнейшем при наличии количественной информации может быть детализирована.
Обобщая вышесказанное, можно сделать вывод о необходимости сбора и формирования информационной базы для обработки и представления в понятном для ЛПР виде при рассмотрении задач управления в СЭС мезоуровня, результатов деятельности СЭС и ее подсистем, оценки результатов уже принятых решений, выбора структуры производственной и сбытовой политики и т. д.
Разработка системы построения моделей районных и региональных СЭС
Современное состояние науки позволяет накапливать большие объёмы информации для решения задач обработки и анализа функционирования социально-экономических, технических, технологических и других систем. Поэтому при моделировании СЭС необходимо использовать программные средства, призванные облегчить работу аналитиков - это системы поддержки принятия решений (СППР). Они позволяют решать проблемы ввода, хранения и анализа данных.
Для адекватного функционирования СППР необходимо, чтобы она удовлетворяла ряду требований, которые можно разбить на две группы. К первой группе относятся требования, предъявляемые к СППР в целом и определяющие её способность быть полезной при решении задач изучения функционирования социально-экономических систем на уровне региона (общие требования). Ко второй - требования, предъявляемые к подсистемам СППР (частные требования).
Общие требования. Выделим пять основных свойств. 1. СППР должна обладать способностью вырабатывать обоснованные решения на основании количественной и качественной информации о функционировании социально-экономических систем. Степень обоснованности повышается, если использовать адекватные математические модели, которые должны изменяться при изменении условий, а также использовать принцип множественности математических моделей. Математические модели должны позволять проводить оценку различных сценариев развития системы и содержательно описывать изучаемые процессы функционирования СЭС. СППР должна иметь возможность учёта множества факторов, характеризующих взаимосвязанные процессы, протекающие, например, в растениеводстве (производство кормовых культур) и животноводстве (поголовье скота). Таким образом, подсистемы СППР должны быть взаимо 107 связаны, а их базы данных и знаний должны строиться с учётом взаимообмена данными для получения непротиворечивых решений. 2. Для выработки общих целей исследования с использованием СППР следует создать аналитическую рабочую группу из специалистов сопряжённых направлений, а также математиков и специалистов по про граммному обеспечению. Это необходимо для согласования планов иссле дований и получения непротиворечивых результатов. 3. Результаты деятельности учебных заведений, научно исследовательских институтов материализуются в различных трудах, статьях, монографиях, публикуемых в специальных изданиях и периодиче ской печати (электронных журналах). Однако масштабы их так велики, что ни один специалист не в состоянии прочитать даже некоторую часть из них. Для обработки печатной информации необходимо создавать элек тронные библиотеки и анализировать нужную информацию средствами Text Mining. 4. СППР должна развиваться: совершенствоваться программное обеспечение; обновляться базы данных и знаний; пополняться электрон ные библиотеки. Развитие СППР предполагает также, что такая система не может быть создана в рамках одного проекта и внедрена сразу во все структуры СЭС. Неизбежно поэтапное создание баз данных, баз знаний, электронных библиотек. Изменяются экономическая ситуация в стране, сорта растений, породы животных, сельскохозяйственные машины, агро технологии, посевных площадей и т. д. 5. СППР должна учитывать особенности функционирования СЭС. Например, если в растениеводстве результаты деятельности фиксируются раз в год и могут служить основой для планирования развития других от раслей на год вперёд, то животноводство и перерабатывающая отрасль функционируют практически непрерывно, и соответствующие базы дан ных могут обновляться, например, один раз в месяц. Частные требования. Перечисленные выше требования относятся в основном к СГШР в целом. Частные требования относятся к отдельным подсистемам, реализующим конкретные модели, используемые для принятия решений. 1. Реализуемость. Результаты моделирования должны представляться в понятном для пользователя виде: таблицы, графики, формулы, прогнозы, сценарии развития и т. д. Параметры изучаемой системы должны обладать свойством полноты, т. е. включать все показатели для адекватного описания определённой СЭС. Показатели должны быть реально получаемыми, т. е. во множество исходных данных необходимо включать только параметры, которые реально измеряемы. СПОР должна работать в диалоговом режиме (определяется цель, перечень концептов, строится модель для описания или прогноза, или управления, строятся сценарии развития системы). 2. Адаптивность. СППР должна обладать свойством адаптивности, т. е. выполнять заданные функции при изменении условий функционирования СЭС. 3. Совместимость. Различные подсистемы СППР должны быть совместимыми - обладать возможностями импорта, экспорта, не вступать в противоречие с операционной системой, базами данных и знаний. 4. Надёжность. СППР должна быть надёжной, т. е. позволять получать адекватные результаты в критических ситуациях, например, при значительных изменениях информации в базах данных или самих баз данных. В качестве примера системы в большой степени, удовлетворяющей перечисленным характеристикам, можно назвать аналитическую платформу Deductor, производимую BaseGroup Labs (г. Рязань). Решение сложных проблем, относящихся к анализу последствий принимаемых решений и прогнозированию функционирования СЭС в новых условиях, во многом связано с разработкой адекватной системы экономико-математических моделей. Мировая практика показывает, что в условиях рыночной экономики наиболее эффективным механизмом управления процессом является системный подход, который повысит экономическую устойчивость отечественных производителей при разработке принципиально новой прикладной модели региональной системы организации и управления социально-экономическими системами. Реализация системного подхода требует создания интеллектуальной информационной системы поддержки принятия решений в условиях неопределенности и риска.
Особенности применения современных методов статистического моделирования
Немаловажную роль при изучении проблемы точности в данных имеет фактор времени. В сельском хозяйстве существует определенная цикличность выполнения работ и получения соответствующей прибыли (которая по основным видам деятельности в растениеводстве также имеет место один раз в год) - т. е. процесс производства не является непрерывным как в промышленности. Кроме того панели годовых данных в отчетах часто оказываются не идентичными, могут появиться новые классификации, изменяются цены. Невозможно дать точную оценку основных фондов, цен продажи, урожайности на определенный момент времени - все эти данные, конечно, содержат либо ошибку, либо неточность.
Наблюдение уникальных явлений, которые невозможно воспроизвести. Если в торговле, сфере обслуживания можно воспроизвести ту или иную ситуацию, то, например, в сфере сельского хозяйства уникальность заключается, прежде всего, в невоспроизводимости погодных и климатических условий, что, естественно, влияет, например, на урожай и, как следствие, на объёмы привлечения сезонных рабочих. В естественных науках, благодаря повторяемости наблюдений выводят некоторые константы, в экономических науках пока введение подобных констант - нерешенная задача (кроме работ В. Парето, С. Жибре). Поиск закономерностей в экономических явлениях был начат еще во времена Риккардо, и во многом это вылилось в содержание экономической теории (политэкономии). Современная точка зрения на эконометрику гласит, что законы и закономерности должны выводиться на основе исходных данных, описывающих изучаемые процессы в определенный момент времени.
В классическом варианте, который рассматривался еще К. Гауссом, сумма ошибок в правой части (3.1) является случайной величиной, подчиняющейся нормальному закону распределения с нулевым математическим ожиданием и постоянной дисперсией. Тот факт, что математическое ожидание равно нулю, стало основой широко распространенного и ничем не подтвержденного мнения о том, что ошибки должны погашать друг друга, но это должно быть доказано в каждом конкретном случае. В теории вероятностей и математической статистике этот факт доказывается исходя из вероятностной основы ошибок (и во многих случаях, например, в технике это соответствовало истине). Однако, как мы видели выше, в экономических и вообще социальных системах кроме вероятностной природы ошибок существует еще целый ряд причин, обусловливающих неточность и неопределенность в исходньк данных. Для констатации факта о взаимном погашении ошибок необходимо дать качественное описание возможных ошибок, с помощью которого можно сделать вывод о накоплении либо взаимном погашении ошибок.
Основная проблема заключается в количественной оценке каждого из источников ошибок. При этом необходимо учитывать, что по мере обработки данных также накапливаются ошибки вследствие агрегирования, сведения к индексам и применения других методов (метода главных компонент, факторного анализа, анализа временных рядов). Наука, начиная со времен Галилея, стремится всем качественным явлениям дать количественную оценку (одно из возможных направлений - это шкалирование данных). Однако в настоящее время в статистике и эконометрике отсутствует единая теория оценки доли влияния ошибок на исходные данные.
Обработка данных в условиях неопределенности предполагает измеримость наблюдений. В качестве основы для изучаемых моделей в условиях различного вида неопределенности (случайности, неточности, нечеткости) рассматривается мера Лебега. Как показали исследования А.С. На-риньяни [211], при рассмотрении процессов приобретения знаний речь идет о выявлении, представлении и последующей обработке только четырех НЕ-факторов, а именно неопределённости (третьего рода - принципиальной неопределенности, порождающей неструктурируемые проблемы; второго рода, являющейся предметом теории игр; первого рода - вероятностной неопределенности), неточности, нечёткости и недоопределенно-сти. Поэтому в качестве основных типов неопределенностей обычно рассматриваются теория вероятностей (probability theory), теория неточных множеств (rough set theory), теория нечетких множеств (fuzzy set theory).
Эконометрический подход в настоящее время предполагает выявление закономерностей в экономических явлениях, однако, если исходные данные практически всегда являются неточными, то какие закономерности мы ищем? Наше мнение - решение проблем точности данных следует рассматривать с точки зрения, что они {данные) представляют собой информационную модель [184], изучаемой системы и фактически являются одной из возможных проекций признакового пространства, характеризующего функционирование объекта и внешнюю среду. На основании этой (информационной) модели нами должны быть изучены свойства объекта (системы), в предположении той или иной природы данных.
Выбор только одной из точек зрения обусловливает целый ряд априорных предположений, которые существенно влияют на результаты моделирования. Проиллюстрируем это следующим примером.
Так, в настоящее время имеется возможность сбора информации о деятельности предприятий, центров занятости населения и других социально-экономических систем мезоуровня. Например, данные, рассматриваемые в службе занятости, часто не являются полными. Это связано с тем, что за рассматриваемый период времени некоторые безработные ещё не были трудоустроены, либо прервали отношения со службой занятости или за нарушения правил пребывания на учёте лишены статуса безработного и закрывают карточку, и мы располагаем неполной информацией о времени их трудоустройства [215]. Наблюдения, которые содержат неполную информацию, называют неполными или цензурированными. Анализ того, что безработный получил работу после t дней после постановки на учёт в СЗ, можно провести, предположив вероятностную природу данных, с помощью функции выживаемости. Для этого временная ось разбивается на некоторое число интервалов. Для каждого интервала рассматривается число лиц, которые были безработными в начале интервала и число лиц, которые получили работу на данном интервале. Кроме того, вычисляется число цензурированных наблюдений, которые были изьяты на каждом интервале. Вычисляются доли этих лиц. На каждом временном интервале наблюдение может быть либо цензурировано (карточка закрыта по причине неявки на регистрацию или безработный на данный момент не трудоустроен), либо наблюдается трудоустройство.
Поддержка принятия управленческих решений в СЭС с использованием систем интеллектуального анализа данных
Результаты функционирования СЭС в настоящее время отражаются в базах данных различных департаментов, государственных, коммерческих структур, комитетов статистики и т. д. Однако практически эти данные рассматриваются только в разрезе средних значений показателей, всевозможных относительных величин и индексов. Отсутствуют примеры использования современных IT применительно к извлечению знаний в СЭС для поддержки принятия управленческих решений. Между тем согласно современным представлениям данные содержат знания о внутренних связях и соотношениях между показателями функционирования СЭС.
Рассмотрим возможности, предоставляемые наиболее известными системами интеллектуального анализа данных (ИАД). Приводимая классификация систем интеллектуального анализа данных неоднократно цитируется на протяжении последних десяти лет [36, 87, 167] - она несколько расширена нами в соответствии со своими предпочтениями [28, 138, 330-343], по сравнению со стандартным вариантом. Классификация в основном ориентируется на узловой метод (или задачу) описываемых систем.
Применительно к анализу больших объёмов данных различают два класса систем интеллектуального анализа данных: системы класса Data Mining и KDD (Knowledge discovery in databases). Отличительной чертой систем ИАД является тот факт, что анализ данных проводится с помощью методов машинного обучения (эволюционного программирования, нейронных сетей, деревьев решений и т. д.). При расширении классов решаемых задач к ним примыкают системы нечёткой логики, когнитивных карт и т. д.
Определение, которое дал Григорий Пятецкий-Шапиро, основатель Data Mining: «Data mining - это процесс обнаружения в сырых данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности» [28]. Data Mining - это процесс аналитического исследования больших массивов информации (обычно экономического характера) в целях выявления определенных закономерностей и систематических взаимосвязей между переменными, которые затем можно применить к новым совокупностям данных. Этот процесс включает три основных этапа: исследование, построение модели или структуры и ее проверку (StatSoft) [341]. Data Mining - это процесс выделения из данных неявной и неструктурированной информации и представления ее в виде, пригодном для реализации. Data Mining - это процесс анализа, выделения и представления детализированных (detailed data) данных неявной конструктивной информации для решения проблем бизнеса (NCR). Data mining - это процесс выделения (selecting), исследования и моделирования больших объемов данных для обнаружения неизвестных до этого структур (patterns) в целях достижения преимуществ в бизнесе (SAS Institute) [339]. Data mining - это процесс, цель которого - обнаружить новые значимые корреляции, образцы и тенденции в результате просеивания большого объема хранимых данных с использованием методик распознавания образцов плюс [применение] статистических и математических методов (Gartner Group). Data mining - это процесс автоматического выделения действительной, эффективной, ранее неизвестной и совершенно понятной информации из больших баз данных и использование ее для принятия ключевых бизнес-решений. Отметим, что процесс обнаружения знаний не полностью автоматический - он требует участия пользователя (специалиста предметной области). Пользователь должен знать, что он ищет, основываясь на собственных гипотезах и обработке экспертной информации. В итоге часто вместо подтверждения имеющейся гипотезы процесс поиска вызывает появление новых гипотез. Все это обозначается термином discovery-driven data mining (DDDM), и термины Data Mining, knowledge discovery в общем случае относятся к DDDM. Data Mining переводится как «добыча» или «раскопка данных». Нередко рядом с Data Mining встречаются слова «обнаружение знаний в базах данных» (knowledge discovery in databases) и «интеллектуальный анализ данных». Их можно считать синонимами Data Mining. Возникновение всех указанных терминов связано с новым витком в развитии средств и методов обработки данных. Цель Data Mining состоит в выявлении скрытых правил и закономерностей в наборах структурированных данных, представляющих собой информационную модель объекта.
Концепция Data mining. Поиск знаний, содержащихся в данных, происходит как решение задачи непараметрической идентификации, что соответствует когнитивному подходу к изучению сложных проблем. Таким образом, современные системы Data Mining - это современная реализация математических когнитивных теорий, основы которых были заложены ещё в 60-е годы XX в. Data mining «просеивает» данные («sifts» through the data), одну запись и одну переменную за один раз, раскрывая ранее скрытую информацию, которую, наверное, раньше никогда не раскрывали, просто вследствие огромного количества данных. Разработаны масштабируемые инструменты data mining для решения этих сложных и больших, насыщенных данными и требующих большой вычислительной мощи проблем. Разработан ряд методов, алгоритмов для data mining (обучения машины - machine-learning) для поиска закономерностей (patterns) в данных, таких как нейронные сети (neural networks), деревья решений (decision trees) и алгоритмы кластеризации (clustering algorithms). Методы Data Mining так же, как и методы прикладной статистики могут применяться в деятельности человека, результаты которой могут быть представлены в виде таблиц количественно-качественных признаков. Однако в отличие от классических статистических методов они практически не используют априорных предположений о природе исходных данных.