Содержание к диссертации
Введение
Глава 1. Трудовые ресурсы региона как объект эконом нко-математического моделирования 12
1.1. Анализ влияния естественного движения населения на формирование трудовых ресурсов 12
1.2. Миграционные процессы как фактор прироста трудовых ресурсов региона 23
1. 3. Проблема моделирования влияния социально-экономических факторов на формирование трудовых ресурсов и её текущее состояние 30
Выводы к главе 1 38
Глава 2. Информационное н математическое обеспечение автоматизированного построения оценочных моделей на базе типовых технологических модулей 40
2.1. Формирование признакового пространства моделирования 41
2.2 Концепция построения оценочных моделей 55
2.3. Выбор математических методов и программных средств построения оценочных зависимостей естественного прироста трудовых ресурсов от социально-экономических факторов 61
2.4. Выбор математических методов и программных средств построения оценочных зависимостей миграционного прироста от социально-экономических факторов 67
2.5. Технология построения оценочных моделей на базе типовых модулей 76
Выводы к главе 2 89
Глава 3. Применение типовых технологических модулей для автоматизированного построения оценочных моделей влияния социально-экономических факторов на формирование трудовых ресурсов Челябинской области 91
3.1. Формирование базы данных типовых технологических модулей 91
3.2. Построение и анализ регрессионных оценочных моделей для показателей естественного движения населения 93
3.3. Построение и анализ продукционных моделей описания логических закономерностей распределения миграционных потоков Большого Урала 119
3.4. Использование нечетких множеств для оценки соответствия нелегальной миграции трудовым потребностям регион 126
Выводы к главе 3 130
Заключение 132
Библиографический список 135
Приложения
- Миграционные процессы как фактор прироста трудовых ресурсов региона
- Концепция построения оценочных моделей
- Выбор математических методов и программных средств построения оценочных зависимостей миграционного прироста от социально-экономических факторов
- Построение и анализ регрессионных оценочных моделей для показателей естественного движения населения
Введение к работе
Актуальность исследования* Главной производительной силой в экономике является экономически активное население — трудовые ресурсы. В современных условиях занятость и труд, качество и состояние трудового потенциала являются одним из главных системообразующих факторов устойчивого поступательного движения экономики. В условиях начавшегося в стране роста промышленности ощущается дефицит квалифицированной рабочей силы, происходит заметное старение кадрового состава промышленных предприятий и инфраструктурных отраслей, нарушаются возрастные соотношения работников, усиливается проблема «смены поколений». Складывающаяся в регионах и стране в целом ситуация с трудовыми ресурсами показывает, что в перспективе уменьшение численности населения становится важнейшим фактором ограничения роста производства. Всё более заметное влияние на состав трудовых ресурсов оказывает миграция.
В этих условиях для органов управления, в том числе регионального уровня, важно проводить постоянный анализ социально-трудовой сферы, исследовать влияние демографического процесса на экономический рост региона, определять, какие социально-экономические меры могут оптимизировать демографическое развитие региона.
Исследованиями в области трудовых ресурсов активно занимаются ученые самых разных научных направлений, тем не менее, до настоящего времени недостаточно разработанными остаются теоретические основы анализа и прогнозирования влияния социально-экономических факторов на состояние региональных трудовых ресурсов. Вместе с тем, развитие методов такого анализа, а тем более создание технологии автоматизированного построения моделей, позволяющих количественно оценивать уровень этого влияния, являются необходимым условием для принятия эффективных решений в сфере формирования трудовых ресурсов региона.
Актуальность проблематики регулирования трудовых ресурсов, недостаточная проработанность методологических основ принятия управленческих решений в этой сфере, необходимость построения моделей, направленных на анализ и прогнозирование демографических показателей состояния трудовых ресурсов предопределили выбор темы исследования. Вопросам разработки теоретических основ и технологии автоматизированного построения оценочных моделей влияния социально-экономических факторов на естественный и миграционный прирост трудовых ресурсов региона, а также применения разработанной технологии для демографического анализа трудовых ресурсов Челябинской области посвящена данная работа.
Степень разработанности проблемы
Проблемы влияния демографических показателей на состояние трудовых ресурсов России и ее" отдельных регионов, роли миграции в формировании трудовых ресурсов рассмотрены в работах отечественных ученых А.Я. Боярского. Д.И.Валентая, А.Г.Вишневского, М.А.Гундарова, В.М.Жеребина, А.В.Кашепова, С.В.Крухмалева. В.И.Переведенцева, Н.М.Римашевской, Л.А.Рыбаковского, С.В.Соболевой, В.И.Староверова, Я.В.Симчеры, Б.С.Хорева и др.. Влияние миграции на состав трудовых ресурсов изучали зарубежные ученые, такие как Д.Дюфор. И.Крозе, А.Сови. Эти работы рассматривались не только как источники, содержащие обширный фактический материал, но и как труды по методологии сопряженного изучения демографических составляющих трудовых ресурсов.
Региональные аспекты миграционных процессов исследовались Плехановой Т.Н., Скрипко О.В., Спициным А.И., Суворовой Н.Н., которые изучали тенденции, связанные с вынужденным характером миграции, рассматривали проблемы, связанные с эмиграцией населения из стран бывшего СССР. В ряде публикаций, посвященных демографическим аспектам трудовых ресурсов, предлагаются отдельные статистические модели зависимостей демографических показателей от двух-трех социально-экономических факторов. Однако вопросы разработки общей методики построения моделей для оценки влияния
6 социально-экономических факторов на естественный и миграционный прирост трудовых ресурсов региона, до настоящего времени не рассматривались. Не применялись в этой обласи исследования и методы, отличные от традиционных статистических, - методы интеллектуального анализа данных («data mining»), имитационного моделирования, теории нечетких множеств, продукционных и лингвистических моделей и др.. Теоретические основы этих методов разработаны в трудах отечественных и зарубежных ученых М.М.Бонгарда, А.Н.Борисова, Д. Гига, Д. Ван Гласса, Л. Заде, О. А. Крумберга, Д. Лоули, Д. Стенли, Т. Саати, Дж. У Тьюки и др.
Вопросы практического применения этих методов в экономике, а также их компьютерной поддержки в информационных технологиях рассмотрены в работах Л.С.Болотовой, А.А. Горчакова, В. Дюка, И. Я. Лукасевича, Б.Е.Одинцова, А.Н. Романова, А.А. Смольяниновой и др. В их трудах разработаны основы и сформирована база для дальнейших разработок в области математического моделирования экономических и социальных процессов с использованием современных средств компьютерной техники.
В свете изложенного представляется актуальной проблема комплексного использования возможностей, предоставляемых современными математическими методами и программными средствами для автоматизированного построения оценочных моделей, характеризующих влияние социально-экономических факторов на демографические характеристики трудовых ресурсов региона.
Цель и задачи исследования. Целью диссертационной работы является развитие и совершенствование моделей анализа и прогнозирования состояния трудовых ресурсов региона, складывающегося под воздействием социально-экономических факторов.
Для достижения указанной цели в работе поставлены и решены следующие задачи:
7 исследовать и выявить специфику формирования трудовых ресурсов регионов под воздействием естественного движения населения, а также легальной и нелегальной миграции;
проанализировать существующие модели анализа и прогнозирования показателей естественного и миграционного прироста трудовых ресурсов региона с освещением основных достоинств и недостатков моделей;
сформировать типовое для регионального уровня признаковое пространство моделирования, определив систему целевых демографических и факторных социально-экономических показателей;
разработать концепцию, создать методику и обосновать выбор математических методов построения оценочных моделей с учетом уровня достоверности демографической информации;
разработать технологические модули, обеспечивающие автоматизированное построение оценочных моделей на базе статистических данных регионального уровня;
на базе предложенной методики и разработанных на её основе технологических модулей построить комплекс моделей, отражающих зависимость существующей демографической ситуации на Южном Урале от социально-экономического состояния этого региона и позволяющих строить прогнозы демографической динамики трудовых ресурсов на краткосрочную перспективу
Объектом исследования являются трудовые ресурсы регионов. Предметом исследования является зависимость динамики демографической составляющей процесса формирования трудовых ресурсов региона от его социально-экономического развития.
Методологические основы исследования. Теоретико - методологической основой данного исследования является принцип диалектического метода познания, включающий принцип объективности в анализе явлений и процессов. В работе использованы методы логического, статистического, сравнительного анализа. Кроме общетеоретических методов исследования, в работе, для по-
8 строения экономико-математических моделей использованы математические методы корреляционно-регрессионного анализа, компонентного и факторного анализа, методы имитационного моделирования, интеллектуального анализа данных, а также элементы теории нечетких множеств.
В ходе проведения исследования использовались труды отечественных и зарубежных ученых в области статистического анализа, имитационного моделирования, теории нечетких множеств, интеллектуального анализа данных, а также материалы научной периодики, конференций и семинаров.
В ходе изучения вопросов, относящихся к теме исследования, активно использовались материалы, имеющиеся в Интернете.
Для решения поставленных задач применялись пакеты прикладных программ «Statgraphics Plus for Windows», «WizWhy», «Fuzzy for Excel», MS Access, MS Excel,
По своему содержанию работа соответствует пункту 1.9. паспорта специальности 08.00.13 «Математические и инструментальные методы экономики» (Разработка и развитие математических методов и моделей анализа и прогнозирования социально-экономических процессов общественной жизни: демографических процессов, рынка труда и занятости населения, качества жизни населения и других).
Информационной базой исследования являются статистические данные областного статистического управления г.Челябинска, данные городской администрации, областного отдела виз и регистрации, областной и городской служб занятости населения, а также официальные статистические данные, представленные в ежегодных статистических сборниках.
Научная новизна В диссертационной работе поставлена и решена новая актуальная задача - разработка типовых технологических модулей (ТТМ), обеспечивающих автоматизированное построение оценочных моделей, характеризующих влияние социально-экономических факторов на демографическую составляющую процесса формирования трудовых ресурсов региона.
9 В результате выполненного исследования получены и обоснованы следующие результаты, выносимые на защиту.
Предложена концепция анализа процессов формирования трудовых ресурсов региона, заключающаяся в построении комплекса регрессионных, продукционных и непараметрических моделей, сочетание которых позволяет выявлять статистические и логические закономерности воздействия социально-экономических факторов на состояние трудовых ресурсов региона. Определены основные принципы реализации предложенной концепции в типовых технологических модулях, обеспечивающих автоматизированное построение оценочных моделей с учетом уровня достоверности демографической информации.
Для моделирования влияния естественного прироста населения на формирование трудовых ресурсов региона сформирована типовая система целевых демографических и факторных социально-экономических показателей и обоснован выбор для ТТМ математико-статистических методов построения регрессионных оценочных моделей, характеризующих статистические закономерности естественного прироста трудовых ресурсов региона.
Для моделирования влияния миграционных процессов на формирование трудовых ресурсов региона предложены в качестве целевых два новых демографических показателя (индекс миграционной привлекательности региона; коэффициент соответствия нелегальной миграции трудовым потребностям региона), выявлен набор воздействующих на них социально-экономических показателей, составляющих информационную базу для построения продукционных и непараметрических оценочных моделей.
Для исследования миграционных процессов в регионе впервые применены методы интеллектуального анализа данных («data mining») и нечеткой математики, позволяющие выявлять логические закономерности в распределении миграционных потоков и переводить качест-
10 венную информацию о нелегальной миграции в количественную меру потребности региона в мигрантах.
Разработана методика комплексного использования в ТТМ методов статистического и интеллектуального анализа данных, имитационного моделирования и нечеткой математики; сформирована программная среда реализации этих методов
С применением ТТМ построен для Челябинского региона комплекс регрессионных, продукционных и непараметрических оценочных моделей, с помощью которых:
установлена количественная мера гюфакторного влияния различных социально-экономических факторов на естественный прирост трудовых ресурсов региона Южного Урала;
определены индексы миграционной привлекательности восьми регионов Большого Урала;
выявлен набор из семи социально-экономических факторов, в наибольшей степени определяющих привлекательность регионов Большого Урала для мигрантов;
получены оценки уровней соответствия нелегальной миграции трудовым потребностям Челябинской области.
Личный вклад автора. Все научные результаты, изложенные в диссертации, получены соискателем лично. Научному руководителю принадлежат идея и постановка задачи. В формулировке научной новизны диссертации и в компоновке её как целостной работы также участвовал научный руководитель.
Практическая значимость работы состоит в том, что её основные теоретические положения, методика и типовые технологические модули автоматизированного построения оценочных моделей могут быть использованы региональными и муниципальными органами власти для проведения мониторинга изменения состояния трудовых ресурсов под влиянием социально-экономической ситуации в регионе.
Алгоритм определения степени соответствия присутствия мигрантов трудовым потребностям региона может быть использован миграционными службами для принятия управленческих решений по регулированию миграционных потоков в соответствии с потребностями региона.
Апробация результатов исследования Основные положения и результаты работы докладывались в Челябинске на межрегиональной научной конференции Академии труда и социальных отношений «Россия и мировое сообщество: Проблемы социально-экономического и политического развития» в 2004 году, и научно-практических конференциях филиала ВЗФЭИ в г. Челябинске «Теория и практика рыночных отношений в регионе» в 2003 году и «Проблемы обеспечения устойчивого экономического и социального развития России» в 2005 году.
Типовые технологические модули были использованы в управлении экономики администрации г.Челябинска при составлении прогноза прироста трудовых ресурсов на краткосрочную перспективу.
Результаты диссертационной работы используются в качестве научных, методических и дидактических материалов на курсах повышения квалификации «Информационное обеспечение и дифференцированное обучение» и «Прикладная информатика в экономике» Уральского социально-экономического института.
Публикации. По теме диссертационной работы опубликовано 9 научных статей автора общим объемом 2,5 п.л., в том числе авторских 2,2 п.л.
Объем и структура работы обусловлены целью, задачами и логикой исследования. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы из 131 наименования и 8 приложений. Общий объем работы -145 (с приложениями-187) страниц, включая 28 таблиц и 30 рисунков.
Миграционные процессы как фактор прироста трудовых ресурсов региона
Действенным механизмом улучшения качества трудовых ресурсов в стране и регионах в последние годы стала миграция [99; 103; 104; 109]. Повышение эффективности миграционной политики становится одной из важнейших народнохозяйственных задач. В управлении трудовыми ресурсами региона должны учитываться объём, направление и состав миграционных потоков, для анализа которых целесообразно исследовать влияющие на них социально-экономические факторы. Этот анализ особенно важен именно на региональном уровне по следующим причинам: - социально - экономическое развитие регионов различно, соответственно, регионы обладают разными возможностями по приему и трудоустройству мигрантов; - с точки зрения потенциальных переселенцев, регионы, как возможное место жительства, обладают разной степенью «привлекательности» - особенностью демографической политики регионального уровня является более высокий, чем в целом по стране, уровень влияния миграционных процессов на состояние населения региона, особенно для небольших регионов;
В 90 - е годы, когда в стране произошел переход от плановой к рыночной экономике, миграционные процессы приобрели достаточно непредсказуемый характер. Фактические данные свидетельствуют о том, что в нашей стране происходили процессы переселения населения из районов нового освоения в старообжитые центрально-европейские области страны, а также переселение населения из городских поселений в сельские [109, с. 10].
Особое внимание обращает на себя внешняя миграция, которая в последние годы стала восприниматься не только как проблема, но больше как фактор, формирующий региональный рынок труда. В этом качестве миграция оказывает значительное влияние на социально- экономическое и демографическое развитие региона. Это наглядно видно на примере Челябинской области. Ре 24 гиональные власти, обеспокоенные складывающейся ситуацией с трудовыми ресурсами, возлагают некоторые надежды на привлечение мигрантов в область. В числе факторов, влияющих на приток мигрантов, называются [78]: обеспечение жильем, предоставление рабочих мест, социальная защита мигрантов.
В этническом плане Южный Урал с полным основанием можно отнести к одному из самых спокойных районов России, что делает его достаточно привлекательным для потенциальных переселенцев. Кроме того, область выделяется богатством Своих ресурсов, мощным научно-техническим и трудовым потенциалом, имеет высокую степень бюджетообеспеченности, является инвестиционно привлекательной. Географическое положение области позволяет ей вбирать миграционные потоки из Казахстана, Средней Азии, Сибири и Дальнего Востока. За 1992 — 2000гг миграционный прирост населения области составил более 106 тысяч человек [109]. В общей сложности за последние десять лет миграционный приток компенсировал свыше 60 % естественной убыли населения области [107]. Однако, в последние годы, как следует из официальных статистических данных [62; 62], этот приток значительно уменьшился, и в 2002-2003гг количество выбывших из области превысило количество прибывших [62].
За последние годы для Челябинской области были характерны пять основных видов миграции: вынужденная; - внешняя; - временная; - внутриобластная; межрегиональная. В 90-е годы первое место по числу мигрантов занимала вынужденная миграция русскоязычного населения из стран «ближнего зарубежья». В большинстве своем это русские (74%), в трудоспособном возрасте (59%). В основ 25 ном вынужденные мигранты прибывали из Казахстана (77,9%), Узбекистана (9,4%), Таджикистана (5,4%) [60; 61]
Наиболее высокой миграционной подвижностью обладают люди трудоспособного возраста. Их удельный вес среди мигрантов, прибывших в область, составляет 74%. В основном, это квалифицированные специалисты, имеющие высокий образовательный уровень. 50,1% вынужденных мигрантов имеют высшее, незаконченное высшее и среднее специальное образование и способны принести пользу экономике области [109].
Таким образом, особенностью вынужденной миграции является то, что переселенцы из новых независимых государств не только улучшают демографическую ситуацию, значительно покрывая естественную убыль населения, но и восполняют трудовой потенциал.
Тем не менее, в последнее время потоки вынужденных переселенцев и беженцев резко уменьшились. Видимо, период массового переселения мигрантов из стран СНГ и Балтии закончился. Для привлечения в область потенциальных мигрантов необходима разработка долгосрочной программы, основанной на глубоком анализе ситуации. Методика подобного анализа должна включать в себя статистические данные ряда областей. Причины, обусловливающие выбор мигрантами той или иной области, рассмотрены в работах Скрипко О.В. [99], Симчеры Я.В.[97; 98], Плехановой Т.Н. [75], Спицина А.И. [107], но, тем не менее, информация по данной проблеме остается статистически неполной.
Сальдо миграционного обмена в области со странами «дальнего зарубежья» всегда было отрицательным. Экономическая нестабильность России в конце прошлого века привела к усилению внешней миграции, то есть к значительному увеличению потоков эмигрантов из Челябинской области за пределы бывшего СССР (начиная с 1993 по 3 - 3,5 тысячи в год). В 2002 году из области выехали 3200 человек. Социальную структуру эмиграции в основном составляют высококвалифицированные специалисты:, семьи крупных предпринимателей, представители творческой интеллигенции. Подобная «утечка умов» далеко не в полной мере компенсируется притоком мигрантов из государств нового зарубежья.
Временная миграция связана с выходом нашей страны на международный рынок труда. Здесь можно наблюдать две тенденции: - первая связана с привлечением в Челябинскую область иностранной рабочей силы (трудовая иммиграция). Это, прежде всего, представители Китая (38%), Польши (30%), Югославии (17%), всего на территории области трудятся выходцы из 20 стран. Привлекаются они для работы в строительстве (43%), промышленности (31%) и сельском хозяйстве (18%) [61; 62; 109].
Можно предположить, что реальные цифры использования иностранных рабочих значительно выше из-за наличия нелегальной трудовой миграции (о которой будет сказано ниже), обусловленной «прозрачностью» границ с государствами бывшего СССР и рядом других факторов.
Вторым видом временной миграции можно считать трудовую эмиграцию, то есть выезд лиц для временной работы за границей. Работают они, как правило, по контракту и по истечении его срока возвращаются на место постоянного проживания, в Челябинскую область.
На долю внутриобластной миграции в 90-е годы приходилось 46 % всех перемещений в Челябинской области. Суть этого вида миграции заключалась, в основном, в переезде жителей из городов в сельскую местность. [61; 62].
Основными факторами, влияющими на подобные перемещения, являлись рост безработицы в городах и высокая цена на жильё, с одной стороны, а также развитие таких форм хозяйствования, как фермерство. Это и определяло положительное сальдо миграции в сельскую местность.
В последние годы, напротив, наблюдается отток жителей из сельской местности. Так, например, в 2001 году, при общей интенсивности миграции по области в 0,1 промилле, интенсивность миграции из сельской местности составила 6,4 промилле.
Концепция построения оценочных моделей
Тем не менее, рассматривая демографическую сферу как явление, следует базироваться на том факте, что демографическая ситуация всегда несет в себе элемент неопределенности, т.к. на поведение человека в этой сфере влияет огромное количество как предсказуемых, так и трудно- или даже непредсказуемых факторов. Но, поскольку одна из целей данного исследования состоит в том, чтобы выявить набор социально-экономических факторов, наиболее значительно влияющих на показатели естественного и механического движения населения, то будем исходить их предположения, что человек = существо прагматичное и решения, принимаемые им, обусловлены рациональными причинами. В противном случае проанализировать факторы, влияющие на уровень рождаемости будет практически невозможно.
В отличие от показателей естественного движения населения, показатели Імпр и Кснм, характеризующие миграционные потоки, как подчеркивалось в 2.1, не являются статистически точными. Расплывчатый характер этих показателей обусловлен следующими причинами. источники статистических данных о миграции не отвечают критерию полноты и точности; относительно количества нелегальных мигрантов можно воспользоваться лишь экспертными оценками. 4. Перечень социально-экономических показателей, являющихся факторными для целевых демографических показателей рождаемости и смертности на 58 считывает 28 показателей, приведенных в таблице 1.11 и описанных в Приложении 4.
Перечень социально-экономических показателей, являющихся факторными для целевых демографических показателей, характеризующих состояние миграционного притока в регион, включает 15 показателей, приведенных в таблице 1.13 и описанных в Приложении 4.
Состав факторных показателей обоснован в 2.1 и составляет признаковое пространство моделирования. Оно может быть расширено, что потребует изменения в информационной базе моделирования, но не повлечет каких-либо изменений в методике.
При построении каждой из моделей зависимости между целевыми демографическими и факторными социально-экономическими показателями, необходимо учитывать, что взаимосвязи между этими показателями носят корреляционный, а не функциональный характер. На целевые показатели влияют различные, в общем случае не совпадающие между собой наборы факторных признаков, соответственно, и модели зависимостей целевых показателей от факторных будут разными - как по типу моделей, так и по составу факторных показателей, входящих в ту или иную модель.
Прогнозируя будущую демографическую ситуацию, складывающуюся под воздействием случайных и неопределенных факторов, можно выделить два вида неопределенности: - общая неопределенность демографической ситуации, связанная со случайным поведением её элементов, поскольку и сами компоненты демографической сферы, и их движущие силы носят случайный характер и непрерывно меняются; - информационная неопределенность, возникающая в связи с особенностями учета миграционных процессов. Второй вид неопределенности в свою очередь имеет две разновидности: - неполнота информации о процессах миграции, связанная с недостаточно длительным периодом наблюдения и некачественной организацией учета мигрантов; - «умышленно» организованная неопределенность информации, связанная с сознательным сокрытием сведений о нелегальной миграции. Проведенный анализ факторов неопределенности позволяет выделить три вида демографической информации, предопределяющих подход к выбору математического аппарата для построения моделей зависимости целевых демографических показателей от социально-экономических факторов: статистически полная, достоверная, точная информация; статистически неполная, неточная информация; недостоверная информация.
В соответствии с тремя выделенными видами степени определенности информации при моделировании целевых демографических показателей СКР, ОКР, ОКС, КССП, Імпр и Кснм следует рассматривать три класса моделей, требующих применения адекватных математических методов аппроксимации статистических зависимостей данных.
Для моделей, базирующихся на информации первого вида, - полной, достоверной, точной - традиционно применяются статистические методы: факторный, компонентный анализ, кластерный анализ, метод анализа временных рядов, корреляционно-регрессионный анализ и др.[3; 4; 5; 55]. В сочетании со статистическими методами можно использовать метод имитационного моделирования, позволяющий оценить диапазон возможных значений целевых показателей в зависимости от изменений факторных показателей, вошедших в модель.
Для моделей, основанных на неполной информации, целесообразно воспользоваться разработанными в последнее десятилетие мощными сред 60 ствами интеллектуального анализа данных (data mining), такими как методы рассуждения по аналогии, байесовские методы, метод поиска логических закономерностей в множестве данных, нейронные сети, генетические алгоритмы, поиск ассоциаций и последовательностей, построение деревьев решений и ДР. [37; 51].
Для моделирования в условиях недостоверности данных широкий спектр возможностей предоставляет теория нечетких множеств, позволяющая формализовать нечеткую или качественную информацию с целью её использования для количественной оценки при построении математических моделей [20; 41].
Таким образом, в условиях существования трех уровней определенности информации для построения модели каждого из целевых демографических показателей требуется свой комплекс математических и программных средств, свой инструментарий моделирования.
Вместе с тем, комплексный характер задачи моделирования зависимостей целевых демографических показателей от социально-экономического состояния региона для поддержки принятия решений в сфере управления трудовыми ресурсами региона требует применения единой методики моделирования, применимой не только для фиксированных наборов целевых и факторных показателей, но и в случае расширения этих наборов при проведении региональных исследований.
Выбор математических методов и программных средств построения оценочных зависимостей миграционного прироста от социально-экономических факторов
Анализируя социально-экономические показатели, факторные для индекса миграционной привлекательности и представленные в табл.2.7., можно установить логические закономерности, выражающие различные аспекты привлекательности региона для мигрантов.
Задачу поиска логических закономерностей на больших множествах разнородных данных, решают системы интеллектуального анализа данных (ИАД) [51, с. 282]. Наряду с термином "ИАД" используются англоязычные термины "data mining" и "knowledge discovery" (дословный перевод: выявление закономерностей в данных, добыча / раскопка знаний).
Как отмечено Кожевниковой Т.Н. в [51], "ИАД, как инструмент анализа, является развитием традиционных статистических подходов, находя применение там, где обычные статистические методы невозможно использовать в силу отсутствия точных зависимостей, описывающих анализируемые процессы. Традиционная прикладная статистика оказалась непригодной для продуктивной обработки сверхбольших массивов "сырых" разнородных данных. Главная причина этого - свойственная статистике концепция усреднения по выборке, приводящая к операциям над фиктивными величинами, которые при исследовании реальных сложных жизненных явлений и процессов, в большинстве случаев малопригодны" [51].
ИАД представляет собой процесс аналитического исследования больших массивов информации (обычно экономического характера) целью которого является выявление определенных закономерностей и систематических взаимосвязей между переменными, которые затем можно применить к новым совокупностям данных. ИАД применяется для нахождения связей между переменными в ситуациях, когда отсутствуют (или недостаточны) априорные представления о природе этих связей.
Современные системы ИАД охватывают широкий спектр методов: - традиционные методы прикладного статистического анализа, базирующиеся на вычислении описательных статистик - максимальных, минимальных, средних значений атрибутов, дисперсии, вариации и т.д.; - методы, разработанные вне контекста ИАД (в частности, в искусственном интеллекте), - байесовские методы, нейронные сети, методы рассуждения по аналогии, генетические алгоритмы, алгоритмы ограниченного перебора, методы нечеткой логики; - методы, разработанные специально для задач ИАД, - поиск ассоциаций и последовательностей, построение деревьев решений и индукция правил.
В основу технологии ИАД положена концепция шаблонов, отражающих взаимоотношения на множестве данных. Шаблоны - это компактно выраженные закономерности, свойственные тем или иным выборкам данных, отра 70 жающие неочевидные, неожиданные регулярности в данных, составляющие "скрытые" знания в "сырых" данных. Поиск шаблонов производится методами, не требующими выполнения априорных предположений о структуре выборки. Из выявленных шаблонов выводятся правила для принятия решений и прогнозирования их последствий [51, с.283]. Существует много различных методов поиска шаблонов. Одним из них, достаточно успешно реализуемым в ряде прикладных областей является алго ритм ограниченного перебора данных «Кора», предложенный М. М. Бонгардом в 1967 году [11]. В алгоритме «Кора» анализируются все возможные конъюнкции вида ТИ Т2 А..- Т, 1 10), где Т— элементарные события, а Ь — некоторое наперед заданное число, ограничивающее длину щепочки» конъюнкций (первоначально в алгоритме «Кора» это число было равно трем). Под элементарным событием Т понимаются значения щ какого-либо признака xL Например, элементарным событием Т называют события ХІ = а или х, Ф а. Элементарными событиями также могут служить события вида х, а ; х, а; а ХІ Ъ, Среди конъюшсций выделяются те, которые характерны для одного из классов и не характерны для другого. Результатом работы данного алгоритма является перечень всех логических закономерностей, характерных для одного класса. К достоинствам алгоритма «Кора» следует отнести то, что он основан на полном переборе возможных вариантов.
Одним из пакетов прикладных программ, реализующих данный алгоритм, является система WizWhy предприятия WizSoft. В этой системе алгоритм ограниченного перебора «Кора» дополнен алгоритмом «Apriori», исключающим из перебора события с низкой частотой. WizWhy находит в массиве данных закономерности «ЕСЛИ - ТО». К об 9 щим характеристикам системы WizWhy её авторы относят следующие свойства: - выявление всех правил «ЕСЛИ-ТО», вычисление вероятности ошибки для каждого правила; определение наилучшей сегментации числовых переменных; вычисление прогностической силы каждого признака; - обобщение полученных правил и зависимостей; выявление необычных феноменов в данных; - использование обнаруженных правил для прогнозирования; - выражение прогноза в виде списка релевантных правил; - вычисление ошибки прогноза; - прогноз с учетом стоимости ошибок. Кроме того, среди достоинств системы дополнительно отмечают следующие качества: - на прогнозы системы не влияют субъективные причины; - пользователям системы не требуется специальных знаний в прикладной статистике; - программа позволяет импортировать данные формата .mdb; более точные и быстрые вычисления, чем у других методов ИАД.
Система WizWhy является на сегодняшний день одним из лидеров на рынке продуктов data mining [37]. Вышеперечисленные достоинства программы WizWhy предопределили её выбор для использования в методике моделирования при исследовании наборов «сырых» данных. Метод определения миграционной привлекательности региона, основанный на поиске логических закономерностей в массиве разнородных данных применяется впервые
Как было установлено в первой главе, при анализе формирования трудовых ресурсов региона необходимо учитывать влияние нелегальной трудовой миграции, информация по которой изначально не может быть достоверной. Как показано в 2.1., широкий спектр возможностей для работы с подобными (приблизительно известными или качественными характеристиками) предоставляет теория нечетких множеств, основы которой были разработаны в шестидесятых годах прошлого века в трудах американского ученого Л. Заде [41].
В отличие от традиционной формальной логики, оперирующей точными и четкими понятиями типа "истина" и "ложь", "ноль" и "единица", нечеткая логика имеет дело со значениями, лежащими в некотором (непрерывном или дискретном) диапазоне.
Понятие нечеткого множества - попытка математической формализации нечеткой или качественной информации с целью её использования при построении математических моделей сложных систем. В основе этого понятия лежит представление о том, что элементы, составляющие данное множество и обладающие неким общим свойством, могут обладать этим свойством в различной степени, и следовательно, принадлежать к этому множеству также с различной степенью. Один из простейших способов математической интерпретации нечеткого множества — описание степени принадлежности элемента к этому множеству числом из интервала [0,1].
Классическое определение нечеткого множества выглядит следующим образом. Пусть X - произвольное непустое множество. Нечетким множеством А на множестве X называется совокупность пар А = {х, ЦА(Х)}, где х принадлежит X, (х є X) а пА(х) є [0,1], называется функцией принадлежности нечеткого множества.
Построение и анализ регрессионных оценочных моделей для показателей естественного движения населения
Модель суммарного коэффициента рождаемости 1. Первоначально в качестве целевого признака из множества Мцщ выбирается СКР - суммарный коэффициент рождаемости. 2 В программе MS EXCEL формируется файл ДАННЫЕ ПО РОЖДАЕМОСТИ СМЕРТНОСТИ. XLS, представленный в Приложении 7. (Матрица показателей в приложении представлена в транспонированном виде для удобства восприятия). 3. Проводится анализ коррелированное показателей исходного файла с использованием функции КОРРЕЛ пакета прикладных программ MS EXCEL.
Для показателей «Соотношение среднедушевых денежных доходов и прожиточного минимума» (Соотношение_СДД_ПМ) и «Превышение доходов над расходами» (Прев_Д_Р) коэффициент корреляции незначителен, следовательно, для дальнейших исследований можно оставить оба эти показателя. Коррелированность таких показателей как «Среднедушевые денежные доходы населения в ценах 90 года» (СДЦ) и «Среднемесячная заработная плата работников в ценах 90 года» (СМЗПЛ) близка к 1, поэтому в модель включаем только один из них - показатель «Среднедушевые денежные доходы населения в ценах 90 года» (СДЦ).
Аналогичная ситуация для показателей «Среднедушевые денежные до ходы населения в ценах 90 года» (СДЦ) и «Величина прожиточного минимума ( в среднем на душу населения в месяц)в ценах 90 года» (ПМ), ввиду этого показатель «Величина прожиточного минимума ( в среднем на душу населения вмесяц)в ценах 90 года» тоже можно не использовать.
Коэффициент корреляции показателей «Среднедушевые денежные доходы населения в ценах 90 года» и «Соотношение среднедушевых денежных доходов и прожиточного минимума» составляет 0,59, поэтому в модель включаются оба показателя.
Высокий коэффициент корреляции (0,98) у показателей «Валовой региональный продукт на душу населения» и «Среднедушевые денежные доходы населения в ценах 90 года». Оба эти показателя важны и часто используются при различных сопоставлениях, но для целей данного исследования больше подходит показатель «Среднедушевые денежные доходы населения в ценах 90 года», как более адекватный понятию уровня жизни населения.
Показатели «Обеспеченность населения врачами» и «Обеспеченность населения больничными койками» демонстрируют отрицательную корреляцию, равную -0,72, в модель включаются оба показателя
Высокий отрицательный коэффициент корреляции у показателей «Число занятых» и «Уровень безработицы» -0,908, поэтому в модель включаем только один, а именно «Уровень безработицы»
Коэффициент корреляции показателей «Выбросы вредных веществ в атмосферу» и «Токсичные отходы» составляет 0,89, в модель будет включен один - «Выбросы вредных веществ в атмосферу».
Показатели «Ввод нового жилья» и «Обеспеченность жильем» демонстрируют довольно странную отрицательную корреляцию -0,66. Вероятно это можно объяснить тем, что хотя темпы строительства жилья в последние годы снижались, одновременно, количество населения уменьшалось и обеспеченность жильем в среднем на человека возрастала. В модель будут включены оба эти показателя.
Высокий коэффициент корреляции (0,90) у показателей «Среднедушевые денежные доходы населения в ценах 90 года» и «Розничный товарооборот на душу населения в ценах 90 года», включаем в модель первый из них
Из показателей обеспеченности населения продуктами питания - «Валовой сбор зерна на душу населения», «Валовой сбор картофеля на душу населения» , «Производство мяса» в модель включаются показатели «Валовой сбор зерна на душу населения» и «Производство мяса»
В результате проведенного корреляционного анализа показателей xl-x28, в файл АНАЛИЗ.XLS включаются показатели, представленные в таблице 3.3., без показателя ОКР. (Матрица показателей представлена в транспонированном виде для удобства восприятия).
Пакет Statgraphics Plus for Windows позволяет получить ряд графиков, из которого наибольший интерес представляет график на рис. 3.3. Из графика хорошо видно, что показатели разделились на две достаточно ясно выраженные группы. Распределение это достаточно хаотично, но, тем не менее, прослеживается следующий факт: показатели, которые можно отнести к социальной сфере (число учащихся, количество врачей, количество студентов на 10000 населения, количество автомобилей на 1000 населения) сгруппированы вместе.
Из сводки четко видно, что максимальные веса в первой компоненте имеют показатели социальной направленности, а показатели экономической сферы преобладают во второй компоненте. На графике это проявляется совершенно отчетливо (рис.3.5)
Из первичной сводки результатов факторного анализа следует, что уже первые три фактора вместе составляют 92,1 % дисперсии первоначальных данных. Применяя процедуру вращения факторов, сравним значения переменных до (рис. 3.6) и после (рис.3.7) проведения процедуры вращения.
Значения факторных нагрузок после процедуры вращения. И здесь так же, как и в предыдущем анализе, переменные разделились на две группы: экономические (основные) показатели имеют до проведения процедуры вращения положительные значения, а показатели социальной сферы - отрицательные. После проведения процедуры варимаксного вращения и те, и другие меняют свой знак на противоположный. Можно сделать вывод, что на целевой демографический показатель СКР влияют две группы факторов: факторы, отражающие развитие социальной инфраструктуры и уровень экономического развития региона.
Вместе с тем, критерий Дарбина-Уотсона для данной модели составляет 3,44 что говорит о возможном наличии отрицательной корреляции. Кроме того, величина t- статистики, полученная делением оценки параметра на среднеквадратичную ошибку, для большинства факторов незначительна, следовательно, можно предположить, что в модель включены факторы, влияющие на выходную величину в небольшой степени.