Содержание к диссертации
Введение
1. Раздел 1. Аналитический обзор и постановка задачи на исследование 10
1.1. Анализ состояния проблемы 10
1.2. Применение нейротехнологии для анализа демографических процессов 23
1.3. Постановка задачи на исследование 34
2. Раздел 2. Разработка методов и средств анализа динамики демографических показателей . 36
2.1. Формирование информативного факторного пространства 36
2.2. Исследование применимости различных типов нейронных сетей к представлению демографических показателей . 41
2.3. Комплексное прогнозирование демографических показателей 52
2.4. Алгоритм поддержки принятия управленческих решений 55
Выводы второго раздела 59
3. Раздел 3. Разработка информационно-аналитической подсистемы поддержки принятия решений в демографии 60
3.1. Структура информационно-аналитической подсистемы 60
3.2. Реализация нейросетевого симулятора 65
3.3. Реализация методики определения структуры нейронной сети при помощи генетических алгоритмов 72
3.4. Тестирование информационно-аналитической подсистемы 76
Выводы третьего раздела 82
4. Раздел 4. Результаты экспериментальных исследований 83
4.1. Проверка адекватности нейросетевых моделей 83
4.2. Исследование демографических процессов в Российской Федерации 90
4.3. Исследование демографических процессов в Словакии 103
4.4. Формирование управленческих решений 112
Выводы четвертого раздела 119 Заключение 120
Список использованной литературы 121
Приложения 137
- Применение нейротехнологии для анализа демографических процессов
- Исследование применимости различных типов нейронных сетей к представлению демографических показателей
- Реализация нейросетевого симулятора
- Исследование демографических процессов в Российской Федерации
Введение к работе
Концепция устойчивого развития общества предполагает постоянное возрастание требований к оптимизации методик принятия решений в региональном планировании и разработке краткосрочных и долгосрочных планов социального развития регионов, которые обеспечиваются, в первую очередь, за счет адекватного анализа и прогноза происходящих в нем демографических процессов.
Информация о динамике конкретных показателей демографических процессов является определяющей для оптимизации управленческих решений в промышленной и социальной инфраструктурах. Возникающие в этом случае неточности в расчетах существенным образом влияют на эффективность принятых управленческих решений.
В настоящее время используется ряд методов исследования и прогноза
динамики демографических показателей в регионе и формирования на этой
основе управленческих решений: регрессионный анализ,
микромоделирование, имитационное моделирование. На протяжении последних десяти лет, например, применяется метод передвижки возрастов, главным недостатком которого является то, что при прогнозе показателей не учитываются значения многих влияющих факторов (например, миграции и т.п.) (Кваша А.Я., Kohler Н.Р).
В работах датского исследователя Г.Ханнерца экстраполяция уровня относительного показателя мужской смертности строится на базе регрессионных моделей, которые ведут себя адекватно только при краткосрочном прогнозировании. Данный подход, как отмечается Ю.М.Полищуком, не является точным для неустойчивых процессов, к которым относятся демографические процессы. В работах Нешкомаевой Э.В. для анализа демографического положения региона предлагается экспоненциальное сглаживание временных рядов, однако, не учитывается структура населения, что приводит к неточности в расчете прогноза его численности. Группой американских разработчиков под руководством
Дж.Филлипса, создана и успешно эксплуатируется автоматизированная система, анализирующая демографическую структуру населения ряда государств Центральной Африки, в которой отсутствует прогноз развития демографической ситуации.
Как отмечено в исследованиях отечественных и зарубежных авторов, демографические процессы подвержены постоянному влиянию множества факторов различной природы, интегральная оценка которых является трудноразрешимой задачей. Между тем, в работах Werbos P.J., Горбаня А.Н., Минского М. показано, что применение нейроподобных алгоритмов позволяет получать хорошие результаты при анализе неустойчивых процессов, имеющих сложный рельеф функции ошибки прогнозирования, которая характеризует и демографические процессы. Следовательно, разработка соответствующих методов и средств анализа и прогноза демографических параметров региона с учетом динамики их изменения является актуальной задачей.
Работа выполнена в соответствии с научно-технической программой «Научные исследования высшей школы по приоритетным направлениям науки и техники», подпрограмма 204 «Технология живых систем» (регистрационный номер № 03.03.031) и одним из научных направлений КурскГТУ «Разработка медико-экологических технологий».
Объект исследования: динамика демографических показателей региона.
Предмет исследования: методы и средства анализа и прогноза изменения
демографических показателей региона.
Цель и задачи исследования.
Цель работы: повышение точности прогноза региональных
демографических показателей на основе применения нейротехнологий.
Для достижения поставленной цели решаются следующие задачи:
- разработка методики декомпозиции и формирования факторного пространства взаимосвязанных групп демографических показателей для
различных регионов (Россия, Словакия, Курская область) на базе нейросетевых моделей;
исследование возможности использования различных типов нейронных сетей для анализа демографических процессов;
разработка информационной технологии анализа демографических процессов для формирования управленческих решений;
проектирование и апробация информационно-аналитической подсистемы анализа и прогноза демографических показателей в регионе;
разработка алгоритма формирования альтернатив управляющих решений для различных структур региона с целью улучшения демографической ситуации.
Методы исследования основаны на положениях теории вероятностей, математической статистики, методах искусственного интеллекта, эволюционного моделирования, теории принятия решений, теории управления, квалиметрии, имитационного моделирования. Научная новизна
В диссертации получены следующие основные результаты, характеризующиеся научной новизной:
-методика декомпозиции факторного пространства, отличающаяся формированием групп демографических показателей путем применения нейронной сети для выявления значимых связей между ними; -метод синтеза модифицированной нейронной сети прямого распространения, особенностью которого является использование разных типов активационных функций, позволяющих учитывать специфику демографических процессов и повысить точность обучения сети; -информационная технология анализа демографических процессов для разработки управленческих решений, отличающаяся применением нейротехнологий и позволяющая повысить точность прогноза; -информационно-аналитическая подсистема анализа и прогноза демографических процессов, отличающаяся формированием рекомендаций
б по альтернативным решениям для различных управляющих структур
региона, позволяющая синтезировать множество возможных вариантов
развития территории и обеспечивающая рациональный выбор наиболее
эффективных стратегий управления.
Практическая значимость и результаты внедрения работы
Практическая значимость работы определяется тем, что разработанные
методики и средства составляют основу информационно-аналитической
подсистемы анализа и прогноза общих тенденций динамики
демографических показателей для регионов с формированием рекомендаций по принятию управленческих решений в сферах планирования развития объектов промышленной и социальной инфраструктур. Информационно-аналитическая подсистема позволяет осуществлять целостное рассмотрение совокупности демографических показателей при помощи нейросетевых алгоритмов и обеспечивает получение статистически значимых моделей динамики демографических процессов за счет применения комитетов нейронных сетей. С помощью разработанной информационно-аналитической подсистемы осуществляется взаимосвязанный учет различных характеристик демографического состояния региона и последующего прогноза их динамики и использования.
Результаты исследования используются в учебном процессе кафедры «Биомедицинской инженерии» Курского государственного технического университета, кафедры «Математического анализа» Курского государственного университета, внедрены в работу Регионального отделения Палаты Коммерции и промышленности Словацкой Республики, (г. Кошице).
Апробация работы
Основные положения и научные результаты диссертационной работы докладывались и обсуждались на: Первой, Второй и Четвертой международных научно-технических конференциях «Медико-экологические информационные технологии» (Курск, 1999,2001,2003 гг.); конференции «Информационные технологии в информационных, социальных и
экономических процессах». (Череповец, 1999); Восьмой, Девятой и Десятой международных конференциях «Новые информационные технологии», (Москва, 2000, 2001, 2002); 6 International Scientific Conference "Applications of Mathematics and Statistics in Economy", (Banska Bystrica, Slovakia, 2003), на научно технических семинарах в Курском государственном техническом университете, Курском государственном университете, Техническом Университете г. Кошице. Публикации:
В открытой печати опубликована 18 работ, из них по теме диссертации 10 работ.
Структура и объем работы:
Диссертация состоит из введения, 4 разделов, заключения, приложений, содержит список литературы из 192 наименований. Основная часть работы изложена на 137 листах машинописного текста, приведено 35 таблиц и 32 рисунка.
Основные положения, выносимые на защиту
Нейронная сеть для декомпозиции факторного пространства демографических показателей.
Информационная технология анализа демографических процессов для разработки управленческих решений.
Информационно-аналитическая подсистема анализа и прогноза демографических показателей региона.
Личный вклад автора:
В работах, опубликованных в соавторстве, и приведенных в конце автореферата: в [1,2] проводится статистический анализ демографических показателей Курской области (35%), в работе [3] предлагается применить методы самоорганизации для моделирования значений демографических процессов (60%), в работах [4,5] рассчитываются статистические модели демографических показателей (20%), в работе [6] описана методика
декомпозиции факторного пространства (50%), в работе [8] представлена методика прогноза демографических показателей при помощи нейронных сетей (90%), в работе [9] показывается, какие типы нейронных сетей лучше применять при работе с демографическими показателями (80%), в работе [10] описываются основные этапы технологии анализа и прогноза в применении к демографическим и экономическим показателям (75%).
Основное содержание работы
Во введении обосновывается актуальность выбранной темы, приводятся цели и задачи исследования, определяются научная новизна и практическая значимость работы. Сформулированы основные положения, выносимые на защиту, приведены сведения об апробации и внедрении результатов работы, кратко излагается содержание основных разделов диссертации.
Первый раздел посвящен характеристике состояния вопроса в
области анализа и прогноза демографических показателей. Рассматриваются
недостатки существующих систем анализа и прогнозирования
демографических показателей и показывается, что большинство применяемых методик не позволяют учитывать многообразные взаимосвязи показателей и указывается на трудности построения точных прогностических заключений. Определяются пути и средства повышения качества управленческих решений, основанных на прогнозе и анализе демографических параметров для промышленной и социальной инфраструктуры региона.
Второй раздел посвящена описанию предлагаемых методов и средств: методики декомпозиции факторного пространства, методу синтеза модифицированной нейронной сети, информационной технологии анализа демографических показателей региона, информационно-аналитической подсистемы анализа и прогноза демографических показателей. В разделе описывается алгоритм формирования альтернатив управляющих решений для различных структур региона
В третьем разделе описана информационно-аналитическая подсистема (ИАП) анализа и прогноза демографических показателей, которая позволяет проводить дисагрегацию факторного пространства, анализировать и прогнозировать данные при помощи нейронносетевых алгоритмов. Показано функционирование блоков ИАП и на основе информации демографического мониторинга приведен пример ее тестирования.
В четвертом разделе проводится анализ адекватности построенных нейросетевых моделей динамики демографических процессов, исследуется работоспособность моделей в условиях шума. Обсуждаются результаты экспериментальных исследований для России и для Словакии, приводятся значения прогноза демографических показателей и рекомендации по планированию развития региона на период прогнозирования, обеспечивающие рациональный выбор наиболее эффективных стратегий управления.
Применение нейротехнологии для анализа демографических процессов
Как описано в литературе, совокупность демографических процессов относится к сложным системам, которые характеризуются высокой степенью неопределенности. Характерной особенностью проблемы управления для сложных систем является невозможность проведения экспериментов над реальной системой и необходимость использования выводов, полученных исключительно на моделях.
Согласно [] сложной системой считается такая система, у которой при вычленении компонентов могут быть утеряны принципиальные свойства, а при добавлении компонентов возникают качественно новые связи. Модель, представляющая сложную систему не может быть реализована при помощи принципов статистического анализа, так как при разделении системы на составные части в процессе синтеза ее внутренней структуры теряются ее определенные свойства, и она становится неадекватной исследуемой системе.
Современный этап моделирования сложных систем характеризуется применением нейронных сетей (НС), которые считаются на сегодняшний день наиболее перспективным инструментом для управления сложными системами [37,48, 132, 156].
НС предлагают устойчивый подход к решению задач аппроксимации непрерывных, дискретных и векторных целевых функций путем оперирования над довольно сложными входными и выходными обучающими векторами. Входные вектора представлены парами характерных значений. Эти значения могут быть высоко коррелированны или независимы друг от друга. Целевым выходным вектором обычно является ряд действительных чисел в промежутке от 0 до 1, где 0 обычно соотносится с наименьшей значимостью, а 1 - с наибольшей значимостью связи.
Использование скрытых слоев позволяет НС осуществлять нелинейные преобразования «вход-выход» любой сложности или извлекать из входных данных статистические показатели высоких порядков. Эти свойства многослойных сетей особенно проявляются при высокой размерности пространства входных сигналов.
При построении НС требуется определить параметры архитектуры сети (количество слоев и нейронов в каждом слое, вектор пороговых уровней и начальных значений весов НС, количество связей НС, функцию активации), параметры обучения НС (момент, скорость обучения, вектор пороговых уровней) и процедуру её реализации (контролируемое, не контролируемое обучение, методика обучения).
Несмотря на то, что НС обычно очень чувствительны к количеству примеров для обучения и полноте представленной входной информации, их использование обеспечивает меньшую экспериментальную ошибку, чем при работе традиционных алгоритмов. Традиционные алгоритмы имеют тенденцию применять экстенсивные математические вычисления и аппроксимацию и в основном описывают структуру процессов. Малые ошибки, возникающие в начале вычисления, могут привести в дальнейшем к тому, что прогностические значения могут выйти за границы максимально допустимого доверительного интервала, как это показано на рис. 1.3.
Прогноз при помощи традиционных алгоритмов Поэтому важной задачей при построении достоверного прогноза является выбор алгоритма аппроксимации данных с минимальной экспериментальной функцией ошибки.
В отличие от традиционных методов, которые вынуждают использовать только заранее определенные характеристики, доказанные разработчиками, НС содержат важное свойство эластичности, которое позволяет генерировать признаки, не разработанные в явном виде, так как они устойчивы к зашумленным данным. До тех пор, пока помехи не влияют не основное направление моделируемого процесса, сеть будет развиваться в правильном направлении.
В зависимости от вычислительной мощности сети, она может обучаться относительно долгий период времени: чем больше слоев и нейронов в каждом слое, тем больше времени потребуется на обучение сети. Но после того, как сеть обучена, постановка эксперимента на ней, в основном, не требуют больших временных затрат.
Примером практического использования НС для решения социальных проблем служит программа нейросетевого прогнозирования объемов заболеваемости опасными вирусными инфекциями, разработанная в центре по Госэпидемнадзору Рязанской области [37]. Автоматизированная система осуществляет краткосрочный и долгосрочный прогнозы инфекционной заболеваемости, что позволяет распределять силы и средства в противоэпидемической деятельности, при составлении областных целевых программ санитарно-эпидемического благополучия.
Исследование применимости различных типов нейронных сетей к представлению демографических показателей
Анализ литературных источников показал, что к настоящему моменту разработаны и апробированы различные типы НС, многие из которых могут быть полезны при аппроксимации и моделировании информации демографического мониторинга.
Принимая во внимание то, что принципы построения и обучения НС могут отличаться друг от друга и, таким образом, давать различные результаты при их применимости к демографических данным, а также для исследования вопроса о том, какие же сети целесообразнее применить к анализу статистических данных, были синтезированы и протестированы различные типы НС, а также исследованы их параметры.
В результате работы с литературными источниками было установлено, что для решения задач прогнозирования предпочтительнее всего выбрать НС следующих типов: 1. Многослойный персептрон (МЛП); 2. НС общей регрессии (НСОР); 3. Полифункциональная НС (ПНС). Выбор данных типов сетей был сделан исходя из следующих предпосылок. МЛП является стандартной базовой структурой НС, которая может быть легко настроена и управляема при помощи корректировки параметров и может быть применима для решения задачи прогноза временных рядов. Кроме того, МЛП наиболее часто используется разработчиками и исследователями для построения моделей процессов и предикции поведения сложных систем. Сети НСОР также являются вероятностными сетями и также применяются при прогнозировании. Сеть ПНС - спроектированный вид НС, основанный на базе МЛП, который за счет одновременного использования различных типов активационных функций представляет полифункциональный анализ показателя. Одним из недостатков оценивания результатов моделирования процессов при помощи НС является то, что на данный момент не существует методов определения адекватности построенных моделей, так как нейросетевые алгоритмы оперируют по принципу «черного ящика», преобразующего информацию. В то же время, способность НС к обобщению можно косвенно оценить при помощи статистических показателей, применяемых для линейных моделей.
Принимая во внимание вышеизложенное, нейросетевые модели процессов, полученные при помощи МЛП, НСОР и ПНС модели были оценены при помощи методов математической статистики. Между реальными и аппроксимированными при использовании синтезированных моделей данными рассчитываются следующие характеристики: 1. коэффициента множественной детерминации R ; 2. коэффициента парной корреляции г2; 3. среднеквадратического отклонения абсолютной ошибки (СКОО); 4. средней абсолютной ошибки (САО). На основе рассчитанных статистических характеристики оценивалась точность нейросетевых моделей. Исследование моделей, основанных на базе многослойного персептрона Как показано в Разделу 1, работа МПЛ определяется выражением 1.1, где F - функция активации. В качестве функции активации выбрана логистическая кривая (сигмоид): J л , -х , так как она является гладкой дифференцируемой функцией, что необходимо для последующего обучения НС методом обратного распространения ошибки.
Для коррекции весов при обучении методам ОРО была применена усовершенствованная формула [132]: (0 = H ",(/-l) + M)- ",-O "-,+aAHf"(?-l)t (о,) где а - момент обучения, OUTf" ) - выходной сигнал с предыдущего слоя, п - количество слоев НС, w - вес связи, / - номер нейрона в предыдущем слое, у- номер нейрона в рабочем слое, t - номер итерации, 8-переменная, ввозимая при обучении нейронной сети методом обратного распространения ошибки.
Момент обучения позволяет избежать опасности нестабильности работы, так как вносит некоторую инерционность от предыдущего значения весового коэффициента. В качестве момента обучения обычно выбирается малое положительное число. Дополнительным преимуществом от введения момента является появляющаяся у алгоритма способность преодолевать мелкие локальные минимумы.
Из литературных источников известно, что алгоритм обучения НС сходится в том случае, если значение ошибки обучения сети достигает пренебрежимо малого значения в результате проведенных итераций или если абсолютное изменение СКО за эпоху является пренебрежимо малой величиной. Считается, что пределы границы изменения СКО достаточно малы, если они находятся в пределах от 0,1 до 1 % на эпоху. При исследовании было принято значение 0,1 % на эпоху [132].
В качестве критерия остановки обучения сети создан суммарный критерий, согласно которому сеть считается обученной, если ошибка обучения снизилась до значения 0,001 и уровень ее абсолютного изменение за эпоху соответствует значению 0,1 % на эпоху.
Реализация нейросетевого симулятора
Блок обучения НС, или нейросетевой симулятор, является вычислительным ядром ИАП, так как именно в данном блоке происходит синтез нейросетевых моделей ДП. Нейросетевой симулятор состоит, в свою очередь, из следующих подблоков: блок определения типа НС; блок определения параметров архитектура НС; блок обучения сети;
Блок определения типа сети осуществляет выбор из МЛП, ПНС и НСОР. Блок ввода параметров НС запрашивает информацию об архитектуре сети. Данные о количестве слоев, количестве нейронов в слоях и о наличии связей между нейронами поступают из блока определения архитектуры НС. Далее для определения характеристик НС необходимо ввести первоначальные значения вектора весов и вектора пороговых уровней. Эти данные пользователь может ввести самостоятельно или же оставить значения, принятые по умолчанию.
При тестировании параметров НС в ходе вычислительного эксперимента были рассчитаны МЛП с разными значениями скорости и момента обучения. Во время проведения теста, оценивалась форма кривых целевой функции ошибки.
На рисунке 3.2 показана кривая целевой функции ошибки на примере показателя естественного прироста в Курской области. Для тестирования была составлена НС с двумя скрытыми слоями.
При значении скорости обучения, находящейся в интервале [0,5..0,9] и значении момента обучения, равного 0,9, возникают осцилляции, и сходимость алгоритма осуществляется при более высоком значении среднеквадратичной ошибки, чем при иных значениях. На третьем графике указанные параметры составляют соответственно 0,5 и 0,1.
Было отмечено, что при значениях скорости обучения, близких к единице и при значениях момента, близких к нулю, незначительно увеличивается время обучения НС, но также повышается стабильность обучения и гасятся осцилляции, как показано на втором графике. С другой стороны, хорошие результаты также были получены при близких к нулю значениях скорости обучения и при значениях момента обучения, находящихся в промежутке [0,5..0,9] (см. четвертый график). Следует отметить, что значение параметра скорости обучения не является постоянным, а изменяется по мере увеличения числа эпох как приведено ниже: скорость обучения = /-, п const количество пройденных эпох) Момент обучения остается постоянной величиной на протяжении всего периода обучения.
После того, как определены параметры архитектуры нейронных сетей и параметры обучения, пользователь переходит к режиму обучения НС методом обратного распространения ошибки.
При работе с мониторинговой информацией, подача обучающих примеров происходит в непрерывном режиме, что позволяет корректировать веса и пороги непосредственно после предъявления каждого из обучающих примеров. Эпоха формируется из JV обучающих примеров, сгруппированных в порядке [x(l),d(l)],...,[x(N),d(N)]. После того, как первый из примеров представляется сети, и рассчитываются коррекции, происходит изменение весовых и пороговых векторов НС для всех примеров данной эпохи. Данные подаются в случайном порядке, чтобы НС не могла привыкнуть к последовательности чередования образов.
Для обучения методом обратного распространения ошибки, на вход подается пример из обучающей выборки. Сигнал распространяется по сети и рассчитывается значение минимизируемой целевой функции ошибки НС (по формуле 2.2). Процедура осуществляет расчет ошибки для каждого из нейронов с учетов коррекции на предыдущих слоях НС. Коррекция происходит в направлении входов сети. Значения весовых и пороговых векторов пересчитываются, и на входы подается новый образ. Обучение проводится до момента достижения минимума ошибки. По достижении критерия остановки, НС готова к работе.
Обучение осуществляется в реальном масштабе времени так, что у пользователя есть возможность наблюдать за поведением функции ошибки обучения. На оси абсцисс отображаются значения количества прошедших эпох обучения, на оси ординат - абсолютные значения ошибки обучения.
Если кривая зашумлена, это свидетельствует о том, что неверно подобраны коэффициенты скорости и момента обучения или о том, что сеть переобучилась. После их коррекции параметров форма кривой меняется и осцилляции в большинстве случаев затухают, и кривая приобретает правильную форму. В случае переобучения (индикаторами которого являются нулевые показатели ошибки сети на обучающей выборке и неадекватное поведение НС на тестовой и контрольной выборках), сеть должна быть рассчитана заново.
В течение всего периода обучения в окне отображается информация о количестве пройденных эпох обучения и об изменении средней ошибки обучения, что позволяет корректировать параметры обучения. В качестве критерия остановки обучения сети выбирается суммарный критерий, который учитывает как снижение ошибки (менее 0,001), так и уровень ее абсолютного изменения за эпоху (0,01 % на эпоху).
Тестирование сети осуществляется в блоке нейросимулятора автоматически. На вход обученной НС подаются тестовые примеры и рассчитываются абсолютная ошибка и среднеквадратической отклонение абсолютной ошибки.
Исследование демографических процессов в Российской Федерации
Предложенная в Разделу 3 информационно-аналитическая подсистема анализа и прогноза демографических показателей была апробирована на статистический информации о демографических процессах в Российской Федерации, в частности в Курской области и в г.Курске. Рассматривалась следующая система показателей:
1. Основные демографические показатели: численность (общая, женского и мужского населения), рождаемость, общая смертность, младенческая смертность, количество браков, разводов, абортов)
2. Показатели, характеризующие движение населения (иммиграция, эмиграция, естественный прирост)
3. Показатели, характеризующие половозрастной состав населения (соотношение мужчин и женщин, численность основных групп населения, процент пожилых людей, процент молодежи)
4. Смертность от различных причин (заболеваний сердечно-сосудистой, пищеварительной, дыхательной системы, новообразований, несчастных случаев, врожденных пороков развития)
Анализируя полученные результаты, можно выделить ряд факторов, которые доминируют и оказывают влияние на большинство ДП региона: плотность населения и естественный прирост. Показатели, определяющие количество браков, абортов, разводов и уровень рождаемости попадают в одну статистически связанную группу с миграцией населения. Устойчивая двусторонняя связь выявлена среди показателей уровня рождаемости и количества абортов. Например, при декомпозиции факторного пространства относительно уровня миграции, сформированы следующие группы: 1. уровни рождаемости, средней продолжительности жизни женщин, количества разводов; 2. уровни естественного прироста, численности населения, средней продолжительности жизни мужчин, смертности; 3. уровни процентного соотношения мужчин и женщин, количества браков и абортов. Опираясь на данные таблицы 4.6, соответственно сформированным группам, были созданы НС.
Отдельно были рассмотрены связи между показателями заболеваемости населения по основным группам и демографическими показателями: численностью, уровнями рождаемости, смертности, миграции, количеством браков, разводов, абортов, соотношением возрастов, уровнем естественного прироста и младенческой смертности. Установлено, что для смертности мужчин в России характерна высокая связь с числом несчастных случаев (причины не выделяются), которое опережает число умирающих от новообразований и болезней сердечнососудистой системы. Для женской смертности характерна высокая значимость заболеваний сердечно-сосудистой, дыхательной и пищеварительной систем.
На основе результатов проведенной декомпозиции построены круговые диаграммы для региональных демографических показателей, на которых отражен вклад каждого из факторов в предсказание выбранной величины.
Выявлена значительная взаимосвязь между показателями количества абортов и женской смертности, а также между показателями количества разводов и уровнями механического (миграция) и естественного прироста (разницы между рождаемостью и смертностью).
Как следует из таблицы, наиболее значимыми факторами для смертности от несчастных случаев являются показатели естественного прироста и количества разводов. Для смертности от заболеваний кровеносной системы, характерна связь с количеством разводов, абортов, миграции и продолжительности жизни женщины. Приведенные примеры свидетельствуют о влиянии психологической и социальных составляющих на демографические процессы.
Для построения МЛП-сетей были определены параметры количества слоев и нейронов в слоях при помощи ГА. Обучение МЛП проводилось методом ОРО в соответствии с определенными в Разделу 3 значениях параметров обучения. Для каждого ДП были созданы несколько вариантов НС. Каждая из созданных НС была статистически оценена коэффициентами парной корреляции, множественной детерминации, СКОО и САО. Для дальнейшей работы были выбраны модели, которые характеризовались лучшими из представленных значениями статистических оценок.