Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Нейросетевое управление рентабельностью предприятия Бычков Андрей Витальевич

Нейросетевое управление рентабельностью предприятия
<
Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия Нейросетевое управление рентабельностью предприятия
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Бычков Андрей Витальевич. Нейросетевое управление рентабельностью предприятия : диссертация ... кандидата технических наук : 05.13.01.- Краснодар, 2001.- 163 с.: ил. РГБ ОД, 61 01-5/2588-8

Содержание к диссертации

Введение

1 Использование и получение знаний в нейросетевых моделирующих системах 14

1.1 Обзор современных нейросетевых программных продуктов 14

1.2 Методы создания многослойных нейронных сетей на основе знаний... 26

1.2.1 Классический способ генерации архитектуры нейросети с бинарными входами и выходами 26

1.2.2 Особенности обучения многослойных нейросетей 28

1.2.3 Анализ методов построения логически прозрачных нейросетей 32

1.3 Создание многослойных нейронных сетей при недостаточном размере обучающего множества". 43

1.4 Выводы 47

2 Создание нейросетевого аппроксиматора на основе алгебраической формулы 50

2.1 Теоретические основы метода FBANN... 50

2.1.1 Приведение силы взаимного влияния переменных в нейросетевой и линейной алгебраической моделями 50

2.1.2 Сохранение семантических связей в нейросети с помощью частотного контрастирования 63

2.2 Метод создания нейросетевого аппроксиматора на основе алгебраической формулы 68

2.2.1 Назначение и условия применения метода FBANN 68

2.2.2. Алгоритм создания нейросетевой модели по методу FBANN .. 70

2.3 Выводы 81

3. Оценка эффективности метода FBANN при нейросетевом моделировании рентабельности предприятий молочной промышленности краснодарского края 83

3.1 Целесообразность использования искусственных нейросетей для моделирования функциональных зависимостей экономических процессов 83

3.2 Показатели оценки эффективности методов создания нейросетевой модели 87

3.3 Моделирование рентабельности промышленного предприятия 89

3.3.1 Актуальность нейросетевого моделирования рентабельности 89

3.3.2 Формализация модели рентабельности промышленного предприятия 93

3.4 Экспериментальная оценка эффективности методов моделирования рентабельности 107

3.4.1 Выбор методов и средств моделирования 107

3.4.2 Создание и исследование моделей 109

3.5 Выводы 121

Заключение 123

Список использованной литературы 125

Приложения

Введение к работе

Математическое моделирование является неотъемлемой частью автоматизированных систем управления и обработки информации, применяемых в различных областях человеческой деятельности. Использование математического моделирования для оперативного прогнозирования и адекватного управления процессами, в научных исследованиях и опережающих АСУ позволяет реализовать базовый принцип автоматизации - повышение производительности процессов. Высокое качество управления достигается путем прогнозирования течения процесса, осуществления упреждающего или оперативного управления и, в результате, минимизации потерь.

Сложность многих объектов управления и необходимость регулирования в реальном масштабе времени накладывает жесткие требования не только к вычислительной мощности и быстродействию АСУ, но и к эффективности самих методов математического моделирования.

Среди направлений математического моделирования выделяется относительно новое научное направление - методы моделирования на основе искусственных нейроподобных сетей (нейросетей). Основными преимуществами нейросетевого моделирования перед другими направлениями являются [13,73]:

а) инвариантность (независимость от влияния) методов синтеза нейрон
ных сетей к размерности пространства признаков и размерам нейронной сети;

б) адекватность современным перспективным технологиям;

в) отказоустойчивость в смысле монотонного (постепенного), а не ката
строфического изменения качества решения задачи в зависимости от числа
вышедших из строя элементов;

г) высокая скорость формирования результата за счет естественного мас
сового параллелизма функционирования;

д) высокая помехоустойчивость и адекватность;

е) возможность интеграции в одной модели переменных имеющих раз
ную природу и типы значений;

ж) нечувствительность к наличию пропусков и искажений в данных;

з) неявный учет скрытого взаимного влияния известных переменных и
реализация нелинейного влияния неизвестных параметров.
Значительные успехи ученых и разработчиков в области развития нейро-

сетевых вычислений определяют это направление как современное и быстро развивающееся, а примеры успешного и экономически эффективного прикладного применения методов неироматематики отражают перспективность его дальнейшего развития.

Предметной областью, в которой уже получили признание нейросетевые методы, является сфера экономики и финансов. В этой области нейросетевые алгоритмы нашли свое применение в форме математического ядра интеллектуальных систем принятия решений, экспертных систем, оболочек для имитационного моделирования, нейросетевых баз знаний и др. [22,28,50,57,60,63]. В данной работе внимание акцентируется на одном из направлений использования нейросетей - это нейросетевые имитационные модели процессов. Имитационное моделирование представляет собой такой метод обработки информации, который позволяет получить приемлемо точные представления о моделируемом процессе, подготовить и оценить влияние управляющих воздействий, не влияя непосредственно на сам процесс.

Важной задачей в области экономического анализа является имитационное моделирование хозяйственной деятельности предприятий. Результатом хозяйственной деятельности предприятий является получение прибыли, поэтому, задача управления прибыльностью производства путем имитационного прогнозирования и анализа с помощью модели рентабельности предприятия является актуальной и современной задачей.

Среди математических моделей рентабельности промышленных предприятий, еще не использовались нейросетевые модели. Применение методов

нейроматематики к задаче моделирования рентабельности позволит повысить качество моделирования за счет вышеописанных достоинств методов нейросе-тевого моделирования.

Однако, практическое использование нейросетей в отдельных предметных областях, в том числе экономике и финансах, имеет ряд особенностей, которые ограничивают применение существующих неиросетевых методов или снижают их эффективность.

К этим ним относятся;

а) существование накопленных и формализованных знаний о закономер
ностях исследуемой области задач и, в месте с тем, частая нехватка необ
ходимых данных для построения модели конкретного процесса;

б) высокая рискованность и ответственность принятия решений;

в) высокая стоимость потерь;

г) высокая стоимость рабочего времени квалифицированных специали
стов.

Из-за этих особенностей некоторые свойства неиросетевых моделей ограничивают их применимость для моделирования экономических процессов.

Основными недостатками нейросетей, препятствующими их использованию относятся:

а) невозможность вербализации нейросетевой базы знаний и, как следст
вие, неинтерпретируемость результата сформированного нейросетевой
моделью;

б) необходимость наличия большого объема исходных данных для обу
чения и тестирования нейросетевой модели;

в) невозможность использования имеющихся знаний представленных в
форме функциональных зависимостей;

г) значительное время обучения нейросетевой модели;

д) необходимость обучения персонала основам теории искусственных
нейронных сетей и работе с нейросетевыми программными комплексами.

Для устранения этих недостатков необходима автоматизация процесса создания и использования модели рентабельности. Автоматизированная система нейросетевого моделирования позволит создать адекватную модель и с ее помощью осуществлять прогнозирование, контроль и оперативное управление состоянием промышленного предприятия.

Модель рентабельности предприятия представляет собой важную часть информационного обеспечения системы управления производством, и является результатом тщательного системного анализа факторов, влияющих на динамику рентабельности.

Актуальность этой диссертационной работы заключается в следующих выводах:

1. Использование существующих знаний выраженных в форме линейных
функциональных зависимостей и обучения на таблице актуальных данных для
создания неиросетевои имитационной модели является серьезным вкладом в
развитие направления создания неиросетевых интеллектуальных систем на
основе знаний.

  1. Программная реализация метода нейросетевого моделирования на основе знаний в составе неиросетевои моделирующей системы позволит создать мощное и доступное средство моделирования, объединяющее в себе достоинства неиросетевых моделей и экспертных систем.

  2. Снижение влияния или устранение вышеперечисленных недостатков неиросетевых аппроксиматоров позволяет значительно повысить их эффективность и привлекательность при использовании в качестве имитационных моделей в экономических задачах.

  3. Создание адекватной неиросетевои модели рентабельности позволит получить доступное средство для оперативного анализа и управления промышленным предприятием, а также краткосрочного прогнозирования величины рентабельности.

На основании перечисленных требований к методам нейросетевого моделирования процессов, сформулированы вопросы, отражающие научную проблему:

1. Как при создании имитационной нейросетевой модели процесса учесть
ранее накопленные знания, существующие в виде приближенных математиче
ских формул или коэффициентов линейной связи параметров?

  1. Возможно ли создание нейросетевой модели при недостаточном количестве исходных данных, но при наличии знаний о некоторых закономерностях моделируемого процесса?

  2. Как обеспечить интерпретируемость результатов работы нейросети?

  3. Каким образом реализовать доступность нейросетевого моделирования для конечного пользователя?

5. Насколько изменятся процесс создания нейросетевой модели и ее
характеристики при ограничении случайного характера ее инициализации?

Целью работы является разработка метода создания нейросетевого аппроксиматора на основе использования существующих знаний, его программная реализация в форме функции нейросетевого экпериментально» прикладного моделирующего комплекса. Этот комплекс должен интегрировать средства для извлечения и использования известных знаний о закономерностях процессов с методами нейроматематики, для создания нейросетевых моделей и проведения имитационного исследования процессов. Использование данного комплекса позволит осуществить адекватное имитационное моделирование динамичных процессов, которое ранее было невозможно из за недостатка достоверных данных.

Необходимо исследовать как повлияет интеграция в структуру нейросети знаний о закономерностях процесса на время обучения нейросетевой модели и ее адекватность.

С помощью моделирующего комплекса необходимо создать имитационную модель рентабельности предприятий перерабатывающей

промышленности, отличающуюся высокой адекватностью и необходимой точностью.

Для достижения указанных целей были поставлены и реализованы следующие задачи:

  1. Определение и исследование возможности построения структуры логически прозрачной нейросетевой модели на основе максимально полного использования существующей информации о моделируемом процессе;

  2. Формализация метода построения логически прозрачной нейросетевой модели на основе знаний отражающих линейные связи переменных модели;

  3. Исследовавание возможности применения разработанного метода в сочетании с современными алгоритмами обучения многослойных нейронных сетей;

4. Экспериментальная проверка применимости предложенного метода
для задачи моделирования рентабельности предприятия перерабатывающей
промышленности.

Содержание диссертационной работы отражает реализацию поставленных задач.

В первой главе выполнен анализ текущего состояния проблемы использования существующих знаний для улучшения вычислительных способностей нейросетевых моделей. Выполнен обзор лучших моделирующих нейросетевых программных пакетов с целью анализа доступности в использовании и определения степени использования накопленных знаний для создания моделей. Для оценки возможности создания условий для последующего извлечения знаний на этапе построения нейросетевой модели, выполнен анализ современных методов создания логически прозрачных нейросетей, а также методов извлечения знаний из обученных нейросетевых моделей. Определен тип прикладных задач, для которого обоснована неэффективность применения существующих методов создания логически прозрачных нейросетевых моделей.

На основании проработанного материала сделан вывод об отсутствии методов использования знаний в форме известных функциональных зависимостей между параметрами моделируемого процесса, для создания логически прозрачных нейросетевых моделей. Отсутствуют методы снижения объема вычислений в оптимизационной задаче обучения, снижения необходимого размера обучающего множества, сокращения времени обучения, повышения адекватности модели путем изменения алгоритма инициализации параметров многослойных нейросетей.

Во второй главе обоснован и описан метод создания улучшенной нейро-сетевой модели на основе использования знаний представленных в форме функциональной зависимости линейного алгебраического вида. Разработанный метод позволяет, используя знания эксперта о степени линейной связанности переменных или приближенную алгебраическую модель, в виде полинома первого порядка, создать структуру логически прозрачной многослойной нейросе-ти и инициализировать значения связей переменных, таким образом, что необученная нейросетевая модель становится способна частично воспроизводить обучающее множество еще до процесса обучения. В результате задача обучения нейросети сводится к задаче дообучения на новых примерах, поэтому сокращается общее время обучения нейросети. Кроме того, построенная по этому методу нейросеть может использовать для обучения обучающее множество меньшего размера. Это позволяет использовать данный метод для моделирования динамических процессов, в которых наибольшую достоверность имеют самые свежие данные, или процессов, для которых не представляется возможным создать обучающее множество необходимого размера.

В третьей главе выполнен обзор математических методов, используемых для моделирования рентабельности промышленного предприятия, и обоснована целесообразность применения нейросетевых методов.

Особенности данной задачи состоят в следующем:

1. В модель входят переменные имеющих разные типы значений;

  1. Аргументы модели имеют неизвестное взаимное влияние;

  2. Существует математическая модель, созданная по данным за прошедшие годы, но в связи с изменяющимися условиями рыночной экономики данная модель является неадекватной текущим данным.

4. Таблица статистических данных имеет небольшой размер.
Описаны: процесс формализации переменных модели рентабельности

промышленного предприятия, создание нейросетевых моделей, результаты моделирования. Выполнено сравнение с результатами, полученными с использованием традиционных методов моделирования рентабельности и классического метода создание многослойных нейросетевых моделей.

В заключении описаны выводы и результаты проделанной работы.

В приложении приводится описание и руководство по использованию разработанной нами системы нейросетевого моделирования NNTool 1.18.

Задачи исследования решены с использованием методов теории искусственных нейронных сетей, системного анализа, математической статистики, оптимизации и идентификации, финансового менеджмента.

Научная новизна исследования заключается в следующих результатах:

  1. Разработан новый метод создания неиросетевои модели, использующий информацию о существующей алгебраической модели исследуемого процесса.

  2. Для ускорения обучения и повышения точности работы многослойной нейросети используется расчет начальных значений весов связей до обучения.

  3. Разработан алгоритм совместного использования неполного обучающего множества и приближенной линейной алгебраической модели для построения неиросетевои модели многопараметрического процесса и показана его эффективность.

  4. Создана нейросетевая модель рентабельности предприятий перерабатывающей промышленности.

Практическая значимость работы заключается в разработке и апробации вышеописанного метода создания нейросетевых моделей, разработке экпери-ментально-прикладной программной системы для создания, исследования и применения нейросетевых имитационных моделей многопараметрических процессов. Созданная нейросетевая модель рентабельности используется для имитационного моделирования изменения прибыли предприятий перерабатывающей промышленности, что подтверждено 3 актами о внедрении. Результаты диссертационной работы используются и в других задачах: оценке стоимости недвижимости, оценке прибыльности производства персональных компьютеров и прогнозировании объема продаж и др., что также подтверждено еще 5 актами о внедрении.

Основные положения, выносимые на защиту:

метод создания нейросетевой модели на основе линейной алгебраической формулы;

нейросетевая модель рентабельности предприятия перерабатывающей промышленности, созданная на основе неполной выборки данных и приближенной формулы линейного вида;

показатели оценки методов моделирования рентабельности с помощью специального программного обеспечения;

результаты сравнительного анализа моделей рентабельности промышленного предприятия созданных тремя способами: регрессионная модель, многослойная нейросетевая модель, созданная классическим способом и модель, созданная по правилам разработанного нами метода FBANN;

Основные положения работы были доложены и обсуждены на Межвузовской научной конференции "Методы управления экономическими, социальными и правовыми процессами в Северо-Кавказском регионе" (ст.Отрадная, 1998 г.), Международной научно-практической конференции "Коммерциализация экономики и проблемы крупного бизнеса" (г. Краснодар, 1998г.), IV Все-

российской научно-методической конференции "Педагогические нововведения в высшей школе" (г. Краснодар, 1998 г.), I Международной научно-практической конференции "Проблемы регионального управления, экономики, права и инновационных процессов в образовании" (г.Таганрог, 1999г.), V Всероссийской научно-практической конференции "Инновационные процессы в высшей школе" (г.Краснодар, 1999г.), VI Всероссийской конференции "Нейрокомпьютеры и их применение" (г.Москва, 2000г).

Разработанная система нейросетевого моделирования процессов внедрена в ОАО "Научно исследовательский институт. Управление. Информационные технологии", ООО "ТД-Холдинг", ЗАО "СИНКО", ООО "Сонар-Директ", ЗАО "СЭНЭМИ", ООО "Мивимекс-Кубань", ООО "КАЯН" и в учебный процесс кафедры ВТ и АСУ КубГТУ. Выполненная работа связана с региональной программой "Научно-технические и инновационные приоритеты Краснодарского края" по разделу "Моделирование экономических систем переходного периода" (Постановление НТС Департамента образования и науки администрации Краснодарского края, 25.05.1999 г.).

Основной материал работы опубликован в 4 научных статьях и 5 тезисах докладов.

Диссертация состоит из введения, трех разделов, заключения, списка использованной литературы и приложений. Ее общий объем составляет 155 страниц текста, содержащего 12 таблиц и 23 рисунков.

Обзор современных нейросетевых программных продуктов

Методы нейроматематики с каждым годом получают все большее распространение в различных сферах человеческой деятельности [6,13,15,16,22,26,28,29,49,59,63,67,71,72,85,95]. Во многих задачах методы теории нейронных сетей имеют значительные преимущества перед другими методами математического моделирования, что определяет это направление в области искусственного интеллекта, как наиболее динамичное и быстроразви-вающееся. Основными преимуществами нейронных сетей, как логического базиса алгоритмов решения сложных задач, являются [17,22,28,26,82]: - инвариантность методов синтеза нейронных сетей к размерности пространства признаков и размерам нейронной сети; - адекватность современным перспективным технологиям; - отказоустойчивость в смысле монотонного, а не катастрофического изменения качества решения задачи, в зависимости от числа вышедших из строя элементов; - высокая скорость формирования результата за счет естественного массового параллелизма функционирования. Реализация нейросетевых вычислений осуществляется с помощью специальных аппаратных и программных средств. Под нейроеетевым программным обеспечением подразумевают программы, включающие в себя алгоритмы эмуляции параллельных вычислений искусственных нейронных сетей. Широкое распространение и высокие вычислительные возможности персональных ЭВМ обуславливают существование большого количества нейросетевого программного обеспечения для этого типа вычислительных машин. Несмотря на то, что нейросетевые модели осуществляют большое количество параллельных вычислений, мощность современных ПЭВМ с последовательной обработкой команд является достаточной для выполнения вычислений, не требующих очень большого размера нейросети [20,28,50]. Наибольшее распространение получило использование нейроэмуляции на ПЭВМ фоннеймановской архитектуры в задачах аппроксимации, классификации, категоризации выявления закономерностей и фильтрации данных, распознавании образов небольшой размерности и других задачах [13,16,20,27,29,63,86,98]. Программное обеспечение, в той или иной степени использующее методы нейросетевого моделирования, используется практически во всех сферах, в которых применялись традиционные методы искусственного интеллекта и моделирования. Нейросетевые программные продукты различаются в зависимости от назначения и степени использования методов теории нейросетей. В настоящее время на российском рынке программного обеспечения существует несколько типов систем использующих методы нейросетевого моделирования. К ним относятся: - интерактивные комплексы для разработки нейросетевых интеллектуальных систем; - комплексы для разработки интеллектуальных систем на основе традиционных парадигм ИИ, включающие нейросетевые методы моделирования; - научно-исследовательские программы для исследований нейронных сетей; - заказные прикладные программы и интеллектуальные системы, предназначенные для автоматизации конкретных прикладных задач, использующие нейросетевую модель в качестве математического ядра. Программные комплексы разработки нейросетевых систем отличают высокие возможности по созданию прикладных систем на основе различных нейросетевых методов. Идеологической основой создания таких комплексов явля 16 метода создания модели от моделируемой задачи. Универсальность нейросете-вых алгоритмов заключается в том, что для создания неиросетевои модели применительно к конкретной задаче достаточно выбрать нейросетевую структуру и подготовить таблицу статистических данных моделируемого процесса. Дополнительная информация о процессе для создания модели не требуется. Программные комплексы разработки нейросетевых приложений обладают значительными возможностями по предобработке данных, выбору типа, структуры, вариантов обучения неиросетевои модели, графическому представлению результатов моделирования, позволяют создавать готовые прикладные нейро-сетевые интеллектуальные системы, максимально приспособленные для использования в прикладных задачах, или модули, встраиваемые в специализированное прикладное ПО. Наиболее известные из таких систем это комплексы Neuro Shell фирмы Ward Systems, Neural Bench компании Neural Bench Development, Neuro Solutions компании Neuro Dimentions и Neural Works PRO от Aspen Technology .

Существующие ограничения этих систем определяются потерями в функциональности обусловленные сложностью реализации в одном комплексе универсальности, мощности, гибкости нейросетевого ядра и максимальной доступности в использовании.

Ряд крупных фирм, многие годы успешно занимающихся разработкой экспертных и аналитических систем, включает методы теории нейронных сетей в свои программные комплексы. Один из крупнейпшх разработчиков экспертных систем компания Gensym Corporation в дополнение к известной экспертной системе G2 разработала программный комплекс под названием NeuroOn-Line, реализующий методы нейросетевого моделирования. Этот комплекс предназначен для создания и интеграции в систему G2 нейросетевых моделей многопараметрических процессов на основе зашумленных и искаженных данных в задачах, где использование систем основанных на рассуждениях неэффективно.

Описания и демоверсии ПО получены из Internet страниц фирм производителей и дилеров. Однако, огромные возможности по формализации знаний, существующие в системе G2, не используются для поддержки создания нейросетевых моделей в программе NeuroOn-Line.

Другой распространенный программный комплекс статистического моделирования бизнес процессов - программа Scenario компании Cognos Incorporated - имеет в своем составе систему нейросетевого моделирования 4Thought для создания имитационных моделей на основе зашумленных и нелинейных данных, на основе небольших выборок. Мощная популярная система для выполнения различных математических расчетов MathLab фирмы Math-Work также имеет в своем составе модуль реализующий нейросетевые вычисления.

Приведение силы взаимного влияния переменных в нейросетевой и линейной алгебраической моделями

Наиболее распространенной нейросетевой структурой является нейросеть типа персептрон. Персептрон имеет многослойную структуру без латеральных связей и является наиболее изученным типом нейросетей [2,17,20,22,37,46,63,82,94,98]. Такая архитектура обладает потенциальной возможностью структурированного представления базы знаний. Одним из классов задач, в которых успешно применяются персептроны, являются задачи многомерной аппроксимации.

Обучение персептронов выполняется методами, основанными на принципе обратного распространения ошибки. Процесс обучения нейросети представляет собой задачу многопараметрической оптимизации по одному из критериев оценки точности работы нейросети, с граничными условиями типа равенство. Оптимизируемыми параметрами являются веса межнейронных связей. Критериями остановки обучения являются: критерий минимума ошибки выхода сети - отражает соответствие нейросети обучающему множеству, и критерий минимума среднего изменения весов - отражает момент прекращения изменения весов и, следовательно, остановку процесса обучения.

При моделировании непрерывных функциональных зависимостей с большим количеством переменных, в результате шкалирования возникает большое количество значений шкал дискретизации входов и выходов, что приводит к большому количеству связей в нейросети. Поэтому для обучения сети требуется значительное время. В зависимости от вычислительной мощности ЭВМ, размерности задачи и желаемой точности модели обучение может продолжаться от нескольких секунд до нескольких часов. [29,63]

Современные градиентные алгоритмы, основанные на принципе обратного распространения ошибки, могут сократить время обучения. Однако эти алгоритмы имеют один существенный недостаток, заложенный буквально в самом начале каждого из них. Этим недостатком является выбор начальной точки для оптимизации.

На основании обзора литературы, сделан вывод, что в подавляющем большинстве случаев использования многослойных нейронных сетей, вопросу выбора начальной точки оптимизации не уделяется должного внимания [20,22,28,37,42,49,66,90,92,94,98,100]. Это объясняется тем, что задача обучения нейросети может иметь несколько решений, описываемых различными наборами значений весов. Поэтому, веса инициализируются случайными значениями. Методы, реализующие создание структуры нейросети на основе деревьев решений, например методы KBANN и ALN, рассмотренные в первой главе включают расчет начальных значений весов связей, как неотъемлимую часть процесса создания нейросети. Рассчитанные ненулевые значения весов связей необученной нейросети, по утверждениям исследователей, существенно ускоряет процесс обучения сети KB ANN [89,96,100,102].

Рассмотрим моделирование функции нескольких аргументов y fCX), где X - многомерный вектор, с использованием однослойной нейронной сети. Однослойная нейронная сеть - простейшая нейросетевая структура. Любую нейронную сеть слоистой архитектуры без латеральных связей можно декомпозировать на множество связанных однослойных сетей [20,29,90]. На практике отдельно однослойные сети не используются, так как они обладают серьезным ограничением - они не способны моделировать линейно неразделимые задачи.

Для нейросетевого моделирования непрерывных функций от непрерывных аргументов переменные шкалируют в области допустимых (или наиболее вероятных значений). Количество значений шкалы зависимой переменной определяется на этапе разработки структуры нейронной сети исходя из желаемой точности выходного значения [21,29].

Рассмотрим некоторый интервал шкалы уг зависимой переменной у - т.е. моделируемого параметра. Этому интервалу соответствует условие ує[уг;у+гі], где г - порядковый номер интервала, и среднее значение функции на интервале уг. Условием, при котором нейронная сеть сформирует выходное значение, соответствующее значению шкалы равному уг является максимальное значение функции активации r-го нейрона выходного слоя, которая рассчитывается по формуле: После обучения вес каждой связи должен стремится к фактическому значению значимости связи. В обученной нейронной сети по абсолютному значению весов связей определяют значимость их связей, а по среднему значению связей входного нейрона - значимость этого нейрона [18,42,53,66]. Декомпозируем выходные нейроны на сумматор и нелинейную функцию активации. Обозначим: Q - количество входных нейронов в сети, S - количество входных переменных в моделируемой функции. В результате шкалирования, при предъявлении на вход нейросети непрерывных значений входных переменных каждое значение каждой переменной представляется отдельным двоичным вектором. Подав на вход нейросети полный вектор входных переменных, получим, что активации Q-S входных нейронов будут равны нулю. Следовательно, эти нейроны не влияют на величину выхода сумматора net выходного нейрона и веса связей между этими нейронами и выходным нейроном могут иметь любое значение. Значения активаций остальных входных нейронов, соответствующих интервалам данного входного вектора, будут максимальны, то есть outi=l. Именно их связи будут формировать значение выхода сумматора. На рисунке 2.2 показан пример распределения значимости весов связей для нейронной сети моделирующей функциональную зависимость двух переменных. Жирными линиями показаны связи осуществляющие распространение входного сигнала -то есть дискретных значений переменных XI и Х2, для одной из записей обучающего множества, пунктирными линиями показаны связи, значения весов которых не влияют на формирование сигналов выходов.

Алгоритм создания нейросетевой модели по методу FBANN

Создание нейросетевой модели по методу FBANN состоит из трех этапов. 1. Построение модели знаний. а) Формализация переменных модели. Из исходного математического выражения выделяются переменные и группируются по одинаковым уровням вложенности: входные переменные-аргументы, промежуточные переменные и выходная переменная. Формализацию переменных модели предпочтительно проводить эксперту, так как он обладает знаниями о внутренней структуре связей переменных и может предложить добавить в модель промежуточные переменные, существенные для дальнейшего извлечения и представления знаний из полученной модели. б) Дискретизация переменных. На этом шаге выполняется приведение всех переменных входящих в формулу к дискретному виду. Непрерывные переменные подвергаются процедуре шкалирования на области допустимых значений. Количество и интервалы шкал переменных определяются экспертом на основании прагматической целесообразности, или рассчитываются из условия равновероятного распределения. Значениям переменных имеющих нечисловую природу ставятся в соответствие наборы дискретных значений. Каждому интервалу шкалы каждой непрерывной переменной ставится в соответствие дискретная переменная. где Xj - некоторая непрерывная переменная модели; j- номер интервала шкалы значений; Ху - непрерывная переменная. С целью обеспечения логической прозрачности структуры нейросети кодирование значений переменных каждого слоя не производится. в) Создание графа семантических связей. Каждому значению каждой дискретной переменной ставится в соответствие узел графа. Проводятся связи между узлами. Наличие семантической связи между дискретными переменными определяется следующим способом: 1) Для каждой возможной комбинации дискретных значений аргументов берутся средние значения на интервалах шкал, соответствующих этим дискретным значениям. Эти значения подставляются в исходную формулу (или систему формул) и рассчитываются значения всех зависимых переменных. По полученным значениям, согласно шкалам дискретизации определяются дискретные значения зависимых переменных и соответствующие им узлы семантической сети. 2) Между узлами соответствующими значениям дискретных независимых переменных, и узлами соответствующими полученным значениям зависимых дискретных переменных проводятся связи. г) Расчет силы связей семантической сети. Сила каждой семантической связи рассчитывается на основании известных линейных коэффициентов исходной формулы как контрастированное значение относительной эластичности переменных на интервалах, соответствующих связываемым узлам семантической сети. Действия пунктов в) и г) выполняются по следующим формулам. Если на основании исходной формулы можно выразить связь переменных в виде: В результате действий первого этапа подготавливается модель знаний представляющая собой однородную семантическую сеть с взвешенными связями. 2. Построение архитектуры нейронной сети на основе модели знаний. а) Преобразование семантической сети в нейронную сеть. На основе семантической сети создается логически прозрачная многослойная нейронная сеть типа персептрон. Нейроны скрытых и выходных слоев имеют сигмоидную функцию активации. Каждому узлу семантической сети, соответствующему значению дискретной переменной ставится в соответствие один нейрон. Каждому значению независимой переменной ставится в соответствие входной нейрон, зависимой переменной - выходной нейрон, промежуточной переменной - нейрон скрытого слоя. Количество скрытых слоев соответствует количеству уровней зависимости переменных согласно семантической сети. Если модель не имеет промежуточных переменных, тогда создается проекция выходных переменных на нейроны скрытого слоя. Для этого создается один скрытый слой, в котором каждому значению выходной переменной ставится в соответствие один нейрон скрытого слоя.

В полученной нейросети общее количество нейронов равно сумме количества значений всех дискретных переменных модели.

Оценивается общее количество нейронов в скрытых слоях. Минимальное количество нейронов в скрытых слоях равно количеству значений промежуточных переменных. Для априорной оценки порядка количества нейронов, обеспечивающего оптимальную точность нейросети можно воспользоваться формулой, полученной на основе оценки из источника [29]:

Целесообразность использования искусственных нейросетей для моделирования функциональных зависимостей экономических процессов

Экономический анализ является неотъемлемой частью управления предприятием. Характерной особенностью метода экономического анализа является использование системы показателей, всесторонне характеризующих хозяйственную деятельность, изучение причин изменения этих показателей, выявление и изменение взаимосвязи между ними. Для определения и выявления взаимосвязи между показателями, которые определяются объективными условиями производства, используются методы экономико-математического моделирования [1,4,32,33,34,56,65,68].

Анализ хозяйственной и финансовой деятельности предприятия, как элемент экономического анализа, является актуальной и динамичной предметной областью, в которой применяются различные методы математического моделирования. "Финансовое состояние предприятия - это в высшей степени сложная система разнообразных взаимодействующих финансовых отношений. Поэтому и моделирование финансового состояния является чрезвычайно сложной как с экономической, так и с математической точки зрения задачей..." [48, С. 15]. Особенность финансовых моделей заключается в существовании большого количества факторов, влияющих на течение моделируемого процесса. Установление роли факторов - аргументов необходимая стадия разработки экономико-математических моделей. При разработке экономико-математических моделей не всегда возможно учесть влияние всех факторов [33]. Часто не по всем факторам имеется объективная статистическая информация [1,31,55,56].

Для того чтобы модели в максимальной степени отражали характер экономических процессов взаимодействия отдельных факторов, необходимо количественное выражение закономерностей процессов воспроизводства и взаимодействия отдельных факторов. На практике "финансовые коэффициенты зачастую используются в анализе в виде неупорядоченной бессистемной совокупности. В результате динамика этих показателей рассматривается обособленно. Это может привести к недостаточно верным выводам о финансовом состоянии предприятия. Поэтому весьма актуальной представляется задача комплексного изучения финансовых коэффициентов, решению которой должно помочь моделирование взаимосвязи нескольких показателей" [48].

Из перечисленного следует, что определение факторов модели и подготовка достоверных данных является весьма трудной задачей. Отбор аргументов-факторов основывается на следующих принципах [9,24,48]: а) все отобранные производственные факторы должны быть количест венно измеримы; б) исходные данные должны быть количественно однородны по своей экономической природе; в) каждый из отобранных факторов должен оказывать существенное влияние на уровень анализируемых показателей; г) результаты наблюдений должны быть независимыми и достаточными по количеству. На практике, независимые параметры имеют сильную взаимную корреляцию, искажены вследствие неточности измерений, имеют пропуски в данных. Часто данных просто недостаточно для построения модели. Данные добываются из различных источников и могут иметь вид действительных чисел, интервалов, быть логического типа, то есть не является количественно однородными. Кроме того, в задачах экономики и менеджмента постоянно используются различные величины, рассматриваемые как числовые. Например, рыночная цена товара, прибыль предприятия, индекс инфляции, валовой внутренний продукт, чистая приведенная величина для потока платежей и т.д. При более тщательном анализе оказывается, что подобные величины не имеют определенного численного значения, они размыты, имеют нечисловой характер, и описывать их следует с помощью нечисловых математических понятий, относящихся к тем или иным классам объектов нечисловой природы, таким, как нечеткие множества, интервалы, распределения вероятностей и др. [52].

Поэтому, построение математических моделей с использованием традиционных для экономических задач методов корреляционного, регрессионного и факторного анализа, теории вероятности и других методов, не всегда позволяет получить требуемый результат. Большинство перечисленных методов при создании модели накладывают ограничения на исходные данные, и условия их использования. Например, для применения статистических методов необходимо знать закон распределения, допустить независимость переменных, и однородность выборки [4,9,24,70].

В 90-х годах широкое применение в финансовой деятельности ведущих компаний стран Европы и США получил новый метод построения моделей на основе теории искусственных нейронных сетей. Существенные преимущества, определившие приоритет нейросетевых моделей перед другими методами моделирования во многих экономических задачах состоят в следующем. Нейросе-тевые модели позволяют имитировать нелинейные математические зависимости, в том числе немонотонные функции с разрывами. Благодаря свойству обобщения, нейросетевые модели не критичны к пропускам и искажениям в данных. Эти модели позволяют неявно учитывать известное и скрытое влияние входных переменных. Нейросетевые модели могут иметь дискретные входы и выходы, поэтому воспроизводят не связи между значениями переменных, а закономерности связей между интервалами значений переменных и, следовательно, некритичны к наличию случайных и даже систематических ошибок в данных. Способность к дообучению позволяет легко адаптировать нейросете-вую модель к условиям, отражаемым новыми данными результатов наблюдений. Все эти свойства нереализуемы другими методами в одной модели.

Для прикладного использования нейросетевые модели имеют ряд важных преимуществ. Естественный параллелизм позволяет эксплуатировать эти модели в реальном времени. Механизмы выделения правил из обученной ней-росетевой модели дают возможность наглядно представить основные свойства модели, и упростить использование результатов моделирования. С помощью нейросетей, соответствующих условию логической прозрачности, можно выявить количественные оценки влияния связей параметров, оценить значимость факторов, построить правила и уравнения связи. Существующее современное программное обеспечение для создания нейросетевых моделей и интеллектуальных систем на их основе, делает этот класс моделей удобным и доступным для интеграции в различные АСУП.

Похожие диссертации на Нейросетевое управление рентабельностью предприятия