Содержание к диссертации
Введение
Глава 1. Современное состояние методов анализа и прогнозирования производственно-экономических показателей работы промышленных предприятий 11
1.1. Анализ традиционных методов и систем прогнозирования как способа определения производственно-экономических показателей работы предприятий на перспективу 11
1.2. Возможности методов искусственного интеллекта (и метода нейронных сетей) в решении задач прогнозирования и управления 32
1.3. Существующий опыт использования нейронных сетей в промышленности 55
Глава 2. Разработка программного комплекса и интегрированной системы анализа параметров работы угольных предприятий, основанных на технологии нейронных сетей 71
2.1. Сравнительный анализ существующего нейросетевого программного обеспечения 71
2.2. Программная реализация компонентов программного комплекса 97
Глава 3. Разработка алгоритмов нейросетевого моделирования параметров работы угольных предприятий 105
3.1. Разработка алгоритма определения степени влияния показателей-аргументов 105
3.2. Разработка алгоритма нейросетевого прогнозирования 121
Заключение 135
Список использованной литературы 137
Приложение 1 148
- Возможности методов искусственного интеллекта (и метода нейронных сетей) в решении задач прогнозирования и управления
- Существующий опыт использования нейронных сетей в промышленности
- Программная реализация компонентов программного комплекса
- Разработка алгоритма определения степени влияния показателей-аргументов
Введение к работе
Важным условием получения объективной оценки работы угольной отрасли, необходимой как для возможной корректировки характера ее функционирования, так и для разработки программ перспективного развития, является наличие достоверной информации о состоянии отдельных угледобывающих предприятий.
Применение традиционных методов анализа состояния угледобывающих предприятий и оценки перспектив их развития не позволяет обеспечить требуемой в современных условиях хозяйствования степени глубины и детализации получаемой информации.
В данной работе предлагается в качестве одного из направлений в решении проблемы осуществления комплексного анализа технико-экономического состояния угольных предприятий и прогнозирования возможного изменения основных показателей их деятельности в перспективе, использовать создание проблемно-ориентированных программных комплексов на основе метода нейронных сетей.
Интенсивные исследования в области нейронных сетей и полученные теоретические и практические результаты привели к возникновению принципиально новых технологий создания интеллектуальных систем в различных областях знаний. Способность нейронных сетей к самоорганизации, адаптации и обучению позволяет создавать качественно новые прикладные системы, обладающие рядом преимуществ по сравнению с традиционными: меньшей процедурной сложностью, толерантностью к ошибкам, высокой точностью решения сложных задач. Одним из фундаментальных свойств нейронных сетей является способность их после обучения к обобщению и пролонгации результатов. Это создает предпосылки для создания на базе их различного рода прогнозирующих систем для разных сфер применения, в т. ч. для угольной промышленности.
Нейронные сети позволяют организовать высоко адаптивные нелинейные прогнозные модели, позволяющие во многих случаях моделировать и выполнять прогнозы сложных временных зависимостей с большей эффективностью и точностью по сравнению с известными статистическими методами.
По этой причине осуществляемая в данной работе разработка программного комплекса оценки технико-экономической деятельности угольных предприятий с использованием метода нейронных сетей является актуальной научной задачей.
Работа выполнялась в соответствии с проектом «Объектно-ориентированные модели горно-технологических информационных систем» плана НИР Института угля и углехимии СО РАН на 2001 - 2002 гг., проектом «Разработка научно-методических основ создания нового поколения геоинформационных систем» плана НИР Института угля и углехимии СО РАН на 2003 - 2005 гг., региональной программой «Сибирь», комплексом работ по стратегии развития угольной промышленности Кузбасса до 2020 г., отдельные этапы работы использовались в хоздоговорах по тематике Института угля и углехимии СО РАН.
Целью диссертационной работы является разработка алгоритмов комплексного анализа технико-экономической деятельности угольных предприятий с использованием метода нейронных сетей.
Идея работы заключается в том, что повышение качества оценки состояния угольных предприятий и анализ возможностей их перспективного развития достигается посредством использования метода нейронных сетей.
Для достижения поставленной цели необходимо решить следующие задачи:
— исследовать возможности нейросетевых методов для оценки технико-экономического состояния угледобывающих предприятий и перспектив его развития в условиях динамически развивающейся среды функционирования;
разработать метод формирования обучающей выборки для нейросетевого прогнозирования отдельных показателей по совокупности остальных технико-экономических показателей, обеспечивающий формирование нейронной сетью последовательности прогнозируемых значений;
разработать нейросетевой алгоритм определения неявных взаимосвязей между технико-экономическими показателями работы угольных предприятий;
разработать программный нейросетевой комплекс для прогнозирования и анализа последовательностей технико-экономических показателей работы угольных предприятий;
разработать на основе нейронных сетей комплексную интегрированную систему обработки и визуализации информации для анализа параметров работы угольных предприятий.
В исследованиях применялись следующие методы:
численные методы для формирования обучающих множеств нейронных сетей на базе статистических показателей периодической отчетности угледобывающих предприятий;
теории нейронных сетей и математического моделирования для разработки алгоритма определения неявных взаимосвязей между технико-экономическими показателями работы угольных предприятий и программных нейросетевых комплексов;
структурного и объектно-ориентированного программирования для разработки комплекса программ интегрированной системы анализа параметров работы угольных предприятий.
Научные положения, выносимые на защиту:
— эффективность решения задач анализа и прогноза технико-
экономических показателей угольных предприятий, определяемая
погрешностью прогнозирования, повышается в результате применения метода
нейронных сетей;
предложенный метод формирования обучающей выборки для нейронной сети, генерируя матрицу прогнозируемых элементов, обеспечивает создание последовательности прогнозируемых значений параметров деятельности угледобывающих предприятий;
разработанный нейросетевой алгоритм определения степени влияния показателей-аргументов, моделируя характер зависимости исследуемого показателя-объекта от показателей-аргументов, выявляет и идентифицирует неявные взаимосвязи между технико-экономическими показателями угледобывающих предприятий и степень влияния одних показателей на другие;
интегрированная с нейросетевым программным комплексом система обеспечивает обработку и визуализацию анализируемых показателей деятельности угледобывающих предприятий.
Достоверность научных положений подтверждается:
корректным использованием в качестве фактологической базы расчетов значительного объема (36 параметров — по угольным шахтам, и 33 — по разрезам) технико-экономических, показателей периодической отчетности российских угольных шахт и угольных разрезов (для различных видов расчетов — за периоды от 3 до 20 лет);
существующим положительным опытом использования: метода нейронных сетей для решения задач моделирования сложных процессов и установления неизвестных закономерностей в угольной промышленности;
сходимостью фактических данных и моделируемых нейронной сетью значений при определении степени взаимного влияния между основными технико-экономическими показателями работы угледобывающих предприятий (значения коэффициента линейной корреляции составляют от 0,78 до 0,95);
достаточной точностью прогнозирования, определяемой по средней норме разности между векторами прогнозируемых и фактических значений исследуемого показателя, порог максимального значения которой (с учетом нормирования показателей в интервале [-1,1]) составляет 0,04;
- общей сходимостью результатов оценки выявленных взаимосвязей
между технико-экономическими параметрами, а также выводов практических
рекомендаций, с результатами экспертного опроса по проблеме оптимизации
работы предприятий угольной промышленности.
Научная новизна полученных результатов состоит в следующем:
установлена возможность использования метода нейронных сетей к решению задач анализа и прогнозирования технико-экономических показателей деятельности угледобывающих предприятий;
разработан метод формирования обучающей выборки для нейронной сети, при использовании в качестве аргумента нейросети совокупности технико-экономических показателей работы угольных шахт и разрезов;
разработан и: обоснован алгоритм определения неявных взаимосвязей между основными технико-экономическими показателями работы угледобывающих предприятий и степени их взаимного влияния;
разработан программный нейросетевой комплекс для анализа последовательностей показателей производственной деятельности угледобывающих предприятий;
разработана и интегрирована в нейросетевой комплекс система обработки и визуализации показателей угледобывающих предприятий.
Личный вклад автора состоит:
в установлении. зависимости между последовательностью прогнозируемых значений исследуемого показателя и временными рядами показателей-аргументов в ретроспективе для формирования обучающего множества нейронной сети;
в разработке алгоритма определения весов взаимосвязей между показателями работы угольных предприятий, позволяющего выбирать наиболее информативные входные переменные на этапе подготовки данных для обучения нейросетей;
в разработке математических моделей прогнозирования деятельности угледобывающих предприятий, определяющих временной ряд исследуемого показателя в краткосрочной перспективе;
в установлении адекватности нейросетевых прогнозных моделей угольных предприятий и сравнении их эффективности с известными экстраполяционными методами;
в определении значения максимальной погрешности алгоритма прогнозирования, обеспечивающего эффективное использование вычислительных ресурсов;
в разработке интегрированной системы моделирования и анализа технико-экономических процессов угольных предприятий, включающей в себя: программный комплекс нейросетевого прогнозирования и интерфейсные приложения.
Практическая ценность диссертационной работы заключается:
в расширении области применения нейронных сетей за счет использования их при анализе и прогнозировании технико-экономических показателей угледобывающих предприятий;
в совершенствовании существующих и обосновании новых технических возможностей математического моделирования с использованием нейросетей;
в разработке базирующегося на использовании нейросетей программного комплекса, способного решать практические задачи по анализу и прогнозированию деятельности угольных предприятий;
в выявлении и анализе практически значимых взаимосвязей между основными технико-экономическими параметрами производственной деятельности предприятий угольной промышленности, дающих возможность определять направления и способы повышения их эффективности.
Результаты научных исследований, приведенные в диссертации, докладывались и получили одобрение на VII Международной научно-практической конференции «Перспективы развития горнодобывающей
промышленности в третьем тысячелетии» (Новокузнецк, 2000 г.), Международных научных симпозиумах «Неделя горняка - 2002», «Неделя горняка -2003» (Москва, 2002 - 2003 гг.), IV и V Международных научно-практических конференциях «Энергетическая безопасность России. Новые подходы к развитию угольной промышленности» (Кемерово, 2002 - 2003 гг.), Международной научно-практической конференции «Наукоемкие технологии разработки и использования минеральных ресурсов» (Новокузнецк, 2003 г.), Международной конференции «Вычислительные и информационные технологии в науке, технике и образовании» (Усть-Каменогорск, Казахстан, 2003 г.)-
Основные результаты диссертационной работы опубликованы в соавторстве с В, П. Потаповым, С. Н. Лазаренко. По результатам выполненных исследований опубликовано десять печатных работ, отражающих основное содержание диссертации.
Возможности методов искусственного интеллекта (и метода нейронных сетей) в решении задач прогнозирования и управления
В ряде случаев собственно статистическая обработка экономической информации непосредственно, не приводит к получению прогнозов, однако является важным звеном в общей системе их разработки. Такая обработка данных наблюдения, нацеленная на вскрытие различного рода конкретных статистических закономерностей, представляет собой, по сути дела, первый шаг на пути осмысливания информации и построения более сложных моделей, отображающих взаимодействие множества факторов, В связи с этим необходимо подчеркнуть важную роль статистической методологии в рамках построения имитационных моделей, которые все больше привлекают внимание экономистов. Потенциальные возможности имитационных моделей в отношении прогнозирования поведения изучаемых (моделируемых) систем еще далеки от полного раскрытия. Но уже сейчас очевидно, что успешность прогнозов, получаемых на основе имитационных моделей, существенно будет зависеть от качества статистического анализа эмпирического материала, от того, насколько такой анализ сможет выявить и обобщить закономерности развития изучаемых объектов во времени.
Инерционность экономических процессов проявляется двояко: как сохранение в основных чертах взаимосвязей прогнозируемого явления с. другими явлениями, объектами и процессами и как сохранение общей тенденции развития явления во времени. Инерционность второго рода — сохранение общей тенденции развития во времени — можно, по-видимому, рассматривать как частный случай более общего проявления инерции.
Прогнозирование, базирующееся на инерционности второго рода, можно свести к подбору аналитических выражений (моделей трендов) типа y = f(t) по данным за прошлое и экстраполяции полученных трендов. Что касается инерции во взаимосвязях, то для прогнозирования она может быть использована, если соответствующую взаимосвязь удается представить в виде аналитического выражения (например, регрессионного уравнения), которое связывает изменение одного экономического показателя: (зависимая переменная) с влиянием ряда фактор-аргументов, т. е. к данным наблюдения подбирается уравнение типа у = f(xux2,---)- Прогноз получают путем подстановки в регрессионное уравнение с численно оцененными параметрами значений независимых переменных. Результат представляет собой оценку среднего значения зависимой переменной при данных уровнях фактор аргументов- Для уравнения регрессии обычно определяют доверительные интервалы, которые также можно использовать в прогнозировании. Расчет доверительных интервалов позволяет определить область, в которой следует ожидать значение прогнозируемой величины.
Точность и надежность прогнозов — широко распространенные в прогностической литературе термины, смысл которых, как это представляется на первый взгляд, вполне очевиден. Однако содержание этих терминов часто толкуется достаточно субъективно. Нередки случаи, когда одно понятие подменяется другим. Во всяком случае мы здесь имеем дело скорее с интуитивным пониманием, чем с более или менее строгим определением данных категорий,
О точности прогноза принято судить по величине погрешности (ошибки) прогноза — разности между прогнозируемым и фактическим значением (реализацией) исследуемой переменной. Однако такой подход к оценке точности возможен только в двух случаях. Во-первых, когда период упреждения уже окончился и исследователь имеет фактические значения переменной- При краткосрочном прогнозировании это вполне реально. Во-вторых, когда прогноз разрабатывается ретроспективно, т. е. прогнозирование осуществляется для некоторого момента времени в прошлом, для которого уже имеются фактические данные. Так поступают в тех случаях, когда проверяется разработанная методика прогноза.
При этом имеющаяся информация делится на две части. Одна из них, охватывающая более ранние данные, служит для оценивания параметров прогностической модели, а более поздние данные рассматриваются как реализации соответствующих прогностических оценок. Полученные ретроспективно ошибки прогноза в какой-то мере характеризуют точность примененной методики прогнозирования и могут оказаться полезными при сопоставлении нескольких методов, В то же время, величину ошибки ретроспективного прогноза нельзя рассматривать как окончательное доказательство пригодности или, наоборот, непригодности применяемого метода прогнозирования- К ней следует относиться с известной осторожностью и при ее применении в качестве меры точности необходимо учитывать, что она получена при использовании лишь части имеющихся данных. Однако эта мера точности обладает большей наглядностью и уж во всяком случае более надежна, чем погрешность прогноза, исчисленная для периода, характеристики которого уже были использованы при оценивании параметров модели, В последнем случае погрешности, как правило, будут незначительны и мало зависимы от теоретической обоснованности примененной для прогнозирования модели. Точность же прогнозов будет преувеличенной и в известном смысле иллюзорной.
Наиболее простой мерой качества прогнозов при условии, что имеются данные об их реализации, может стать отношение числа случаев, когда фактическая реализация охватывалась интервальным прогнозом, к общему числу прогнозов, т. е, где р — число прогнозов, подтвержденных фактическими данными; q — число прогнозов, не подтвержденных фактическими данными. Когда все прогнозы подтверждаются, q = 0 и ц = 1, если же все прогнозы не подтвердились, то/?, а следовательно, и ц равны нулю. Ширина доверительного интервала в значительной мере зависит от принятой доверительной вероятности. Чем меньше эта вероятность, тем уже интервал. Таким образом,. сопоставление коэффициентов х\ для разных инструментов прогноза и моделей может иметь смысл только при условии, что доверительные вероятности приняты одинаковыми.
Существующий опыт использования нейронных сетей в промышленности
Однако на пути создания нейросетевых систем есть и немало трудностей. Самый главный вопрос — насколько можно доверять решению нейросети. Ясно, что степень уверенности нейросети в своем решении не является ответом на этот вопрос. На самом деле, в данной ситуации остаются те же проблемы, какие возникают при создании обычных экспертных систем. Создание обучающей выборки, ее корректность, подбор обучающих параметров остаются на совести человека. Немаловажно четкое понимание того, чему же все-таки необходимо обучить неиросеть. Правильная постановка задачи — достаточно сложное дело. Поэтому не следует впадать и в другую крайность — неиросеть не панацея для решения всех проблем, а лишь гибкий инструмент в руках пользователя:
Главным критерием работы нейросетевых экспертных систем должна быть практика — многократные испытания и проверки в самых различных условиях.
В задачах классификации ИНС имеют также определенные преимущества. Классификация занимается принятием решения выбора одной опции из числа возможных, т. е. какое действие надо сделать в данной ситуации? Вы также можете представлять это как проблему классификации образов: дан образец (ситуация), к какому классу надо отнести его (что надо сделать)? Это статистический метод определения класса для данного образа. Классификация может тренироваться на примерах, для которых известно, к какому классу они принадлежат; поэтому это — метод обучения с учителем.
Задачи классификации (типа распознавания букв) очень плохо алгоритмизируются. Если в случае распознавания букв верный ответ очевиден заранее, то в более сложных практических задачах обученная нейросеть выступает как эксперт, обладающий большим опытом и способный дать ответ на трудный вопрос,
Нейросеть позволяет обрабатывать огромное количество факторов (до нескольких тысяч), независимо от их наглядности — это универсальный «хороший врач», который может поставить свой диагноз в любой области.
Для решения задач аппроксимации ИНС и статистические методы имеют различные подходы. Аппроксимация находит функциональную взаимосвязь между входными переменными или параметрами и выходом- Вначале находится сама взаимосвязь, затем может быть подсчитан прогнозируемый выход для новых входных переменных. Статистические методы аппроксимации делают два критических предположения. Первое — выход и вход линейно зависят. Второе — отсутствие внутреннего взаимодействия между входными переменными. ИНС имеют преимущество перед аппроксимацией, т. к. могут представлять нелинейную взаимосвязь и допускают корреляцию между переменными.
Есть другое важное различие между двумя подходами. Если используются стандартные методы статистической аппроксимации, то точно определяется требуемая модель перед выполнением вычислений. Часто эти модели основываются на. упрощении предположений о распределении лежащих в основе данных. Модель может использоваться только в том случае, если она выполняется хорошо на новых проверочных данных.
ИНС, с другой стороны, генерируют лежащую в основе модель. Поэтому сеть более крепка (способна предсказать более точно и на более широком диапазоне входных данных), когда лежащий в основе процесс нелинейный и его статистика не гауссовская. Сети могут также адаптировать свою модель к ответу на новые данные. Однако, лежащая в основе модель, может быть сложной, либо даже невозможной для сети- В этом случае есть основания сомневаться в предсказанных сетью ответах. Кластеризация — это разбиение набора примеров на несколько компактных областей (кластеров), причем число кластеров заранее неизвестно. Кластеризация позволяет представить неоднородные данные в более наглядном виде и использовать далее для исследования каждого кластера различные методы. Например, таким образом можно быстро выявить фальсифицированные страховые случаи или недобросовестные предприятия.
Методы кластеризации являются также важным инструментом первичной обработки данных. Кластеризация обозначает результирующие кластеры, которые затем используются в процессе обучения с учителем. Помимо задач кластеризации, нейросети широко используются для поиска зависимостей в данных.
Нейронные сети широко используются в задачах прогнозирования. Задачи этого класса особенно важны для практики, в частности, для финансовых приложений. Таким образом, можно заключить, что искусственные нейронные сети являются мощным средством для определения производственно-экономических показателей работы предприятий в сравнении с традиционными методами и системами прогнозирования.
Одно из известных направлений использования ИНС в горной промышленности — диагностика подшипников горнодобывающих машин [95]. Анализ вибрации для диагностики машин — это мощный инструмент для обстоятельного контроля. Оборудование и технические приемы для диагностики подшипников разработаны и доступны. Самый надежный метод для диагностики подшипников: — анализ огибающей. Различные неисправности подшипников приводят к разным изображениям спектра огибающей. Проверки амплитуд характеристик подшипника на разных частотах недостаточно для надежной диагностики. Поэтому эксперты сравнивают изображение спектров характеристик подшипников с изображениями типичных дефектов. Представленная система прогнозирования дефектов подшипников имитирует действия эксперта. Используя нейронную сеть, система различает не только типичные дефекты подшипников, но также и другие виды неисправностей техники, такие как несбалансированность или биение свободных частей механизмов.
Во время работы механизма, вследствие движения его деталей, возникает вибрация. Неисправности элементов механизма обычно приводят к усиленной вибрации. Для измерения сигнала вибрации используется датчик ускорения, В основном диагностика происходит на частотах, не превышающих 50 кГц. Датчик ускорения производит переменный ток, который пропорционален амплитуде вибрации. Этот сигнал обрабатывается компьютером.
Локальные повреждения подшипника, такие как выбоины на дорожках, генерируют периодические импульсы. Частота этих импульсов для каждой неисправности различная и, в зависимости от геометрии подшипника и скорости его вращения, может быть подсчитана, В определенном частотном спектре неисправность подшипника может быть определена по высокой амплитуде результирующей кинематической частоты и ее гармонике.
ИНС дают более близкий к человеческому восприятию подход, чем традиционные методы. В контраст традиционным экспертным системам, где знания определены определенным набором правил, нейронные сети генерируют свои собственные правила, обучаясь на представленных примерах. Нейронные системы прогнозирования способны обучатся и для каждой решаемой задачи строить уникальные структуры. Особенно они полезны для распознавания образов.
Программная реализация компонентов программного комплекса
В настоящее время известно большое количество нейропакетов, выпускаемых рядом фирм и отдельными исследователями, позволяющих конструировать, обучать и использовать нейронные сети для решения практических задач.
Ниже излагаются результаты рассмотрения и сравнительного анализа основных характеристик различных нейропакетов и приведены преимущества и недостатки их возможного практического применения.
Так, нейропакет Neural Planner появился благодаря развитию своего предшественника — продукта PlanN, Нейропакет позволяет пользователю создавать многослойные нейронные сети с помощью простого графического редактора или автоматически создавать стандартную трехслойную нейронную сеть из файла данных» Также можно создавать файлы данных для тренировки, тестирования, сохранять выходные данные сети средствами неиросетевого пакета или используя любой редактор, поддерживающий текстовый формат. Выходные данные можно сохранять в виде электронной таблицы или иерархически. Neural Planner можно использовать совместно с другими нейросетевыми пакетами-Neural Planner является программной оболочкой, позволяющей моделировать нейронные сети различной конфигурации. Нейропакет может работать на платформе Windows как в сети, так и на локальном компьютере и не предъявляет особых требований к оборудованию. Пакет Neural Planner предназначен для решения различных задач классификации объектов, обработки значений случайных процессов, решения некоторых математических задач, создания эффективных экспертных систем.
Основными разделами нейропакета являются встроенный графический редактор и аналог табличного редактора- Графический редактор позволяет легко и наглядно создавать и редактировать нейронные сети без необходимости их описания в текстовом виде. Аналог табличного редактора позволяет создавать и редактировать обучающие векторы и векторы опроса нейросега, а также управлять процессом обучения.
К преимуществам пакета можно отнести такие характеристики, как возможность создавать нейронную сеть достаточно сложной структуры (в том числе с обратными связями), доступный пользовательский интерфейс, а также наличие встроенной помощи по командам и опциям программы. Недостатки пакета заключаются в применении ограниченного количества нейросетевых архитектур и алгоритмов обучения.
Программа NeuroProO.l является свободно распространяемой альфа-версией разрабатываемого неиросстевого программного продукта для работы с искусственными нейронными сетями и производства знаний из таблиц данных с помощью нейронных сетей.
Возможности программы заключаются в следующем; — Работа (чтение, запись, редактирование) с файлами данных, представленными в форматах dbf (СУБД dBase, FoxPro, Clipper) и db (СУБД Paradox). — Создание слоистых нейронных сетей для решения задач прогнозирования. Число слоев в нейросети — до десяти, число нейронов в каждом слое — до ста. — Сигмоидные нейроны с нелинейной функцией трансформации /(А) = А /(Л + с), Крутизна сигмоиды может задаваться отдельно для каждого слоя нейронов. - Нейросеть может иметь несколько выходных сигналов (решать одновременно несколько задач прогнозирования); для каждого из выходных сигналов могут быть установлены свои требования к точности прогнозирования. - При работе с нейропакетом имеются такие возможности, как тестирование нейронной сети, вычисление и отображение значимости входных сигналов сети, внесение случайных возмущений в веса синапсов сети. - Генерация вербального описания нейронной сети позволяет восстанавливать набор правил, используемых нейросетью для правильного решения задачи. Вербальное описание может редактироваться и сохраняться во внешнем файле на диске. Обучение нейронной сети происходит по принципу двойственного функционирования с применением одного из следующих методов оптимизации: - градиентный спуск; - модифицированный РагТап-метод; - метод сопряженных градиентов. Упрощение (контрастирование) нейронной сети выполняется несколькими способами: - сокращение числа входных сигналов нейросети; - сокращение числа синапсов нейросети; - сокращение числа неоднородных входов (порогов) нейронов сети; - равномерное прореживание структуры синапсов нейросети; - бинаризация весов синапсов нейросети. Применение данного программного продукта возможно в традиционных областях, а именно в медицине, экологии, климатологии, метеорологии, при построении моделей технических объектов и их идентификации, в экономике (прогнозирование курсов валют, акций и т. д.) и вообще, для решения любой задачи классификации или прогноза, которая решается при наличии выборки данных и для решения которой ранее использовались традиционные математические методы (регрессионный анализ, непараметрическая статистика), однако не была достигнута требуемая точность прогноза.
К преимуществам пакета можно отнести возможность оптимизации структуры сети, а к недостаткам — использование фиксированной нелинейности нейронов и невозможность сохранения результатов опроса обученной иейросети.
Пакет Neuro office предназначен для проектирования интеллектуальных программных модулей, построенных на основе нейронных сетей с ядерной организацией. Результатом проектирования является обученная нейронная сеть с программным интерфейсом, соответствующим модели многокомпонентных объектов (СОМ-технология), что позволяет легко встраивать интеллектуальный модуль в любое приложение Microsoft office, включая электронные таблицы Excel, базы данных Access, редактор Word и пр. В равной степени интеллектуальный модуль может быть встроен в любой проект пользователя, реализованный на языках Visual C++,, Borland C++, Visual Basic, Java. Ядерные нейронные сети могут быть использованы для задач прогнозирования финансовой и социальной политики, для построения экспертных систем, для распознавания образов, в задачах цифровой обработки сигналов (включая реализации быстрых алгоритмов спектральных преобразований). Интеллектуальные модули могут быть встроены в Web страницу сети Интернет или использоваться в этой сети для построения интеллектуально-развитых систем поиска, В корпоративных сетях СОМ-технология позволяет реализовать распределенную обработку данных. Средства проектирования структуры и топологии, входящие в состав пакета, могут найти применение для разработки топологии коммутационных систем и топологии нейрочипов.
Разработка алгоритма определения степени влияния показателей-аргументов
Как было показано выше, существенные перспективы в области разработки новых методов моделирования сложных процессов связаны с применением нейронных вычислительных структур. Преимущества таких структур обусловлены принципами их структурно-функциональной организации, высоко параллельной и самонастраивающейся архитектурой, а также особенностями процессов обработки информационных потоков в нейронных сетях, позволяющими прогнозировать поведение сложных систем с высокой эффективностью использования вычислительных ресурсов.
Важной для оптимизации работы угольной отрасли является проблема прогнозирования уровня технико-экономического состояния угледобывающих предприятий. В качестве одного из направлений в решении ряда задач, связанных с данной проблематикой, может рассматриваться выявление — и последующее использование в процессе прогнозирования — неявных, «скрытых» взаимосвязей между производственно-экономическими показателями деятельности угольных предприятий.
Актуальность задачи выявления скрытых взаимосвязей между производственно-экономическими показателями угольных предприятий и высокая эффективность нейросетевого моделирования при решении подобного рода задач обусловливают необходимость создания новых специальных программных систем на основе нейронных сетей.
Существует проблема выбора из всего множества имеющих какое-либо отношение к исследуемому вопросу экономических и технологических показателей наиболее влияющих на результат прогноза. Исключая из множества входных параметров не влияющие или мало влияющие на исследуемый параметр, повышается достоверность полученного прогноза. При этом уменьшается размерность входного пространства, что приводит к увеличению скорости обучения сети.
Для определения степени влияния входного показателя на выбранный исследуемый показатель используется сеть прямого распространения, на вход которой подаются значения параметров.работы угольных предприятий, а.на выходе сети выдаются значения выбранного исследуемого показателя. После обучения сети определить приоритеты показателей можно различными способами: - непосредственным изменением значений параметра; - определением значений метрики приоритетов; - весовым выделением исследуемого параметра. Первый способ заключается в непосредственном изменении каждого параметра (например +/-10% от интервала изменения этого параметра) и фиксировании полученного при этом изменения выхода сети- После нормализации получаем коэффициенты влияния параметров. Во втором случае используется более универсальный подход. На множестве входных весов сети вводится метрика. Обозначим за W1 вектор входных весов сети, ассоциированных с i-ым параметром. Всего имеется п параметров. Количество элементов в векторах обозначим как s9 и оно равно количеству нейронов в первом слое. Таким образом, метрика М определяется как функция из Д в R. Вычислив значения M(Wi)t i=l„.,,n и нормируя их, получаем коэффициенты влияния параметров. В третьем случае коэффициент влияния каждого параметра определяется нормированной разностью между максимальным и минимальным значением выхода сети на объединении тренировочного и тестового множеств после весового выделения требуемого параметра. Весовое выделение производится обнулением значений всех входных весов сети, не ассоциированных с исследуемым параметром. Получив для каждого параметра соответствующую разность, выполняем нормализацию делением на максимальную разность. В результате получаем коэффициенты влияния из интервала [0,1], где ноль соответствует минимальному влиянию, а единица максимальному. Наиболее простой вариант этого способа возможен в случае наличия одного нейрона в первом слое нейронной сети и был применен в работе [110], где решалась задача прогнозирования прибыли угледобывающего предприятия, полученной с 1 т добытого угля, исходя из его экономических показателей, представленных в виде входного вектора. Каждый вектор в описываемом случае соответствовал определенному угледобывающему предприятию Кемеровской области. (Всего — 82 предприятия, включая разрезы и шахты. Список предприятий и их параметров можно посмотреть в приложении!). Компонентами векторов являлись экономические показатели предприятий за 1997 год, а именно; - среднемесячная отпускная цена 1 т,руб.; - добыча угля общая, тыс. т; - среднемесячная производительность труда, т/мес; - среднесписочная численность работников, чел.; - среднемесячная зарплата работников, руб.; доля ФОТ, %. На выходе сети выдавалось значение прибыли предприятия, полученной с 1 т добытого угля. Решение данной задачи позволило определить наиболее важные показатели, влияющие на прибыль предприятия,. Во-первых, можно проанализировать веса обученной сети. Чем больше абсолютное значение веса, связанного с данным параметром, тем больше этот параметр влияет на выход сети. Во-вторых, после обучения сети и; успешного тестирования можно вручную изменить нужный параметр входного вектора и наблюдать за изменением прибыли. Для решения задачи был использован аппарат нейронных сетей. Сеть создавалась с помощью нейросетевого пакета NeuroSolutions v 3.0, Пакет NeuroSolutions предлагает большой выбор нейросетевых архитектур: