Содержание к диссертации
Введение
Глава 1. Анализ объекта исследования и существующих методов логического контроля устройств СЦБ. постановка задачи 12
1.1. Системы диспетчерской централизации 12
1.2. Методы логического контроля в системах ДЦ 21
1.3. Автоматизация процессов логического контроля в системах ДЦ 28
1.4. Выводы 34
Глава 2. Разработка интеллектуальной продукционной модели логического контроля устройств сцб в составе системы ДЦ 36
2.1. Описание интеллектуальной продукционной модели и механизма вывода 36
2.2. Базы знаний на основе обобщенных структурно-временных описаний 45
2.3. Базы знаний на основе нейросетевых моделей 52
2.5. Организация механизма вывода 59
2.6. Выводы 64
Глава 3. Разработка методов формирования баз знаний для интеллектуальной продукционной модели логического контроля устройств СЦБ в составе системы ДЦ 66
3.1. Методы оптимизации при формировании баз знаний 66
3.2. Генетический алгоритм оптимизации обучающих выборок для нейросетевых моделей 79
3.4. Генетический алгоритм нахождения минимальных покрытий в моделирующих графах 87
3.5. Выводы ..95
Глава 4. Экспериментальные исследования основных теоретических разработок и их практическая реализация 97
4.1. Результаты экспериментальных исследований 97
4.2. Применение темпоральных моделей в подсистеме логического обнаружения несоответствия зависимостей устройств ЭЦ и АБ в составе системы ДЦ-Юг с РКП 111
4.3. Обнаружение подпитки повторителей путевых реле с использованием темпоральных метрических отношений 117
4.4. Выводы 122
Заключение 124
Список литературы 127
Приложения 138
- Системы диспетчерской централизации
- Описание интеллектуальной продукционной модели и механизма вывода
- Методы оптимизации при формировании баз знаний
- Результаты экспериментальных исследований
Введение к работе
Актуальность работы. Современные системы диспетчерской централизации (ДЦ) являются высоко интегрированными технологическими комплексами и включают в себя в качестве важнейших подсистем подсистемы логического контроля, отвечающие за надежность функционирования аппаратуры сигнализации, централизации и блокировки (СЦБ), а, следовательно, и за безопасность движения поездов. В основе существующих технологий обеспечения надежности и безопасности систем ДЦ лежат методы контроля, основанные на использовании традиционных автоматных моделей системы в виде логических уравнений-зависимостей. Однако на пути использования аналитических моделей для решения поставленных задач возникает ряд проблем, связанных со сложностью построения точных аналитических моделей контроля устройств СЦБ, чрезмерно большой размерностью задач логического контроля, недостоверностью информации, поступающей на вход системы и ее недостаточной информативностью для принятия контролирующих решений.
В решении указанных проблем могут помочь современные информационные технологии, в развитии которых, в последнее время, произошли существенные изменения, которые объясняются рядом причин, но, прежде всего, резким увеличением производительности вычислительных устройств, появлением новых компьютерных систем.
Наиболее характерным примером информационных технологий нового поколения являются гибридные информационные технологии [1-3]. В их основу положена идея использования для решения конкретных практических задач не одного какого-либо метода или модели, а объединения нескольких различных классов моделей, опирающихся на различные принципы представления и обработки информации. Благодаря такой интеграции разнотипных моделей в рамках единой технологии удается объединить
5 преимущества различных методов и подходов к принятию решений и одновременно нивелировать их недостатки, что существенно повышает эффективность всей системы принятия решений. Особый эффект достигается в результате интеграции точных аналитических моделей принятия решений, основанных на традиционных методах математического программирования, с интеллектуальными моделями, основанными на знаниях. Такие технологии получили название гибридных интеллектуальных технологий.
Гибридные интеллектуальные технологии ориентированы, главным образом, на решение задач повышенного уровня сложности или, так называемых, информационно-сложных задач. Их характерными признаками являются: неполнота либо недостоверность исходной информации о решаемой задаче; невозможность построения точной аналитической модели принятия решений; отсутствие алгоритмического решения поставленной задачи либо практическая невозможность его получения из-за необходимости использования чрезмерно больших компьютерных ресурсов времени и памяти. Наличие хотя бы одного из перечисленных выше признаков в решаемой задаче позволяет отнести ее к классу информационно-сложных задач [4, 5].
Класс информационно-сложных задач, с которыми приходится сталкиваться специалистам на практике, в последнее время непрерывно расширяется, что обусловлено, вовлечением в сферу автоматизации все более сложных процессов и систем. Наиболее характерными примерами информационно-сложных процессов являются процессы контроля и диагностирования сложных технических систем и технологических комплексов на железнодорожном транспорте и, в частности, систем диспетчерского управления, предназначенных для автоматизации процессов контроля и управления движением поездов на участках и направлениях железной дороги.
Таким образом, при создании современных систем ДЦ возникает потребность в разработке новых технологий контроля устройств СЦБ, основанных на принципах гибридизации, позволяющих в наиболее полной мере использовать весь потенциал технологических знаний о системе и законах ее функционирования для целей повышения надежности и безопасности создаваемой системы.
Степень разработанности проблемы.
Большой вклад в развитие теории и практики разработки эффективных систем диспетчерского управления, автоматизированных систем диагностирования и создания на их основе единых центров управления внесли отечественные ученые Л.А. Баранов, Д.В. Гавзов, И.Е. Дмитренко, И.Д. Долгий, O.K. Дрейман, В.Н. Иванченко, В.М. Лисенков, А.А. Поплавский, Е.Н. Розенберг, И.Н. Розенберг, В.В. Сапожников, Вл. В. Сапожников, Д.В. Шалягин, и др.
Большой вклад в развитие интеллектуальных технологий и теоретических основ информатики внесли такие ученые как Л.С. Берштейн, Г.И. Белявский, В.Н. Вагин, А.Н. Гуда, А.П. Еремеев, В.В. Емельянов, В.М. Курейчик, СМ. Ковалев, Н.Н. Лябах, Г.С. Осипов, Э.В. Попов, Д.А. Поспелов, В.Б.Тарасов, Е.М. Ульяницкий, В.К. Финн, И.Б. Фоминых и др.
Цель работы.
Целью диссертационной работы является исследование и разработка новых методов автоматизации логического контроля устройств СЦБ в составе систем ДЦ, основанных на использовании динамических зависимостей между телесигналами.
Для достижения поставленной цели требуется решить следующие задачи:
1. Провести комплексный анализ современных систем ДЦ и известных методов логического контроля устройств СЦБ с целью обоснования выбора гибридной модели для поддержки принятия контролирующих решений.
Разработать новый класс интеллектуальных поддерживающих моделей для гибридной системы логического контроля в составе систем ДЦ, основанных на использовании структурно-временной информации о функционировании устройств СЦБ.
Разработать методы формализации динамических зависимостей между телесигналами, методы оптимизации баз знаний (БЗ) и алгоритмы вывода, в качестве основного механизма поддержки принятия контролирующих решений.
Провести экспериментальные исследования, для обоснования эффективности предложенного класса моделей.
Методы исследования.
Для решения поставленных задач использовались следующие методы исследований: элементы теории множеств, элементы теории графов и гиперграфов, элементы темпоральной логики, элементы теории искусственных нейронных сетей, элементы теории генетического поиска.
Научная новизна диссертационной работы заключается в следующем:
Обоснована возможность применения искусственных нейронных сетей в качестве интеллектуальной модели поддержки процессов логического контроля в системах диспетчерского управления, позволяющей повысить достоверность определения состояния объектов контроля при неполных либо частично недостоверных данных.
Для систем диспетчерского управления разработана гибридная модель автоматизации процессов логического контроля, основанная на объединении теоретико-графовых и нейросетевых моделей и позволяющая учесть влияние динамических зависимостей между телесигналами при принятии контролирующих решений.
Предложен метод формализации динамических зависимостей между телесигналами, основанный на объединении темпоральных и нейросетевых
8 моделей, позволяющий при формировании баз знаний использовать линейные нейросети.
4. Для предложенного класса гибридных моделей разработаны методы оптимизации баз знаний и адаптации их параметров на основе генетических алгоритмов, решающие задачи нахождения покрытий в моделирующих графах и оптимизации обучающих выборок для нейросетевых моделей.
Практическая ценность диссертационной работы заключается в следующем:
На основе разработанной интеллектуальной модели создаются подсистемы логического контроля как в составе систем ДЦ, так и в других системах диспетчерского контроля и управления [6].
Предложенный способ представления данных об изменениях сигналов ТС в виде темпоральных формул применяется в составе интеллектуальной продукционной модели, и в других системах в качестве метода организации БД.
Разработанные генетический алгоритм нахождения покрытий в моделирующих графах и генетический алгоритм оптимизации обучающих выборок для нейросетевых моделей используются для решения широкого круга задач в области автоматизации контроля и диагностирования.
Достоверность и обоснованность научных положений, выводов и результатов, сформулированных в диссертации, подтверждается результатами вычислительных экспериментов на практических и модельных задачах, публикациями и апробацией работы на региональных, отраслевых и внутривузовских научно-технических конференциях, а также актами внедрения результатов работы.
Реализация результатов работы.
Часть теоретических и практических результатов работы использованы при разработке подсистемы логического обнаружения несоответствия зависимостей устройств электрической централизации (ЭЦ) и
9 автоблокировки (АБ) в составе системы ДЦ-Юг с РКП. На основе теоретических исследований разработан метод обнаружения подпитки повторителей путевого реле средствами системы ДЦ. Результаты работы используются в учебном процессе.
Апробация основных теоретических и практических результатов работы проводилась на научных семинарах (с 2002 по 2004 гг., РГУПС), региональной научно-практической конференции «Актуальные проблемы развития транспорта Черноморского побережья России» (Туапсе, 2004 г.), четвертой, пятой научно-технической конференции «Безопасность движения поездов» (Москва, 2003 г., 2004 г.), всероссийской научно-практической конференции «Транспорт - 2004» (Ростов-на-Дону, 2004 г.). Публикации.
По теме диссертации опубликовано 9 печатных работ. Структура и объем работы.
Диссертационная работа состоит из введения, четырех глав, заключения, и списка использованных источников. Работа содержит 152 стр., включая 34 рис., список использованных источников из 109 наименований, 15 стр. приложений и актов о внедрении. Содержание работы.
Во введении обоснована актуальность темы диссертационной работы, сформулированы цели, дано общее описание выполненной работы.
В первой главе выполнен комплексный анализ объекта исследования -подсистемы логического контроля устройств СЦБ в составе системы ДЦ, и предмета исследования - методов автоматизации процессов логического контроля устройств СЦБ в составе системы ДЦ. По результатам анализа сделан вывод о необходимости и возможности применения интеллектуальной методов контроля и диагностирования, и о необходимости разработки гибридной системы. Выполнена постановка задачи диссертационной работы, которая заключается в разработке для
10 интеллектуальной продукционной модели контроля аппаратуры СЦБ в составе ДЦ способа представления структурно-временных описаний, способа формирования баз БЗ в виде системы продукционных правил и алгоритма вывода в качестве основного механизма поддержки принятия решений в гибридной системе ДЦ.
Во второй главе предложен новый класс интеллектуальных поддерживающих моделей, основанных на использовании структурно-временной информации о функционировании аппаратуры СЦБ и ориентированных на поддержку процессов логического контроля. Предложены виды организации БЗ на основе теоретико-графовых моделей, на основе линейных нейроклассификаторов и на основе нейросетей одношагового прогноза.
В третьей главе разработаны алгоритмы формирования правил для интеллектуальной продукционной модели на основе методов генетического поиска. Это генетический алгоритм нахождения минимальных покрытий в моделирующих графах, оперирующий с особями, содержащими только «единичные» гены, с оригинальным оператором мутации. И генетический алгоритм оптимизации обучающих выборок для нейросетевых моделей с оригинальным оператором скрещивания на основе теоретико-множественной операции пересечения.
В четвертой главе выполнены экспериментальные исследования, показавшие эффективность генетического алгоритма нахождения минимальных покрытий в моделирующих графах и генетического алгоритма оптимизации обучающей выборки для нейросетевых моделей, возможность формирования продукционных правил на основе нейросетевых моделей. Показана эффективность представления данных в виде структурно-временных отношений в подсистеме логического обнаружения несоответствия зависимостей устройств ЭЦ и АБ в составе ДЦ-ЮГ с РКП и
11 методе обнаружения подпитки повторителей путевого реле, разработанных автором.
В заключении изложены основные выводы и результаты диссертационной работы.
В приложениях приведены копии актов о внедрении и использовании и исходные программные коды разработанных алгоритмов.
Системы диспетчерской централизации
Основным объектом исследования данной работы является диспетчерская централизация (ДЦ).
Диспетчерская централизация - это комплекс устройств железнодорожной автоматики и телемеханики, состоящий из автоблокировки на перегонах, электрической централизации стрелок и сигналов на станциях, системы телеуправления (ТУ) и телесигнализации (ТС) и дающий возможность поездному диспетчеру задавать поездные и маневровые маршруты на раздельных пунктах диспетчерского участка с центрального поста управления (ЦПУ) [7, 8].
ДЦ представляет собой технологическую систему, состоящую человеческих и аппаратных ресурсов. Поэтому она относится к кибернетическим системам, в которые технические системы входят как подсистемы.
В кибернетической системе для оценки входной ситуации используются различные критерии и соответственно для определенного набора входных данных могут быть выбраны разные программы управления. Кибернетическая система имеет возможность перекомбинации программ управления под воздействием внешнего или внутреннего управления. В одной и той же ситуации однотипные кибернетические системы могут вести себя по-разному и, с другой стороны, одинаково в различных ситуациях, т. е. для кибернетических систем характерно формировать поведение исходя из оценки внешней ситуации по определенному критерию в соответствии с внутренней целью.
В отличие от технических систем, где соблюдается жесткое соответствие между ситуацией на входе и реакцией системы на выходе, в кибернетических системах принимается то или иное управляющее решение и при нестандартной ситуации на входе системы, на основе обобщения опыта системы действия в похожих ситуациях.
Качество управления, прежде всего, зависит от объема исходной информации и полноты представления ситуации на входах системы, от которых зависит точность опознания ситуации и, следовательно, правильный выбор программы управления. Это объясняется тем, что обычно каждой ситуации однозначно противопоставлена определенная программа управления. Ошибки в опознании ситуации на входах системы неизбежно ведут к потере эффективности в управлении независимо от причины ошибки, т. е. безразлично была ли непредусмотренная ситуация или неправильно опознана предусмотренная.
Управление движением поездов на участке ДЦ производится путем организации определенных маршрутов средствами ЭЦ и АБ по командам диспетчера. Маршруты на станциях содержат стрелки и ограничивающие светофоры, по показаниям которых осуществляется движение.
Основным объектом контроля в системе ДЦ является система электрической централизации стрелок и сигналов [9-13], которая, как и любые сложные технические системы, в процессе эксплуатации подвержена отказам. Следствием отказов устройств ЭЦ являются ложная занятость или потеря контроля отдельных элементов или станций в целом, перекрытия сигналов, невозможность установки или отмены маршрутов и др. (рис. 1.2) [14].
По характеру отказы делятся на внезапные, постепенные и перемежающиеся [16, 17]. Внезапные, вызванные резкими изменениями погодных условий или режимов эксплуатации, неправильными действиями работников различных служб и другими причинами, составляют 32,27 % от общего числа отказов; постепенные, отражающие процессы старения и износа аппаратуры, разрегулировки механических и электрических параметров, - 60,75 %; перемежающиеся (с неустановленными причинами, самоустраняющиеся), вызванные нахождением рабочих параметров устройств в области, близкой к критической, - 6,98 %. Распределение основных причин отказов устройств ЭЦ показано на рис. 1.3 [14].
Кроме отказов в ЭЦ существует еще несколько возможных видов неисправностей на пути информации о состоянии ОК.
Нештатными ситуациями в рамках рассматриваемой структуры наиболее часто являются: неисправности объектов контроля, обрыв или подпитка цепей контроля, неисправности устройств ввода информации ТС (датчиков). Каналы связи, применяемые в системах ДЦ, относятся к первой категории по достоверности и имеют еще ряд других специфических требований [8]. Аппаратные и программные средства ЦПУ также достаточны надежны.
Описание интеллектуальной продукционной модели и механизма вывода
В основе продукционной модели [46-55] лежит понятие продукции, имеющей смысл выражения «Если..., то...». Выяснилось, что продукция может служить некоторым универсальным каркасом, в который можно встраивать самые различные виды знаний, а следовательно, использовать его в формальных моделях представления знаний.
Таким образом, продукционные правила, являясь основными единицами представления знаний в БЗ, могут представлять в компьютерных системах самую различную информацию. При этом с прагматической точки зрения интерес представляет лишь та информация, или те знания, которые является наиболее существенными для принятия решений. Такой информацией являются знания о законах функционирования системы или объекта управления и знания о способах управления.
В соответствии с этим можно выделить два основных класса продукций. Первый класс продукций включает правила вывода новых фактов в системе на основании фактов уже имеющихся в базе данных [59-62] (БД) системы. Второй класс продукций включает правила действия, в соответствии с которыми в системе вырабатываются решения.
В свою очередь, входящие в перечисленные классы продукции можно классифицировать по типу используемых в ней компонент и, в частности, в зависимости от характера секвенции - ядра продукции. Рассмотренная выше общая форма продукции характерна для детерминированных продукций. Однако в общем случае могут встречаться и недетерминированные или стохастические, а также нечеткие продукции. В соответствии с этим можно выделить классы недетерминированных и нечетких продукционных систем. В недетерминированных или нечетких продукционных системах каждая из продукций может дополнительно содержать дополнительную количественную оценку степени истинности правила.
Особенностью разрабатываемой продукционной модели является то, что она гибридная, т.е. содержит в себе оба класса продукционных правил: детерминированные на основе теоретико-графовых моделей и недетерминированные на основе нейросетевых моделей. Объединение нескольких типов продукционных моделей позволит увеличить достоверность определения адекватности состояний ОК текущей информационной ситуации.
Выбор точечной темпоральной логики для формализации обобщенных структурно-временных описаний обусловлен теми соображениями, что данная логика, являясь наиболее разработанной из всех темпоральных логик, содержит эффективные процедуры вывода, обладающие линейными оценками алгоритмической сложности, что позволяет разрабатывать на ее основе простые в вычислительном плане алгоритмы автоматического формирования классов обобщенных описаний для БЗ интеллектуальных поддерживающих моделей.
Продукционные правила типа П2 используются для поддержки процессов контроля при неполных либо частично недостоверных данных, опираясь на нейросетевые методы обработки информации.
Поскольку для реальных схем с большим числом релейных элементов полное множество всевозможных пар событий, связанных всевозможными типами временных отношений, достаточно велико, входами ИНС являются некоторые ограниченные подмножества элементарных пар отношений, оптимальным образом подбираемые для каждого из контролируемых элементов yj є Y в процессе формирования БЗ
Выбор простейших линейных ИНС в качестве классификаторов обобщенных описаний в диагностических поддерживающих моделях обусловлен тем соображением, что линейные ИНС, основанные на признаках второго порядка (каковыми являются признаки-отношения), способны обеспечить качество аппроксимации данных аналогичное тому, которое может быть получено на этих же данных путем применения ИНС с нелинейными функциями активации. В то же время для линейных ИНС существуют эффективные аналитические методы расчета оптимальных значений весовых коэффициентов Wn что упрощает процедуру обучения и обеспечивает возможность разработки на этой основе эффективных методов автоматического формирования БЗ интеллектуальных моделей.
Продукционные правила типа ПЗ, также как и правила типа П2, используются для поддержки процессов контроля при неполных либо частично недостоверных данных, и также опираются на нейросетевые методы обработки информации. Однако в качестве предусловий правил используются модели обобщенных описаний, представленные в виде двухслойных ИНС - многослойных персептронов (МСП) [63-65], осуществляющих функции одношагового прогнозирования состояния динамической системы м,(ґ) на основе информации о прошлых состояниях.
Структура нейросети одношагового прогноза приведена на рис 2.2. Выбор в качестве прогнозирующей нейросети МСП обусловлен несколькими факторами: 1) МСП может формировать сколь угодно сложные границы принятия решения и реализовывать произвольные булевы функции [64]; 2) МСП обладает возможностью настройки обобщающей способности при формировании архитектуры и обучении; 3) для МСП разработано множество эффективных алгоритмов обучения.
Методы оптимизации при формировании баз знаний
Предлагаемая в данной работе поддерживающая продукционная модель представляет собой стандартную тройку вида (2.2), особенностью которой является наличие в ней продукционных правил трех типов - ПІ, П2 и ПЗ, отличающихся по форме представления антецедентов.
МСП являются формой представления обобщенных описаний в продукционных правилах ПЗ. В разрабатываемом классе интеллектуальных моделей данные правила используются для поддержки процессов контроля в условиях неполной либо частично недостоверной входной информации. Поддерживающая модель в этом случае, фактически, реализует механизм вероятностного или нечеткого распознавания.
Архитектура МСП (рис. 3.1) состоит из последовательно соединённых слоев, где нейрон каждого слоя своими входами связан со всеми нейронами предыдущего слоя, а выходами - следующего. Нейроны располагаются в первом (скрытом) и во втором (выходном) слое. Входной слой только передает входные сигналы ко всем К нейронам первого слоя. Каждый нейрон первого слоя имеет N входов, которым приписаны веса wkl ,wk2,..., w (для нейрона с номером к). Получив входные сигналы, нейрон суммирует их с соответствующими весами, затем применяет к этой сумме некоторую передаточную функцию и пересылает результат на один из входов нейрона второго (выходного) слоя. В свою очередь, нейрон т выходного слоя суммирует полученные от первого слоя сигналы с некоторыми весами w(2) ,,.(2) (2)
Таким образом, выходы нейронов в МСП осуществляют классификацию у(2) = у(2)(х), где л: - входной, &у(2) - выходной векторы.
После вычисления суммы входных сигналов нейрон скрытого слоя осуществляет ее нелинейное преобразование в выходной сигнал с помощью сигмоидальной функции: f = 1 + е-« (3-1)
График сигмоидальной функции представлен на рис. 3.2. Основное ее достоинство, которое раскрывается при применении алгоритма обратного распространения, в том, что она дифференцируема на всей оси абсцисс и имеет очень простую производную: f\x) = qf{x)(\-f{x)). (3.2) Цель обучения состоит в подборе таких значений весов VWnA: и wkm для всех слоев сети, чтобы при заданном входном векторе х получить на выходе значения Ут , которые с требуемой точностью будут совпадать с ожидаемыми значениями dm, для т = 1, 2, ..., М. Рис. 3.1. Структура двухслойной нейронной сети Рис. 3.2. Сигмоидальная функция активации Состояние к-го нейрона скрытого слоя определяется по формуле: N -Zvttf. а его выходной сигнал: y?-f{sT)=f(j: \ (3.4) Аналогично, нейрон т в выходном слое вырабатывает выходной сигнал, определяемый как УІ2)=/(0 = /(І Г ), (35) к=\ После подстановки выражения (3.4) в формулу (3.5) получаем: 2,=д ді 4))- (3.6) к=\ и=1 3.1.2, Алгоритм обратного распространения ошибки Алгоритм обратного распространения ошибки [80] определяет стратегию подбора весов многослойной сети с применением градиентных методов оптимизации. Его основу составляет целевая функция, формулируемая, как правило, в виде квадратичной суммы разностей между фактическими и ожидаемыми значениями выходных сигналов. Для обучающей выборки (х, d) целевая функция определяется в виде і м Ж"0 = г2 і2)-О2- (3.7) т-\ Цель обучения состоит в таком определении значений весов нейронов каждого слоя сети, чтобы при заданном входном векторе х v(2) получить на выходе значения сигналов Ут , совпадающие с требуемой точностью с ожидаемыми значениями dm, при т = 1, 2, ..., М. Обобщенный алгоритм обучения МСП методом обратного распространения ошибки представлен на рис. 3.3. Учитывая, что целевая функция обладает свойством непрерывности, наиболее эффективными локальными способами обучения являются градиентные методы оптимизации, согласно которым корректировка вектора весов каждого слоя на четвертом шаге алгоритма производится по формуле w{t +1) = w(t) + Ди , (3.8) где Aw = Ap(w), (3.9) Я - коэффициент обучения, a p(w) - направление в многомерном пространстве w. Обучение многослойной сети с применением градиентных методов требует определения вектора градиента относительно весов всех слоев сети, что необходимо для правильного выбора направления/? .
Алгоритм обучения методом обратного распространения ошибки Все остальные методы локальной оптимизации фактически представляют собой различные методы выбора направления/» [81-90]. Все они имеют один общий недостаток: они не гарантируют достижение глобального минимума функции E(w). Различные модификации указанных алгоритмов, например добавление так называемого момента, хотя и позволяют избегать попадания в локальные минимумы, но только достаточно мелкие. К тому же алгоритм с такой модификацией может вообще не сойтись при попадании в «овраг» на поверхности целевой функции. По этой причине возникает необходимость применения методов глобальной оптимизации. Наиболее эффективными из них справедливо считаются генетические алгоритмы
Генетические алгоритмы [91-98] доказали свою эффективность при решении многих TVP-сложных задач [99], особенно в практических приложениях, где математические модели имеют сложную структуру и применение стандартных методов типа ветвей и границ, динамического или линейного программирования крайне затруднено. Принцип применения генетических алгоритмов [80, 100, 101] для обучения нейронных сетей заключается в организации эволюционного процесса, конечной целью которого является получение оптимального решения в сложной комбинаторной задаче подбора весовых коэффициентов.
Стандартный генетический алгоритм начинает свою работу с формирования начальной популяции Н0 — {hh h2, ..., hNJ - где каждая особь соответствует какой-либо точке из множества векторов весовых коэффициентов {wj, н 2, ... WMJ. Особи начальной популяции, как правило, выбираются случайным образом. В принципе, выбор начальной популяции не имеет значения для сходимости генетического алгоритма, однако формирование "хорошей" начальной популяции (например, из множества локальных оптимумов) может заметно сократить время достижения глобального оптимума.
Результаты экспериментальных исследований
Основными задачами этого пункта являются: 1. Испытание генетического алгоритма нахождения минимальных покрытий в моделирующих графах. 2. Испытание генетического алгоритма оптимизации обучающей выборки для нейросетевых моделей. 3. Экспериментальное доказательство возможности применения линейных нейроклассификаторов для формирования правил на обучающей выборке из множества темпоральных отношений (x&tXj) (xnXj єХ, ркє RT). 4. Экспериментальное доказательство возможности применения нейросетей одношагового прогноза для предсказания состояния динамической системы (системы ЭЦ) на основе информации о ее прошлых состояниях, и соответственно, применения указанных нейросетей для формирования правил. В системе диспетчерской централизации «ДЦ-Юг с РКП» непрерывно ведется протокол состояний ячеек ТС. Автором был разработан программный модуль для конвертирования произвольных отрывков данного протокола в матрицу (текстовый файл), каждая строка которой представляет собой вектор состояний ячеек ТС в определенный момент времени. Полученная матрица М вводится в рабочее пространство MATLAB [106, 107] собственными средствами программы. При конвертировании 200-часового протокола изменения состояний ОК станции «Примерная» (рис. 4.1) была получена матрица размером 20 000 х 192 (20 тыс. векторов состояний ОК размерностью 192 по количеству контролируемых элементов в перечне сигналов ТС).
Из множества векторов М были выделены два непересекающихся подмножества векторов Mj и М2 каждое размерностью 10 000 х 192, которые впоследствии были использованы для формирования соответственно обучающего и тестового множеств. Для формирования обучающей выборки для нейросетей одношагового прогноза применяется метод «скользящего окна» на подмножествах векторов Mj и М2, описанный во второй главе. Далее для каждого вектора mi множеств М} и М2 формируются вектора темпоральных отношении (x kXj) {xnXj є X, (рк є RT) (множества векторовS{, S2). Для этого используется следующий метод. Сначала формируется таблица (рис. 4.2), в строках и столбцах которой попарно располагаются события х и х] для каждого сигнала ТС. На пересечении строк и столбцов выставляются соответствующие временные отношения темпоральной логики для точечных событий, включающей в качестве базиса семейство темпоральных отношений RT = {(р0(рх(р2} ( Ро совпадать во времени, ty\ - следовать во времени, (рг- предшествовать во времени). Очевидно, что для формирования вектора темпоральных отношений s( достаточно выбрать отношения, лежащие справа от диагонали матрицы так, как показано на рис. 4.2, с последующей построчной склейкой. Количество темпоральных отношений в векторе s., получается согласно формуле: kl = jW,.-D (4.1) где Ns, - размерность вектора st.
Согласно структуре нейроклассификатора, предложенной во второй главе, на каждый вход ИНС подается факт присутствия или отсутствия определенного темпорального отношения Jix Xj ) є {0,1}. Каждое темпоральное отношение кодируется методом 1 из N, в соответствии с которым применяется следующая кодировка: «010»- J(Xi PoXj), «\oo»-J(xi p1xJ)t «001»- Jix Xj).
Генетический алгоритм нахождения минимальных покрытий в моделирующих графах используется в качестве базисного метода при формировании БЗ на основе структурно-временного обобщения.
График процесса нахождения минимального покрытия в моделирующем графе Параметр п определяющий максимальное количество попыток улучшения особи при формировании начальной популяции был выбран п=10. Размер популяции - 300 особей.
Поскольку в разработанном алгоритме нахождения покрытий применяется оригинальный оператор мутации, который заключается в добавлении случайного признака к мутирующей особи, для нахождения глобального экстремума необходимо задать достаточно высокую вероятность мутации. Определим РтШ =0.2. Вероятность скрещивания возьмем
Как видно из графика разработанный алгоритм действительно обладает высокой эффективностью. Как и предполагалось, формирование начальной популяции с использованием ограниченного локального спуска к локальному минимуму не уступает по эффективности предварительной фазе типового мобильного генетического алгоритма, а также существенно уменьшает время нахождения глобального минимума. Использование в строках переменной длины только единичных генов в совокупности с оригинальным оператором мутации также позволяют значительно сэкономить вычислительные ресурсы.
Испытание генетического алгоритма оптимизации обучающих выборок для нейросетевых моделей При использовании нейросетевых методов для бинарной модели контроля важнейшей задачей является выбор оптимальных наборов признаков, являющихся входными данными для ИНС. Для решения указанной задачи используется генетический алгоритм оптимизации обучающих выборок для нейросетевых моделей.
Разработанный алгоритм был реализован в среде Matlab, в виде т-файла. График процесса оптимизации обучающей выборки представлен на рис. 4.4.
В показанном эксперименте максимальное количество единичных генов в особи 7V ax=100. Размер популяции - 150 особей. В рассматриваемом алгоритме вероятности мутации и скрещивания не задаются, т.к. оператор мутации в нем отсутствует как таковой, а вероятность скрещивания соответствует вероятности пересечения особей и увеличивается по мере схождения популяции.
Рассматриваемый алгоритм был аналогичным образом применен для оптимизации обучающей выборки для нейросети одношагового прогноза. Только в целевой функции использовалась регрессионная нейросеть GRNN.
Как и ожидалось, дополнительное использование встроенной градиентной процедуры доформирования частичных наборов признаков обеспечивает дополнительное "ускорение" процессу поиска локального экстремума и повышает эффективность генетического алгоритма. А применение в целевой функции при оптимизации обучающей выборки для нейросети одношагового прогноза нейронной сети с архитектурой GRNN значительно снижает требования к вычислительным ресурсам.