Содержание к диссертации
Введение
1. Программно-аппаратные комплексы управления информационным ресурсом 10
1.1 . Характеристики информационных систем 10
1.2. Существующие программно-аппаратные комплексы управления информационным ресурсом 17
1.2.1.. Технологам хранения данных 21
1.2.2. Программно-аппаратные комплексы управления неструктурированными данными 31
1.3.Концепция управления информационным ресурсом 34
1 А.Требования, предъявляемые к функционированию информационной системы 37
2. Оптимизация структуры информационного ресурса... 40
2.1 .Методика формирования структуры информационного ресурса 40
2.1.1. Этапы определения входных параметров структуры 43
2.1.2. Формализованное описание результатов исследования 51
2.2.Математическая модель оптимизации структуры 55
2.2.1. Расчет значений параметров модели 55
2.2.2. Постановка задачи оптимального планирования номенклатуры дисковых массивов 58
2.2.3. Постановка задачи оптимизации запасов ресурса 60
2.3.Решение задачи оптимального планирования 64
2.3.1. Решение задачи линейного программирования для случая
трехуровневой структуры информационного ресурса 64
2.3.2. Решение задачи многокритериальной оптимизации 67
Выводы по главе 70
3. Построение классификатора информационного ресурса на основе нейронных сетей 71
3.1 .Этапы классификации информационного ресурса 71
3.2. Реализация нейросетевой модели и исследование ее технических характеристик 82
3.3.Определение критерия качества нейронной сети и функционала его оптимизации 88
Выводы по главе 96
4. Управление информационными ресурсами организации 97
4.1.Анализ информационного ресурса 97
4.2.Организация размещения информационного ресурса 110
4.3.Организация защиты данных 122
4.4.Расчет эффективности предлагаемых решений 125
Выводы по главе 129
Основные выводы и результаты работы 130
Список литературы
- Характеристики информационных систем
- Существующие программно-аппаратные комплексы управления информационным ресурсом
- Этапы определения входных параметров структуры
- Реализация нейросетевой модели и исследование ее технических характеристик
Введение к работе
По оценке аналитиков, архивы корпоративной информации удваиваются каждые два года, причем 80% объема данных, хранимых в электронном виде, приходится на неструктурированную информацию [1]. Ситуация осложняется требованиями нормативных актов и внутрикорпоративных стандартов, предписывающих длительное хранение некоторых видов информации — иногда в течение 5-10 лет [2,3]. При существующей тенденции прогнозируется дальнейшее ускорение темпов роста, что ставит перед специалистами в области информационных технологий (ИТ) задачи обеспечения функционирования информационных систем (ИС) с заданными параметрами. В настоящее время активно ведутся работы по созданию единых информационных пространств, что предполагает использование открытых информационных систем. В связи с этим к ИС предъявляются требования интероперабельности, масштабируемости, переносимости, производительности, надежности.
Для проектирования ИС необходимо обеспечить взаимодействие аппаратного, программного, информационного обеспечения на заданном уровне производительности, надежности, масштабируемости, т.е. требуемых уровнях функционирования. Применение различных конфигураций этих составляющих позволит выработать определенную стратегию построения ИС, направленную на улучшение требуемых параметров функционирования и уменьшение затрат на обслуживание и модернизацию.
Решение вышеперечисленных задач связано с выбором состава технических устройств, средств связи, структуры и организации вычислительной сети, структуры информационного ресурса (ИР), которые обеспечивали требуемые параметры при снижении затрат.
Именно поэтому особый интерес в настоящее время приобретают методы, которые позволяют оценить структуру вычислительной сети,
организацию баз данных, характеристики технических комплексов, организацию хранения ИР.
Фундаментальные положения теории информации и управления информационными процессами принадлежат Л. Бриллюену, Н. Винеру, А. Колмогорову, Дж. Пирсу, Р. Фишеру, К. Шеннону [4].
В российской литературе различные аспекты информационных ресурсов, их производства и распространения нашли отражение в работах [4, 6] В.Тихомирова, А. Хорошилова, Д. Чернавского. В последние годы появились работы, в которых решаются вопросы эффективного использования ИС при совершенствовании деятельности организаций. Это работы A.M. Вендрова, Т.А. Гавриловой, A.M. Карминского, К.Г. Скрипкина, Г.А. Титоренко, СВ. Черемных и др. [11-15,17].
Однако в известных работах решались, как правило, задачи, связанные с повышением эффективности поиска, передачи и анализа информации. Вместе с тем в настоящее время актуальны вопросы, связанные с хранением информационного ресурса.
Требуется комплексный анализ ИС по качественным и количественным характеристикам, ограничениям и целевым критериям с точки зрения оптимизации структуры ИР, что способствует увеличению эффективности функционирования ИС, снижению рисков в деятельности организации, снижению затрат на хранение ИР. Цель работы.
Обеспечение требуемого уровня функционирования информационных систем за счет оптимизации структуры хранения информационного ресурса и применения эффективных алгоритмов его обработки.
Основные задачи исследования.
Для достижения поставленной цели в диссертационной работе решаются следующие задачи:
Выбор и разработка методов исследования ИР, ИС и методов оценки входных параметров многоуровневой структуры ИР, используемой для определения оптимального состава ПАК его хранения.
Моделирование многоуровневой структуры ИР, используемой для определения оптимальных параметров ПАК хранения.
Разработка интеллектуального классификатора для классификации ИР по экономическим критериям, основанным на методах и алгоритмах нейронных сетей.
Анализ и совершенствование алгоритмов обучения нейронной сети, используемой для классификации ИР.
Практическая реализация и внедрение предложенных решений в виде методических и программно-аппаратных средств для хранения ИР организации.
Объектом исследования являются информационные системы.
Предметом исследования являются математические модели описания ИР, методы классификации ИР, алгоритмы математического программирования.
Научная новизна диссертационной работы заключаются в следующем:
разработана методика формирования структуры ИР, включающая методы и алгоритмы исследования ИР и оценки параметров его структуры;
разработана математическая модель структуры ИР и определены оптимальные параметры ПАК хранения ИР для принятых технико-экономических критериев эффективности;
разработан интеллектуальный классификатор для автоматической классификации ИР по экономическим критериям на основе алгоритмов нейронных сетей (НС), включающий выбор совокупности признаков классов ИР, методов их обработки, выбора оптимальной архитектуры НС и алгоритмов обучения.
На защиту выносится: методика формирования структуры ИР;
8 математическая модель структуры ИР; математическая модель классификатора ИР; результаты внедрения в формировании ИР организации.
Апробация работы.
Основные научные результаты, полученные в диссертационной работе, докладывались и обсуждались на всероссийской научно-практической конференции «Современные инновационные технологии и оборудование» (г. Тула, 2006г.), на региональных научно-практических конференциях «Социально-экономические проблемы развития региона» (г. Чайковский, 2001г., 2005г., 2006г.), на Всероссийской научно-технической конференции «Информационные системы и модели в научных исследованиях, промышленности и экологии» (г. Тула, 2007г.), на Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям (г. Новосибирск, 2007), на Всероссийских конференциях молодых ученых «Применение теории динамических систем в приоритетных направлениях науки и техники» (г. Ижевск, 2006г., 2007г.).
Основные результаты диссертационной работы отражены в 11 научных публикациях, из них 3 статьи в научных журналах, рекомендованных ВАК для публикации.
Структура и объем работы.
Диссертация состоит из введения, четырех глав, основных выводов и результатов работы, списка литературы, приложений. Объем диссертации составляет 142 страницы машинописного текста, включая 27 рисунков и 26 таблиц. Список литературы составляет 118 наименований.
В первой главе приведены основные характеристики ИС. Рассмотрены параметры требуемого уровня функционирования ИС различного назначения. Дан обзор существующих методов и алгоритмов, а также программно-аппаратных комплексов обработки, поиска и хранения ИР.
Во второй главе рассматривается методика формирования структуры ИР. Приведен алгоритм разработки структуры ИР, определение параметров
9 ИР. Формулируется задача оптимизации структуры ИР по техническим параметрам. Представлены алгоритмы и методы решения.
В третье главе рассмотрен процесс разработки интеллектуального классификатора, построенного на базе нейронной сети (НС). Описывается и обосновывается структура нейронной сети для классификации ИР, алгоритм ее обучения.
В четвертой главе с использованием полученных моделей, методик и алгоритмов описана оптимизация структуры информационного ресурса на примере образовательного учреждения; получена прогнозная оценка роста объема ИР и определены параметры оптимальной структуры ИР с учетом изменений объемов ИР; получена оценка эффективности предлагаемых решений оптимизации структуры ИР.
Достоверность и обоснованность.
Математические модели, алгоритмы и прикладные программы, используемые в работе, основаны на положениях теории графов, методах математического моделирования, методах оптимизации, алгоритмах нейронных сетей, теории кодирования и математической статистики, эволюционного и математического программирования.
Практическая ценность работы.
Работа выполнялась в рамках федеральной целевой программы «Исследование и разработка по приоритетным направлениям развития научно-технологического комплекса России на 2007-2012годы» по теме «Технология построения открытых виртуальных исследовательских пространств» шифр «2007-4-1.4-15-03-123» Государственный контракт №02.514.11.4043.
Результаты работы использованы в Чайковском технологическом институте путем внедрения методических рекомендаций и технических мероприятий по организации и обеспечению требуемого уровня функционирования информационных систем.
Характеристики информационных систем
Информационная система - это организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе с использованием средств вычислительной техники (ВТ) и связи, реализующих информационные процессы (ИП) сбора, обработки, хранения, поиска и распространения информации. В состав ИС входят средства обеспечения и их технологии — программные, технические, организационные средства (программы для ЭВМ, средства ВТ и связи, классификаторы), используемые или создаваемые при проектировании систем и обеспечивающие их эксплуатацию [7,8].
Принято различать функциональную и обеспечивающую часть ИС. Обеспечивающая часть ИС состоит из организационного, методического, технического, математического, программного, информационного, эргономического видов обеспечения. Создание ИС отождествляется не только с автоматизацией отдельных функций (задачи обработки данных и принятия решений) на базе ЭВМ, но и с критическим анализом и выбором структуры системы.
В работах [9,10,11] Мамиконова А.Г. рассматриваются методы и алгоритмы проектирования структур ИС. При проектировании ИС используются следующие виды структуры системы: организационная, функциональная, информационная, структура комплекса технических средств и др. Разработка моделей и методов синтеза структуры ИС предполагает создание формализованных человеко-машинных процедур выбора оптимальных вариантов построения систем и включает в себя выбор задач автоматизации, определение состава узлов системы, определение параметров технических средств, обеспечивающих решение возложенных на них задач. В работе [10] приведен общий случай проектирования структуры
ИС, а также частные случаи проектирования организационной структуры, синтез структуры ИС с учетом затрат на обмен информации. Приведены математические модели оптимизации структуры, в которой задача выбора оптимальной структуры рассматривается как задача нелинейного математического программирования. Модель позволяет учитывать такие характеристики эффективности вариантов структуры системы, как стоимость, оперативность, надежность. В работе [17] приведен вариант структурирования ИС с точки зрения обмена информацией.
Организация, внедряющая в свою деятельность ИС, преследует определенные цели. В связи с этим, к информационным системам предъявляются требования. Соблюдение требований при проектировании и внедрении ИС, а также при ее эксплуатации обеспечивает достижение целей, поставленных перед ИС. Возрастание роли ИС в деятельности организаций с одной стороны, увеличение объемов ИР, усложнение процессов, с другой стороны, ведут к увеличению затрат на внедрение и сопровождение ИС. Поэтому перед специалистами ИТ стоит проблема разработки и внедрения ИС заданного качества и снижения стоимости эксплуатации ИС.
По своему назначению различают следующие ИС: системы оперативного учета (OLTP), системы аналитического учета (OLAP), системы реального времени (СРВ) и др. Для каждого из этих типов характерен определенный набор функций с информацией: чтение, изменение, обработка, передача [16,18,19].
На сегодняшний день ведутся работы по созданию единых информационных пространств, обеспечивающих тесное взаимодействие территориально распределенных подразделений посредством глобальных вычислительных сетей, что предполагает использование методов технологии открытых систем (ТОС), GRID-систем [20-25].
В связи с этим к информационным системам предъявляются требования интероперабельности, масштабируемости, переносимостии многоплатформенности, производительности, интеграции с другими ИС.
Многообразие стандартов, проектов в этой сфере говорит о том, что деятельность, связанная с развитием технологий открытых систем и применением ее к сферам государственного либо отраслевого уровня, является актуальной и перспективной [23,24,27-30].
Открытые информационные системы (ОИС) характеризуются следующими свойствами [21]:
- обладание огромными ресурсами, которые несравнимы с ресурсами обычных компьютеров (число доступных процессоров, объем памяти, число активных приложений, пользователей и т. п.);
- распределенность - компоненты системы могут быть удалены друг от друга на сотни и тысячи километров, что неизбежно вызовет большую латентность и, следовательно, скажется на оперативности их взаимодействия;
- масштабируемость - обеспечивает добавление новых структурных элементов или изменение текущих без изменения остальных функциональных частей. Задача системы поддержки работы системы состоит в поиске подходящих ресурсов, проверке их работоспособности, в распределении поступающих задач вне зависимости от текущей конфигурации в целом;
- неоднородность - в состав систем входят различные операционные системы. Разные системы поддерживают различные системы команд и форматы представления данных. Различные системы в разное время могут иметь различную загрузку, связь с вычислительными системами идет по каналам с различной пропускной способностью;
- объединение ресурсов различных организаций - политика доступа и использования конкретных ресурсов может сильно меняться в зависимости от их принадлежности к той или иной организации;
- архитектура определяет системные компоненты, цели и функции этих компонентов и отражает способы взаимодействия компонентов друг с другом.
Существующие программно-аппаратные комплексы управления информационным ресурсом
Для многих система хранения данных (СХД) ассоциируется с устройствами хранения и в первую очередь с дисковыми массивами. Действительно, дисковые массивы сейчас — основные устройства хранения данных, однако не стоит забывать, что обработка информации, формирование логической структуры ее хранения (дисковых томов и файловых систем) выполняется на сервере. В процедуры доступа к данным (помимо процессоров и памяти сервера) вовлечены установленные в нем адаптеры, работающие по определенному протоколу, драйверы, обеспечивающие взаимодействие этих адаптеров с операционной системой, менеджер дисковых томов, файловая система и менеджер памяти ОС и т.д. [32].
Как правило, СХД содержит следующие подсистемы и компоненты: непосредственно устройства хранения (дисковые массивы, ленточные библиотеки), инфраструктуру доступа к устройствам хранения, подсистему резервного копирования и архивирования данных, ПО управления хранением, систему управления и мониторинга.
Традиционный подход к хранилищам данных состоит в непосредственном подключении серверов к системе хранения DAS (Direct Attached Storage). Помимо DAS, существуют устройства хранения данных, подключаемые к сети, — NAS (Network Attached Storage), а также компоненты сетей хранения данных — SAN (Storage Area Networks). И NAS-, и SAN-системы появились в качестве альтернативы архитектуре DAS. Причем каждое решение разрабатывалось как ответ на растущие требования к системам хранения данных и основывалось на использовании доступных в то время технологиях [32-35].
Для того чтобы лучше понять особенности автономных накопителей, остановимся немного на одной из более простых технологий построения систем хранения данных — шинно-ориентированной технологии [32]. Она предусматривает использование корпуса для дисковых накопителей и контроллера PCI RAID.
Между дисками и РО-шиной хоста (от англ. Host — в данном случае автономный компьютер, например, сервер или рабочая станция) есть только один контроллер, который в значительной мере и задает быстродействие системы. Накопители, построенные по этому принципу, являются наиболее производительными. Но в связи с архитектурными особенностями практическое их использование, за исключением редких случаев, ограничивается конфигурациями с одним хостом.
К недостаткам шинно-ориентированной архитектуры накопителей следует отнести: эффективное использование только в конфигурациях с одним хостом; зависимость от операционной системы и платформы; ограниченную масштабируемость; ограниченные возможности по организации отказоустойчивых систем. Для вычислительного центра или даже для двух серверов, которым нужны одни и те же данные, шинно-ориентированная архитектура не подходит. Недостатки этой архитектуры позволяет избежать архитектура автономных дисковых подсистем. Основной принцип ее построения достаточно прост. Контроллер, который управляет системой, переїюсится из хост-компьютера в корпус накопителя, обеспечивая независимое от хост-систем функционирование. Следует отметить, что такая система может иметь большое количество внешних каналов ввода/вывода, что обеспечивает возможность подключения к системе нескольких или даже многих компьютеров.
Любая интеллектуальная система хранения данных состоит из аппаратной части и программного кода. В автономной системе всегда есть память, в которой хранится программа алгоритмов работы самой системы и процессорные элементы, которые этот код обрабатывают. Такая система функционирует независимо от того, с какими хост-системами она связана.
Благодаря своей интеллектуальности автономные накопители зачастую самостоятельно реализуют множество функций по обеспечению сохранности и управлению данными. Различают три основных варианта организации доступа к накопителям (рисунок 4): SAS (Server Attached Storage) — накопитель, подсоединенный к серверу [второе название DAS (Direct Attached Storage) — напрямую подсоединённый накопитель]; NAS (Network Attached Storage) — накопитель, подсоединенный к сети; S AN (Storage Area Network) — сеть хранения данных. SAS/DAS — это достаточно простой традиционный способ подключения, который подразумевает прямое (отсюда и DAS) подсоединение системы хранения к одной или нескольким хост-системам через высокоскоростной канальный интерфейс. Часто в таких системах для подсоединения накопителя к хосту используется такой же интерфейс, который используется для доступа к внутренним дискам хост-системы, что в общем случае обеспечивает высокое быстродействие и простое подключение. NAS — накопитель, который подсоединен к сети и обеспечивает файловый (обратите внимание — файловый, а не блочный) доступ к данным для хост-систем в сети LAN/WAN. Клиенты, которые работают с NAS, для доступа к данным обычно используют протоколы NSF (Network File System) или CIFS (Common Internet File System). NAS интерпретирует команды файловых протоколов и исполняет запрос к дисковым накопителям в соответствии с используемым в нём канальным протоколом. Фактически, архитектура NAS — это эволюция файловых серверов. Главным преимуществом такого решения является быстрота развёртывания и качество организации доступа к файлам, благодаря специализации и узкой направленности.
Этапы определения входных параметров структуры
Требуемый уровень функционирования ИС связан с обеспечением характеристик, значения которых задаются в соответствии со спецификой деятельности организации и особенностями используемых ИС в данной деятельности (таблица 2). Таблица 2. Характеристики требуемого уровня функционирования ИС
Обозначеие увеличение объемов обрабатываемой информации, (% прироста в ед. времени) увеличение числа пользователей (% прироста) среднее время ожидания пользователя (время реакции, мс) Укр критическая масса информации, которая может быть потеряна при сбоях системы без нарушения деятельности (% от общего объема за ед. времени)
Обеспечение требуемых параметров функционирования ИС зависит от технических характеристик программно-аппаратного комплекса, используемого для хранения ИР.
Размещение информации должно осуществляться, с одной стороны, на тех носителях, характеристики которых удовлетворяют заданным параметрам ИР. С другой стороны, необходимо снижение затрат на его хранение. Добиться оптимального распределения ресурсов хранения при снижении затрат можно, формируя ИР в виде многоуровневой блочной структуры.
С этой целью необходимо классифицировать информацию, формируемую в ходе деятельности организации, по степени ее значимости и применять инструменты управления размещением данных на устройствах хранения в соответствии с этой классификацией.
Информация в период своего существования проходит следующие стадии: создание, обработка, хранение, архивирование, удаление.
Как было сказано в первой главе, требуемый уровень функционирования ИС способствует эффективной деятельности организации. Отсутствие доступа к ИР влечет определенные финансовые потери. В этом случае снижается эффективность функционирования ИС, соответственно эффективность деятельности организации. Доступ к данным невозможен как в случае выхода из строя каналов (доступа) или вычислительных средств, так и в случае отсутствия необходимой производительности для выполнения прикладных задач.
Как показал анализ, проведенный ведущими кампаниями IDC и Gartner Group [1,3], информация за период своего существования меняет актуальность и востребованность. В связи с этим, в текущий момент времени состав ИР, необходимый для осуществления деятельности, постоянно изменяется.
Таким образом, допустимые финансовые издержки позволяют классифицировать информацию на следующие классы: критическая, важная, неважная, бесполезная (таблица 3). Информация обладает следующими свойствами [8]: полнота - характеризует качество информации и определяет достаточность данных для выполнения процессов; достоверность — наличие шумов и помех в информации ведет к ее искажению, т.е. недостоверная; ценность - ценность информации не может быть абстрактной. Информация может быть полезной для определенной группы пользователей с целью выполнения определенных функций; адекватность — характеризует степень соответствия информации реальному объективному состоянию; актуальность - характеризует степень соответствия информации настоящему моменту времени. Со временем информация устаревает, т.е. теряет актуальность; доступность - это мера возможности получения определенной информации.
Оценка информации по степени важности для деятельности организации осуществляется на основании оценки таких свойств, как актуальность и ценность.
Актуальность отражает степень устаревания информации. Для оценки степени вводится период актуальности, который для каждого процесса индивидуален. Например, для систем оперативного учета транзакция, созданная сегодня, актуальна в течение суток, недели или месяца. Для систем аналитического учета, которые работают с ретроспективными данными, актуальна информация, созданная несколько месяцев, недель назад.
Свойство полезности определяется степенью необходимости ИР определенному кругу пользователей для выполнения определенных процессов.
Определение параметров программно-аппаратного комплекса, используемого для хранения, связано с расчетом параметров структуры ИР.
Значения параметров структуры зависят от факторов, связанных с деятельностью организаций и используемых в этой деятельности информационных систем.
С этой целью необходимо провести всестороннее, систематизированное исследование информационных процессов (ИП), возникающих в ходе деятельности организации, т.е. построенных на основе набора правил, алгоритмов и методов изучения объекта в целом, вместе со всей совокупностью его внешних и внутренних связей [69].
В ходе анализа ИП необходимо собрать и изучить влияние параметров ИС, параметров ИР на эффективность функционирования ИС и деятельности организации в целом. Исследование организации проводится по следующим направлениям: исследование целей и задач отдельных подразделений и организации в целом; исследование общей организационной структуры предприятия и описание его связей с внешними организациями; изучение ответственности, функций и обязанностей каждого подразделения; изучение документооборота каждого подразделения; изучение связей с другими подразделениями предприятия; выявление функциональных взаимодействий между подразделениями информационных потоков внутри подразделений и между ними, внешних по отношению к организации объектов и внешних информационных взаимодействий;
Реализация нейросетевой модели и исследование ее технических характеристик
Оценка качества работы нейронной сети определяется величиной функции вычисления ошибки Е, как среднеквадратичное отклонение текущих выходов от требуемых для каждой обучающей пары [96]: где у - текущее значение результата вычисления нейрона к для 5-ой обучающей пары; d - требуемое значение результата вычисления нейрона к для обучающей 5-ой пары. В случае вычисления ошибки для всего множества обучающих пар величина Е вычисляется по формуле: Е = Е,М- тіп, (41) где TV- мощность обучающей выборки.
Формально процесс обучения представляет собой задачу многомерной оптимизации, которая состоит в поиске оптимальных значений весовых коэффициентов w, которые давали бы минимальное значение целевой функции Е для всей обучающей выборки:
Нахождение оптимального значения зависит от метода инициализации начальных значений параметров w и используемого метода обучения, реализующего некоторый алгоритм оптимизации.
От того, насколько удачно будут выбраны начальные значения весовых коэффициентов, зависит, как долго сеть за счет обучения и подстройки будет искать их оптимальные величины и найдет ли она их.
В рассматриваемой задаче всем весам на начальном этапе присваиваются случайные величины, равномерно распределенные в диапазоне [-1,1].
Приступая к обучению выбранной нейросетевой модели, необходимо было решить, какой из известных типов алгоритмов: метод обратного распространения ошибки, метод сопряженных градиентов и генетический алгоритм - решает задачу классификации качественно.
Подбор весовых коэффициентов может занять огромное количество времени, поэтому предлагается использовать для этой цели генетический алгоритм. По скорости определения оптимума целевой функции ГА на несколько порядков превосходит случайный поиск. ГА прекрасно зарекомендовал себя в задачах нахождения глобальных экстремумов функций, точные формулы которых неизвестны, слишком сложны или не поддаются аналитическому описанию [105-107].
ГА представляют собой скорее некоторую стратегию/подход, чем единый алгоритм. Для успешного решения (по сложности и качеству) конкретного класса задач они требуют "содержательного" наполнения. В работах [105-107] представлены варианты применения ГА для решения определенных задач оптимизации в экономике и производстве. Для работы ГА необходимо подобрать следующие параметры: способ кодирования, вероятности применения генетических операторов, способы выполнения генетических операторов - мутации, кроссовера и инверсии, выбор функции приспособленности. Значения перечисленных параметров влияет на качество работы ГА и, как следствие, качество функционирования НС.
ГА является известным представителем эволюционных алгоритмов и хорошо зарекомендовал себя при нахождении глобального экстремума в многокритериальной функции. Он заключается в параллельной обработке множества альтернативных решений. Работа алгоритма начинается с формирования области допустимых значений переменных и выбора в ней некоторых пробных точек. Далее итерационно выполняются операции отображения точек на пространство критериев, формируя рельеф поверхности критериев. Затем на основании полученной информации и в соответствии с выбранной стратегией поиска осуществляются операции с координатами точек, формируя новое пространство точек. Условием завершения алгоритма является достижение заданного значения целевой функции J{X) или определенного количества итераций, во время которых значение целевой функцииДХ) не улучшалось [108].
Используемый для решения задачи обучения НС генетический алгоритм схематично можно представить следующим образом: 1. Сгенерировать случайным образом начальную популяцию. 2. Вычислить целевую функцию для каждой строки популяции. 3. Выполнить операцию селекции. 4. Выполнить операцию кроссовера. 5. Выполнить операцию мутации. 6. Если критерий останова не достигнут, перейти к п.2, иначе завершить работу.
Рассмотрим основные решения, используемые в разработанных ГА для решения задачи обучения НС.
В нашем случае стоит задача обучить НС со следующими параметрами: размерность входного слояр= 5 нейронов; число скрытых слоев - 1; число нейронов на скрытом слое Н=8; число нейронов на выходном слое = 3; число связей = 68.
В ГА каждый из вариантов решения задачи называется особью. Каждая особь характеризуется своим генотипом (обычно набор 1 и 0) и фенотипом (расшифровка генотипа).