Содержание к диссертации
Введение
1. Аналитический обзор распределенных информационных систем 16
1.1 Понятие распределенной информационной системы 16
1.2 Анализ математических моделей проектирования и оптимизации структуры распределенных информационных систем 18
1.3 Математический аппарат нечетких множеств и нечеткой логики при анализе и синтезе ситем 24
1.4 Постановка задачи исследования 33
Выводы 40
2 Построение математической модели оптимизации структуры распределенной информационной системы 42
2.1 Построение математической модели оптимизации структуры распределенной информационной системы в терминах теории четких множеств 42
2.2 Построение математической модели оптимизации структуры распределенной информационной системы в терминах теории нечетких множеств 46
2.3 Разработка метода вычисления значений функций принадлежности и построения нечетких отношений 52
Выводы 58
3 Разработка метода решения задачи нечеткого синтеза структуры распределенной информационной системы с использованием генетического алгоритма и нечеткой логики 60
3.1 Применение нисходящих нечетких логических выводов для синтеза структуры распределенной информационной системы 60
3.2 Применение генетического алгоритма для решения задачи нечеткого синтеза структуры распределенной информационной системы 66
3.3 Выбор оптимальных характеристик генетического алгоритма и генетических операторов 3.3.1 Характеристики генетического алгоритма 69
3.3.2 Оператор отбора 71
3.3.3 Оператор кроссинговера 72
3.3.4 Оператор мутации 74
3.3.5 Критерий останова 75
3.4. Реализация генетического алгоритма
Выводы 80
4 Разработка программного комплекса решения задачи нечеткого синтеза структуры распределенной информационной системы 82
4.1 Структура классов программного комплекса, реализующего генетический алгоритм синтеза структуры распределенной информационной системы 82
4.2 Алгоритм работы программного комплекса 90
4.3 Порядок работы с программным комплексом на примере оптимизации структуры распределенной информационной системы НОУ ВПО «Северо-Кавказский гуманитарно-технический институт» г. Ставрополя 91
Выводы 98
Заключение 100
Литература 103
- Анализ математических моделей проектирования и оптимизации структуры распределенных информационных систем
- Математический аппарат нечетких множеств и нечеткой логики при анализе и синтезе ситем
- Построение математической модели оптимизации структуры распределенной информационной системы в терминах теории нечетких множеств
- Выбор оптимальных характеристик генетического алгоритма и генетических операторов
Введение к работе
Актуальность работы. Развитие информационных технологий оказывает огромное влияние на все области человеческой деятельности, связанные с накоплением и обработкой информации. Разработка распределенных информационных систем является одной из важных проблем в информационных технологиях.
Многие малые н средние задачи автоматизации решены адекватными средствами на достаточно высоком технологическом урош-е. Ко вот задачи создания распределенных информационных систем нуждаются в дополнительном осмыслении и анализе, т.е. должна решаться комплексная проблема, заключающаяся в следующем:
-
Распределенная информационная система - это симбиоз математического, программного, информационного, аппаратного обеспечения, и эффективное проектирование системы должно затрагивать все подсистемы. Оптимизация только одной подсистемы может сделать функционирование остальных крайне неэффективным.
-
Система непрерывно развивается, при этом изменения ее состояния должны отражаться во времени. Па новых этапах развития может потребоваться повторное перепроектирование, которое может затронуть произвольное количество подсистем.
-
Система должна предусматривать существование разнородных данных и уметь их эффективно накапливать и обрабатывать.
-
Проектирование осуществляется в условиях неопределенности, под которой понимаются недостаток информации о предмете проектирования, наличие противоречивой информации и плохоформализованной информации, которая, как правило, представлена в лингвистической форме.
Известны методы объектного проектирования распределенных информационных систем и модели процессов массового обслуживания запросов на получение информации в системе.
Указанные методы недостаточно приспособлены для оптимизации структуры распределенных информационных систем (ИС).
Данный вывод обусловлен следующими причинами:
оцениваются некоторые, но не все параметры локальных ИС, что не дает полной оценки состояния системы;
анализ сложных распределенных ИС приходится гроводить в условиях нечеткой и/или неполной исходной информации, что предъявляет специфические требования к построению математической модели и условиям ее интерпретации;
система непрерывно развивается, при этом должны отражаться изменения ее состояния во времени, а пе оцениваться ее работа в определенный момент времени.
Таким образом, задача построения и внедрения математической модели оптимизации структуры распределенной информационно? системы, позволяющей получить экономический эффект, считается актуальной.
Цель » задачи работы. Целью диссертационной работы является получение-экономического эффекта за счет разработки и внедрения математической модели оптимизации структуры распределенной информационной системы.
Для решения общей научной задачи исследований была проведена ее декомпозиция на ряд следующих частных задач:
-
Проведение критического анализа известных математических моделей и методов анализа и синтеза распределенных информационных систем, в том числе методов мягких вычислений: алгоритмов нечеткого логического вывода, генетических алгоритмов и т.п.
-
Построение математических моделей оптимизации структуры распределенной информационной системы в терминах теории четких и нечетких множеств. Проведение их сравнения с указанием достоинств и недостатков.
-
Разрабо"ка метода вычисления значений функций принадлежности и построения нечетких отношений на основе обобщения и модификации метода попарных сравнений и прямого группового метода. В результате его применения становится возможным вычисление нормированных значений функций принадлежности при учете мнения всех заинтересованных в реализации проекта экспертов.
-
Исследование функции эффективности функционирования распределенной ИС в зг.висимости от ее основных параметров На основе проведенных исследований построение системы уравнений задачи нечеткого синтеза структуры систгмы.
-
Разработка метода решения задачи нечеткого синтеза структуры распределенной информационной системы с использованием нечеткой логики и генетического алгоритма.
-
Разработка программного комплекса, реализующего генетический алгоритм с гибкой системой настроек и допускающего его использование в задачах оптимизации для произвольных предметных областей.
Объект исследования - распределенные информационные системы.
Предмет исследования - математические модели оптимизации структуры распределенное информационной системы.
Методы исследования. При решении поставленных в диссертационной работе задач использовались методы системного анализа, исследования операций, теории вероятности и математической статистики, теории множеств, теории нечетких множеств, нечеткой логики, генетические алгоритмы, методы программирзвания и объектно-ориентированного моделирования.
Основные положения, выносимые на защиту. В работе получены и выносятся на защиту следующие основные положения:
-
Математическая модель оптимизации структуры распределенной информационной системы, позволяющая получить экономический эффект.
-
Метод вычисления значений функций принадлежности и построения нечетких отношений на основе обобщения и модификации метода попарных сравнений и прямого группового метода.
-
Метод решения задачи нечеткого синтеза структури' распределенной информационной системы с использованием нечеткой логики и генетического алгоритма.
-
Программный комплекс, реализующий генетический алгоритм в задаче нечеткого синтеза структуры распределенной ИС.
Научная новизна полученных результатов:
-
Построена и внедрена математическая модель оптимизации структуры распределенной информационной системы, отличающаяся от известных методов и моделей, в том числе основанных на теории СМО, тем, что более эффективна для решения плохоформализуемых задач, при этом обеспечивает заданное качество решения при меньших требованиях к вычислительным ресурсам ПЭВМ. Указанная математическая модель позволяет описать весь комплекс характеристик системы, пыбрать список параметров, влияние которых важно при анализе работы системы.
-
Разработан метод вычисления значений функций принадлежности и построения нечетких отношений на основе обобщения и модификации метода попарных сравнений и прямого группового метода. Предложенный модифицированный метод отличается тем, что при экспоненциальной сложности задачи он оценивается полиномиальной функцией сложности. Вычисление нормированных значений функций принадлежности производится при учете мнения всех заинтересованных в реализации проекта экспертов, при этом система голосования застрахована от ситуации, когда группа экспертов по каким-либо причинам не дает объективную оценку реализациям объекта
-
Разработан метод решения задачи нечеткого синтеза структуры распределенной информационной системы с использованием нечеткой логики и генетического алгоритма, отличающийся возможностью получения квазиоп-тимального решения для сложных задач, для решения которых специальных методов не существует. Известные решения, применимые только для частных задач, обычно сводятся к построению многокаскадных схем пошагового вывода, и их применение к задачам рассматриваемого типа затруднено.
-
Разработан программный комплекс, реализующий ггнетический алгоритм в задаче нечеткого синтеза структуры распределенной ИС, по итогам работы которого достигнут экономический эффект при оптимизации структуры распределенной информационной системы НОУ ВПО «Северо-Кавказский гуманитарно-технический институт» за счет снижения суммарной стоимости проекта на 7%.
Практическая ценность работы заключается в разработке программного комплекса решения задачи нечеткого синтеза структуры распределенной информационной системы с использованием языка С# корпорации Microsoft.
Разработанный программный комплекс использовался для анализа и оптимизации структуры распределенной информационной системы, функционирующей в рамках корпоративной вычислительной сети НОУ ВПО «Северо-Кавказский гуманитарно-технический институт» г. Ставрополя.
В процессе анализа были найдены недостатки в структуре распределенной информационной системы и выработаны конкретные рекомендации по их
устранению. При указанных изменениях структуры распределенной информационной системы был достигнут экономический эффект за счет снижения числа ПЭВМ v коммуникационного оборудования, протяженности линий коммуникаций, объема оплаты работы по монтажу оборудования и локальной вычислительной сети.
Итого общая стоимость проекта корпоративной распределенной информационной системы может быть снижена та 7%. При этом расчетные значения остальных характеристик функционирования системы остаются в рамках заданных экспертами значений.
Достоверность и обоснованность полученных в диссертационной работе результатов и формулируемых на их основе выводов подтверждаются корректным использованием теоретических и практических методов их обоснования. Основные выводы и положения диссертационной работы подтверждены использованием при их получении известных, проверенных практикой моделирования на ЭВМ теоретических методов исследования, а также применением разработанных методов при решении конкретных задач предприятия, что подтверждается актами внедрения результатов работы. Экспериментальные исследования и тестирование разработанных алгоритмов и программного комплекса показали непротиворечивость полученных результатов.
Реализации и внедрение результатов работы. Полученные в диссертационной работе: научные и практические результаты внедрены в НОУ ВПО «Северо-Кавказский гуманитарно-технический институт» г. Ставрополя.
Апробация результатов работы. Основные этапы работы докладывались и обсуждались на ежегодных научно-практических конференциях НОУ ВПО «Северо-Кавказский гуманитарно-технический институт» (Ставрополь, 2006г.), международной научно-практической конференции «Стратегические вопросы мировой науки-2007» (г. Днепропетровск, 2007г.), IX Всероссийском симпозиуме по прикладной и промышленной математике (Кисловодск, 2008г).
Публикации. Основные результаты диссертации опубликованы в шести научных работах, в том числе 2 статьи опубликованы в ведущих научных изданиях, рекомендованных ВАК РФ для публикации основных результатов диссертаций, получено свидетельство об официальной регистрации программы для ЭВМ № 2008610355 от 18 января 2008 года.
Структура и объем диссертации. Материал основной части диссертационной работы изложен на 111 страницах машинописного текста. Диссертация состоит из введения, четырех разделов, заключения, списка литературы из 112 наименований, 16 рисунков, 22 таблиц и четырех приложений. Всего 144 страницы.
Анализ математических моделей проектирования и оптимизации структуры распределенных информационных систем
Современная деятельность человека во многом связана с накоплением, хранением и компьютерной-обработкой информации [32]. На сегодняшний день подавляющее большинство персональных компьютеров в мире работают в сетях [23, 24, 107]. Локальные вычислительные сети (ЛВС) персональных компьютеров получили очень широкое распространение, так как 80 - 90% информации циркулирует вблизи мест ее появления и только 10 — 20% связано с внешними взаимодействиями. Локальные сети связывают компьютеры, размещенные на небольшом расстоянии друг от друга. Главная отличительная особенность локальных сетей — единый высокоскоростной канал передачи данных и малая вероятность возникновения ошибок в коммуникационном оборудовании. В качестве канала передачи данных используются витая пара, коаксиальный или оптоволоконнышкабель и др. Расстояния между ЭВМ в локальной сети небольшие - до-10 км при использовании радиоканалов связи до 20 км. Каналы в локальных сетях являются собственг ностыо организации, и это упрощает их эксплуатацию. Основное назначение любой компьютерной сети — предоставление информационных и вычислительных ресурсов подключенным к ней пользователям. С этой точки зрения локальную вычислительную сеть можно рассматривать как совокупность серверов и рабочих станций. Сервер- компьютер, подключенный к сети и обеспечивающий ее пользователей определенными услугами. Серверы могут осуществлять хранение данных, управление базами данных, удаленную обработку заданий, печать заданий и ряд других функций, потребность в которых может возникнуть у пользователей сети. Особое внимание следует уделить одному из типов серверов - файловому серверу (File Server). В распространенной терминологии для него принято сокращенное название - файл-сервер. Компьютеры, входящие в состав ЛВС, могут быть расположены самым случайным образом на территории, где создается вычислительная сеть. Для управления сетью небезразлично, как расположены абонентские ЭВМ. Поэтому имеет смысл говорить о топологии ЛВС. Топология сети - это физическое расположение компьютеров, кабелей и других компонентов сети. Топологии вычислительных сетей могут быть самыми различными, но для ЛВС типичными являются всего три: кольцевая, шинная, звездообразная.
Любую компьютерную сеть можно рассматривать как совокупность узлов. Узел - любое устройство, непосредственно подключенное к передающей среде сети.
Кольцевая топология предусматривает соединение узлов сети замкнутой кривой - кабелем передающей среды. Выход одного узла сети соединяется с входом другого. Информация по кольцу передается от узла к узлу. Последовательная дисциплина обслуживания узлов такой сети снижает ее быстродействие. Каждый компьютер выступает в роли репитера (повторителя), усиливая сигналы и передавая их следующему компьютеру[23].
Шинная топология - одна из наиболее простых и наиболее распространенных. Она связана с использованием в качестве передающей среды общей шины. Данные от передающего узла сети распространяются по шине в обе стороны. Промежуточные узлы не транслируют поступающих сообщений. «Шина» - пассивная топология. Это значит, что компьютеры только «слушают» передаваемые по сети данные, но не перемещают их от отправителя к получателю. Так как данные в сеть передаются лишь одним компьютером, ее производительность зависит от количества компьютеров, подключенных к шине[24].
Звездообразная топология базируется на концепции центрального узла, к которому подключаются периферийные узлы. Каждый компьютер имеет свою отдельную линию связи с центральным узлом. Вся информация передается через центральный узел, который ретранслирует, переключает и маршрутизирует информационные потоки в сети. Звездообразная топология значительно упрощает взаимодействие узлов сети друг с другом, позволяет использовать более простые сетевые адаптеры. В то же время работоспособность ЛВС со звездообразной топологией целиком зависит от центрального узла (концентратора). Основной целью создания локальных компьютерных сетей является совместное использование ресурсов и осуществление интерактивной связи.как внутри одной фирмы, так и за ее пределами. Ресурсы - это данные и приложения (программы), хранящиеся на дисках сети, и периферийные устройства. Понятие интерактивной связи компьютеров подразумевает обмен сообщениями в реальном режиме времени.
Быстрое развитие информационных технологий, в том числе аппаратных средств, средств телекоммуникаций, инструментов быстрой разработки приложений и развитых графических интерфейсов, послужило мощным технологическим фактором, обуславливающим нарастание темпов, модернизации и развитие всех отраслей бизнеса. При современном развитии сетевых коммуникационных технологий и соотношении производительности/стоимости сетевых аппаратных средств особую актуальность приобретает методология организации на их базе высокоэффективных распределенных вычислительных систем.
Анализ математических моделей проектирования и оптимизации структуры распределенных информационных систем
Качество современных информационных систем обеспечивается при помощи моделей, позволяющих оценивать и оптимизировать процессы сбора, хранения и обработки информации. Как правило, сегодня для каждой ИС разрабатываются свои модели, учитывающие целевое назначение и специфику функционирования системы. Существует множество аналитических моделей, позволяющих оценивать отдельные характеристики функционирования систем. В общем виде под целью ИС следует понимать удовлетворение потребностей пользователей в обеспечении надежного и своевременного представления полной, достоверной и конфиденциальной информации [64]. Степень выполнения этих потребностей характеризует качество функционирования ИС с точки зрения конкретного пользователя информации. При построении распределенных систем возникает множество задач, не решенных на данный момент даже принципиально. Практически все имеющиеся в настоящее время решения основаны на приспосабливании сосредоточенной системы к распределенной структуре, что, естественно, не решает большинства проблем. Кроме того, известна большая сложность, а следовательно, и трудоемкость практической разработки таких систем. Основные требования к распределенной системе [48]: возможность оптимальной загрузки имеющихся вычислительных мощностей; - балансировка нагрузки в течение работы системы; обеспечение плавного масштабирования, а следовательно, повторного использования частей системы, построенных по некоторым открытым стандартам; обеспечение связи с имеющимися системами и средствами разработки; наличие четкой методологии проектирования. Как показала практика, попытки организовать распределенные системы при недостаточной информации о предметной области, представленной в этой системе, как правило, неуспешны. Известны методы объектного проектирования распределенных систем [48]. Методология основана на расширении методов объектно-ориентированного проектирования и заключается в следующем. Предметная область представляет множество объектов, обменивающихся сообщениями. Объекты объединены в классы, определяющие общие свойства объектов. Классы объединены в иерархии. Отношения в иерархиях классов - тип-подтип, т.е. каждый подкласс является конкретизацией, уточнением класса. Объекты самодостаточны, т.е. они представляют собой законченную модель сущности реального мира. С точки зрения распределенной системы, объект в идеале должен быть мобильным и открытым (понятным окружающим его объектам). Мобильность на практике труднодостижима для уже существующих информационных ресурсов, но может быть предусмотрена методологией. Открытость обеспечивается интерфейсами, представляющими множество методов, выполняемых некоторым объектом.
Математический аппарат нечетких множеств и нечеткой логики при анализе и синтезе ситем
Декартово произведение UxOxP образует полное множество решений функциональной задачи заданным множеством потребителей. Многозначное соответствие фсЦхОхР определяет конкретную реализацию способа решения поставленной функциональной задачи при заданных требованиях к сети: ( р,о 2о...о г)л/?.
В дальнейшем проведена декомпозиция основной задачи диссертационного исследования, на ряд следующих частных задач:
1. Построение математической модели оптимизации структуры распределенной информационной системы в терминах теории четких множеств. Выбор и обоснование критерия эффективности математической модели. Модернизация математической модели для формулирования в терминах теории нечетких множеств с целью дальнейшего ее улучшения. Определение целевой функции и набора ограничений.
2. Разработка метода вычисления значений функций принадлежности и построения нечетких отношений на основе обобщения и модификации метода попарных сравнений и прямого группового метода. 3. Разработка метода решения задачи нечеткого синтеза структуры распределенной информационной системы с помощью нечеткой логики и генетического алгоритма: Исследование эффективности функционирования распределенной информационной системы от основных парамеїров. Формирование ограничений на характеристики компонентов распределенной информационной системы по результатам нисходящих нечетких логических выводов. Построение системы уравнений по отношению к неизвестным входным переменным при заданных переменных вывода. Применение генетического алгоритма для решения задачи нечеткого синтеза структуры распределенной информационной системы.
4. Разработка программного комплекса, реализующего генетический алгоритм в задаче нечеткого синтеза структуры распределенной ИС. Анализ результатов его применения при оптимизации структуры распределенной информационной системы НОУ ВПО «Северо-Кавказский гуманитарно-технический институт» г. Ставрополя. Оценка экономического эффекта, достигаемого при- изменениях структуры распределенной информационной системы.
1. Под распределенной информационной системой понимают программно-аппаратный комплекс, реализующий некоторый комплекс функциональных задач в различных бизнес-системах. По соображениям производительности и стоимости проекта, в качестве платформы, как правило, выбирают корпоративные локальные вычислительные сети, объединяющие вычислительные ресурсы большого числа отдельных ПЭВМ. Для таких крупных распределенных систем задача оптимизации их структуры представляется актуальной.
2. Известны подходы к построению математических моделей оптимизации структур распределенных ИС. ИС можно описывать с точки зрения объектно-ориентированной идеологии, например [48]. Другим направлением моделирования является использование методов математической статистики и систем массового обслуживания, например [64]. 3. Анализ математических моделей, основанных на теории СМО, показал недостаточную приспособленность их для оптимизации структуры распределенной информационной системы. Исследованные математические модели обладают целым комплексом недостатков, основные из которых: описание отдельных характеристик, а не комплекса характеристик ИС; отдельные математические модели не дают представления о работе ИС в целом; модели позволяют описать только «статическое» состояние системы без учета ее динамических характеристик [28]. На корректность математических моделей накладывается множество ограничений. Как правило, основным условием математической корректности моделей является существование и независимость функций распределения, описывающих характеристики функционирования ИС.
4. Для преодоления указанных недостатков предлагается комплексный подход к построению математической модели оптимизации структур распределенных ИС на основе нечетких множеств и нечеткой логики. Применение данного математического аппарата обусловлено двумя причинами: во-первых, необходимостью решения задачи в условиях неопределенности и наличия неполной и противоречивой информации о реализуемых ИС функциональных задачах, во-вторых, математически строго доказана универсальность нечеткого аппроксима-тора в задачах анализа и синтеза систем. Применение теории нечетких множеств и нечеткой логики для построения математической модели оптимизации структуры распределенной информационной системы дает нам возможность описать весь комплекс характеристик системы, выбрать список параметров, влияние которых важно при анализе работы системы. Гибкость в описании основных характеристик позволяет эффективно сравнивать различные реализации распределенных информационных систем при условии привлечения к построению математической модели экспертов в данной предметной области.
Построение математической модели оптимизации структуры распределенной информационной системы в терминах теории четких множеств математическую модель оптимизации структуры распределенной информационной системы на основе теории четких множеств [16,57,102,108]. Функционирование распределенной информационной системы предъявляет повышенные требования к надежности N(o), быстродействию Q{), безопасности В{), доступности данных D(o) И суммарной стоимости проекта S{o). В общем случае формулируется задача многокритериальной оптимизации с множеством допустимых решений на Декартовом произведении действительных чисел G с R" и векторной целевой функцией
Известны несколько методов определения компромиссного решения [27,30]:
1. Одним из способов является сведение некорректной задачи многокритериальной оптимизации к соответствующей задаче математического программирования путем выделения из множества скалярных целевых функций {/к(х)}5кшХ одной основной и использования остальных для формирования дополнительных ограничений, накладываемых на множество G допустимых решений.
2. Выделение множества Парето (множества компромисса) Q из множества 1 = /(G) = [Y є R5: Y = f{x),X є G), которое (П ) обладает свойством множества наиболее предпочтительных решений G =/" (fl )cG, а допустимые решения из G либо эквивалентны, либо несопоставимы в смысле строгой предпочтительности. На основании выделения множества Парето работает множество следующих методов задачи многокритериальной оптимизации. При этом в задачу эксперта входит определение некоторой дополнительной информации в исследуемой предметной области.
3. Метод ранжировки критериев, при котором дополнительная информация может состоять в том, что скалярные целевые функции fk(x), к = 1,5 в задаче векторной оптимизации упорядочены в соответствии с их значимостью. В этом случае номер целевой функции определяет приоритет соответствующего скалярного критерия.
Построение математической модели оптимизации структуры распределенной информационной системы в терминах теории нечетких множеств
Предлагается следующий метод построения нечетких отношений, характеризующих основные характеристики распределенной информационной системы. Всякое такое отношение строится из множества двухместных функций, например в основе нечеткого отношения надежности на множестве фрагментов распределенного объекта лежит функция fN{F,,F ). Если зафиксировать одну из переменных функции fN, то при построчном заполнении матрицы необходимо вычислить значения одноместной функции /„{F, ) при постолбцовом значения одноместной функции // (Fj.
Построение функций принадлежности является нетривиальной задачей. Известны прямые и косвенные методы построения функций принадлежности [90]. Из прямых методов возможно использование следующих двух:
Для всех характеристик системы, исходя из современного развития средств телекоммуникаций, определяются полярные значения, соответствующие значениям функции принадлежности 0 и 1. Для характеристики конкретной реализации распределенной информационной системы эксперт, исходя из построенной шкалы, задает / (я:)є[0,і], формируя векторную функцию принадлежности ["лОО / іОО»— / і(-0}- Возможна модификация метода, по которой полярные значения определяются не человеком-экспертом, а на основе тестовых испытаний различных реализаций распределенной информационной системы, или получение такой информации из доступных литературных источников. Такая модификация метода предоставляет возможность автоматического расчета оптимальной конфигурации системы без привлечения экспертов при постановке задачи в нечетком виде.
При прямом групповом методе группе экспертов предъявляется конкретная характеристика распределенной информационной системы, и каждый должен дать один из двух ответов: удовлетворительна ли характеристика РИС для решения поставленной функциональной задачи, или нет. Число утвердительных ответов, деленное на общее число экспертов, дает значение функции принадлежности указанной характеристики к нечеткому множеству.
В задаче оптимизации структуры распределенной информационной системы использование прямых методов затруднено, так как обычно характеристики системы задаются в лингвистической форме, а если возможно измерить характеристики отдельных составляющих системы, то, учитывая ее размеры и сложность, построение интегральных характеристик затруднено. Поэтому для построения нечетких отношений будем использовать косвенные методы построения функции принадлежности, в частности, метод попарных сравнений.
Если бы значения функций принадлежности были известны, например, jUA(xl) = wl, / = 1..и, то попарные сравнения можно представить матрицей отноше ний А = \а \, где а = — -. На практике эксперт сам формирует матрицу А, при Wj этом предполагается, что диагональные элементы равны 1, а для элементов, сим 1 метричных относительно главной диагонали, а = —, т.е если один элемент оце а, нивается в а раз значимее чем другой, то последний должен быть в — раз значи а мее, чем первый. В общем случае задача сводится к поиску вектора w, удовлетворяющего уравнению вида Aw = Ztimw, где Дтік - наибольшее собственное значение матрицы А. Поскольку матрица А положительна по построению, решение данной задачи существует и является положительным. Рассмотрим модифицированный метод попарных сравнений, совмещенный с прямым групповым методом [77], который может быть использован при проектировании распределенной информационной системы. Начальный набор реализаций распределенной информационной системы по каждой ее характеристике может быть избыточным или, наоборот, недостаточным, поэтому: - с целью разработки системы объективного проектирования начальный набор ее реализаций ограничивается только теми, которые могут быть определенны без участия заинтересованного человека-эксперта; - выбираются только те реализации системы, которые поддерживаются непосредственными исполнителями.
Для решения выявленных проблем и предотвращения ошибок в расчетах выбранные параметры подвергаются предварительной обработке. Ошибки в расчетах могут появляться при некорректном определении значений функций принадлежности коррелируемых параметров.
Пусть для функций принадлежности параметров р, и р2 справедливо Р\ - /ІРг) = P2=fl(Pi) или f(P\) = f(Pi) Для любых значений рх и р7, тогда параметры могут быть однозначно вычислены на основе значений известных параметров. Для корректного их определения выделяются все избыточные группы (двойки, тройки и т. д.) коррелируемых параметров, в каждой из которых выбирается единственный параметр.
Вычисление значений функций принадлежности всех параметров представляется достаточно сложной (с вычислительной точки зрения) задачей. Оценим вычислительную сложность вычисления одного значения нечеткого отношения одного из параметров распределенной информационной системы /(/?,,р7). Зафиксируем вторую переменную и вычислим отдельное значение f ip,) как сравнение с другими возможными реализациями соответствующего объекта. Пусть множество реализаций некоторого объекта РИС имеет конечную мощность - пг. Реализации в общем случае могут не являться независимыми и вступать в некоторые взаимоотношения с другими, т. е. изменение значения реализации может изменять значения, сопоставленные с другими реализациями. Каждая из реализаций вступает в некоторые отношения с остальными пг -1 реализациями. Для всякого параметра рг набора можно построить неориентированный граф отношений между реализациями: G = (V,E), (2:20) где V - конечное множество вершин (реализаций); Е — множество неупорядоченных пар (ребер) на V, т. е. подмножество" множества VxV. Рисунок 6 — Граф отношений для набора из четырех реализаций объекта Условимся подписывать вершины названием реализации и обозначать ребром е = (u,v): и-у ситуацию наличия отношения между двумя реализациями и и v. Для каждого ребра и - v будем подписывать вес соответствующего отношения (вес отношения и -и равен 1). На рисунке 6 представлен граф отношений для набора из 4 реализаций объекта.
Выбор оптимальных характеристик генетического алгоритма и генетических операторов
В программе GeneticNetwork предусмотрено хранение данных генетического алгоритма в виде текстового файла на диске. Данные записываются в формате XML. В файл записываются данные, необходимые для работы генетического алгоритма, такие как: - структура уровней распределенной информационной системы. - исходные матрицы основных параметров функционирования системы для конкретных реализаций ее компонентов. - коэффициенты целевой функции, представленной в виде обобщенного критерия. - критерии останова алгоритма. - вероятности срабатывания генетических операторов.
Пример XML-файла с данными о генетическом алгоритме представлен в приложении А.
Алгоритм работы программы Genetic Network, основанный на представленном на рисунке 11 алгоритме и с учетом представленной структуры классов, состоит из следующих шагов:
1. При загрузке оконного приложения создается объект генетического алгоритма geneticAlgorithm класса NetworkGeneticAlgorithm и объект данных алгоритма algorithmData класса AlgorithmData.
2. Через свойство algorithmData.Layers заполняется структура уровней распределенной информационной системы. 3. Через свойства algorithrnData.KoefSpeed, algorithmData.KoefCost, algo-rithraData.KoefSecurity, algorithmData.KoefReliability устанавливаются значения коэффициентов целевой функции в виде обобщенного критерия соответственно для быстродействия, стоимости, безопасности, доступности и надежности системы.
4. С помощью метода CreateMatrices() и свойств algorithmData.CostMatrix, algorithinData.SpeedMatrix, algorithmData.SecurityMatrix, algorithmData.Reliability Matrix создаются и заполняются исходные матрицы основных параметров функционирования распределенной информационной системы.
5. С помощью свойств geneticAlgorithm.MutationProbablity, geneticAlgo-rithm.StopCriteria, geneticAlgorithm.StopCriteriaValue задаются, соответственно, вероятность срабатывания оператора мутации, критерий останова алгоритма и численное значение параметра критерия останова.
Создается начальная популяция особей с помощью метода geneticAlgo-rithm.CreatePopulation(). С помощью метода geneticAlgorithm.Start() запускается на выполнение генетический алгоритм. Блок-схема генетического алгоритма представлена на рисунке 10. Листинг программы Genetic Network представлен в приложении Б. Порядок работы с программным комплексом на примере оптимизации структуры распределенной информационной системы НОУ ВПО «Северо-Кавказский гуманитарно-технический институт» г. Ставрополя
За основу оптимизации структуры распределенной информационной системы примем существующую локальную вычислительную сеть НОУ ВПО «Северо-Кавказский гуманитарно-технический институт», представленную в приложении В. В структуре рассматриваемой сети выделяются: - уровень серверов (9 штук), в состав которых входят выделенные сервера базы данных и файловые сервера, в том числе сервера учебных лабораторий; - коммуникационное оборудование (21 штука) для обеспечения взаимосвязи клиентских ПЭВМ между собой и с серверным оборудованием; - клиентские ПЭВМ (138 штук).
Структура и характеристика связей между элементами сети, а также характеристика элементов представлены в приложении В. С целью формирования исходного множества вариантов функционирования распределенной информационной сети ее известные элементы дополняются недостающими элементами с известными характеристиками функционирования, таким образом, на основе представленных в предыдущих главах методов формируются матрицы N(o), 0(), #(), D(o), S(o).
Программный комплекс Genetic Network реализован в виде графического приложения, состоящего из набора вкладок, отражающих каждый шаг работы алгоритма.
На первом шаге на вкладке «Структура сети» вводятся известные элементы сети с указанием принадлежности ко множествам серверов коммуникационного оборудования и клиентскому оборудованию и предположительному распределению по уровням сети. На этой вкладке с помощью кнопок «Добавить уровень», «Добавить сущность» и ниспадающего списка оператор формирует структуру сети для оптимизации с использованием генетического алгоритма (рисунок 12).
На втором шаге заполняются исходные матрицы основных параметров функционирования распределенной информационной системы на вкладке «Матрицы». При заполнении ячейки матрицы цвет ее фона меняется с белого на черный. В случае если связь между отдельными элементами, в принципе, невозможна, то в соответствующую ячейку вводится заведомо большое значение (для стоимости) или заведомо малое число (для надежности, быстродействия, безопасности, доступности данных). На рисунке 13 представлена матрица В(о).
На третьем шаге задаются параметры работы генетического алгоритма: коэффициенты целевой функции в виде обобщенного критерия, вероятность срабатывания оператора мутации, критерий останова алгоритма и численное значение параметра критерия останова (рисунок 14).
Уменьшается объем оплаты работы по монтажу оборудования и локальной вычислительной сети.
Итого общая стоимость проекта корпоративной распределенной информационной системы может быть снижена на 7%. При этом расчетные значения остальных характеристик функционирования системы остаются в рамках заданных экспертами значений.