Содержание к диссертации
Введение
1 Теория надежности использования информационных технологий 13
1.1 Информационные технологии 13
1.2 Надежность информационных технологий 17
1.2.1 Надежность аппаратных средств 19
1.2.2 Надежность программных средств 21
1.3 Процесс восстановления 24
1.4 Модели процессов восстановления 28
1.4.1 Пуассоновский процесс 28
1.4.2 Простой процесс восстановления 30
1.4.3 Модель (p,q) несовершенного восстановления . 32
1.4.4 Модель функционирования восстанавливаемых объектов с виртуальным возрастом 34
1.4.5 Процесс восстановления порядка (^1,/) 36
1.5 Стратегии использования информационных технологий 37
2 Обобщенная модель процесса восстановления с учетом затрат и эффективности 42
2.1 Затраты на восстановления 42
2.2 Эффективность работы 46
2.3 Процесс восстановления порядка (^1,/) , учитывающий стоимости восстановлений 51
2.4 Затраты на восстановление для процесса восстановления порядка (^1,/) 55
2.4.1 Интегральное уравнение для функции затрат 55
2.4.2 Интегральные представления функции затрат 57
2.4.3 Асимптотическое поведение функции затрат 59
2.5 Функция эффективности для процесса восстановления порядка (&ь&2) 64
2.5.1 Интегральное представление функции эффективности 64
2.5.2 Интегральное уравнение для функции эффективности 66
2.6 Выводы 68
3 Вычисление характеристик обобщенной модели процесса восстановления порядка 70
3.1 Операционный метод 70
3.1.1 Функция восстановления процесса восстановления порядка (1,1) , образованного функцией 72
3.1.2 Функция затрат 73
3.2 Представление характеристик в виде обобщенного степенного ряда 74
3.3 Метод конечных сумм нахождения характеристик модели 83
3.3.1 Описание метода 83
3.4 Метод Монте-Карло 93
3.5 Выводы 97
4 Задачи оптимизации стратегий использования информационных технологий 98
4.1 Стратегии восстановления 99
4.1.1 Примеры решения задач оптимизации для стратегии восстановления блоками 103
4.2 Порядок замены объектов при стратегии только аварийных восстановлений 105
4.2.1 Порядок замен без учета стоимостей 106
- Надежность информационных технологий
- Модели процессов восстановления
- Процесс восстановления порядка (^1,/) , учитывающий стоимости восстановлений
- Функция восстановления процесса восстановления порядка (1,1) , образованного функцией
Введение к работе
Актуальность. В связи с информатизацией всех сфер деятельности человека проблема обеспечения высокой надежности использования информационных технологий (ИТ) является одной из наиболее значимых в развитии научно-технического прогресса. Надежность использования ИТ определяется надежностью ее взаимодействующих компонент - программного обеспечения, аппаратных устройств и методов их применения.
Применительно к надежности аппаратных составляющих ИТ используются методы классической теории надежности, изложенные в работах Б.В.Гнеденко, И.А.Ушакова, Д.Кокса, Р.Барлоу, В.Смита, Ф.Байхельта, Е.Ю.Барзиловича и других авторов [2, 18, 95, 62, 25, 23]. В этих работах процесс функционирования объекта рассматривается как процесс восстановления, при котором функции распределения наработок на отказ после каждого восстановления не изменяются.
Для аппаратных компонент ИТ характерны различные способы восстановлений, которые связаны с изменяющимися затратами и приводят объект в различные состояния. Таким образом, приходим к моделям процессов восстановления с изменяющимися функциями распределения наработок на отказ, затратами на восстановления и
эффективностями заменяемых объектов. Обобщающие модели процесса восстановления были предложены М.Броуиом и Ф.Прошаном, М.Кийама и У.Сумита, К.Дорадо и другими авторамрі [58, 65, 77, 72, 73]. Однако эти модели не вполне достаточны для описания процессов функционирования аппаратных средств в теории надежности использования ИТ.
Вопросам надежности использования ИТ применительно
к программным компонентам посвящены работы Г.Майерса,
Р.Гласса, Т.Тейера, В.В.Липаева, В.В.Шуракова, И.Б.Герцбаха
[31, 33, 17, 40, 29, 30]. В этих работах надежность рассматривается
как" внутреннее свойство программы. Наиболее известными
математическими моделями надежности программного
обеспечения являются модели Шумана, Джелинского-Моранды, Шика-Вольвертона, Вайса, Коркорена, Нельсона и другие [31, 40, 96, 71, 78, 90, 101, 60, 85]. Предполагается, что исходное число ошибок в программе постоянно и может уменьшаться по мере того, как ошибки исправляются. В большинстве случаев рассматривается экспоненциальный закон распределения наработок на отказ с неизменяющейся интенсивностью отказов в процессе восстановления.
Следует отметить, что отказы программных компонент возникают не только из-за ошибок, заложенных в коде программы, но и в связи с ее некорректным использованием, а также с изменением взаимодействующих с программой компонент ИТ в процессе использования. Так же, как и в моделях процессов восстановления для аппаратных средств, после восстановлений изменяются
функции распределения наработок на отказ программных средств, эффективность использования программ и затраты на восстановления.
Так как основные показатели надежности закладываются на этапах разработки, проектирования и тестирования, то одной из возможностей поддержания характеристик надежности при использовании ИТ на требуемом уровне является применение оптимальных стратегий восстановления, например, когда наряду с аварийными проводятся профилактические восстановления. Здесь также следует учитывать специфику ИТ.
Таким образом, необходимость обеспечения высокого уровня показателей надежности приводит к построению обобщенных моделей процессов восстановления и стратегий эксплуатации в теории надежности использования ИТ.
Целью работы является исследование процессов восстановления в теории надежности использования информационных технологий.
Исходя из поставленной цели были определены следующие задачи исследования:
Разработка обобщенной модели процесса восстановления применительно к теории надежности использования информационных технологий.
Нахождение и исследование характеристик надежности использования информационных технологий на основе моделей процессов восстановления.
Разработка и исследование стратегий восстановления в теории надежности использования информационных технологий.
Основные научные результаты, выносимые на защиту
Разработана и обоснована модель процесса восстановления в теории надежности использования информационных технологий, обобщающая известные модели процессов восстановления, учитывающая изменяющиеся в результате восстановлений функции распределения наработок на отказ, затраты на восстановления и эффективность заменяемых элементов.
Получены и обоснованы методы нахождения характеристик обобщенной модели процесса восстановления с различными законами распределения наработок на отказ. Получена асимптотическая оценка функции затрат.
Разработаны модели стратегий восстановления в теории надежности использования ИТ при проведении аварийных и профилактических восстановлений.
Теоретическая значимость. В рамках диссертационной работы получены теоретические результаты по построению и обоснованию обобщенной модели процесса восстановления в теории надежности использования информационных технологий.
Практическая значимость. Работа имеет практическую направленность. Результаты могут быть использованы для прогнозирования, планирования и оптимизации использования информационных технологий.
Достоверность результатов. Достоверность результатов определяется учетом особенностей работы компонент
информационных техно л огрій, корректным применением
математических методов при решении рассматриваемых задач. Все результаты работы снабжены строгими доказательствами.
Методика исследования. В диссертационной работе использовались теоретические основы информационных систем и технологий, методы математической теории надежности, теории восстановления, теории вероятностей и случайных процессов, теории интегральных уравнений, теории информации.
Апробация работы. Основные результаты исследования
докладывались на межвузовской научной конференции
студентов, аспирантов и молодых ученых "Информатика и
информационные технологии" (Красноярск, 2003), Всероссийской
научной конференции молодых ученых "Наука. Технологии.
Инновации" (Новосибирск, 2005), Всероссийской научно-
методической конференции "Повышение качества высшего
профессионального образования" (Красноярск, 2007),
Международной научной школе "Моделирование и анализ безопасности и риска в сложных системах" (Санкт-Петербург, 2007), Всероссийской конференции " Финансово- актуарная математика и смежные вопросы" (Красноярск, 2007), на семинарах кафедры прикладной математики Сибирского федерального университета (Красноярск, 2003-2007).
Публикации и личный вклад автора. По теме диссертационной работы опубликовано 7 работ, из них 5 статей, в том числе одна в периодическом издании по перечню ВАК. Основные результаты диссертации получены лично автором.
Структура и объем работы. Диссертация состоит из введения, 4 глав, заключения и библиографии. Текст изложен на 125 страницах, дополнен 9 иллюстрациями. Библиография включает 104 наименования.
Основное содержание работы
Во введении обосновывается актуальность темы, излагается современное состояние вопроса, цель и задачи работы, отмечается научная новизна, теоретическая и практическая значимость полученных результатов, формулируются основные положения, выносимые на защиту, кратко описано содержание диссертации по главам, приводятся данные о публикациях и личном вкладе автора.
В первой главе приводятся предварительные сведения об информационных технологиях - основные термины, определения, а также требования, предъявляемые к информационным технологиям; рассматривается проблема обеспечения надежности использования информационных технологий. Рассматривается математическая постановка основной задачи теории восстановления, описывающей процесс функционирования информационных средств, подверженных отказам; приводится обзор существующих моделей процессов восстановления.
Во второй главе в дополнение к функции восстановления (математическое ожидание числа отказов) вводятся функция затрат (математическое ожидание затрат на восстановления) и функция эффективности (математическое ожидание эффективности), и получены их представления в виде бесконечных рядов содержащих, п -кратные свертки функций распределения наработок на отказ.
С учетом стоимости и эффективности, вводится обобщенная модель процесса восстановления порядка (^1,/) Получены интегральные уравнения и интегральные представления для функции затрат и функции эффективности, а также асимптотическая оценка функции затрат.
Во третьей главе рассматриваются методы нахождения точных и приближенных значений функции восстановления, функции затрат и функции эффективности.
В параграфе 3.1 для введенного процесса восстановления порядка (^1./) приводятся решения полученных интегральных уравнений Вольтерра второго рода для функции восстановления и стоимости затрат через преобразования Лапласа-Стилтьеса в случае, когда все наработки на отказ имеют экспоненциальный закон распределения.
В параграфе 3.2 рассматриваются интегральные представления для функции восстановления, функции затрат и функции эффективности через Нф(к2\і) - функцию восстановления процесса восстановления порядка (1,1) , организованного сверткой всех функций распределения периодической части процесса восстановления. Рассматривается представление функции Нф(к2\і) в виде / -кратного обобщенного степенного ряда и доказывается его сходимость для случая, когда наработки распределены по закону Вейбулла-Гнеденко с произвольными параметрами.
В параграфе 3.3 получена квадратурная формула приближенного вычисления п -кратных сверток функций распределения и оценка ее погрешности. Приводится метод конечных сумм для решения интегральных уравнений для функции восстановления, функции
стоимости затрат, функции эффективности, с использованием полученных квадратурных формул вычисления сверток.
В параграфе 3.4 рассматривается применение метода Монте-Карло для нахождения функции восстановления, функции затрат и функции эффективности для произвольных моделей процесса восстановления.
В четвертой главе для обобщенной модели процесса восстановления рассматриваются стратегии использования информационных технологий: стратегия только аварийных восстановлений и стратегия восстановления блоками, при которой наряду с аварийными восстановлениями проводятся профилактические. Решаются задачи выбора и оптимизации этих стратегий по критериям минимума интенсивности затрат или минимума среднего числа отказов.
Надежность информационных технологий
Развитие и усложнение средств информационных технологий, а также охват информационными технологиями практически всех видов деятельности человека придает особое значение проблеме надежности их использования. Надежность информацрюнных технологий, в конечном итоге, имеет стратегическое значение для развития общества. Особенное значение надежность имеет для больших и сложных программно-аппаратных систем, управляющих жизненно важными и ответственными объектами в реальном масштабе времени. Уже сегодня во многих развитых странах проблемы обеспечения надежности и безопасности информационных технологий ставятся наравне с проблемами экономической, биологической, военной безопасности.
В то же время, следует заметить, что надежность является основным, но не единственным требованием к информационным технологиям. Надежность следует рассматривать в связи с другими предъявляемыми к ИТ требованиями:
Гибкость - способность информационной технологии быстро адаптироваться к изменяющимся условиям и требованиям.
В процессе использования могут меняться информационные ресурсы, методы, техника или программное обеспечение. Нарушение условия гибкости может привести к неправильной работе информационной технологии, уменьшению эффективности, снижению уровня ее надежности и безопасности ее использования, а также стать причиной остановки.
Эффективность - количественная оценка работы информационной технологии.
Могут использоваться различные показатели: затраты, продуктивность, скорость выполнения, отношение затрат к продуктивности и т.п. Эффективность использования информационной технологии зависит от выбора информационных средств, стратегий и режимов эксплуатации. В общем случае, снижение эффективности может повлечь снижение надежности использования информационной технологии и даже привести к отказам.
Надеэ/сносгпь - свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции в заданных режимах и условиях применения, технического обслуживания и транспортирования (ГОСТ 27.002-89).
Ключевым понятием теории надежности является понятие отказа. Определение этого понятия зависит от выбора приложения теории надежности. В частности, для надежности использования информационных технологий может быть использовано следующее определение.
Отказ информационной технологии - это случайное событие, приводящее к изменению способности информационных технологий выполнять требуемые функции в заданных режимах и условиях эксплуатации: искажение информации, остановка процесса, изменение эффективности се использования.
Надежность использования информационной технологии требует рассмотрения в первую очередь надежности информационных средств - аппаратных и программных.
При изучении надежности аппаратных средств применяются методы математической теории восстановления [2, 18, 95, 62, 25, 23].
В математической теории надежности предполагается, что объект может находиться в двух состояниях — работоспособном и неработоспособном, а отказ заключается в переходе из работоспособного в неработоспособное состояние. Отказы в аппаратных средствах возникают из-за множества случайных факторов: старение элементов из-за износа или усталости дефекты производства внешние воздействия, природные катастрофы, катаклизмы, коммунальные аварии и т.п.
В процессе обратного перехода в работоспособное состояние (восстановление) могут совершаться любые необходимые действия вплоть до замены объекта на новый. В большинстве случаев время восстановления считается пренебрежимо малым по сравнению со временем нормальной работы и принимается равным нулю. В некоторых случаях время восстановления учитывается, например в альтернирующих процессах восстановления.
Модели процессов восстановления
К настоящему времени известен ряд моделей процессов восстановления. Отличительной особенностью каждой модели являются условия, накладываемые на функции распределения наработок на отказ заменяемых объектов.
В течение многих лет наиболее используемыми моделями процесса восстановления были простой процесс восстановления [62, 95] PI неоднородный пуассоновский процесс [50, 53]. Модель простого процесса восстановления предполагает, что после каждого отказа объект полностью восстанавливается в свое начальное состояние, хотя это далеко не всегда имеет место. В случае пуассоновского процесса, интенсивность событий - величина постоянная, и не зависит ни от времени работы объекта, ни от того, сколько отказов уже произошло к текущему моменту t . В современной литературе эти, две модели рассматриваются как крайние модели процесса несовершенного восстановления [76].
Пуассоновский процесс
В теории восстановления пуассоновская модель процесса восстановления известна как модель с минимальным восстановлением [50, 53]. Примерами процесса Пуассона являются процесс поступления заявок в системах массового обслуживания, поступление телефонных звонков на АТС, поток покупателей в магазине, запросы к Web-серверу, выплаты по страховым договорам [42], отказы вычислительных систем или программного обеспечения [36], отказы в электрических системах [19, 35] и т.д.
Рассмотрим считающий процесс N(t) . Обозначим N(a, b) -число событий на интервале от а до 6 N{a, b) = N{b) - N(a) с математическим ожиданием А(а,Ь) = E[N(a,b)].
Считающий процесс N(t) называется процессом Пуассона или пуассоновским процессом, если число событий N(a, b) на произвольном интервале от а до b имеет распределение Пуассона с параметром Л(а, 6) P(N(a,b) = k) = e- 5jp -, k = 0,1,..., b где Л(а, b) = J X(x)x , X(t) - интенсивность событий в момент а времени t . Функция восстановления для процесса Пуассона равна t H(t) = A(0,t) - / X(x)dx, о а интенсивность потока отказов h(t) = H (t) = X{t).
В случае, когда интенсивность отказов является постоянной величиной X(t) = Л , данный процесс называется однородным процессом Пуассона. Для такого процесса функция восстановления пропорциональна времени, прошедшему с начала функционирования объекта H(t) = Xt.
В случае, когда интенсивность отказов является функцией от времени А() , процесс Пуассона называется неоднородным.
Недостатком данной модели является то, что интенсивность событий не зависит от времени, прошедшего с момента последнего отказа, и от числа предшествующріх отказов, зависит только от времени, прошедшего с начала работы объекта.
Простой процесс восстановления является упрощенной моделью функционирования восстанавливаемых объектов. В современной литературе эта модель известна как модель с полным (совершенным) восстановлением. Считается, что после отказа объект заменяется объектом, находящимся в точно таком же состоянии, как первый в начальный момент времени, то есть функции распределения F{(x) не изменяются при очередных восстановлениях. Несмотря на простоту модели, она достаточно широко и эффективно используется в приложениях теории надежности использования информационных технологий [31].
Процесс восстановления порядка (^1,/) , учитывающий стоимости восстановлений
Процесс восстановления называется процессом восстановления порядка ( 1,/) если функции распределения Fi(t), г 0 , удовлетворяют условию Fi(t) = Fj(t) при г = j (mod fc2), і J kY. (2.20) Наработки с 1-ой по (к\ — 1) -ую определяют непериодическую частью процесса восстановления, остальные (начиная с к\ -ой) -периодическую (Рисунок 2.3.). Функция восстановления H(t) имеет представление в виде ряда [6] оо H(t) = F n\t). (2.21) п=1
Пусть Y{ = Xki+i-i - наработки периодической части процесса восстановления и Фг() - их функции распределения Ф»( ) = JWi(t), г = 1,2,.... (2.22) Условие (2.20) запишется в виде Фі(і) = Фу(і) при г = j (mod fc2), ij l. (2.23) Функция восстановления процесса восстановления порядка (/ь к2) удовлетворяет интегральному уравнению [6] t H(t) = G{t) + I H{t- x)d$ ik2\x), (2.24) о где G(t) = J2 F(n)w - (Ylp{n) ф{кг))( ) n=l n=l
В частности, для процессов восстановления порядка (1,1) простой процесс восстановления и (2,1) - запаздывающий процесс восстановления уравнение (2.24) принимает вид [25] t H{t) = Fi(i) + f H(t- x)dF1(x)1 (2.25) о и t H{t) = F t) + f H(t- x)dF2(x). (2.26) о Разработанные в диссертационной работе методы решения уравнения (2.24) для модели процесса восстановления порядка (hi, к2) рассматриваются в главе 3. Функция восстановления Hit) процесса восстановления порядка (ki,k2) имеет интегральное представление через функцию восстановления периодического процесса восстановления (процесса восстановления порядка (1, к2) ) НФ(і) , образованного последовательностью функций распределения {$()} [6] H(t) = ]Г F(t) + І НФ(і - x)dF 1\x). (2.27) І=І { Из (2.27) следует t HFiFiit) = Fi(t) + J HF2(t - x)dFl(x): (2.28) 0 где HFiF2(t) - функция восстановления процесса восстановления порядка (2,1) , HFi(t) - функция восстановления процесса восстановления порядка (1,1). Функция восстановления ЯФ() периодического процесса (1, ) имеет представление через функцию восстановления [6] ЯФ() = 2Нф(І)фік2)(ї)- (2-29) или с учетом (2.28) h #ф() - ]Г (ф( + / Нф(к2\ - x)d &{t)\ (2.30) Следующее представление объединяет представления (2.27) и (2.30) fa-i H{t) = J2 F{n)W) + 5Z (F(kl l) Ф(і)) ( )+ n=l г=1 + 5Z ( (Лі_1) ф(і) ЯФ(Ла)) W- (2-31) г=1
Из представления (2.31) следует, что если известна функция восстановле ния , то нахождение функции восстановления процесса восстановления порядка ( 1,/) сводится к вычислению конечного числа интегралов.
В работе [10] получено ассимптотическое поведение функции восстановления &2 ,. л , ( +Му) 1іш(Я(«)- ) = -1+ . 2 - - ЕЁМ«0. (2.32) где / , (7 , мУ , (Ту - математические ожидания и дисперсии суммы наработок периодической и непериодической части процесса восстановления соответственно, M(Yj) - математическое ожидание j -ой наработки из периодической части процесса восстановления.
Определение. Процесс восстановления с учетом затрат, у которого функции распределения Fi(t) и затраты на восстановления Q удовлетворяют условию Fi(t) Fj(t), СІ — Cj при і = j (mod ;2), i,j ki, (2.33) назовем процессом восстановления порядка (&i, /) с учетом затрат.
Функция восстановления процесса восстановления порядка (1,1) , образованного функцией
Основные характеристики надежности компонент информационных технологий закладываются на этапах проектирования, разработки и тестирования. Одной из возможностей поддержания надежности в процессе эксплуатации объекта является выбор оптимальных стратегий эксплуатации. Оптимизация может проводиться по различным критериям, таким как минимум функции восстановления, максимум коэффициента готовности, минимум интенсивности затрат и другие.
В стратегиях восстановления с проведением, наряду с аварийными, профилактических восстановлений, как правило предполагается, что стоимость как профилактических, так и аварийных восстановлений не изменяется при очередных восстановлениях [48, 54, 47]. На практике это не всегда имеет место.
В данной главе рассматриваются две стратегии восстановления, учитывающие стоимость восстановлений, в случае обобщенной модели процесса восстановления порядка (:1,/) _ стратегия восстановления блоками (с проведением профилактических восстановлений) и стратегия только аварийных восстановлений. Также рассматриваются стратегии проведения оптимальной последовательности замен в случае, когда возможно несколько вариантов замены отказавшего элемента - новыми элементами с различными стоимостями восстановлений и с различными функциями распределения наработок на отказ.
Рассмотрим стратегию восстановления блоками [2] для процесса восстановления порядка ( 1,/) с учетом стоимости восстанавливаемых объектов. В этом случае аварийные восстановления образуют процесс восстановления порядка ( 1,/) , а в фиксированные моменты времени т, 2т,... проводятся профилактические восстановления. В результате каждой профилактики заново начинается рассматриваемый процесс восстановления, то есть независимо от того, сколько произошло до этого аварийных восстановлений, объект восстанавливается с функцией распределения Fi(t) и стоимостью с\ , а далее продолжается процесс восстановления порядка ( 1,/)
Таким образом, процесс эксплуатации разбивается на стохастически эквивалентные циклы пт, (п + 1)т, п = 0,1,... [2]. О т 2т Зт Рисунок 4.1. Стратегия восстановления блоками Тогда интенсивность эксплуатационных затрат будет выражаться следующей формулой 1(т) = S(T)/T, 0 Г ОО.
Для данной стратегии С\ - стоимость профилактических работ, a Q, г 2 - стоимости аварийных замен.
Рассмотрим стратегию только аварийных восстановлений. В этом случае профилактические восстановления не проводятся ( т = оо ). Интенсивность затрат 1а является предельным значением 1(т) при г — оо . Таким образом, Ia = lim 1(т) = lim т—+оо т—»оо 7" Учитывая выведенную формулу асимптотического поведения S(t) (2.55), получаем
При выборе оптимальной стратегии восстановления по минимуму интенсивности затрат приходим к задаче минимизации функции 1(т) , то есть нахождению величины т = т (времени проведения профилактических работ), при которой 1(т) принимает наименьшее значение.
Если значения минимума функции интенсивности затрат стратегии восстановления блоками меньше интенсивности затрат стратегии аварийных восстановлений, то проведение профилактик целесообразно, в противном случае следует ограничиться только аварийными восстановлениями.
На рисунке 4.2. приведены графики функций эффективности затрат для двух моделей процессов восстановления.
В случае а, рассматривается процесс восстановления порядка (3.1) с наработками, распределенными по закону Вейбулла Гнеденко с параметрами : / = 0.5, в\ = 1, С\ = 10; / = 0.5, #2 = 1, С2 = 1; / = 1-5, #з = 15 Сі = 1 . Интенсивность затрат в стратегии восстановления блоками при всех t больше интенсивности затрат при только аварийных восстановлениях. В этом случае предпочтение отдается стратегии только аварийных восстановлений.
В случае Ь, рассматривается процесс восстановления порядка (3.2) с наработками, распределенными по закону Вейбулла Гиеденко с параметрами: /Зі = 2, 9\ = 1, с\ — 10; / = 8,02 = 1, с2 = 1; / = 16, = 1,сз = 1; / = 32, 0з = 15 Сі = 1 . В этом случае интенсивность аварийных затрат имеет единственный минимум в точке г « 1.607, 1(т ) «