128
Федеральное агентство железнодорожного транспорта Иркутский государственный Университет путей сообщения А.А. Ермаков ОСНОВЫ НАДЕЖНОСИ ИНФОРМАЦИОННЫХ СИСТЕМ Учебное пособие по дисциплине «Надежность информационных систем» для студентов специальности «Информационные системы и технологии» Иркутск 2006

Ермаков - Основы надежности информационных систем

Embed Size (px)

Citation preview

Page 1: Ермаков - Основы надежности информационных систем

Федеральное агентство железнодорожного транспорта Иркутский государственный Университет путей сообщения

А.А. Ермаков

ОСНОВЫ НАДЕЖНОСИ

ИНФОРМАЦИОННЫХ СИСТЕМ

Учебное пособие

по дисциплине «Надежность информационных систем» для студентов

специальности «Информационные системы и технологии»

Иркутск 2006

Page 2: Ермаков - Основы надежности информационных систем

УДК 002.6:519.718 ББК 30.14

Е 72 Рекомендовано Сибирским региональным учебно-методическим цен-тром высшего профессионального образования для межвузовского использования в качестве учебного пособия для студентов по специ-альности 230201 «Информационные системы и технологии».

Ермаков А.А. Основы надежности информационных систем: учеб-ное пособие. – Иркутск: ИрГУПС, 2006.- 151с.

В учебном пособии изложены основные разделы теории надежности и

ее приложений к техническим устройствам и, в частности, к информаци-онным системам. Наиболее важные моменты иллюстрируются с помощью рисунков, таблиц и примеров. Пособие написано в соответствии с требова-ниями образовательных стандартов, предъявляемых к дисциплине «На-дежность информационных систем» по специальности «Информационные системы и технологии». Рекомендуется для студентов этой специальности, но может быть полезно при изучении родственных дисциплин на других технических специальностях.

УДК 002.6:519.718

ББК 30.14

Рецензенты: доктор технических наук В.П. Удилов, профессор, замес-титель начальника ВСИ МВД России по учебной работе; кандидат техни-ческих наук Ю.Д. Артеменко, доцент Иркутского ВВАИУ.

Ермаков А.А., 2006

ИрГУПС, 2006

Page 3: Ермаков - Основы надежности информационных систем

149

Оглавление

Введение…………………………………………………………………….…3 Глава 1. Основные понятия и определения теории надежности………6

1.1. Понятие надежности. Термины и определения…………………..6

1.2. Надежность как свойство ТУ. Понятие состояния и

события. Определение понятия отказа………………………………..9

1.3. Классификация отказов ТУ………………………………………10

1.4. Факторы, влияющие на снижения надежности ТУ…………. …11

1.5. Факторы, определяющие надежность информационных

систем………………………………………………………………….16

1.6. Влияние человека-оператора на функционирование

информационных систем……………………………………………..18

Глава 2. Основные показатели надежности невосстанавливаемых

технических устройств……………………………………………………. 20

2.1. Составляющие надежности……………………………………… 20

2.2. Простейший поток отказов……………………………………….21

2.3. Вероятность безотказной работы и вероятность отказов………23

2.4. Интенсивность отказов……………………………………………27

2.5. Среднее время безотказной работы………………………………29

2.6. Аналитические зависимости между основными

показателями надежности……………………………………………..30

2.7. Долговечность……………………………………………………..34

Глава 3. Надежность программного обеспечения…………………….38

3.1. Основные понятия…………………………………………………38

3.2. Основные причины отказов программного обеспечения…... …39

3.3. Основные показатели надежности программного

обеспечения…………………………………………………………… 42

Глава 4. Надежность невосстанавливаемых технических

устройств в процессе их эксплуатации…………………………………. 51

4.1. Характеристики надежности на различных этапах

Page 4: Ермаков - Основы надежности информационных систем

150

эксплуатации…………………………………………………………. 51

4.2. Надежность в период износа и старения………………………..54

4.3. Надежность технических устройств в период хранения……….58

4.4. Характеристики надежности информационной системы

при хранении информации……………………………………………60

Глава 5. Элементы теории восстановления…………………………. 66

5.1. Основные понятия и определения теории восстановления…….66

5.2. Коэффициенты отказов…………………………………………...70

5.3. Комплексные показатели надежности…………………………...72

5.4. Аналитические зависимости между показателями

надежности восстанавливаемых технических устройств……………76

5.5 Полная вероятность выполнения заданных функций…………....79

Глава 6. Структурные схемы надежности……………………………..82

6.1. Структурные схемы надежности с последовательным

соединением элементов………………………………………………..82

6.2. Структурные схемы надежности с параллельным

соединением элементов………………………………………………..85

6.3. Структурные схемы надежности со смешанным

соединением элементов………………………………………………..86

6.4. Сложная произвольная структура………………………………..87

6.5. Расчет надежности по внезапным отказам…………………….. 90

6.6. Расчет надежности по постепенным отказам…………….……..92

Глава 7. Методы повышения надежности. Резервирование.………96

7.1. Классификация методов резервирования………………………..96

7.2. Общее резервирование…………………………………………..100

7.3. Раздельное резервирование……………………………………...103

7.4. Определение необходимого количества резервных

элементов………………………………………………………………106

7.5. Особенности резервирования электрических схем……………109

7.6. Другие виды резервирования……………………………………112

Page 5: Ермаков - Основы надежности информационных систем

151

7.7. Резервирование информационных систем………………………113

Глава 8. Испытания на надежность…………………………………...117

8.1 Временные характеристики, применяющиеся при

статистических исследованиях надежности………………………....117

8.2. Экспериментальное определение характеристик

надежности……………………………………………………………..120

8.3. Ускоренные испытания на надежность……………………….....126

8.4. Метод статистического моделирования надежности…………...129

8.5. Прогнозирование надежности………………………………….…135

8.6. Методика системы сбора и обработки информации

о надежности……………………………………………………143

Библиографический список………………………………………………. 147

Page 6: Ермаков - Основы надежности информационных систем

6

Глава 1

Основные понятия и определения теории надежности

1.1 Понятие надежности. Термины и определения

Функциональные качества технических устройств (ТУ), в том числе и

информационных систем, в значительной степени зависит от их надежно-

сти.

Информационная система (ИС) – это сложная программно-аппаратная

система, включающая в свой состав эргатические (человеко-машинные)

звенья, технические или аппаратные средства и программное обеспечение.

Говоря о надежности ИС, необходимо учитывать две ее составляющие: на-

дежность аппаратных средств и надежность программного обеспечения.

Если методы исследования и обеспечение надежности технической (аппа-

ратной) составляющей ИС аналогичны соответствующим мероприятиям

других ТУ, то программное обеспечение отличается от подобной методо-

логии. Так, при исследовании этих структур имеется в виду достоверность

информации, ее корректность, правильность ее интерпретации. Отметим,

что в дальнейшем, говоря о ТУ, будем иметь в виду, в том числе, и аппа-

ратные составляющие ИС (компьютеры, периферийное оборудование,

коммутационное оборудование, кабельное оборудование и др.).

Названные категории не исключают, а взаимно дополнят друг друга,

поскольку в такой сложной системе, как ИС обеспечить необходимый

уровень надежности можно, только учитывая особенности ее составляю-

щих.

Самые совершенные начальные технические характеристики ТУ яв-

ляются необходимыми, но недостаточными условиями высоких эксплуа-

тационных качеств этих устройств. Начальные характеристики ТУ показы-

вают его потенциальные технические возможности. Важным является спо-

Page 7: Ермаков - Основы надежности информационных систем

7

собность ТУ сохранять эти характеристики в течение всего жизненного

цикла или в процессе эксплуатации.

Способность ТУ сохранять свои первоначальные технические каче-

ства в процессе эксплуатации называется надежностью.

Эта способность зависит как от свойств, которые были заложены в ТУ

в процессе проектирования и изготовления, так и от интенсивности экс-

плуатации, правильности и своевременности технического обслуживания.

Поэтому физический смысл надежности состоит в способности сохранять

эти свойства, сопротивляться агрессивным эксплуатационным факторам.

Надежность может выступать как в качестве самостоятельной эксплуата-

ционной характеристики, так и служить составляющей других эксплуата-

ционных характеристик.

Одной из основных задач, решаемых в процессе эксплуатации и тех-

нического обслуживания ТУ, является обеспечение их надежной работы.

Важность этой проблемы обусловлена как сложностью современных ТУ,

так и высокими значениями эксплуатационных нагрузок (температура,

давление, влажность и т.д.).

Поэтому есть определение надежности в соответствии с ГОСТ 27.002-

83, которое отражает эксплуатационную сущность этого показателя.

Под надежностью понимается свойство ТУ выполнять заданные

функции, сохраняя свои эксплуатационные характеристики в заданных

пределах в течение требуемого промежутка времени или требуемой на-

работки в определенных условиях эксплуатации.

Говоря о некотором ТУ, нужно иметь в виду, что его надежность туP

в общем случае оказывает влияние на эффективность работы Э более

сложной системы, частью которой он является. Это влияние осуществляет-

ся через технико-экономическую эффективность ТЭ , представляющую

собой характеристику уровня выполнения системой своих функций с уче-

Page 8: Ермаков - Основы надежности информационных систем

8

том финансовых, трудовых и материальных затрат. Формально это можно

записать следующим образом:

).,(

);,,,(

);,,(

1

,1

инту

nту

n

УКP

ФФPfТЭ

ФФТЭfЭ

=

=

=

K

K

Здесь −нК начальный уровень надежности ТУ;

−иУ фактор, учитывающий условия эксплуатации и технического

обслуживания этой системы;

−nФФ ,,1 K прочие факторы.

В качестве критерия оценки технико-экономической эффективности

ТЭ технического устройства может быть использовано соотношение

,∑

=E

QТЭ

где Q – полезный эффект;

∑ −E суммарные затраты.

Зависимость между характеристиками надежности и технико-

экономической эффективностью может быть представлена в виде

.)()( im

iio PtataТЭ ∑+=

В этом выражении −iP количественные показатели надежности, таких

как безотказность, долговечность, сохраняемость и ремонтопригодность;

)(ta i – коэффициенты, показывающие степень влияния соответствующих

показателей надежности; −)(ta o коэффициент, учитывающий влияние

прочих эксплуатационных факторов.

В заданных условиях эксплуатации необходимо стремиться к тому,

чтобы поддерживать такое значение туP , которое позволит эксплуатиро-

Page 9: Ермаков - Основы надежности информационных систем

9

вать ТУ без ограничений при минимальных трудовых, материальных и

финансовых затратах.

1.2 Надежность как свойство ТУ. Понятие состояния и события. Опре-

деление понятия отказа

Таким образом, исходя из определений, надежность – это свойство

ТУ.

Надежность - это свойство, присущее конкретному ТУ и зависящее

от проекта этого ТУ, применяемых для его изготовления материалов и

технологии изготовления.

Иными словами – это индивидуальное свойство. Как и всякое свойст-

во, в общем случае надежность в процессе эксплуатации изменяется, а на-

дежность, в частности - уменьшается. Уменьшение надежности ТУ проис-

ходит в результате его износа и старения. Тогда можно сказать, что в мо-

мент начала эксплуатации ТУ надежность была максимальной и с течени-

ем времени это свойство, несмотря на профилактические мероприятия,

уменьшилось на столько, что дальнейшая эксплуатация ТУ стала нецеле-

сообразной.

В связи с этим вводятся понятия работоспособности и отказа, кото-

рые определяются как состояние ТУ.

В соответствии с определением надежности по ГОСТ 27.002-83 рабо-

тоспособность можно определить как состояние, при котором эксплуата-

ционные характеристики ТУ находятся в заданных пределах, ТУ способно

выполнять заданные функции, сохраняя значения заданных параметров в

пределах, установленных нормативно – технической документацией.

Понятие работоспособности нельзя путать с понятием исправности. В

соответствие с тем же ГОСТом:

Исправность - это такое состояние ТУ, при котором он соответ-

ствует всем требованиям, установленным нормативно–технической до-

Page 10: Ермаков - Основы надежности информационных систем

10

кументацией. Поэтому понятие исправность более широкое, чем работо-

способность. Действительно, ТУ может быть в неисправном состоянии, но

функционировать нормально.

Если хотя бы один из заданных параметров ТУ, характеризующих его

способность выполнять заданные функции, не соответствует требова-

ниям, то это ТУ находится в неработоспособном состоянии.

Такое неработоспособное состояние называется отказом и является

противоположным по отношению к работоспособному состоянию.

Переход ТУ из одного состояния в другое называется событием.

Отказ является событием нарушения работоспособности и происходит

в результате воздействия на ТУ различных агрессивных факторов, по

большей части носящих случайный характер. Таким образом, отказ явля-

ется случайным событием со всеми особенностями, присущими случайно-

му событию.

1.3. Классификация отказов ТУ

Возникающие в ТУ отказы разнообразны как по характеру развития и

проявления, так и по причинным связям. Основными признаками класси-

фикации является следующее:

- по характеру изменения параметра;

- по взаимосвязи;

- по характеру нарушения работоспособности;

- по причинам возникновения.

К первой группе относятся внезапные и постепенные отказы.

Внезапным называется отказ, характеризующийся скачкообразным

изменением одного или нескольких основных параметров.

Постепенным называется отказ, характеризующийся постепенным

изменением одного или нескольких основных параметров.

Page 11: Ермаков - Основы надежности информационных систем

11

Основными причинами внезапных отказов являются резкие измене-

ния условий эксплуатации. Постепенные отказы возникают из-за старения

и износа в процессе медленно меняющихся условий эксплуатации.

Ко второй группе относятся зависимые и независимые между собой

отказы.

Зависимым называется отказ элемента, обусловленный повреждени-

ем или отказом других элементов сложного ТУ.

Независимый отказ не обусловлен отказами других элементов.

В третьей группе различаются сбои и перемежающие отказы.

Сбоем называется самоустраняющийся отказ, приводящий к крат-

ковременному нарушению работоспособности.

Перемежающимся отказом называется многократно возникающий

сбой одного и того же характера.

К последней группе относятся конструктивные, производственные и

эксплуатационные отказы.

Конструктивными называется отказ, возникающий в результате на-

рушения установленных норм или правил конструирования ТУ.

Производственным называется отказ, возникающий в результате

нарушения установленного процесса изготовления или ремонта ТУ.

Эксплуатационным называется отказ, возникший в результате пра-

вил или условий эксплуатации ТУ.

1.4. Факторы, влияющие на снижения надежности ТУ

Все отказы ТУ происходят вследствие воздействия различных факто-

ров, к которым относятся физические, физико-химические и химические,

биологические и эксплуатационные факторы.

Page 12: Ермаков - Основы надежности информационных систем

12

Физические причины возникновения отказов

Физические причины или факторы возникновения отказов представ-

ляют собой физические явления, процессы и свойства среды, воздейст-

вующие на ТУ и наносящие им вред и тем самым ухудшающие их состоя-

ния.

Физические факторы делятся на внешние и внутренние.

Внешние физические факторы являются совокупностью свойств

внешней окружающей среды, оказывающих влияние на работоспособность

ТУ. К ним относятся чрезмерно высокая или низкая окружающая темпера-

тура, осадки, высокая влажность воздуха, низкое давление, наличие в воз-

духе взвешенной пыли, аномальные электромагнитные проявления окру-

жающей среды.

Внутренние физические факторы представляют собой те явления и

процессы, которые, развиваясь в ТУ во время их функционирования, од-

новременно влияют на состояние и рабочие режимы этих же ТУ и их со-

ставных элементов, а также ТУ, взаимосвязанных с ними. Сюда можно от-

нести вибрацию, внутренний перегрев и другие факторы.

Под влиянием длительного воздействия на ТУ физических факторов

происходит износ элементов (деталей сложных ТУ) и старение материа-

лов, из которых они выполнены.

Износ характеризуется постепенным изменением формы и размера

отдельных элементов системы, что приводит к ухудшению их работы.

Старение характеризуется постепенным структурным изменением

материалов, из которых изготовлены ТУ. Это, в свою очередь, ведет к

ухудшению их рабочих характеристик.

Физико-химические и химические причины возникновения отказов

К физико-химическим факторам, снижающим надежность работы ТУ,

относятся такие процессы внешней среды и процессы, происходящие в са-

Page 13: Ермаков - Основы надежности информационных систем

13

мих ТУ, в результате физического действия которых происходят химиче-

ские реакции или изменение физических свойств ТУ. К таким явлениям

можно отнести вредные химические примеси в атмосфере, действие лучи-

стой энергии, электроэрозию, чрезмерное выделение тепла, например, в

результате короткого замыкания.

К химическим причинам относятся химические реакции, приводящие

к изменению молекулярного состава материалов. К наиболее распростра-

ненной реакции такого типа относится окисление железа. Появляющиеся в

результате этого процесса окислы имеют отличные от первоначальных ма-

териалов физико-химические свойства. Другой распространенной медлен-

нотекущей химической реакцией является полимеризация изоляционных

материалов в электрических проводах. Полимеризация ведет к отвердева-

нию изоляции, к потере упругости и изолирующих свойств и дальнейшему

разрушению. Вследствие этого происходят короткие замыкания, приводя-

щие к большим разрушениям и даже человеческим жертвам.

Биологические факторы, влияющие на ухудшение эксплуатационных

свойств технических объектов

К биологическим факторам относятся воздействие животных и расти-

тельных организмов, наносящие вред ТУ. Наиболее часто биологические

факторы проявляются при хранении ТУ. В этот период, если не соблюдены

необходимые при хранении профилактические меры, то хранящееся уст-

ройство может подвергнуться воздействию термитов, уничтожающих изо-

ляционные материалы, каучуки, полимеры. Аналогичным образом воздей-

ствуют на ТУ и мелкие грызуны. Большой вред для электрических и элек-

тронных систем могут принести тараканы. Они становятся причиной ко-

роткого замыкания в электрических и электронных схемах.

Многие ТУ в холодное время является источником тепла. Поэтому

мелкие животные через различные отверстия могут проникнуть внутрь и

Page 14: Ермаков - Основы надежности информационных систем

14

стать причиной замыканий, несрабатывания, поломок и разрушений от-

дельных деталей.

Эксплуатационные факторы возникновения отказов

К эксплуатационным факторам относятся технические возможности

самих ТУ, технологического оборудования для профилактических работ, а

также объективные и субъективные возможности специалистов, задейст-

вованных в процессе эксплуатации ТУ. К причинам, по которым могут

возникать отказы в процессе эксплуатации и проведения профилактиче-

ских работ, чаще всего относят:

- несоблюдение требований эксплуатации, чрезмерно высокая интенсив-

ность эксплуатации;

- невыполнение требуемого объема ремонта;

- отсутствие технологического оборудования и приспособлений;

- слабое крепление деталей;

- постановка нестандартных деталей;

- отклонение от установленных размеров;

- отступление от технологических требований;

- неудовлетворительный осмотр;

- личные качества исполнителей.

Первый из перечисленных факторов определяется неудовлетвори-

тельной работой специалистов или созданием сложных условий эксплуа-

тации, как климатических, так и режимных.

Невыполнение требуемого объема ремонта большого перечня типов

ТУ является причиной более четверти отказов от их общего количества, то

есть возникают такие отказы достаточно часто.

На выявление скрытых дефектов тратится много времени, отведенно-

го для выполнения ремонтных операций. Поэтому трудно переоценить

значение средств технической диагностики. Отсутствие необходимого

оборудования приводят к низкой распознаваемости скрытых дефектов.

Page 15: Ермаков - Основы надежности информационных систем

15

Дефекты, возникающие из-за слабого крепления деталей и узлов, ха-

рактерны для многих типов ТУ. Отказы, возникающие по этой причине,

происходят, во-первых – из-за отсутствия или не применения необходи-

мых средств контроля и, во-вторых – из-за несоблюдения правил сборки.

Нестандартными деталями называются такие, которые производятся

не предприятиями-изготовителями ТУ, а эксплуатирующими организа-

циями. В основном это детали механических узлов и агрегатов. Их изго-

товление характеризуется большим разнообразием технологических опе-

раций и непостоянством исполнителей. Вследствие этого на ТУ могут

быть установлены детали низкого качества. Они могут отказывать сами и

быть причиной отказа других деталей.

Дефекты по отклонению от установленных размеров возникают в

местах соединения проводов, деталей и узлов между собой, в их располо-

жении по отношению друг к другу и корпусу ТУ. Основными причинами

возникновения отказов из-за этих дефектов при исполнении монтажных

работ являются несоблюдения исполнителями конструктивных размеров,

определяющих взаимное расположение деталей, а также изменение этих

размеров в процессе эксплуатации из-за ослабления вследствие агрессив-

ных воздействий внешней среды.

Отступление от технологических требований проявляются прежде

всего в том, что на ремонтируемое ТУ, вопреки требованиям нормотивно-

технической и ремонтной документации, устанавливается некондиционное

оборудование.

При неудовлетворительном осмотре в период профилактических ра-

бот не выявляются скрытые дефекты, что приводит к отказам оборудова-

ния в период эксплуатации ТУ.

Личные качества и низкие технологические знания исполнителей яв-

ляются не только субъективными факторами, но и факторами, носящими

социальную окраску. Вопросы воспитания специалистов, соблюдения пра-

Page 16: Ермаков - Основы надежности информационных систем

16

вил трудовой дисциплины, технической учебы и повышения квалифика-

ции, вопросы самоконтроля и контроля выполняемых работ являются

очень важными в деле профилактики дефектов и возникающих по их при-

чинам отказов по вине человеческого фактора.

Уменьшение влияния названных и ряда других факторов является од-

ной из основ работа по поддержанию надежности работы ТУ.

1.5 Факторы, определяющие надежность информационных систем

Для построения надежных ИС можно использовать различные виды

обеспечения:

- экономическое,

- временное,

- организационное,

- структурное,

- технологическое,

- эксплуатационное,

- социальное,

- эргатическое,

- алгоритмическое,

- синтаксическое,

- семантическое.

Обеспечение можно характеризовать как совокупность факторов, спо-

собствующих достижению поставленной цели. Организационное, эконо-

мическое и временное обеспечение, обуславливаемое необходимостью ма-

териальных и временных затрат, используется для поддержания достовер-

ности результатов работы ИС. Оно включают в себя:

- правовые и методические аспекты функционирования ИС;

- нормативы достоверности информации по функциональным подсисте-

мам и этапам преобразования информации;

Page 17: Ермаков - Основы надежности информационных систем

17

- методики выбора и обоснования оптимальных структур, процессов и

процедур преобразования информации.

Назначение структурного обеспечения состоит в повышении надеж-

ности функционирования технических комплексов и эргатических звеньев,

а также ИС в целом. Здесь обосновывается рациональное построение

структуры ИС, зависящее от выбора структуры технологического процесса

преобразования информации, обоснования взаимосвязи между отдельными

звеньями системы, резервирования функциональных звеньев системы и

использования устройств, осуществляющих процедуры контроля.

Технологическое обеспечение предназначено для повышения надеж-

ности работы ТУ и технологических комплексов, входящих в состав сис-

темы. Это обеспечение включает в себя выбор схемных и конструктивных

решений отдельных ТУ, технологий и протоколов реализации информаци-

онных процессов.

Эксплуатационное обеспечение связано с выбором режимов работы

устройств, технологий обслуживания, профилактик и ремонтов.

К социальному обеспечению относятся такие факторы, как создание

здоровой психологической обстановки в коллективе, повышение ответст-

венности за выполненную работу, повышение квалификации специали-

стов, повышение моральной и материальной заинтересованности в пра-

вильности выполнения работы. Особо важно обеспечить соответствие це-

лей субъекта с целями управления: лишь когда работник заинтересован в

получении объективных, достоверных данных, они могут быть получены.

Эргатическое обеспечение включает в себя комплекс факторов, свя-

занных с рациональной организацией работы человека в системе. Это пра-

вильное расположение функций между людьми и техническими средства-

ми, обязанность норм и стандартов работы, оптимальность интенсивности

и ритмичности, построение рабочих мест в соответствии с требованиями

эргономики.

Page 18: Ермаков - Основы надежности информационных систем

18

Алгоритмическое обеспечение применяется для обеспечения высокого

качества и безошибочности алгоритмов и программ преобразования ин-

формации и для реализации контроля достоверности информации.

Информационное синтаксическое и семантическое обеспечение за-

ключается во введении специальной информационной избыточности, из-

быточности данных и смысловой избыточности, обуславливающих воз-

можность проведения контроля достоверности информации. Подробнее об

избыточности речь пойдет в последующих главах.

1.6 Влияние человека-оператора на функционирование информацион-

ных систем

Личные качества и низкие технологические знания исполнителей яв-

ляются не только субъективными факторами, но и факторами, носящими

социальную окраску. Вопросы воспитания специалистов, соблюдения пра-

вил трудовой дисциплины, технической учебы и повышения квалифика-

ции, вопросы самоконтроля и контроля выполняемых работ являются

очень важными в деле профилактики дефектов и возникающих по их при-

чинам отказов по вине человеческого фактора.

Ошибки обслуживающего персонала, выход ИС из штатного режима

эксплуатации в силу случайных или преднамеренных действий пользова-

телей, или обслуживающего персонала – операторов (превышение расчет-

ного числа запросов, чрезмерный объем обрабатываемой информации и

другие неоправданные действия), невозможность или нежелание обслужи-

вающего персонала выполнять свои функции приводит к чрезвычайно

серьезным последствиям. Это могут быть длительный простой в работе,

ИС, искажение обрабатываемой информации и получение неверных ре-

зультатов, потеря информации, сбои в работе программ и оборудования,

отказы оборудования.

Page 19: Ермаков - Основы надежности информационных систем

19

Таким образом, поддержание высокой надежности работы ИС в целом

является важной и сложной инженерно-технической и социально-

организационной задачей.

Вопросы для самоконтроля

1. Что такое «надежность» ТУ?

2. Что такое «эффективность» ТУ?

3. Какое состояние ТУ называется работоспособным?

4. Что такое «отказ»?

5. Дать характеристику отказов ТУ.

6. Факторы, влияющие на надежность информационных систем.

7. Какое влияние оказывает человек на надежность информационных

систем?

Page 20: Ермаков - Основы надежности информационных систем

20

Глава 2

Основные показатели надежности невосстанавливаемых

технических устройств

2.1. Составляющие надежности

В соответствии с определением, надежность является сложным свой-

ством. Именно благодаря надежности, ТУ выполняет определенные функ-

ции, делая это в течение некоторого срока, с заданным качеством. Это

происходит вследствие наличия таких составляющих надежности, как без-

отказность, ремонтопригодность, долговечность и сохраняемость.

Безотказность – это способность ТУ работать без отказа в тече-

ние некоторого времени.

Долговечность – свойство ТУ сохранять работоспособность с необ-

ходимыми перерывами для технического обслуживания и ремонта до пре-

дельного состояния, оговоренного в технической документации.

Сохраняемость – это свойство ТУ сохранять работоспособность

при хранении до начала эксплуатации, в перерывах между периодами экс-

плуатации и после транспортировки.

Ремонтопригодность – свойство конструктивной приспособленно-

сти ТУ к выявлению, устранению и предупреждению в них неисправно-

стей.

Эта составляющая разделяет все ТУ на восстанавливаемые (ремон-

тируемые) и невосстанавливаемые (неремонтируемые). К последним отно-

сятся такие ТУ, ремонт которых в случае отказа не предусмотрен и не про-

изводится. Они составляют достаточно большую часть технических уст-

ройств, так как в большинстве случаев являются элементами сложных тех-

нических систем.

Page 21: Ермаков - Основы надежности информационных систем

21

Названные свойства относятся так называемым единичным показа-

телям надежности, объединенным в комплексное понятие собственно на-

дежности.

Рассмотрим эти и другие показатели, характеризующие надежную

работу ТУ, относящимся к неремонтируемым, так как эти показатели носят

ключевой характер в теории надежности.

2.2. Простейший поток отказов

ТУ – это наиболее общее название технических объектов. Они могут

быть сложными и простыми. В теории надежности различают понятие сис-

тема и элемент.

Элемент - составная часть сложного ТУ, которая при расчете и ис-

следовании надежности не подлежит расчленению. Система – совокупно-

сти совместно действующих элементов, предназначенная для выполнения

определенных заданных функций.

Тогда отказ системы может наступить при отказе одного элемента

этой системы.

В теории надежности, наряду с другими, рассматривают простейший

поток отказов, который соответствует простейшему потоку случайных со-

бытий. Простейший поток обладает следующими свойствами:

- стационарность,

- ординарность,

- отсутствие последовательности.

Стационарность определяется тем, что вероятность появления то-

го или иного числа отказов на некотором временном интервале эксплуа-

тации t зависит только от длины этого интервала, но не зависит от по-

ложения этого интервала на оси времени.

Иными словами, предполагается, что отказы распределены на оси

времени в процессе эксплуатации с одинаковой средней плотностью λ .

Page 22: Ермаков - Основы надежности информационных систем

22

Ординарность определяется тем, что вероятность возникновения

двух или более отказов системы в некоторый момент времени t пренеб-

режимо мала по сравнению с вероятностью одного отказа.

Это означает, практически, что одновременно в системе отказа более

двух элементов быть не может.

Отсутствие последствия определяется тем, что наступление отка-

за в момент it не зависит от того, сколько отказов и в какие моменты

времени они возникали до момента it .

Поскольку простейший поток отказов соответствует простейшему по-

току событий, то он подчиняется закону Пуассона. Закон Пуассона гласит:

Если случайная величина ξ в простейшем потоке событий за время

τ некоторое целое положительное значение K , то эта величина распре-

делена по закону Пуассона:

.!

)( aK

eKaKp −==ξ

Статистический смысл параметра a заключается в том, что a – это

среднее число событий, наступающих в простейшем потоке за время τ :

.τλ=a

С точки зрения надежности случайная величина ξ представляет со-

бой число отказов ТУ, а число )( Kp =ξ представляет собой вероятность

появления ровно K отказов ТУ за время τ . Представляет интерес вероят-

ность отсутствия отказов или вероятность работы ТУ без отказов в течение

времени τ :

.!0

)0(0

λτξ −−− ==== eeeap aa

Тогда вероятность противоположного события, заключающегося в

том, что за время τ произойдет хотя бы один отказ, будет равна

Page 23: Ермаков - Основы надежности информационных систем

23

λτξξ −−==−=≥ epp 1)0(1)1( .

Особенность закона Пуассона заключается в том, что математическое

ожидание и дисперсия равны между собой и равны величине a :

.aDM == ξξ

2.3. Вероятность безотказной работы и вероятность отказов

Надежность как качественная характеристика всегда принималась во

внимание при решении различных вопросов эксплуатации и технического

обслуживания. Количественное определение надежности появилось с воз-

никновением теории надежности. Математической платформой теории на-

дежности являются теория вероятностей и математическая статистика.

Действительно, отказы в ТУ происходят случайным образом в неожидан-

ные моменты времени. Это характерно даже для множества однотипных

устройств, изготовленных на одном предприятии и поставленных на экс-

плуатацию в одно и то же время. Несмотря на единый проект, одинако-

вость технологии производства – каждый из них имеет индивидуальную

способность сохранять свои первоначальные качества. Первоначально ка-

жется что никакой закономерности в появлении отказов нет. Тем не менее,

такая закономерность существует. Проявляется она тогда, когда ведется

наблюдение не за одним, а за многими ТУ, находящимися в эксплуатации.

В качестве основной количественной меры надежности ТУ, характе-

ризующей закономерность появления отказов во времени, принята веро-

ятность безотказной работы.

Вероятность безотказной работы (ВБР) – это вероятность того,

что за определенное время работы ТУ и в заданных условиях эксплуата-

ции отказа не происходит.

Поскольку возникновение отказа является случайным событием, то и

время его возникновения ot – также событие случайное. Поэтому ВБР:

Page 24: Ермаков - Основы надежности информационных систем

24

)()( ttptp o ≥= ,

где t – заданное время работы.

Вероятность появления отказа – это вероятность противополож-

ного события:

)()( ttptq o <= .

Но событие отказа и событие безотказности – суть противоположные

события. Поэтому, в соответствии со свойством вероятностей противопо-

ложных событий, можно записать

1)()( =+ tqtp .

На практике определяют оценки этих вероятностей. Пусть N – это

общее количество однотипных ТУ, эксплуатируемых в течение времени t .

За это время )(tN ТУ работало безотказно, а )(tn – отказало. Таким обра-

зом:

)()( tntNN += ,

то есть через время t общее количество как исправных, так и отказавших

ТУ равно первоначальному. Статистическая вероятность безотказной ра-

боты определяется выражением

NtNtp )()(* = ,

а частота отказов

Ntntq )()(* = .

Найдем сумму этих частот:

1)()()()()()( ** ==+

=+=+NN

NtntN

Ntn

NtNtqtp ,

что соответствует теоретическим выводам.

Page 25: Ермаков - Основы надежности информационных систем

25

Для перехода от )(* tp и )(* tq к )(tp и )(tq нужно взять предел от-

ношений частот:

NtNtp

N

)(l)( im∞→

= ,

.)()( lim Ntntq

N ∞→=

Так как ∞→N достичь невозможно, то под этой декларацией на

практике можно подразумевать весь парк поставленных на эксплуатацию

однотипных ТУ.

Очевидно, что с течением времени общее количество отказов в ТУ

увеличивается. Следовательно, увеличиваются и )(tq , а, значит, уменьша-

ется )(tp . Кривые, определяющие характер этих изменений, имеют вид:

Рис. 1. Характер изменения кривых p(t) и q(t)

На практике часто необходимо определить надежность ТУ в течение

некоторого интервала времени от at до bt (например, в течение периода

работы этого устройства) при условии, что оно уже находилось в эксплуа-

тации некоторое время bt . ВБР ТУ за время )( ab tt − при условии, что оно

безотказно проработало в течение at часов, определяется условной веро-

ятностью

1

p(t), q(t)

0 t

p(t)

q(t)

Page 26: Ермаков - Основы надежности информационных систем

26

)()( boa

ab ttpt

ttp ≥=−

.

Эта условная вероятность численно равна вероятности )(a

b

ttp . Дейст-

вительно, вероятность того, что объект не отказал в течение времени

)( ab tt − при условии того, что он безотказно проработал at часов, скла-

дывается из ВБР в течение at часов и ВБР в течение часов от at до bt . Со-

гласно понятию условной вероятности,

)()()()(

a

ab

a

b

a

ab

tpttp

ttp

tttp ==−

.

Но ),( ab ttp численно равна вероятности того, что ТУ безотказно прора-

ботает bt часов:

)(),( bab tpttp = .

Тогда

)()()(

a

b

a

b

tPtp

ttp = .

В частном представлении эта формула примет вид

)()()(*

a

b

a

b

tNtN

ttp = ,

так как

NtN

tp aa

)()(* = ;

NtNtp b

b)()(* = .

Используя величину вероятности безотказной работы )(tp , можно

оценить среднее количество элементов или устройств ИС (например, сети,

ЭВМ или ее периферии) )(tn , которые могут отказать за интервал времени

t∆ при известной наработке t :

Page 27: Ермаков - Основы надежности информационных систем

27

)()()( ttpNtpNtn ∆+−= ,

где N – число исправных элементов ИС в начале ее эксплуатации.

2.4. Интенсивность отказов

С течением времени ТУ становятся менее надежными и в процессе

эксплуатации отказывают. Если весь период эксплуатации разделить на

равные промежутки времени ),1( kiti

=∆ , то в любой из этих промежут-

ков отказывают in∆ однотипных объектов.

Числовой характеристикой, которая путем учета отказавших одно-

типных объектов позволила бы определить уровень надежности этих объ-

ектов в любой момент времени, является интенсивность отказов. Она оп-

ределяется количеством отказов in∆ в интервале it∆ , отнесенных к ис-

правно действующим однотипным ТУ в данном интервале:

ii

ii tN

n∆

∆=*λ ,

где iN – среднее число исправно действующих ТУ в интервале it∆ . Ин-

декс «i» представляет собой указатель интервала, для которого рассчиты-

вается интенсивность отказа. Для расчета по приведенной формуле необ-

ходимо знать величины ii Nn ,∆ и it∆ . Обычно из условия задачи из-

вестны m количество отказавших ТУ in∆ и величина интервала времени

it∆ . Величина iN по своей сути представляет собой математическое

ожидание числа безотказно проработавших ТУ в течение i-го интервала

времени. Наиболее очевидной статистической оценкой этой величины

могло бы стать среднеарифметическое

Page 28: Ермаков - Основы надежности информационных систем

28

i

nNN

m

ii

i

∑=

∆−= 1

)(.

Однако существует оценка, которая с большей точностью соответствует

значению математического ожидания:

.2

1

1∑−

=

∆−∆−=

i

k

iki

nnNN

Переходя от дискретного времени t∆ к непрерывному ( 0→∆t ), по-

лучим

dttdn

tNt )(

)(1)( =λ .

Введем понятие плотности вероятности отказа в однотипных ТУ.

Если в знаменатели выражения для *iλ величину iN заменить на N , по-

лучим

i

ii tN

nf

∆∆

=* ,

или, при 0→∆t ,

dttdn

Ntf )(1)( = .

Отсюда следует

)()()(

)()(

tptftf

tNNt ==λ ,

или

)()()( tpttf λ= .

Интенсивность отказов имеет характерные изменения в процессе экс-

плуатации. Характерными являются 3 участка, получившие название пе-

риодов приработки (I), нормальной эксплуатации (II) и период износа и

старения (III). В первом периоде проявляются конструктивно производст-

Page 29: Ермаков - Основы надежности информационных систем

29

венные недостатки, во II периоде отказы происходят в основном из-за на-

рушений или изменений условий эксплуатации. В III периоде отказы оп-

ределяются причинами, скрытыми в самом названии этого периода.

2.5. Среднее время безотказной работы

Часто в качестве характеристики надежности используют среднее

время безотказной работы.

Обозначим эту величину буквой T . Тогда некоторое количество из

множества однотипных ТУ, находящихся в эксплуатации, проработает

безотказно какое-то время Tt ≥ , причем каждый из ТУ – свое, остальные

же откажут раньше, чем наступит время T . Отсюда время T можно рас-

сматривать как математическое ожидание отрезков времени безотказной

работы этих однотипных ТУ.

)(tλ

Рис. 2. Кривая интенсивности отказов

Среднее время безотказной работы является математическим ожи-

данием случайной величины – времени безотказной работы невосстанав-

ливаемых ТУ.

0 t I II III

Page 30: Ермаков - Основы надежности информационных систем

30

В соответствие с определением получается

∫∞

=0

)( dtttfT .

Здесь )(tf – плотность вероятности времени отказов однотипных

ТУ.

Статистическим аналогом среднего времени безотказной работы яв-

ляется среднее статистическое время безотказной работы:

n

tT

n

jj∑

== 1* ,

где jt – время появления отказа j -го ТУ; n – количество отказов в раз-

личные j -е моменты времени.

2.6. Аналитические зависимости между основными показателями

надежности

Вероятность отказов )(tq определяется выражением

)()( ttptq o <= .

С другой стороны, выражение )( ttp o < по определению функции рас-

пределения есть не что иное как функция распределения времени до отка-

за:

)()( tFtq = .

Тогда

dttdq

dttdFtf )()()( == .

Учитывая, что

)(1)( tqtp −= ,

получим

Page 31: Ермаков - Основы надежности информационных систем

31

dttdptf )()( −= ,

Отсюда следует

)()()( tptqtf ′−=′= .

Подставим значение плотности вероятности отказов в выражение интен-

сивности отказов:

)()()(

tptft =λ .

В результате получится дифференциальное уравнение относительно веро-

ятности безотказной работы:

)()()(

tptpt

′−=λ .

Эта важная зависимость широко используется в теории надежности. Она

является обобщенным законом надежности невосстанавливаемых ТУ в

дифференциальной форме. Результатом интегрирования этого уравнения

будет

∫ =−t

tpdtt0

)(ln)(λ ,

откуда

∫−=

tdtt

etp 0)(

)(λ

.

Полученное выражение представляет собой обобщенный закон надежно-

сти в интегральной форме. Подставляя этот результат в выражение

)()()( tpttf λ= , получим

∫−

=t

dttettf 0

)()()(

λλ .

Проведем аналогичные преобразования для среднего времени безот-

казной работы:

Page 32: Ермаков - Основы надежности информационных систем

32

)()()(00 0

ttdpdtdt

tdptdtttfT ∫∫ ∫∞∞ ∞

−=−== .

Интегрируем полученное выражение по частям

∫∫∞∞∞

+−=−0

00

)()()( dttpttpttdp .

Левое слагаемое 0)( 0 =− ∞ttp , так как 0)( =∞p . Поэтому

∫∞

=0

)( dttpT ,

или

∫∞ −∫

=

0

)(0

dtt

eTλ

.

Это выражение связывает среднюю наработку до отказа с вероятно-

стью безотказной работы. Отсюда следует, что средняя наработка до отка-

за равна площади под кривой вероятности безопасной работы. Необходимо

учитывать, что приведенные показатели надежности относятся к работо-

способным объектам, включенным в работу в нулевой момент времени.

Рассмотрим более подробно период нормальной эксплуатации

(рис. 2). В этот период в основном имеют место внезапные отказы. Они,

имея случайный характер происхождения, подчиняются закону распреде-

ления, вытекающему из условий постоянства интенсивности отказов. По-

этому для этого периода можно считать, что интенсивность отказов явля-

ется практически постоянной величиной, то есть λλ == constt)( . В

связи с этим основные зависимости примут вид: tetp λ−=)( ,

tetptq λ−−=−= 1)(1)( ,

tetf λλ −=)( ,

Page 33: Ермаков - Основы надежности информационных систем

33

.1)(100 λ

λλ

λλ =∫−=∫=∞ −∞ − tdedteT tt

Полученное выражение для )(tp называют экспоненциальным законом

надежности. Само это выражение, а также выражение для определения

)(tq соответствуют аналогичным вероятностям, полученным в п. 2.2 на-

стоящей главы. Это означает, что в период нормальной эксплуатации по-

ток отказов является простейшим.

Принимая во внимание последнее выражение, получим

.)( Tt

etp−

=

При Tt = вероятность безотказной работы будет равна

≈== −

eetp 1)( 1 0,37.

Это говорит о том, что для обеспечения высокого уровня надежности не-

восстанавливаемых ТУ следует выбирать срок их службы намного мень-

ший, чем среднее время безотказной работы. Так, например, если =Tt

0,1,

то =)(tp 0,9, или сокращение срока службы в 10 раз ведет к увеличению

вероятности безотказной работы приблизительно в 2,4 раза.

Если срок службы ТУ во много раз меньше среднего времени безот-

казной работы, то характеристики надежности удобно рассчитывать по уп-

рощенным формулам. Разлагая выражение

Tt

etp−

=)(

в ряд и принимая во внимание только первый член этого ряда, получим:

.)(

,11)(

tTttq

tTttp

λ

λ

=≈

−=−≈

Page 34: Ермаков - Основы надежности информационных систем

34

Эти формулы дают хорошее приближение при 1,0<tλ .

При экспоненциальном законе распределения вероятность )(a

bttp мо-

жет быть переписана в следующем виде :

)()( ab

b

a ttt

t

a

b eee

ttp −−

== λλ

λ

,

где )( ab tte −−λ есть безусловная вероятность безотказной работы ТУ в ин-

тервале времени )( ab tt − .

Таким образом, в период нормальной эксплуатации вероятность без-

отказной работы в течение некоторого времени совершенно не зависит от

величины наработки данного ТУ, предшествующего отрезку этого време-

ни.

Пример. Пусть интенсивность отказа блока питания ЭВМ в период нормальной

эксплуатации является практически постоянной величиной и равна 0,021х10 -3. Пользу-

ясь экспоненциальным законом распределения, определить для времени наработки

блока t = 500 час вероятность безотказной работы, плотность вероятности (частоту) от-

казов и среднее время безотказной работы.

Согласно теории, получим:

9896,050010021,0)(3

500 =⋅⋅−=−

ep ;

.47600310021,0

1;31002078,0500310021,0310021,0)500(

часT

ef

=−⋅

=

−⋅=⋅−⋅−⋅−⋅=

2.7. Долговечность

В п. 21 было дано определение таким понятиям как долговечность,

сохраняемость и безотказность, а также были рассмотрены основные пока-

затели надежности с точки зрения безотказности. Рассмотрим более под-

робно две первые характеристики.

Page 35: Ермаков - Основы надежности информационных систем

35

Время нормального функционирования всякого ТУ ограничено неиз-

бежными изменениями свойств материалов и деталей, из которых они из-

готовлены. Именно поэтому долговечность определяется сроком службы

и ресурсом.

Срок службы определяется календарной продолжительностью экс-

плуатации ТУ от ее начала или возобновления после ремонта до предель-

ного состояния.

Различаются:

- средний срок службы или математическое ожидание срока службы:

∫∞

=0

.. )( dttftT слслiслср ,

где слit – срок службы i -го ТУ;

)( слtf – плотность распределения срока службы;

- средний срок службы до списания спслсрT .. – это средний срок службы от

начала эксплуатации ТУ до его списания;

- гамма-процентный срок службы γ.слT – это срок службы, в течение кото-

рого объект не достигает предельного состояния с заданной вероятностью

γ процентов:

100ln1

λγ −=слT .

Кроме срока службы, долговечность ТУ характеризуется его ресур-

сом.

Ресурсом называется наработка ТУ от начала эксплуатации или же

ее возобновления после ремонта до наступления предельного состояния.

В отличие от определения понятия срок службы, понятие ресурс опе-

рирует не календарной продолжительностью, а общей наработкой ТУ. Эта

наработка в общем случае является величиной случайной. Поэтому, наряду

Page 36: Ермаков - Основы надежности информационных систем

36

с понятиями назначенного ресурса, долговечность оценивают средним ре-

сурсом, гамма-процентным ресурсом и другими видами ресурсов.

0 t

Работа ПР Работа ПР Работа ПР Работа tпс

t1 t2 . . . tn-1 tn

НА РА БОТ КА Рис. 3. Календарный срок службы и наработка ТУ:

ПР – профилактика; tпс – время наступления предельного состояния

Назначенный ресурс нR – это суммарная наработка ТУ, при дости-

жении которой эксплуатация должна быть прекращена, не зависимо от

его состояния.

Средний ресурс срR – математическое ожидание ресурса.

∫∞

=0

)( dtrrfRср ,

где r – ресурс некоторого ТУ;

)(rf – плотность вероятности величины r .

Гамма-процентный ресурс γR – наработка, в течение которой ТУ не

достигает предельного состояния с заданной вероятностью γ процен-

тов.

Гарантийный ресурс гR является понятием юридическим. Этот ре-

сурс определяет, когда предприятие-изготовитель принимает претензии по

Календарный срок службы

Page 37: Ермаков - Основы надежности информационных систем

37

качеству выпущенных изделий. Гарантийный ресурс совпадает с периодом

приработки.

Вопросы для самоконтроля

1. Какие показатели относятся к составляющим надежности?

2. Какой поток называется простейшим?

3. Свойства простейшего потока и их характеристики.

4. Среднее число событий, наступающих в простейшем потоке.

5. Что такое вероятность безотказной работы?

6. Как определить вероятность безотказной работы на некотором ин-

тервале времени?

7. Что такое вероятность отказов?

8. Что такое интенсивность отказов?

9. Плотность вероятности отказов и ее связь с вероятностью отказов.

10. Какие характерные участки имеет кривая интенсивности отказов не-

восстанавливаемых технических устройств?

11. Что такое и как определяется среднее время безотказной работы?

12. Что такое среднее статистическое время безотказной работы?

13. Какова зависимость между )(tf и )(tp , )(tp и )(tλ , )(tf и

)(tλ , T и )(tλ ?

14. Как зависят )(tp , )(tf и T от )(tλ при constt == λλ )( ?

15. Основные расчетные соотношения между показателями надежности

для случая, когда Tt << .

16. Что такое календарный срок службы?

17. Что такое ресурс и чем он отличается от календарного срока служ-

бы?

18. Виды ресурсов.

Page 38: Ермаков - Основы надежности информационных систем

38

Глава 3

Надежность программного обеспечения

3.1. Основные понятия

Решение любой задачи, выполнение любой функции, возложенной на

ЭВМ, работающей в сети или локально, возможно при взаимодействии ап-

паратных и программных средств. Поэтому при анализе надежности вы-

полнения ЭВМ заданных функций следует рассматривать единый ком-

плекс аппаратных и программных средств.

По аналогии с терминами, принятыми для обозначения показателей

надежности ТУ, под надежностью программного обеспечения (ПО) пони-

мается свойство этого обеспечения выполнять заданные функции, сохра-

няя свои характеристики в установленных пределах при определенных ус-

ловиях эксплуатации.

Надежность ПО определяется его безотказностью и восстанавливае-

мостью. Безотказность ПО – это свойство сохранять работоспособ-

ность при использовании его для обработки информации в ИС. Безотказ-

ностью программного обеспечения оценивается вероятность его работы

без отказов при определенных условиях внешней среды в течение заданно-

го периода наблюдения.

В приведенном определении под отказом ПО понимается недопус-

тимое отклонение характеристик функционирования этого обеспечения

от предъявляемых требований. Определенные условия внешней среды –

это совокупность входных данных и состояние самой ИС. Заданный пери-

од наблюдения соответствует времени, необходимому для выполнения на

ЭВМ решаемой задачи.

Безотказность ПО может характеризоваться средним временем воз-

никновения отказов при функционировании программы. При этом предпо-

Page 39: Ермаков - Основы надежности информационных систем

39

лагается, что аппаратные средства ЭВМ находятся в исправном состоянии.

С точки зрения надежности, принципиальное отличие ПО от аппаратных

средств состоит в том, что программы не изнашиваются и их выход из

строя из-за поломки невозможен. Следовательно, характеристики функ-

ционирования ПО зависят только от его качества, предопределяемого про-

цессом разработки. Это означает, что безотказность ПО определяется его

корректностью и зависит от наличия в нем ошибок, внесенных на этапе его

создания. Кроме того, проявление ошибок ПО связано еще и с тем, что в

некоторые моменты времени на обработку могут поступать ранее не

встречавшиеся совокупности данных, которые программа не в состоянии

корректно обработать. Поэтому входные данные в определенной мере

влияют на функционирование ПО.

В ряде случаев говорят об устойчивости функционирования ПО. Под

этим термином понимается способность ПО ограничивать последствия

собственных ошибок и неблагоприятных воздействий внешней среды или

противостоять им. Устойчивость ПО обычно обеспечивается с помощью

введения различных форм избыточности, позволяющих иметь дублирую-

щие модули программ, альтернативные программы для одних и тех же за-

дач, осуществлять контроль за процессом исполнения программ.

3.2. Основные причины отказов программного обеспечения

Основными причинами, вызывающими нарушения нормального

функционирования ПО, являются:

- ошибки, скрытые в самой программе;

- искажение входной информации;

- неверные действия пользователя;

- неисправность аппаратных средств ИС, на которой реализуется вычис-

лительный процесс.

Page 40: Ермаков - Основы надежности информационных систем

40

Ошибки, скрытые в программе. При разработке сложного ПО воз-

можно возникновение ошибок, которые не всегда удается обнаружить и

ликвидировать в процессе отладки. В силу этого в программах остается

некоторое количество скрытых ошибок. Они являются причиной неверно-

го функционирования этих программ. Среди ошибок подобного рода мож-

но выделить следующие характерные группы.

Ошибки вычислений. Ошибки этой группы связаны с некорректной за-

писью или программированием математических выражений, а также не-

верное преобразование типов переменных. Вследствие этого получаются

неправильные результаты.

Логические ошибки. Эта группа ошибок является причиной искажения

алгоритма решения задачи. К ошибкам подобного рода можно отнести не-

верную передачу управления, неверное задание диапазона изменения па-

раметра цикла, неверное условие и другие ошибки.

Ошибки ввода-вывода. Эти ошибки связаны с неправильным управле-

нием ввода-вывода, формированием выходных записей, определением

размера записей и другими неправильно свершенными действиями.

Ошибки манипулирования данными. К числу таких ошибок относятся:

неверное определение числа элементов данных; неверные начальные зна-

чения, присвоенные данным; неверное указание длины операнда или име-

ни переменной и другие ошибки.

Ошибки совместимости связаны с отсутствием совместимости разра-

батываемого или применяемого ПО с операционной системой или другими

прикладными программами.

Ошибки сопряжений. группа этих ошибок вызывает неверное взаимо-

действие ПО с другими программами или подпрограммами, с системными

программами, устройствами ЭВМ или входными данными.

Искажение входной информации. Указанная причина вызывает нару-

шение функционирования ПО, когда входные данные не попадают в до-

Page 41: Ермаков - Основы надежности информационных систем

41

пустимую область значения переменных. В этом случае возникает несоот-

ветствие между исходной информацией и возможностями программы.

Неверные действия пользователя связаны с неправильной интерпре-

тацией сообщений, с неправильными действиями пользователя при работе

в диалоговом режиме. Часто эти ошибки являются следствием некачест-

венной программной документацией.

Неисправность аппаратных средств ИС. Эти неисправности оказы-

вают определенное влияние на характеристики надежности ПО. Появление

отказов или сбои в работе аппаратуры приводят к нарушению хода обра-

ботки информации и, как следствие, могут искажать как исходные данные,

так и саму программу.

Следствием появления ошибок в программе является ее отказ. По-

следствия отказов ПО можно разделить на:

- полное прекращение выполнения функций программы;

- кратковременное нарушение хода обработки информации в ИС.

Степень серьезности последствий отказов ПО оценивается соотноше-

нием между временем восстановления программы после отказа и динами-

ческими характеристиками объектов, использующих результаты работы

этой программы.

Аварийное завершение работы прикладного ПО легко идентифициру-

ется, так как операционная система выдает сообщения, содержащие ава-

рийный код. Характерными причинами появления аварийного завершения

являются ошибки при выполнении макрокоманды, неверное использова-

ние методов доступа, нарушение защиты памяти, нехватка ресурсов памя-

ти, неверное использование макрокоманды, возникновение программных

прерываний, для которых не указан обработчик, и другие причины.

Page 42: Ермаков - Основы надежности информационных систем

42

3.3. Основные показатели надежности программного обеспечения

Если рассматривать отказавшее ПО без учета его восстановления, а

также случайный характер отказов в программах, то основные показатели

надежности в этом случае не отличаются от тех, которые были рассмотре-

ны в п.п. 2.2. – 2.4. При этом характер изменения этих показателей во вре-

мени будет зависеть от модели надежности ПО.

Таким образом, основными показателями надежности ПО являются:

- вероятность безотказной работы программы )(tp , представляющая со-

бой вероятность того, что ошибки программы не проявятся в интервале

времени ),0( t ;

- вероятность отказа программы )(tq или вероятность события отказа ПО

до момента времени t ;

- интенсивность отказов программы )(tλ ;

- средняя наработка программы на отказ T , являющаяся математическим

ожиданием временного интервала между последовательными отказами.

При определении характеристик надежности ПО учитывается тот

факт, что возникающие при работе программ ошибки устраняются, коли-

чество ошибок уменьшается и, следовательно, их интенсивность понижа-

ется, а наработка на отказ программы увеличивается. В связи с такими

предположениями рассматривается несколько моделей надежности ПО:

модель с дискретно-понижающей частотой появления ошибок, модель с

дискретным увеличением наработки на отказ или ошибку ПО, экспоненци-

альная модель надежности ПО.

3.3.1. Модель с дискретно-понижающей частотой появления

ошибок ПО

В этой модели предполагается, что интенсивность отказов программы

)(tλ является постоянной величиной до обнаружения возникшей ошибки

Page 43: Ермаков - Основы надежности информационных систем

43

и, как следствие – отказа программы и ее устранения. После этого значе-

ние )(tλ уменьшается и интенсивность отказов снова становится констан-

той. В этой модели предполагается, что между )(tλ и числом оставшихся

в программе ошибок существует зависимость

iiMKt λλ =−= )()( ,

где M – неизвестное первоначальное число ошибок;

i – число обнаруженных ошибок, зависящее от времени t ;

K – некоторая константа.

Характер изменения интенсивности отказов для этой модели представлен

на рисунке 4.

)(tλ

K

t Рис. 4. Характер изменения интенсивности отказов программы от

времени наработки при модели с дискретно-понижающей частотой

появления ошибок

Плотность распределения времени обнаружения i -й ошибки it опре-

деляется соотношением

iitii etf λλ −=)( .

Значения неизвестных параметров K и M могут быть оценены на

основании последовательности наблюдения интервалов между моментами

обнаружения ошибок.

На практике условия рассмотренной модели нередко не соблюдаются,

а именно:

Page 44: Ермаков - Основы надежности информационных систем

44

- не всегда при устранении ошибки интенсивность отказов уменьшается

на одну и ту же величину K , так как разные ошибки имеют различное

влияние на ход исполнения программы;

- довольно часто возникают ситуации, при которых устранение одних

ошибок приводит к появлению новых;

- не всегда удается устранить причину ошибки и программу продолжают

использовать, так как при других исходных данных ошибка может себя

и не проявить.

3.3.2. Модель с дискретным увеличением времени наработки

на отказ

Основным допущением в этой модели является предположение о том,

что отказы и ошибки программы в начале эксплуатации возникают часто.

По мере отладки программы таких ошибок становится меньше, а время на-

работки на отказ после ликвидации очередного отказа увеличивается

(рис.5).

)1(t )2(t )3(t )1( −mt

t

)2(t∆ )3(t∆ )1( −∆ mt )(mt∆

)1(t )2(t )3(t )1( −mt mt

0 1t 2t 3t 1−mt mt

Рис. 5. Диаграмма интервалов времени наработки на отказ компьютерной программы

На диаграмме величины mm ttttt ,,,,, 1321 −K – случайные моменты

времени возникновения первого, второго, третьего и так далее – m -го от-

казов. Величины )()1()3()2()1( ,,,,, mm ttttt −K – случайные интервалы

Page 45: Ермаков - Основы надежности информационных систем

45

времени между соседними отказами программы (обозначены под первым

рядом нижних скобок диаграммы). Интервалы )()1()3()2( ,,, mm tttt ∆∆∆∆ −

также являются случайными временными интервалами.

Пусть первая ошибка, проявившаяся в результате отказа программы,

произошла в случайный момент времени 1t и была устранена. Наработка

до первого отказа и возникшей ошибки равна интервалу времени )1(t . Вто-

рая ошибка возникла в момент времени 2t . Наработка до второй ошибки

определяется интервалом )2(t . В соответствии с предположением, этот ин-

тервал больше, чем )1(t , так как после перезапуска программа проработала

время до первой ликвидированной ошибки, продолжила работу до новой,

второй ошибки. Следовательно, интервал )2(t можно представить в виде

)2()1()2( ttt ∆+= ,

где )2(t∆ – дополнение интервала )1(t до величины интервала )2(t .

Обобщая эти рассуждения до любого i -го интервала ( mi ,1= ), можно

записать

)()1()( iii ttt ∆+= − .

Случайные величины )(it∆ являются независимыми, имеют математиче-

ское ожидание ][ tM ∆ и дисперсию 2t∆σ .

Случайное время возникновения ( −i 1) ошибки it отсчитывается от

начального момента времени 00 =t . Время, необходимое на ликвидацию

ошибки, в расчет не берется. В этом случае для всех случайных моментов

времени возникновения ошибки и временных интервалов между соседни-

ми ошибками можно записать:

Page 46: Ермаков - Основы надежности информационных систем

46

.2)2()1(

;

;

;

)()1()3()2()1(

)3()2()1()2()1()1()3()2()1()3(23

2)1()1()2(12

)1(1

mmm tttmtmmtt

tttttttttttt

tttttt

tt

∆+∆++∆−+∆−+=

∆+∆++∆++=++=+=

∆++=+=

=

−L

LLLLLLLLLLLLL

Учитывая, что от момента времени 00 =t до начала момента 1t не выяв-

лено ни одной ошибки программы и в силу того, что интервал )1(t сравни-

тельно невелик, так как ошибки программы вначале ее эксплуатации про-

исходят довольно часто, можно представить интервал )1(t как )1(t∆ . Тогда,

с учетом этой замены, выражение для mt примет вид

)()1()3()2()1( 2)2()1( mmm tttmtmtmt ∆+∆++∆−+∆−+∆= −L ,

или

∑ ∑= =

∆=m

i

i

j

jm tt

1 1

)( .

Рассмотрим выражение для )(it при 1=i . Согласно ранее принятой замене

)1(t на )1(t∆ , получим

)1()1()0()1( tttt ∆=∆+= .

Действительно, интервал )0(t равен нулю, так как до начала эксплуатации

программы никаких ее отказов произойти не могло. Поэтому для любого

mi = при 1>i можно записать

∑=

∆=m

i

im tt1

)()( .

Page 47: Ермаков - Основы надежности информационных систем

47

Но )(mt – это наработка между )1( −m и m – отказами. Тогда, для любых

m , средняя наработка между )1( −m и m отказами равна математическо-

му ожиданию интервала )(mt :

∑=

∆==m

i

immср tMtMt

1

)()()( ][][ .

Но для любого i

][][ )( tMtM i ∆=∆ .

Поэтому

][][][11

)()( tmMtMtMtm

i

m

i

imср ∆=∆=∆= ∑∑

==.

Отсюда видно, что с увеличением m увеличивается и средняя наработка

между двумя отказами.

Рассмотрим среднюю наработку до возникновения m -го отказа. Она

равна математическому ожиданию от mt :

][ mсрm tMt = ∑ ∑ ∑ ∑= = = =

∆+

=∆=∆=m

i

i

j

m

i

i

j

j tMmmtMtM1 1 1 1

)( .][2

)1(][][

Как и предыдущем случае, из полученного выражения видно, что средняя

наработка до отказа возрастает с увеличением числа отказов

Оценки ][ tM ∆ и 2t∆σ получаются по данным об отказах программы в

течение периода наблюдения нt :

M ∑=

∆=∆нm

i

i

нt

mt

1

)(1][ ;

∑=

∆ ∆−∆−

=нm

i

i

нt tMt

m 1

2)(2 ][()1(

1σ ,

где нm – число отказов за интервал времени ( нt,0 ).

Page 48: Ермаков - Основы надежности информационных систем

48

3.3.3. Экспоненциальная модель надежности ПО

Основным предположением этой модели является экспоненциальный

характер изменения числа ошибок в программе во времени. Прогноз на-

дежности программы производится на основании данных, получаемых во

время ее тестирования.

Основными параметрами модели являются:

- τ – суммарное время функционирования от начала тестирования (с устра-

нением обнаруженных ошибок) до момента оценки надежности;

- M – число ошибок, имеющихся в программе перед началом тестирова-

ния;

- )(τm – конечное число исправленных ошибок;

- )(0 τm – число оставшихся ошибок.

Предполагается, что число ошибок в программе в каждый момент вре-

мени имеет пуассоновское распределение, а временной интервал между

двумя ошибками распределен по экспоненциальному закону. Параметр

этого распределения изменяется после распределения очередной ошибки.

Интенсивность отказов считается непрерывной функцией, пропорциональ-

ной числу оставшихся ошибок. С учетом введенных параметров и предпо-

ложений очевидно, что

)()(0 ττ mMm −= ,

а интенсивность ошибок

)()( 0 ττλ Cm= ,

где C – коэффициент пропорциональности, учитывающий быстродейст-

вие ЭВМ и число команд в программе.

Пусть в процессе исправления ошибок новые ошибки не появляются.

Следовательно, интенсивность исправления ошибок будет равна интен-

сивности их обнаружения:

Page 49: Ермаков - Основы надежности информационных систем

49

)()(τλ

ττ

=d

dm.

Совместное решение полученных выражений дает

CMCmd

dm=+ )()(

τττ

.

Решением этого уравнения является выражение

)]exp(1[)( ττ CMm −−= .

Будем характеризовать надежность программы после тестирования в

течение времени τ средним временем наработки на отказ:

)(1

0 τλ=T .

Следовательно,

)exp(10 τC

CMT = .

Введем величину тT0 – исходное значение среднего времени нара-

ботки на отказ перед тестированием, которое равно

CMT т

10 = .

Подставляя это значение в выражение 0T , получим

)exp(0

00m

m MTTT τ

= .

Из этого выражения видно, что среднее время наработки на отказ уве-

личивается по мере выявления и исправления ошибок.

Таким образом, аналитические модели надежности дают возможность

исследовать закономерности проявления ошибок в программе и прогнози-

ровать надежность при ее разработке и эксплуатации.

Page 50: Ермаков - Основы надежности информационных систем

50

Вопросы для самоконтроля

1. Что понимается под термином «надежность программного обеспече-

ния» (ПО)?

2. Что понимается под терминами «безотказность ПО» и «отказ ПО»?

3. Основные причины отказов ПО.

4. В чем сущность модели с дискретно-понижающей частотой появления

ошибок ПО?

5. В чем сущность экспоненциальной модели надежности ПО?

Page 51: Ермаков - Основы надежности информационных систем

51

Глава 4

Надежность невосстанавливаемых технических устройств

в процессе их эксплуатации

4.1. Характеристики надежности на различных этапах эксплуатации

В предыдущих рассуждениях мы исходили из того, что поток отказов

невосстанавливаемых ТУ подчиняется закону Пуассона. При таком допу-

щении закон распределения времени до отказа является экспоненциаль-

ным. Практика показала, что эти допущения правомерны более чем для

60% таких ТУ. Рассмотрим интенсивность отказов по периодам эксплуата-

ции (рис.6).

Рис. 6. Кривая интенсивностей отказов по периодам эксплуатации

На рисунке обозначены: прt – время окончания периода приработ-

ки; нt – время окончания периода нормальной эксплуатации; t – некото-

рый текущий момент времени; )(tпрλ – интенсивность отказов в период

приработки; λ – интенсивность отказов при нормальной эксплуатации,

)(tисλ – интенсивность постепенных отказов в период износа и старения.

прt нt

)(tλ

t1t

0

const=λ const=λ

)(tпрλ )(tисλ

Page 52: Ермаков - Основы надежности информационных систем

52

Из рисунка видно, что в любой момент времени прtt < суммарная интен-

сивность отказов периода приработки )(tпрΣλ будет равна

)()( tt прпр λλλ +=Σ .

Отсюда, вероятность безотказной работы в этот период будет равна

tdttdtt

пр eeetp

t

пр

t

прλ

λλλ−

−+− ∫=

∫= 00

)())(()( .

Аналогичным образом можно получить выражение для вероятности

безотказной работы в период износа и старения. В этом случае для нtt >

суммарная интенсивность постепенных отказов периода износа и старения

)(tисΣλ определяется выражением

)()( tt исис λλλ +=Σ ,

откуда можно определить вероятность безотказной работы при постепен-

ных отказах:

tdttdttdtt

ис eeeetp

t

ис

t

ис

t

исλ

λλλλ−

−+−− ∫=

∫=

∫=

Σ000

)())(()()( .

Вообще интенсивность отказов в зависимости от типа, назначения,

качества, нагрузочных режимов и режимов эксплуатации может иметь

разнообразный характер, ее кривая – различные формы. Представим эту

зависимость в общем виде:

ntt 1)( λλλ += ,

где λ – интенсивность отказов в период нормальной эксплуатации;

1λ – параметр масштаба интенсивности отказов;

n – параметр формы интенсивности отказов.

Подставим полученное выражение интенсивности в левую часть

обобщенного закона надежности в дифференциальной форме:

Page 53: Ермаков - Основы надежности информационных систем

53

)()())(( 1 tp

tpt′

−=+ λλ

и проинтегрируем уравнение от 0 до t . В результате вероятность безот-

казной будет определяться общим выражением

11

1)(+

+−−=

ntnteetpλ

λ .

Второй сомножитель в левой части выражения определяет вероятность с

переменной во времени интенсивностью и представляет собой распределе-

ние Вейбулла. В последнее время это распределение довольно часто ис-

пользуется для изучения разброса срока службы электронной аппаратуры

и невосстанавливаемых элементов ИС. Вид распределения Вейбулла зави-

сит от показателя n (рис. 7). Величины интенсивностей отказов представ-

лены в таблице 1.

Для конкретных задач определения надежности при внезапных и по-

степенных отказах выбираются необходимые зависимости )(tλ . При этом

выбор значения показателя n производится, исходя из следующих воз-

можностей: результатов специальных испытаний ТУ на надежность, нако-

пленных данных об отказах этих ТУ при различных режимах работы в

процессе эксплуатации и, наконец, справочных материалах об интенсивно-

стях отказов.

Рис. 7. График изменения интенсивности отказов в зависимости от показателя n

1λλ +

)(tλ

t

λ

0

1

233

4

Page 54: Ермаков - Основы надежности информационных систем

54

Таблица 1

Значение n Зависимость Кривая на

рис. 7

0

1

Больше 1

Меньше 1

1)( λλλ +=t

tt 1)( λλλ +=

11)( >+= ntt λλλ

ntt 1)( 1λλλ +=

1

2

3

4

4.2. Надежность в период износа и старения

В период износа и старения развиваются постепенные отказы. Для

этих отказов характерно то, что для них нельзя указать определенные гра-

ницы времени начала и конца их появления. Времена наступления посте-

пенных отказов имеют тенденцию группироваться вокруг среднего време-

ни безотказной работы T ′ , определяемого из условия появления только

износовых отказов.

Распределение времени безотказной работы до появления износового

отказа во многих случаях хорошо описывается нормальным законом рас-

пределения.

Тогда

>

≤=

′−− ,0,

0, 0)( 22 2/)( tce

ttf

Tt σ

где πσ 2

1=c – нормирующий множитель;

t – текущее время работы ТУ с момента ввода его в эксплуатацию;

σ – среднее квадратическое отклонение времени безотказной работы T ′ .

Page 55: Ермаков - Основы надежности информационных систем

55

Для определения безусловной вероятности отказа ТУ в интервале вре-

мени ),( 21 tt воспользуемся формулой

∫∫′−−==

2

1

222

1

2/)(21 2

1)(),(t

t

Ttt

tdtedttfttq σ

πσ.

Применим замену переменной:

zTt =′−

σ)(

; σdtdz = .

Величина z – центрирована относительно T ′ , то есть z =0 при Tt ′= . То-

гда, делая соответствующую подстановку, получим

∫ ∫

′− ′−

−−−=

σ σ

π

Tt Ttz

dzedzettqz2 1 2

0 0

22

2

21 21),( .

Полученные интегралы в правой части можно вычислить с помощью спе-

циальной функции, представляющей собой определенный интеграл от вы-

ражения 2/ze− . Эта функция называется функцией Лапласа, она обознача-

ется символами )(xФ и для составлены таблицы. Функция Лапласа равна

dzexФx z

∫−

=0

2

2

21)(π

.

В силу замены xTt =′−

σ)(

, получим

)()(),( 1221 σσ

TtФTtФttq′−

−′−

= .

Графики функций )(tq и )'(σ

TtФ − показаны на рисунке 8. Так как

)'(σ

TtФ − является законом распределения времени до отказа, а

)'()( Ttptq <= по определению является также законом распределения

Page 56: Ермаков - Основы надежности информационных систем

56

Рис. 8. График функции распределения времени до отказа

времени до отказа, то эти законы совпадают и приведены на рисунке од-

ним графиком. Если через ординату )'(σ

TtФ − = 0,5 провести прямую, па-

раллельную оси абсцисс, а затем принять ее за новую ось абсцисс z , то

видно, что в новой системе координат значения функции )'(σ

TtФ − в точ-

ках, равностоящих от новой оси ординат, равны по абсолютной величине:

)()( aФaФ −= .

Это вдвое сокращает объем табличного материала для функции )'(σ

TtФ −.

Следует иметь в виду, что при работе с отрицательными аргументами

справедливо следующее соотношение:

).()( aФaФ −=−

Если предположить, что 1t = 0, где 1t – время начала износа старения и

при условии, что σ>>′T , с известной долей приближения можно запи-

сать

5,0)()( 1 −≅′

−=′−

σσTФTtФ .

0

)'

TtФ

−q(t)

t

z

+0,5

-0,5

1

0,5

Ф(-а)

Ф(а)

0

Page 57: Ермаков - Основы надежности информационных систем

57

Тогда

)(5,0)5,0()()(σσ

TtФTtФtq′−

+=−−′−

= .

В силу того, что вероятность безотказной работы ),( 21 ttp может быть

вычислена по формуле

)(1)( tqtp −= ,

то, с учетом полученного выражения для вероятности отказов, можно за-

писать

)(5,0)(σ

TtФtp′−−= .

Тогда общая вероятность безотказной работы ТУ с учетом внезапных и

постепенных отказов в период износа и старения будет определяться сле-

дующим выражением:

))(5,0()()()(σ

λ TtФetptptp пп

вtис

′−−=⋅= − ,

где )(tpп – вероятность безотказной работы ТУ в период износа и старе-

ния.

Вероятность отказа ТУ в период износа и старения увеличивается со

временем. Если функция интенсивности отказов )(tλ для этого периода

известна, то при определении условной вероятности безотказной работы за

промежуток времени 12 ttt −=∆ можно воспользоваться формулой

∫−==

2

1

)(

211

21 ),(),(

t

tdtt

ettptttp

λ

.

Поскольку в период износа и старения интенсивность отказов непре-

рывно увеличивается, то, очевидно, что величина ),(1

21tttp для одинако-

вых по продолжительности отрезков времени будет различной в зависимо-

Page 58: Ермаков - Основы надежности информационных систем

58

сти от того, к какому моменту времени общего срока эксплуатации при-

мыкает рассматриваемый отрезок времени. Отсюда следует, что в этот пе-

риод надежность ТУ как свойство выполнять заданные функции в преде-

лах требуемого промежутка времени 12 ttt −=∆ зависит от возраста ТУ

или его наработки к началу рассматриваемого отрезка времени.

Существует ряд мероприятий по профилактике износа ТУ. Основным

из них является соблюдение правил эксплуатации. Это позволяет избежать

преждевременного износа и сокращения периода нормальной эксплуата-

ции. Важную роль играет и система технического обслуживания ТУ,

включающая настройку, регулировку и другие мероприятия. Не менее

важным способом предотвращения отказов по причине износа является

замена устройств до наступления периода износа и старения. Наиболее

широко этот способ применяется для обеспечения необходимого уровня

надежности и безотказности ТУ, выполняющих ответственные функции,

особенно если они связаны с риском для жизни людей.

4.3. Надежность технических устройств в период хранения

В п. 2.1 было дано определение понятия сохраняемости. Эта состав-

ляющая надежности характеризует свойство ТУ противостоять вредным

воздействиям среды при их хранении и транспортировке.

В понятии сохраняемости следует различать две стороны. Одна из них

связана с надежностью ТУ в процессе их хранения на складах. Здесь ис-

пользуются такие показатели, как интенсивность отказов при хранении,

среднее время безотказного хранения (средний срок сохраняемости) и дру-

гие характеристики. Другая сторона понятия сохраняемости характеризует

способность ТУ противостоять отрицательному влиянию условий хране-

ния и транспортировки на его безотказность при последующей эксплуата-

ции в рабочих режимах. В этом случае сохраняемость характеризуется не-

которым сроком хранения в определенных условиях с соответствующим

Page 59: Ермаков - Основы надежности информационных систем

59

техническим обслуживанием. В течение этого срока уменьшение средней

наработки до отказа, обусловленное хранением, должно находиться в до-

пустимых пределах, оговоренных нормативно-технической документаци-

ей. В качестве основных количественных показателей сохраняемости ис-

пользуются:

• срок сохраняемости. Это календарная продолжительность хранения

или транспортировки ТУ, в течение которого сохраняются в задан-

ных пределах значения параметров, характеризующих способность

ТУ выполнять заданные функции;

• средний срок сохраняемости ..срсохрT . Это величина является мате-

матическим ожиданием срока сохраняемости:

dttftT сохрсохрiсрсохр )(0

.. ∫∞

= ,

где сохрit – сохраняемость i -го ТУ; )( сохрtf – плотность распределения

величины сохрt ;

• гамма-процентный срок сохраняемости γ.сохрT – срок сохраняемо-

сти, который будет достигнут ТУ с заданной вероятностью γ про-

центов.

Срок сохраняемости в теории надежности рассматривается как слу-

чайная величина. Пример. На складе долгое время хранится партия резисторов с номиналом

кОмRH 20= . В процессе длительного хранения резисторы старели, менялся их по-

тенциал. При проверке было обнаружено, что среднее значение сопротивления рези-

сторов возросло и стало рано кОмRm 21= , а среднее квадратическое сопротивление

σ = 2 кОм. Определить долю брака, если допустимое отклонение сопротивления рези-

стора от номинала должно быть не более 15% (предполагается нормальное распределе-

ние значений сопротивления).

Page 60: Ермаков - Основы надежности информационных систем

60

Решение. Найдем границы допустимых 15% отклонений Ну и вy в единицах сопро-

тивлений:

.

;

232015,115,1%15

172085,085,0%15

кОмRRRв

кОмRRR

HHH

HHHH

y

y

====

====

×+

×−

Вероятность нахождения значений сопротивлений вне поля допуска ндP при условии

нормальности распределения будет равна:

.477.0)2(2

2123

;341,0)1(2

1721;1

=Φ=

Φ=

Φ=

=Φ=

Φ=

−Φ=

−−=

σ

σ

RHH

вRв

вНнд

myR

ymR

PPP

Тогда =ндP 1 - 0,342 - 0,477 = 0,182. Таким образом18.2% будут бракованными.

4.4. Характеристики надежности информационной системы при

хранении информации

Хранение информации в ИС производится как на программном, так и

на аппаратном уровне. Если говорить о программном уровне, то в качестве

информационных хранилищ могут рассматриваться базы и банки данных и

знаний. Поскольку и те и другие являются программными продуктами, то

они обладают теми же свойствами и характеристиками, что и программ-

ное обеспечение вообще. В главе 3 настоящего пособия достаточно под-

робно рассматривались и характеристики ПО с точки зрения надежности.

Если говорить об аппаратном уровне, то основным аппаратным сред-

ством, предназначенным для хранения информации, является память ком-

пьютера. Она имеет иерархическую организацию и состоит из верхней па-

мяти, внешней памяти и съемных хранилищ. Верхняя память состоит из

регистров процессора, составляющих внутреннюю память процессора,

кэш-памяти, разделяемой в современных ЭВМ на два уровня, и оператив-

Page 61: Ермаков - Основы надежности информационных систем

61

ной памяти, реализованной в настоящее время чаще всего на базе микро-

схем динамической памяти с произвольным доступом. К внешней памяти

относится жесткий фиксированный магнитный диск (винчестер). Съемные

хранилища представляют собой внешние накопители на магнитной ленте,

магнитооптические диски и другие виды носителей.

Верхняя память предназначена для кратковременного хранения ин-

формации в процессе выполнения компьютером программы.

Оперативная память в современных компьютерах является полупро-

водниковым устройством. Модули оперативной памяти изготавливаются

на основе интегральной технологии. В процессе работы этих устройств

возникают ошибки, которые разделяются на неустранимые и корректи-

руемые. Причинами неустранимых ошибок являются дефекты физического

характера. Они заключаются в том, что некоторые элементы микросхем

перестают изменять состояние при записи, вследствие чего считываемый с

них код не соответствует переданному при записи. Неустранимые ошибки

являются следствием дефектов производственного характера, старения

или условий эксплуатации. Корректируемые ошибки носят случайный ха-

рактер и не являются результатом неисправности модуля. Они вызываются

причинами, начиная от воздействия помех в цепях питания, внешней ра-

диации и кончая температурной нестабильностью в работе микросхем.

Оба этих типа ошибок представляют серьезную опасность, как во

время работы программы, так и при хранении информации. Поэтому в

компьютерах предусмотрены схемы выявления и коррекции ошибок. Мо-

дули оперативной памяти относятся к невосстанавливаемым элементам

ИС и потому показатели надежности для них аналогичны тем, которые

описаны в главе 2 и п.п. 4.1 – 4.3. При этом следует иметь в виду, что на-

дежность современных модулей памяти весьма высока – среднее время на-

работки на отказ (среднее время безотказной работы) составляет сотни

тысяч часов.

Page 62: Ермаков - Основы надежности информационных систем

62

Регистровая кэш-память представляет собой буфер между оператив-

ной памятью и центральным процессором компьютера. Она обладает вы-

сокой скоростью передачи данных и сравнительно небольшим объемом. В

кэш-памяти кратковременно хранятся копии блоков данных тех областей

оперативной памяти, к которым выполнялись последние обращения, и

весьма вероятны обращения в ближайшие такты работы. Создается кэш-

память на основе тех же технологий, что и оперативная память. Поэтому

особенности ее работы и характеристики надежности соответствуют тем,

которыми обладает оперативная память.

В современных ЭВМ внешняя память представлена накопителями на

жестких магнитных дисках (винчестерах). Магнитный диск представляет

собой пластину круглой формы из немагнитного металла или пластика,

покрытую слоем магнитного материала. Данные записываются на носитель

и считываются с него с помощью магнитной головки, являющейся миниа-

тюрным электромагнитом. Винчестеры предназначены для долговремен-

ного хранения информации как во время работы компьютера, так и в пе-

риоды его отключения. Отдельные элементы винчестера (диск, магнитная

головка) можно считать функционально независимыми с точки зрения хра-

нения информации, так как состояние магнитной головки не может оказать

влияние на качество уже записанной на диск информации. Поэтому речь

будет идти именно о дисковой части винчестера как невосстанавливаемом

элементе ИС, отказы которых представляют собой наибольшую опасность

для хранимой на них информации.

Практика их эксплуатации показывает, что среднее время наработки

на отказ для винчестеров растет и для ряда моделей в настоящий момент

достигает значения 1200000 часов. Оценим этот показатель. Для этого вве-

дем некоторые допущения. Пусть оцениваемые нами винчестеры находят-

ся в периоде нормальной эксплуатации. Все винчестеры принадлежат к

одной серии и введены в эксплуатацию одновременно. Установим режим

Page 63: Ермаков - Основы надежности информационных систем

63

работы – 24 часа в сутки в течение всего года. Кроме того, будем предпо-

лагать, что винчестеры поставлены на эксплуатацию после прохождения

периода приработки. Это означает, что отказы, связанные с дефектами

проектирования, монтажа, изготовления, не учитываются. Допущение о

круглосуточной работе дает основание предполагать, что остановки нако-

пителей информации будут связаны с отключением электроэнергии, бро-

сками тока и напряжения. С одной стороны, эти остановки приводят к ус-

коренному износу оборудования, а с другой – постоянная работа винчесте-

ра будет причиной достаточно быстрого износа механических элементов

диска. Будем также считать, что любой отказ винчестера связан с полной

или частичной потерей или искажением записанной информации.

В силу принятых допущений будем считать, что средняя наработка

винчестера на отказ будет =T 60000 часов, что вполне соответствует пока-

зателям для дисков, установленных на современных компьютерах. Тогда,

для периода нормальной эксплуатации, интенсивность отказов будет равна

==T1

λ 0,000016(6) ≈ч1

0,000017ч1

.

Определим величину вероятности безотказной работы поставленных на

эксплуатацию винчестеров через год, два, три, четыре и пять. Пусть на

восстановление информации по отказам жестких дисков тратится 10% го-

дового бюджета времени. Тогда количество рабочих дней рдt будет равно

=рдt 365 – 36,5 = 328,5 (рабочих дней),

или в часах:

=)1(чt 328,5×24 = 7884 (часа),

где )1(чt – количество часов работы винчестера в год. Тогда вероятности

безотказной работы этих устройств )(iP , где =i 1, 2, 3, 4, 5 – количество

лет работы, будут равны:

Page 64: Ермаков - Основы надежности информационных систем

64

=== ×−− 7884000017,0)1()1( eeP чtλ 0,875;

== − )2()2( чteP λ 0,764;

== − )3()3( чteP λ 0,669;

== − )4()4( чteP λ 0,571;

== − )5()5( чteP λ 0,504.

Полученные результаты говорят о том, что в среднем следует ожидать че-

рез год отказа около 13% винчестеров, через 2 года – около 24%, через 3

года – более 33%, через 4 – около 43% и через 5 лет – откажет почти поло-

вина поставленных на эксплуатацию жестких дисков.

Можно предполагать, что чем дольше диск работает, тем более ценная

информация на нем хранится. Поэтому ущерб, наносимый при выходе

винчестера из строя через 5 лет, будет более ощутим, чем при его отказе

через год. Следовательно, при эксплуатации компьютеров чрезвычайно

важными являются мероприятия, связанные с обеспечением сохранности

информации. Прежде всего, к ним необходимо отнести работы по созда-

нию и поддержанию стабильного электропитания и необходимого микро-

климата. Затем необходимо создать системы антивирусной защиты и про-

филактики. И, наконец, необходимо обеспечить сохранность информации

путем применения систем резервного копирования.

Вопросы для самоконтроля

1. Какие основные виды интенсивностей отказов могут иметь ТУ?

2. Что такое средний срок сохраняемости?

3. Какой характер имеет поведение интенсивности отказов в нормаль-

ный период эксплуатации и в период износа и старения?

4. Каким законом может быть описано распределение времени безот-

казной работы в период износа и старения?

Page 65: Ермаков - Основы надежности информационных систем

65

5. Как определяется общая вероятность безотказной работы ТУ с уче-

том внезапных и постепенных отказов?

6. Какие устройства информационных систем являются основными

хранилищами информации?

7. Основные показатели надежности при хранении информации.

8. Основные мероприятия по обеспечению сохранности информации.

Page 66: Ермаков - Основы надежности информационных систем

66

Глава 5 Элементы теории восстановления

5.1 Основные понятия и определения теории восстановления

К восстанавливаемым ТУ относятся такие, ремонт которых в слу-

чае отказов или выработки ими предусмотренного срока эксплуатации

производится в соответствии с заданной технологией и в необходимом

объеме. После эксплуатация ТУ возобновляется до его предельного со-

стояния или следующего ремонта.

Восстанавливаемые ТУ в общем случае представляют собой сложные

системы, состоящие из высоконадежных элементов, отказы которых явля-

ются независимыми. Для таких систем появление отказов на одном интер-

вале наработки практически не влияет на вероятность появления какого-

либо количества отказов на другом интервале, не пересекающемся с пер-

вым. В этом случае отказы можно считать независимыми, а время нара-

ботки между отказами распределенным по экспоненциальному закону.

Восстановление устройства после отказа производят путем замены

неисправного элемента или путем его ремонта. При этом в теории надеж-

ности не учитывают время, необходимое на восстановление. Предполага-

ется, что возникающие отказы ТУ устраняются мгновенно. Это – так назы-

ваемая модель мгновенного восстановления работоспособности ТУ. При

рассмотрении характеристик надежности восстанавливаемых ТУ считает-

ся, что восстановление полностью возвращает устройству те же свойства,

которыми оно обладало до отказа так, что его невозможно отличить от но-

вого. При таком допущении продолжительность работы ТУ с момента его

восстановления до очередного отказа не зависит от того, сколько раз оно

отказывало в прошлом.

Одной из основных характеристик восстанавливаемых ТУ является

ремонтопригодность или восстанавливаемость. Определение термина

Page 67: Ермаков - Основы надежности информационных систем

67

«ремонтопригодность» было дано в п. 3.1. Численной мерой восстанавли-

ваемости является вероятность восстановления, под которой понимается

вероятность того, что за определенный интервал времени и в заданных

условиях ремонта неисправное ТУ будет восстановлено:

)()( ремфрем ttptP <= ,

где фt – фактическое время восстановления;

ремt – заданное время процесса восстановления.

В процессе эксплуатации сложные восстанавливаемые ТУ в любой

момент времени, принятый за начало отсчета времени эксплуатации, могут

находиться в одном из двух состояний: исправном или неисправном. Ис-

правное состояние восстанавливаемого ТУ в течение некоторого периода

рабочего времени ( τ−t ) определяется следующими двумя необходимыми

условиями:

- наличием исправного состояния в любой данный момент вре-

мени t , принятый за начало отсчета;

- непоявления отказа в полуинтервале времени ( τ−t ), исключая

момент t .

В силу сказанного, количественная мера надежности определяется как

эксплуатационная надежность, представляющая собой функцию эксплуа-

тационной надежности или вероятность исправного состояния ТУ в тече-

ние интервала ( τ−t ):

)()()( 0 ττ ptppЭ = .

Это выражение определяется произведением вероятности исправного

состояния )(0 tp в любой момент времени τ<t и вероятности непоявле-

ния отказа ТУ )(τp в течение интервала от момента t до τ , исключая

сам момент t .

Первый сомножитель равен

Page 68: Ермаков - Основы надежности информационных систем

68

NtNtp )()(0 = ,

где N – некоторое постоянное количество восстанавливаемых ТУ, на-

ходящихся под наблюдением;

)(tN – количество восстанавливаемых ТУ, находящихся к момен-

ту времени t в исправном состоянии.

Аналогично определяется и вероятность отказа в любой момент вре-

мени τ<t :

Ntn

NtNNtq )()()(0 =

−= .

Очевидно, что

1)()( 00 =+ tqtp .

Если предположить, что t меняется от 0 до τ (а это корректное пред-

положение, так как по принятому условию момент времени t принят за

начало отсчета), то второй сомножитель эксплуатационной надежности

равен

tTt

eetpp λτ −−=== )()( .

Последовательности событий, состоящие в возникновении отказов в

случайные моменты времени ntttt ,,,, 321 K , образуют поток событий или

поток отказов. Тогда, в качестве характеристик надежности восстанавли-

ваемых ТУ можно принять характеристики потока отказов. Основными

характеристиками потока отказов являются средняя статистическая

плотность вероятности отказов или параметр потока отказов и После-

довательности событий, состоящие в возникновении отказов в случайные

моменты времени ntttt ,,,, 321 K , образуют поток событий или поток отка-

зов. Тогда, в качестве характеристик надежности восстанавливаемых ТУ

можно принять характеристики потока отказов. Основными характеристи-

Page 69: Ермаков - Основы надежности информационных систем

69

ками потока отказов являются средняя статистическая плотность веро-

ятности отказов и суммарная статистическая плотность вероятности

отказов.

Средняя статистическая плотность вероятности отказов или па-

раметр потока отказов определяется как отношение количества отка-

завших ТУ in∆ в интервале времени it∆ к числу ТУ ЭN , находящихся в

эксплуатации, при условии, что все отказавшие ТУ мгновенно восстанав-

ливаются или заменяются исправными:

ii tN

n∆

∆=ω .

Суммарная статистическая плотность вероятности отказов вы-

ражается отношением полного числа отказов )(tn по времени эксплуа-

тации t :

ttn )(

=Ω .

Одной из важных показателей в теории восстановления является

среднее время наработки между двумя отказами моT . Оно определяется

как отношение времени наработки t ТУ к полному числу отказов ТУ, воз-

никших в нем за это время

)(tntTмо = ,

или

Ω= 1

моT .

Известно, что для любого закона распределения времени безотказной

работы ТУ значение средней плотности вероятности отказов )(tω для

восстанавливаемых устройств в установившемся режиме их работы при

∞→t имеет предел:

Page 70: Ермаков - Основы надежности информационных систем

70

,1)(lim λω ===∞→

constT

tt

где λ – интенсивность отказов, а T – среднее время безотказной ра-

боты.

5.2. Коэффициенты отказов

Иногда, в качестве вспомогательного критерия надежности элементов

восстанавливаемых ТУ применяются различные коэффициенты, в частно-

сти – коэффициент отказов.

Коэффициент отказов представляет собой отношение числа отка-

зов однотипных элементов эn к общему числу отказов в системе сn :

c

эo n

nk = .

Величина этого коэффициента позволяет оценить степень влияния

определенного типа элемента на надежность системы в целом. Однако он

не дает возможности определить, какой тип элементов системы менее на-

дежен, а какой более надежен. Для этой цели может быть использован от-

носительный коэффициент отказов

эc

cэoo Nn

Nnk = ,

где эN – количество элементов определенного типа в системе;

cN – полное количество элементов всех типов в системе.

Эти коэффициенты могут быть выражены через другие показатели

надежности. Так, количество отказов в системе вследствие неисправных

элементов определенного типа в течение промежутка времени t∆ можно

определить с помощью выражения

tNn эээ ∆= ω ,

Page 71: Ермаков - Основы надежности информационных систем

71

где эω – средняя плотность вероятности отказов элементов определенного

типа. За это же время в системе произойдет всего отказов:

tn cc ∆Ω= ,

где cΩ – суммарная плотность вероятности отказов в системе.

Подставим полученные значения в выражение коэффициента отказов

с

ээ

c

ээo N

ttNk

Ω=

∆Ω∆

=ωω

.

При ∞→∆ предельное значение средней плотности вероятности эле-

ментов определенного типа будет равно

ээ λω = .

Следовательно,

с

ээo Nk

Ω=

λ.

Аналогично можно найти зависимость относительного коэффициента от-

казов ook от средней и суммарной плотности вероятности отказов:

с

эc

эс

cээ

эc

cэoo N

tNtNN

NnNnk

Ω=

∆Ω∆

==ωω

.

В предельном случае

ээ λω =

будет получено значение

с

эcoo Nk

Ω=

λ.

Таким образом, коэффициенты отказов могут быть выражены через

интенсивность отказов и суммарную плотность вероятности отказов.

Page 72: Ермаков - Основы надежности информационных систем

72

5.3. Комплексные показатели надежности

Процесс эксплуатации сложных восстанавливаемых ТУ не следует

рассматривать как непрерывный процесс. Обычно функциональное ис-

пользование их чередуется с простоем вследствие двух основных причин:

- бездействие исправных ТУ ввиду отсутствия необходимости их приме-

нения или наличия причин и условий, препятствующих их эксплуатации.

В результате образуется так называемый конъюнктурный простой;

- проведение мероприятий, связанных с профилактикой и текущим ремон-

том, в результате чего образуется вынужденный простой.

Поэтому текущее время эксплуатации ТУ складывается из следующих

компонентов:

КПВП ttttэ ++= ∑ ,

где ∑t – суммарное время наработки ТУ в течение определенного кален-

дарного времени эксплуатации эt ;

ВПt – суммарное время вынужденного простоя (по отказам и плано-

вым профилактикам и восстановлению после них) за этот же период экс-

плуатации;

КПt – суммарное время конъюнктурного простоя за этот же период.

Здесь под конъюнктурным простоем понимается бездействие исправного

ТУ ввиду отсутствия необходимости применения.

Время вынужденного простоя ВПt представляет собой сумму

НПЛПЛВП ttt += ,

где ПЛt – плановое время вынужденного простоя, которое образуется

вследствие проведения плановых профилактик. Эта величина вполне опре-

делена и практически пропорциональна времени эксплуатации;

Page 73: Ермаков - Основы надежности информационных систем

73

НПЛt – неплановое время вынужденного простоя из-за восстановле-

ния по отказам. Это величина случайная и определяется временем ∑ pt ,

необходимым для восстановления по всем отказам за определенный ка-

лендарный период.

Одним из важнейших критериев надежности является готовность

ТУ быть эксплуатируемым (или готовность к применению), которая вы-

ражается коэффициентом эксплуатационной готовности:

ВПЭГ tt

tK

+=

∑ .

Величина этого коэффициента зависит не только от надежности, но и

от эксплуатационного совершенства, характеризующего степень его (ТУ)

приспособленности к проведению профилактических работ.

Ввиду того, что плановое время вынужденного простоя не является

случайной величиной и значение его отношения к наработке не зависит от

количества возникающих отказов, то можно определить величину, выра-

жающую собой вероятность того, что ТУ в любой момент времени мо-

жет находиться в исправном состоянии. Это величина носит название ко-

эффициента готовности и выражается как

∑∑

+=

pГ tt

tK .

На практике важен такой показатель, как степень использования ТУ

в эксплуатации за календарное время эt . Определяется эта величина как

коэффициент использования:

ЭИС t

tK ∑= .

Коэффициент использования численно равен вероятности того, что в лю-

бой момент времени Эt ТУ выполняет свои предписанные функции.

Page 74: Ермаков - Основы надежности информационных систем

74

В рассмотренном ранее коэффициенте готовности

∑+=

Σ

Σ

pГ tt

tK ,

величины Σt и ptΣ могут быть получены из выражений:

pp Ttnt )( ∑∑ = ,

моTtnt )( ∑∑ = ,

где pT – среднее время восстановления ТУ;

моT – среднее время наработки между двумя отказами.

Тогда, после подстановки этих значений в исходную формулу коэф-

фициента готовности, получим

pмо

моГ TT

TK+

= .

При ∞→t предельное значение среднего времени наработки между дву-

мя отказами будет равно

TTмоt=

∞→lim .

Подставляя это значение в выражение коэффициента готовности, получим

pГ TT

TK+

= .

С учетом того, что

Ω=

1моT ,

последнее выражение можно записать в виде

pГ T

KΩ+

=1

1.

Page 75: Ермаков - Основы надежности информационных систем

75

Для сложных информационных систем понятие надежности в боль-

шей степени определяется по коэффициенту готовности ГK , то есть по

вероятность того, что ИС в любой момент времени находится в исправном

состоянии. Для типичного современного сервера =ГK 0,99. Это означает

примерно 3.5 суток простоя в год. За рубежом популярной является клас-

сификация ИС по уровню надежности (табл. 2).

Таблица 2

Коэффициент

готовности

ГK

Максимальное время про-

стоя в год

Тип информационной системы

0,99 3,5 суток Обычная

0,999 8,5 часов Высокая надежность

0,9999 1 час Отказоустойчивая

0,99999 5 минут Безотказная

Необходимо отметить и другие качества и надежности функциониро-

вания ИС. Так, одним из важнейших комплексных показателей качества

функционирования ИС функциональная полнота F , представляющая со-

бой отношение области автоматизированной обработки информации aQ

той системы, для которой была спроектирована ИС, к области обработки

информации иQ для функционирования всей обслуживаемой системы:

и

aQQF = .

Качественной характеристикой ИС являются показатели их надежно-

сти. Различают функциональную и адаптивную надежность.

Функциональная надежность представляет собой свойство ИС реали-

зовать в определенной степени функции программно-технологического,

технического и эргономического обеспечения.

Page 76: Ермаков - Основы надежности информационных систем

76

Адаптивная надежность ИС состоит в возможности реализовывать

свои функции в пределах установленных границ:

висис

исад TT

TK+

= ,

где исT – средняя наработка на отказ ИС;

висT – среднее время восстановления ИС.

Как видно из последнего выражения, адK есть не что иное, как коэф-

фициент готовности для ИС.

5.4. Аналитические зависимости между показателями надежности

восстанавливаемых технических устройств

В п. 5.1 был определен показатель надежности – средняя статисти-

ческая плотность вероятности. Пусть 0→∆ it . Тогда, при переходе от

дискретного времени к непрерывному, определим плотность вероятности

отказов восстанавливаемых ТУ:

dttdn

Ntiti

)(1)(lim 00

==→∆

ωω ,

где )()()(0 tdmtdntdn −= ; )(tdn – число отказов, возникших в ТУ за ин-

тервал времени dt , а )(tdm – количество восстановленных ТУ из числа

неисправных за этот же интервал времени dt .

Отсюда

dttdm

Ndttdn

Nt )(1)(1)( −=ω ,

или

Ntn

dttdm

tnNtN

dttdn

tNt )()(

)(1)()(

)(1)( ⋅⋅−⋅⋅=ω .

Но

Page 77: Ермаков - Основы надежности информационных систем

77

)()()(

1 tdt

tdntN

λ=⋅ ,

а величина

dttdm

tn)(

)(1 ⋅

называется интенсивностью восстановления отказавших ТУ и обозначает-

ся символом )(tµ :

dttdm

tnt )(

)(1)( ⋅=µ .

С учетом этих отношений, )(tω примет вид

)()()()()( 00 tqttptt µλω −= .

Известно, что для невосстанавливаемых ТУ плотность вероятности

отказов аналитически выражается через вероятность безотказной работы,

как

dttdptf )()( −= .

Та же зависимость характерна и для восстанавливаемых ТУ, а именно:

dttdpt )()( 0−=ω .

Тогда можно записать

)()()()()(

000 tqttptdt

tdpµλ +−= .

При выражении )(0 tq через )(0 tp получается

[ ] )()()()()(

00 ttpttdt

tdpµµλ =++ .

Решение этого дифференциального уравнения имеет вид [ ] [ ] ])([)( )()()()(

0 Cdtetetp dtttdttt += ∫ +∫ +−∫

µλµλ µ .

Page 78: Ермаков - Основы надежности информационных систем

78

Относительно постоянной интегрирования С можно выдвинуть две

версии:

- в момент начала эксплуатации ТУ исправно: 1)0(0 =p ;

- в момент начала эксплуатации ТУ неисправно : 0)0(0 =p .

Тогда, для случая const=λ и const=µ , при 1)0(0 =p имеем

( )

+

+=′ +− tetp µλ

µλ

µλµ 1)(0 ,

а при 0)0(0 =p

( )

+=′′ +− tetp µλ

µλ

µλµ 1)(0 .

График изменения )(0 tp′ и )(0 tp ′′ представлены на рисунке.

Рис. 9. Графики изменения )(0 tp при различных начальных условиях

При известных уже допущениях const=λ и const=µ , и, следователь-

но,

T1

=λ ; pT

1=µ ,

получим

)(0

tp

t

1

0

)('0 tp

)("0 tp

Page 79: Ермаков - Основы надежности информационных систем

79

Гp

p

p KTT

T

TT

T=

+=

+=

+ 11

1

µλµ

.

Тогда

( )

+= +− t

Г eKtp µλ

µλ1)('

0 ,

( )

−= +− t

Г eKtp µλ

µλ1)("

0 .

Практически, обычно для установившегося процесса эксплуатации, счита-

ют, что

ГKp =0 .

Таким образом;

)()( τpKtp Гэ = .

Отсюда

ttГэ eeKtp λλ

µλµ −−

+==)( .

Для оценки вероятности того, что в любой момент времени восста-

навливаемое ТУ будет находиться в ремонте, используется функция про-

стоя ПK

p

pП TT

TK

+=

+=

µλλ

.

5.5. Полная вероятность выполнения заданных функций

В том случае, когда λ и µ являются величинами одного порядка,

наиболее точные результаты эксплуатационной надежности можно полу-

чить, применяя закон полной вероятности сложного события. Эта веро-

Page 80: Ермаков - Основы надежности информационных систем

80

ятность выполнения ТУ заданных функций равна сумме произведений ве-

роятности частных событий на вероятность существующих гипотез:

)()()1()(),( ppГГpф ttptUKtpKttp −×−+= .

Здесь предполагается, что существуют только два состояния: исправное

рабочее и восстанавливаемое. Тогда

pГ TT

TK+

=

представляет собой вероятность исправного состояния ТУ;

Tt

etp−

=)( – вероятность безотказной работы в течении времени t ;

p

pГ TT

TK

+=−1 – вероятность неисправного состояния ТУ;

p

p

Tt

p

pp e

Tt

tU′

+−=

2

)21(1)( – вероятность восстановления неисправного

состояния ТУ за время pt ;

Ttt

p

p

ettp−

−=− )( – вероятность безотказной работы ТУ за оставшееся по-

сле ремонта время ptt − , достаточное для выполнения заданной функции.

Подставляя эти значения в исходное выражение, получим

Ttt

Ttt

p

p

p

pTt

ppф

pp

eeTt

TTT

eTT

TttP−

−−

−−

+−×

++

+=

211),( .

При ptt >> и pTT >> разница между ЭP и фP небольшая, по-

этому с достаточной степенью точности можно ограничиться формулой

Tt

ГЭ eKP−

= .

Page 81: Ермаков - Основы надежности информационных систем

81

Применять расчет ),( pф ttP целесообразно, когда T и pT , а также t и pt

имеют один порядок.

Пример. Для 40=t час, pt =10 найти полную вероятность выполнения задан-

ных функций ТУ, среднее время безотказной работы которого =T 100час, а среднее

время восстановления =pT 20р, и сравнить с функцией эксплуатационной надежно-

сти.

Тогда, а соответствии с полученным выражением, имеем

=

+−×+

++

=−

−⋅

−100

104020102

10040

2010211

2010020

20100100)10,40( eeePф

[ ] 603,07408,03679,0211667,06703,0833,0 =×⋅−+⋅=

559,020100

100 10040

=+

=−

ePЭ.

Вопросы для самоконтроля

1. Какие ТУ называются восстанавливаемыми?

2. Определить основные характеристики надежности восстанавливае-

мых ТУ.

3. Что такое коэффициент отказов? Виды коэффициентов отказов.

4. Какие показатели надежности относятся к комплексным?

5. Что такое коэффициент готовности?

6. Аналитические выражения коэффициента готовности.

7. Что такое интенсивность восстановления?

8. Основные аналитические зависимости между показателями надеж-

ности восстанавливаемых ТУ.

9. Определить полную вероятность выполнения заданных функций.

10. Основные показатели надежности для восстанавливаемых информа-

ционных систем.

Page 82: Ермаков - Основы надежности информационных систем

82

Глава 6

Структурные схемы надежности

Ранее говорилось о том, что ТУ подразделяются на элементы и систе-

мы, причем система состоит из элементов. Элементы, составляющие сис-

тему, могут быть соединены между собой различным образом. С точки

зрения надежности, такие соединения представляют собой структуры, ка-

ждая из которых имеет свой способ расчета. Такой расчет представляет

собой расчет надежности. Сами структуры носят название структурных

схем надежности. Структурные схемы надежности нельзя путать с прин-

ципиальными, функциональными, структурными и другими схемами сис-

тем, хотя в частных случаях они могут совпадать. Соединение элементов в

структурных схемах надежности можно свести к четырем видам:

- последовательному,

- параллельному,

- смешанному,

- произвольному.

В качестве основных показателей надежности здесь используются ве-

роятность безотказной работы и вероятность отказа.

6.1. Структурные схемы надежности с последовательным соединением

элементов

Последовательное соединение в структурной схеме надежности –

это такое соединение, при котором отказ хотя бы одного элемента при-

водит к отказу всей системы в целом (рис. 9).

1 2 n

. . . Рис. 9. Структурная схема надежности с последовательным соединением элементов

Page 83: Ермаков - Основы надежности информационных систем

83

Этот тип соединения в теории надежности еще называет основным со-

единением.

Если считать отказы элементов независимыми, то на основании тео-

ремы умножения вероятностей, вероятность безотказной работы ТУ выра-

жается следующим образом:

∏=

=⋅⋅⋅=n

iinc tptptptptP

12 )()(...)()()( 1 ,

где )(tpi – вероятность безотказной работы i -о элемента;

)(tPc – вероятность безотказной работы системы.

Если

)()(...)2()( 21 tptpptp n ==== ,

то

)()( tptP nc = .

С учетом выражения вероятности безотказной работы через интенсив-

ность отказов можно записать

∫∑=

∑∫=

∫= ==

−−−

=

t n

ii

n

i

t

i

t

i dttdttdttn

ic eeeПtP 0 11 00

)()()(

1)(

λλλ.

Отсюда можно сделать заключение, что суммарная интенсивность от-

казов n последовательно соединенных элементов находится как сумма ин-

тенсивностей отдельных элементов.

∑=

Σ =n

ii tt

1)()( λλ ,

или, для случая равнонадежных элементов,

)()( tnt λλ =Σ .

Для случая const=λ имеем

Page 84: Ермаков - Основы надежности информационных систем

84

∑= =

−n

iit

c etP 1)(λ

,

откуда

∑=

=∑

n

ii

1λλ .

Из последнего выражения видно, что для обеспечения требуемой тех-

ническими условиями вероятности безотказной работы ТУ при увеличении

числа последовательно соединенных элементов необходимо снижать вели-

чину интенсивности отказов каждого элемента или, что то же самое, при-

нимать меры к увеличению их средней наработки на отказ.

Нередки случаи, когда система последовательно соединенных элемен-

тов состоит из k подсистем, а каждая j -я ),1( kj = подсистема состоит

из jn равнонадежных элементов. В этом случае вероятность безотказной

работы системы будет определяться выражением

∏=

=k

j

tnc

jptP1

)()( ,

где jn – количество равнонадежных элементов j -о типа; )(tp – вероят-

ность безотказной работы элемента j -й подсистемы.

Суммарная интенсивность отказов равна

∑=

Σ =k

jj tnt

1)()( λλ .

Анализ полученных выражений показывает:

- вероятность безотказной работы будет тем ниже, чем больше элементов в

него входит;

- вероятность безотказной работы последовательного соединения будет

ниже, чем эта же вероятность у самого надежного элемента системы.

Page 85: Ермаков - Основы надежности информационных систем

85

6.2. Структурные схемы надежности с параллельным соединением

элементов

Параллельным соединением элементов в структурной схеме надеж-

ности называется такое соединение, при котором система отказывает

только при отказе всех n элементов, образующих эту схему (рис. 10).

Согласно определению,

∏∏==

−==⋅⋅⋅=n

ii

n

iinc tptqtqtqtqtQ

1121 ))(1()()(...)()()( .

Отсюда

∏=

−−=−=n

iicc tptQtP

1))(1(1)(1)( .

Рис. 10. Структурная схема надежности с параллельным соединением элементов

С учетом интенсивности отказов выражение примет вид

)1(1)( 0

)(

1

∫−−=

=

t

i dttn

ic eПtPλ

.

Для случая равнонадежных элементов имеем

ndtt

c

t

oetP )1(1)()(∫

−−=− λ

,

а при const=λ последнее выражение примет вид

)1(1)(1

∏=

−−−=n

i

tc

ietp λ .

1

2

n

Page 86: Ермаков - Основы надежности информационных систем

86

Основные правила расчета надежности при последовательном и па-

раллельном соединениях элементов в структурной схеме надежности мож-

но формулировать следующим образом:

- определить количество элементов, составляющих структурную схему

надежности;

- из справочных таблиц или статистики определить интенсивность отказов

iλ каждого элемента;

- на основании iλ по формулам видов соединений в структурных схемах

надежности определяется ВБР.

6.3. Структурные схемы надежности со смешанным соединением

элементов

Иногда в сложных устройствах структурные схемы надежности со-

держат как последовательные, так и параллельные надежностные структу-

ры. Речь идет о том, что в схеме надежности присутствуют и те и другие

виды соединений, что и показано на рисунке 11.

Рис. 11. Пример структурной схемы надежности со смешанным соединением эле-

ментов

В этом случае для расчета надежности структурную схему разбивают

на последовательные или параллельные участки таким образом, чтобы ка-

ждый участок имел либо только последовательную, либо только парал-

I II III IV

Page 87: Ермаков - Основы надежности информационных систем

87

лельную структурную схему. На каждом участке определяется вероятность

безотказной работы в соответствии с теми формулами, которые соответст-

вуют структурным схемам рассматриваемого участка. Таким образом, ис-

ходная структурная схема надежности превращается в структуру с после-

довательным или параллельным соединением элементов. Такая эквива-

лентная последовательная структура показана на рисунке 12. Здесь, на

примере предыдущего рисунка 11, IVIIIIII PPPP ,,, – вероятности без-

отказной работы соответственно первого, второго, третьего и четвертого

последовательных участков, на которые структурная схема со смешанным

соединением элементов предварительно была разбита.

PI PII PIII PIV

Рис. 12. Преобразованная структура со смешанным соединением элементов

Тогда вероятность безотказной работы системы в представленном примере

будет равна

IVIIIIIIc PPPPtP ⋅⋅⋅=)( .

В общем случае, для системы с k последовательными участками, по-

лученными в результате предварительных преобразований, выражение для

вероятности безотказной работы будет иметь вид

)()(1

tPtPk

jjc ∏

== ,

где 0(tPj – вероятность безотказной работы j -о участка.

6.4. Сложная произвольная структура

Когда невозможно при составлении структурных схем надежности

применить последовательную, параллельную или смешанную схемы, то

Page 88: Ермаков - Основы надежности информационных систем

88

приходится иметь дело с так называемой сложной произвольной структу-

рой. Для такой структуры не существует общих методов расчета надеж-

ности. Одной из наиболее часто встречающихся схем такой структуры яв-

ляется мостиковая схема (рис. 13).

Рис. 13. Произвольная структурная «мостиковая» схема надежности

Расчет вероятности безотказной работы этой схемы можно осущест-

вить методом прямого перебора всех состояний. В частности, мостиковая

схема считается работоспособной при пяти вариантах отказов по одному

элементу (отказавшие элементы: 1, или 2, или 3, или 4, или 5), при восьми

вариантах отказов по два элемента (отказавшие группы элементов: 1 и 4,

или 2 и 5, или 1 и 3, или 2 и 3, или 3 и 4, или 3 и 5, или 1 и 5, или 2 и 4), при

двух вариантах отказа по трем элементам (отказавшие группы элементов: 1

и 3 и 4, или 2 и 3 и 5) или когда все 5 элементов работоспособны. Тогда,

для случая равнонадежных элементов вероятность безотказной работы

системы, структурная схема надежности которой представляет собой мос-

тиковую схему, будет равна

322345

322345

)1(2)1(8)1(

28)(

5

5

ppppppp

qpqpqpptpc

−+−+−+=

=+++=,

где )(tpp = – вероятность безотказной работы одного элемента;

)(tqq = – вероятность отказа одного элемента.

1

2 3

4

5

Page 89: Ермаков - Основы надежности информационных систем

89

В начале главы говорилось о том, что в большинстве случаев струк-

турные схемы надежности не совпадают с принципиальными, функцио-

нальными и структурными схемами ТУ. Наиболее ярко это утверждение

можно продемонстрировать на примере электрических систем, показав,

что принципиальная электрическая схема может не совпадать со структур-

ной схемой надежности.

Известно, что основными отказами электрических систем являются

отказы типа «обрыв» и «короткое замыкание». Пусть система состоит из

двух диодов Д 1 и Д 2 , включенных параллельно (рис.14, а). Для отказа ти-

б

а Рис. 14. Принципиальные электрические схемы и соответствующие им структур-

ные схемы надежности: а) - для диодов; б) - для конденсаторов

па «короткое замыкание» система выйдет из строя, когда откажет любой

из двух диодов. Поэтому структурная схема надежности для этого случая

изображается в виде последовательного соединения элементов. В другом

случае при отказе типа «обрыв» параллельная цепочка диодов откажет

только в случае отказа двух диодов. Следовательно, структурная схема на-

дежности будет представлять собой параллельное соединение элементов.

На рисунке 14, б изображена последовательная цепочка конденсаторов С 1

и С 2 . При «коротком замыкании» эта схема выйдет из строя, если только

Д 1

Д 2

С 1 С 1

1

1

1

1

2

2

2

2

«обрыв»

«короткое замыка-ние»»

Page 90: Ермаков - Основы надежности информационных систем

90

«пробьет» и С 1 и С 2 . В силу этого структурная схема надежности пред-

ставляется в виде параллельного соединения элементов. И, наконец, при

«обрыве» конденсаторная цепочка откажет, если откажет любой из двух

конденсаторов. Это значит, что структурная схема надежности будет иметь

последовательное соединение.

6.5. Расчет надежности по внезапным отказам

В связи с наличием двух типов отказов элементов (постепенные и

внезапные отказы) различаются и два способа расчета надежности, соот-

ветствующих двум типам отказов. При внезапных отказах применяют по-

каскадный метод расчета надежности и (или) поэлементный метод. Рас-

смотрим эти методы.

6.5.1. Покаскадный метод расчета надежности

Кроме расчета надежности по внезапным отказам этот подход дает

приемлемую оценку безотказности на самых ранних этапах проектирова-

ния ТУ. В качестве исходных данных используется число каскадов и при-

надлежность их к той или иной группе. Считается, что все элементы кас-

када образуют основное соединение элементов в смысле надежности. По-

этому для расчета берутся формулы:

∫=

−t

dtt

в etp 0)(

)(λ

,

где )(tλ представляет собой суммарную интенсивность отказов по

всем элементам системы;

∑=

=k

iii tnt

1)()( λλ ,

где in – количество однотипных элементов в i -м ),1( ni = каскаде;

k – количество каскадов.

Для оценки суммарной интенсивности используют выражение

Page 91: Ермаков - Основы надежности информационных систем

91

410* −=akk

λ (1/час),

где ak – коэффициент, учитывающий условия эксплуатации.

Для надежных элементов значение этого коэффициента лежат в диа-

пазоне от величины 1,2 до 1,4.

6.5.2. Поэлементный метод расчета надежности

Этот метод позволяет получить более точную оценку безотказности.

Его также можно применять при проектировании ТУ, но на более поздних

этапах. В качестве исходных данных берется общее число элементов, их

тип и данные по эксплуатации аналогичного типа оборудования. Расчет

производится по вышеприведенным формулам, но при определении вели-

чины интенсивности отказов используются данные, полученные на преды-

дущем этапе эксплуатации ТУ аналогичного типа. При этом

na

na

эа

эа

nnλλ

λ == ,

где naэа λλ , – суммарные интенсивности отказов эксплуатируемого ана-

лога и проектируемой аппаратуры;

naэа nn , – количество элементов эксплуатируемой и проектируемой

аппаратуры.

Отсюда

эаэа

nana n

nλλ = .

Эти методы расчета (покаскадный и поэлементный) по интенсивно-

стям отказов позволяют достаточно полно оценить безотказность проекти-

руемой аппаратуры.

В качестве исходных данных используются:

- принципиальная схема;

- сведения о количестве групп и типов комплектующих элементов;

Page 92: Ермаков - Основы надежности информационных систем

92

- сведения об интенсивностях отказов комплектующих элементов и узлов.

Порядок расчета следующий:

1. Согласно принципиальной схеме и спецификации, производят разбивку

всех элементов на группы, имеющие приблизительно одинаковую интен-

сивность отказов. Подсчитывают число элементов в каждой группе in .

2. По справочным данным находят минимальную и максимальную интен-

сивности отказов minmax , ii λλ .

3. Определяют максимальную и минимальную интенсивности отказов по

группам: minmax,iin λ .

4. Вычисляют общую интенсивность отказов ∑=

=k

iiint

1)( λλ .

5. Используя это выражение, определяют вероятность безотказной работы

и срT (расчет ведется по значения maxiλ и miniλ , а также по средним значе-

ниям интенсивностей отказов).

6.6. Расчет надежности по постепенным отказам

Основой для расчета являются данные о закономерностях изменения

определяющих параметров исследуемого ТУ во времени, а также установ-

ленные допуски на эти параметры.

Исследования поведения параметров многочисленных типов транс-

портных ТУ показывают, что распределение времени безотказной работы

при постепенных отказах соответствует нормальному закону. Это значит,

что для каждого параметра могут быть найдены значения iT и iσ .

Вероятность безотказной работы по i -у параметру системы или эле-

мента определяется выражением

Page 93: Ермаков - Основы надежности информационных систем

93

Φ

−Φ

=

i

i

i

i

пi T

tT

tP

σ

σ)( .

В этом случае вероятность безотказной работы по постепенным отказам

всего ТУ, если считать отказы элементов независимыми, находится из вы-

ражения

∏=

=h

inin tPtP

1)()( ,

где h – число определяющих параметров.

Вероятность безотказной работы сложного ТУ по внезапным и посте-

пенным отказам может быть найдена из выражения

.)()()(1

1 ∏=

Σ∑

== =h

ini

ntпв tPetpptP

k

iiiλ

Примеры расчетов надежности

Задача 1. Простая система состоит из трех независимо работающих элементов, соеди-

ненных последовательно в структурной схеме надежности. Интенсивность отказов

элементов равна соответственно:

.155101,03,15105,02,15108,01=−−⋅=−−⋅=−−⋅= ччч λλλ

Определить вероятность безотказной работы системы через 100 часов.

Решение. В соответствии с формулой расчета надежности в структурной схеме с по-

следовательным соединением элементов определяется суммарная интенсивность отка-

зов:

.13104,1321−−⋅=++=Σ чλλλλ

Тогда вероятность безотказной работы будет

.869,0)( 100104,1 3=== ⋅⋅−− −

Σ eetp tc

λ

Задача 2. Решить задачу 1, но для системы, состоящей из трех независимо работающих

элементов, соединенных параллельно в структурной схеме надежности.

Page 94: Ермаков - Основы надежности информационных систем

94

Решение. Вероятность безотказной работы системы, состоящей из параллельно соеди-

ненных элементов в структурной схеме надежности, определяется следующим образом:

( )( )( ) ( )( )( ).999962,0

99,0195,01923,0111111)( 321

==−−−−=−−−−= −−− ttt

c eeetp λλλ

Задача 3. Рассчитать по средним значениям интенсивностей отказов ориентировочную

величину вероятности безотказной работы проектируемой системы автоматического

управления через 100 часов предполагаемой работы.

Решение. По электрической схеме эскизного проекта системы определяем типы эле-

ментов, входящих в проектируемую систему, и их количество in . Данные об интенсив-

ностях отказов различных типов элементов, входящих в систему, сведены в таблицу.

По этим данным вычисляется суммарная интенсивность отказов каждой группы эле-

ментов iin λ . Полученные результаты также заносятся в таблицу.

п/п Наименование элементов in 1610 −−⋅ чiλ 1610 −−⋅ чiin λ

1 Трансформатор 2 2 4

2 Индуктивность 3 0,09 0,27

3 Плата интегральных схем 13 0,19 2,47

4 Чип памяти 5 0,9 4,5

6 Резистор 2 15 30

7 Диод 8 0,38 3,04

8 Триод 4 1,9 7,6

9 Конденсатор 2 0,04 0,08

10 Штепсельный разъем 9 0,7 6,3

11 Концевой выключатель 3 0,26 0,78

Расчет надежности производится поэлементным методом. Тогда результирующая ин-

тенсивность отказов системы равна сумме интенсивностей отказов всех составных эле-

ментов:

.1014,5911

1

16∑=

−−⋅==i

iic чn λλ

Вероятность безотказной работы системы автоматического управления равна

.994,01001014,59)100(6

≅⋅⋅−=−

ecp

Page 95: Ермаков - Основы надежности информационных систем

95

Вопросы для самоконтроля

1. Что такое структурная схема надежности и чем она отличается от

принципиальной схемы ТУ?

2. Что такое структурная схема надежности с последовательным со-

единением элементов?

3. Что такое структурная схема надежности с параллельным соедине-

нием элементов?

4. Надежность при структурной схеме с последовательным соединени-

ем элементов.

5. Надежность при структурной схеме с параллельным соединением

элементов.

6. Что такое сложная произвольная структурная схема надежности?

7. Надежность при произвольной структурной схеме.

8. Основы расчета надежности при постепенных отказах.

9. Основы расчета надежности при внезапных отказах.

10. Вероятность безотказной работы сложного ТУ при внезапных и по-

степенных отказах.

Page 96: Ермаков - Основы надежности информационных систем

117

Глава 8. Испытания на надежность

8.1. Временные характеристики, применяющиеся при статистических

исследованиях надежности

Определяющим параметром долговечности любого устройства явля-

ется наработка, под которой понимается продолжительность работы ТУ.

Основной мерой, оценивающей продолжительность работы, принято счи-

тать время в часах, то есть время, в течение которого ТУ выполняет свои

рабочие функции. Время наработки нельзя смешивать со временем экс-

плуатации, то есть календарным временем, в течение которого устройство

находится в эксплуатации.

У некоторых ТУ мерой оценки продолжительности работы являются

другие показатели, например, продолжительность работы электрических

аккумуляторных батарей измеряется числом зарядно-разрядных циклов;

продолжительность работы реле – числом включений и выключении; объ-

ектов подвижного состава железнодорожного транспорта – количеством

пройденных километров и так далее.

Тем не менее все основные характеристики надежности, являющиеся

функциями времени наработки, должны быть использованы при решении

задач надежности, когда определяющие параметры имеют другую размер-

ность. В этом случае под символом t следует понимать любой вид нара-

ботки, а под T – математическое ожидание появления отказа, оцениваю-

щееся любой из возможных размерностей.

При оценке надежности ТУ или сложных систем в целом по характе-

ристикам надежности составляющих этих систем, имеющих разную раз-

мерность наработки, необходимо, чтобы количественные показатели опре-

деляющих параметров были приведены к одинаковой размерности для

всех элементов таких систем. Если для какого-нибудь элемента или уст-

ройства, входящего в систему, размерность определяющих параметров на-

Page 97: Ермаков - Основы надежности информационных систем

118

дежности равна величине ra , а для системы в целом она равна A, то ко-

эффициент приведения определяющих параметров элементов к размерно-

сти соответствующих параметров системы выразится в виде соотношения

rr a

A=γ .

Тогда, чтобы привести характеристики наработки элементов, имею-

щих размерность r , к размерности, например, времени, их следует умно-

жить на коэффициент приведения:

.

;

][

][

rtrчасt

rrчас TT

σγσ

γ

=

=

При проведении статистических испытаний на надежность и расчетов

в качестве определяющего параметра применяется случайная величина –

суммарное время наработки ТУ, взятых под наблюдение в течение неко-

торого времени эксплуатации этих устройств:

∑=

Σ =N

iitt

1,

где it – время наработки до отказа i-о ТУ.

Для непрерывно работающих невосстанавливаемых ТУ можно запи-

сать

∑−

=Σ +−+=

1

1,)1(

n

ini tnNtt

где it – время наработки i-о невосстанавливаемого ТУ;

nt – время, соответствующее n случаям отказа ТУ.

Практически для вычисления суммарного времени наработки весь ис-

пытательный период рабочего времени разбивается на разряд, соответст-

вующий равным отрезкам времени t∆ .

Page 98: Ермаков - Основы надежности информационных систем

119

Если in∆ – число отказов в течение i -о отрезка рабочего времени, то

суммарное время наработки всех функционирующих в процессе эксплуа-

тации ТУ может быть выражено следующим образом:

,)5,0(5,15,0))((( 21 kntkntntttnNt ∆∆−++∆∆+∆∆+−=Σ L

где tktt ∆−∆∆ )5,0(,;5,1;5,0 K – времена наработки отказавших ТУ;

k – полное число разрядов.

Учитывая, что

∑=

∆=∆++∆+∆=k

jjk nnnntn

121)( K

и

,ktt =∆

получим

∑=

Σ ∆−+−=k

jjnjk

kNtt

1.])5,0(1[

Для восстанавливаемых ТУ суммарное время наработки равно

,1 1

∑ ∑= =

Σ =N

i

k

jjitt

где jit – время наработки j -о ТУ в течение i -о интервала испытательного

времени.

Одной из основных количественных характеристик долговечности яв-

ляется среднее время наработки.

Среднее время наработки ТУ измеряется математическим ожиданием

суммарного времени их наработки от начала до заданного момента време-

ни эксплуатации.

Среднее статистическое время наработки в границах заданного

времени эксплуатации есть отношение суммарного времени наработки од-

Page 99: Ермаков - Основы надежности информационных систем

120

нотипных ТУ за весь период времени эксплуатации к общему этих уст-

ройств:

.*NtT Σ=

На практике в качестве одного из основных критериев часто применя-

ется среднее время наработки на один отказ. Эта величина оценивается

отношением суммарного времени наработки однотипных ТУ за заданное

время эксплуатации к числу отказавших за это же время устройств:

.*ntTно Σ=

8.2. Экспериментальное определение характеристик надежности

Вероятностные элементы характеристик надежности ТУ могут быть

получены на основании использования статистических данных по резуль-

татам эксплуатации или путем проведения специальных испытаний. Осно-

вой для экспериментального определения надежности ТУ в процессе экс-

плуатации являются статистические данные об отказах. Для сбора сведе-

ний об отказах применяются специальные формы учета, в которые входят

такие показатели, как, например, наименование отказавшего элемента,

время его работы до отказа, общее количество однотипных элементов,

подвергшихся испытаниям.

Достоинством метода получения статистических сведений о фактиче-

ской надежности ТУ в процессе их эксплуатации являются реальные усло-

вия и режимы работы, обеспечивающие возможность получения наиболее

точной информации. К недостаткам этого метода можно отнести несвое-

временное получение необходимой информации, в виду того, что характе-

ристики надежности становятся известными только после накопления

опыта эксплуатации.

Page 100: Ермаков - Основы надежности информационных систем

121

Несмотря на достоинства способа получения информации путем про-

ведения специальных испытаний, он не всегда является экономически це-

лесообразным из-за необходимости проведения длительных и дорогостоя-

щих экспериментов.

Применение ускоренных испытаний элементов и сложных ТУ, при ко-

торых подвергающиеся испытаниям устройства работают в режиме повы-

шенных нагрузок, позволяет в значительной степени сократить время про-

ведения испытаний и отчасти сократить объем выборки для испытаний.

Для экспериментального определения статистических характеристик

надежности могут применяться несколько способов планирования испыта-

ний, что показано в таблице 3.

Таблица 3

Номер способа испыта-ний

Прове-дение замены элемен-тов

Фиксация моментов отказов

Цели испытаний

Результаты испы-таний

1

Нет

Да

Испытания ведутся до отказа всех устройств

Суммарная нара-ботка 2

Нет

Да

Число отказов при Nn <

Суммарная нара-ботка 3 Нет Нет Длительность испытаний

Число отказов 4

Да

Да

Число отказов

Длительность ис-пытаний 5 Да Да Длительность испытаний Число отказов

Первые три способа характеризуются фиксированным начальным

объемом выборки без применения замены отказавших устройств. В случае

проведения испытаний до отказа всех элементов выборочной совокупно-

сти (способ первый) имеется возможность получить полное распределение

времени появления отказов, однако при определении статистических ха-

рактеристик надежности следует иметь в виду, что различные по своей

природе отказы имеют различные законы распределения. Так, внезапные

Page 101: Ермаков - Основы надежности информационных систем

122

отказы имеют экспоненциальное распределение, а отказы, появляющиеся в

результате износа и старения – нормальное распределение. Кроме того,

средняя наработка на один внезапный отказ внT имеет существенно боль-

шее значение, чем средняя наработка на один постепенный отказ псT . Оп-

ределить статистическое значение величины внT можно лишь на этапе

нормальной эксплуатации. Статистическое значение величины псT опре-

деляется значительно позже, когда вероятность появления отказов в ре-

зультате износа становится доминирующим фактором с точки зрения на-

дежности и численно подавляет вероятность появления внезапных отказов

(рис. 22).

Рис. 22. Кривые вероятности безотказной работы: pвн(t) — при действии внезапных от-

казов; pи (t) — при действии износовых отказов; p(t) — при одновременном действии

внезапных и износовых отказов

Рассматриваемый способ позволяет определить интенсивность отка-

зов технических устройств и другие характеристики надежности.

При проведении испытаний до отказа лишь некоторого определенного

количества элементов выборки (способ второй) имеется возможность зна-

чительно сократить продолжительность испытаний и вместе с этим ис-

ключить влияние износа и старения на надежность элементов. Однако, в

этом случае, следует иметь в виду, что при этом достоверность оценки на-

0

p(t)

t

pи(t)

pвн(t)

p(t)=pвн(t)+ pи(t)

Page 102: Ермаков - Основы надежности информационных систем

123

дежности несколько понижается. При этом на испытание ставится также

N элементов, но испытания заканчиваются в момент, когда отказывают

ровно Nn < элементов.

Известно, что если N элементов подвергнуть испытаниям способом

«без замены», то n из них будут отказывать в моменты времени

nttt ,,, 21 K , отсчитываемые от начала испытания. Сами испытания пре-

кратятся к моменту времени nt наступления n -го отказа, так что )( nN −

элементов еще не откажут к концу испытания. Тогда оценка максимально-

го правдоподобия средней наработки на один отказ определяется выраже-

нием

n

tnNtT

n

ini∑

=+−+

=

1

1)1(

* ,

где числитель представляет собой суммарную наработку всех испытывае-

мых элементов.

Рассмотрим способ постоянного объема выборки на протяжении всех

испытаний. Элементы, отказавшие в процессе испытаний или эксплуата-

ции, немедленно заменяются новыми из той же генеральной совокупности.

Следовательно, если n элементов отобраны для испытания, общее число

элементов, проходящих испытание, все время остается равным N . Если

испытания прекращаются по истечении времени t при наступлении n -о

отказа, то суммарная наработка для N элементов равна tN , а оценка

средней наработки элементов на отказ в этом определяется как отношение

ntNT =* ,

где N – постоянное число однотипных элементов, проходящих испытание.

Этот вид испытаний не позволяет, за исключением экспоненциально-

го закона распределения, определить непосредственно по первичным ста-

Page 103: Ермаков - Основы надежности информационных систем

124

тистическим данным вид закона распределения. Такой способ и приведен-

ное выражение широко применяются при оценке надежности элементов в

процессе эксплуатация, тем более что в этом случае имеют место главным

образом внезапные отказы и в значительно меньшем количестве отказы,

произошедшие в результате износа и старения.

Определение размера выборки при испытании на надежность. При

ограниченном объеме испытаний возрастает величина риска неправильно-

го решения в приемке или браковке ТУ, проверяемых на надежность.

Величина риска – это убыток, выраженный в стоимостных единицах.

Чтобы увеличить информацию и тем самым уменьшить вероятность ошиб-

ки, можно увеличить объем выборки или число и время испытаний, на ос-

новании которых принимается решение. Однако испытания обладают сами

по себе большой стоимостью, причем пропорциональной величине выбор-

ки, числа и времени испытаний.

Для определения оптимального размера выборки вN следует задаться

предполагаемым значением математического ожидания интенсивности

отказов λm генеральной совокупности элементов. В качестве оценки λm

может быть принята известная средняя интенсивность отказов аналогич-

ных элементов.

Тогда исходная формула для определения величины вN может быть

представлена выражением

tNmmв

n=λ ,

где nm – математическое ожидание количества отказов в выборке вN за

время t .

Пусть определена вероятность того, что за время t произойдет не бо-

лее n отказов, то есть )( nnp ф ≤ , где фn – фактическое количество отка-

Page 104: Ермаков - Основы надежности информационных систем

125

зов, полученных при испытаниях выборки вN . Эта вероятность является

суммой вероятностей несовместных событий, представляющих собой со-

вокупность одновременно существующих не появлений отказов вообще

или появления одного, двух или трех и так далее до появления n отказов

включительно.

Такая вероятность несовместимых событий, согласно закону Пуассо-

на, определяется выражением

,)!!2!1

1(

!)(

!2)(

!1)(

!0)()(

2

210

nmnnnn

tn

tttф

en

mmm

entetetetnnp

−−−−

++++=

=++++=≤

L

L λλλλ λλλλ

Подставляя сюда nm из выражения математического ожидания интенсив-

ности отказов λm :

tmNm вn λ= ,

получим

.!

)()(0

tmNn

j

фвe

jtmNnnp λλ −

=∑=≤

Вероятность того, что число отказов выборки будет не меньше

)1( +n , определяется следующим образом:

tmNn

j

ффвe

jtmNnnpnnp λλ −

=∑−=≤−=+≥

0 !)(1)(1)1( .

Для определения размера выборки при заданных значениях λm и t

следует исходить из наиболее приемлемого числа фn и достаточной по ве-

личине вероятности )( nnp ф ≥ . Тогда по графику (рис. 23), составленно-

му на основания выражений для определения значений величин

Page 105: Ермаков - Основы надежности информационных систем

126

)( nnp ф ≤ и nm , можно найти величину количества устройств выбороч-

ной совокупности

tmmN n

вλ

= .

Пример 5.1. Необходимо провести испытание на надежность новых генераторов посто-

янного тока. Согласно условиям, испытание производится в течение 100 часов. Пред-

полагается, что в течение этого времени произошло более трех отказов с досто-

верностью p(nф ≥ n)=0,95.Ориентировочное значение математического ожидания ин-

тенсивности отказов выбираем из справочных таблиц для аналогичных генераторов по-

стоянного тока λ =3 10 4− . Математическое ожидание количества отказов находим по

графику рис. 23 6=mn . Размер выборки генераторов для испытания определяем по

формуле

=вN 41031006

−××=200 шт.

Рис.23. Вспомогательный график для определения размера выборки при испытании на надежность

8.3. Ускоренные испытания на надежность

Ускоренные испытания ТУ на надежность проводятся в рабочем ре-

жиме с повышенными нагрузками и представляют собой разновидность

метода физического моделирования.

ln nm

0,0001 0,005 0,05 0,1 0,2 0,3 0,9 0,95 0,999 ln p(nф≥ n)

5

2

1

0,5

0,2 0,1

n=12

3 4

56

10

Page 106: Ермаков - Основы надежности информационных систем

127

Для экспоненциального закона вероятность безотказной работы равна

Tt

etp−

=)( .

Если безразмерные коэффициенты модели и реального процесса рав-

ны, то в этом случае метод физического моделирования для опыта приме-

ним. В данном случае

,τ==Tt

Tt

у

у

где уt и уT – временные характеристики надежности при ускоренных

испытаниях. Отсюда

,уу

tTTt =

где kTTу

= – коэффициент подобия.

Аналогично можно написать

)()( уtptp = .

Коэффициент подобия выражает собой величину соответствия време-

ни работы ТУ в условиях нормальной эксплуатации одному часу ускорен-

ных испытаний.

Для любых элементов ТУ вероятность безотказной работы является

функцией комплексной нагрузки Z и времени работы t :

).,( tZp ψ=

Комплексная нагрузка включает в себя различные частные

нагрузки, влияющие на величину интенсивности отказов, например, для

информационных систем:

),,,,,( 0 KVtQUZ ϕ=

Page 107: Ермаков - Основы надежности информационных систем

128

где U – качество электропитания информационной системы;

Q и 0t – влажность и температура окружающей среды соответственно;

V – объем перерабатываемой информации и другие нагрузки.

Комплексная нагрузка может быть выражена в виде безразмерного

коэффициента ξ . Тогда выражение для вероятности безотказной работы

можно записать в виде

),(1 tp ξψ=

и аналогично для ускоренных испытаний:

),(1 ууу tp ξψ= ,

где ууу pptt === ,,ξξ .

Эти равенства и служат критерием соответствия параметров при ус-

коренных испытаниях и в реальных условиях эксплуатации.

Чем больше коэффициент подобия, тем больше сокращается срок

проведения испытаний, однако надо учитывать, что при достаточно боль-

ших значениях коэффициента подобия может быть нарушено соответствие

между вероятностями p и уp .

Для экспоненциального закона распределения оценка среднего време-

ни безотказной работы при ускоренных испытаниях равно

уу tNT 1= ,

где уt1 – время появления первого отказа при ускоренных испытаниях;

N – количество однотипных ТУ или элементов, поставленных на ус-

коренные испытания. Очевидно, что чем больше число N , тем достовер-

нее станет величина уT .

Page 108: Ермаков - Основы надежности информационных систем

129

Из выражения коэффициента подобия k и среднего времени безот-

казной работы при ускоренных испытаниях уT определяется среднее вре-

мя безотказной работы для реальных условий:

уу tkNkTT 1== .

Если определить некоторое заданное время работы испытуемого ТУ

как зt и минимальное допустимое время безотказной работы minT для это-

го случая, то время ускоренных испытаний может быть определено из со-

отношения

kNT

ktt з

уmin== .

Количество ТУ, необходимое для проведения ускоренных испытаний

на надежность с учетом желаемой точности эксперимента, может быть

оценено на основании следующего выражения:

)(lg)](1lg[

y

у

tptQ

N−

= ,

так как статистическая вероятность отказа, полученная при ускоренных

испытаниях N ТУ, определяется по формуле

Nуу tptQ )](*[1)(* −= ,

где )(* уtp – статистическая вероятность безотказной работы одного

испытываемого ТУ.

8.4. Метод статистического моделирования надежности

Метод статистического моделирования надежности основан на так на-

зываемом методе Монте-Карло. Суть метода Монте-Карло состоит в ис-

пользовании данных предыдущего опыта для оценки возможных ситуаций

в будущем. Принципиальная особенность метода состоит в том, что влия-

ние различных случайных факторов в процессе опыта учитывается не рас-

Page 109: Ермаков - Основы надежности информационных систем

130

четным, а игровым способом. В качестве универсального механизма слу-

чайного выбора используется совокупность случайных чисел, равномерно

распределенных в интервале (0 – 1), которые вырабатываются датчиком

случайных чисел. Случайные числа используются для получения дискрет-

ного ряда случайных переменных, имитирующих результаты, которые

можно было бы ожидать в соответствии с вероятностным распределением,

полученным на основании предыдущего опыта.

Метод Монте-Карло можно проиллюстрировать на довольно простом

примере. Пусть под наблюдением находится некоторое количество про-

стых ТУ. Каждые 100 часов число отказов этих устройств соответствует

распределению, приведенному в таблице 4.

Таблица 4

Число отказов Вероятность Кумулятивная вероятность

26

34

31

29

24

28

33

0,105

0,175

0,15

0,145

0,125

0,14

0,16

0,105

0,28

0,43

0,575

0,7

0,84

1,00

По этой таблице строим график распределения кумулятивной вероят-

ности (график закона распределения) случайной величины – число отказов

ТУ (рис. 24).

Пусть в дальнейшем необходимо получить предполагаемое число от-

казов для шести аналогичных периодов времени. Для этого запускается

ранее описанный датчик случайных чисел и фиксируются шесть первых

полученных значений. Пусть это будут значения: 0,1; 0,22; 0,37; 0,17; 0,56;

0,87. Полученные случайные числа можно рассматривать как вероятности.

Page 110: Ермаков - Основы надежности информационных систем

131

Рис. 24. Распределение кумулятивных вероятностей

Они сравниваются с законом распределения вероятностей числа отка-

зов, изображенным на рисунке, а результаты заносятся в таблицу.

Таблица 5

Период времени Случайное число (вероятность) Предполагаемое число отказов

1

2

3

4

5

6

0,1

0,22

0,37

0,17

0,56

0,87

Менее 26

26

34

26

31

28

Для увеличения достоверности эксперимента рекомендуется взять

еще несколько таких выборок. Так как используемые случайные числа

распределены равномерно, то каждое из значений исследуемой величины

(в примере – число отказов) будет в процессе эксперимента появляться с

такой же относительной частотой, что и при реальных условиях эксплуа-

тации или при натурном эксперименте подобного рода. При этом иссле-

дуемая величина приобретает случайный характер. Следовательно, при

применении такого метода получаются результаты, типичные для факти-

ческого поведения исследуемой системы (в нашем случае – закон распре-

1,0

0,8

0,6

0,4

0,2

0 26 34 31 29 24 28 33

Page 111: Ермаков - Основы надежности информационных систем

132

деления числа отказов, полученных на основании ранее проведенных на-

блюдений).

Если мы располагаем совокупностью распределенных случайных ве-

личин iy ( =i 1, 2, n,K ) в интервале (0 – 1), то каждой из них соответст-

вует определенное для данного вида функции yxF =)( число ix , значе-

ние которого находится обратным преобразованием (то есть то значение

аргумента x , для которого iyxF =)( ).

Отсюда следует, что процесс получения последовательности случай-

ных чисел ix с заданным законом распределения )(xF сводится к реше-

нию относительно ix уравнения

∫∞

∞−== ydxxfxF )()( .

Например, если требуется реализовать случайную величину t , рас-

пределенную по экспоненциальному закону с известным значением λ :

texF λ−−= 1)( ,

то на основании ранее приведенных соображений получим

qe t =− −λ1 .

Тогда, очевидно,

)1(ln1ii qt −−=

λ,

где iq – последовательность случайных чисел, распределенных в интерва-

ле (0 – 1), вырабатываемых датчиком случайных чисел.

Результаты моделирования представляют собой статистические сред-

ние значения величин, фиксируемые в качестве искомых параметров:

Page 112: Ермаков - Основы надежности информационных систем

133

∑=

=N

iix x

Nm

1

* 1,

где ix – численное значение искомого параметра в i -ой реализации;

N – число реализаций алгоритма.

В соответствии с известными предельными теоремами теории вероят-

ностей среднее значение стремится к действительному ожиданию случай-

ной величины при неограниченном возрастании числа испытаний.

На практике число испытаний ограничено. В силу этого значение ис-

комого параметра в известной степени будет случайным, то есть вместо

точного будет получено его приближенное значение, или оценка, имеющее

лишь ограниченную точность. Абсолютная величина максимального от-

клонения определяется следующим образом:

mt σε α= ,

где )(2 1 αα−= Фt представляет собой количество величин среднеквад-

ратических отклонений mσ для нормального закона распределения, кото-

рую нужно отложить вправо и влево от центра рассеивания, чтобы вероят-

ность попадания на полученный интервал была равна α . Значения αt та-

булированы, )(1 α−Ф – функция, обратная функции Лапласа. Это означает,

что каждому значению аргумента α соответствует определенная величина

функции Лапласа, равная αt .

Применение современных ЭВМ позволяет осуществить исследование

самых разнообразных систем и при этом имитировать реальные условия

эксплуатации. В этом случае большое значение имеет разработка стан-

дартных программ и алгоритмов для решения типовых задач надежности.

Основой для разработки программ может быть методика, приведенная ни-

же.

Page 113: Ермаков - Основы надежности информационных систем

134

Основной характеристикой, необходимой для проведения расчетов,

является вероятность пребывания системы в определенном состоянии

)(tPi для заданного интервала времени τ , при котором она способна нор-

мально функционировать. В сложных ТУ таких состояний может быть

большое количество. Для определения конкретных состояний на учет бе-

рутся все элементы устройства, каждый из которых может находиться в

одном из двух состояний: исправном или неисправном.

В результате предварительного анализа процесса функционирования

устанавливается число рассматриваемых состояний, при которых ТУ спо-

собно функционировать, при этом маловероятные ситуации обычно ис-

ключаются.

Методика решение задачи оценки надежности методом статистиче-

ского моделирования системы сводится к следующему: заданный интервал

времени τ разбивается на равные промежутки

kt τ

=∆

и для каждого t∆ определяется состояние каждого элемента системы в со-

ответствии с принятыми законами распределения времени безотказной ра-

боты. Эта информация используется для определения рабочих состояний

ТУ, соответствующих некоторому рассматриваемому промежутку времени

t∆ . Все состояния системы нумеруются в порядке убывания показателей

надежности. Затем фиксируется состояние с наименьшим номером, то есть

выбирается состояние системы с наилучшей по надежности комбинацией

исправных элементов.

Аналогично этот процесс повторяется для следующего промежутка

времени и так далее. Многократное повторение этого процесса для каждо-

го t∆ позволяет получить оценку для вероятности исправного j -го со-

стояния )(tp j в момент времени t , принадлежащему τ .

Page 114: Ермаков - Основы надежности информационных систем

135

В результате анализа процесса функционирования системы из множе-

ства различных M состояний выделяется только r состояний, удовлетво-

ряющих требованиям нормального функционирования системы. Исходя из

этого, определяется вероятность безотказной работы системы в течение

времени τ≤t :

∑=

=r

jjc tptP

1)()( .

Достоинства метода статистического моделирования заключаются:

- в возможности не всегда использовать аналитические выражения, связы-

вающие показатели надежности ТУ и его элементов;

- в простоте учета различных законов распределения времени до отказа и

времени восстановления работоспособности ТУ;

- в возможности использовать различные способы отображения временных

изменений значений показателей надежности (гистограммы, средние зна-

чения, дисперсия и другие).

В настоящее время метод статистического моделирования надежности

является достаточно популярным. В комплексе с расчетными методами и

методами натуральных испытаний он представляет собой перспективный

аппарат исследования особенностей поведения и безотказности сложных

ТУ.

8.5. Прогнозирование надежности

Исходным материалом для определения показателей надежности яв-

ляется статистические данные, накопленные за период эксплуатации ТУ.

Однако надежность как комплексный эксплуатационный показатель, в со-

ответствии с ГОСТ 27.002-83, представляет собой «…свойство ТУ выпол-

нять заданные функции, сохраняя свои эксплуатационные характеристики

в заданных пределах в течение требуемого промежутка времени или тре-

буемой наработки в определенных условиях эксплуатации». Исходя из

Page 115: Ермаков - Основы надежности информационных систем

136

этого определения, можно сказать, что значение эксплуатационных харак-

теристик, под которыми понимаются наблюдаемые параметры ТУ, явля-

ются косвенными характеристиками надежности. Действительно, в соот-

ветствии с ранее данным определением, «…если хотя бы один из заданных

параметров ТУ, характеризующих его способность выполнять заданные

функции, не соответствует требованиям, то это ТУ находится в нера-

ботоспособном состоянии». Таким образом, с помощью значений наблю-

даемого параметра можно оценить надежность устройства.

Пусть наблюдения за состоянием некоторого ТУ ведутся с помощью

измерений значений некоторого параметра )(tx в дискретные моменты

времени nttt ,,, 21 K (для простоты рассуждений рассматривается одно-

параметрический случай). Измеренные значения параметра

)(,),(),( *2

*1

*ntxtxtx K являются реализациями случайного процесса

)(tx в указанные моменты времени. Тогда для всех ni ,1= будет спра-

ведливым

iii xtxtx ∆+= )()(* ,

где )( itx – истинное значение наблюдаемого параметра )(tx ;

ix∆ – случайная составляющая наблюдения.

Истинное значение наблюдаемого параметра формируется под влия-

нием условий эксплуатации, процессов износа и старения. Поэтому, в об-

щем случае, для любого значения t

)()( tftx = ,

то есть )(tx является функцией времени. Для большого количества ТУ в

процессе возникновения постепенных отказов или в условиях естественно-

го износа и старения эта функция является монотонной. Следовательно, в

общем случае, для любых целых 0>i имеют место неравенства:

Page 116: Ермаков - Основы надежности информационных систем

137

).()(

);()(

);()(

1

1

10

nn

ii

txtx

txtx

txtx

KKKKK

KKKKK

Рис. 25. Параметр наблюдения динамики надежности ТУ

Пусть функция )(tx является монотонной функцией, для которой но-

минальным значением является ее значение в нулевой момент времени:

)( 0txxн = .

Пусть также известны распределения случайной величины )(* tx в

моменты nttt ,,, 21 K : ),(,),,(),,( 21 ntxftxftxf K . Тогда для любого

момента времени вероятность нахождения значения )(*itx в интервале

x(t)

x2

x1

f(x, t1 ) f(x, tn ) f(x, t2 )

x(t1) x(t2) x(tn)

t 0

t1 t2 tn

Page 117: Ермаков - Основы надежности информационных систем

138

заданных не зависящих от времени ограничений ( 2,1 xx ) будет опреде-

ляться выражением

∫=2

1

),()(x

xii dxtxftp .

Полученное выражение нельзя считать общепринятой вероятностью

безотказной работы в момент времени it . Однако, безусловно, вероятность

нахождения значения )(* tx в любой момент времени в интервале задан-

ных ограничений ( 2,1 xx ) косвенным образом характеризует вероятность

безотказной работы или надежность. Из рисунка 25 видно, что

∫∫∫ ≥≥2

1

2

1

2

1

),(),(),( 21

x

xn

x

x

x

xdxtxfdxtxfdxtxf .

А это означает, что надежность рассматриваемого ТУ со временем падает.

Именно это свойство ТУ монотонно изменять значение наблюдаемых

параметров является основой для прогнозирования надежности. Прогнози-

рование надежности основывается на предсказании состояния ТУ на осно-

ве наблюдения за параметрами систем и использования их значений за

прошедшие периоды эксплуатации. Для практических целей прогнозиро-

вание надежности позволяет проводить заблаговременные ремонтно-

профилактические работы и замену тех устройств, которые по прогнозу

могут отказать во время поездки.

В настоящее время методика прогнозирования разрабатывается глав-

ным образом применительно к постепенным отказам. Однако между по-

степенными и внезапными отказами нет глубокой границы. Большинству

скачкообразным изменениям состояния ТУ (внезапные отказы) предшест-

вует накопление постепенных изменений. С расширением возможностей

контроля состояний число внезапных отказов будет сокращаться за счет

возможности выявлении их предыстории и, следовательно, проведения ме-

Page 118: Ермаков - Основы надежности информационных систем

139

роприятий по не допущению этих отказов. Сфера же применения методов

прогнозирования будет расширяться.

Из опыта эксплуатации сложных систем, в том числе и информацион-

ных, известно, что для большинства их элементов основную часть отказов

составляют постепенные отказы, обусловленные старением и износом и

выражающиеся в постепенном изменении и выходе наблюдаемого опреде-

ляющего параметра за эксплуатационные ограничения. Так, например, ин-

тенсивность постепенных отказов полупроводниковых приборов в 2 – 4

раза превышает интенсивность внезапных отказов. Для большинства элек-

троприборов постепенные отказы составляют 40 – 60 % от всех отказов.

Примерно такие же соотношения имеют место для механических конст-

рукций. Поэтому в качестве основной модели отказа при выборе алгорит-

мов прогнозирования надежности выбирают постепенный отказ.

Математические основы прогнозирования включают в себя методы

экстраполяции, метод наименьших квадратов, приближение функций мно-

гочленами, рядами, методы теории случайных функций и другие методы.

Прогнозирование в общем случае представляет собой исследователь-

ский процесс, в результате которого получаются данные о будущем со-

стоянии системы на основе анализа тенденций её развития с учётом целого

ряда факторов, влияющих на систему. Суть прогнозирования состоит в об-

работке имеющихся данных о характеристиках прогнозируемого процесса.

В ходе такой обработки могут быть получены зависимости, устанавли-

вающие взаимосвязь этих характеристик. Далее с помощью найденных за-

висимостей вычисляются значения самого процесса или его характеристик

на прогнозируемый период. При этом предполагается, что исследуемый

процесс на участке прогнозирования имеет те же тенденции, что и на уча-

стке наблюдения.

Задача прогнозирования формулируется следующим образом: по из-

вестным значениям функции K,2,1,0),( =− ktx kn , полученным в период

Page 119: Ермаков - Основы надежности информационных систем

140

времени 1T , необходимо предсказать (экстраполировать) значения этой

функции K,2,1),( =+ mtx mn для последующих моментов времени

mnnn ttt ++ ,,, 1 K , входящих в период 2T .

Рис. 26. Иллюстрация к прогнозированию значений монотонной функции x(t)

На рисунке 26 показаны прогнозирующая функция )(tF , t∆ – ша-

гом прогноза (наблюдения). В тех случаях, когда наблюдаемый параметр

)(tx представляет собой монотонную неслучайную функцию, в качестве

прогнозирующей функции )( mntF + используют различные интерполяци-

онные полиномы. Так, в частности, по интерполяционной формуле Ла-

гранжа можно получить

∑= −+

−++

−=∆+n

ii

innn

n txnm

Cn

nmmmtmtF0

),(1

)1(!

)()1()1()( K

где n– число предыдущих дискретных наблюдений; m – число шагов

прогноза. Так, для случая =n 3 и =m 2 получается следующий полином:

).()()()()( 32103 10201542 txtxtxtxttF +−+−=∆+

По интерполяционной формуле Ньютона прогнозирующий полином примет вид

,!

)1()( 22

1 2K+∆++∆+=∆+ −− nnnn xmmxmxtmtF

x(t0)

T1 T2

x(t)

xпр

F(t)

x(t)

∆t

t0 t1 t2 tn tn+1 tn+ mt

Page 120: Ермаков - Основы надежности информационных систем

141

где

.

;,,

;,,

11

1323

2212

221211

nk

nk

nk

nnnnnn

nnnnnn

xxx

xxxxxx

xxxxxx

−+

−−−−−−−

−−−−−

∆−∆=∆

∆−∆=∆∆−∆=∆

−=∆−=∆

K

K

Для =n 3 и =m 3 формула Ньютона примет вид:

.1063)3( 03

12

233 xxxxttF ∆+∆+∆+=∆+

Если наблюдаемая функция )(tx является случайной, то задача про-

гнозирования решается методами линейной экстраполяции случайной

функции. Значение функции )( mntF + образуется как линейная

комбинация настоящего и прошлого значений случайных величин

)( kntx − : .)()(

0∑=

−+ =n

kknkmn txatF

На это выражение накладывается условие минимума среднего квадрата

ошибки прогнозирования:

∑ ∑=

==∆−+∆+∑−=

n

k

n

lxlk

n

kxkxxm tlkKaatmkKaK

0

1

00

2 ],)[(])[()0( 2σ

где xK – корреляционная функция процесса )(tx . Значения оптимальных

коэффициентов naaa ,,, 10 K для прогнозирующей функции, для кото-

рых средний квадрат ошибки прогнозирования будет наименьшим, нахо-

дится из системы уравнений:

.])[(])[(1

0

20∑

==∆−+∆+−=

n

lxlx

k

xm tlkKatmkKдaдσ

Для оптимальных naaa ,,, 10 K средний квадрат ошибки прогнозирова-

ния будет минимальным:

Page 121: Ермаков - Основы надежности информационных систем

142

∑=

∆+−=n

kxxm tmkK

0

2min ].)[()0(σ

Значение корреляционной функции находят по статистическим данным предыдущих измерений по приближенной формуле:

K,,,;)()(1)( 2101

* =−

≅∆ ∑−

=+ ν

νν

ν

ν

n

iiix txtx

ntK

Очевидно, что с увеличением частоты наблюдения n увеличивается точность определения )(* tK x ∆ν . При этом особое значение имеет правиль-ный выбор шага t∆ . От неточного знания величины корреляционной функции ошибки прогнозирования возрастают. При прогнозировании надежности в качестве наблюдаемой функции

)(tx могут быть выбраны вероятность безотказной работы )(tp , вероят-

ность отказов )(tq , интенсивность отказов )(tλ . Прогнозирование значе-

ний самого наблюдаемого физического параметра )(tx для моментов вре-

мени mnnn ttt ++ ,,, 1 K позволит для соответствующих точек оценить ве-

роятности нахождения прогнозируемых значений параметра

)(,),(),( 1 mnпрогnпрогnпрог txtxtx ++ K в пределах заданных ограничений

( 2,1 xx ):

++

++

=

=

=

2

1

2

1

2

1

.),()(

,

,),()(

,),()(

11

x

xmnпрогmn

x

xnпрогn

x

xnпрогn

dxtxftp

dxtxftp

dxtxftp

KKKKKKKK

Как известно из ранее представленного материала, эти вероятности являются косвенными оценками вероятности безотказной работы.

Page 122: Ермаков - Основы надежности информационных систем

143

8.6. Методика системы сбора и обработки информации о надежности

Система сбора и обработки информации о надежности должна обес-

печить решение следующих задач:

- определение и оценка показателей надежности;

- выявление конструктивных и технологических недостатков ТУ, сни-

жающих надежность;

- установление деталей и сборочных единиц, ограничивающих надеж-

ность конечных изделий;

- определение закономерностей возникновения отказа;

- оптимизация норм расхода запасных частей, выявление недостатков

эксплуатации и совершенствование системы технического обслужива-

ния и ремонта;

- установление влияния условий и режимов эксплуатации на надежность;

- корректировка нормируемых показателей надежности;

- определение эффективности мероприятий по поддержанию эксплуата-

ционной надежности на необходимом уровне.

Информация о надежности должна быть достоверной. Так как воз-

никновение отказа происходит случайным образом, то внесение любой

субъективности в сведения об отказах приводит к неправильным выводам

о фактическом уровне надежности ТУ. Поэтому нередко для формирова-

ния первичной информации о надежности прибегают к комиссионному

методу оценки неисправности с составлением соответствующих докумен-

тов.

Для формирования правильных выводов и решений по надежности

информация об отказах должна быть полной. Данные по отказам ТУ соби-

раются в межремонтный период (неплановый ремонт) и по отказам, вы-

звавшим увеличение объема ремонта или простоя на плановых ремонтах

(сверхплановый ремонт). В этой информации не учитывается плановая

Page 123: Ермаков - Основы надежности информационных систем

144

смена деталей, поэтому она не может считаться полной. Дело в том, что

сам момент плановой профилактики определяется волевым способом и по-

этому является случайным. Следовательно, замена какой-либо детали,

предусмотренная технологией данной работы, не в полной мере подкреп-

лена объективными причинами. Поэтому некоторая часть информации не

учитывается, что вносит погрешности в определение величины показате-

лей надежности.

Информация должна быть оперативной. Если говорить об информа-

ционных системах как одной из самых передовых категорий современной

техники, то нельзя не отметить, что они являются ядром не только техно-

логий сбора, накопления, обработки и передачи информации, но и систем

управления сложными технологическими и другими процессами. Следова-

тельно, при таких обстоятельствах особое значение приобретает информа-

ция о динамике количества отказов, о качественных и количественных ха-

рактеристиках отказов. Несвоевременное обнаружение отказа какого-либо,

на первый взгляд, малозначительного элемента может иметь тяжелые по-

следствия вплоть до линии связи, сервера или локальной сети. Информа-

ция должна непрерывно и постоянно накапливаться для обоснования объ-

емов работ, выполняемых при плановых профилактиках, а также для оп-

тимизации всей системы обслуживания ИС.

Информация об отказах должна быть краткой, емкой и хорошо обра-

батываться. Для типов ТУ разработаны специальные схемы формализации

и передачи информации. Формы учета должны отвечать требованиям

стандартов и содержать сведения, позволяющие выявить причины и по-

следствия отказа. Основы таких сведений составляют:

- паспортные данные ТУ (ИС);

- адрес организации, где эксплуатируется ТУ;

- режимы эксплуатации;

Page 124: Ермаков - Основы надежности информационных систем

145

- даты всех плановых профилактик или обслуживаний и неплановых

ремонтов;

- характер повреждения (отказа) и возможные причины;

- наработку до отказа от установки или от ремонта и технического об-

служивания.

В системе передачи информации должна быть организована обратная

связь, которая доводила бы обработанную информацию по надежности до

руководства предприятий, что, в свою очередь, позволило бы принимать

своевременные организационные меры, направленные на быстрейшее вы-

явление и устранение причин, вызывающих отказы и неисправности.

С увеличением объема и количества задач по сбору и передаче ин-

формации о надежности возрастает и ее объем. Принятие решений по

управлению надежностью зависит не только от количества информации,

но, прежде всего, от ее качества. Поэтому при создании информационных

хранилищ следует уделять внимание методам оценки качества информа-

ции. Критериями качества являются ценность, достоверность и своевре-

менность.

Вопросы для самоконтроля

1. Какие временные характеристики применяются при статистических

исследованиях надежности?

2. Что собой представляют основные способы планирования испыта-

ний и испытаний на надежность?

3. В чем состоит методика определения размера выборки при испыта-

ниях на надежность?

4. Особенности ускоренного испытания на надежность.

5. Что такое эффективность резервирования?

6. Сущность метода Монте-Карло.

7. Что такое кумулятивная вероятность?

Page 125: Ермаков - Основы надежности информационных систем

146

8. Для чего строится закон распределения кумулятивных вероятно-

стей?

9. Как определяется величина отклонения оценки среднего значения

испытуемого параметра от его математического ожидания?

10. Как определяется оценка вероятности безотказной работы ТУ мето-

дом статистического моделирования?

Page 126: Ермаков - Основы надежности информационных систем

147

Библиографический список

1. Бройдо В.Л. Вычислительные системы, сети и телекоммуникации. –

СПб.: Изд-во Питер, 2004.- 543c.

2. Вентцель Е.С. Теория вероятностей. – М.: Наука, 1964.- 576с.

3. Гнеденко Б.В., Беляев Ю.К., Соловьев А.Д. Математические методы в

теории надежности. М.: Наука, 1965. – 524с.

4. ГОСТ 27.002 – 89. Надежность в технике. Основные понятия. Термины

и определения. – М.: Изд-во стандартов, 1990.

5. Дедков В.К., Северцев Н.А. Основные вопросы эксплуатации сложных

систем. – М.: Высшая школа, 1976. – 406с.

6. Дружинин Г.В., Степанов С.В. и др. Теория надежности радиоэлек-

тронных систем в примерах и задачах. – М.: Энергия, 1976. – 448с.

7. Ермаков А.А. Вероятностные основы авиационного оборудования –

Иркутск: Изд-во Иркутского ВВАИУ, 1991. – 215с.

8. Ермаков А.А., Лучников В.А. и др. Элементы теории надежности и тео-

рии массового обслуживания. – Иркутск: Изд-во Иркутского ВВАИУ,

1989. – 83с.

9. Ермаков А.А. Прогнозирование состояний систем. Научное издание –

Иркутск: ИрИИТ, 1999. -112с.

10. Инженерно-авиационная служба и эксплуатация авиационного обору-

дования. /Под ред. Е.А. Румянцева– М.: Изд-во ВВИА им. проф. Н.Е.

Жуковского, 1970. – 513с.

11. Каган Б.М., Мкртумян И.Б. Основы эксплуатации ЭВМ. – М.: Энерго-

атомиздат, 1988. – 430с.

12. Каштанов В.А., Медведев А.И. Теория надежности сложных систем. –

М.: Изд-во «Европейский центр по качеству», 2002. – 469с.

13. Козлов Б.А., Ушаков И.Б. Краткий справочник по расчету надежности

радиоэлек0тронной аппаратуры. – М.: Советское радио, 1966. – 334с.

Page 127: Ермаков - Основы надежности информационных систем

148

14. Липаев В.В. Надежность программных средств. – М.: Изд-во «Син-

тез», 1998. – 246с.

15. Надежность автоматизированных систем управления. /Под ред. Я.А.

Хачатурова– М.: Высшая школа, 1979. – 271с.

16. Орлов И.А., Корнюшко В.Ф., Бурляев В.В. Эксплуатация и ремонт

ЭВМ, организация работы вычислительного центра. – М.: Энергоатом-

издат, 1989. – 400с.

17. Острейковский В.А. Теория надежности. – М.: Высшая школа, 2003. –

363с.

18. Сандлер Д. Техника надежности систем. – М.: Наука, 1966. – 408с

19. Сапожников В.В., Сапожников Вл.В., Шаманов В.И. Надежность сис-

тем железнодорожной автоматики, телемеханики и связи. – М.: Изд-во

«Маршрут», 2003. – 262с.

20. Соловьев А.Д. Оценка надежности восстанавливаемых систем. –

М.: Знание, 1987. – 271с.

21. Солодов А.В. Теория информации и ее применение к задачам автома-

тического управления и контроля. – М.: Наука, 1967. – 223с.

22. Столлингс У. Структурная организация и архитектура компьютерных

систем, 5-е изд. – М.: Изд-во дом «Вильямс», 2002. – 892с.

23. Устич П.А., Карпычев В.А., Овечников М.Н. Надежность рельсового

нетягового подвижного состава. – М.: Изд-во «Маршрут», 2004. – 412с.

24. Червонный А.А., Лукьященко В.И., Котин Л.В. Надежность сложных

систем. – М.: Машиностроение, 1976. – 391с.

25. Четвергов В.А., Пузанков А.Д. Надежность локомотивов. – М.: Изд-во

«Маршрут», 2003. – 414с.

26. Шеннон Р. Имитационное моделирование систем – искусство и наука.

– М.: Мир, 1978. – 244с.

27. Электроподвижной состав. Эксплуатация, надежность и ремонт /Под

ред. А.Т. Головатого и П.И. Борцова– М.: Транспорт, 1983. – 273с.

Page 128: Ермаков - Основы надежности информационных систем

149

28. Якубайтис Э.А. Информационные сети и системы: справочная книга. –

М.: Финансы и статистика, 1996. – 363с.