42
ANÁLISIS DE FIABILIDAD DE EQUIPOS 2013 ANTONIO ROS MORENO

Análisis de Fiabilidad de Equipos Industriales

Embed Size (px)

DESCRIPTION

La teoría de la fiabilidad es el conjunto de teorías y métodos matemáticos y estadísticos, procedimientos y prácticas operativas que, mediante el estudio de las leyes de ocurrencia de fallos, están dirigidos a resolver problemas de previsión, estimación y optimización de la probabilidad de supervivencia, duración de vida media y porcentaje de tiempo de buen funcionamiento de un sistema.

Citation preview

Page 1: Análisis de Fiabilidad de Equipos Industriales

ANÁLISIS DE

FIABILIDAD DE

EQUIPOS

2013

ANTONIO ROS MORENO

Page 2: Análisis de Fiabilidad de Equipos Industriales

2

MANTENIMIENTO

"Cuando todo va bien, nadie recuerda que existe"

"Cuando algo va mal, dicen que no existe"

"Cuando es para gastar, se dice que no es necesario"

"Pero cuando realmente no existe, todos concuerdan en que debería existir"

A.SUTE

Page 3: Análisis de Fiabilidad de Equipos Industriales

3

1.- TÉCNICAS ESPECÍFICAS DE MANTENIMIENTO

1.1.- Análisis de Fiabilidad de Equipos

1.1.1.- Introducción

1.1.2.- Definiciones básicas

1.1.3.- Teoría de la fiabilidad

1.1.4.- Leyes Estadísticas

1.1.5.- Modos de fallo y modelos de indisponibilidad

1.1.6.- Fiabilidad de los Sistemas

1.1.7.- Sistemas Complejos. Método del Árbol de Fallos

1.1.8.- Mantenibilidad. Disponibilidad

Page 4: Análisis de Fiabilidad de Equipos Industriales

4

1. TÉCNICAS ESPECÍFICAS DE MANTENIMIENTO

1.1. Análisis de Fiabilidad de Equipos

1.1.1. Introducción

Las empresas buscan asegurar y mejorar su competitividad por medio de los

esfuerzos, acciones y decisiones orientadas a garantizar sistemas y equipos operando de

manera eficiente y eficaz, riesgos reducidos, cero incidentes ambiéntales y costos

óptimos. Así los propietarios, la comunidad, los empleados y los clientes se sienten en

un entorno “Confiable”.

Esto significa que para poder mostrar que se es competitivo y exitoso, es

necesario usar mediciones de factores clave como son: la calidad, la productividad, la

rentabilidad, la imagen, la seguridad y la integridad ambiental que en su conjunto

expresan el desempeño. A estos factores las empresas han agregado otro muy

importante como la “Fiabilidad”.

Muchas personas asocian la fiabilidad y la disponibilidad de los equipos en

forma directa y exclusiva con las actividades del mantenimiento, sin embargo, la

verdadera causa raíz de los problemas de disponibilidad y confiabilidad, normalmente

comienzan mucho antes de que el mantenimiento sea requerido.

En estos momentos Fiabilidad es la palabra de moda, la pregunta es ¿Los

responsables del mantenimiento conocen conscientemente las mejores prácticas y

técnicas para buscar la “Optima Fiabilidad”?.

La fiabilidad es concebida durante la etapa de diseño por el equipo o personal de

ingeniería, donde aspectos claves como la fiabilidad intrínseca de cada componente y el

mantenimiento deben ser considerados, posteriormente la fiabilidad de los equipos será

condicionada por las mejores prácticas que se hayan incorporado durante la etapa de

construcción, montaje e instalación y finalmente por la operación del equipo reflejado

en buenas prácticas de trabajo para su buen funcionamiento.

Existen empresas que han ido más allá de considerar la estadística y han

revisado sus prácticas internas, efectuando comparaciones con las que son destacadas en

dicho proceso. Estas organizaciones llegaron a la conclusión de que es imposible hablar

de fiabilidad como una cifra única, por lo tanto es necesario usar diversas mediciones

como indicadores fundamentales de entrada y salida de los procesos.

El concepto más conocido para definir que es fiabilidad es: “La probabilidad de

que un equipo o sistema opere sin fallos durante un tiempo (t) determinado, en unas

condiciones ambientales dadas”. Más sencillamente, fiabilidad es la probabilidad de

que un sistema o producto funcione.

Page 5: Análisis de Fiabilidad de Equipos Industriales

5

Para los sistemas y productos de un solo servicio, (como un misil o los motores

de un cohete de combustible sólido), la definición se reduce a la probabilidad de

funcionar en las condiciones previstas.

La teoría de la fiabilidad es el conjunto de teorías y métodos matemáticos y

estadísticos, procedimientos y prácticas operativas que, mediante el estudio de las leyes

de ocurrencia de fallos, están dirigidos a resolver problemas de previsión, estimación y

optimización de la probabilidad de supervivencia, duración de vida media y porcentaje

de tiempo de buen funcionamiento de un sistema.

En conclusión, la planificación de la fiabilidad exige la comprensión de las

definiciones fundamentales.

1. Cuantificación de la fiabilidad en términos de probabilidad.

2. Clara definición de lo que es un buen funcionamiento.

3. Del ambiente en que el equipo ha de funcionar.

4. Del tiempo requerido de funcionamiento entre fallos.

Si no es así, la probabilidad es un número carente de significado para los

sistemas y productos destinados a funcionar a lo largo del tiempo.

La necesidad de fiabilidad en las instalaciones es tan antigua como la

humanidad, pero es innegable que la creciente importancia de los temas ambientales y

de seguridad han conducido a la necesidad de cambiar nuestra perspectiva debido a:

- Alta presión para disminuir los costos y poder competir

- Mayor número de funciones operacionales realizadas por equipos y máquinas

- Mayores dificultades para hacer intervenciones de mantenimiento, debido al

aumento en utilización de los equipos.

- Tendencias a usar componentes informáticos, electrónicos, neumáticos e

hidráulicos que tienen comportamientos diferentes de desgaste con relación a los

componentes que fallan en función de la edad.

- Legislaciones actuales cada vez más exigentes y poco tolerantes.

En la actualidad, la fiabilidad tiene sus orígenes en la aeronáutica (seguridad de

funcionamiento). Un paso significativo se dio en Alemania cuando se trabajó con el

misil V1. Von Braun consideraba erróneamente que en una cadena de componentes,

Page 6: Análisis de Fiabilidad de Equipos Industriales

6

cuyo buen funcionamiento era esencial para el correcto funcionamiento del conjunto, la

probabilidad de fracaso dependía exclusivamente del funcionamiento del componente

más débil. Erich Pieruschka (matemático del equipo) dio vida a la fórmula de la

fiabilidad del sistema a partir de la fiabilidad de los componentes, que permite afirmar

que la fiabilidad del conjunto es siempre inferior a la de sus componentes individuales.

Posteriormente en el sector militar en EEUU, para garantizar el funcionamiento

de sistemas electrónicos y finalmente en el industrial, para garantizar la calidad de los

productos y eliminar riesgos de pérdidas valiosas, dieron el impulso definitivo para su

paulatina implantación en otros campos.

1.1.2. Definiciones básicas

Las definiciones necesarias y básicas para comenzar el estudio de fiabilidad son

las siguientes (incluida la de fiabilidad ya definida con anterioridad):

- Fallo: Es toda alteración o interrupción en el cumplimiento de la función

requerida.

- Fiabilidad (de un elemento): Es la probabilidad de que funcione sin fallos

durante un tiempo (t) determinado, en unas condiciones ambientales dadas.

- Mantenibilidad: Es la probabilidad de que, después del fallo, sea reparado en

un tiempo dado.

- Disponibilidad: Es la probabilidad de que esté en estado de funcionar (ni

averiado ni en revisión) en un tiempo dado.

Si adoptamos, para simplificar, que el esquema de vida de una máquina consiste

en una alternancia de "tiempos de buen funcionamiento" (TBF) y "tiempos de averías"

(TA):

Figura 12

Page 7: Análisis de Fiabilidad de Equipos Industriales

7

en los que cada segmento tiene los siguientes significados:

TBF: Tiempo entre fallos

TA: Tiempo de parada

TTR: Tiempo de reparación

TO: Tiempo de operación

n: Número de fallos en el periodo considerado

podemos definir los siguientes parámetros como medidas características de dichas

probabilidades:

a) El tiempo medio entre fallos (MTBF) como medida de la Fiabilidad:

y su inversa (λ) conocida como la tasa de fallos:

b) El tiempo medio de reparación (MTTR) como medida de la Mantenibilidad:

y su inversa (μ) conocida como la tasa de reparación:

Page 8: Análisis de Fiabilidad de Equipos Industriales

8

c) La disponibilidad (D) es una medida derivada de las anteriores:

Es decir, la disponibilidad es función de la fiabilidad y de la mantenibilidad.

Otra medida de la fiabilidad es el factor de fiabilidad:

donde:

HT: Horas totales del periodo

HMC: Horas de Mantenimiento Correctivo (Averías)

HMP: Horas de Mantenimiento Preventivo (programado)

Y otra medida de la disponibilidad es el factor de disponibilidad:

donde se pone claramente de manifiesto que la disponibilidad es menor que la

fiabilidad, puesto que al contabilizar el tiempo de buen funcionamiento, en la

Page 9: Análisis de Fiabilidad de Equipos Industriales

9

disponibilidad se prescinde de todo tipo de causas posibles (se incluye el tiempo de

mantenimiento preventivo programado):

Sin embargo en el cálculo de la fiabilidad, al contabilizar el tiempo de buen

funcionamiento, no se incluye el tiempo de mantenimiento preventivo programado.

El esquema siguiente es un resumen de los parámetros que caracterizan la vida

de los equipos:

Figura 13

Page 10: Análisis de Fiabilidad de Equipos Industriales

10

1.1.3. Teoría de la fiabilidad

Hemos definido antes la FIABILIDAD como la probabilidad de que un

elemento, conjunto ó sistema funcione sin fallos, durante un tiempo dado, en unas

condiciones ambientales dadas. Ello supone:

a) Definir de forma inequívoca el criterio que determina si el elemento funciona

ó no.

b) Que se definan claramente las condiciones ambientales y de utilización y se

mantengan constantes.

c) Que se defina el intervalo t durante el cual se requiere que el elemento

funcione.

-Para evaluar la fiabilidad se usan dos procedimientos:

a) Usar datos históricos. Si se dispone de muchos datos históricos de aparatos

iguales durante un largo período no se necesita elaboración estadística. Si son pocos

aparatos y poco tiempo hay que estimar el grado de confianza.

b) Usar la fiabilidad conocida de partes para calcular la fiabilidad del conjunto.

Se usa para hacer evaluaciones de fiabilidad antes de conocer los resultados reales.

-Consideramos t "tiempo hasta que el elemento falla" como variable

independiente (período al que se refiere la fiabilidad).

.Función de distribución de probabilidad: f (t)

.Probabilidad de que el elemento falle en instante t: f (t) dt

Figura 14

Page 11: Análisis de Fiabilidad de Equipos Industriales

11

.Probabilidad de que falle en el instante t ó antes (infiabilidad):

donde F(t) es la función de distribución de probabilidad acumulada

.Fiabilidad, R(t), Probabilidad de que funcione todavía en el instante t:

.Tasa de fallos, λ(t), es la función de distribución de Probabilidad (condicional)

de un elemento que ha funcionado bien hasta el instante t, y falla en el tiempo

comprendido entre t y t+dt.

.Véase la diferencia entre f (t) y λ (t):

-f (t) dt representa la fracción de población que falla entre t y t+dt, respecto

una población sana en t=o (original).

-λ (t)dt representa la fracción de población que falla entre t y t+dt, respecto

una población sana en el momento t (es menos numerosa, ó como máximo igual a

la población original).

Page 12: Análisis de Fiabilidad de Equipos Industriales

12

.f (t) dt es una probabilidad a priori, referida al instante inicial de

funcionamiento.

.λ (t)dt es una probabilidad a posteriori, condicionada a la información cierta de

que el aparato ha funcionado bien hasta el momento t.

Relación entre fiabilidad R(t) y tasa de fallos (t)

Prob.de que falle en período t+dt = Prob.de que funcione todavía en t x Prob.de

que falle en t+dt, estando bien en t.

.Recordando que:

Separando variables:

e integrando entre 0 y t:

Page 13: Análisis de Fiabilidad de Equipos Industriales

13

ya que ln R (0)= 0 porque R (0)= 1.

La fórmula anterior que es la fiabilidad en función de la tasa de fallos, junto con

las siguientes:

constituyen tres relaciones, entre cuatro funciones [f (t), F (t), R (t), λ (t)], por lo que

conociendo una cualquiera de ellas, se conocen las otras tres.

Análisis de la función tasa de fallos (t)

.Tiene la dimensión inversa de un tiempo, por lo que puede interpretarse como

"Número de fallos en la unidad de tiempo".

-Al representarla gráficamente para una población homogénea de componentes,

a medida que crece su edad t:

Figura 15

Page 14: Análisis de Fiabilidad de Equipos Industriales

14

resulta ser la llamada curva de la bañera, en la que se distinguen claramente tres

períodos:

A: .Período de Mortalidad Infantil

.Fallos de rodaje, ajuste o montaje

.La tasa de fallos es decreciente

.Propio de componentes de Tecnología Mecánica.

B: .Período de Fallos por azar (o aleatorios)

.Tasa de fallos constante

.Propio de materiales de Tecnología eléctrica/electrónica.

C: .Período de Fallos por Desgaste ó Vejez

.Tasa de fallos creciente

.Propio de materiales de Tecnología mecánica ó electromecánica (desgaste

progresivo).

En general, la curva λ(t) resulta de la superposición de la curva (a) asociada a los

defectos iniciales tras la puesta en servicio y la curva (b) que marca los fenómenos de

desgaste o deterioro de la función.

Figura 16

De manera que, dependiendo de la influencia de cada uno de los fenómenos

mencionados, la tasa de fallo tendrá una forma distinta. Así en los equipos mecánicos

predominan los fenómenos asociados al desgaste y su tasa de fallo crece con el tiempo:

Page 15: Análisis de Fiabilidad de Equipos Industriales

15

Figura 17

En los últimos años ha habido una polémica considerable acerca de la exactitud

de la descripción proporcionada por la curva de la bañera. En vista de las pautas de

obsolescencia y de los nuevos resultados de las investigaciones, existen razones para

poner en duda el concepto. No obstante, como subraya la relación existente entre la

fiabilidad de los dispositivos y la forma de la función de riesgo, la idea de la curva de la

bañera proporciona un punto de partida excelente para la definición de los modelos de

distribución de probabilidades.

La estadística ha demostrado que, tras estudiar el comportamiento de los equipos

en una planta industrial, el ciclo de vida de la mayoría de los equipos no se corresponde

únicamente con la curva de bañera, sino que se diferencian 6 tipos de curvas:

Figura 18

Page 16: Análisis de Fiabilidad de Equipos Industriales

16

Curiosamente, la mayor parte de los equipos no se comportan siguiendo la curva

A ó “curva de bañera”. Los equipos complejos se comportan siguiendo E, en el que la

probabilidad de fallo es constante a lo largo de su vida, y el modelo F, en el que tras una

etapa inicial con una mayor probabilidad de fallo infantil, la probabilidad de fallo se

estabiliza y permanece constante. Eso hace que no sea identificable un momento en el

que realizar una revisión sistemática del equipo, con la sustitución de determinadas

piezas, ante la imposibilidad de determinar cuál es el momento ideal, pues la

probabilidad de fallo permanece constante. Incluso, puede ser contraproducente si curva

de probabilidad sigue el modelo F, pues estaríamos introduciendo mayor probabilidad

de fallo infantil al sustituir determinadas piezas:

Figura 19

Por todo ello, en muchas plantas industriales es conveniente abandonar la idea

de un mantenimiento sistemático para una buena parte de los equipos que la componen,

y recurrir a las diversas técnicas de mantenimiento condicional o predictivo.

Page 17: Análisis de Fiabilidad de Equipos Industriales

17

1.1.4. Leyes Estadísticas

Ahora vamos a ver la forma de estas funciones para cada uno de los tres aspectos

de la función λ (t): constante, creciente y decreciente.

a) λ = cte. Ley exponencial (exponencial negativa)

b) λ (t) es variable. Ley de Weibull. Ley con tres parámetros que permiten

ajustar las tasas de fallos crecientes ó decrecientes.

β: Parámetro de forma β > 0

η: Parámetro de escala η > 0

γ: Parámetro de posición -∞ < γ < +∞

Figura 21

Page 18: Análisis de Fiabilidad de Equipos Industriales

18

Si β < 1. λ decrece. Período A

β = 1. λ constante. Período B

β > 1. λ crece. Período C

De forma simplificada:

t: variable de duración 0 < t < ∞

T: duración característica, T > 0

β: parámetro de forma

Page 19: Análisis de Fiabilidad de Equipos Industriales

19

Si β < 1. λ decrece. Fallos infantiles

Β = 1. λ constante. Fallos aleatorios

Β > 1. λ crece. Fallos por desgaste

Para un período de tiempo t, igual a la duración característica T:

La duración característica T es la duración hasta que han fallado el 63,2% de la

población.

-Representando la función de Weibull gráficamente con escala doble logarítmica

en ordenadas y logarítmica en abscisas, R(t) adopta forma de recta de pendiente β. En

dicho gráfico es posible determinar la fiabilidad R para cualquier duración t. Sin

embargo, la aplicación de las técnicas estadísticas permiten una estimación más precisa.

-El conocimiento de las leyes de evolución de λ(t) en función del tiempo puede

ser útil para establecer la política de mantenimiento más adecuada para cada tipo de

componente de los equipos. En componentes de tasa de fallo constante un cambio de

pieza no aporta una mayor fiabilidad, es más, presentaría un valor de fiabilidad menor al

principio de su puesta en servicio, por posibles defectos de fabricación. Sin embargo, en

componentes con tasa de fallo creciente con el tiempo está perfectamente justificada la

sustitución preventiva antes de que la tasa de fallos alcance un valor inadmisible.

1.1.5. Modos de fallo y modelos de indisponibilidad

Los equipos pueden manifestar sus fallos en tres intervalos de tiempo: mientras

están en espera, cuando se demanda su actuación o cuando están en operación o

funcionamiento.

Los parámetros que a continuación se definen serán utilizados para el cálculo de

las indisponibilidades de los sucesos básicos mediante las expresiones matemáticas que

procedan para cada modo de fallo.

Page 20: Análisis de Fiabilidad de Equipos Industriales

20

- Tasa de fallos ( ): Esta determinada por el número de fallos que ocurren en un

equipo dividido por el tiempo transcurrido.

- Tasa de fallos en operación ( o): Esta determinada por el número de fallos que

tiene un equipo cuando está en operación dividido por el tiempo de operación en el que

ocurren los fallos.

- Tasa de fallos en espera ( s): Esta determinada por el número de fallos que tiene

un equipo cuando está en espera dividido por el tiempo de espera en el que ocurren los

fallos.

- Indisponibilidad (F): Es el parámetro que en términos probabilísticos define la

no disponibilidad de un equipo en un cierto instante de tiempo.

- Indisponibilidad por demanda (Fd): Es el número de fallos que tiene un equipo

en la demanda de actuación dividido por el número de demandas efectuadas.

- Tiempo de operación (TO): Es el tiempo en que un equipo está en

funcionamiento o en operación.

- Tiempo entre pruebas (Tep): Es el intervalo de tiempo entre revisiones

periódicas de un equipo.

- Tiempo de prueba (Tp): Es el tiempo medio que dura la prueba o revisión de un

equipo.

- Tiempo de reparación (TTR): Es el tiempo medio de reparación de un equipo

que se ha detectado fallado.

La función indisponibilidad, definida por la ecuación se

particulariza para cada modo de fallo, adquiriendo expresiones matemáticas diferentes:

Fallo en espera

Se produce en componentes que están en espera para entrar en operación y

estando en este estado fallan. Ejemplos de este tipo de componentes son las válvulas de

seguridad, las bombas de refrigeración, redundantes o no, pero que no estén

refrigerando en ese periodo, los grupos electrógenos, las alarmas, etc.

Los mecanismos por los que estos componentes fallan son dependientes del

tiempo, por corrosión o suciedad, envejecimiento, etc. y la tasa de fallos se ajusta a una

distribución exponencial

Page 21: Análisis de Fiabilidad de Equipos Industriales

21

por lo que la indisponibilidad puntual adquiere la expresión:

Estos componentes pueden ser probados periódicamente o no, siendo la

indisponibilidad media distinta en cada caso.

- Componentes en espera sometidos a pruebas periódicas: la indisponibilidad

media en el intervalo entre pruebas Tep es:

- Componentes en espera no sometidos a pruebas periódicas: la indisponibilidad

media en el tiempo que le queda al componente es:

donde Tvp y Tv son el tiempo de vida previsto del componente y el tiempo que lleva en

funcionamiento, respectivamente.

Page 22: Análisis de Fiabilidad de Equipos Industriales

22

Indisponibilidad por pruebas

Asociada a componentes en espera que son probados o revisados periódicamente

con un intervalo Tep y en los que las revisiones les hace estar indisponibles durante el

tiempo de pruebas Tp.

Indisponibilidad por mantenimiento preventivo

Asociada a componentes a los que se realiza mantenimiento preventivo con un

ciclo de duración Tm, dejándolos indisponibles durante el tiempo de reparación TTR.

Fallo en demanda

Se da en componentes que fallan cuando se les demanda un cambio de estado,

por ejemplo cuando el componente está funcionando y se le demanda que pare o cuando

el componente está en espera y se le demanda que entre en operación, fallando en el

arranque. Se le asocia la distribución estadística binomial, ya que la demanda solo

puede tomar dos valores, éxito o fracaso:

donde x y n son el número de fallos en demanda y el número de demandas efectuadas,

respectivamente.

Page 23: Análisis de Fiabilidad de Equipos Industriales

23

Fallo en operación

Se da en componentes que fallan durante el tiempo de operación TO. La tasa de

fallos se ajusta a la distribución exponencial:

Por lo que la probabilidad de que un componente en operación falle antes de que

finalice el tiempo de operación está determinada por:

Fallo humano

Son fallos producidos en componentes debido a un error humano en su

operación. Este modo de fallo se encuentra tratado de forma sucinta en las Notas

Técnicas de Prevención 360 (Fiabilidad humana: conceptos básicos) y 377 (Fiabilidad

humana: métodos) del Instituto Nacional de Seguridad e Higiene en el Trabajo

1.1.6. Fiabilidad de los Sistemas

Tratamos ahora de establecer la relación que liga la fiabilidad de un sistema

complejo con la de sus componentes individuales.

La fiabilidad de un sistema no es otra que la probabilidad de ocurrencia del

acontecimiento "NO HAY FALLOS", lo cual es, a su vez, resultado de una serie de

acontecimientos más simples.

Las partes componentes del sistema se pueden comportar, desde el punto de

vista de la fiabilidad de forma independiente ó no.

El funcionamiento, desde el punto de vista de la fiabilidad, de un sistema se

representa mediante esquemas de bloques adecuadamente conectados, de forma que

cada bloque representa un elemento ó subsistema.

Page 24: Análisis de Fiabilidad de Equipos Industriales

24

Estos esquemas no corresponden con los esquemas funcionales de la instalación

(No hay correspondencia con el despiece físico), sino que representan la dependencia

lógica del acontecimiento "fallo del sistema".

a) Sistemas en serie.

El fallo de uno cualquiera de sus componentes determina el fallo del sistema

completo

Figura 22

Si λ= cte. entonces

λ1 λ2 λ3 λn

Page 25: Análisis de Fiabilidad de Equipos Industriales

25

b) Sistemas en paralelo.

Basta que funcione un elemento

para que funcione todo el sistema.

Se llaman también sistemas

redundantes.

En este caso se simplifican los

cálculos usando la función infiabilidad

Figura 23

de manera que F(t)=F1(t) x F2(t) x...x Fn(t)

con lo que

Cuantos más elementos hay en paralelo, mejor es la fiabilidad.

λ3

λn

λ1

λ2

Page 26: Análisis de Fiabilidad de Equipos Industriales

26

1.1.7. Sistemas Complejos. Método del Árbol de Fallos

Normalmente, en los equipos, los componentes forman un sistema complejo que

en parte son subsistemas en serie y en parte subsistemas en paralelo.

De los diversos métodos existentes para estudiar la fiabilidad de sistemas

complejos el que mejor se adapta a un tratamiento informático es el MÉTODO DEL

ÁRBOL DE FALLOS.

Consiste en descomponer, escalonadamente, la ocurrencia de un suceso en un

sistema lógico secuencial integrado por unidades (elementos) operativos

independientes, hasta alcanzar los sucesos tomados como iniciales (primarios). Cada

unidad queda identificada por su denominación y la función (operación-fallo) que se

espera de ella.

Los estados en que pueden encontrarse las unidades son dos: Operativo-Fallo.

A partir del suceso en estudio se responde a la pregunta:

é

é

Page 27: Análisis de Fiabilidad de Equipos Industriales

27

Para la representación gráfica de los árboles de fallos y con el fin de normalizar

y universalizar la representación se han elegido ciertos símbolos que se representan en

las siguientes tablas:

Page 28: Análisis de Fiabilidad de Equipos Industriales

28

Se comienza eligiendo el suceso final objeto del análisis. A partir de aquí se van

determinando los sucesos previos inmediatos que, por combinación lógica, pueden ser

su causa. El proceso se repite hasta alcanzar una serie de "sucesos básicos",

denominados así porque no precisan de otros anteriores a ellos para ser explicados.

También alguna rama puede terminar por alcanzar un "suceso no desarrollado" en otros,

sea por falta de información o por la poca utilidad de analizar las causas que lo

producen.

Los nudos de las diferentes puertas y los "sucesos básicos o no desarrollados"

deben estar claramente identificados.

Estos "sucesos básicos o no desarrollados" que se encuentran en la parte inferior

de las ramas del árbol se caracterizan por los siguientes aspectos:

- Son independientes entre ellos.

- Las probabilidades de que acontezcan pueden ser calculadas o estimadas.

Para ser eficaz, un análisis por árbol de fallos debe ser elaborado por personas

profundamente conocedoras de la instalación o proceso a analizar y que a su vez

conozcan el método y tengan experiencia en su aplicación; por lo que, si se precisa, se

deberán constituir equipos de trabajo pluridisciplinarios (técnico de seguridad, ingeniero

del proyecto, ingeniero de proceso, etc.) para proceder a la reflexión conjunta que el

método propicia.

Una vez desarrollado para cada suceso preestablecido, es posible determinar

cualitativa y cuantitativamente la fiabilidad del sistema.

El análisis cualitativo permite determinar los sucesos (fallos mínimos) que deban

presentarse (condición necesaria y suficiente) para que ocurra el suceso principal.

El análisis cuantitativo (mediante el álgebra de Boole) determina la fiabilidad del

sistema si se conocen la de los distintos elementos o sucesos primarios.

La modelización del sistema mediante el árbol de fallos o errores y el análisis

cualitativo y cuantitativo del mismo están tratados en la NTP-333 "Análisis

probabilístico de riesgos: Metodología del Árbol del fallos y errores", a la que se remite

al lector para su mejor comprensión.

Page 29: Análisis de Fiabilidad de Equipos Industriales

29

Ejemplo: Fallos de una linterna eléctrica de mano para que no funcione.

Page 30: Análisis de Fiabilidad de Equipos Industriales

30

Si Fi representa la tasa de fallo de cada evento:

F0 = F1 . F2

F2 = F3 + F4 F0 = F1 . (F3 + F5 + F6) = F1 . F3 + F1 . F5 + F1 . F6

F4 = F5 + F6

Cuando es conocida la probabilidad de cada suceso primario, es posible calcular

la del fallo principal. (Datos históricos/Datos de fabricantes).

De esta forma se determina si es aceptable ó no el fallo principal, y nos ayuda a:

- Determinar la fiabilidad de elementos, subsistemas y sistemas.

-Analizar la fiabilidad de distintos diseños (análisis comparativo).

-Identificar componentes críticos, que pueden ser causa de sucesos

indeseables.

- Analizar fallos críticos que previamente han sido identificados por un

análisis AMFE.

Como consecuencia de estos análisis podemos decir que el método del árbol de

fallos se podría utilizar para:

- Evidenciar la fiabilidad de un sistema

- Comparar con la de otros sistemas

- Proponer modificaciones en el diseño

e incluso para establecer el plan de su mantenimiento preventivo (gamas y frecuencia).

Para facilitar el análisis cuantitativo, la tasa de fallos de cada suceso se asigna, a

falta de datos precisos, utilizando valores relativos arbitrarios como la tabla de

probabilidades relativas de la Atomic Energy of Canada Ltd.:

Muy probable 10-2

Probable 10-3

No probable 10-4

Improbable 10-5

Page 31: Análisis de Fiabilidad de Equipos Industriales

31

Muy improbable 10-6

Extremadamente improbable 10-7

En las puertas Y la probabilidad es igual al producto de las probabilidades.

Como están expresadas en forma de potencias de 10, sólo habrá que sumar exponentes:

10-3

x 10-4

= 10-7

En las puertas OR la probabilidad es igual a la suma de probabilidades. Por la

misma razón (potencias de 10) se puede simplificar tomando la mayor y despreciando el

resto:

10-4

+ 10-3

+ 10-6 ≈ 10

-3

Análisis de un sistema de refrigeración

En este apartado se presenta un caso práctico de la aplicación de los datos de

fiabilidad de componentes. La aplicación de esta metodología puede ser tanto para el

análisis de seguridad de las instalaciones, como para mejorar su mantenimiento

preventivo.

Se realiza el análisis de la disponibilidad del sistema de refrigeración de un

reactor discontinuo ("batch"), representado, esquemáticamente en la figura 1. Este

sistema, además de ser un ejemplo poco complejo y relativamente fácil de analizar,

corresponde a una instalación muy extendida en la industria química de proceso y en

particular en las PYMES del sector químico, por ejemplo en la industria de química

fina.

Page 32: Análisis de Fiabilidad de Equipos Industriales

32

La instalación de refrigeración está formada, básicamente por dos tramos iguales

y cada tramo consta de:

- 1 bomba centrífuga para impulsar el agua (B1/B2).

- 2 válvulas de accionamiento manual para aislar la bomba (V11/V21 y V12/V22)

- 1 válvula de retención para evitar que se produzca flujo inverso (VR1/VR2).

- 1 válvula de control, gobernada por un controlador de temperatura del reactor.

Elaboración del árbol de fallos

En el análisis de fiabilidad del sistema de refrigeración se ha empleado la

metodología de árbol de fallos y errores humanos (véase NTP-333). El paso previo a la

elaboración del árbol en sí, es la identificación del suceso no deseado cuya probabilidad

se requiere obtener y los sucesos y circunstancias que deben concurrir para llegar al

mismo. Esta etapa previa puede ser realizada por medio de:

- Un análisis histórico de accidentes en instalaciones similares, aportando

experiencias similares.

- Un análisis sistemático, empleando metodologías como el análisis funcional de

operabilidad (HAZOP) (véase NTP-238), el análisis modal de fallos y efectos

(FMEA), etc.

- La experiencia del personal de la planta y del analista.

En la figura 27 se presenta el árbol de fallos utilizado para analizar la

indisponibilidad del sistema. En el presente caso la indisponibilidad estudiada es la falta

de refrigeración en el reactor (suceso no deseado o Top event).

Los sucesos intermedios que inciden directamente al TOP son: fallo en el tramo

1 y fallo en el tramo 2. Como se ha indicado anteriormente, los dos tramos son

idénticos, por lo que, sólo se comenta uno, obviamente tal duplicidad aminora

significativamente la indisponibilidad total. Los sucesos considerados para analizar el

posible fallo en el tramo son:

- Válvula manual V11 cerrada erróneamente u obstruida.

- Válvula de retención VR1 falla en la apertura.

- Válvula manual V12 cerrada erróneamente u obstruida.

Page 33: Análisis de Fiabilidad de Equipos Industriales

33

- Fallo en la válvula de control VC1.

- Fallo en la bomba B1.

Page 34: Análisis de Fiabilidad de Equipos Industriales

34

Los sucesos considerados por los que la válvula de control dejará de operar

correctamente son, básicamente:

- Fallo del controlador de temperatura del reactor:

.- Fallo de la señal de apertura SA.

.- Actuación de señal de cierre SC.

- Fallo a la demanda.

- Fallo en operación.

- Fallo del suministro eléctrico.

El segundo suceso y el tercero son modos de fallo de la válvula.

Los sucesos considerados por los que la bomba dejará de operar correctamente o

no estará disponible son, básicamente:

- Indisponibilidad de la bomba por pruebas o por mantenimiento.

- Fallo a la demanda.

- Fallo en operación.

- Fallo en espera.

- Fallo del suministro eléctrico.

- Fallo del controlador de temperatura del reactor:

.- Fallo de la señal de apertura SA.

.- Actuación de señal de cierre SC.

Los cuatro primeros sucesos son modos de fallo de la bomba.

El fallo del suministro eléctrico no se ha desglosado en más sucesos básicos,

recibiendo el nombre de suceso no desarrollado. A este recurso se recurre cuando no se

tiene más información para desglosar un suceso intermedio, su desarrollo no aporta más

información o sus consecuencias son despreciables. En este caso, no es objeto del

análisis y no aporta más información.

Page 35: Análisis de Fiabilidad de Equipos Industriales

35

El suceso anterior y los sucesos básicos derivados de los fallos del controlador

de temperatura del reactor, en la metodología de árbol de fallos, se pueden considerar

como "fallos del modo común", ya que dichos fallos también son sucesos que puedan

afectar a las válvulas de control.

Análisis cualitativo y cuantitativo del árbol de fallos

El análisis cualitativo del árbol de fallos consiste en identificar las

combinaciones mínimas de sucesos básicos que hacen que se produzca el suceso no

deseado, también denominado en la terminología de árboles de fallos, conjunto mínimo

de fallos (de la nomenclatura anglosajona, minimal cut set).

Para la determinación de los mismos se aplica la lógica del álgebra de Boole,

suponiendo que los sucesos básicos son independientes.

Con el listado de los diferentes conjuntos mínimos de fallos, se tiene una

clasificación de los caminos o combinaciones de sucesos que pueden producir el suceso

no deseado. Pero si lo que se pretende es hacer una clasificación por importancia o

magnitud (de más a menos importancia) deberíamos de asignar valores a cada suceso

básico, realizando un análisis cuantitativo.

La indisponibilidad de un conjunto mínimo de fallos viene dada por el producto

de las indisponibilidades de los sucesos básicos. A su vez, la indisponibilidad total del

suceso no deseado es la suma de las indisponibilidades de los conjuntos mínimos de

fallos, como límite superior.

La indisponibilidad de cada suceso básico se calcula con las expresiones

matemáticas descritas en el apartado "Modos de fallo y modelos de indisponibilidad" y

a partir de las tasas de fallos de los componentes y de una serie de tiempos de

funcionamiento del sistema (TO, Tep, Tp, etc.).

Las tasas de fallos pueden ser extraídas de bancos de datos de fiabilidad de

reconocido prestigio internacional o de la experiencia de la planta basada en registros de

fallos o averías, en concreto para el presente caso se han empleado los valores

publicados por CCPs (Center for Chemical Process Safety) del AlChE (American

Institute of Chemical Engineers) y los tiempos, determinados en las especificaciones de

operación del sistema, se han establecido los siguientes:

- Tiempo de operación: 1,25 h (tiempo durante el cual el sistema de

refrigeración debe funcionar correctamente, para cada proceso batch)

- Tiempo entre pruebas de las bombas: 2000 h.

- Tiempo en pruebas o mantenimiento de las bombas: 5 h.

Page 36: Análisis de Fiabilidad de Equipos Industriales

36

Realizando el análisis cualitativo y cuantitativo del presente caso (tabla 13),

siguiendo la metodología descrita en la NTP-333, se ha obtenido:

- 84 conjuntos mínimo de fallos:

.- 3 de orden 1.

.- 81 de orden 2.

Indisponibilidad total del sistema: 8,2 10-4

procesos-1

(tabla 14), esto quiere decir

que de 1220 batch (o veces que se realice la operación), probablemente en una de ellas

se producirá una falta de refrigeración del reactor.

Page 37: Análisis de Fiabilidad de Equipos Industriales

37

Análisis de importancia

En todo análisis de seguridad, es esencial identificar aquellos equipos y modos

de fallos que tienen un mayor impacto en la seguridad del sistema analizado, es lo que

constituye un "Análisis de importancia" del sistema. Este tipo de análisis permitirá

centrar estudios posteriores en aquellos equipos o situaciones que han propiciado los

sucesos básicos más importantes, a la vez que marca las pautas a seguir para adoptar las

medidas preventivas más eficaces, que obviamente serán sobre aquellos equipos que

muestren medidas de importancia más significativas.

Page 38: Análisis de Fiabilidad de Equipos Industriales

38

La importancia de los sucesos básicos puede calcularse a través de diferentes

medidas existentes, que realizan el análisis desde diferentes puntos de vista. En este

documento se han considerado tres de las medidas más utilizadas.

a. Medida de importancia RAW (Risk Achivement Worth): se define como

el cociente entre la suma de las probabilidades de los conjuntos mínimos de fallo donde

aparece el componente, asumiendo para éste una probabilidad de fallo de 1 (fallo

seguro), y la probabilidad total del suceso no deseado. Proporciona la degradación del

sistema en caso de ocurrir el suceso básico. La ordenación obtenida está basada en la

disposición estructural de los sucesos básicos en el árbol de fallos, sin tener en cuenta

explícitamente los valores reales de las indisponibilidades de los sucesos.

b. Medida de importancia RRW (Risk Reduction Worth): se define como el

cociente entre la probabilidad total del suceso TOP y la suma de las probabilidades de

todos los conjuntos mínimos, asumiendo para el componente una tasa de fallo nula. Esta

medida proporciona los sucesos básicos que más contribuyen al riesgo. Identifica

aquellos sucesos básicos que si fueran perfectamente fiables, con indisponibilidad nula,

conducirían a una reducción más importante del riesgo del sistema.

c. Medida de importancia de Fussell-Vesely: se define este factor respecto de

un componente, como el cociente entre la suma de las probabilidades de todos los

conjuntos mínimos que contienen a este componente y la probabilidad total (o suma de

la probabilidad de todos los conjuntos mínimos). En esta medida influye tanto la

indisponibilidad del componente como su posición estructural en el árbol de fallos.

En el caso práctico del apartado anterior, los resultados obtenidos para las tres

medidas de importancia se muestran en las tablas 15, 16 y 17 y se representan en los

gráficos 3, 4 y 5, respectivamente.

a. Medida RAW: esta medida revela la importancia de asegurar las señales

eléctricas SA y SC de actuación de las válvulas de control (VC1 y VC 2) y de las

bombas (B1 y B2), así como el suministro eléctrico.

b. Medidas RRW y Fussell-Vesely: estas medidas proporcionan la misma

ordenación de sucesos básicos y revelan la importancia de reducir la probabilidad de los

modos de fallo de las bombas (B1 y B2) en demanda y en espera.

Page 39: Análisis de Fiabilidad de Equipos Industriales

39

Page 40: Análisis de Fiabilidad de Equipos Industriales

40

Medidas de reducción de la indisponibilidad. Intervalo óptimo entre

pruebas

Las medidas existentes para aumentar la fiabilidad (o disminuir la

indisponibilidad) de un sistema o reducir la probabilidad de fallo, pueden ser

básicamente de dos tipos.

En primer lugar, modificar la estructura del árbol de fallos: a través de cambios

en la instalación, que fundamentalmente pueden consistir en la incorporación de

redundancias en aquellos elementos o funciones que se hayan identificado como críticas

o imprescindibles para la seguridad del sistema, como en el caso del suministro

eléctrico y señales de actuación del ejemplo anterior, que proporcionan los valores

superiores en la medida de importancia RAW.

En segundo lugar, disminuir la indisponibilidad de los sucesos básicos: tal y

como se ha visto en el punto "Modos de fallo y modelos de indisponibilidad", la

indisponibilidad de cada suceso básico se ha calculado mediante unas expresiones

matemáticas para cada modo de fallo, que tienen como variables las tasas de fallos

intrínsecas de los componentes ( s, o) y las condiciones de operación y mantenimiento

del sistema (Tep, Tp, TO, TTR).

Por ello, la reducción de las indisponibilidades de los sucesos básicos puede ser

lograda mediante la elección de componentes con tasas de fallos bajas y adoptando

adecuadas estrategias de mantenimiento preventivo.

En el caso práctico analizado, las medidas de importancia RRW y Fussell-

Vesely han revelado la importancia de reducir la indisponibilidad de las bombas

instaladas, a las cuales se les realiza pruebas periódicas.

Intervalo óptimo entre pruebas

La indisponibilidad de la bomba está determinada por:

Page 41: Análisis de Fiabilidad de Equipos Industriales

41

El intervalo óptimo entre pruebas se puede obtener derivando la función anterior

respecto al tiempo entre pruebas e igualando la derivada a cero:

Que en el caso práctico realizado anteriormente proporciona un valor de 1.036

horas.

Para verificar este resultado se ha calculado la indisponibilidad total del suceso

no deseado para distintos tiempos entre pruebas de las bombas; los resultados se

presentan en la tabla 18 y se representan en el gráfico 6, de donde se desprende que el

mínimo valor de la indisponibilidad total se obtiene para un tiempo entre pruebas

próximo a 1.000 horas, corroborándose el cálculo matemático del tiempo óptimo

realizado anteriormente.

1.1.8. Mantenibilidad. Disponibilidad

Se trata de conceptos paralelos a la fiabilidad en tanto en cuanto son funciones

de distribución de probabilidad, de acuerdo con las definiciones dadas antes.

-La mantenibilidad, probabilidad de ser reparado en un tiempo predeterminado,

se refiere a la variabilidad de los tiempos de reparación, que es muy grande por los

numerosos factores que pueden intervenir.

Page 42: Análisis de Fiabilidad de Equipos Industriales

42

La función de distribución de estos tiempos puede ser:

-Distribución Normal: Tareas relativamente sencillas.

-Distribución Logarítmico-Normal: La mayoría de los casos en

mantenimiento.

Función de distribución de probabilidad m (t), indica la distribución de los

tiempos de mantenimiento.

- Mantenibilidad:

- Tasa de reparación:

Si µ = cte. entonces

- Tiempo medio de reparación: MTTR

-La disponibilidad, probabilidad de desarrollar la función requerida, se refiere a

la probabilidad de que no haya tenido fallos en el tiempo t, y que caso que los tenga,

que sea reparada en un tiempo menor al máximo permitido. Es función por tanto, de la

fiabilidad y de la mantenibilidad.

En el caso de que la tasa de fallos λ (t) y la tasa de reparación μ (t) sean

constantes, es:

La disponibilidad aumenta al aumentar la fiabilidad (disminuir la tasa de fallos

λ) ó al disminuir el tiempo medio de reparación (aumentar la tasa de reparación μ).

Cartagena, marzo 2013