Upload
rob-sorian
View
264
Download
2
Embed Size (px)
Citation preview
Dr. Luis Cuautle Gutiérrez
Dr. Luis Cuautle Gutiérrez
El análisis de varianza (ANOVA) es la técnicacentral en el análisis de datosexperimentales.
La idea general de esta técnica es separar lavariación total en las partes con las quecontribuye cada fuente de variación en elexperimento.
Existen dos esquemas para desarrollar unANOVA:
◦ Esquema de una vía (Diseño de un Factor)
◦ Esquema de dos vías (Diseño de dos Factores)
En este análisis se compara la diferencia entrelos tratamientos con la variación causada porlas repeticiones dentro de cada tratamiento.
Si la fuente de variación ”Entre tratamientos”es significativamente mayor que la fuente“Dentro del tratamiento”, se concluye queexiste una diferencia entre tratamientos.
El objetivo del análisis de varianza de un factores probar la hipótesis de igualdad de lostratamientos con respecto a la media de lacorrespondiente variable de respuesta:
Lo cual se puede escribir en formaequivalente:
Los tratamientos tienen efecto (las mediasson diferentes).
Cuando los tratamientos no dominancontribuyen igual o menos que el error (lasmedias son iguales).
Variabilidad debida a
tratamientos
Variabilidad debida al
error
Variabilidad debida a
tratamientos
Variabilidad debido a
tratamientos
Variabilidad debida al
error.
Variabilidad Total
Variabilidad Total
Sirve para representar sumas y medias que seobtienen a partir de los datos experimentales.
Las cantidades de interés son:
Yi. =Suma de las observaciones del tratamiento
i.
Yi.=Media de las observaciones del i-ésimo
tratamiento.
Y..=Suma total de las N = n1 +n2+…+nk
mediciones.
Y..=Media global o promedio de todas las
observaciones.
Note que el punto indica la suma sobre elcorrespondiente subíndice. De tal formaque:
in
j
ijYYi1
i
n
j
n
Yij
iY
i
1
k
i
n
j
ij
i
YY1 1
kiN
YY ,...,2,1;
k
i
inN1
FV SC GL CM Fo Valor-p
Tratamientos k-1
Error N-k
Total N-1
En la tabla de ANOVA se resume el análisis devarianza de un experimento que sirve para probarlas hipótesis de interés.
N
Y
n
Yk
i i
i
2
1
2
TRATT SCSC
N
YY
k
i
n
j
ij
i 2
1 1
2
1k
SCTRAT
kN
SCE
E
TRAT
CM
CM)( FoFP
El ANOVA supone que la variable de respuesta se distribuye normalmente, con varianza constante y que las mediciones son
independientes entre si.
En la tabla a continuación se muestran losresultados de dureza obtenidos de lasmuestras tomadas durante cada una de lascondiciones de tratamiento seleccionadas.
Empleando Minitab se grafican los datos y seobtiene lo siguiente:
¿Que se puede decir acerca de los tratamientos?
Para determinar si existe una diferenciasignificativa entre tratamientos se realiza unaprueba F.
Un equipo de mejora investiga el efecto de 4métodos de ensamble A, B, C y D, sobre eltiempo de ensamble en minutos. Se hicieron 4observaciones del tiempo de ensamble en cadamétodo. Los valores obtenidos se muestran enla siguiente tabla.
A B C D
6 7 11 10
8 9 16 12
7 10 11 11
8 8 13 9
Método de ensamble
¿Existen diferencias entre los 4 métodos de ensamble?
En el ANOVA de dos factores seconsideran como fuentes probables devariación:◦ Factor A
◦ Factor B
◦ Interacción Factor A x Factor B
◦ Error Experimental (Variación causada porrepeticiones)
En el ejemplo anterior, se plantea un ANOVAde dos factores.
Tiempo de Horno
Temperatura de Salida
700OF 800OF 900OF
30’ 90 87 84
87 85 87
60’ 95 87 79
92 90 78
Captura de Datos
ANOVA
Valor-p < 0.05, existe efecto!
Esta muestra de manera gráfica el resultadopromedio de cada uno de los niveles delfactor.
Esta gráfica señala si dos factores dependenentre ellos en relación al efecto de ellos sobreel resultado.
El diseño de experimentos consiste enplanear y realizar un conjunto de pruebascon el objetivo de generar datos que, al seranalizados estadísticamente, proporcionenevidencias objetivas que permitanresponder las interrogantes planteadas porel experimentador sobre determinadasituación.
El uso de los DOE’s mejora la calidad, en corto tiempo, y reduce el retrabajo y el costo.
Factores estudiados: Son las variables que seinvestigan en el proceso para observar comoafectan o influyen en la variable de respuesta.
Factores controlables: Son variables de procesoy/o características de los materiales y losmétodos experimentales que se pueden fijar enun nivel dado.
Factores no controlables (ruido): Son variablesque no se pueden controlar durante elexperimento o la operación normal del proceso.
Variable de respuesta: A través de esta(s)variable(s) se conoce el efecto o los resultados decada prueba experimental.
Niveles: Los diferentes valores que se asignan acada factor estudiado en un diseño experimental.
Tratamientos o punto de diseño: Unacombinación de niveles de todos los factoresestudiados. Nivel de
velocidadNivel de
temperaturaTratamiento Y
1 1 1
?2 1 2
1 2 3
2 2 4
Aleatorización: Consiste en hacer corridasexperimentales en orden aleatorio(al azar);este principio aumenta la posibilidad de queel supuesto de independencia de los erroresse cumpla.
Repetición: Es correr mas de una vez untratamiento o combinación de factores. Estaspermiten distinguir mejor qué parte de lavariabilidad total de los datos se debe al erroraleatorio y cuál a los factores.
Diseño factorial: Diseño experimental quesirve para estudiar el efecto individual y deinteracción de varios factores sobre una ovarias respuestas.
Factor cualitativo: Sus niveles toman valoresdiscretos o de tipo nominal. Ejemplos:máquinas, lotes, marcas, etcétera.
Factor cuantitativo: Sus niveles de pruebapueden tomar cualquier valor dentro decierto intervalo. La escala es continua, comopor ejemplo: temperatura, velocidad,presión, etc.
El tamaño de la muestra (el numero de valores dedatos en cada combinación de prueba) tambiénafecta la estimación del error experimental.
Generalmente, entre más datos (más grados delibertad), mejor es la estimación.
Sin embargo, las consideraciones prácticas se debensopesar con las consideraciones estadísticas.
Aunque pueden existir excepciones, una buena reglade “pulgar” es recolectar un mínimo de 3 valores dedatos para cada combinación de prueba.
Hoja de Trabajo de Planeación de DOEBlack Belt: ___________________ Depto. / Proceso:____________________________________
Título del Proyecto__Mejora del Proceso de Prototipo_ Fecha: ________
Objetivo del DOE: __Reducir al Mínimo el Tiempo de Ciclo de Prototipo.________________________________________________________________________________________________________________________________________________________________________________________________________________
Antecedentes Relevantes: Actualmente, el tiempo de ciclo de prototipo promedio excede los 9 días___ (13,100 minutos).__________________________________________________________________________________
__________________________________________________________________________________
Características del Resultado
Característica CT Qué / Cómo medir Especificaciones¿Usar como Medidadel Experimento?(s/n)
Tiempo de Ciclo de Prototipo
Del recibo de confirmación del Faxdel Cliente al recibo de confirmaciónsin error del Fax del Proveedor conla Orden de Compra.
Menos de 5400minutos
S
Exactitud de las Ordenesde Compra
Número de erroresNúmero de iteraciones de retrabajo
Sin errores Sin retrabajo
N
Sí. __ ¿Existe una sola medida de resultado que incluya todas (o varias) las características CT?
Si se usa una medida de tiempo de ciclo que incluya el tiempo dedicado al retrabajo, la reducción del__
tiempo de ciclo; también incluye el objetivo de reducir los errores y el retrabajo.
37
Factores Controlables (Proceso de Prototipo)
Si es factor del DOE Si no es factor del DOEFactores
Controlables NivelActual
Nivel (es)
Propuesto (s)
¿Cómo mantener constante? ¿A qué nivel?
Método de Orden de Compra
S Manual Automatizado
Quién Introduce los Datos S
Lanzamiento delCoordinador y del
empleado que introduce Datosambos los introd.
Cualquiera(No ambos)
Método para crearuna "Lista de Selección"
NUsa el método actual(Manual).
Fuerz
a d
el
Impacto
sobre
Y
Fácil d
e c
am
bia
rdura
nte
el
experi
mento
¿Inclu
ir c
om
o
facto
r en e
l experi
mento
Leyenda:
:Impacto fuerte, Fácil de cambiar
:Impacto moderado, Moderadamente fácil de cambiar
:Impacto débil, Difícil de cambiar
38
Factores de Ruido
Si es factor del DOE Si no es factor del DOE
Estrategia
Factores de Ruido
Niveles a establecer
durante elexperimento
¿Cómo mantener
constante?
¿A qué nivel?
Hora en que serecibió la Ordendel cliente
S 3
Mañana (8:00-11:00am)
vsTarde (1:00-4:00)
Fuerz
a d
el
impacto
sobre
Y
Fácil d
e c
am
bia
rdura
nte
el experi
mento
Inclu
ir c
om
o f
acto
r en
el experi
mento
? (s
/n)
Robuste
z/
Red d
e la v
ari
ació
n
Si es f
uert
e,
contr
arr
esta
rá
Leyenda:
:Impacto fuerte, Fácil de cambiar
:Impacto moderado, Moderadamente fácil de cambiar
:Impacto débil, Difícil de cambiar
Este diseño también puede ser estudiado apartir de la técnica de ANOVA, los valores-pmenores a 0.10 implican efectos fuertes.
Factor Niveles Unidad
A: Broca 1/16 1/8 Pulgadas
B: Velocidad 40 90 rps
Los datos obtenidos de las 16 pruebas se muestran acontinuación
A:Broca B:Velocidad A B X1 X2 Vibración
1/16 40 - - -1 -1 18.2 18.9 12.9 14.4
1/8 40 + - +1 -1 27.2 24.0 22.4 22.5
1/16 90 - + -1 +1 15.9 14.5 15.1 14.2
1/8 90 + + +1 +1 41 43.9 36.3 39.9
A:Broca B:Velocidad A B X1 X2 Vibración
1/16 40 - - -1 -1 18.2 18.9 12.9 14.4
1/8 40 + - +1 -1 27.2 24.0 22.4 22.5
1/16 90 - + -1 +1 15.9 14.5 15.1 14.2
1/8 90 + + +1 +1 41 43.9 36.3 39.9
Con α = 0.10, el tipo de broca, la velocidad y la interacción entre ambos factores son
significativos
¿Qué niveles de los factores deberán seleccionarse para minimizar la vibración?
Mejor Tratamiento: A-, B+
Mejor Tratamiento: 1/16”, 90 rps
Los supuestos del modelo de ANOVA: normalidad, varianza constante e independencia de los residuos deben verificarse antes de dar por
válidas las conclusiones.
Nota: La técnica DOE es más eficiente con datos variables
Paso 1: Encuentra los factoresque afectan la variación. Usa estos factores para minimizar la variación.
Paso 2: Encuentra los factores que desplazan el promedio (y NO afectan la variación). Usa estos factores para ajustar la salida promedio con la meta deseada.
Objetivo
En este modelo se estudian 3 factores endos niveles cada uno. Consta de 23 = 8tratamientos diferentes, los cuales sepueden identificar con las mismasnotaciones del Diseño 22.
La región Experimental ahora es un cuboregular centrado en el origen (0,0,0),cuyos vértices son los ocho tratamientos.
La matriz de diseño seconstruye alternando elsigno menos y el signomás en la primeracolumna, dos menos ydos más en la segundacolumna y cuatro menosy cuatro más en latercera; el diseño resultaacomodado en el ordenestándar o de Yates.
A B C
-1 -1 -1
+1 -1 -1
-1 +1 -1
+1 +1 -1
-1 -1 +1
+1 -1 +1
-1 +1 +1
+1 +1 +1
Sean A, B, C los factores que se quieren estudiar y sean(I), a, b, ab, c, ac, bc, y abc, los totales observados encada uno de los 8 tratamientos escritos en su ordenestándar. Los efectos en este diseño se puedencalcular a partir de la tabla de signos siguiente.
Total A B C AB AC BC ABC
(1) - - - + + + -
a + - - - - + +
b - + - - + - +
ab + + - + - - -
c - - + + - - +
ac + - + - + - -
bc - + + - - + -
abc + + + + + + +
Una empresa de dispositivos electrónicosidentificó que las fracturas de las obleas desilicio por choques térmicos era la principalescausa de ruptura de obleas en la etapa de“grabado mesa”. Se identificaron tres factoresprincipales (temperaturas) como las probablescausas del problema. Por ello se utilizo unexperimento factorial 23 con el objetivo delocalizar una combinación de temperaturas enla cual se rompan un mínimo de obleas porefecto térmico.
Los tres factores controlados y sus niveles enunidades originales son:◦ T1: Temperatura de grabado (-3oC, -1oC)
◦ T2: Temperatura de piraña (60oC, 98oC)
◦ T1: Temperatura de agua (20oC, 70oC)
La respuesta medida a cada oblea procesada enel experimento es binaria con valor 1 si la oblease rompe y 0 si no se rompe.
A continuación se da la proporción de obleasrotas por cada 250 procesadas.
T1 T2 T3 P
-1 -1 -1 0.04
1 -1 -1 0.012
-1 1 -1 0.036
1 1 -1 0.00
-1 -1 1 0.02
1 -1 1 0.00
-1 1 1 0.016
1 1 1 0.004
-1 -1 -1 0.032
1 -1 -1 0.008
-1 1 -1 0.028
1 1 -1 0.00
-1 -1 1 0.02
1 -1 1 0.016
-1 1 1 0.008
1 1 1 0.004
FV SC GL CM Fo Valor-p
A 0.001521 1 0.001521 52.45 0.0001
B 0.000169 1 0.000169 5.83 0.0422
C 0.000289 1 0.000289 9.97 0.0135
AB 0.000001 1 0.000001 0.03 0.8573
AC 0.000361 1 0.000361 12.45 0.0078
BC 0.000001 1 0.000001 0.03 0.8573
ABC 0.000025 1 0.000025 0.86 0.3803
Error 0.000232 8 0.000029
Total 0.002599 15
R2 = 91.1 R2
aj= 83.3
De tal forma que los Efectos de A (Temperatura deGrabado), B (Temperatura de Piraña,) C (Temperatura deAgua), la interacción AC están presentes.
Estos efectos pueden graficarse en un diagrama dePareto para visualizar cuáles tienen mayor impacto sobrela variable de respuesta. (Nota: Se grafican los efectosdivididos entre su error estándar) 22
ˆ efectoun deestándar error del Estimaciónk
Eefecto
n
CM
Con la información del Pareto Estandarizado se apreciaque los efectos que tienen un valor-p menor que 0.05son los efectos principales A,B y C; y la interacción AC.
De tal manera, con el objeto de aclarar mejor cualesfuentes de variación son significativas y obtener unmodelo final en el que sólo se incluyan términossignificativos, se construye el Mejor ANOVA.
FV SC GL CM Fo Valor-p
A 0.001521 1 0.001521 64.60 0.0000
B 0.000169 1 0.000169 7.18 0.0214
C 0.000289 1 0.000289 12.27 0.0049
AC 0.000361 1 0.000361 15.33 0.0024
Error 0.000259 11 0.0000235
Total 0.002599 15
R2 = 90.03 R2
aj= 86.4
De esta gráfica el mejor tratamiento sería (1,1,1)
De esta gráfica se observa que si se trabaja con temperatura alta de grabado, da lo mismo cualquiera de
las dos temperaturas de agua.
De esta gráfica se observa que las dos mejores condiciones son: (1,1,1) y (1,1,-1). Es decir (-1oC, 98oC,
70oC) y ((-1oC, 98oC, 20oC) respectivamente.
Se grafican los residuos y bajo la prueba de Anderson Darling se comprueba la normalidad de los datos.
Se grafican los residuos vs cada
uno de los factores y se comprueba la
homogeneidad de las varianzas.
Rath & Strong Management Consultants (2006). Six Sigma Pocket Guide. Rath & Strong.
Schmidt, S. y Launsby, R. (1998). UnderstandingIndustrial Designed Experiments. Air AcademyExpress
Curso de Entrenamiento Seis Sigma: Green Belt(Johnson Controls-UPAEP)