39
EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009 PREGUNTAS: 1. ¿Cuáles propósito y los entregables de la fase de Análisis? Propósito: Entregables: Página 1 de 39

UNIVERSIDAD LA SALLE, Aicicm.com/files/EJERCICIOS_FASE_ANALISIS_BB.docx · Web viewComp 55 G Comp 63 C Elect 42 M Elect 44 G Elect 46 Con Minitab: Stat > ANOVA > Two-Way. En Response,

  • Upload
    vukien

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

PREGUNTAS:

1. ¿Cuáles propósito y los entregables de la fase de Análisis?

Propósito:

Entregables:

Página 1 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

EJERCICIOS:

REGRESIÓN LINEAL

2. Regresión lineal: El archivo PULSE.MTW contiene datos correspondientes a datos de peso y altura de corredores, realizar un análisis de regresión:

Con Minitab:File > Open worksheet > PULSE.MTWStat > Regresión > Fitted line plot Indicar Response (Height) y Predictor (Weight) Linear OK

a) Ecuación de regresión Y =

b) Coeficiente de determinación R-sq = Conclusiones:

c) Coeficiente de correlación R = 0.7848_______ Raiz cuadrada de R-Sq en decimalEste valor de correlación es significativo si el valor P de la tabla ANOVA (Analysis of variance) es menor de 0.05, en este caso fue de 0.000

d) Estimar Y para X = 150: Substituir X = 150 en la ecuación de regresión y determinar Y

Y = 69.31

3. Caso de datos transformados

En algunos casos el ajuste se mejora mucho si se transforman los datos:

Por ejemplo usando los datos del archivo CEREBRO.MTW siguiente que tiene los pesosdel cerebro y los pesos del cuerpo en 62 especies de mamíferos se tiene:

Nombre Peso total (kg)Peso cerebro (g)

Zorro blanco 3.38 44.5Búho 0.48 15.5Castor 1.35 8.1Vaca 465 423Lobo gris 36.33 119.5Cabra 27.66 115Corzo 14.83 98.2Cobaya 1.04 5.5Vervet 4.19 58Chinchilla 0.43 6.4Ardilla 0.1 4Ardilla ártica 0.92 5.7Rata africana 1 6.6Musaraña 001 0.14

Página 2 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Topo 0.06 1Armadillo 3.5 10.8Tree Hyrax 2 12.3Zarigüeya 1.7 6.3Elefante asiático 2547 4603Gran murciélago 0.02 0.3Burro 187.1 419Caballo 521 655Erizo 0.79 3.5Patas monkey 10 115Gato 3.3 25.6Galago 0.2 5Jineta 1.41 17.5Jirafa 529 680Gorila 207 406Foca gris 85 325Rock hyrax 0.75 12.3Persona humana 62 1320Elefante africano 6654 5712Zarigüella de agua 3.5 3.9Rhesus monkey 6.8 179Canguro 35 56Marmota 4.05 17Hamster 0.12 1Ratón 0.02 0.4Pequeño murciélago 0.01 0.25Slow loris 1.4 12.5Okapi 250 490Conejo 2.5 12.1Oveja 55.5 175Jaguar 100 157Chimpance 52.16 440Mandril 10.55 179.5Erizo del desierto 0.55 2.4Armadillo gigante 60 81Rock hyrax 3.6 21Mapache 4.29 39.2Rata americana 0.28 1.9Topo del este de América 0.08 1.2Topo rata 0.12 3Almizcle 0.05 0.33Cerdo 192 180Echidna 3 25Tapir 160 169Tenrec 0.9 2.6Phalanger 1.62 11.4Tree shrew 0.1 2.5Zorro rojo 4.24 50.4

Copiar los datos del archivo a Minitab

a) Hacer una gráfica de dispersión bivariada se tiene:

Página 3 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Graph > Scatterplot: Simple Y = Peso cerebro y X = Peso total

Pegar gráfica

En este caso los pesos de los elefantes pueden sesgar la ecuación de la recta no se pueden eliminar como anómalos y se intentará transformarlos en formalogarítmica:

b) Stat > Regression > Fitted line PlotSeleccionar en Response (Y) Peso Cerebro y en Predictor (X) Peso TotalSeleccionar modelo Linear aunque puede ser Quadratic o CubicEn Options seleccionar: Loggten of Y Loggten X Display options: Display CI y PI

OKc) Establecer conclusiones.

4. Con los datos siguientes:X Y

1.04185 18.08990.23129 16.03083.9113 29.65013.913 29.7359

4.12512 30.73840.63987 17.38184.98369 35.212.96085 25.63140.10635 15.48893.29437 27.11891.79592 21.25834.49059 32.65541.32325 19.18820.406 16.2046

0.74985 17.44623.7309 29.2728

1.36255 19.27410.31936 15.7934.91976 34.87134.96988 34.75391.23507 19.28834.38413 32.25543.01659 25.57662.07339 21.5864.174 31.4337

1.75039 20.56743.79849 29.28884.81151 33.83931.43903 19.32944.87897 34.51354.87167 34.03873.95905 30.02924.88136 34.7271

Página 4 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

0.17029 15.42431.28646 18.80980.8069 17.4371

0.86312 17.73842.88961 25.17721.2012 18.8126

0.14982 15.38333.7274 29.1058

0.92558 17.89780.6973 17.6353

2.16195 22.45710.24348 15.81910.4348 16.8297

4.34982 31.69993.72729 29.1370.91105 17.95043.88122 29.7899

copiar los datos de las columnas X, Y a Minitab

a) Realizar el análisis de regresión con modelo linealStat > Regression > Fitted line PlotSeleccionar en Response (Y) Y, Predictor (X) XSeleccionar modelo Linear En Options seleccionar Display Confidence Interval y Prediction Interval:En Graphs seleccionar Residuals vs Fits

Aparece la gráfica siguiente de residuos que no varían aleatoriamente alrededor de la media, sino más bien con un patrón que sugiere un modelo cuadrático:

b) Realizar el mismo estudio pero ahora con el modelo cuadráticoStat > Regression > Fitted line PlotSeleccionar en Response (Y) Y, Predictor (X) X

Seleccionar modelo QuadraticEn Options seleccionar Display Confidence Interval y Prediction Interval:En Graphs seleccionar Residuals vs Fits

c) Establecer conclusionesLos residuos aparecen en forma aleatoria indicando un modelo adecuado. 

Página 5 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

REGRESIÓN MÚLTIPLE

5. Ejemplo de factores para filtración:

Cliente Meses Tipo_rep horas1 2 1 2.92 6 0 3.03 8 1 4.84 3 0 1.85 2 1 2.96 7 1 4.97 9 0 4.28 8 0 4.89 4 1 4.4

10 6 1 4.5X1 X2 Y

a) Encontrar la ecuación de regresión y predecir el valor de Y para X1 = 8 y X2 = 1Stat > Regression > RegressionResponse: Horas Predictors: Meses Tipo_repOptions: Prediction intervals for new observations 8 1 Graphs: Residual for plots - Standardized Residual Plots: Normal Plot of residualsStorage: Standardized residuals Residuals FitsOk

b) Obtener la gráfica de residuals estandarizados

Graph > Probability plotVariables SRES NormalOKNOTA: Los puntos deben encontrarse entre los límites de confianza

c) Determinar las variables significativas Xi que influyen en la Y = horas. Las de P value menor a 0.05

d) Determinar los valores de la Y estimada o Fits

e) Hallar la gráfica de normalidad de residuos Graph > Probability plotVariables RES NormalOK

f) Estimar el Valor de Y para X1 = 8 y X2 = 1 (con ecuación de regresión)

Página 6 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

g) Obtener las gráficas de regresión simple de Horas vs Rep. Y vs Meses y comentarStat > Regression > Fitted line Plot (Y vs X1 o Y vs X2)Response: Horas Predictors: Meses o Tipo_repType of regression Model: LinearOK

h) Hallar la matriz de correlación de las X1, X2 y eliminar de la regresión una de las que esté correlacionada (con P value <=0.05)

Stat>Basic Statistics >Correlation Variables Meses Tipo_rep HorasDisplay P valuesOK

6. Riesgos de un ataque al corazón. Evaluar la dependencia de las variables a un 5% de nivel de significancia.

Y X1 X2 X3Riesg

o Edad Presión Fuma12 57 152 024 67 163 013 58 155 056 86 177 128 59 196 051 76 189 118 56 155 131 78 120 037 80 135 115 78 98 022 71 152 036 70 173 115 67 135 148 77 209 115 60 199 036 82 119 18 66 166 03 80 125 1

37 62 117 0

a) Encontrar la ecuación de regresión y predecir el valor de Y para X1 = 45, X2 = 140 y Fuma = 1Stat > Regression > RegressionResponse: Riesgo Predictors: Edad Presion FumaOptions: Prediction intervals for new observations 45 140 1

Página 7 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Graphs: Residual for plots - Standardized Residual Plots: Normal Plot of residualsStorage: Standardized residuals Residuals FitsOk

b) Obtener la gráfica de los residuos estandarizadosGraph > Probability plotVariables SRES NormalOKNOTA: Los puntos deben encontrarse entre los límites de confianza

c) Determinar las variables significativas Xi que influyen en la Y = Riesgo. Las de P value menor a 0.05

d) Determinar los valores de la Y estimada o Fits

e) Hallar la gráfica de normalidad de residuos Graph > Probability plotVariables RES NormalOK

f) Estimar el Valor de Y para X1 = 45, X2 = 140 y X3 =1 (con ecuación de regresión)

g) Obtener las gráficas de regresión simple de Riesgo vs Edad y Presión y comentarStat > Regression > Fitted line Plot (Y vs X1 o Y vs X2)Response: Riesgo Predictors: Edad o PresionType of regression Model: LinearOK

g) Hallar la matriz de correlación de las X1, X2, X3 y eliminar de la regresión una de las que esté correlacionada (con P value <=0.05)

Stat>Basic Statistics >Correlation Variables Edad Presión FumaDisplay P valuesOK

7. Investigar la cantidad pagada en tarjeta de crédito dependiendo del ingreso y tamaño de la familia. Alfa = 0.05

X1 X2 YIngres

o Tamaño Cantidad54 3 401630 2 315932 4 5100

Página 8 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

50 5 474231 2 186455 2 407037 1 273140 2 334866 4 476451 3 411025 3 420848 4 421927 1 247733 2 251465 3 421463 4 496542 6 441221 2 244844 1 299537 5 417162 6 567821 3 362355 7 530142 2 302041 7 4828

a) Encontrar la ecuación de regresión

b) Determinar las variables significativas que influyen en la Y = Cant. Pagada

c) Determinar los valores de la Y estimada o Fitsd) Hacer la gráfica de normalidad de residuos

e) Estimar la cantidad pagada para una familia con 5 miembros e ingreso de 40

f) Hallar la matriz de correlación de las X1, X2 eliminar de la regresión una de las que esté correlacionada

8. Los siguientes datos corresponden a la potencia de un motor en función de las rpm, octanos de la gasolina y compresión del motor:

Y_Potencia Rpm Octanos compresion225 2000 90 100212 1800 94 95229 2400 88 110222 1900 91 96219 1600 86 100

Página 9 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

278 2500 96 110246 3000 94 98237 3200 90 100233 2800 88 105224 3400 86 97223 1800 90 100230 2500 89 104

a) Establecer la ecuación de regresión múltipleCon Minitab:Stat > Regression > RegressionResponse Potencia Predictors rpm octano compresión OK

Potencia =

b) Predecir la potencia rpm = 2500, Octano = 95, Compresión = 105.

Con MinitabStat > Regression > RegressionResponse Potencia Predictors rpm octano compresión Options: Prediction intervals for new observations 2500 95 105 OK OK

(Ver Fit) = Potencia =

c) ¿Existe multicolinealidad entre las variables predictoras?

Con Minitab:Stat > Basic statistics > CorrelationVariables rpm Octano Compresion OK

¿En que cada intersección de variables, de los dos valores, el inferior representa el P value de la correlación, si es menor a 0.05 si hay multicolinealidad entre ese par variables predictoras, de la matriz que se puede concluir?

9. Investigar los factores que tienen influencia en la temperatura del flux a un 95% de nivel de confianza en base a las temperaturas de diferentes zonas del horno.

X1 X2 X3 Y

Este Sur NorteTemp_Flux

33.53 40.55 16.66 271.8

36.5 36.19 16.46 264

Página 10 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

34.66 37.31 17.66 238.8

33.13 32.52 17.5 230.7

35.75 33.71 16.4 251.6

34.46 34.14 16.28 257.9

34.6 34.85 16.06 263.935.3

8 35.89 15.93 266.535.8

5 33.53 16.6 229.135.6

8 33.79 16.41 239.335.3

5 34.72 16.17 25835.0

4 35.22 15.92 257.634.0

7 36.5 16.04 267.332.2 37.6 16.19 26734.3

2 37.89 16.62 259.631.0

8 37.71 17.37 240.435.7

3 37 18.12 227.234.1

1 36.76 18.53 19634.7

9 34.62 15.54 278.735.7

7 35.4 15.7 272.336.4

4 35.96 16.45 267.437.8

2 36.26 17.62 254.535.0

7 36.34 18.12 224.735.2

6 35.9 19.05 181.535.5

6 31.84 16.51 227.5

Página 11 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

35.73 33.16 16.02 253.6

36.46 33.83 15.89 263

36.26 34.89 15.83 265.8

37.2 36.27 16.71 263.8

a) Encontrar la ecuación de regresión

b) Determinar las variables significativas que influyen en la Y = Temp. De Flux

c) Determinar los valores de la Y estimada y Fits

d) Hallar la gráfica de normalidad de residuos Graph > Probability Plot > Normal

e) Estimar la temperatura de flux para X1 = 32, X2 = 36 y X3 = 16.5

f) Hallar la matriz de correlación de las X1, X2, X3 eliminar de la regresión una de las que esté correlacionada

Página 12 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

PRUEBAS DE HIPÓTESIS

10. Las rentas diarias de automóviles en Dólares de ocho ciudades se muestra a continuación:

Ciudad RentaA 47B 50C 53D 45E 40F 43G 39H 37

¿A un 5% de nivel de significancia se comprueba la hipótesis de que la varianza de la población es de 30?

Paso 1. Ho: Varianza = 30 Ha: Varianza <> 30

Paso 2. Estadístico de prueba Chi-cuadrado

Sigma = desvest(datos) = 5.5742

Estadístico Chi calculado = 0.24

Paso 3. Estadístico de alfa/2 Chi cuadrada:

=PRUEBA.CHI.INV(0.025,7) = 16.01276

Paso 4. Establecer conclusiones: como Chi calculado es menor a Chi de alfa/2, no se rechaza Ho y las rentas son similares en las diferentes ciudades.

Con Minitab:Stat > Basic statistics > One varianceEnter variance

Página 13 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Samples in columns C1Seleccionar Perform hypothesis test Hypothetized variance 30OK

11. Los siguientes datos representan los tiempos de quemado de dos formulaciones químicas. Probar a un 95% de nivel de confianza si son iguales.

Fórmula 1 Fórmula 265 4481 5157 6366 3982 4582 3667 4959 5475 6270 59

a) Prueba de igualdad de varianzas

Ho: Varianza F1 = Varianza F2; Ha: Varianza F1 <> Varianza F2Con Minitab:Stat > Basic satistics > 2 - variancesSamples in different Columns First: F1 Second: F2 Options: Confidence level 95%OK

Si el valor P de la prueba F es mayor a 0.05 no se rechaza Ho y las varianzas son iguales

b) Prueba de igualdad de medias

Ho: µF1 - µF2 = 0

Ha: µF1 - µF2 <> 0

Con MinitabStat > Basic satistics > 2 - Samples tSamples in different Columns First: F1 Second: F2

Si las varianzas fueron iguales, seleccionar: Assume equal variances

Página 14 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Options: Confidence level 95%, Test Difference 0.0 Alternative Not equalOK

SI el cero se encuentra en el intervalo de confianza, las medias no son diferentes.

Si el valor P de la prueba t es mayor a 0.05 no se rechaza Ho y las medias no son diferentes

Prueba de hipótesis de Poisson

12. Las Centrales A y B cuentan con un número de bombas que fallan cada seis meses. La superintendencia establece que 20 fallas por semestre es el máximo aceptable. Se quiere determinar si se cumple con este requisito:

Fallas_Central_A Fallas_Central_B

18 2018 3521 1914 3019 2614 2221 2018 1919 2727 2318 2719 2418 3115 3019 2410 2516 3120 2522 2215 35

Con Minitab:a) Realizar la prueba para la central A

Stat > Basic Statistics > 1-Sample Poisson Rate. En Samples in columns, Seleccionar 'Fallas_Centrl_A '. Seleccionar Perform hypothesis test. En Hypothesized rate, poner 20. Click Options. En Alternative, seleccionar less than. Click OK en cada cuadro de diálogo

Establecer conclusiones:

Página 15 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

a) Realizar la prueba para la central B

Stat > Basic Statistics > 1-Sample Poisson Rate. En Samples in columns, Seleccionar 'Fallas_Centrl_B '. Seleccionar Perform hypothesis test. En Hypothesized rate, poner 20. Click Options. En Alternative, seleccionar less than. Click OK en cada cuadro de diálogo

Establecer conclusiones:

c) Comparar ambas centrales

Stat > Basic Statistics > 2-Sample Poisson Rate. Samples in different columns Seleccionar First 'Defective A' Second 'Defective B'Click Options. En "Length" of observation [time, items, area, volume, etc], poner '3 6' Click OK en cada cuadro de diálogo

Establecer conclusiones

Tamaño de muestra y potencia

Es la capacidad de una prueba para detectar una diferencia cuando realmente existe.

Hipótesis NulaDesición Verdadera FalsaNo rechazar Desición correcta Error tipo II

p = 1 - a p = bRechazar Error tipo I Desición correcta

p = a p = 1 - bPotencia

La potencia de la prueba es la probabilidad de de rechazar correctamente la hipótesis nula siendo que en realidad es falsa.

El análisis de potencia puede ayudar a contestar preguntas como:

* ¿Cuántas muestras se deben tomar para el análisis?* ¿Es suficiente el tamaño de muestra?* ¿Qué tan grande es la diferencia que la prueba puede detectar?* ¿Son realmente valiosos los resultados de la prueba?

C1

Y-Da

ta

375370365360355

0.18

0.16

0.14

0.12

0.10

0.08

0.06

0.04

0.02

0.00

VariableOriginalCorridaLIE 360 LIE 370

Ho:Meta365

Ha: Corrida367.5

CORRIDA DE 2.5 GRS. EN PROMEDIO

Para estimar la potencia, Minitab requiere de dos de los siguientes parámetros:

* Tamaños de muestra* Diferencias - un corrimiento significativo de la media que se desea detectar* Valores de potencia - La probabilidad deseada de rechazar Ho cuando es falsa

13. Ejemplo: Se tiene una población normal con media de 365 y límites de especificación

Página 16 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

de 360 y 370. Si la media se desplaza 2.5 gramos por arriba de la media, el número de

defectos sería inaceptable, la desviación estándar histórica es de 2.403:

C1

Y-Da

ta

375370365360355

0.18

0.16

0.14

0.12

0.10

0.08

0.06

0.04

0.02

0.00

VariableOriginalCorridaLIE 360 LIE 370

Ho:Meta365

Ha: Corrida367.5

CORRIDA DE 2.5 GRS. EN PROMEDIO

a) En Minitab:Stat > Power and Sample size > 1 –Sample t Sample size 6Difference 2.5Standar deviation 2.403

Alternative hipothesis Not equalSignificance level 0.05

Se tiene un 53.76% de Potencia para detectar una diferencia de 2.5 si se usan 6 muestrasO sea que hay una probabilidad del 46.24% que no se rechaze Ho y se concluya que no hay diferencia significativa.

b) ¿cuántas muestras se requieren para tener un 80% de probabilidad de detectar el corrimiento, y para 85%, 90% y 95%?

Stat > Power and Sample size > 1 –Sample t Sample size Difference 2.5Power values 0.80 0.85 0.90 0.95

Standar deviation 2.403

Observar los resultados y establecer conclusiones

Si la potencia es demasiado alta por decir 99% se pueden detectar diferenciasque realmente no son significativas.

14. Ejemplo: La potencia de una prueba depende de la diferencia que se quiera detectarrespecto a la desviación estándar, para una sigma poner 1 en diferencia y desviaciónestándar, con valores deseados de Potencia de 0.8 y 0.9.

Stat > Power and Sample size > 2 –Sample t

Página 17 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Sample size Difference 1Power values 0.80 0.90 Graphs: seleccionar Power curvesStandar deviation 1OK

Obtenerlos resultados y establecer conclusiones

15. Tamaño de muestra para ANOVA

Se usa para calcular uno de las pruebas siguientes en prueba de igualdad de medias poblacionales· potencia· tamaño de muestra· diferencia mínima detectable entre la media menor y la mayor (diferencia máxima)

Se requiere como dato dos de estos valores, Minitab calcula el tercero.

Stat > Power and Sample Size > One-way ANOVA.En Number of levels, poner 4.En Sample sizes, poner 5.En Values of the maximum difference between means, poner 4.En Standard deviation, poner 1.64. Click OK.

Los resultados son:

Por tanto si se asignan cinco unidades a cada nivel de tratamiento, se tendrá una potencia de 0.83 para detectar una diferencia de 4 o más unidades entre las medias de los tratamientos.

ANÁLISIS DE VARIANZA DE UNA VÍA- ANOVA DE UN FACTOR

16. ANOVA: Las calificaciones de un curso de liderazgo para 18 participantes de tres diferentes departamentos fueron las mostradas en la tabla siguiente. Probar a un 5% de nivel de significancia si el aprovechamiento fue similar en los tres departamentos o en su caso cuál fue el peor.

a) Con datos en columnas: hacer una prueba de normalidad en cada columnaStat > Basic statistics > Normality test

Página 18 de 30

Depto_A Depto_B Depto_C8 7 57 8 68 7 66 7 77 6 78 8 6

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Variable Depto_A, B o C

Seleccionar Kolmogorov SimirnovOKPara que cumplan normalidad, el valor P debe ser mayor a 0.05

b) Con datos en una sola columna, probar que las varianzas de las muestras son iguales:Stat > ANOVA > Test for equal variancesResponse CALIF Factor DEPTOOK

Usar la prueba de Barlett como referencia para el valor P (debe ser mayor a 0.05) si en la prueba anterior los deptos. Fueron normales y la prueba de Levene si alguna no lo fue.

CALIF DEPTO8 A7 A8 A6 A7 A8 A7 B8 B7 B7 B6 B8 B5 C6 C6 C7 C7 C6 C

c) Correr el ANOVA con sus columnas originales separadas con:

Con Minitab:Stat > ANOVA One way (Unstacked)Responses (in separate columns) Depto_A Depto_B Depto_C Store residualsGraphs: Box plot od data Normal plot of residualsComparisons: Tukey’s, family error rate 5

Página 19 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

OK

P =0.041, por tanto las medias no son iguales.El Depto. C tiene menos calificación que el A y B

O con los datos en una sola columna con:Stat > ANOVA One way (Unstacked)Response CALIF Factor DEPTO Store residualsGraphs: Box plot of data Normal plot of residualsComparisons: Tukey’s, family error rate 5OK

Probar la normalidad de residuos con:Graph > Probability plot > SingleVariable RESI1, RESI2, RESI3 (uno a un tiempo)OK

El valor P debe ser mayor a 0.05 y deben estar dentro del intervalo de confianzaVerificar el valor P de la ANOVA como es de que 0.05, se concluye que Las medias que son diferentes se identifican en las gráficas de diferencias de TukeyEl peor aprovechamiento lo tuvo el departamento

17. Ejemplo: Los técnicos de una fábrica de papel hacen un experimento de un factorpara ver que variedad de árbol produce menos fenoles en los desechos de pasta depapel. Se colectan los siguientes datos en porcentajes:

TIPO DE ARBOLA B C

1.9 1.6 1.31.8 1.1 1.62.1 1.3 1.81.8 1.4 1.1  1.1 1.5    1.1

A un 95% de nivel de confianza, ¿hay alguna variedad que produzca más fenoles que otra?

Fenoles Tipo_Arbol1.9 A1.8 A2.1 A1.8 A1.6 B1.1 B1.3 B1.4 B1.1 B

Página 20 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

1.3 C1.6 C1.8 C1.1 C1.5 C1.1 C

a) Con datos en columnas: hacer una prueba de normalidad en cada columnaStat > Basic statistics > Normality test Variable A, B o CSeleccionar Kolmogorov SimirnovOK

Para que cumplan normalidad, el valor P debe ser mayor a 0.05

b) Con datos en una sola columna, probar que las varianzas de las muestras son iguales:Stat > ANOVA > Test for equal variancesResponseFENOLES Factor TIPO_ARBOLOK

Usar la prueba de Barlett como referencia para el valor P (debe ser mayor a 0.05) si en la prueba anterior los deptos. Fueron normales y la prueba de Levene si alguna no lo fue.

c) Correr el ANOVA con sus columnas originales separadas con:Con Minitab:Stat > ANOVA One way (Unstacked)Responses (in separate columns) A B C Store residualsGraphs: Box plot od data Normal plot of residualsComparisons: Tukey’s, family error rate 5OK

O con los datos en una sola columna con:Stat > ANOVA One way (Unstacked)Response FENOLES Factor TIPO_ARBOL Store residualsGraphs: Box plot of data Normal plot of residualsComparisons: Tukey’s, family error rate 5OK

Probar la normalidad de residuos con:Graph > Probability plot > SingleVariable RESI1, RESI2, RESI3 (uno a un tiempo)OKEl valor P debe ser mayor a 0.05 y deben estar dentro del intervalo de confianza

Página 21 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Verificar el valor P de la ANOVA como es de que 0.05, se concluye que Las medias que son diferentes se identifican en las gráficas de diferencias de Tukey

ANÁLISIS DE MEDIAS

18. Sirve para realizar un análisis de medias (ANOM) para datos normales, binomiales o de Poisson y opcionalmente imprime una tabla resumen para datos normales o binomiales.

Por ejemplo para datos normales: Se evalúa el efecto de tres tiempos de niveles de proceso y tres niveles de resistencia en la densidad. Se analizan las medias y un diseño de dos vías para identificar interacciones o efectos principales significativos.

File > Open worksheet EXH_AOV.MTW. En Response, seleccionar Density.Seleccionar Normal.En Factor 1, seleccionar Minutes. En Factor 2, seleccionar Strength. Click OK.

Los resultados se muestran a continuación:Pegar los resultados

Se muestra una gráfica de interacción y de efectos principales para los dos factores.La gráfica ANOM tiene una línea central y límites de decisión, si un punto cae fuera de estos límites es evidente que es diferente de la gran media. Si la interacción fuera significativa, ya no se consideran los efectos principales por separado, dado que unos dependen de otros. En este caso no es significativos.

El punto que representa la media del nivel 3 del factor Minutes se muestra con un asterisco en rojo, indicando que hay evidencia al nivel de alfa = 0.05 de que difiera significativamente de la media general.

En el caso de Strenght, hay evidencia de que los efectos principales para los niveles 1 y 3 están fuera de los límites de decisión y son diferentes de la media general.Los puntos que están fuera se pueden investigar.

19. Ejemplo con datos binomialesSe cuenta el número de soldaduras rechazadas en muestras de tamaño 80 para identificar que proporciones que están fuera de la línea con las otras muestras.Como las muestras tienen dos resultados, la proporción de éxitos es constante y son independientes, se usa el análisis de medias para datos binomiales.

WeldRejects3

Página 22 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

68

1461818

101

File > Open worksheet EXH_AOV.MTW.Stat > ANOVA > Analysis of Means.En Response, seleccionar WeldRejects.Seleccionar Binomial y poner 80 en Sample size. Click OK.

Los resultados se muestran a continuación:

La gráfica muestra la proporción de defectos para cada muestra, la línea central representando la proporción promedio, y los límites superior e inferior. En este caso la muestra cuatro sale de los límites de decisión y es anormal.

ANÁLISIS DE VARIANZA DE DOS VÍA- ANOVA DE UN FACTOR BLOQUEADO

20. Se estudia el plancton en dos lagos. Se preparan doce tanques en el laboratorio, seis con agua de cada uno de los lagos, se agrega uno de tres nutrientes en cada tanque y al mes se cuenta el plancton en cada unidad de volumen de agua. Se utiliza el ANOVA de dos vías para este experimento.

Zooplankton Supplement Lake34 1 Rose43 1 Rose57 1 Dennison40 1 Dennison85 2 Rose68 2 Rose67 2 Dennison53 2 Dennison41 3 Rose24 3 Rose42 3 Dennison52 3 Dennison

Con Minitab:

Página 23 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

File > Open worksheet EXH_AOV.MTW. Stat > ANOVA > Two-Way.En Response, seleccionar Zooplankton.En Row factor, seleccionar Supplement. Seleccionar Display means.En Column factor, seleccionar Lake. seleccionar Display means. Click OK.

Pegar los resultados

De la tabla de ANOVA se ve que no hay una interacción significativa entre Supplement*Lake o por Lake. Hay evidencia significativa de que el Supplement afecta al crecimiento para un alfa de 0.05. De la gráfica de medias parece que el Supplement 2 es mejor para el crecimiento del plancton. Para examinar comparaciones múltiples de medias, utilizar el modelo lineal general.

21. Se quiere probar si los tiempos de verificación de autos probados en Analizador computarizado y en probadores electrónicos son iguales, para lo cual se usan tres tamaños de autos. Porbar a un 5%.

Analizador CompElectrónic

oCompacto 50 42Mediano 55 44Grande 63 46

Arreglando los datos se tiene:

Reng ColTiempo

C Comp 50M Comp 55G Comp 63C Elect 42M Elect 44G Elect 46

Con Minitab:

Stat > ANOVA > Two-Way.En Response, seleccionar Tiempo.En Row factor, seleccionar Reng Seleccionar Display means.En Column factor, seleccionar Col seleccionar Display means. Click OK.

De la tabla de ANOVA se ve que hay una interacción significativa entre

Página 24 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

¿ hay evidencia significativa de que el tipo de analizador afecta el tiempo para un alfa de 0.05?

22. Se prueba si el tiempo en aprender diferentes sistemas es el mismo. Probar a un 95% con 5 operadores..

Oper - Sistema A B C

1 16 16 242 19 17 223 14 13 194 13 12 185 18 17 22

Arreglando los datos:

Reng ColTiemp

o1 A 162 A 193 A 144 A 135 A 181 B 162 B 173 B 134 B 125 B 171 C 242 C 223 C 194 C 185 C 22

Con Minitab:Stat > ANOVA > Two-Way.En Response, seleccionar Tiempo.En Row factor, seleccionar Reng Seleccionar Display means.En Column factor, seleccionar Col seleccionar Display means. Click OK.

De la tabla de ANOVA se ve que hay una interacción significativa entre

Página 25 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

¿Hay evidencia significativa de que el sistema afecta el tiempo de aprendizaje para un alfa de 0.05?

23. Un químico quiere probar el efecto de cuatro agentes químicos sobre la resistencia de un tipo particular de tela. Debido a que podría haber variabilidad de un rollo de tela a otro, el químico decide usar un diseño de bloques aleatorizados, con los rollos de tela considerados como bloques. Selecciona cinco rollos y aplica los cuatro agentes químicos de manera aleatoria a cada rollo. A continuación se presentan las resistencias a la tensión resultantes. Analizar los datos de este experimento (utilizar alfa = 0.05) y sacar las conclusiones apropiadas.

Agente Rollo Mediasquímico 1 2 3 4 5

1 73 68 74 71 67 70.62 73 67 75 72 70 71.43 75 68 78 73 68 72.44 73 71 75 75 69 72.6

Medias 73.5 68.5 75.5 72.75 68.5 71.75

Arreglar los datos:

Con Minitab:Stat > ANOVA > Two-Way.En Response, seleccionar ResistenciaEn Row factor, seleccionar Agente Seleccionar Display means.En Column factor, seleccionar Rollo seleccionar Display means. Click OK.

De la tabla de ANOVA se ve que hay una interacción significativa entre ¿hayevidencia significativa de que agente químico afecta la resistencia para un alfa de 0.05?

24. Un experimento para determinar el efecto del factor de forma del diseño de boquillas jet de aire se realiza con cuatro diseños diferentes de boquillas midiendo la estabilidad de salida del agua bajo diferentes velocidades de salida del aire aplicado.Los resultados se muestran a continuación:

Velocidad Tipo

boquilla 11.73 14.37 16.59 20.43 23.5 28.74A 0.78 0.8 0.81 0.75 0.77 0.78B 0.85 0.85 0.92 0.86 0.81 0.83C 0.93 0.92 0.95 0.89 0.89 0.83D 1.14 0.97 0.98 0.88 0.86 0.83E 0.97 0.86 0.78 0.76 0.76 0.75

Página 26 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Arreglar los datos:

Con Minitab:Stat > ANOVA > Two-Way.En Response, seleccionar Estabilidad_aguaEn Row factor, seleccionar Boquilla Seleccionar Display means.En Column factor, seleccionar Velocidad seleccionar Display means. Click OK.

De la tabla de ANOVA se ve que hay una interacción significativa entre ¿ hay evidencia significativa de que el tipo de boquilla afecta la estabilidad del agua para un alfa de 0.05?

PRUEBAS NO PARAMÉTRICAS

25. Prueba de simetría de la distribución: Esta prueba es relevante ya que las pruebas no paramétricas consideran que las distribuciones son simétricas.

Ho: La distribución es simétricaHa: La distribución no es simétrica

File > Open worksheet EXH_QC.MTW.Seleccionar Stat > Quality Tools > Symmetry Plot.En Variables, poner Faults. Click OK.

Establecer conclusiones:

26. Prueba de igualdad de varianzas de Levene: Sirve para probar igualdad de varianzas en varias muestras.

Ho: Varianza 1 = Varianza 2 = Varianza 3 = ……Ha: Al menos una varianza es diferente

File > Open worksheet Exh_aov.mtw.Stat > ANOVA > Test for Equal Variances.Response, Rot.Factors, seleccionar Temp Oxygen. Click OK.

Se genera un grupo de intervalos de confianza de Bonferroni (simultaneos) para la desviación estándar en cada nivel del factor. Utilizar los resultados de Bartlett cuandolos datos vengan de una distribución normal y la de Levene cuando los datos vengan de una distribución continua pero no necesariamente normal.

Página 27 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

En caso de que el valor P value sea mayor a 0.05 no se rechaza la hipótesis nula de igualdad de las varianzas.

27. Prueba de rachas: Un entrevistador encuesta a 30 personas al azar y les hace una pregunta con 4 posibles respuestas (0, 1, 2 y 3). Se quiere probar si hay una respuesta aleatoria en el orden de las respuestas o que no haya sesgo en el entrevistado.

Ho: Las rachas son aleatorias

Ha: Las rachas siguen un patrón no aleatorio

File > Open Worksheet > Data > Exh_stat.mtw.Stat > Nonparametrics > Runs Test.En Variables, seleccionar Response. Click OK.

Interpretación de resultados: Como P value es a 0.05 se tiene evidencia de queel comportamiento de las respuestas es aleatorio y debe investigarse la causa.

28. Pueba de signos de la mediana: Se evalúan los índices de precios de 29 casas. Los datos históricos indican que el índice ha sido de 115. Probar a un alfa de 0.10 si el índice se ha incrementado.

Ho: mediana = mediana hipotetizada

Ha: mediana ≠ mediana hipotetizada

File > Open Worksheet > Data > Exh_stat.mtw.Stat > Nonparametrics > 1-Sample SignConfidence level 95%Variables, seleccionar PriceIndex. Test median 115 Alternative, Seleccionar greater than.Click OK.

Interpretación de resultados: Como el valor P de la prueba es 0.05 hayevidencia suficiente para Ho y la mediana a 115.

29. Prueba de una mediana de Wilconox. Se registran los resultados de examenes en ciencias para 9 estudiantes. Se quiere probar si hay suficiente evidencia de que la mediana sea diferente de 77 con alfa = 0.05.

Página 28 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

Ho: mediana = mediana hipotetizada versus

Ha: mediana ≠ mediana hipotetizada

File > Open Worksheet > Data > Exh_stat.mtw.Stat > Nonparametrics > 1-Sample WilconoxConfidence level 95%Variables, seleccionar Achivement. Test median 77 Alternative, Seleccionar Not equalClick OK.

Interpretación de resultados: Como el valor P de la prueba es 0.05 hayevidencia suficiente para Ho y la mediana ____ es estadísticamente diferente de 77.

30. Prueba de rangos de dos muestras de Mann Whitney. Se compara la presión diastólica de dos muestras extraídas de dos poblaciones. Se quiere probar a un 5% de nivel de significancia si hay diferencia entre las medianas.

Ho: h1 = h2 versus Ha: h1 ≠ h2 , donde h es mediana de la población.

Se asume que las muestras provienen de dos poblaciones con la misma forma y varianza.

File > Open Worksheet > Data > Exh_stat.mtw.Stat > Nonparametrics > Mann - WhitneyFisrt sample: DBP1 Second sample: DBP2Confidence level 95%Alternative, Seleccionar Not equalClick OK.

Interpretación de resultados: Como el valor P de la prueba es 0.05 hay evidencia suficiente para Ho y las medianas son diferentes estadísticamente.

31. Prueba de igualdad de medianas de Kruskal Wallis. Se quiere probar si el efecto de tres tratamientos diferentes influye en el crecimiento de bacterias a un 5% de nivel de significancia.

Ho: Las medianas poblacionales son todas iguales versus Ha: Al menos hay una diferente

Esta es una generalización de la prueba de Mann Whitney

Página 29 de 30

EJERCICIOS FASE DE ANÁLISIS SEIS SIGMA BB P. Reyes / Abril 2009

File > Open Worksheet > Data > Exh_stat.mtw.Stat > Nonparametrics > Kruskal-WallisResponse: Growth Factor: TreatmentConfidence level 95%Alternative, Seleccionar Not equalClick OK.

Interpretación de resultados: Como el valor P de la prueba es 0.05 hay evidencia suficiente para Ho y las medianas son diferentes estadísticamente.

32. Prueba de igualdad de medianas de Mood - Exp. de un factor (ANOVA). Se mide la habilidad intelectual de 179 estudiantes en base al dibujo de figuras después se aplica una prueba OTIS y se quiere probar si a un alfa de 5% hay diferencia significativa entre el nivel de educación 0 - Preprofesionales 1 -Profesionales 2 – Preparatoria.Prueba similar a la anterior:

Ho: h1 = h2 = h3,

Ha: no todas las h's son iguales con h's medianas poblacionales

Con Minitab:

File > Open Worksheet > Data > Cartoon.mtwStat > Nonparametrics > Mood’s median testResponse: Otis Factor: EDOK.

Interpretación de resultados: Como el valor P es a 0.05 indica que las medianas son iguales

33. Prueba de Friedman. Experimento aleatorizado bloqueado (similar a la ANOVA de dos vías). Se quiere probar un tratamiento de drogas sobre la actividad enzimatica. Se prueba con tres tratamientos en animales de diferentes granjas.

File > Open Worksheet > Data > Exh_stat.mtw.Stat > Nonparametrics > FriedmanResponse: EnzymeActivity Treatment: Therapy

Blocks: LitterOK.

Los valores P son a 0.10 por tanto hay evidencia para decir que el efecto

Página 30 de 30