41
Prueba de Hipótesis Bondad de Ajuste Tuesday, August 5, 14

Prueba de Hipótesis - Área de Operaciones de la … de Operacione… · toman dos muestras de 40 unidades cada una y se realiza una prueba de hipótesis de diferencia de medias

Embed Size (px)

Citation preview

Prueba de HipótesisBondad de Ajuste

Tuesday, August 5, 14

Conceptos Generales• Hipótesis: Enunciado que se quiere demostrar.

• Prueba de Hipótesis: Procedimiento para determinar si se debe rechazar o no una afirmación acerca del valor de un parámetro de la población.

• Hipótesis nula: Ho, hipótesis que propone un valor tentativo acerca de una parámetro poblacional.

• Hipótesis alternativa: Ha, hipótesis opuesta a la hipótesis nula.

Tuesday, August 5, 14

Conceptos Generales

• Para probar una hipótesis se lleva a cabo un experimento, utilizando las técnicas de muestreo.

• Existen dos posibles resultados:

• La Ho se rechaza.

• La Ho no se puede rechazar, es decir, no se cuenta con suficiente evidencia estadística de que la hipótesis alternativa sea verdadera.

Tuesday, August 5, 14

Conceptos Generales

• La hipótesis que se investiga por lo común se expresa como la alternativa.

• Se puede llegar a la conclusión de que la hipótesis que se investiga es verdadera si se rechaza la hipótesis nula.

Tuesday, August 5, 14

Caso 1: Una investigación

• Se desea probar si un nuevo sistema de inyección mejora el rendimiento de un modelo de vehículo cuyo rendimiento promedio es de 24 millas/galón.

• Ho:  μ  ≤  24Ha:  μ  >  24

La Ha se formula de tal modo que el rechazo de Ho respalde la conclusión que se propone.

Tuesday, August 5, 14

Caso 2: Una afirmación

• Un fabricante de bebidas afirma que el contenido de sus botellas no es menor a 2 litros.

• Ho:  μ  ≥  2Ha:  μ  <  2

La Ha se formula de tal modo que el rechazo de Ho proporcione evidencia estadística de que la afirmación es incorrecta.

Tuesday, August 5, 14

Caso 3: Una decisión

• Se prueban unas piezas de un embarque para saber si están o no dentro de especificaciones, en donde un valor menor o mayor a 2 causa problemas de ensamblaje.

• Ho:  μ  =  2Ha:  μ  ≠  2

En estos casos, se toma tanto una decisión si la hipótesis nula se rechaza como si no se pueda rechazar.

Tuesday, August 5, 14

Tipos de Error

Tuesday, August 5, 14

Nivel de Significancia: α

• En la práctica, la persona que efectúa la prueba de hipótesis especifica la máxima probabilidad permisible, llamada nivel de significancia para la prueba, de cometer un error tipo I.

• Se acostumbran los valores de 0,05 y 0,01 para α.

• Un  pequeño  valor  de  α  significa  un  alto  grado  de  confianza  en  que  sea  correcta  la  conclusión  de  rechazar  Ho  y  de  que  Ha  es  verdadera.

Tuesday, August 5, 14

Error tipo II: β

• Aunque en la mayoría de las aplicaciones de pruebas de hipótesis se controla la probabildad de cometer un error tipo 1, no siempre se controla la de incurrir en un error tipo II.

• Debido a la incertidumbre de cometer un error tipo II, en estadística se recomienda usar la redacción “no rechazar Ho” en lugar de “aceptar Ho” porque si se acepta Ho se corre el riesgo de cometer un error tipo II.

Tuesday, August 5, 14

Pruebas de Bondad de Ajuste

• Una de las bases fundamentales del control estadístico de la calidad es la inferencia estadística. Por ello, la determinación del tipo de distribución correspondiente a un conjunto de datos provenientes del estudio es absolutamente necesario. La prueba de bondad de ajuste permite probar el ajuste de los resultados de un experimento a una distribución de probabilidad teórica sujeto a un error o nivel de confianza.

Tuesday, August 5, 14

Pruebas de Bondad de Ajuste

• El método en cuestión se basa en la comparación de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribución teórica en análisis.

• Para la prueba de hipótesis utilizaremos dos estadísticos: El Chi-cuadrado y la prueba de Kolmogorov-Smirnov

Tuesday, August 5, 14

Chi-Cuadrado

• En donde:

• fo =Frecuencia observada de datos discretos

• fe =Frecuencia esperada de la distribución teórica

• Los grados de libertad se emplea (k-1) y luego se resta un grado adicional de libertad para cada parámetro de población que tenga que ser estimado de los datos de la muestra

(fo – fe)2 χ2 = fe Σ

Tuesday, August 5, 14

Media con datos Agrupados

• En donde:

• d= desviación del punto medio con respecto a la posición de la media supuesta, es medida en unidades de intervalo de clase

• i= amplitud o intervalo de clase

• A= punto medio de la clase que contiene la media supuesta (clase de d=0)

• fo = Frecuencias observadas en número de clases

• n = tamaño de la muestra

X = A + (Σ fo×d)×i n

Tuesday, August 5, 14

Desviación estándar con datos Agrupados

S = i Σfo×d2

n − (Σfo×d)2

n2

Tuesday, August 5, 14

Chi-Cuadrado

• Se acepta la hipótesis nula cuando:

• Chi-calculado < Chi-tabular

Tuesday, August 5, 14

Ejercicio Los Líquidos S.A.

• Los valores que se adjuntan corresponden a la fabricación de un producto realizada en tres días sucesivos. La especificación para ese producto es de 50000 ± 6000 milílitros. Pruebe con un nivel de significancia de 0,01que los datos siguen un comportamiento con base en una distribución normal.

Tuesday, August 5, 14

Itervalo fo fo Acum.35000 < X < 40000 6 640000 < X < 45000 15 2145000 < X < 50000 58 7950000 < X < 55000 139 21855000 < X < 60000 66 28460000 < X < 65000 11 29565000 < X < 70000 5 300

Tuesday, August 5, 14

Intervalos de Calse fo Xk d fod fod Pi fe

35000-40000 40000-45000 45000-50000 50000-55000 55000-60000 60000-65000 65000-70000

Ho: La distribución normal con un � de 0,01es una buena descripción del proceso de fabricación del producto X. Ha: La distribución normal con un � de 0,01 no es una buena descripción del proceso de fabricación del producto X.

2

Tuesday, August 5, 14

Tuesday, August 5, 14

Límite Límite Fo Xk d Fo*d Fo*d^2 Probabilidad FrecuenciaInferior Superior Esperada Esperada35000 40000 6 37500 -3 -18 54 0.0087 2.6140000 45000 15 42500 -2 -30 60 0.0677 20.31 22.9245000 50000 58 47500 -1 -58 58 0.2428 72.84 72.8450000 55000 139 52500 0 0 0 0.3687 110.61 110.6155000 60000 66 57500 1 66 66 0.2385 71.55 71.5560000 65000 11 62500 2 22 44 0.0654 19.62 21.9665000 70000 5 67500 3 15 45 0.0078 2.34

300 -3 327

Meida muestral = 52500 + (-3*5000)/300 =52450

Desviación estándar = 5000 x (327/300) - (-3^2/300^2) = 5219,91

Tuesday, August 5, 14

Frecuencia Frecuencia Fo-Fe (Fo-Fe)2 (Fo-Fe)2/FeObservada Esperada

21 22.92 -1.92 3.69 0.1658 72.84 -14.84 220.23 3.02

139 110.61 28.39 805.99 7.2966 71.55 -5.55 30.80 0.4316 21.96 -5.96 35.52 1.62

Chi calculado = 12.52

Tuesday, August 5, 14

Tuesday, August 5, 14

Kolmogorov-Smirnov •  Es un simple método no paramétrico para probar si hay

una diferencia significativa entre una distribución observada y una distribución teórica de frecuencia.

•  La hipótesis nula se rechaza sí:

•  * Dn > dt, 1-α •  En donde Dn es el valor máximo.

Tuesday, August 5, 14

Ejercicio

• En un estudio se obtuvieron los siguientes resultados para el punto de ebullición en grados Celsius, de un compuesto de silicio: 166,141,136,153,170,162,155,146,183,157,148,132,160,175, y 150. Utilizando un nivel de significancia de 0.01 pruebe que los puntos de ebullición provienen de una población normal en donde la media poblacional es de 160 grados Celsius y la desviación estándar poblacional es de 10 grados Celsius.

Tuesday, August 5, 14

Prueba de Hipótesis •  Ho: Los puntos de ebullición provienen de

una población normal con µ de 160 grados y σ de 10 grados

•  Ha: Los puntos de ebullición no provienen de una población normal con µ de 160 grados y σ de 10 grados

Tuesday, August 5, 14

Intervalos+Límites+de+Clase+ Fo+

Fo+Acumulada+

Fo+Acumulada+Rela7va+

Fe+Acumulada+

D++++++++++++++++++++Ifo+:+feI+

130+:+141+ 130.5+:+141.5+ ++ ++ ++ ++ ++

141+:+152+ 141.5+:+152.5+ ++ ++ ++ ++ ++

152+:+163+ 152.5+:+163.5+ ++ ++ ++ ++ ++

163+:+174+ 163.5+:+174.5+ ++ ++ ++ ++ ++

174+:+185+ 174.5+:+185.5+ ++ ++ ++ ++ ++

Tuesday, August 5, 14

Tuesday, August 5, 14

Tuesday, August 5, 14

Intervalos Límites de Clase Fo Fo

Acumulada Fo Acum Relativa

Fe Acumulada

D |F(X) - Sn(X)|

130 - 141 103.5 - 141.5 3 3 0.2000 0.0322 0.1678

141 - 152 141.5 - 152.5 3 6 0.4000 0.2266 0.1734

152 - 163 152.5 - 163.5 5 11 0.7333 0.6368 0.0965

163 - 174 163.5 - 174.5 2 13 0.8667 0.9265 0.0598

174 - 185 174.5 - 185.5 2 15 1.0000 0.9946 0.0054

Tuesday, August 5, 14

Tipos de Pruebas en Excel

• Excel nos ofrece varios comandos para poder resolver hipótesis para comparar dos medias, tomando el valor de p y comparándolo con α.

• Si  el  valor  de  p  es  menor  que  α  o  que  α/2,  se  concluye  que  existen  diferencias  significaMvas  entre  los  grupos  que  se  comparan.  

Tuesday, August 5, 14

Tipos de Pruebas en ExcelCaracterísticas de la prueba

de mediasPrueba que se emplea en

Excell

Se  conocen  σ12  y  σ22Prueba Z para medias de dos

muestras

Comparar antes y después del tratamiento

Prueba t para medias de dos muestras emparejadas

Comparar las medias de dos poblaciones

Prueba t para dos muestras suponiendo varianzas igualesComparar las medias de dos

poblaciones Prueba t para dos muestras suponiendo varianzas desiguales

Se  supone  que  σ12  =  σ22  =…σn2   Análisis de varianza

Tuesday, August 5, 14

Prueba Z para Dos Medias

• Para realizar esta prueba se requiere cumplir una de las dos siguientes condiciones:

• Que las varianzas poblacionales sean conocidas.

• Que las varianzas poblacionales sean desconocidas pero el tamaño de la muestra sea mayor a 30 para estimar las varianzas a partir de la muestra.

Tuesday, August 5, 14

Ejercicio Los Líquidos S.A.

• Ahora suponga que el producto es fabricado por dos máquinas y se desea saber si entre ellas hay una diferencia en el desempeño, para ello se toman dos muestras de 40 unidades cada una y se realiza una prueba de hipótesis de diferencia de medias utilizando la prueba Z con varianzas poblacionales desconocidas.

Tuesday, August 5, 14

Tuesday, August 5, 14

Tuesday, August 5, 14

Tuesday, August 5, 14

Tuesday, August 5, 14

Tuesday, August 5, 14

Formulación:Ho: µ1 = µ2Ha: µ1 ≠ µ2

P(dos colas) = 0,00P(dos colas) < α/2Se rechaza Ho, existe suficiente evidencia estadística para indicar que hay diferencias significativas entre las medias.Los valores de la máquina 1 difieren estadísticamente de la máquina 2.

Tuesday, August 5, 14

Bibliografía Esencial

Tuesday, August 5, 14