16
Estadística Inferencial

Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

  • Upload
    doannga

  • View
    288

  • Download
    41

Embed Size (px)

Citation preview

Page 1: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

Estadística Inferencial

Page 2: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

1

Sesión No. 8

Nombre: Pruebas de hipótesis referentes al valor de la media de la población. Parte II. Objetivo: Al finalizar la sesión, el estudiante conocerá cómo calcular el tamaño

de la muestra requerido para probar la media. Así mismo aplicará el método del

valor P para pruebas de hipótesis referentes a la media de la población.

Contextualización

Establecer el tamaño muestral apropiado para una investigación es fundamental

y depende del método de análisis a emplear. A partir de la prueba de hipótesis

que se utilizará es posible un acercamiento al tamaño de la muestra particular.

En la sesión anterior, se ha visto que la decisión de rechazar o aceptar 𝐻0 se

tomó al comparar el valor calculado del estadístico de prueba con un valor crítico

de 𝑧 basado en el nivel de significancia 𝛼 de la prueba. Aún así, diferentes

niveles de significancia pueden conducir a diversas conclusiones. Para evitar

confusiones en las conclusiones, algunos experimentadores prefieren usar un

nivel de significancia variable llamado valor P para la prueba.

Page 3: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

2

Introducción al Tema

¿Por qué es importante establecer el tamaño apropiado de una muestra para probar la media?

Imagen recuperada de: 4.bp.blogspot.com

En esta sesión, se expondrá en primer lugar cómo determinar el tamaño de la

muestra requerido para probar la media. Podrás ver que, para el caso de

pruebas de hipótesis para la media con varianza conocida, y tamaño de muestra

grande o población normal muestreada, se tiene una expresión sencilla para

calcular el tamaño de muestra.

También podrás revisar acerca de un procedimiento para las pruebas de

hipótesis conocido como método del valor P, que actualmente ha cobrado

popularidad por ser fácilmente aplicable al software de cómputo.

Page 4: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

3

Explicación

4.3 Determinación del tamaño de muestra requerido para probar la media

¿Cómo determinar el tamaño de la muestra en una prueba de hipótesis para la media poblacional?

Al realizar una prueba de hipótesis para el valor de la media poblacional, el nivel

de significancia elegido determina la probabilidad de cometer un error tipo I en

esta prueba. Al controlar el tamaño de la muestra, también se controla la

probabilidad de cometer un error tipo II.

La expresión matemática para determinar el tamaño de la muestra en la prueba

de hipótesis de cola inferior para la media poblacional se muestra a continuación:

𝒏 =(𝒛𝒂 + 𝒛𝜷)𝟐𝝈𝟐

(𝝁𝟎 − 𝝁𝒂)𝟐

Donde:

𝑧𝑎 = Valor de 𝑧 que proporciona un área de 𝑎 en la cola superior de la

distribución normal estándar.

𝑧𝛽= Valor de 𝑧 que proporciona un área de 𝛽 en la cola superior de la

distribución normal estándar.

𝜎 = Desviación estándar poblacional.

𝜇0= Valor de la media poblacional en la hipótesis nula.

𝜇𝑎= Valor de la media poblacional utilizada para el error tipo II.

Para una prueba de hipótesis de dos colas se emplea 𝑧𝑎 2⁄ en lugar de 𝑧𝑎 en la

misma expresión.

Page 5: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

4

Ejemplo:

Un contratista tiene que decidir si acepta un

pedido de vigas recibido de un proveedor o si

lo rechaza por no ser del tamaño solicitado.

Las especificaciones indican que la longitud

promedio de las vigas debe ser por lo menos

120 centímetros. Para evaluar si el pedido

recibido satisface lo anterior, se selecciona una muestra de 36 vigas y se miden.

De acuerdo con esta muestra se deberá tomar la decisión de aceptar el pedido

de vigas o devolverlo por no tener la longitud adecuada.

Sea 𝜇 el número medio de longitud que tienen las vigas del envío. La hipótesis

nula y alternativa para la media poblacional que se plantean son:

𝐻0: 𝜇 ≥ 120 𝐻1: 𝜇 < 120

Suponiendo que el contratista establece con base a su propio criterio lo siguiente

acerca de las probabilidades de cometer los errores tipo I y tipo II:

Para el error tipo I: Si la media de la longitud de las vigas del pedido es

𝜇 = 120, el estará dispuesto a asumir el riesgo de que la probabilidad de

rechazar el envío sea 0.05.

Para el error tipo II: Si la media de la longitud de las vigas del pedido es

5 centímetros menos de lo que indican las especificaciones (es decir,

𝜇 = 115), estoy dispuesto a asumir el riesgo de que la probabilidad de

aceptar el envío sea 𝛽 = 0.10.

Si 𝛼 = 0.05 y 𝛽 = 0.10. Mediante la distribución de probabilidad normal estándar

se tiene que:

𝑧𝑎 = 𝑧0.05 = 1.645

Fuente: construmatica.com

Page 6: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

5

𝑧𝛽 = 𝑧0.10 = 1.282

Como 𝜇0 = 120, 𝜇𝑎 = 115 y 𝜎 = 12 se tiene que:

𝑛 =(1.645 + 1.282)2(12)2

(120 − 115)2= 49.3478 ≅ 50

Como las probabilidades de los dos tipos de errores se han controlado utilizando

𝑛 = 50, queda justificado que, en esta prueba de hipótesis, el contratista diga se

acepta 𝐻0 o se rechaza 𝐻0. Las inferencias correspondientes se hacen teniendo

probabilidades admitidas de cometer un error tipo I o un error tipo II.

Acerca de la relación entre 𝛼 , 𝛽 y el tamaño 𝑛 de la muestra caben tres

observaciones (Anderson, Sweeney, & Williams, Estadística para administración

y economía, 2008).

1. Una vez que se tienen dos de estos tres valores, el tercero puede

calcularse.

2. Dado un nivel de significancia 𝛼, aumentando el tamaño de la muestra se

reduce 𝛽.

3. Dado un tamaño de muestra, al disminuir 𝛼 aumenta 𝛽 y al aumentar 𝛼,

disminuye 𝛽.

La tercera observación debe tenerse en cuenta cuando no se controla la

probabilidad de cometer un error tipo II. Dicha observación indica que no se

deben elegir niveles de significancia 𝛼 innecesariamente pequeños; para un

Page 7: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

6

tamaño de muestra dado, elegir un nivel de significancia pequeño implica más

riesgo de cometer un error tipo II. Valores pequeños de 𝛼 son mejores si sólo

preocupa cometer un error tipo I. Pero valores pequeños de 𝛼 tienen la

desventaja de incrementar la probabilidad de cometer un error tipo II.

4.4 Método del valor P para pruebas de hipótesis referentes a la media de la población

¿En qué consiste el método del valor P?

El procedimiento de prueba de hipótesis para la media poblacional por el método

del valor P es el siguiente (Anderson, Sweeney, & Williams, Estadística para

negocios y economía, 2012):

1. Establecer la hipótesis nula y la hipótesis alternativa.

2. Especificar el nivel de significancia.

3. Recabar los datos muestrales y calcular el valor del estadístico de prueba.

4. Emplear el valor del estadístico de prueba para calcular el valor P.

5. Rechazar 𝐻0 si el valor P≤ 𝛼

El valor P es el nivel más pequeño de significancia 𝛼 para el cual la información

observada indica que 𝐻0 debe ser rechazada cuando se utiliza un procedimiento

de prueba especificado con un conjunto de datos dado.

El valor P es un número comprendido entre 0 y 1, por ser una probabilidad, que

mide el grado en que los datos observados confirman 𝐻0. Es una probabilidad

asociada al valor que toma el estadístico de contraste para los datos de la

muestra. Cuanto menor sea el valor P es menos probable que los datos

observados se ajusten a la hipótesis nula formulada (González Manteiga &

Perez de Vargas, 2012).

Para calcular el valor P, se emplea el valor del estadístico de prueba. El método

a seguir depende de si se trata de una prueba de cola inferior, de cola superior o

de dos colas.

Page 8: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

7

En la prueba de cola inferior, el valor P es la probabilidad de conseguir un valor

del estadístico de prueba tan pequeño o menor que el obtenido con la muestra.

Por ende, para calcular el valor P, en el caso de 𝜎 conocida, se debe determinar

el área bajo la curva normal estándar para valores de 𝑧 ≤ que el valor del

estadístico de prueba. Una vez que se ha determinado el valor P, la conclusión a

un nivel particular 𝛼 resulta de comparar el valor P con 𝛼:

1. Valor P≤ 𝛼 ⇒ rechazar 𝐻0 al nivel 𝛼

2. Valor P> 𝛼 ⇒ no rechazar 𝐻0 al nivel 𝛼

Ejemplo:

El Instituto Nacional del Consumidor (INCO) realiza un estudio para verificar si

cierta marca de refresco embotellado cumple con el contenido neto de 3 litros

que se anuncia en su etiqueta. El INCO establece que mientras la media

poblacional del volumen de llenado sea por lo menos 3 litros por envase, los

derechos del consumidor estarán protegidos. Por lo tanto, el INCO selecciona

una muestra de 36 botellas de refresco de un contenedor grande, la media

muestral obtenida es �̅� = 2.92 litros. Los estudios realizados con anterioridad

indican que 𝜎 = 0.18 y que se puede sostener que la población de los volúmenes

de llenado tiene una distribución normal.

Solución

Si la media poblacional del volumen de llenado es por lo menos de 3 litros, lo

que afirma la embotelladora es correcto. Esto establece la hipótesis nula de la

prueba.

𝐻0: 𝜇 ≥ 3

Si la media poblacional del volumen de llenado es menor de 3 litros, lo que

afirma la embotelladora es incorrecto. Esto establece la hipótesis alternativa de

la prueba.

Page 9: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

8

𝐻1: 𝜇 < 3

El responsable de realizar la prueba en el INCO afirma que si la empresa

satisface sus especificaciones de volumen en 𝜇 = 3, no tomará ninguna medida

en su contra. Pero está dispuesto a asumir un riesgo de 1% de cometer tal error

(𝛼 = 0.01).

Con �̅� = 2.92, 𝜎 = 0.18 y 𝑛 = 36 se determina el valor del estadístico de prueba 𝑧.

𝑧 =�̅� − 𝜇0𝜎 √𝑛⁄

=2.92 − 3

0.18 √36⁄= −2.67

Como el valor P es la probabilidad de que el estadístico de prueba 𝑧 sea menor

o igual que −2.67 (el área bajo la curva normal estándar a la izquierda del

estadístico de prueba), en la siguiente tabla de probabilidad normal estándar

aparece que el área en la cola inferior para 𝑧 = −2.67 es 0.0038.

En la gráfica se puede ver que a �̅� = 2.92 le corresponde 𝑧 = −2.67 y el valor P

= 0.0038.

Page 10: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

9

Dado que el responsable de la prueba eligió como nivel de significancia un valor

𝛼 = 0.01, al comparar éste valor con el valor P (0.0038 ≤ 0.01), por lo tanto 𝐻0

es rechazada.

Algunos lineamientos que los expertos en estadística recomiendan para

interpretar valores P pequeños son (Anderson, Sweeney, & Williams, Estadística

para negocios y economía, 2012):

• Menor que 0.01: Evidencia terminante para concluir que 𝐻1 es verdadera.

• Entre 0.01 y 0.05: Fuerte evidencia para concluir que 𝐻1 es verdadera.

• Entre 0.05 y 0.10: Evidencia débil para concluir que 𝐻1 es verdadera.

• Mayor que 0.10: Evidencia insuficiente para concluir que 𝐻1 es verdadera.

Page 11: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

10

Conclusión

En esta sesión, pudiste ver cómo determinar el tamaño de la muestra requerido

en una prueba de hipótesis para la media poblacional, de manera que se

controlen tanto la probabilidad de cometer un error tipo I como un error tipo II.

También se presentaron los pasos básicos del método del valor P para pruebas

de hipótesis acerca de una media poblacional. El cual se basa en la

determinación de un valor P que es una medida de fortaleza de la evidencia de

los datos en contra de la hipótesis nula.

Si los intervalos de confianza están dedicados a determinar los valores creíbles

para una cantidad como una media poblacional 𝜇, ¿cuál será la relación entre

los intervalos de confianza y las pruebas de hipótesis?

Page 12: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

11

Para aprender más

¿Cuándo nace el concepto del p-valor y cómo ha evolucionado hasta el concepto tal y como es utilizado en nuestros días?

• Romero, S. N. (2012). La revolución en la toma de decisiones estadísticas:

el p-valor. Telos, 14(3), 439-446. Septiembre-Diciembre Documento

obtenido de:

http://www.redalyc.org/pdf/993/99324907004.pdf

Page 13: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

12

Actividad de Aprendizaje

Instrucciones:

Con la finalidad de profundizar en los conocimientos adquiridos a lo largo de esta

sesión, ahora tendrás que realizar la siguiente actividad:

Resuelva los siguientes problemas.

1. En un estudio sobre el rendimiento de la gasolina en los automóviles,

medido en kilómetros por litro, se probaron las siguientes hipótesis

Hipótesis Conclusión

𝐻0 : ≥ 20 𝑘𝑘𝑘í𝑚𝑚𝑚𝑚𝑚𝑚 𝑝𝑚𝑚 𝑐𝑎𝑐𝑎 𝑘𝑘𝑚𝑚𝑚 Confirma lo que sostiene el fabricante

𝐻1 < 20 𝑘𝑘𝑘ó𝑚𝑚𝑚𝑚𝑚𝑚 𝑝𝑚𝑚 𝑐𝑎𝑐𝑎 𝑘𝑘𝑚𝑚𝑚 Refuta lo que sostiene el fabricante; el rendimiento es menor de lo afirmado

Para 𝜎 = 3 y un nivel de significancia de 0.02, ¿qué tamaño de muestra

se recomienda si el investigador desea tener 80% de probabilidad de

detectar que 𝜇 es menor que 20 kilómetros por litro cuando en realidad es

de 19?

2. La longitud objetivo de cintas empleadas en moños para regalos es de

245 cm. De una muestra de 50 cintas, cada una con una longitud

determinada, se obtiene una media de longitud de 246.18 cm y una

desviación estándar de 3.6 cm. ¿Sugieren estos datos que la longitud

promedio verdadera es algún otro diferente del valor objetivo?

3. Un gerente de control de calidad para probar si en el proceso de

fabricación de LEDs se satisface el estándar de producir 120 piezas por

lote se usan las hipótesis 𝐻0: 𝜇 = 120 y 𝐻1: 𝜇 ≠ 120. Empleando un nivel

de significancia de 0.05 y una desviación estándar de 5. Si la media de

producción disminuye a 117 piezas por lote, el gerente de control de

Page 14: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

13

calidad desea tener 98% de oportunidad de concluir que no se está

satisfaciendo el estándar de producción. ¿De qué tamaño deberá tomarse

la muestra?

Puedes realizarlo en un procesador de textos, al final tendrás que guardarlo en

formato PDF, y entregarlo de acuerdo a las indicaciones de tu profesor.

Recuerda que esta actividad te ayudará a reforzar tus conocimientos en la

determinación del tamaño de la muestra y el método del valor P.

Esta actividad representa el 5% de tu calificación y se tomará en cuenta lo

siguiente:

• Tus datos generales.

• Título de la actividad.

• Procedimiento correcto y completo de los ejercicios.

• Ortografía y redacción.

Page 15: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

14

Bibliografía

• Alvarado, V. J. A., & Obagi, A. J. J. (2008). Fundamentos de inferencia

estadística. Colombia: Pontificia Universidad Javeriana.

• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística

para administración y economía (10 ed.). México: Cengage Learning.

• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2012). Estadística

para negocios y economía (11 ed.). México: Cengage Learning.

• Devore, J. L. (2008). Probabilidad y estadística para ingeniería y ciencias

(8 ed.). México: Cengage Learning.

• González, M. M. T., & Pérez de Vargas, A. (2012). Estadística aplicada.

Una visión instrumental. España: Díaz de Santos.

• Hines, W. W., & Montgomery, D. C. (1996). Probabilidad y estadística

para ingeniería y administración (2 ed.). México: Compañía Editorial

Continental.

• Lind, D. A., Marchal, W. G., & Wathen, S. A. (2012). Estadística aplicada a

los negocios y economía (15 ed.). México: McGraw-Hill.

• Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2015). Introducción a la

probabilidad y estadística (14 ed.). México: Cengage Learning.

• Navidi, W. (2006). Estadística para ingenieros. México: McGraw-Hill.

• Spiegel, M. R., & Stephens, L. J. (2008). Estadística. México: McGraw-Hill.

• Triola, M. F. (2004). Estadística (9 ed.). México: Pearson Educación.

• Triola, M. F., & Pineda Anaya, M. L. (2004). Probabilidad y Estadística.

México: Pearson Education.

Page 16: Estadística Inferencialmoodle2.unid.edu.mx/dts_cursos_mdl/ejec/ME/EI/S08/EI08_Lectura.pdf · ESTADÍSTICA INFERENCIAL 1 Sesión No. 8 Nombre: Pruebas de hipótesis referentes al

ESTADÍSTICA INFERENCIAL

15

• Wackerly, D. D., Mendenhall III, W., & Scheaffer, R. L. (2010). Estadística

matemática con aplicaciones (7 ed.). México: Cengage Learning.

• Walpole, R. E., Myers, R. H., & Myers, S. L. (1999). Probabilidad y

estadística para ingenieros (6 ed.). México: Prentice-Hall.

Cibergrafía

• Romero, S. N. (2012). La revolución en la toma de decisiones estadísticas:

el p-valor. Telos, 14(3), 439-446. Septiembre-Diciembre Documento

obtenido de:

http://www.redalyc.org/pdf/993/99324907004.pdf

Te invito a que consultes la Biblioteca Digital UNID