25
HERRAMIENTAS ESTADÍSTICAS PARA INGENIERÍA Prueba de Hipótesis para Distribuciones: Normal y t de Student Presenta: MTRO. JAVIER SOLIS NOYOLA

Prueba de hipótesis para distribuciones normal y t student

Embed Size (px)

Citation preview

Page 1: Prueba de hipótesis para distribuciones normal y t student

HERRAMIENTAS ESTADÍSTICAS PARA INGENIERÍA

Prueba de Hipótesis para Distribuciones:Normal y t de Student

Presenta:MTRO. JAVIER SOLIS NOYOLA

Page 2: Prueba de hipótesis para distribuciones normal y t student

OBJETIVOS• El alumno conocerá y comprenderá el concepto de hipótesis

estadística como herramienta para la toma de decisiones.

• Identificará el proceso de cálculo de hipótesis para distribuciones de probabilidad: Normal y t de Student

• Desarrollará ejercicios que impliquen cálculos de Hipótesis en distribuciones de probabildad: Normal y t de Student

Page 3: Prueba de hipótesis para distribuciones normal y t student

En el Proceso del Método Científico, ¿Qué es una Hipótesis?

Problema

Observación:•Identificar variables. • Información Teórica

Hipótesis:*Propuesta de posible solución

Experimentación:•ejecución de acciones queVerifiquen la hipó-Tesis.

Difusión:•Conformación de un nuevos do-cumentos que con-tienen nueva in-formación.

Page 4: Prueba de hipótesis para distribuciones normal y t student

Niveles de análisis (Método Estadístico)

0. Nosotros no tenemos experiencia ni datos, sólo opiniones.

1. Nosotros sólo usamos experiencia, no datos.

2. Nosotros colectamos datos, pero apenas miramos números.

3. Nosotros agrupamos los datos en forma de tablas y gráficas.

4. Nosotros usamos datos muestra con estadísticas descriptivas.

5. Nosotros usamos datos muestra con estadísticas inferencial.

USLT

LSL

¿Qué nivel de análisis usas para

soportar tus decisiones?

Page 5: Prueba de hipótesis para distribuciones normal y t student

LA ESTADÍSTICA SEGÚN EL TIPO DE ESTUDIO CIENTÍFICO

DESCRIPTIVA

• Métodos para organizar, resumir y presentar datos de manera informativa.

INFERENCIAL• Son los métodos para determinar

algo acerca de una población basándose en una muestra.

USLT

LSL

Aquí es donde estudiaremos cómo aceptar o rechazar una Hipótesis, según los parámetros de la muestra de una población en estudio .

Page 6: Prueba de hipótesis para distribuciones normal y t student

PROBLEMA REAL

PROBLEMA ESTADÍSTICO

SOLUCIÓN ESTADÍSTICA

APLICACIÓN PRÁCTICA DE LA

SOLUCIÓN

Campo Estadístico

Vida Real

Solución de problemas con Estadística

¿Cómo funciona la metodología?

Page 7: Prueba de hipótesis para distribuciones normal y t student

Una hipótesis estadística es una afirmación o proposición respecto a alguna característica de una población, generalmente fundamentada sobre un parámetro de la misma. Contrastar una hipótesis es comparar las predicciones con la realidad que observamos ocurrida en una muestra. Si dentro del margen de error que estamos dispuestos a admitir, hay coincidencia, aceptaremos la hipótesis y en caso contrario la rechazaremos.

hi

eó tp si

s

Page 8: Prueba de hipótesis para distribuciones normal y t student

Hipótesis nula e hipótesis alternativa•La hipótesis emitida se suele designar por Ho y se llama Hipótesis nula. Lo de “nula” viene de que partimos del supuesto de que las diferencias entre el valor verdadero del parámetro y su valor hipotético, en realidad no son tales, sino debidas al azar, es decir no hay diferencia o dicho de otra forma la diferencia es nula.

•La hipótesis contraria se designa por H1 y se llama Hipótesis alternativa (en algunos textos también aparece la notación Ha).

1.- Sospechamos que las bolsas de frutos secos de 100 gramos, realmente no pesan 100 gramos. Para contrastar esta hipótesis plantearíamos:

2.- Estaría contento de comprobar que no pueden demostrar que mi media de notas ha bajado de 7,785 como parecen indicar los últimos exámenes. Para contrastar esta hipótesis:

Ejemplos:

Hipótesis nula

Hipótesis nula

Hipótesis alternativa

Hipótesis alternativa

Page 9: Prueba de hipótesis para distribuciones normal y t student

Paso 4: Se formula la regla de decisión

Paso 3: Se identifica el estadístico de prueba

Paso 5: Se toma una muestra y se decide: se acepta H0 o se rechaza

H0

Paso 2: Se selecciona el nivel de significancia (α)

Paso 1: Se plantean las hipótesis nula (H0) y alternativa (H1)

α α α/2 α/2

ó ; n<30

H0 : µ= µ0

H1 : µ ≠µ0

H0 : µ ≥ µ0

H1 : µ < µ0

H0 : µ ≤ µ0

H1 : µ > µ0

Cola a la derecha

Cola a laIzquierda

Bilateral (ambas colas)

; n≥30

Sí el valor del Z (calculado por estadístico) < Zα (valor crítico obtenido en tablas: Normal o T Student) SE ACEPTA (H0)

Sí el valor del Z (calculado por estadístico) > Zα (valor crítico obtenido en tablas: Normal o T Student) SE ACEPTA (H0)

• Sí el valor del Z (calculado por estadístico) > - Zα/2 (cola izquierda) ó

• Sí el valor del Z (calculado por estadístico) < + Zα/2 (cola derecha) Cualquiera de los 2 casos anteriores SE ACEPTA (H0)

Cola a la derecha

Cola a la izquierda

Ambas colas

En función del tamaño la muestra, las condiciones de pasos (1 a 4) y los cálculos desarrollados Se ACEPTA (H0) ó se RECHAZA (H0)

Procedimiento de cinco pasos para probar una Hipótesis

Page 10: Prueba de hipótesis para distribuciones normal y t student

H0 : µ= µ0

H1 : µ ≠µ0

H0 : µ ≥ µ0

H1 : µ < µ0

H0 : µ ≤ µ0

H1 : µ > µ0

Cola a la derecha Cola a la Izquierda Bilateral (ambas colas)

Paso 1: Se plantean las hipótesis nula (H0) y alternativa (H1)

Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian.

La hipótesis nula (H0) se refiere siempre a un valor especificado del parámetro de población. La letra H significa hipótesis y el subíndice cero no hay diferencia.

La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad (= ; ≥; ≤ ) con respecto al valor especificado del parámetro.

La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.

H0 H0H0

H1H1 H1

H1

Identificación simbólica y gráfica en una distribución de las hipótesis: nula (H0) y alternativa H1

Page 11: Prueba de hipótesis para distribuciones normal y t student

•Nivel de significancia: Probabilidad de rechazar la hipótesis nula (H0) cuando es verdadera. Se le denota mediante la letra griega α, también es denominada como nivel de riesgo, este término es mas adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.

•Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población.

Paso 2: Se selecciona el nivel de significancia (α)

Page 12: Prueba de hipótesis para distribuciones normal y t student

Ilustraciones del Nivel de significancia α (0, 1%, 5%, y 10%) para una prueba bilateral de dos extremos o dos colas de una distribución Normal, y sus respectivos valores de Z. (Ver TABLA valores de Z en ANEXO A )

Page 13: Prueba de hipótesis para distribuciones normal y t student

Distribución Normal:Prueba para la media de la población: muestra grande (n≥30) , desviación estándar de la población conocida.

zX

/ n

Distribución t de Student:Prueba para la media de la población: muestra pequeña (n<30) , desviación estándar poblacional desconocida.

nsXt

/

¿Cómo se identifica el estadístico para una prueba de Hipótesis ?Existen muchos estadísticos de prueba. En esta presentación, sólo se analizan 2 de ellos: Distribución Normal y distribución t de Student.

Donde: = media muestral

µ = Media Poblacional

σ = Desviación Estándar Poblacional

n = número en la muestra

Donde: = media muestral

µ = Media Poblacional

s = Desviación Estándar de la muestra

n = número en la muestra

Paso 3: Se identifica el estadístico de prueba

Page 14: Prueba de hipótesis para distribuciones normal y t student

Paso 4: Formulación de la regla de decisión

Sí el valor del Z (calculado por estadístico) > Zα (valor crítico obtenido en tablas: Normal ) SE ACEPTA (H0)

Sí el valor del Z (calculado por estadístico) < Zα (valor crítico obtenido en tablas: Normal ) SE ACEPTA (H0)

• Sí el valor del Z (calculado por estadístico) > - Zα/2 (cola izquierda*) y

• Sí el valor del Z (calculado por estadístico) < + Zα/2 (cola derecha*) O bien , si el Z calculado esta entre valores de ±Zα/2 SE ACEPTA (H0)

Nota: Los valores de - Zα/2 y + Zα/2 se obtienen de tablas de datos de distribución Normal (Esto también aplica de igual forma para una distribución t de Student )

Cola a la Izquierda

valor crítico (-)

Cola a la derecha

Bilateral: Ambas colas

valor crítico (+)

valor crítico (+) - Zα/2 + Zα/2

H0

H0

H0

Una regla de decisión establece las condiciones específicas en las que se rechaza la Hipótesis Nula (H0), y las condiciones en las que no se rechaza. La región de rechazo (establecidos en α) define la probabilidad de que No se acepte la hipótesis nula (H0) o que sea aceptada la hipótesis alterna (H1)

valor crítico (-)

Valor Crítico (-Zα ó +Zα )es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula. Este valor se obtiene mediante la tablas de distribución Normal. Esto también aplica de igual forma para una distribución t de Student. (ver ANEXOS A y B al final de presentación)

Page 15: Prueba de hipótesis para distribuciones normal y t student

El quinto y último paso en una prueba de Hipótesis es calcular el estadístico de prueba Z ó t (por medio de fórmulas de distribución: Normal o t de Student), compararlos con el valor crítico (-Zα , +Zα , - ±Zα/2 ; -tα, +tα, ±tα/2 ) , que se obtiene de tablas de distribución: Normal o t de Student ), y tomar la decisión de rechazar o no la Hipótesis nula

Paso 5: Se toma una muestra y se decide: se acepta H0 o se rechaza H0

- Zα/2 + Zα/2

zX

/ n

nsXt

/

-Zα, +Zα, ± Zα/2

SE ACEPTA (H0) NO SE ACEPTA (H0)

-tα, +tα, ±tα/2

Page 16: Prueba de hipótesis para distribuciones normal y t student

Ejemplo 1

análisis de valores Z

análisis de valores Z

El administrador de un centro de salud desea saber si el tiempo medio invertido por los pacientes en la sala de espera es mayor de 20 minutos. Un muestra de 100 pacientes permanecieron, en promedio, 23 minutos en la sala de espera entre el registro y la atención por algún médico del centro de salud. La desviación estándar de la muestra fue de 10. use un nivel de significancia del 5%.

𝑛=100

ó (0.05) 1- ó (0.95)𝑥=23𝑚𝑖𝑛𝑢𝑡𝑜𝑠𝝈=10𝑚𝑖𝑛𝑢𝑡𝑜𝑠

Distribución Normal (n ≥30)Paso 3: Se identifica el estadístico de prueba

Paso 2: Se selecciona el nivel de significancia (α)

Paso 1: Se plantean las hipótesis nula (H0) y alternativa (H1)

Page 17: Prueba de hipótesis para distribuciones normal y t student

Región de rechazoRegión de aceptación

𝒁 𝒄=𝟐𝟑−𝟐𝟎𝟏𝟎

√𝟏𝟎𝟎

=𝟑

𝒁 𝜶=𝟏 .𝟔𝟒𝟓La regla de decisión es rechazar

Como: , rechazamos la hipótesis nula .

Paso 4: Se formula la regla de decisión

Paso 5: Se toma una muestra y se decide: se acepta H0 o se rechaza H0

𝒁 𝒄=𝟑

ó menor𝑯𝟏 :𝑬𝒍 𝒕𝒊𝒆𝒎𝒑𝒐𝒎𝒆𝒅𝒊𝒐 𝒊𝒏𝒗𝒆𝒓𝒕𝒊𝒅𝒐 𝒑𝒐𝒓 𝒍𝒐𝒔𝒑𝒂𝒄𝒊𝒆𝒏𝒕𝒆𝒔 𝒆𝒏𝒍𝒂𝒔𝒂𝒍𝒂𝒅𝒆𝒆𝒔𝒑𝒆𝒓𝒂𝒆𝒔𝒎𝒂𝒚𝒐𝒓 𝒅𝒆𝟐𝟎𝒎𝒊𝒏𝒖𝒕𝒐𝒔

Ver cálculo de

En Tabla de ANEXO A

Sí el valor del Zc (calculado por estadístico) > Zα (valor crítico obtenido en tabla Normal SE RECHAZA (H0)

Aceptando Hipótesis Alterna (H1)

𝑯𝟎

𝑯 𝟏

𝜇=0

𝑍=𝒙−𝝁𝝈√𝒏

𝒁−𝒁

ístico Calculado)

Page 18: Prueba de hipótesis para distribuciones normal y t student

Ejemplo 2

análisis de valores Z

Kg análisis de valores Z

En una ciudad, cada persona produce en promedio 1.2 kg de basura diariamente, con una desviación estándar de 0.7 kg. Se tiene la idea de que esta cantidad ha cambiado, así que un investigador toma una muestra de la basura que produjeron 75 personas, dando un promedio de 1.4 kg de basura por persona. Probar la hipótesis mencionada con un nivel de significancia del 1%

75

ó (0.01) 1- ó (0.99)g.

Kg

Paso 3: Se identifica el estadístico de prueba

Paso 2: Se selecciona el nivel de significancia (α)

Paso 1: Se plantean las hipótesis nula (H0) y alternativa (H1)

Distribución Normal (n≥30)

Page 19: Prueba de hipótesis para distribuciones normal y t student

Región de rechazo

2.47

75

La regla de decisión es: Aceptar

Como: 2.47 esta dentro del intervalo Aceptamos la Hipótesis nula .

Paso 4: Se formula la regla de decisión

Paso 5: Se toma una muestra y se decide: se acepta H0 o se rechaza H0

2.47

Se acepta la Hipótesis nula H0, ya que el estadístico de prueba ( Z=2.47) queda dentro de los valores críticos: -2.575 y 2.575.

Ver cálculo de ±575

En Tabla de ANEXO A𝜇=0

𝑍=𝒙−𝝁𝝈√𝒏

𝑯𝟎

𝑯𝟏𝑯𝟏

Región de aceptaciónRegión de rechazo−𝒁𝜶 /𝟐=−𝟐 .𝟓𝟕𝟓

𝒁−𝒁

ístico Calculado)

Page 20: Prueba de hipótesis para distribuciones normal y t student

Ejemplo 3

análisis de valores t

g análisis de valores t

Un ingeniero tiene la impresión de que el desperdicio en una línea de producción automatizada está aumentando: según datos históricos era de 45 kg en promedio diariamente. Para probarlo, toma una muestra de 20 días, y calcula un desperdicio promedio diario de 46.3 kg, con una desviación estándar de 2. Probar la hipótesis con un nivel de significancia del 5%.

𝑛=2 0

ó (0.05) 1- ó (0.95)𝑥=46.3𝐾𝑔𝑺=2𝐾𝑔

Distribución t de Student (n<30)Paso 3: Se identifica el estadístico de prueba

Paso 2: Se selecciona el nivel de significancia (α)

Paso 1: Se plantean las hipótesis nula (H0) y alternativa (H1)

nsXt

/

Page 21: Prueba de hipótesis para distribuciones normal y t student

Región de rechazo Región de aceptación

2.9069

29

Paso 4: Se formula la regla de decisión

69

𝜇=0

𝑯𝟎

𝑯𝟏

𝒕−𝒕

ístico Calculado)

nsXt

/

Los grados de libertad (gl), se obtienen a partir de la fórmula: gl = n – 1 gl = 20 – 1= 19

ó (0.05) para prueba de una cola

La regla de decisión es: rechazar Sí el valor del tc (calculado por estadístico) > tα (valor crítico obtenido en tabla t de Student SE RECHAZA (H0)

tabla datos t de Student

Tabla de ANEXO B29

Paso 5: Se toma una muestra y se decide: se acepta H0 o se rechaza H0

Acepto la hipótesis alternativa, ya que el estadístico de prueba (2.9069) supera el valor crítico 1.729 (Se rechaza Hipótesis Nula

Page 22: Prueba de hipótesis para distribuciones normal y t student

ANEXO A

Tabla de áreas bajo la curva Normal (del lado derecho curva):

acceso en:http://abaco.com.ve/esta/Tabla_distribucion_normal_a_la_derecha_de_z_0.pdf

𝒁 𝜶=𝟏 .𝟔𝟒𝟓

Caso de ejemplo 1 = 1.64 ó 1.65

O bien obteniendo un promedio de: (1.64 +1.65)/ 2 =

Page 23: Prueba de hipótesis para distribuciones normal y t student

ANEXO BTabla de de distribución

t de Student. Obtenida de libro:

MASON D. Robert, Douglas LIND A. y William MARCHAL. Estadística para Administración y Economía. 11ª. Edición, Alfaomega, 2004.

Los grados de libertad (gl), se obtienen a partir de la fórmula:

gl = n - 1

Donde: n = tamaño de la muestra

gl = grados de libertad

Page 24: Prueba de hipótesis para distribuciones normal y t student

1.- La duración de las bombillas que fabrica una empresa, sigue una distribución normal, con una desviación estándar de 125 horas. La empresa garantiza una vida mínima de 875 horas para cada bombilla. Se escoge una muestra de 50 bombillas, y después de comprobar la vida de las mismas se obtuvo una media de 798 horas. ¿Puede afirmarse con un nivel de significancia de 5% que la publicidad de la empresa es engañosa?

2.- Jamestown Steel Company fabrica y arma escritorios y otros muebles para oficina en diferentes plantas en el oeste del estado de Nueva York. La producción semanal del escritorio modelo A325 en la planta de Fredonia tiene una distribución normal, con una media de 200 y una desviación estándar de 16. Hace poco, con motivo de la expansión del mercado, se introdujeron nuevos métodos de producción y se contrató a más empleados. El vicepresidente de fabricación pretende investigar si hubo algún cambio en la producción semanal del escritorio modelo A325. En otras palabras, ¿la cantidad media de escritorios que se produjeron en la planta de Fredonia es diferente de 200 escritorios semanales con un nivel de significancia de 0.01?

3.- La longitud media de una pequeña barra de contrapeso es de 43 milímetros. Al supervisor de producción le preocupa que hayan cambiado los ajustes de la máquina de producción de barras. Solicita una investigación al departamento de ingeniería, que selecciona una muestra aleatoria de 12 barras y las mide. Los resultados aparecen en seguida, expresados en milímetros.

42, 39, 42, 45, 43, 40, 39, 41, 40, 42, 43, 42

¿Es razonable concluir que cambió la longitud media de las barras? Utilice el nivel de significancia 0.02.

Ejercicios para desarrollar

Page 25: Prueba de hipótesis para distribuciones normal y t student

MASON D. Robert, Douglas LIND A. y William MARCHAL. Estadística para Administración y Economía. 11ª. Edición, Alfaomega, 2004.

Hernández Sampieri Roberto, Fernández Collado Carlos y Bapista Lucio Pilar. METODOLOGÍA DE LA INVESTIGACIÓN. Editorial Mc Graw Hill, edición 3ª. México, 2004

Referencias Informáticas