PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA
Pruebas de hipótesis es una parte de la ESTADISTICA INFERENCIAL y
tiene su analogía con los pasos que se realizan en un JUICIO.
Objetivo:
Aquí no se busca Estimar el parámetro 𝜃 sino determinar cuál de
las hipótesis contrapuestas propuestas por el investigador es la
correcta para cierto nivel.
Procedimiento de Prueba de Hipótesis
El investigador establecerá las hipótesis en base a la teoría
que quiere verificar, para un parámetro 𝜃.
Tomar una muestra aleatoria de la población en estudio.
Comparar lo observado con su teoría, si lo observado se
contrapone a su teoría se rechaza su hipótesis en caso
contrario se dice que no se observó cambio.
Primero definiremos los elementos necesarios para lleva adelante
una Prueba de hipótesis.
a) El investigador debe establecer las hipótesis contrapuestas
de interés para 𝜃, llamadas Hipótesis Nula (𝑯𝟎) e Hipótesis
Alternativa (𝑯𝒂).
𝑯𝟎 hipótesis de no cambio, no diferencia, no mejoría, etc.
𝑯𝒂 hipótesis que el investigador pretende validar.
Si 𝜃 es el parámetro de interés y 𝜃0 un valor fijado por el
investigador entonces en nuestro tratamiento de Prueba de
hipótesis consideraremos estas posibles hipótesis alternativas
𝑯𝒂 ∶
𝜽 ≠ 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒃𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍
𝜽 > 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓𝜽 < 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓
b) Estadístico de Prueba: estadístico con distribución conocida
bajo hipótesis nula, sobre el cual se basará la decisión a
tomar.
c) Región de Rechazo (RR): conjunto de valores del estadístico
de prueba para los cuales 𝑯𝟎 será rechazada.
d) Luego 𝑯𝟎 será rechazada si el valor observado o alcanzado
del estadístico pertenece a la RR, en cuyo caso diremos que
la 𝑯𝒂 es la correcta. En caso contario diremos que no se
encontró evidencia suficiente para rechazar 𝑯𝟎.
Al tomar una decisión se pueden cometer dos tipos de errores.
Error tipo I: Rechazar 𝑯𝟎 cuando 𝑯𝟎 es verdadera.
Error tipo II: Aceptar 𝑯𝟎 cuando 𝑯𝟎 es falsa.
Denotaremos con 𝛼 𝑦 𝛽 a las probabilidades de cometer los Errores
tipo I y tipo II respectivamente.
Llamaremos nivel de significación de una prueba al valor
𝜶 = 𝐦𝐚𝐱𝜽𝝐𝜴𝟎𝜶 𝜽 , 𝒅𝒐𝒏𝒅𝒆 𝑯𝟎: 𝜽𝝐𝜴𝟎.
La RR determina las probabilidades de cometer cada uno de los
errores.
En resumen los pasos a seguir para realizar una Prueba de
Hipótesis son:
a) Identificar el parámetro de interés.
b) Determinar las Hipótesis nula y alternativa para el
problema.
c) Determinar el Estadístico de Prueba adecuado, con
distribución conocida bajo 𝑯𝟎 .
d) Fijado un nivel de significancia 𝜶 determinar la
Región de Rechazo.
e) Calcular el valor observado o alcanzado del
estadístico de prueba con la muestra obtenida.
f) Determinar si 𝑯𝟎 debe ser rechazada o no para el
nivel de significación dado, estableciendo una
conclusión en el contexto del problema.
PROBLEMA:
Supongamos que el 10% de las tarjetas de circuito producidas por
cierto fabricante son defectuosas.
Con el fin de reducir la proporción de tarjetas defectuosas se ha
sugerido un nuevo proceso de producción.
En este caso 𝜃 = 𝑝 es la verdadera proporción de tarjetas
defectuosas con este nuevo método de producción.
a) Establecer las hipótesis de interés.
b) Se tomó una muestra aleatoria de n=200 tarjetas producidas
con este nuevo método. Determinar el Estadístico de Prueba.
c) Dada la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 15 , calcular el nivel de significancia
aproximado y hallar una expresión para la probabilidad
aproximada de cometer el Error de tipo II.
d) Si ahora la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 12 , calcular el nivel de
significancia aproximado.
e) Si en la muestra aleatoria se obtuvo x=13 ¿cuál sería su
conclusión? Usando la región de rechazo dada en el ítem c).
Observaciones:
i) 𝛽 𝑝 crece cuando 𝑝 se aproxima a 0,10.
ii) 𝛼 = max𝑝≥0,10 𝛼 𝑝 = 𝛼 0,10 . Luego esta prueba sigue
teniendo el mismo nivel de significancia para la hipótesis
simplificada 𝐻0: 𝑝 = 0,10.
Por lo tanto de ahora en más nuestra hipótesis nula será:
𝑯𝟎 ∶ 𝜽 = 𝜽𝟎
Pruebas de Hipótesis para la media poblacional
Así como hicimos en IC consideraremos diferentes situaciones para
plantear Prueba de Hipótesis.
Hipótesis Nula:
𝑯𝟎 ∶ 𝝁 = 𝝁𝟎
Caso A:
Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una m.a. de 𝑁(𝜇, 𝜎2) con 𝜎2 conocido.
Bajo estos supuestos sabemos que
𝑿 ~ 𝑵 𝝁,𝝈𝟐
𝒏 ⇔
𝑿 − 𝝁
𝝈 𝒏 ~ 𝑵(𝟎, 𝟏)
Estadístico de Prueba
𝑿 −𝝁𝟎
𝝈 𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯𝟎
Si la Hipótesis alternativa fuese:
𝑯𝒂 ∶ 𝝁 < 𝜇𝟎
Fijado un nivel de significancia 𝛼 entonces veamos cómo
definir la Región de Rechazo (𝑅𝑅𝛼 ) y estudiemos el
comportamiento de la función 𝛽.
𝑹𝑹𝜶 = 𝒙 ≤ 𝒌𝜶 = −𝒛𝜶
𝝈
𝒏 + 𝝁𝟎 = 𝒛 ≤ −𝒛𝜶
La probabilidad de cometer el error tipo II es:
𝜷 𝝁′ = 𝟏 − 𝜱 −𝒛𝜶 + ( 𝝁𝟎−𝝁′)
𝝈 𝒏 , ∀ 𝝁′ < 𝝁𝟎.
Observaciones sobre esta función:
i) lim𝜇→𝜇0− 𝛽 𝜇 = 1 − 𝛼 y lim𝜇→−∞ 𝛽 𝜇 = 0.
ii) 𝛽 es una función creciente con punto de inflexión en
𝑘𝛼 .
Ahora si queremos determinar el tamaño de muestra
necesario para que una prueba de nivel 𝛼 sea tal que
𝜷 𝝁′ ≤ 𝜷𝟎
Entonces:
𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶
( 𝝁𝟎−𝝁′) 𝝈
𝟐
.
Ejercicio (8.18)
Se sabe que el tiempo de secado de cierto tipo de pintura, bajo
ciertas condiciones de prueba, está normalmente distribuido con
valor medio de 75 minutos y una desviación estándar de 9 minutos.
Unos químicos han diseñado un nuevo aditivo para reducir el
tiempo medio de secado de la pintura. Se supone que el tiempo de
secado para la pintura con el nuevo aditivo seguirá teniendo
distribución normal con desviación estándar de 9 minutos.
Debido al gasto asociado con el aditivo, la evidencia debe sugerir de
forma contundente una disminución en el tiempo medio de secado
(𝜇) para su aceptación.
a) Plantear las hipótesis pertinentes.
b) Dar el estadístico de prueba y su distribución bajo hipótesis
nula.
c) Se tomó una muestra aleatoria de tamaño 25 obteniéndose
un promedio muestral de 72,3 minutos. ¿Cuál sería su
conclusión usando un nivel de significancia de 0,01? Justifique
su respuesta.
d) ¿Cuál es el nivel de significación para la 𝑅𝑅= 𝑧 ≤ −2,88 ?
e) Para la RR dada en el ítem d), dar el valor de la probabilidad
de cometer el error tipo II cuando 𝜇 =70.
f) Para la RR dada en el ítem d), ¿cuál es el menor tamaño de
muestra que debería tomar para asegurar que 𝛽 70 ≤ 0,01?
Nivel de significación y P(error tipo II cuando μ=70)
68 69 70 71 72 73 74 75 76 77 78 79 80 81 820,00
0,02
0,04
0,07
0,09
0,11
0,13
0,16
0,18
0,20
0,22
De
nsid
ad
P(errortipo I)=0,0020
68 69 70 71 72 73 74 75 76 77 78 79 80 81 820,00
0,02
0,04
0,07
0,09
0,11
0,13
0,16
0,18
0,20
0,22
De
nsid
ad
P(error tipo II en 70)=0,5398
De igual forma se puede trabajar con las otras dos hipótesis
alternativas y que se pueden resumir como sigue.
Supuestos:
Sea 𝑿𝟏 , 𝑿𝟐, … , 𝑿𝒏 una m.a. de 𝑵(𝝁, 𝝈𝟐) con 𝝈𝟐 conocido.
Hipótesis Nula:
𝑯𝟎 ∶ 𝝁 = 𝝁𝟎
Estadístico de Prueba:
𝒁 = 𝑿 −𝝁𝟎
𝝈 𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯𝟎
𝑯𝒂 𝑹𝑹𝜶 𝜷 𝝁 𝝁 < 𝜇𝟎
𝒛 ≤ −𝒛𝜶 𝟏 − 𝜱 −𝒛𝜶 +
( 𝝁𝟎 − 𝝁)
𝝈 𝒏
𝝁 > 𝜇𝟎
𝒛 ≥ 𝒛𝜶 𝜱 𝒛𝜶 + ( 𝝁𝟎 − 𝝁)
𝝈 𝒏
𝝁 ≠ 𝝁𝟎
𝒛 ≥ 𝒛𝜶𝟐
𝜱 𝒛𝜶
𝟐 + ( 𝝁𝟎 − 𝝁)
𝝈 𝒏 − 𝜱 −𝒛𝜶
𝟐 +( 𝝁𝟎 − 𝝁)
𝝈 𝒏
El mínimo tamaño de muestra necesario para que una
prueba de nivel 𝛼 sea tal que
𝜷 𝝁′ ≤ 𝜷𝟎 tomar 𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶
( 𝝁𝟎−𝝁′) 𝝈
𝟐
si la hipótesis es
unilateral y poner 𝑧𝛼
2 en lugar de 𝑧𝛼 si la hipótesis es
bilateral. Problemas 8.10 y 8.11
Caso B:
Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una m.a. con media y varianza 𝜇 𝑦 𝜎2 . Si
el tamaño de muestra es suficientemente grande entonces
por TCL:
𝑿 ~ 𝑵 𝝁,𝝈𝟐
𝒏 ⇔
𝑿 − 𝝁
𝝈 𝒏 ~ 𝑵(𝟎, 𝟏)
Pedir 𝑛 ≥ 30 si la varianza es conocida y si es desconocida
reemplazar 𝜎 por S y pedir 𝑛 ≥ 40, luego todo es igual que
en el Caso A.
Hipótesis Nula:
𝑯𝟎 ∶ 𝝁 = 𝝁𝟎
Estadístico de Prueba:
𝒁 = 𝑿 −𝝁𝟎
𝝈 𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯𝟎
𝑯𝒂 𝑹𝑹𝜶 𝜷 𝝁 𝝁 < 𝜇𝟎
𝒛 ≤ −𝒛𝜶 𝟏 − 𝜱 −𝒛𝜶 +
( 𝝁𝟎 − 𝝁)
𝝈 𝒏
𝝁 > 𝜇𝟎
𝒛 ≥ 𝒛𝜶 𝜱 𝒛𝜶 + ( 𝝁𝟎 − 𝝁)
𝝈 𝒏
𝝁 ≠ 𝝁𝟎
𝒛 ≥ 𝒛𝜶𝟐
𝜱 𝒛𝜶𝟐 +
( 𝝁𝟎 − 𝝁)
𝝈 𝒏 − 𝜱 −𝒛𝜶
𝟐 +( 𝝁𝟎 − 𝝁)
𝝈 𝒏
Si el 𝜎 es desconocido reemplazarlo por S, siempre que
𝑛 ≥ 40.
El mínimo tamaño de muestra necesario para que una
prueba de nivel aproximado 𝛼 sea tal que 𝜷 𝝁′ ≤ 𝜷𝟎
tomar 𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶
( 𝝁𝟎−𝝁′) 𝝈
𝟐
si la hipótesis es unilateral y
poner 𝑧𝛼
2 en lugar de 𝑧𝛼 si la hipótesis es bilateral.
Caso C:
Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una m.a. de 𝑁(𝜇, 𝜎2) con 𝜎2
desconocido.
Bajo estos supuestos sabemos que
𝑿 − 𝝁
𝑺 𝒏 ~ 𝒕𝒏−𝟏
Hipótesis Nula:
𝑯𝟎 ∶ 𝝁 = 𝝁𝟎
Estadístico de Prueba:
𝑻 = 𝑿 −𝝁𝟎
𝑺 𝒏 ~ 𝒕𝒏−𝟏 , bajo 𝑯𝟎
𝑯𝒂 𝑹𝑹𝜶 𝝁 < 𝜇𝟎
𝒕 ≤ −𝒕𝜶
𝝁 > 𝜇𝟎
𝒕 ≥ 𝒕𝜶
𝝁 ≠ 𝝁𝟎
𝒕 ≥ 𝒕𝜶𝟐
,𝒏−𝟏
En este caso es muy complicado dar la expresión de la
probabilidad de cometer el Error Tipo II y determinar el
valor de n.
Problema 8.29
Pruebas de Hipótesis para la Proporción poblacional
Supuestos:
Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una m.a. de Bernoulli de parámetro 𝑝,
entonces la variable 𝑋 = 𝑋𝑖 ~ B(n, p) 𝑛𝑖=1 . Aquí
tendremos dos casos a considerar:
i) Si n es suficientemente grande.
ii) Si n es pequeño.
Caso i)
Por TCL sabemos que
𝑝 =𝑋
𝑛 ~ 𝑁 𝑝,
𝑝 𝑞
𝑛
Hipótesis Nula:
𝑯𝟎 ∶ 𝒑 = 𝒑𝟎
Estadístico de Prueba:
𝒁 = 𝑝 − 𝒑𝟎
𝒑𝟎 𝒒𝟎 𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯𝟎
𝑯𝒂 𝑹𝑹𝜶 𝜷 𝒑′ 𝒑 < 𝒑𝟎
𝒛 ≤ −𝒛𝜶
𝟏 − 𝜱
−𝒛𝜶 𝒑𝟎 𝒒𝟎
𝒑′𝒒′+
( 𝒑𝟎 − 𝒑′)
𝒑′𝒒′𝒏
𝒑 > 𝒑𝟎
𝒛 ≥ 𝒛𝜶 𝜱
𝒛𝜶 𝒑𝟎 𝒒𝟎
𝒑′𝒒′+
( 𝒑𝟎 −𝒑′)
𝒑′𝒒′𝒏
𝒑 ≠ 𝒑𝟎
𝒛 ≥ 𝒛𝜶𝟐
𝜱
𝒛𝜶𝟐
𝒑𝟎 𝒒𝟎
𝒑′𝒒′+
( 𝒑𝟎 −𝒑′)
𝒑′𝒒′𝒏
−𝜱
−𝒛𝜶𝟐
𝒑𝟎 𝒒𝟎
𝒑′𝒒′+
( 𝒑𝟎 − 𝒑′)
𝒑′𝒒′𝒏
Si 𝑛 𝑝0 ≥ 10 y 𝑛 𝑞0 ≥ 10.
El tamaño de muestra necesario para que una prueba de
nivel aproximado 𝛼 sea tal que 𝜷 𝒑′ ≤ 𝜷𝟎 tomar
𝒏 ≥ 𝒛𝜷𝟎 𝒑′ 𝒒′+ 𝒛𝜶 𝒑𝟎 𝒒𝟎
( 𝒑𝟎−𝒑′)
𝟐
si la hipótesis es unilateral y
poner 𝑧𝛼
2 en lugar de 𝑧𝛼 si la hipótesis es bilateral.
Problema 8.35.
ii) Si n es pequeño la prueba estadística estará basada
en
Hipótesis Nula:
𝑯𝟎 ∶ 𝒑 = 𝒑𝟎
Estadístico de Prueba:
𝑿 = 𝑿𝒊 ~ 𝐁(𝐧, 𝒑𝟎) 𝒏𝒊=𝟏 bajo 𝑯𝟎
Problema 8.9
p-valor para una prueba de Hipótesis
Definición:
Se llama p-valor o nivel de significancia alcanzado al
mínimo nivel de significancia a partir del cual rechazaría la
hipótesis nula para un conjunto dado.
Una vez calculado el p-valor la conclusión a un nivel de
significancia 𝛼 será
Si p − valor ≤ α entonces rechazar 𝐻0 a un nivel 𝛼
Si p − valor > α entonces diremos que no hay evidencia
suficiente para rechazar 𝐻0 a un nivel 𝛼 .
¿Cómo calcular el p-valor?
Distribución del Estadístico de
Prueba
Hipótesis alternativa
p-valor
Z
Cola superior Cola inferior Bilateral
𝟏 − 𝜱(𝒛𝒐𝒃𝒔) 𝜱(𝒛𝒐𝒃𝒔) 𝟐 𝟏 − 𝜱( 𝒛𝒐𝒃𝒔 )
T
Cola superior Cola inferior Bilateral
P( T > 𝒕𝒐𝒃𝒔) P( T < 𝒕𝒐𝒃𝒔) 2 P( T > 𝒕𝒐𝒃𝒔 )