Upload
others
View
3
Download
1
Embed Size (px)
Citation preview
15/12/2011
1
Contraste de hipótesis
Análisis de datos y gestión veterinariaAnálisis de datos y gestión veterinaria
Departamento de Producción Animal – Facultad de Veterinaria
Universidad de Córdoba
Córdoba, 14 de Diciembre de 2011
Conceptos del contraste de hipótesis
N = ???? = millones de votantes
estadísticos
n = 10.000votantes
estimadores ointervalos de confianza
Inferencias.Generalizaciones apartir de la muestra ala población.
15/12/2011
2
Conceptos del contraste de hipótesis
N = ???? = millones de votantes
Hipótesis o conjetura
n = 10.000votantes
Verificación de la validez de la
hipótesis
Contraste de hipótesis.Verificación de la validez de unahipótesis planteada sobre unapoblación a partir de lainformación muestral.
Conceptos del contraste de hipótesis
Un veterinario quiere saber si la esperanza de vida de losgatos es la misma que la de las gatas.
15/12/2011
3
Conceptos del contraste de hipótesis
Un veterinario quiere saber si la esperanza devida de los gatos es la misma que la de lasgatas.
Una clínica veterinaria recibe un envío dematerial clínico. Sólo aceptará el envío si nohay más de un 1% de materialesdefectuosos.
Conceptos del contraste de hipótesis
Un veterinario quiere saber si la esperanza devida de los gatos es la misma que la de lasgatas.
Una clínica veterinaria recibe un envío dematerial clínico. Sólo aceptará el envío si nohay más de un 1% de materialesdefectuosos.
Una fábrica de piensos afirma que producesacos de 50 kg.
15/12/2011
4
Conceptos del contraste de hipótesis
Una fábrica depiensos afirma queproduce sacos de 50kg.
Hipótesis nula: se formula la conjetura sobre elparámetro y se acepta siempre que no se produzcasuficiente evidencia en contra.
0 0:H θ θ=
Ho: los sacos de pienso pesan 50 kg
Conceptos del contraste de hipótesis
Una fábrica depiensos afirma queproduce sacos de 50kg.
Hipótesis alternativa: se contrasta la validez de lahipótesis nula frente a su alternativa con informaciónmuestral. Se considera cierta si la nula resulta falsa.
1 0:H θ θ≠
H1: los sacos de pienso no pesan 50 kg
15/12/2011
5
Conceptos del contraste de hipótesis
Hipótesis nula
simple0 0:H θ θ=
compuesta0 0:H θ θ≤
Hipótesis alternativa
unilateral1 0:H θ θ≤
bilateral1 0:H θ θ≠
Conceptos del contraste de hipótesis
Una fábrica depiensos afirma queproduce sacos de 50kg.
n = 100sacos
Se rechaza
1 0:H θ θ≠ Regla de decisión
Se acepta
0 0:H θ θ=
15/12/2011
6
Se rechaza
Conceptos del contraste de hipótesis
1 0:H θ θ≠Regla de decisión Se acepta
0 0:H θ θ=
Si Ho es cierta y la regla la rechaza, se comete el
error Tipo I
Si Ho es falsa y la regla no la rechaza, se comete el
error Tipo II
α es la probabilidad derechazar Ho siendo cierta
β es la probabilidad deaceptar Ho siendo falsa
1-α es la probabilidad deaceptar Ho siendo cierta
1-β es la probabilidad derechazar Ho siendo falsa
Regla de decisiónRealidad
Conceptos del contraste de hipótesis
aceptar
rechazar
Ho cierta Ho falsa
Decisión correctap = 1 – α
Error Tipo Ip = α
Error Tipo IIp = β
Decisión correctap = 1 – β
α = nivel de significación de la prueba1 – β = potencia de la prueba
15/12/2011
7
Regla de decisiónRealidad
Conceptos del contraste de hipótesis
aceptar
rechazar
Ho cierta Ho falsa
Decisión correctap = 1 – α
Error Tipo Ip = α
Error Tipo IIp = β
Decisión correctap = 1 – β
α = nivel de significación de la prueba1 – β = potencia de la prueba
Robustez. Habilidad delcontraste para no detectarerróneamente diferencias,cuando no realmente no lashay.
Potencia. Habilidad paraseñalar diferencias, cuandoefectivamente las hay.
Conceptos del contraste de hipótesis
Una fábrica depiensos afirma queproduce sacos de 50kg.
n = 100sacos
Se rechaza
1 0:H θ θ≠ Regla de decisión
Se acepta
0 0:H θ θ=
α = 0,05
15/12/2011
8
Contrastes para la media
¿n?
n>30 contrastebasadoen Z
no requiered. normal
n<30requiere
d. normal¿σ2 conocida?
no requiereconocer σ2
contraste basado en t
Contrastes para la media
contrastebasadoen Z
n<30requiere
d. normal¿σ2 conocida?
15/12/2011
9
Contrastes para la media de una distribución normal con varianza conocida
n = X1, X2, …, Xn
µ desconocidaσ2 conocida
0 0
1 0
:
:
H
H
µ µ
µ µ
=
>
/
XZ
n
µσ−
=
Si Ho es cierta…
0
/
XZ
n
µσ−
=
Si H1 es cierta…
0
/
XZ
n
µσ↑↑ −
=↑↑
Contrastes para la media de una distribución normal con varianza conocida
n = 16= 5,038 gµ = ¿5 g?σ2 = 0,0256
0 0
1
:
:
5
5
H
H
µ µ
µ
==
>
5,038 51,52
0,1/ 16Z
−= =
X
¿puedo considerar que 1,52 es muy grande para aceptar
Ho?
15/12/2011
10
Contrastes para la media de una distribución normal con varianza conocida
Z
fZ(z)
-5 -3 -1 1 3 5
0
0,1
0,2
0,3
0,4
n = 16= 5,038 gµ = ¿5 g?σ2 = 0,0256
0 0
1
:
:
5
5
H
H
µ µ
µ
==
>
5,038 51,52
0,1/ 16Z
−= =
X
Contrastes para la media de una distribución normal con varianza conocida
n = 16= 5,038 gµ = ¿5 g?σ2 = 0,0256
0 0
1
:
:
5
5
H
H
µ µ
µ
==
>
5,038 51,52
0,1/ 16Z
−= =
X
Depende del riesgo a asumir. Ho será rechazadacuando, siendo cierta, la probabilidad de que la mediamuestral tome el valor observado sea menor al 5%(α=0,05):
P(Z>zα)=α; α = 0,05; Z=1,645
¿puedo considerar que 1,52 es muy grande para aceptar
Ho?
15/12/2011
11
Contrastes para la media de una distribución normal con varianza conocida
Z
fZ(z)
-5 -3 -1 1 3 5
0
0,1
0,2
0,3
0,4
n = 16= 5,038 gµ = ¿5 g?σ2 = 0,0256
0 0
1
:
:
5
5
H
H
µ µ
µ
==
>
5,038 51,52
0,1/ 16Z
−= =
X
α
Contrastes para la media de una distribución normal con varianza conocida
n = 16= 5,038 gµ = ¿5 g?σ2 = 0,0256
0 0
1
:
:
5
5
H
H
µ µ
µ
==
>
5,038 51,52
0,1/ 16Z
−= =
X
Depende del riesgo a asumir. Si se quiere asumirun 5% de probabilidad de rechazo de Ho, si escierta (α=0,05):
P(Z>zα)=α; α = 0,05; Z=1,645
¿puedo considerar que 1,52 es muy grande para aceptar
Ho?
Dado que 1,52 < 1,645; no hay suficienteevidencia para rechazar Ho (con una probabilidadde rechazar Ho, si fuera cierta, del 5%).
15/12/2011
12
Contrastes para la media de una distribución normal con varianza conocida
n = 16= 5,038 gµ = ¿5 g?σ2 = 0,0256
0 0
1
:
:
5
5
H
H
µ µ
µ
==
>
5,038 51,52
0,1/ 16Z
−= =
X
Si α=0,10:
P(Z>zα)=α; α = 0,10; Z=1,28
¿puedo considerar que 1,52 es muy grande para aceptar
Ho?
Contrastes para la media de una distribución normal con varianza conocida
n = 16= 5,038 gµ = ¿5 g?σ2 = 0,0256
0 0
1
:
:
5
5
H
H
µ µ
µ
==
>
5,038 51,52
0,1/ 16Z
−= =
X
Si α=0,10):
P(Z>zα)=α; α = 0,10; Z=1,28
¿puedo considerar que 1,52 es muy grande para aceptar
Ho?
Dado que 1,52 > 1,28; hay suficiente evidenciapara rechazar Ho (con una probabilidad derechazar Ho, si fuera cierta, del 10%).
15/12/2011
13
Contrastes para la media de una distribución normal con varianza conocida
Z
fZ(z)
-5 -3 -1 1 3 5
0
0,1
0,2
0,3
0,4
0,1α =
0,05α =
Mientras menor sea el nivel de significación,mayor será la duda sobre su veracidad.
Contrastes para la media de una distribución normal con varianza conocida
n = X1, X2, …, Xn
µ desconocidaσ2 conocida
0 0
1 0
:
:
H
H
µ µ
µ µ
=
>
/
XZ
n
µσ−
=Rechazar Ho si:
siendo Z una variable aleatoria normalestándar
0
/
( )
XZ z
n
P Z z
α
α
µσ
α
−= >
> =
15/12/2011
14
Contrastes para la media de una distribución normal con varianza conocida
n = X1, X2, …, Xn
µ desconocidaσ2 conocida
0 0
1 0
:
:
H
H
µ µ
µ µ
=
<
/
XZ
n
µσ−
=Rechazar Ho si:
siendo Z una variable aleatoria normalestándar
0
/
( )
XZ z
n
P Z z
α
α
µσ
α
−= < −
> − =
Contrastes para la media de una distribución normal con varianza conocida
n = X1, X2, …, Xn
µ desconocidaσ2 conocida
0 0
1 0
:
:
H
H
µ µ
µ µ
=
≠
/
XZ
n
µσ−
=Rechazar Ho si:
siendo Z una variable aleatoria normalestándar
0 0/2 /2
/2 /2
o / /
( ) / 2 ( ) / 2
X XZ z Z z
n n
P Z z P Z z
α α
α α
µ µσ σ
α α
− −= < − = >
< − = > =
15/12/2011
15
Contrastes para la media de una distribución normal con varianza conocida
Valor crítico (p-value). Elmenor nivel de significaciónal cual puede rechazarse unahipótesis.
5,038 51,52
0,1/ 16Z
−= =
1,52; 0,0643zα α= =
Si Ho fuera cierta, la probabilidad de encontrar un valor igual o superior a 1,52
es del 6,43%
La hipótesis nula puede ser rechazada para todos los niveles de significación mayores que 6,43%
Contrastes para la media de una distribución normal con varianza conocida
Cuando una máquina de ordeño funciona bien, la presión es de 2 atmcon d.t. 0,06 atm. Periódicamente se comprueba que funciona bien enuna muestra aleatoria de 9 vacas. El último control reportó una mediade 1,95 atm. Contraste que la media poblacional sigue siendo de2 atm con un nivel de significación del 5% y halle el p-valor.
Rechazar si:0 0
1
: 2
: 2
H
H
µ µ
µ
= =
≠0 0
/2 /2 o / /
X XZ z Z z
n nα α
µ µσ σ− −
= < − = >
/2 0,025
/2 0,025
1,95 22,50
0,06 / 9
1,96
1,96
Z
z z
z z
α
α
−= = −
= =
− = − = −
15/12/2011
16
Contrastes para la media
contrastebasadoen Z
n<30requiere
d. normal¿σ2 conocida?
Contrastes para la media
¿n?
n>30 contrastebasadoen Z
no requiered. normal
n<30requiere
d. normal¿σ2 conocida?
no requiereconocer σ2
15/12/2011
17
Contrastes para la media si n>30
Los mismos planteamientosdesarrollados anteriormenteson válidos.
Teorema central del límite
Si no se conoce σ2, se usa s2
Contrastes para la media
¿n?
n>30 contrastebasadoen Z
no requiered. normal
n<30requiere
d. normal¿σ2 conocida?
no requiereconocer σ2
contraste basado en t
15/12/2011
18
Contrastes para la media de una distribución normal: varianza poblacional desconocida
n = X1, X2, …, Xn
µ desconocidaσ2 desconocida
0 0
1 0
:
:
H
H
µ µ
µ µ
=
>
Rechazar Ho si:
Donde tn-1 sigue una distribución t deStudent con n-1 grados de libertad
01,
1 1,
/
( )
n
x
n n
Xt
S n
P t t
α
α
µ
α
−
− −
−>
> =
Rechazar Ho si:
Donde tn-1 sigue una distribución t deStudent con n-1 grados de libertad
Contrastes para la media de una distribución normal: varianza poblacional desconocida
n = X1, X2, …, Xn
µ desconocidaσ2 desconocida
0 0
1 0
:
:
H
H
µ µ
µ µ
=
<
01,
1 1,
/
( )
n
x
n n
Xt
S n
P t t
α
α
µ
α
−
− −
−< −
< − =
15/12/2011
19
Rechazar Ho si:
Donde tn-1 sigue una distribución t de Student conn-1 grados de libertad
Contrastes para la media de una distribución normal: varianza poblacional desconocida
n = X1, X2, …, Xn
µ desconocidaσ2 desconocida
0 0
1 0
:
:
H
H
µ µ
µ µ
=
≠
0 01, /2 1, /2
1 1, /2 1 1, /2
o / /
( ) / 2 ( ) / 2
n n
x x
n n n n
X Xt t
S n S n
P t t P t t
α α
α α
µ µ
α α
− −
− − − −
− −< − >
< − = > =
Se basa en que la variable aleatoria:
sigue una distribución chi-cuadrado con (n–1) grados delibertad.
Contrastes para la varianza de una distribución normal
Se apoya de modo crucial en la distribución normal
( ) 2
2
1 2
1 x
n
n sχ
σ−
−=
15/12/2011
20
Si Ho es cierta, la variable aleatoria:
sigue una distribución normal con (n–1) grados de libertad
Contrastes para la varianza de una distribución normal
n = X1, X2, …, Xn
µ desconocidaσ2 desconocida
2 2
0 0:H σ σ=
( )
( ) ( )
2
2
1 2
0
2 2 2 2
1 1, 1 1,
1
x
n
n n n n
n s
P Pα α
χσ
χ χ α χ χ α
−
− − − − −
−=
> = < =
Contrastes para la varianza de una distribución normal
Intervalo de confianza del
( ) ( )
2 22
2 2
1, /2 1,1 /2
2 2 2 2
1 1, /2 1 1,1 /2
( 1) ( 1)
2 2
x x
n n
n n n n
n s n s
P P
α α
α α
σχ χ
α αχ χ χ χ
− − −
− − − − −
− −< <
> = < =
100(1 )%α−
chi-cuadrado
f(chi-cuadrado)
0 10 20 30 40
0
0,02
0,04
0,06
0,08
0,1
1 α− 2
α
2
α
2
,1 /2v αχ −2
, /2v αχ
15/12/2011
21
Rechazar Ho si:
Donde la variable aleatoria chi-cuadrado sigue unadistribución chi-cuadrado con (n-1) grados de libertad
Contrastes para la varianza de una distribución normal
n = X1, X2, …, Xn
µ desconocidaσ2 desconocida
2 2
0 0
2 2
1 0
:
:
H
H
σ σ
σ σ
=
≠
( ) ( )2 2
2 2
1,1 /2 1, /22 2
0 0
2 2 2 2
1 1,1 /2 1 1,1 /2
1 1 o
( ) / 2 ( ) / 2
x x
n n
n n n n
n s n s
P P
α α
α α
χ χσ σ
χ χ α χ χ α
− − −
− − − − − −
− −< >
< = > =
Rechazar Ho si:
Donde la variable aleatoria Z sigue una distribución normalestándar
Contrastes para la proporción poblacional
0 0
1 0
:
:
H p p
H p p
=
≠
( ) ( )0 0
/2 /2
0 0 0 0
/2 /2
ˆ ˆ o
1 / 1 /
( ) / 2 ( ) / 2
x xp p p pz z
p p n p p n
P Z z P Z z
α α
α αα α
− −> < −− −
> = < − =
15/12/2011
22
Contrastes para la proporción poblacional
De una muestra de 802 clientes de clínicas veterinarias, 378 fueroncapaces de recordar el precio del servicio un año después del mismo.Contrastar con un nivel de significación del 10% que al menosla mitad de los clientes de clínicas veterinarias son capaces derecordar el precio un año después del servicio.
Rechazar si:0 0
1
: 0,50
: 0,50
H p p
H p
≥ =
<
( )0
0 0
0,10
ˆ
1 /
1,28
xp pz
p p n
z z
α
α
−< −
−
= =0,471 0,50
1,640,50·0,50 / 802
−= −
Contrastes para la diferencia entre dos medias
Se estudia la diferencia de medias antes ydespués del tratamiento en los mismossujetos que constituyen una muestra,extraída aleatoriamente de la poblaciónnormal.
Se estudia la diferencia de medias de dosmuestras independientes extraídasaleatoriamente de poblaciones normales.
Diferencia de medias con datos pareados
Diferencia de medias en muestras independientes
15/12/2011
23
Contrastes para la diferencia entre dos medias
Se estudia la diferencia de medias antes ydespués del tratamiento en los mismossujetos que constituyen una muestra,extraída aleatoriamente de la poblaciónnormal.
Diferencia de medias con datos pareados
Contrastes para la diferencia entre dos medias
Diferencia de medias con datos pareados
Rechazar Ho si:
donde la variable aleatoria tn-1 sigue una distribución t deStudent con (n–1) grados de libertad.
0 01, /2 1, /2
1 1, /2 1 1, /2
o / /
( ) / 2 ( ) / 2
n n
d d
n n n n
d D d Dt t
s n s n
P t t P t t
α α
α αα α
− −
− − − −
− −< − >
< − = > =
0 0
1 0
:
:
x y
x y
H D
H D
µ µ
µ µ
− =
− ≠
15/12/2011
24
Contrastes para la diferencia entre dos medias
Se estudia la diferencia de medias antes ydespués del tratamiento en los mismossujetos que constituyen una muestra,extraída aleatoriamente de la poblaciónnormal.
Se estudia la diferencia de medias de dosmuestras independientes extraídasaleatoriamente de poblaciones normales.
Diferencia de medias con datos pareados
Diferencia de medias en muestras independientes
Contrastes para la diferencia entre dos medias
Se estudia la diferencia de medias de dosmuestras independientes extraídasaleatoriamente de poblaciones normales.
Diferencia de medias en muestras independientes
varianza conocidao
tamaño muestral grande
varianzas poblacionales son iguales
15/12/2011
25
Contrastes para la diferencia entre dos medias
Se estudia la diferencia de medias de dosmuestras independientes extraídasaleatoriamente de poblaciones normales.
Diferencia de medias en muestras independientes
varianza conocidao
tamaño muestral grande
30 observaciones en cadamuestra son, en general,suficientes
si la varianza poblacional nose conoce, se utiliza lavarianza muestral
Contrastes para la diferencia entre dos medias
Diferencia de medias en muestras independientes convarianza conocida o tamaño muestral grande
Rechazar Ho si:
donde la variable aleatoria Z sigue una distribución normalestándar.
0 0/2 /2
2 22 2
/2 /2
o
( ) / 2 ( ) / 2
y yx x
x y x y
x y D x y Dz z
n n n n
P Z z P Z z
α α
α α
σ σσ σ
α α
− − − −< − >
+ +
< − = > =
0 0 1 0: :x y x yH D H Dµ µ µ µ− = − ≠
15/12/2011
26
Contrastes para la diferencia entre dos medias
Se estudia la diferencia de medias de dosmuestras independientes extraídasaleatoriamente de poblaciones normales.
Diferencia de medias en muestras independientes
varianza conocidao
tamaño muestral grande
varianzas poblacionales son iguales
A continuación, estimar la varianza común.
Contrastes para la diferencia entre dos medias
Diferencia de medias en muestras independientes convarianzas poblacionales iguales
En primer lugar, contrastar la igualdad de varianzas.
( ) ( )2 2
21 1
2
x x y y
x y
n s n ss
n n
− + −=
+ −
Finalmente, contrastar la diferencia de medias.
15/12/2011
27
Contrastes para la diferencia entre dos medias
Diferencia de medias en muestras independientes convarianzas poblacionales iguales
Rechazar Ho si:
donde la variable aleatoria tnx+ny-2 sigue una distribución t deStudent con (nx+ny-2) grados de libertad.
0 02, /2 2, /2
2 2, /2 2 2, /2
o
( ) / 2 ( ) / 2
x y x y
x y x y x y x y
n n n n
x y x y
x y x y
n n n n n n n n
x y D x y Dt t
n n n ns s
n n n n
P t t P t t
α α
α αα α
+ − + −
+ − + − + − + −
− − − −< − >
+ +
< − = > =
0 0 1 0: :x y x yH D H Dµ µ µ µ− = − ≠
Contrastes para la diferencia entre dos medias
Una muestra aleatoria de 4 perros tratados con un fármaco tuvo unamedia de 78,0 + 24,4 latidos cardíacos por minuto, mientras que otramuestra independiente de 4 perros sin tratar, tuvo una media de 63,5 +20,2 latidos. Asumiendo igualdad de varianzas, contrastar con el10% de significación que ambas medias son iguales frente a laalternativa que la media es mayor en el grupo con tratamiento.
0
1
: 0
: 0
x y
x y
H
H
µ µ
µ µ
− =
− >
( ) ( )2 2 2 21 1 3·24,4 3·20,222,4
2 4 4 2
x x y y
x y
n s n ss
n n
− + − += = =
+ − + −
15/12/2011
28
Contrastes para la diferencia entre dos medias
Una muestra aleatoria de 4 perros tratados con un fármaco tuvo unamedia de 78,0 + 24,4 latidos cardíacos por minuto, mientras que otramuestra independiente de 4 perros sin tratar, tuvo una media de 63,5 +20,2 latidos. Asumiendo igualdad de varianzas, contrastar con el10% de significación que ambas medias son iguales frente a laalternativa que la media es mayor en el grupo con tratamiento.
0
1
: 0
: 0
x y
x y
H
H
µ µ
µ µ
− =
− >
02,
78 63,5 0,915
822,4
16
x yn n
x y
x y
x y Dt
n ns
n n
α+ −
− − −> =
+
2,0,10 6,0,10 1,440x yn nt t+ − = =
Contrastes para la diferencia entre dos proporciones
40 observaciones en cada muestra son, en general, suficientes
Rechazar Ho si:
Donde la variable aleatoria Z sigue una distribución normalestándar
0 1: :x y x yH p p H p p= ≠
( ) ( )/2 /2
0 0 0 0
/2 /2
ˆ ˆ ˆ ˆ o
ˆ ˆ ˆ ˆ1 1
( ) / 2 ( ) / 2
x y x y
x y x y
x y x y
p p p pz z
n n n np p p p
n n n n
P Z z P Z z
α α
α αα α
− −< − >
+ +− −
< − = > =
15/12/2011
29
Contrastes para la igualdad de varianzas
Se toman dos muestras aleatorias e independientes: nx, ny
De dos poblaciones normales con varianzas: σ2x, σ2
y
Con varianzas muestrales: s2x, s2
y
F
f(F)
0 1 2 3 4 5
0
0,2
0,4
0,6
0,8
F con (nx-1) g.L. en elnumerador y (ny-1)g.L. en el denominador
2 2
2 2
/
/
x x
y y
sF
s
σσ
=
Contrastes para la igualdad de varianzas
Rechazar Ho si:
Donde la variable aleatoria F sigue una distribución F con (nx–1) g.L. en el numerador y (ny–1) g.L. en el denominador
2 2 2 2
0 1: :x y x yH Hσ σ σ σ= ≠
( )
2
1, 1,2
1, 1 1, 1,
x y
x y x y
xn n
y
n n n n
sF
s
P F F
α
α α
− −
− − − −
>
> =
15/12/2011
30
Contrastes no paramétricos
contrastes basados en el supuesto de normalidad (también válidos si se aplican en muestras grandes aunque la población no
sea normal)
¿Cómo contrastamos dos medias si la distribución de la
población difiere considerablemente de la normal, o n es pequeño?
Contrastes no paramétricos
- No requieren d. normal en las poblaciones.- Es poco sensible a valores extremos.- Requieren muestras independientes.- Requieren distribuciones poblacionales similares.- Si la población es normal, son menos poderosos que losparamétricos.
Contrastes no paramétricos
Contraste de signos
¿Cómo contrastamos dos medias si la distribución de la
población difiere considerablemente de la normal, o n es pequeño?
Contrastes no paramétricos
- No requieren d. normal en las poblaciones.- Es poco sensible a valores extremos.- Requieren muestras independientes.- Requieren distribuciones poblacionales similares.- Si la población es normal, son menos poderosos que losparamétricos.
Contraste de Wilcoxon
Contraste de Mann-Whitney
15/12/2011
31
Contrastes no paramétricos
Contraste de signos
A
B
8 personas elegidas aleatoriamente van a catar
ambos platos y a puntuarlos de 1 a 10
Contrastes no paramétricos
Contraste de signos
A B
Individuo Diferencia Signo
Jamón A Jamón B
María 6 8 -2 -
Pedro 4 9 -5 -
Alejandro 5 4 1 +
Sonia 8 7 1 +
Ana 3 9 -6 -
Raquel 6 9 -3 -
Andrés 7 7 0 0
José 5 9 -4 -
Valoración
Si se descartan los ceros, los signos pueden considerarse como una muestra aleatoria
de una población con distribución binomial.
Individuo Diferencia
Jamón A Jamón B
María 6 8 -2
Pedro 4 9 -5
Alejandro 5 4 1
Sonia 8 7 1
Ana 3 9 -6
Raquel 6 9 -3
Andrés 7 7 0
José 5 9 -4
ValoraciónIndividuo
Jamón A Jamón B
María 6 8
Pedro 4 9
Alejandro 5 4
Sonia 8 7
Ana 3 9
Raquel 6 9
Andrés 7 7
José 5 9
Valoración
Se usa como alternativa no paramétrica a la comparación de dos medias con datos pareados
15/12/2011
32
Contrastes no paramétricos
Contraste de signos
A B
Individuo Diferencia Signo
Jamón A Jamón B
María 6 8 -2 -
Pedro 4 9 -5 -
Alejandro 5 4 1 +
Sonia 8 7 1 +
Ana 3 9 -6 -
Raquel 6 9 -3 -
Andrés 7 7 0 0
José 5 9 -4 -
ValoraciónIndividuo
Jamón A Jamón B
María 6 8
Pedro 4 9
Alejandro 5 4
Sonia 8 7
Ana 3 9
Raquel 6 9
Andrés 7 7
José 5 9
ValoraciónIndividuo Diferencia
Jamón A Jamón B
María 6 8 -2
Pedro 4 9 -5
Alejandro 5 4 1
Sonia 8 7 1
Ana 3 9 -6
Raquel 6 9 -3
Andrés 7 7 0
José 5 9 -4
Valoración
0 : 0,5H p+ =
ˆ 0,28p+ =La regla de decisión se basaen la probabilidad de que, si Hofuese cierta, que probabilidadhabría de tener un resultadomuestral como el obtenido
Contrastes no paramétricos
Contraste de signos
A B
0 : 0,5H p+ =
1 : 0,5H p+ ≠
x
f(x)
0 2 4 6 8
0
0,05
0,1
0,15
0,2
0,25
0,3
/ 2α / 2α1 α−
ˆ 0,28p+ =
15/12/2011
33
0 : 0,5H p+ =
1 : 0,5H p+ ≠
ˆ 0,28p+ =
Contrastes no paramétricos
Contraste de signos
A B
x
f(x)
0 2 4 6 8
0
0,05
0,1
0,15
0,2
0,25
0,3
/ 2α / 2α1 α−
(0) (1) (2) (5) (6) (7) 0,4532P P P P P P+ + + + + =
0 : 0,5H p+ =
1 : 0,5H p+ ≠
ˆ 0,28p+ =
Contrastes no paramétricos
Contraste de signos
A B
x
f(x)
0 2 4 6 8
0
0,05
0,1
0,15
0,2
0,25
0,3
/ 2α / 2α1 α−
(0) (1) (6) (7) 0,1250P P P P+ + + =
15/12/2011
34
Contrastes no paramétricos
Contraste de signos
x
f(x)
0 20 40 60 80 100
0
0,02
0,04
0,06
0,08
Si n>20, el contraste de signosse basa en la aproximaciónbinomial de la normalA B
Contrastes no paramétricos
Contraste de signos
Rechazar Ho si:
Donde la variable aleatoria Z sigue una distribución normalestándar
/2 /2
ˆ ˆ0,5 0,5 o
0,5·0,5 / 0,5·0,5 /
x xp p
z zn n
α α
− −< − >
0 : 0,5H p =
1 : 0,5H p ≠
15/12/2011
35
Contrastes no paramétricos
Contraste de signos
Se usa como alternativa no paramétrica al contraste demedias con datos pareados.
Sólo indica diferencias, no informa de la magnitud dela diferencia.
n>20
Contrastes no paramétricos
Contraste de Wilcoxon
A
B
8 personas elegidas aleatoriamente van a catar
ambos platos y a puntuarlos de 1 a 10
15/12/2011
36
Contrastes no paramétricos
A B
Individuo Diferencia Signo
Jamón A Jamón B
María 6 8 -2 -
Pedro 4 9 -5 -
Alejandro 5 4 1 +
Sonia 8 7 1 +
Ana 3 9 -6 -
Raquel 6 9 -3 -
Andrés 7 7 0 0
José 5 9 -4 -
Valoración Rango(+) Rango(-)
3
6
1,5
1,5
7
4
5
3 25 Suma
Contraste de Wilcoxon
Contraste de Wilcoxon
Contrastes no paramétricos
A B
Rango(+) Rango(-)
3
6
1,5
1,5
7
4
5
3 25 Suma
observación
rango
Si no hay diferencias, la distribución de losrangos estará centrada en 0.
15/12/2011
37
Contraste de Wilcoxon
Contrastes no paramétricos
A B
Rango(+) Rango(-)
3
6
1,5
1,5
7
4
5
3 25 Suma
observación
rango
Si no hay diferencias, la sumade rango(+) debe seraproximadamente la mismaque la suma de rango (-), quepara n=7, sería entorno a 14.
Si Ho (no hay diferencias) es cierta, ¿qué probabilidad
habría de obtener un resultado muestral como el
obtenido?
Contraste de Wilcoxon
Contrastes no paramétricos
A B
Rango(+) Rango(-)
3
6
1,5
1,5
7
4
5
3 25 Suma
La más pequeña de las sumasde rangos es el estadístico T.
En este caso, T=3; que para n=7, α = 0,025
15/12/2011
38
Contraste de Wilcoxon
Contrastes no paramétricos
A B
Si n>20, la distribución normales una buena aproximación alestadístico T
( )
( )2
1( )
4
1 (2 1)( )
24
T
T
T
T
n nE T
n n nVar T
TZ
µ
σ
µσ
+= =
+ += =
−=
Rechazar Ho si:
Donde la variable aleatoria Z sigue una distribución normalestándar
Contraste de Wilcoxon
Contrastes no paramétricos
A B
Si n>20, la distribución normales una buena aproximación alestadístico T
/2T
T
Tzα
µσ−
< −
15/12/2011
39
Contraste de Wilcoxon
Contrastes no paramétricos
Se usa como alternativa no paramétrica al contraste demedias con datos pareados.
Además de los signos utiliza la magnitud, por lo que Ho serárechazada con un nivel de significación menor que utilizandoel contraste de signos.
Contrastes no paramétricos
Se compara el rendimiento quesero de 31 cabras con dos alimentosdiferentes, ensilado de maíz frente a heno de alfalfa. Se calcularon losrangos y el más pequeño correspondió al heno de alfalfa (189).Contrastar la hipótesis se que ambos alimentos producen elmismo rendimiento quesero.
0
1
: 0
: 0
x y
x y
H
H
µ µ
µ µ
− =
− ≠
( )
( )2
1 31·32248
4 4
1 (2 1) 31·32·632604
24 24
189 2481,16
51,03
T
T
T
T
n n
n n n
TZ
µ
σ
µσ
+= = =
+ += = =
− −= = = −
/2 /21 1 1 0,4385 0,56152
z zα α
α− = − = − = − =
15/12/2011
40
Contraste de Mann-Whitney
Contrastes no paramétricos
Se usa como alternativa no paramétrica al contraste demedias con muestras aleatorias independientes.
nx
análisis de datos = 10 alumnos
¿son diferentes las horas semanales de estudio de Análisis de Datos y de
Embriología?
ny
embriología = 12 alumnos
Contraste de Mann-Whitney
Contrastes no paramétricos
Análisis de datos Embriología rango análisis datos rango embriología
10 13 10 17,5
6 17 2 22
8 14 4,5 19
1 12 10 15,5
12 10 15,5 10
13 9 17,5 7
11 15 13 20
9 16 7 21
5 11 1 13
11 8 13 4,5
9 7
7 3
93,5 159,5 Suma de rangos
Análisis de datos Embriología
10 13
6 17
8 14
1 12
12 10
13 9
11 15
9 16
5 11
11 8
9
7
Se desarrolla de modo similar alcontraste de Wilcoxon
15/12/2011
41
Contraste de Mann-Whitney
Contrastes no paramétricos
Análisis de datos Embriología rango análisis datos rango embriología
10 13 10 17,5
6 17 2 22
8 14 4,5 19
1 12 10 15,5
12 10 15,5 10
13 9 17,5 7
11 15 13 20
9 16 7 21
5 11 1 13
11 8 13 4,5
9 7
7 3
93,5 159,5 Suma de rangos
( )
( )2
1
2
( )2
1( )
12
x x
x y x
x y
U
x y x y
U
U
U
n nU n n R
n nE U
n n n nVar U
UZ
µ
σ
µσ
+= + −
= =
+ += =
−=
nx>10 y ny>10
Contraste de Mann-Whitney
Contrastes no paramétricos
Rechazar Ho si:
Donde la variable aleatoria Z sigue una distribución normalestándar
/2 /2 o U U
U U
U Uz zα α
µ µσ σ− −
< − >
15/12/2011
42
Contraste de Mann-Whitney
Contrastes no paramétricos
Análisis de datos Embriología rango análisis datos rango embriología
10 13 10 17,5
6 17 2 22
8 14 4,5 19
1 12 10 15,5
12 10 15,5 10
13 9 17,5 7
11 15 13 20
9 16 7 21
5 11 1 13
11 8 13 4,5
9 7
7 3
93,5 159,5 Suma de rangos
Análisis de datos Embriología
10 13
6 17
8 14
1 12
12 10
13 9
11 15
9 16
5 11
11 8
9
7
( )
( )2
1 10·1110·12 93,5 81,5
2 2
10·12( ) 60
2 2
1 10·12·23( ) 230
12 12
81,5 601,42
230
x x
x y x
x y
U
x y x y
U
U
U
n nU n n R
n nE U
n n n nVar U
U
µ
σ
µσ
+= + − = + − =
= = = =
+ += = = =
− −= =
/2 1,42 0,0778 0,15562
zαα
α= = =