27
Cap´ ıtulo 7 Contrastes de hip´otesis 7.1. Introducci´on ................................... 1 7.1.1. Contraste de media de normal, con varianza conocida . . 2 7.1.2. Contraste de proporci´on ......................... 6 7.2. Contrastes bilaterales ............................ 7 7.2.1. Tests bilaterales m´as usuales ...................... 7 7.3. Contrastes unilaterales ........................... 9 7.3.1. Dise˜ no de tests unilaterales. Elecci´on de hip´otesis nula.. 10 7.3.2. Tests unilaterales m´as usuales ..................... 11 7.4. Test generales, funci´ on de potencia ................. 12 7.5. Tests de raz´ on de verosimilitudes .................. 18 7.6. Tests uniformemente m´ as potentes ................. 26 7.6.1. Lema de Neyman–Pearson ........................ 26 7.1. Introducci´on Continuamos en este cap´ ıtulo dentro del marco general de los dos anteriores: una cierta variable X tiene funci´ on de masa/densidad f (x; θ), donde θ es un par´ ametro desconocido. El objetivo de la tecnolog´ ıa de inferencia (param´ etrica) consiste en obtener informaci´ on sobre θ a partir de una muestra emp´ ırica (x 1 ,...,x n ). En el cap´ ıtulo 5 analizamos estimadores delpar´ametro θ (m´ etodos de construc- ci´ on y propiedades). Con un estimador T , la muestra emp´ ırica da lugar a una esti- maci´on ˆ θ = T (x 1 ,...,x n ) del par´ ametro θ. En el cap´ ıtulo 6 nos ocupamos de establecer intervalos de confianza I para el par´ametro θ, de manera que, con alta confianza, el verdadero (y desconocido) valor de θ est´ e en el intervalo I (que depende de la muestra). En este cap´ ıtulo cambiaremos el punto de vista, y desarrollaremos una tecno- log´ ıa para contrastarhip´otesis sobre el par´ametro, como que valga 3, que sea mayor 1

Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

Capıtulo 7

Contrastes de hipotesis

7.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

7.1.1. Contraste de media de normal, con varianza conocida . . 2

7.1.2. Contraste de proporcion . . . . . . . . . . . . . . . . . . . . . . . . . 6

7.2. Contrastes bilaterales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

7.2.1. Tests bilaterales mas usuales . . . . . . . . . . . . . . . . . . . . . . 7

7.3. Contrastes unilaterales . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

7.3.1. Diseno de tests unilaterales. Eleccion de hipotesis nula . . 10

7.3.2. Tests unilaterales mas usuales . . . . . . . . . . . . . . . . . . . . . 11

7.4. Test generales, funcion de potencia . . . . . . . . . . . . . . . . . 12

7.5. Tests de razon de verosimilitudes . . . . . . . . . . . . . . . . . . 18

7.6. Tests uniformemente mas potentes . . . . . . . . . . . . . . . . . 26

7.6.1. Lema de Neyman–Pearson . . . . . . . . . . . . . . . . . . . . . . . . 26

7.1. Introduccion

Continuamos en este capıtulo dentro del marco general de los dos anteriores: unacierta variable X tiene funcion de masa/densidad f(x; θ), donde θ es un parametrodesconocido. El objetivo de la tecnologıa de inferencia (parametrica) consiste enobtener informacion sobre θ a partir de una muestra empırica (x1, . . . , xn).

En el capıtulo 5 analizamos estimadores del parametro θ (metodos de construc-cion y propiedades). Con un estimador T , la muestra empırica da lugar a una esti-macion θ = T (x1, . . . , xn) del parametro θ.

En el capıtulo 6 nos ocupamos de establecer intervalos de confianza I para elparametro θ, de manera que, con alta confianza, el verdadero (y desconocido) valorde θ este en el intervalo I (que depende de la muestra).

En este capıtulo cambiaremos el punto de vista, y desarrollaremos una tecno-logıa para contrastar hipotesis sobre el parametro, como que valga 3, que sea mayor

1

Page 2: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

2 Capıtulo 7. Contrastes de hipotesis

que 5, etc. Avisamos al lector de que, aunque la cuestion de interes sea distinta, lametodologıa que disenaremos se va a apoyar en gran medida en los desarrollos quedieron lugar a los intervalos de confianza.

Digamos, por ejemplo, que tenemos una muestra (x1, . . . , xn), donde los xi sonceros o unos, que sabemos que ha sido obtenida lanzando repetidamente una mone-da. La hipotesis que queremos contrastar (que otra podıa ser) es que la moneda encuestion es regular. En terminos mas tecnicos, si X sigue una ber(1/2) o no. Obser-vamos la muestra, contamos ceros y unos, calculamos promedios y obtenemos queen la muestra aparece un 30% de unos. Esto, desde luego, parece ir en contra de lahipotesis; no es que sea imposible que una moneda regular produzca tal proporcionde caras, pero se nos antoja bastante improbable. ¿Cuanto?, ¿lo suficiente como paradescartar que la moneda sea regular?

Veamos. Si la muestra fuera de tamano 10 y se tuvieran tres caras y siete cruces,quizas la alarma fuera injustificada: no parece que haya suficiente evidencia comopara descartar, sin miramientos, la posibilidad de que la moneda sea 50%-50%. Sinembargo, si en 1000 lanzamientos obtenemos 300 caras, entonces sı, la intuicion (ysi no, nuestro sabio consejo) nos dice que es practicamente imposible que tal resul-tado provenga de una moneda regular, lo que nos inducirıa a rechazar la hipotesis:definitivamente, la moneda estaba cargada.

Ası que de lo que se trata es de disenar un cierto procedimiento, o test, cuyaexpresion explıcita dependera de la variable X, del estimador del parametro que seconsidere, y del tamano de la muestra, que racionalice el “mosqueo” que la muestraparece producir al respecto de la hipotesis; que cuantifique el peso que la evidenciaestadıstica (la muestra empırica) aporta en contra de la hipotesis de partida.

Note, lector, como en esta ilustracion estamos insistiendo siempre en la posibili-dad de rechazar la hipotesis.

7.1.1. Contraste de media de normal, con varianza conocida

Comenzamos, como para los intervalos de confianza, con el ejemplo basico de

contrastar la hipotesis de que la media (esperanza) μde una determinada cantidad X en una poblacion que sigue X ∼ N (μ, σ2)toma un determinado valor μ0

suponiendo que se conoce la varianza σ2.

Aprovecharemos este ejemplo concreto para ir introduciendo la terminologıa ynotacion generales.

A. Hipotesis nula. La hipotesis que queremos contrastar, que se conoce comohipotesis nula y se denota por H0, es en este caso que μ = μ0. Escribiremos

H0 : μ = μ0 .

Aquı, μ0 es un dato. La hipotesis H0 puede venir de estudios previos, de modeloteorico, de. . .

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 3: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.1. Introduccion 3

B. Test de hipotesis. Para contrastar esta hipotesis realizaremos un test, que sedice de hipotesis.

1) Tomamos un estadıstico para el test, que en este caso va a ser X.

2) Estudio previo. Si la hipotesis H0 fuera cierta, entonces la media muestral Xde una muestra de tamano n seguirıa una normal N (μ0, σ

2/n).

Si fijamos α pequeno (digamos α = 1%), entonces

X ∈ I(μ0, α) :=(μ0 − zα/2

σ√n, μ0 + zα/2

σ√n

)ocurrira con probabilidad de 1− α (digamos, probabilidad de 99%).

3) Aplicacion del test. Ahora obtenemos una muestra concreta de tamano n,pongamos (x1, . . . , xn).

Si ocurriera que x no se encuentra en elintervalo I(μ0, α), habrıa sucedido un eventoextremo, algo que solo ocurre con probabili-dad α (digamos 1 de cada 100). Si ası fuera,desconfiarıamos de la hipotesis H0. No es queno pueda ocurrir, pero es tan inusual que ocu-rra (si la hipotesis es cierta) que desconfiamos,ademas cuantificablemente.

• Ası que, si x /∈ I(μ0, α), rechazamos la hipotesis H0 y decimos que lo hacemoscon nivel de significacion α.

• Por el contrario, si hubiera ocurrido x ∈ I(μ0, α) no tendrıamos argumentos(evidencia estadıstica) para rechazar H0 y aceptamos H0.

Observaciones:

Si x esta significativamente alejado de μ0, consideramos que hay evidenciaestadıstica (suficiente) como para rechazar la hipotesis de que μ = μ0.

En general, un test de hipotesis rechaza la hipotesis H0 cuando sucede algoinusualmente extremo, que va muy en contra (probabilistamente hablando) dela hipotesis.

Los niveles de significacion usuales son α = 5%, 1%, 0.1%, etc. La significacionde 5% es un estandar de referencia en contrastes de hipotesis de estudioscientıficos.

C. Hipotesis alternativa. Cuando rechazamos H0, en la practica nos estamosquedando con la llamada hipotesis alternativa H1, que en este caso es

H1 : μ �= μ0 .

Cuando el test rechaza la hipotesis H0 (y acepta H1), lo hace con fundamento,pero cuando acepta H0 lo hace porque no queda mas remedio. Mas sobre esto, en elapartado F de esta misma seccion.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 4: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

4 Capıtulo 7. Contrastes de hipotesis

D. Region de rechazo. La region Rα = {X /∈ I(μ0, α)} es conocida como laregion de rechazo del test. Al complementario de Rα nos referiremos como laregion de aceptacion Aα del test.

Ejemplo 7.1.1. Contraste para la media de una normal de varianza σ2 = 4 parauna muestra de tamano 100.

Tenemos una normal N (μ, σ2), con σ2 = 4 (y por tanto σ = 2). La hipotesis nulaes H0 : μ = μ0, donde μ0 = 1. Siguiendo el analisis anterior, rechazamos la hipotesis

si x cumple que |x− μ0| > zα/2σ√n,

es decir, si x cae en la region de rechazo.

Supongamos que tenemos 100 muestras deX, y que la media muestral es x = 1.3.Por un lado,

|x− 1| = 0.3.

Por otro lado, si tomamos α = 1%, entonces

zα/2σ√n= 2.58

2

10= 0.52.

La conclusion es que no podemos rechazar la hipotesis nula y, por tanto, no quedamas remedio, aceptamos H0.

Si tomamos α = 5%, entonces

zα/2σ√n= 1.96

2

10= 0.39,

y de nuevo tendrıamos que aceptar H0.

Sin embargo, si hubieramos fijado α = 15%, entonces tendrıamos que

zα/2σ√n= 1.44

2

10= 0.29,

y en este caso sı que rechazarıamos H0 (con nivel de significacion del 15%). ♣

E. Nivel de significacion α y p-valor. Si, en el ejemplo numerico anterior,fijamos, digamos, α = 5%, solo rechazarıamos H0 cuando |x − 1| > 0.39, es decir,cuando la media muestral estuviera por encima de 1.39 o por debajo de 0.61. Sinembargo, si pusieramos α = 1%, entonces rechazarıamos solo en el caso en que|x − 1| > 0.52 (media muestral por encima de 1.52 o por debajo de 0.48). Ahora,para rechazar H0, se necesita que x se aparte de 1 mucho mas que en el caso anterior.

Es decir, cuanto mas pequeno es el valor de la significacion α, mas difıcil es queel test rechace la hipotesis H0, y cuanto mayor sea α, mas facil es que se rechace lahipotesis H0.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 5: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.1. Introduccion 5

O, dandole la vuelta, dada la muestra (y el consiguiente valor de x): si α es muygrande, entonces seguramente rechazaremos la hipotesis, y si α es muy pequeno, laaceptaremos. Nos gustarıa determinar el menor valor de la significacion α para elque rechazarıamos la hipotesis H0.

Dada la muestra (x1, x2, . . . , xn) de X, al valor de α, digamos α0, tal que H0 serechaza para α ≥ α0 y se acepta para α < α0, se le denomina p-valor. Es decir, elp-valor es el mas pequeno valor de α para el que la hipotesis se rechaza.

no rechaza rechaza p-valor

Un rechazo esta mas justificado cuanto mas pequeno sea el nivel de significacioncon que se hace. Ası que, si el p-valor es muy pequeno, entonces la muestra aportauna evidencia estadıstica muy contundente en contra de la hipotesis que se estacontrastando.

Ejemplo 7.1.2. Calculo explıcito del p-valor para el contraste de la media en unamuestra normal.

Seguimos con una normal de varianza σ2 conocida. La hipotesis nula se escribeH0 : μ = μ0. Tenemos nmuestras, y la media muestral es x. Rechazaremos H0 cuando

|x− μ0| > zα/2σ√n

=⇒ zα/2 <

√n

σ|x− μ0|.

Como zα/2 = Φ−1(1 − α/2), podemos “despejar” α y obtener una formula explıcitapara el p-valor α0:

α0 = 2(1− Φ

(√n

σ|x− μ0|

)).

Para la muestra del ejemplo 7.1.1, de tamano 100 y con media muestral x = 1.3,tendrıamos un p-valor

2(1− Φ

(102

0.3))

= 2(1− Φ(3/2)) = 13.36%,

que es (medianamente) alto. Esto significarıa que la evidencia estadıstica que lamuestra aporta en contra de la hipotesis no es muy alta.

Sin embargo, con muestras de tamano 100, si ocurriera que x = 1.5, entonces elp-valor serıa 1.24%, y el rechazo estarıa mas que justificado. ♣

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 6: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

6 Capıtulo 7. Contrastes de hipotesis

F. Errores y sus tipos. En un test de hipotesis, se pueden producir cuatro si-tuaciones, recogidas en la siguiente tabla:

Aceptamos H0 Rechazamos H0

H0 cierta OK error tipo 1H0 falsa error tipo 2 OK

Las dos situaciones en las que el test comete error se conocen tradicionalmente(y poco nemotecnicamente) como:

Error de tipo 1. Este es el error que se comete si se rechaza la hipotesis H0

cuando es cierta.

Error de tipo 2. Este es el error que se comete cuando se acepta (o no serechaza) H0 cuando es falsa.

En el test que estamos considerando, la probabilidad de cometer un error deltipo 1 es exactamente α. Como habitualmente tomamos α pequeno, el test estadisenado para que este tipo de error sea pequeno: la probabilidad de equivocarse alrechazar es muy pequena.

Tambien interesarıa controlar la probabilidad de que el error de tipo 2 fuerapequeno, pero el diseno del test anterior no contempla esta posibilidad.

Ejemplo 7.1.3. Inocentes a la carcel o culpables en libertad.

En un juicio se intenta dilucidar si un sospechoso es culpable o inocente de uncierto crimen. Nos preguntamos si la hipotesis que se debe plantear es H0 : “el sospe-choso es culpable”, o H0 : “el sospechoso es inocente”. Parece asunto intrascendente,pero no.

En el sistema judicial espanol (y en cualquiera razonable, con la presuncion deinocencia como guıa) se plantea como hipotesis H0 : “el sospechoso es inocente”, demanera que la evidencia aportada (las pruebas) han de ser muy contundentes pararechazar H0, y condenar al sospechoso. Con una tabla analoga a la anterior,

Se acepta H0 Se rechaza H0

H0 cierta Se absuelve a un inocente Se condena a un inocente

H0 falsa Se absuelve a un culpable Se condena a un culpable

Y se pretende que la probabilidad de cometer un error de tipo 1 (condenar a uninocente) sea muy pequena. Esto exige que el sistema sea muy garantista, que laspruebas de culpabilidad hayan de ser muy solidas. . . lo que conduce, claro, a que enocasiones algunos culpables queden libres (error de tipo 2). Como es bien sabido. ♣

7.1.2. Contraste de proporcion

Tratamos ahora otro caso de interes, en el que se desea contrastar la hipotesis deque, en una determinada poblacion, la proporcion de individuos con una determinadacaracterıstica (votantes por un partido, seguidores de un equipo, etc.) es p0.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 7: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.2. Contrastes bilaterales 7

Es decir, tenemos una variable X ∼ Ber(p) y queremos contrastar la hipotesis

H0 : p = p0 ,

contra la hipotesis alternativaH1 : p �= p0 .

Si H0 fuera cierta, es decir, si p0 fuera el verdadero valor de p, en una muestraaleatoria (X1,X2, . . . ,Xn) de tamano n (grande) se habrıa de cumplir, con probabi-lidad 1− α, que

X ∈(p0 −

zα/2√n

√p0(1− p0), p0 +

zα/2√n

√p0(1− p0)

)

El test de hipotesis consiste entonces en rechazar H0 cuando en la muestra rea-lizada (x1, . . . , xn) se tiene que

x /∈(p0 −

zα/2√n

√p0(1− p0), p0 +

zα/2√n

√p0(1− p0)

)

La region de rechazo es la union de dos intervalos semiinfinitos:

Rα =(−∞, p0 −

zα/2√n

√p0(1− p0)

)⋃(p0 +

zα/2√n

√p0(1− p0) ,+∞

)

El estadıstico del test es X . Observese que, en este caso, x es la proporcion de lacaracterıstica en estudio en la muestra.

El test compara la proporcion observada x con la proporcion p0 esperada/su-puesta, y si son muy diferentes, rechaza la suposicion.

7.2. Contrastes bilaterales

En los llamados contrastes bilaterales, la hipotesis que se desea contrastar es queel parametro de interes tome un determinado valor. Es decir, la hipotesis nula H0 esH0 : θ = θ0 y la hipotesis alternativa es H1 : θ �= θ0.

Mas adelante se contrastan hipotesis nulas como H0 : θ ≤ θ0, conocidas comohipotesis unilaterales, que tienen algun ingrediente adicional.

7.2.1. Tests bilaterales mas usuales

Con el mismo argumento que en los dos ejemplos que hemos visto (que, de hecho,son contrastes bilaterales), se obtienen los siguiente test de hipotesis, todos con nivelde significacion α. Compare el lector con los intervalos de confianza analogos de laseccion 6.5.1.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 8: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

8 Capıtulo 7. Contrastes de hipotesis

Contrastes para una poblacion

Variable Hipotesis nula Estad. Region de rechazo

N (μ, σ2) H0 : μ = μ0 (σ conocida) X |x− μ0| > zα/2 σ/√n

N (μ, σ2) H0 : μ = μ0 (σ desc.) X |x− μ0| > t{n−1;α/2} s/√n

N (μ, σ2) H0 : σ2 = σ2

0 S2 (n−1)s2

σ20

/∈ (χ2{n−1;1−α/2}, χ2

{n−1;α/2})

ber(p) H0 : p = p0 X |x− p0| > zα/2√p0(1 − p0)/

√n

poiss(λ) H0 : λ = λ0 X |x− λ0| > zα/2√λ0/

√n

(Nota: el tamano n de la muestra ha de ser grande en el caso de la Bernoulli y la Poisson.)

Contrastes para dos poblaciones

Variables Hipotesis nula Region de rechazo

N (μ1, σ21),N (μ2, σ

22)

H0 : μ1 = μ2

(σ1, σ2 conocidas)|x1 − x2| > zα/2

√σ21

n1+

σ22

n2

N (μ1, σ21),N (μ2, σ

22)

H0 : μ1 = μ2

(σ1 = σ2 desconocidas)|x1 − x2| > t{n1+n2−2;α/2} sp

√1n1

+ 1n2

N (μ1, σ21),N (μ2, σ

22)

H0 : μ1 = μ2

(σ1 �= σ2 desconocidas)|x1 − x2| > t{f ;α/2}

√s21n1

+s22n2

N (μ1, σ21),N (μ2, σ

22) H0 : σ

21 = σ2

2

s21s22

/∈ (F{n1−1;n2−1;1−α/2}, F{n1−1;n2−1;α/2}

)ber(p1),ber(p2) H0 : p1 = p2 |x1 − x2| > zα/2

√p(1− p)

√1n1

+ 1n2

donde

n1 y n2 son los tamanos muestrales (que han de ser grandes para el contrastede medias de Bernoullis);

x1 y x2 son las medias muestrales;

s21 y s22 son las cuasivarianzas muestrales;

s2p =(n1 − 1)s21 + (n2 − 1)s22(n1 − 1) + (n2 − 1)

;

f es el entero mas proximo a(s21/n1 + s22/n2)

2

(s21/n1)2

n1−1 +(s22/n2)2

n2−1

;

p =n1x1 + n2x2

n1 + n2.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 9: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.3. Contrastes unilaterales 9

7.3. Contrastes unilaterales

Volvemos al ejemplo basico de una variable X ∼ N (μ, σ2), con σ2 conocida ydonde estamos contrastando una hipotesis sobre la esperanza μ.

En particular, planteamos ahora, co-mo hipotesis nula,

H0 : μ ≤ μ0 , para un cierto μ0.

La hipotesis alternativa es H1 : μ > μ0.El estadıstico es de nuevo X .

Si la hipotesis H0 es cierta, X sigueuna normal N (μ, σ2), con una media μcuyo valor es menor o igual que el μ0 dereferencia. Es decir, X es una N (μ, σ2/n), con μ ≤ μ0, y por tanto X sigue uno delos modelos representados en la figura.

Esto sugiere rechazar H0 cuando x sea mucho mayor que μ0. En concreto, y poranalogıa con el caso bilateral, la region Rα de rechazo sera

x > μ0 + zασ√n.

Ahora la significacion α se define como

α = supμ≤μ0

Pμ(Rα) = Pμ0(Rα),

y mide la maxima probabilidad de cometer error de tipo 1, que se alcanza justamenteen μ = μ0. Vease la nota 7.3.1 siguiente, y tambien la seccion 7.4.

El p-valor es, de nuevo, el valor α0 de la significacion α para el que, dada lamuestra concreta, se rechaza H0 si α ≥ α0 y no se rechaza para α ≤ α0.

� Nota 7.3.1. Detalle del significado de α en este test unilateral. Queremos medir la probabilidad decometer un error de tipo 1, es decir, de rechazar H0 cuando la hipotesis es cierta. Ahora, notese, H0

incluye un rango completo de valores de μ.

Si X tuviera una media μ0, entonces la probabilidad de cometer un error de tipo 1 serıa

Pμ0(Rα) = Pμ0(X > μ0 + zα σ/√n) = Pμ0

(X − μ0

σ/√n

> zα)= α.

Mientras que si X tuviera una media μ, con μ < μ0, entonces

Pμ(Rα) = Pμ(X > μ0 + zα σ/√n) = Pμ

(X − μ

σ/√n

> zα +μ0 − μ

σ/√n

)< α.

Notese el menor estricto.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 10: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

10 Capıtulo 7. Contrastes de hipotesis

7.3.1. Diseno de tests unilaterales. Eleccion de hipotesis nula

Seguimos analizando el caso en el que X ∼ N (μ, σ2), con σ2 conocida. Tenemoscomo valor de referencia un cierto μ0.

Mantenemos, ademas, la firme conviccion de que el verdadero μ es mayor queese μ0 de referencia. Como los test de contraste de hipotesis funcionan “bien” encaso de rechazo, lo natural es plantear en este caso la hipotesis H0 : μ ≤ μ0, con laesperanza de que, cuando tengamos la muestra, y por tanto el valor de x, podamosrechazar H0 con un nivel de significacion pequeno, y por tanto concluir, confiada yfinalmente, que μ es mayor que μ0.

Como situacion alternativa, digamos que ya disponemos de una muestra, y que elvalor de x es bastante mayor que μ0. Esto nos inclina a pensar que, plausiblemente,el μ verdadero sea mayor que μ0. De nuevo, el test natural que deberıamos planteartiene como hipotesis nula a H0 : μ ≤ μ0. Si x es significativamente mayor que μ0,es decir, si x cae en la region de rechazo para un α pequeno (o mejor, si el p-valor es pequeno), entonces rechazaremos H0 con garantıa, con confianza, es decir,confirmaremos confiadamente que μ > μ0.

� Nota 7.3.2. Bilateral vs unilateral. Supongamos que X ∼ N (μ, σ2). La hipotesis de referencia esμ = 0 (y σ es conocido). Pero no nos hemos decantado por aplicar un contraste bilateral o unilateral.

Tenemos en mente el estandar de significacion de 5%. Y disponemos de una muestra con media x,positiva y relativamente grande.

Si planteamos un test bilateral, rechazaremos la hipotesis H0 : μ = 0 si

x > zα/2σ√n

= 1.96σ√n.

Mientras que si planteamos un test unilateral, rechazaremos la hipotesis H0 : μ ≤ 0 si

x > zασ√n

= 1.64σ√n.

Como se aprecia, es mas facil rechazar en el unilateral y concluir que μ > 0, que rechazar en elbilateral y concluir que μ �= 0.

Digamos, por ejemplo, que σ = 2 y n = 100. Ası que 1.96σ/√n ≈ 0.392, mientras que

1.64σ/√n ≈ 0.328. Si la muestra nos diera x = 0.35, entonces no podrıamos rechazar la hipote-

sis μ = 0, pero sı la hipotesis μ ≤ 0.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 11: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.3. Contrastes unilaterales 11

7.3.2. Tests unilaterales mas usuales

Contrastes para una poblacion

Variable Hipotesis nula Estad. Region de rechazo

N (μ, σ2) H0 : μ ≥ μ0 (σ conocida) X x < μ0 − zα σ/√n

N (μ, σ2) H0 : μ ≤ μ0 (σ conocida) X x > μ0 + zα σ/√n

N (μ, σ2) H0 : μ ≥ μ0 (σ desc.) X x < μ0 − t{n−1;α} s/√n

N (μ, σ2) H0 : μ ≤ μ0 (σ desc.) X x > μ0 + t{n−1;α} s/√n

N (μ, σ2) H0 : σ2 ≥ σ2

0 S2 (n−1)s2

σ20

< χ2{n−1;1−α}

N (μ, σ2) H0 : σ2 ≤ σ2

0 S2 (n−1)s2

σ20

> χ2{n−1;α}

ber(p) H0 : p ≥ p0 X x < p0 − zα√p0(1 − p0)/

√n

ber(p) H0 : p ≤ p0 X x > p0 + zα√p0(1 − p0)/

√n

poiss(λ) H0 : λ ≥ λ0 X x < λ0 − zα√λ0/

√n

poiss(λ) H0 : λ ≤ λ0 X x > λ0 + zα√λ0/

√n

(Nota: el tamano n de la muestra ha de ser grande en el caso de la Bernoulli y la Poisson.)

Contrastes para dos poblaciones

Variables Hipotesis nula Region de rechazo

N (μ1, σ21),N (μ2, σ

22)

H0 : μ1 ≤ μ2

(σ1, σ2 conocidas)x1 − x2 > zα

√σ21

n1+

σ22

n2

N (μ1, σ21),N (μ2, σ

22)

H0 : μ1 ≤ μ2

(σ1 = σ2 desconocidas)x1 − x2 > t{n1+n2−2;α} sp

√1n1

+ 1n2

N (μ1, σ21),N (μ2, σ

22)

H0 : μ1 ≤ μ2

(σ1 �= σ2 desconocidas)x1 − x2 > t{f ;α}

√s21n1

+s22n2

N (μ1, σ21),N (μ2, σ

22) H0 : σ

21 ≤ σ2

2

s21s22

> F{n1−1;n2−1;α})

ber(p1),ber(p2) H0 : p1 ≤ p2 x1 − x2 > zα√p(1− p)

√1n1

+ 1n2

donde

n1 y n2 son los tamanos muestrales (que han de ser grandes para el contrastede medias de Bernoullis);

x1 y x2 son las medias muestrales; s21 y s22 son las cuasivarianzas muestrales;

s2p =(n1 − 1)s21 + (n2 − 1)s22(n1 − 1) + (n2 − 1)

; p =n1x1 + n2x2

n1 + n2.

f es el entero mas proximo a(s21/n1 + s22/n2)

2

(s21/n1)2

n1−1 +(s22/n2)2

n2−1

;

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 12: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

12 Capıtulo 7. Contrastes de hipotesis

7.4. Test generales, funcion de potencia

Planteamos a continuacion un marco general para analizar test de contrastesde hipotesis. Partimos, como es habitual, de una variable X con funcion de den-sidad/masa f(x; θ), con θ ∈ Θ. El espacio de parametros Θ se divide en Θ0 y sucomplementario Θ1. La hipotesis nula, que deseamos contrastar, es

H0 : θ ∈ Θ0 ,

y la hipotesis alternativa esH1 : θ ∈ Θ1 .

Para construir un test de hipotesis,

seleccionamos un estadıstico T = h(X1, . . . ,Xn);

y determinamos una region (de rechazo) R ⊂ R, que habitualmente dependede un cierto nivel o umbral.

La operativa del test va como sigue: dada una muestra empırica (x1, . . . , xn)de X, obtenemos un valor t = h(x1, . . . , xn) del estadıstico. Entonces,

si t ∈ R, entonces se rechaza H0 (y se acepta H1);

si t /∈ R, entonces se acepta H0.

Ya hemos visto, en paginas anteriores, los estadısticos y regiones de rechazocorrespondientes a los tests mas habituales.

Vamos ahora a dar un paso mas alla en el analisis y obtener, para cada posiblevalor de parametro θ, la probabilidad de que el test rechace la hipotesis nula supo-niendo que ese θ fuera el verdadero valor del parametro. Esto es lo que se conocecomo la funcion de potencia del test, β(θ), que a cada θ ∈ Θ le asocia el numero(entre 0 y 1)

(7.1) β(θ) = Pθ(rechazar H0) = Pθ(T ∈ R).

Por supuesto, con la funcion 1−β(θ) codificamos la probabilidad de que el test aceptela hipotesis suponiendo que ese θ fuera el verdadero valor del parametro.

Lo ideal, claro, serıa que

• β(θ) fuera muy proxima a 0 para todo θ ∈ Θ0 (es decir, que si la hipotesis fueracierta, el test la rechazara con baja probabilidad);

• y que β(θ) fuera cercana a 1 para todo θ ∈ Θ1 (es decir, que si la hipotesis nulafuera falsa, el test la rechazara con probabilidad cercana a 1).

La primera situacion se corresponde con errores de tipo 1. De hecho, la signifi-cacion α del test se define como

(7.2) α = supθ∈Θ0

β(θ) ,

es decir, la “maxima” probabilidad de rechazo suponiendo que la hipotesis fueracierta (maxima probabilidad de cometer error de tipo 1).

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 13: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.4. Test generales, funcion de potencia 13

En la segunda situacion, cuando θ ∈ Θ1 (y la hipotesis H0 es falsa), entonces1−β(θ) nos da la probabilidad, para cada θ ∈ Θ1, de cometer error de tipo 2. Comoveremos en los ejemplos que siguen, en los tests con un nivel de significacion pequeno,la probabilidad de cometer errores de tipo 2 puede (y suele) llegar a ser grande.

Los test de las paginas anteriores, que se escriben en terminos de un α de refe-rencia, tienen nivel de significacion justamente α, en el sentido tecnico dado en (7.2),como ilustramos en los dos siguientes ejemplos.

� Nota 7.4.1. En un test de contraste de hipotesis general, se plantea una region de rechazo R, quehabitualmente depende de uno o varios umbrales. A posteriori, se calcula su nivel de significacion αsiguiendo (7.2). Veanse, en los ejemplos 7.4.3 y 7.4.4, un par de ilustraciones.

En los test estandar que hemos descrito en las primeras secciones de este capıtulo, se pone poradelantado el valor de α, y se disena la region de rechazo Rα para que tenga justamente nivel designificacion α.

Ejemplo 7.4.1. Funcion de potencia para el test habitual de la hipotesis H0 : μ = μ0

para X ∼ N (μ, σ2), con σ conocida.

Para muestras (X1, . . . ,Xn) de X de tamano n, consideramos el estadıstico X.Dado un α ∈ (0, 1), y como ya hemos visto, la region de rechazo es

Rα ={|X − μ0| > zα/2

σ√n

}

Para calcular la funcion de potencia, recordamos que, si X ∼ N (μ, σ2), entonces(X − μ)/(σ/

√n) ∼ N (0, 1). Usando esto, tenemos que

β(μ) = Pμ(X ∈ Rα) = Pμ

(|X − μ0| > zα/2 σ/√n)= 1−Pμ

(|X − μ0| ≤ zα/2 σ/√n)

= 1−Pμ

(− zα/2 σ/√n ≤ X − μ0 ≤ zα/2 σ/

√n)

= 1−Pμ

((μ0 − μ)− zα/2 σ/

√n ≤ X − μ ≤ (μ0 − μ) + zα/2 σ/

√n)

= 1−Pμ

(μ0 − μ

σ/√n

− zα/2 ≤X − μ

σ/√n

≤ μ0 − μ

σ/√n

+ zα/2

)= 1−

[Φ(μ0 − μ

σ/√n

+ zα/2

)− Φ

(μ0 − μ

σ/√n

− zα/2

)].

La funcion β(μ) tiende a 1 cuando μ → ±∞. Y ademas, β(μ0) = 1 − Φ(zα/2) +Φ(−zα/2) = α, de manera que el nivel de significacion del test es α, como debe ser.

La figura de la izquierda muestra el as-pecto de β(μ) para para los valores μ0 = 1,σ = 1, α = 5% y n = 100. Observese como βes pequeno en el entorno de μ0. Notese tam-bien que si el verdadero μ estuviera cerca deμ0, pero no fuera exactamente μ0, la hipote-sis nula serıa falsa, pero el test la aceptarıacon una (relativa) alta probabilidad. Si por

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 14: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

14 Capıtulo 7. Contrastes de hipotesis

el contrario μ estuviera lejos de μ0, entoncesel test cometerıa un error de tipo 2 con baja probabilidad. ♣

Ejemplo 7.4.2. Funcion de potencia para el test habitual de la hipotesis H0 : μ ≤ μ0

para X ∼ N (μ, σ2), con σ conocida.

El estadıstico es de nuevo X. Dado un α ∈ (0, 1), la region de rechazo es

Rα ={X > μ0 + zα

σ√n

}

Procediendo como en el ejemplo anterior,

β(μ) = Pμ(X ∈ Rα) = Pμ

(X > μ0 + zα σ/

√n)= Pμ

(X−μ > (μ0−μ) + zα σ/

√n)

= Pμ

(X − μ

σ/√n

>μ0 − μ

σ/√n

+ zα

)= 1− Φ

(μ0 − μ

σ/√n

+ zα

).

Representamos a la izquierda muestra el as-pecto de β(μ) (de nuevo para los valores μ0 = 1,σ = 1, α = 5% y n = 100). La funcion β espequena, casi 0, a la izquierda de μ0, como es-perabamos. El nivel de significacion viene dadopor supμ≤μ0

β(μ) = β(μ0) = 1 − Φ(zα) = α, co-mo (de nuevo) debe ser.

Como en el ejemplo anterior, si μ fuera lige-ramente mayor que μ0, la hipotesis serıa falsa,

pero el test la aceptarıa con alta probabilidad. ♣

Ejemplo 7.4.3. Un test para proporciones.

Queremos contrastar la hipotesis de que la proporcion p de personas infectadaspor una cierta enfermedad en una poblacion es inferior al 5%. Es decir, la hipotesisnula es

H0 : p ≤ 5%.

Para contrastarla, disenamos el siguiente test: analizaremos a cinco personas, y si enesa muestra encontramos al menos una infectada, entonces rechazaremos la hipotesisde partida. El test parece razonable, pues un infectado (o mas) de cada cinco apuntaa una proporcion mucho mayor del 5% (o menor) supuesto.

Digamos que X1, . . . ,X5 son las variables que registran si cada persona analiza-da esta infectada o no. Son variables independientes, que siguen1 una distribucionber(p). Su suma Z = X1 + · · · + X5, que registra el numero de infectados, es unavariable bin(5, p).

1Para que esto sea cierto, deberıamos suponer, en el lenguaje habitual de las urnas, que cadaextraccion se hace con reemplazamiento; o bien que la poblacion es tan grande que unas cuantasextracciones no cambian la p de partida.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 15: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.4. Test generales, funcion de potencia 15

La region de rechazo se escribe ahora

R = {Z ≥ 1}.

La funcion de potencia del test es

β(p) = Pp(Z ≥ 1) = 1−Pp(Z = 0) = 1− (1− p)5.

A la izquierda hemos dibujado esta funcion de po-tencia. Como β(p) es una funcion creciente, la sig-nificacion del test es supp≤5% β(p) = β(5%) =22.62%, un poco (bastante) alta.

Buscando un mejor nivel de significacion, redisenamos el test y rechazamos lahipotesis si encontramos en la muestra de cinco personas al menos dos infectadas.La region de rechazo serıa ahora R = {Z ≥ 2}, y la funcion de potencia del test serıa

β(p) = Pp(Z ≥ 2) = 1−Pp(Z = 0)−Pp(Z = 1) = 1− (1− p)5 − 5 p(1− p)4,

cuyo aspecto es similar a la de la grafica anterior, pero que nos darıa un nivel designificacion de supp≤5% β(p) = β(5%) = 2.26%, mucho menor que el anterior.

Observese que, para los dos tests, pero mas pronunciadamente en el segundo, laprobabilidad de error de tipo 2 puede llegar a ser muy grande. Por ejemplo, si pfuera del 6%, la hipotesis serıa falsa, pero el test la aceptarıa con una (altısima)probabilidad del 1− β(6%) = 96.81%. ♣

Ejemplo 7.4.4. Tests para la uniforme.

Digamos queX ∼ unif[0, a], donde a es un parametro positivo. Tratamos primerola hipotesis

H0 : a ≤ A,

donde A es un cierto valor dado. Digamos que tenemos una muestra (x1, . . . , xn).Observese que en cuanto haya algun valor xi mayor que A, la hipotesis no puede sercierta. Esto sugiere definir la siguiente region de rechazo:

R = {max(X1, . . . ,Xn) > A},que describimos usando el maximo de las Xi.

La funcion de potencia asociada es

β(a) = Pa(max(X1, . . . ,Xn)>A) = 1−Pa(max(X1, . . . ,Xn)≤A) = 1−Pa(X≤A)n.

Observese que Pa(X ≤ A) = 1 si a < A, yque Pa(X ≤ A) = A/a si a ≥ A. Lo que nos da,finalmente, que

β(a) =

{0, si a ≤ A,1− (A/a)n, si a > A.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 16: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

16 Capıtulo 7. Contrastes de hipotesis

A la izquierda dibujamos la funcion de potenciadel test. El nivel de significacion es α = 0, pues

β(a) = 0 si a ≤ A; es decir, no es posible cometer errores de tipo 1 con este test.

Planteamos ahora la hipotesis

H0 : a ≥ A.

Ahora no esta tan claro como definir una region de rechazo. Planteamos dos posiblesalternativas: una primera un tanto imaginativa, la segunda algo mas organizada.

Veamos. La hipotesis H0 sugiere que el parametro a es “grande”, mayor que A.Ası que parece razonable rechazarla si en la muestra observaramos “muchos” valoresrelativamente “pequenos”. Cuantificamos ese “pequenos” con un nivel, digamos A/5,y los “muchos valores”, con, por ejemplo, mas de la mitad de ellos. Definimos, pues,la siguiente region de rechazo para una muestra (X1, . . . ,Xn):

(�) R ={#{Xi ≤ A/5} ≥ n/2

}.

La funcion de potencia del test es

β(a) = Pa(R) = P(Z ≥ n/2) ,

donde Z es una variable binomial con n repeticiones y probabilidad de exito dadapor Pa(X ≤ A/5). Observese que

Pa(X ≤ A/5) =

{1 si a ≤ A/5,

A/(5a) si a > A/5.

Esto nos da, finalmente, que

β(a) =

{1 si a < A/5,

P(bin(n, A

5a

) ≥ n/2) si a > A/5.

A la izquierda dibujamos el aspecto de esta fun-cion de potencia. En azul, la region de parame-tros en la que la hipotesis es cierta. El nivelde significacion del test es α = supa≥A β(a) =β(A) = P(bin(n, 1/5) ≥ n/2). Por ejemplo, sin = 10 y A = 5, rechazamos la hipotesis cuando

al menos cinco muestras sean menores o iguales que 1.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 17: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.4. Test generales, funcion de potencia 17

El nivel de significacion es, en este caso,

α = P(bin(10, 1/5) ≥ 5) =10∑j=5

P(bin(10, 1/5) = j) ≈ 3.28%,

que es razonable pequeno. Si el corte en la region de rechazo (�) se hubiera puestoen A/4, en lugar de en A/5 (manteniendo el n/2), entonces el nivel de significacionserıa mayor, de 7.81%

Como alternativa, podrıamos argumentar como sigue: si X sigue una unif[0, a],esperamos que el maximo de una muestra (grande) de X este (muy) cerca del valorextremo a. Ası que si la hipotesis es cierta, es decir, si a ≥ A, el maximo de lamuestra deberıa estar (quizas bastante) a la derecha de A.

Esto sugiere un test que rechace la hipotesis si el maximo esta un poco a laizquierda de A. Cuantificaremos esta idea en el ejemplo 7.5.4. ♣

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 18: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

18 Capıtulo 7. Contrastes de hipotesis

7.5. Tests de razon de verosimilitudes

En las ilustraciones anteriores, los estadısticos para el test y las correspondientesregiones de rechazo venıan dadas, bien por estudios previos teoricos, bien por analisisad hoc de la variable y de su dependencia del parametro en cuestion.

Presentamos a continuacion un metodo general para la construccion de tests paracontrastes de hipotesis.

Partimos, como es habitual, de una variable X con funcion de densidad/masaf(x; θ), donde θ ∈ Θ. El espacio de parametros se parte (particion disjunta) enΘ = Θ0 ∪Θ1. La hipotesis que deseamos contrastar es

H0 : θ ∈ Θ0.

Supongamos que disponemos de una muestra (x1, . . . , xn) de X. Asociada a esamuestra, tenemos la funcion de verosimilitud,

vero(θ;x1, . . . , xn) =n∏

i=1

f(xi; θ),

definida para cada θ ∈ Θ. Imaginemos que esta funcion de verosimilitud tiene unaspecto como en el que se muestra en las figuras bajo estas lıneas, con un unicomaximo, al que designarıamos como θ si estuvieramos en el apartado 5.2.2 sobreestimacion por maxima verosimilitud.

En las tres figuras se plantean tres posibles situaciones. En la primera, el intervaloΘ0 que se desea contrastar, marcado en horizontales con una lınea gruesa, incluye aese maximo: esta situacion apunta a que la hipotesisH0 es plausible, dada la muestra.En las otras dos, la muestra (y su verosimilitud) parecen indicar que la hipotesis noes muy creıble. Muy poco, de hecho, en la ultima figura.

Para cuantificar esta impresion, podemos comparar el valor maximo de la vero-similitud en todo el espacio de parametros (la altura maxima de la grafica) con lamaxima verosimilitud obtenida cuando θ se mueve en Θ0. El cociente de estas can-tidades es 1 en la primera figura, algo mas pequeno en la segunda, y muy pequenoen la tercera. El cociente al que nos estamos refiriendo, y que vamos a llamar razonde verosimilitudes2 RV se escribe como

RV(x1, . . . , xn) =supθ∈Θ0

vero(θ;x1, x2, . . . , xn)

supθ∈Θ vero(θ;x1, x2, . . . , xn).

2Aunque en realidad es un cociente entre supremos de verosimilitudes.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 19: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.5. Tests de razon de verosimilitudes 19

Observese que RV es un numero entre 0 y 1, que no tiene unidades, y que depende dela muestra, pero no del parametro θ. Un valor de RV grande, cercano a 1 (o directa-mente 1), apunta a que H0 es aceptable; mientras que si RV es pequeno, tenderemosa rechazar H0. Queda unicamente establecer ese umbral de aceptacion/rechazo enfuncion del valor de RV.

Elevamos ya notacion, pasando de muestras (x1, . . . , xn) concretas a vectores(X1, . . . ,Xn) que recogen todo el universo de posibles muestras, para describir elproceso de construccion de un test de razon de verosimilitudes.

Disponemos de una muestra aleatoria (X1, . . . ,Xn) de X de tamano n. Asociadaa esta muestra, tenemos la verosimilitud vero(θ;X1, . . . ,Xn).

El test va como sigue:

1) Estadıstico. Consideramos el estadıstico “razon de verosimilitud(es)”:

RV(X1, . . . ,Xn) =supθ∈Θ0

vero(θ;X1,X2, . . . ,Xn)

supθ∈Θ vero(θ;X1,X2, . . . ,Xn).

Volvemos a insistir en que RV ∈ [0, 1], y en que RV es realmente un estadıstico,en cuya definicion no interviene el parametro θ.

2) Region de rechazo. Un test de razon de verosimilitudes es cualquier testque usa a RV como estadıstico y toma como region de rechazo a Rc = (0, c],donde c es un cierto calibre c ∈ (0, 1):

Rc = {RV(X1, . . . ,Xn) ≤ c}.

Hay un test distinto para cada valor de c. Cada uno de ellos tendra una funcionde potencia, y un nivel de significacion.

Vemos a continuacion unas cuantas ilustraciones. Algunas de ellas sirven de jus-tificacion de varios de los tests exhibidos en secciones anteriores.

Ejemplo 7.5.1. Test de razon de verosimilitudes para la hipotesis μ = μ0 en unavariable X ∼ N (μ, σ2), con σ2 conocida.

En la notacion general, Θ0 = {μ0}. Pongamos para simplificar lo que sigue queσ = 1. Tenemos

vero(μ;X1, . . . ,Xn) =( 1√

)nexp

(− 1

2

n∑j=1

(Xj − μ)2).

El estimador por maxima verosimilitud de μ es X, como ya sabemos (ejem-plo 5.2.10), ası que

supμ

vero(μ;X1, . . . ,Xn) =( 1√

)nexp

(− 1

2

n∑j=1

(Xj −X)2).

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 20: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

20 Capıtulo 7. Contrastes de hipotesis

Por consiguiente,

RV(X1, . . . ,Xn) =vero(μ0;X1, . . . ,Xn)

supμ vero(μ;X1,X2, . . . ,Xn)

= exp(− 1

2

n∑j=1

(Xj − μ0)2 +

1

2

n∑j=1

(Xj −X))2),

que tras algebra simplificadora se reduce a

RV(X1, . . . ,Xn) = exp(− n

2(X − μ0

)2).

Con calibre c ∈ (0, 1) obtenemos el test con region de rechazo

Rc = {RV(X1, . . . ,Xn) ≤ c} ={|X − μ0| ≥ 1√

n

√2 ln(1/c)

}.

Si no hubiera sido σ = 1, la region de rechazo habrıa sido

Rc = {RV(X1, . . . ,Xn) ≤ c} ={|X − μ0| ≥ σ√

n

√2 ln(1/c)

}.

De manera que el test de razon de verosimilitudes con calibre c es el test bilateralusual con zα/2 =

√2 ln(1/c). El aspecto de la funcion de potencia de este test

aparecio en el ejemplo 7.4.1. ♣

Ejemplo 7.5.2. Test de razon de verosimilitudes para la hipotesis μ ≤ μ0 en unavariable X ∼ N (μ, σ2), con σ2 conocida.

En la notacion general, Θ0 = {μ ≤ μ0}. Volvemos a poner σ = 1. Usamos lanotacion del ejemplo anterior. La funcion de verosimilitud

vero(μ;X1, . . . ,Xn) =( 1√

)nexp

(− 1

2

n∑j=1

(Xj − μ)2)

tiene un maximo en X. El exponente de vero,como funcion de μ, es una parabola (invertida)con maximo en X.

Si X ≤ μ0, entonces el lugar donde alcanzael maximo global la funcion vero esta en Θ0

y, por tanto, numerador y denominador de RVcoinciden. Por tanto, RV = 1 si X ≤ μ0.

Por el contrario, si X > μ0, el supremo delnumerador se alcanza en μ0, lo que nos dice que,en este caso,

RV(X1, . . . ,Xn) =vero(μ0,X1, . . . ,Xn)

vero(X ;X1, . . . ,Xn).

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 21: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.5. Tests de razon de verosimilitudes 21

En suma,

RV(X1, . . . ,Xn) =

⎧⎨⎩1; si X ≤ μ0 ,

exp(− n

2(X − μ0

)2); si X > μ0 .

Con calibre c ∈ (0, 1), obtenemos el test con region de rechazo

Rc = {RV(X1, . . . ,Xn) ≤ c} ={X > μ0 , exp

(− n

2(X − μ0

)2) ≤ c}

={X > μ0 , |X − μ0| ≥ 1√

n

√2 ln(1/c)

}=

{X − μ0 ≥ 1√

n

√2 ln(1/c)

}.

De nuevo, para un σ general, la region de rechazo en el test de razon de verosimili-tudes serıa

{RV(X1, . . . ,Xn) ≤ c} ={X − μ0 ≥ σ√

n

√2 ln(1/c)

}.

De manera que el test de razon de verosimilitudes con calibre c es el test unilateralusual con zα =

√2 ln(1/c). Vease el aspecto de la funcion de potencia asociada en

el ejemplo 7.4.2. ♣

Ejemplo 7.5.3. Test de razon de verosimilitud para la hipotesis a ≤ A en unavariable X ∼ unif[0, a].

Queremos contrastar la hipotesis H0 : a ≤ A, para un A > 0 dado. Es decir,Θ0 = {a ≤ A}. Denotemos por Mn al estadıstico Mn = max

(X1, . . . ,Xn

).

La funcion de verosimilitud es

vero(a;X1, . . . ,Xn) =

⎧⎨⎩

1

an, si Mn ≤ a .

0 , si Mn > a .

cuyo aspecto dibujamos a la derecha para una mues-tra dada. Observese que

supa>0

vero(a;X1, . . . ,Xn) =1

Mnn

,

mientras que, argumentando sobre la posicion relativa entre A y Mn (vease la figura),

supa∈Θ0

vero(a;X1, . . . ,Xn) = supa≤A

vero(a;X1, . . . ,Xn) =

⎧⎨⎩

1

Mnn

, si Mn ≤ A ,

0 , si Mn > A .

Concluimos entonces que

RV(X1, . . . ,Xn) =

⎧⎨⎩1 , Mn ≤ A ,

0 , Mn > A .

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 22: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

22 Capıtulo 7. Contrastes de hipotesis

La region de rechazo correspondiente un calibre c ∈ (0, 1) es

{RV ≤ c} = {RV = 0} = {Mn > A},de manera que solo hay un test, y se rechaza si Mn > A y se acepta si Mn ≤ A. Setrata, por cierto, del test del ejemplo 7.4.4, vease allı su funcion de potencia. ♣

Ejemplo 7.5.4. Test de razon de verosimilitud para la hipotesis a ≥ A en unavariable X ∼ unif[0, a].

Queremos contrastar ahora la hipotesis H0 : a ≥ A, para un A > 0 dado. Deno-tamos, como antes, por Mn al estadıstico Mn = max

(X1, . . . ,Xn

).

La funcion de verosimilitud es la del ejemplo anterior 7.5.3. Argumentando comoallı, tenemos que ahora

supa≥A

vero(a;X1, . . . ,Xn) =

⎧⎪⎨⎪⎩

1

Mnn

, si Mn ≥ A ,

1

An, si Mn < A .

De manera que

RV(X1, . . . ,Xn) =

⎧⎨⎩1 , si Mn ≥ A ,(Mn

A

)n, si Mn < A .

Dado un calibre c ∈ (0, 1), la region de rechazo del test es

{RV ≤ c} = {Mn < A , (Mn/A)n ≤ c} = {Mn ≤ Ac1/n}.

Observese que, para un c ∈ (0, 1), en cuanto n sea moderadamente grande, c1/n esmuy cercano a 1, de manera que rechazaremos la hipotesis cuando el maximo de lamuestra este (un poco) por debajo de A.

La funcion de potencia resulta ser

β(a) = Pa(RV ≤ c) = Pa

(max(X1, . . . ,Xn) ≤ Ac1/n

)

= Pa

(X ≤ Ac1/n

)n=

⎧⎪⎨⎪⎩1 , si a ≤ Ac1/n ,(Ac1/n

a

)n, si a > Ac1/n .

=

⎧⎨⎩1 , si a ≤ Ac1/n ,

c(Aa

)n, si a > Ac1/n .

Dibujamos a la derecha

el aspecto de estafuncion de potencia, que es (vagamente) similaral de la funcion de potencia del test del ejem-plo 7.4.4. El nivel de significacion de este test re-sulta ser justamente el valor del calibre c, puestoque α = supa≥A β(a) = β(A) = c.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 23: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.5. Tests de razon de verosimilitudes 23

Ejemplo 7.5.5. Test de razon de verosimilitudes para la hipotesis θ ≤ θ0 en unavariable con funcion de densidad

f(x; θ) =

{e−(x−θ), si x > θ ,

0, si x ≤ θ ,

donde θ es un parametro positivo.

La funcion de distribucion viene dada por

Pθ(X ≤ t) =

⎧⎨⎩0 , si t ≤ θ ,

1− eθ−t , si t > θ .

Denotemos por mn al estadıstico mn = mın(X1, . . . ,Xn).

La funcion de verosimilitud viene dada por

V (θ;X1, . . . ,Xn) =

⎧⎨⎩enθ−

∑nj=1 Xj , si θ < mn ,

0 , si θ ≥ mn .

Ası quesupθ∈R

V (θ;X1, . . . ,Xn) = e−∑n

j=1 Xj+nmn

Ademas,

si mn ≤ θ0 entonces supθ≤θ0

V (θ;X1, . . . ,Xn) = e−∑n

j=1 Xj+nmn

si mn ≥ θ0 entonces supθ≤θ0

V (θ;X1, . . . ,Xn) = e−∑n

j=1 Xj+nθ0

Por tanto,

RV(X1, . . . ,Xn) =

{1, si mn < θ0

en(θ0−mn), si mn ≥ θ0

La region de rechazo en el test de razon de verosimilitudes con calibre c es entonces

Rc = {RV(X1, . . . ,Xn) ≤ c} ={mn ≥ θ0 , en(θ0−mn) ≤ c

}=

{mn ≥ θ0 +

ln(1/c)

n

}.

Para calcular la funcion de potencia β de este test, denotemos h = θ0+ln(1/c)/n.Entonces

β(θ) = Pθ(RV ≤ c) = Pθ(mn ≥ h) = Pθ(X ≥ h)n

Ahora bien,

Pθ(X ≥ h) =

⎧⎨⎩1 , si θ ≥ h ,

e(θ−h) , si θ ≤ h .

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 24: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

24 Capıtulo 7. Contrastes de hipotesis

Por consiguiente,

β(θ) =

⎧⎨⎩1 , si θ ≥ θ0 + ln(1/c)/n ,

c en(θ−θ0) , si θ ≤ θ0 + ln(1/c)/n .

La significacion del test resulta ser, de nuevo,el valor del calibre c, pues

supθ∈Θ0

β(θ) = β(θ0) = c.♣

Ejemplo 7.5.6. Test de razon de verosimilitudes para la hipotesis σ2 ≤ σ20 en una

variable X ∼ N (0, σ2).

Llamemos, por simplicidad notacional, θ = σ2 al parametro, y θ0 = σ20 al valor

de referencia, de manera que Θ0 = {θ ≤ θ0} es la hipotesis que queremos contrastar.

La funcion de densidad de la variable es

f(x; θ) =1√2πθ

e−12x2/θ,

y la funcion de verosimilitud asociada a la mues-tra (X1, . . . ,Xn) es

V (θ;X1, . . . ,Xn) =1

(2π)n/21

θn/2e−

12nX2/θ,

cuyo aspecto tıpico representamos a la derecha.

El (unico) maximo de esta funcion se alcanza en θ = X2 (el estimador pormaxima verosimilitud de θ), de manera que

supθ

V (θ;X1, . . . ,Xn) =1

(2π)n/21

(X2)n/2e−n/2.

Por otro lado, argumentando como en ejemplos anteriores,

supθ≤θ0

V (θ;X1, . . . ,Xn) =

⎧⎨⎩

1(2π)n/2

1

(X2)n/2e−n/2 si θ0 > X2,

1(2π)n/2

1

θn/20

e−n2X2/θ0 si θ0 ≤ X2,

lo que nos da que

RV(X1, . . . ,Xn) =

⎧⎨⎩

1 si X2/θ0 < 1,(X2

θ0

)n/2e−

n2(X2/θ0−1) si X2/θ0 ≥ 1.

Ahora, dado un calibre c ∈ (0, 1), obtenemos la region de rechazo

Rc = {RV ≤ c} ={X2

θ0≥ 1 ,

(X2

θ0

)n/2exp

(− n

2

(X2

θ0− 1

))≤ c

}.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 25: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.5. Tests de razon de verosimilitudes 25

Para calcular la funcion de potencia deltest, consideramos la funcion

f(z) = zn/2 e−n2(z−1)

que tiene el aspecto que se muestra en la figurade la derecha, con el maximo situado en z = 1(para el que f(1) = 1). El conjunto de losvalores de z para los que f(z) ≤ c es la unionde dos intervalos, marcados en la figura. Sillamamos z∗ a la solucion (mayor que 1) de f(z) = c, entonces resulta que la regionde rechazo anterior se puede escribir como

Rc ={X2

θ0≥ z∗

},

una expresion bastante mas manejable, salvo por el detalle, no menor, de que el valorde z∗ (que depende unicamente de n y c) ha de calcularse numericamente.

La funcion de potencia es

β(θ) = Pθ(Rc) = Pθ

(X2

θ0≥ z∗

).

Si X ∼ N (0, θ), entonces

nX2

θ=

n∑i=1

X2i

θ

d= χ2

n,

pues las X2i /θ son cuadrados de normales estandar independientes.

De forma que la funcion de potencia es

β(θ) = Pθ

(X2

θ0≥ z∗

)= Pθ

(nX2

θ≥ n

θ0θz∗)

= P(χ2n ≥ n

θ0θz∗),

cuyo aspecto mostramos en la figura de la dere-cha. La significacion del test es supθ≤θ0 β(θ) =β(θ0) = P(χ2

n ≥ nz∗). Por ejemplo, si n = 10y tomamos un calibre c = 10%, entonces z∗ ≈2.23, y la significacion es α = 1.36%. ♣

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 26: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

26 Capıtulo 7. Contrastes de hipotesis

7.6. Tests uniformemente mas potentes

Tenemos dos tests para contrastar la hipotesis θ ∈ Θ0. Sus respectivas funcionesde potencia son β1 y β2.

Decimos que el test 1 es uniformemente mas potente que el test 2 si

β1(θ) > β2(θ) , para todo θ /∈ Θ0.

En otras palabras, cuando la probabilidad de rechazar cuando se debe es siempremayor en el primer test que en el segundo.

7.6.1. Lema de Neyman–Pearson

En este apartado discutimos un resultado que se conoce como el lema de Ney-man–Pearson, y que ilustra el principio de que los test de razon verosimilitud sonoptimos en el sentido de ser uniformemente mas potentes que cualesquiera otros.

Digamos que queremos contrastar una hipotesis nula H0 : θ = θ0 contra unahipotesis alternativa H1 : θ = θ1. No hay mas valores del parametro, es decir, en estecaso, Θ = {θ0, θ1}

Como referencia tenemos el test de razon de verosimilitud con calibre c ∈ (0, 1),que rechaza H0 en {RV ≤ c}, es decir, rechaza si

V (θ0;X1, . . . ,Xn)

max{V (θ0;X1, . . . ,Xn), V (θ1;X1, . . . ,Xn)} ≤ c ,

que a su vez equivale a rechazar si

V (θ0;X1, . . . ,Xn) ≤ c V (θ1;X1, . . . ,Xn) .

Supongamos que el calibre c es tal que el test de razon de verosimilitudes tienesignificacion α, es decir, que

Pθ0(RV ≤ c) = α ,

o, en otros terminos, que

Pθ0

(V (θ0;X1, . . . ,Xn) ≤ c V (θ1;X1, . . . ,Xn)

)= α .

Denotemos por β a la funcion de potencia de este test de razon de verosimilitudes,que solo toma dos valores, β(θ0) y β(θ1). Ademas β(θ0) = α.

Supongamos que tenemos un test alternativo para el mismo contraste, con funcionde potencia β y con la misma significacion α, es decir, β(θ0) = α.

Pues bien: el Lema de Neyman–Pearson afirma que

β(θ1) ≥ β(θ1)

sea cual sea ese test alternativo. Es decir, el test de razon de verosimilitudeses uniformemente mas potente que (cualquier) test alternativo.

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez

Page 27: Contrastes de hip´otesis - UAMverso.mat.uam.es/~pablo.fernandez/7-contrastes-curso17-18.pdf · Contraste para la media de una normal de varianza ... cuando la media muestral estuviera

7.6. Tests uniformemente mas potentes 27

Para la demostracion, denotemos con 1 a la funcion que vale 1 en la regionde Rn de rechazo del test de razon de verosimilitudes y que vale 0 en la complemen-taria region de aceptacion, y denotemos con 1 a la funcion analoga, pero para el testalternativo.

Consideremos la integral

(�) I :=

∫Rn

(1(x)− 1(x))(cV (θ1;x)− V (θ0;x)

)dx

• Si 1(x) = 1, entonces cV (θ1;x)− V (θ0;x) ≥ 0 y

(1(x)− 1(x))(cV (θ1;x)− V (θ0;x)

) ≥ 0 .

• Si 1(x) = 0, entonces cV (θ1;x)− V (θ0;x) ≤ 0 y

(1(x)− 1(x))(cV (θ1;x)− V (θ0;x)

) ≥ 0 .

En suma, el integrando de (�) es siempre no negativo, y, por tanto

I =

∫Rn

(1(x)− 1(x))(cV (θ1;x)− V (θ0;x)

)dx ≥ 0

Por tanto, usando que β(θ0) = β(θ0) = α y desarrollando la integral, se tiene que

0 ≤ I = cβ(θ1)− β(θ0)−(cβ(θ1)− β(θ0)

)= cβ(θ1)− cβ(θ1) ,

de donde β(θ1) ≥ β(θ1). �

notas de estadıstica I – 12 de diciembre de 2017 – jose l. fernandez y pablo fernandez