4
Test di Kolmogorov (si usa solo nel caso di v.a. continue). Caso campioni completi 1. Si calcola k*: max distanza tra F teorica ed F empirica. 2. si legge k c in apposite tabelle. In tabella si entra con α e con la dimensione campionaria n. 3. Si confronta k* con k c . Se k*> k c si propende per H 1 altrimenti si propende per H 0 : Dettagli punto 1): calcolo di k* Come si dovrebbe fare (a rigore): Si può verificare che(essendo le F funzioni monotone crescenti): ( ) ( ) () ( ) () ( ) 1,2,..., 1 ˆ max max , i i x i n i i Fx Fx Fx Fx n n −∞< <+∞ = = Nota () ( ) () { } # : ˆ j i i j x x i Fx n n = = Molti testi suggeriscono di adottare questo procedimento approssimato (si valutano le distanze solo in corrispondenza dei valori osservati) F empirica: ( ) ˆ Fx F teorica: ( ) Fx Massima distanza 1 F F empirica: ( ) ˆ Fx F teorica: ( ) Fx Massima distanza 1 F ( ) ( ) ˆ max x Fx Fx −∞< <+∞ ( ) ˆ F x ( ) ( ) 1,2,.., ˆ max i i i n Fx Fx = ( ) { } # : ˆ j j x x Fx n =

Test Adattamento

Embed Size (px)

DESCRIPTION

statistica

Citation preview

Page 1: Test Adattamento

Test di Kolmogorov (si usa solo nel caso di v.a. continue). Caso campioni completi

1. Si calcola k*: max distanza tra F teorica ed F empirica. 2. si legge kc in apposite tabelle. In tabella si entra con α e con la dimensione

campionaria n. 3. Si confronta k* con kc. Se k*> kc si propende per H1 altrimenti si propende per

H0: Dettagli punto 1): calcolo di k* • Come si dovrebbe fare (a rigore): Si può verificare che(essendo le F funzioni monotone crescenti):

( ) ( ) ( )( ) ( )( )1,2,...,

1ˆmax max ,i ix i n

i iF x F x F x F xn n−∞< <+∞ =

−⎧ ⎫− = − −⎨ ⎬⎩ ⎭

Nota

( )( ) ( ){ }# :ˆ j i

i

j x x iF xn n

≤= =

• Molti testi suggeriscono di adottare questo procedimento approssimato (si valutano le distanze solo in corrispondenza dei valori osservati)

F empirica: ( )F̂ x

F teorica: ( )F x

Massima distanza

1

F

F empirica: ( )F̂ x

F teorica: ( )F x

Massima distanza

1

F

( ) ( )ˆmaxx

F x F x−∞< <+∞

( )F̂ x

( ) ( )1,2,..,

ˆmax i ii n

F x F x=

( ){ }# :ˆ jj x x

F xn

≤=

Page 2: Test Adattamento

1. Il test è distribution free se l’ipotesi nulla specifica sia la forma del modello teorico che il valore dei suoi parametri (in questo caso si usa per tutti i modelli la medesima tabella). 2. Kc dipende dalla distribuzione se i parametri vengono stimati. In questo caso per ogni modello bisogna utilizzare una tabella apposita. Nota: nel caso della distribuzione Normale si può usare la tabella di cui al punto 1 anche nel caso in cui i parametri vengono stimati. I valori di Kc che si ottengono sono infatti molto prossimi a quelli esatti. L’uso di tale tabella comporta che il valore reale di α sia minore o uguale di quello utilizzato per entrare in tabella (si tratta quindi di una soluzione conservativa).

Page 3: Test Adattamento

Test χ2 (si usa solo sia nel caso di v.a. continue che discrete). { }1 2, , , lϑ ϑ ϑ ϑ= ⋅⋅⋅ noto: l’ipotesi nulla specifica sia il modello che il valore dei parametri.

X ni ic A1 n1 1c A2 n2 2c

Ak nk kc

( ) 02

2 2

1~

k Hi i

o ci i

n cc

χ χ=

−= ∑

Procedimento pratico

1. Si formano le classi (il risultato del test dipende dalla scelta effettuata) 2. si calcolano le ci e le ni 3. si calcola 2

0χ 4. si determina 2

cχ entrando nella tabella della 2χ con 1-α e k-1. 5. si confronta 2

0χ con 2cχ : se 2 2

0 cχ χ> si decide che è vero H1 altrimenti si propende per H0.

Test χ2 { }1 2, , , lϑ ϑ ϑ ϑ= ⋅⋅⋅ non noto (l’ipotesi nulla specifica solo il tipo di modello). Procedura pratica:

1. si stimano i parametri usando stimatori consistenti (tipo massima verosimiglianza o metodo dei momenti)

2. si pone: ( )ˆi o ic n P X x ϑ= ⋅ =

3. si esegue il test come nel caso precedente tenendo conto che in questo caso si ha k-l-1≤g.l. ≤ k-1

Dettagli punto 3). • I g.l. sono esattamente k-l-1 se i parametri vengono stimati utilizzando i dati in

tabella • Sono invece pari ad un numero w (anche non intero) compreso tra k-l-1 e k-1.se i

parametri vengono stimati utilizzando i dati singoli (informazione più dettagliata). In generale è difficile determinare l’esatto valore di w, pertanto in questo secondo caso spesso si pone g.l.=k-1. Questa soluzione garantisce che il valore reale di α sia minore o uguale di quello utilizzato per cercare 2

cχ in tabella (si tratta quindi di una soluzione conservativa).

H0

2fχ α

Regione critica

R.C.: 2 2 2

1o c αχ χ χ −> =

Statistica test

in frequenze assolute osservate

ic frequenze assolute teoriche

( )i o ic n P X x ϑ= ⋅ =

H0: P X x P X xi o i= = =a f a f;ϑ

H1: ( ) ( );i o iP X x P X x ϑ= ≠ =

I gradi di liberta sono k-1.

Page 4: Test Adattamento

Calcolo delle ci nel caso di v.a. continue.

Frequenze teoriche frequenze

assolute Frequenze empiriche

A1 A2 A3 A4 A5 A6 A7

( )i ic n P X A= ⋅ ∈

Ai

( )iP X A∈

( )Xf x