Upload
nicola-dangelo
View
4
Download
2
Embed Size (px)
DESCRIPTION
statistica
Citation preview
Test di Kolmogorov (si usa solo nel caso di v.a. continue). Caso campioni completi
1. Si calcola k*: max distanza tra F teorica ed F empirica. 2. si legge kc in apposite tabelle. In tabella si entra con α e con la dimensione
campionaria n. 3. Si confronta k* con kc. Se k*> kc si propende per H1 altrimenti si propende per
H0: Dettagli punto 1): calcolo di k* • Come si dovrebbe fare (a rigore): Si può verificare che(essendo le F funzioni monotone crescenti):
( ) ( ) ( )( ) ( )( )1,2,...,
1ˆmax max ,i ix i n
i iF x F x F x F xn n−∞< <+∞ =
−⎧ ⎫− = − −⎨ ⎬⎩ ⎭
Nota
( )( ) ( ){ }# :ˆ j i
i
j x x iF xn n
≤= =
• Molti testi suggeriscono di adottare questo procedimento approssimato (si valutano le distanze solo in corrispondenza dei valori osservati)
F empirica: ( )F̂ x
F teorica: ( )F x
Massima distanza
1
F
F empirica: ( )F̂ x
F teorica: ( )F x
Massima distanza
1
F
( ) ( )ˆmaxx
F x F x−∞< <+∞
−
( )F̂ x
( ) ( )1,2,..,
ˆmax i ii n
F x F x=
−
( ){ }# :ˆ jj x x
F xn
≤=
1. Il test è distribution free se l’ipotesi nulla specifica sia la forma del modello teorico che il valore dei suoi parametri (in questo caso si usa per tutti i modelli la medesima tabella). 2. Kc dipende dalla distribuzione se i parametri vengono stimati. In questo caso per ogni modello bisogna utilizzare una tabella apposita. Nota: nel caso della distribuzione Normale si può usare la tabella di cui al punto 1 anche nel caso in cui i parametri vengono stimati. I valori di Kc che si ottengono sono infatti molto prossimi a quelli esatti. L’uso di tale tabella comporta che il valore reale di α sia minore o uguale di quello utilizzato per entrare in tabella (si tratta quindi di una soluzione conservativa).
Test χ2 (si usa solo sia nel caso di v.a. continue che discrete). { }1 2, , , lϑ ϑ ϑ ϑ= ⋅⋅⋅ noto: l’ipotesi nulla specifica sia il modello che il valore dei parametri.
X ni ic A1 n1 1c A2 n2 2c
Ak nk kc
( ) 02
2 2
1~
k Hi i
o ci i
n cc
χ χ=
−= ∑
Procedimento pratico
1. Si formano le classi (il risultato del test dipende dalla scelta effettuata) 2. si calcolano le ci e le ni 3. si calcola 2
0χ 4. si determina 2
cχ entrando nella tabella della 2χ con 1-α e k-1. 5. si confronta 2
0χ con 2cχ : se 2 2
0 cχ χ> si decide che è vero H1 altrimenti si propende per H0.
Test χ2 { }1 2, , , lϑ ϑ ϑ ϑ= ⋅⋅⋅ non noto (l’ipotesi nulla specifica solo il tipo di modello). Procedura pratica:
1. si stimano i parametri usando stimatori consistenti (tipo massima verosimiglianza o metodo dei momenti)
2. si pone: ( )ˆi o ic n P X x ϑ= ⋅ =
3. si esegue il test come nel caso precedente tenendo conto che in questo caso si ha k-l-1≤g.l. ≤ k-1
Dettagli punto 3). • I g.l. sono esattamente k-l-1 se i parametri vengono stimati utilizzando i dati in
tabella • Sono invece pari ad un numero w (anche non intero) compreso tra k-l-1 e k-1.se i
parametri vengono stimati utilizzando i dati singoli (informazione più dettagliata). In generale è difficile determinare l’esatto valore di w, pertanto in questo secondo caso spesso si pone g.l.=k-1. Questa soluzione garantisce che il valore reale di α sia minore o uguale di quello utilizzato per cercare 2
cχ in tabella (si tratta quindi di una soluzione conservativa).
H0
2fχ α
Regione critica
R.C.: 2 2 2
1o c αχ χ χ −> =
Statistica test
in frequenze assolute osservate
ic frequenze assolute teoriche
( )i o ic n P X x ϑ= ⋅ =
H0: P X x P X xi o i= = =a f a f;ϑ
H1: ( ) ( );i o iP X x P X x ϑ= ≠ =
I gradi di liberta sono k-1.
Calcolo delle ci nel caso di v.a. continue.
Frequenze teoriche frequenze
assolute Frequenze empiriche
A1 A2 A3 A4 A5 A6 A7
( )i ic n P X A= ⋅ ∈
Ai
( )iP X A∈
( )Xf x