Test Di Normalita

Embed Size (px)

Citation preview

STATISTICA 6.0: TEST DI IPOTESIObiettivi della lezione:A Analisi del file: Esercizio1.sta B Verifica della normalit di un campione: normal probability plot C Test del Chi-quadro per la bont delladattamento D Test di Kolmogorov-Smirnov per la bont delladattamento

1

a) Statistica descrittiva:

A

Analisi del file Esercizio1.sta

Var1) v.a. continua, positiva, media deviazione standard, asimmetria>>0, curtosi>>0 Esponenziale? Var2) v.a. continua, media ~ moda ~ mediana, asimmetria~0, curtosi~0 Normale? Var3) v.a. continua, range limitato, media ~mediana, asimmetria~0, curtosi0, curtosi~0 Poisson? Var5) v.a. discreta, media ~ moda ~ mediana, asimmetria~0, curtosi~0 Binomiale?2

A

Verifica della normalit di un campione: normal probability plot

Verifica dellipotesi di normalit della distribuzione di un campione: istogramma delle frequenze calcolo dei coefficienti di curtosi e di skewness (asimmetria) impiego del normal probability plot

Normal probability plots: si ordinano per ranghi le deviazioni dalle rispettive medie si calcolano a partire da tali ranghi i valori z (valori standardizzati della distribuzione normale) basati sullipotesi che i dati provengano da una distribuzione normale asseX: residui osservati asse Y: valori z se i dati provengono da una distribuzione normale i punti si distribuiscono intorno a una retta (normal expected)

3

A

Verifica della normalit di un campione: normal probability plot

Per convertire i ranghi in valori attesi di una distribuzione normale, ovvero valori normali z: per N osservazioni il valore z(j) per il j-simo rango z(j)=-1 [(3j - 1) / (3N + 1)] dove -1 indica linversa della distribuzione normale standard.

Esercizio1.Si cosiderino i dati presenti in Esercizio1.sta. Grafici ----> Grafici 2D ----> Normal probability plot Variable: scegliere quella voluta Si genera il plot con la retta normal expected4

Esempio1.Valore Normale Atteso

Normal Probability Plot di Var1 (Spreadsheet2 2v*1000c) 4

3

2

VAR2:

1

0

-1

-2

-3

-4 -2 -1 0 1 2 Valore Osservato 3 4 5 6

Il normal probability plot: da Grafici ----> Grafici 2D ---->Normal Probability plots (evidenziando la colonna interessata) consente di confermare in prima analisi lipotesi di normalit.5

Esempio1.VAR1:Valore Normale Atteso

Normal Probability Plot di Var2 (Spreadsheet2 2v*1000c) 5 4 3 2 1 0 -1 -2 -3 -4 -1 0 1 2 3 Valore Osservato 4 5 6 7

Il normal probability plot: da Grafici ----> Grafici 2D ---->Normal Probability plots (evidenziando la colonna interessata) Conduce a rifiutare lipotesi di normalit; sono necessari altri test sulla distribuzione.6

C-D Test di Kolmogorov-Smirnov e del ChiQuadro automatico per la bont delladattamento un test NON parametrico per valutare la bont delladattamento della distribuzione empirica a una distribuzione prescelta si pu eseguire il test direttamente oppure effettuare passo per passo la procedura necessaria utilizzando le facilit del programma

a) Test automatico Sintassi:Dal modulo Nonparametrics/Distrib

Statistiche ----> Adattamento Distribuzioni quindi scegliere la distribuzione teorica ipotizzata

7

Esercizio1. Sialeatorie.

testino le ipotesi fatte sulla distribuzione delle 5 variabili

Procedura1. Si seleziona la distribuzione ipotizzata

8

Variabile da testare

Distribuzione ipotizzata

Tabella delle frequenze e risultato del test del Chi-quadro (di default)

Istogramma e distribuzione teorica ipotizzata Di default fornisce solo il risultato del testi del Chi-quadro9

Numero di classi della tabella delle frequenze

Parametro della distribuzione ipotizzata. Di default prende uno stimatore ottenuto dal campione. DEVO dare il valore del parametro che ipotizzo!!!10

Permette di visualizzare il risultato del test di KolmogorovSmirnov

Permette di combinare tra loro le categorie che contengono frequenze attese minori o uguali a 5. N.B. I gradi di libert per il test Chi-quadro vengono modificati di conseguenza!11

Non posso dire che i dati non appartengono alla distribuzione esponenziale.

12

Esercizi di esameNel file esameBio13_07.sta nella variabile 1 sono riportati i valori di crescita (in un mese) di 500 germogli (in mm) coltivati con un concime classico. Effettuare unanalisi di tipo statistico descrittivo sui dati del campione, commentando i risultati. Disegnare listogramma. Quale distribuzione possiamo ipotizzare per la crescita dei germogli? Verificare la bont della distribuzione ipotizzata con un opportuno test di ipotesi. Si raccolgono i dati relativi alla quantit di sodio presenti nellacqua che sgorga da una certa sorgente. Nella prima colonna del file esameBio29_11Ater.sta sono riportati i risultati relativi a 1000 misurazioni effettuate in giorni successivi. Effettuare unanalisi statistica dei dati; Quale distribuzione possiamo ipotizzare per la quantit considerata? Verificare la correttezza di tale distribuzione; Controllare se sia ragionevole supporre che in media la quantit di Sali presenti nellacqua sia minore di 8;13