25
Analisi dei dati per i disegni ad un fattore

Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

Embed Size (px)

Citation preview

Page 1: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

Analisi dei dati per i disegni ad un fattore

Page 2: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

t di Student• La statistica t di Student é definita come

t = (Y-s2/N)-1/2

dove Y é la variabile,

il parametro valor medio della popolazione,

s é la deviazione standard stimata ed N il numero delle osservazioni.

Page 3: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

t di StudentEssa rappresenta lo scarto dalla media

misurato in unità dell’errore standard della distribuzione campionaria.

Può essere utilizzato per costruire intervalli di confidenza attorno alla stima puntuale della media campionaria,

Page 4: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

t di Student

Il parametro con livello di confidenza

(1-si trova all’interno dell’intervallo:

<Y> ± (t /2) s2/N)-1/2

Page 5: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

t di StudentLa statistica t di Student consente di realizzare

un test di inferenza statistica per il confronto tra due medie campionarie.

In questo caso H0 prevede che la differenza tra le due medie campionarie sia nulla.

Page 6: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

t di StudentLa statistica t di Student per il confronto tra

medie campionarie ha quindi al numeratore la differenza delle medie campionarie e al denominatore l’errore standard della distribuzione della differenza delle medie campionarie.

Page 7: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

t di Student Se i due campioni sono composti da N1 ed N2

valori rispettivamente, la statistica risulterà avere (N1+N2-2) gradi di libertà o gdl, perché sia lo scarto tra le medie che il corrispondente errore standard sono stimati a partire dai dati.

Page 8: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

Inferenza statistica

Si rifiuta H0 in base ai dati

Si accetta H0 in base ai dati

H0 è vera Errore di I tipo

False Alarm (

Decisione corretta

Hit

H0 è falsa Decisione corretta

Correct Rejection

Errore di II tipo

Omission (

Page 9: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

La statistica del 2

La statistica del é costituita da somme di punti Z al quadrato.

Il numero dei gdl è pari al numero di punti Z sommati.

Page 10: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

La statistica del 2

La distribuzione del con pochi gdl è asimmetrica e ha come valore atteso lo zero;

all’aumentare dei gdl il valore atteso tende ad essere pari al valore dei gdl, mentre la varianza tende ad essere pari a 2

Page 11: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

La statistica F di Fisher La statistica F di Fisher é costituita dal

rapporto tra due

F= (

Page 12: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

La statistica F di Fisher La distribuzione F è asimmetrica, non

negativa e ha una forma che dipende dai gdl.

Tra la statistica F e la t intercorre un’ovvia relazione:

F= (t

Page 13: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza L’ANOVA è una tecnica statistica che

sottopone a verifica l’ipotesi nulla secondo la quale le medie campionarie di J gruppi sono estratte dalla medesima popolazione, e quindi sono pari al parametro della popolazione :

H0 : 1 = 2 = 3 = ..... = J =

Page 14: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza Nell’ANOVA ad una via i gruppi sono

individuati a partire dai livelli di un unico fattore o trattamento.

• Si chiamano effetti del trattamento () gli scarti tra la media di un gruppo e la media generale:

J = (J -

Page 15: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza L’ANOVA fornisce un modello dei dati, nel

senso che permette di esprimere il valore delle osservazioni in termini dei parametri del modello più un termine di errore;

per il modello tra i soggetti abbiamo:

Yij = + eij

Page 16: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza Il punto di partenza dell’analisi è la scomposizione della

devianza totale:

SQTOTALE = i,j(Yij-<Y>)2 =

= i,j ( (Yij- <YJ>) + (<YJ>-<Y>) )2 =

= i,j (Yij- <YJ>)2 + nj j (<YJ>-<Y>)2 = =SQINTRAGRUPPO + SQINTERGRUPPO

dove nj è la numerosità del gruppo j-esimo.

Page 17: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza Per valutare l’entità e la significatività

statistica degli effetti (nel loro insieme), l’ANOVA confronta la media dei quadrati intgruppo

QMINTERGRUPPO = SQINTERGRUPPO/(J-1) con la media dei quadrati intragruppo

QMINTRAGRUPPO = SQINTraGRUPPO/(N - J)

Page 18: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza Sotto l’ipotesi nulla, queste due quantità

riflettono due stime equivalenti della varianza dell’errore.

Quindi se la variabilità interna ai gruppi e quella tra i gruppi così stimate sono equivalenti allora l’ipotesi nulla sarà verificata.

Page 19: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza Per realizzare il confronto si utilizza la

statistica F di Fisher, che per un confronto ad N soggetti e J gruppi ha la forma:

FJ-1,N-J = QM INTERGRUPPO / QMINTRAGRUPPO

Page 20: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianzaRicordiamo che l’ANOVA assume

l’omoschedasticità, ovvero l’uguaglianza delle varianze tra i gruppi.

L’ipotesi di uguaglianza delle varianze è verificata con il test di Levène.

Se il test di Levène è significativo sarebbe necessario rinunciare all’ANOVA e ricorrere ad un confronto non parametrico, ad esempio usando il test di Wilcoxon.

Page 21: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza• Ciò é specialmente vero nel caso di gruppi

non bilanciati, cioè di gruppi con numerosità molto diverse tra loro.

Page 22: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza• Tuttavia, dato che gli effetti della

eteroschedasticità consistono in un aumento della probabilità di commettere errori di primo tipo, in caso di

moderata eteroschedasticità (fino ad un rapporto 3:1 tra la varianza massima e la

minima) si può procedere con l’ANOVA considerando però

un valore più restrittivo.

Page 23: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza• L’ANOVA assume inoltre la normalità e

l’indipendenza degli errori.

• Se queste assunzioni non sono rispettate la possibilità di commettere errori di I tipo aumenta e la sensibilità del test diminuisce.

Page 24: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza• Il modello ANOVA consente di stimare

l’entità degli effetti attraverso il quoziente 2, che fornisce la quota di varianza spiegata dalla variabile indipendente; 2 é definito in termini di somma dei quadrati:

2=SQINTERGRUPPO/ SQTOTALE

Page 25: Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita come t = (Y- s 2 /N) -1/2 dove Y é la variabile, il parametro

L’analisi della varianza• Dato che SQTOTALE= SQINTERGRUPPO+

SQINTraGRUPPO, si ha che 2 varia tra zero ed uno.

• Quando si analizzano fenomeni complessi è possibile che la quota di varianza spiegata da una singola variabile indipendente sia anche molto piccola.