Analisi dei dati per i disegni ad un fattore. t di Student La statistica t di Student é definita...

Preview:

Citation preview

Analisi dei dati per i disegni ad un fattore

t di Student• La statistica t di Student é definita come

t = (Y-s2/N)-1/2

dove Y é la variabile,

il parametro valor medio della popolazione,

s é la deviazione standard stimata ed N il numero delle osservazioni.

t di StudentEssa rappresenta lo scarto dalla media

misurato in unità dell’errore standard della distribuzione campionaria.

Può essere utilizzato per costruire intervalli di confidenza attorno alla stima puntuale della media campionaria,

t di Student

Il parametro con livello di confidenza

(1-si trova all’interno dell’intervallo:

<Y> ± (t /2) s2/N)-1/2

t di StudentLa statistica t di Student consente di realizzare

un test di inferenza statistica per il confronto tra due medie campionarie.

In questo caso H0 prevede che la differenza tra le due medie campionarie sia nulla.

t di StudentLa statistica t di Student per il confronto tra

medie campionarie ha quindi al numeratore la differenza delle medie campionarie e al denominatore l’errore standard della distribuzione della differenza delle medie campionarie.

t di Student Se i due campioni sono composti da N1 ed N2

valori rispettivamente, la statistica risulterà avere (N1+N2-2) gradi di libertà o gdl, perché sia lo scarto tra le medie che il corrispondente errore standard sono stimati a partire dai dati.

Inferenza statistica

Si rifiuta H0 in base ai dati

Si accetta H0 in base ai dati

H0 è vera Errore di I tipo

False Alarm (

Decisione corretta

Hit

H0 è falsa Decisione corretta

Correct Rejection

Errore di II tipo

Omission (

La statistica del 2

La statistica del é costituita da somme di punti Z al quadrato.

Il numero dei gdl è pari al numero di punti Z sommati.

La statistica del 2

La distribuzione del con pochi gdl è asimmetrica e ha come valore atteso lo zero;

all’aumentare dei gdl il valore atteso tende ad essere pari al valore dei gdl, mentre la varianza tende ad essere pari a 2

La statistica F di Fisher La statistica F di Fisher é costituita dal

rapporto tra due

F= (

La statistica F di Fisher La distribuzione F è asimmetrica, non

negativa e ha una forma che dipende dai gdl.

Tra la statistica F e la t intercorre un’ovvia relazione:

F= (t

L’analisi della varianza L’ANOVA è una tecnica statistica che

sottopone a verifica l’ipotesi nulla secondo la quale le medie campionarie di J gruppi sono estratte dalla medesima popolazione, e quindi sono pari al parametro della popolazione :

H0 : 1 = 2 = 3 = ..... = J =

L’analisi della varianza Nell’ANOVA ad una via i gruppi sono

individuati a partire dai livelli di un unico fattore o trattamento.

• Si chiamano effetti del trattamento () gli scarti tra la media di un gruppo e la media generale:

J = (J -

L’analisi della varianza L’ANOVA fornisce un modello dei dati, nel

senso che permette di esprimere il valore delle osservazioni in termini dei parametri del modello più un termine di errore;

per il modello tra i soggetti abbiamo:

Yij = + eij

L’analisi della varianza Il punto di partenza dell’analisi è la scomposizione della

devianza totale:

SQTOTALE = i,j(Yij-<Y>)2 =

= i,j ( (Yij- <YJ>) + (<YJ>-<Y>) )2 =

= i,j (Yij- <YJ>)2 + nj j (<YJ>-<Y>)2 = =SQINTRAGRUPPO + SQINTERGRUPPO

dove nj è la numerosità del gruppo j-esimo.

L’analisi della varianza Per valutare l’entità e la significatività

statistica degli effetti (nel loro insieme), l’ANOVA confronta la media dei quadrati intgruppo

QMINTERGRUPPO = SQINTERGRUPPO/(J-1) con la media dei quadrati intragruppo

QMINTRAGRUPPO = SQINTraGRUPPO/(N - J)

L’analisi della varianza Sotto l’ipotesi nulla, queste due quantità

riflettono due stime equivalenti della varianza dell’errore.

Quindi se la variabilità interna ai gruppi e quella tra i gruppi così stimate sono equivalenti allora l’ipotesi nulla sarà verificata.

L’analisi della varianza Per realizzare il confronto si utilizza la

statistica F di Fisher, che per un confronto ad N soggetti e J gruppi ha la forma:

FJ-1,N-J = QM INTERGRUPPO / QMINTRAGRUPPO

L’analisi della varianzaRicordiamo che l’ANOVA assume

l’omoschedasticità, ovvero l’uguaglianza delle varianze tra i gruppi.

L’ipotesi di uguaglianza delle varianze è verificata con il test di Levène.

Se il test di Levène è significativo sarebbe necessario rinunciare all’ANOVA e ricorrere ad un confronto non parametrico, ad esempio usando il test di Wilcoxon.

L’analisi della varianza• Ciò é specialmente vero nel caso di gruppi

non bilanciati, cioè di gruppi con numerosità molto diverse tra loro.

L’analisi della varianza• Tuttavia, dato che gli effetti della

eteroschedasticità consistono in un aumento della probabilità di commettere errori di primo tipo, in caso di

moderata eteroschedasticità (fino ad un rapporto 3:1 tra la varianza massima e la

minima) si può procedere con l’ANOVA considerando però

un valore più restrittivo.

L’analisi della varianza• L’ANOVA assume inoltre la normalità e

l’indipendenza degli errori.

• Se queste assunzioni non sono rispettate la possibilità di commettere errori di I tipo aumenta e la sensibilità del test diminuisce.

L’analisi della varianza• Il modello ANOVA consente di stimare

l’entità degli effetti attraverso il quoziente 2, che fornisce la quota di varianza spiegata dalla variabile indipendente; 2 é definito in termini di somma dei quadrati:

2=SQINTERGRUPPO/ SQTOTALE

L’analisi della varianza• Dato che SQTOTALE= SQINTERGRUPPO+

SQINTraGRUPPO, si ha che 2 varia tra zero ed uno.

• Quando si analizzano fenomeni complessi è possibile che la quota di varianza spiegata da una singola variabile indipendente sia anche molto piccola.