Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
Analisi della varianza
Analisi della varianza
L’analisi della varianza (ANOVA, ANalysis Of VAriance) è una tecnica dianalisi dei dati che consente di verificare ipotesi relative a differenze tra lemedie di due o più popolazioni.
L’analisi della varianza è una tecnica statistica di tipo parametrico:
• si assume che la variabile di interesse si distribuisca normalmente nellapopolazione e che i due campioni siano estratti in maniera casuale dallapopolazione;
• la numerosità campionaria è rilevante
• nel confronto tra più campioni le varianze devono essere omogenee.
Analisi della varianza
È possibile classificare i diversi modelli di ANOVA in base al numero divariabili indipendenti e dipendenti:
• i modelli che prevedono una sola variabile indipendente vengono definitidisegni a una via ;
• i modelli che prevedono due o più variabili indipendenti vengono definitidisegni fattoriali ;
• i modelli che prevedono una sola variabile dipendente definisconoun’analisi della varianza univariata ;
• i modelli che prevedono due o più variabili dipendenti definiscono un’analisidella varianza multivariata (o MANOVA , Multivariate Analysis of Variance)
Analisi della varianza univariata: disegni “tra soggetti” ad un solo
fattore
Vengono definiti “tra soggetti”, oppure per gruppi indipendenti, i disegni in cuiad ogni trattamento o condizione sperimentale corrisponde un diversogruppo di soggetti. In ogni condizione ci sono soggetti diversi: un soggettoesposto ad una condizione non viene esposto a nessun’altra condizione.
A B
S1 S11
S2 S12
… …
S10 Sn
Il modello teorico dell’ANOVA
Nel modello teorico dell’ANOVA “tra i soggetti” il punteggio yij di un soggetto jnel gruppo i è così scomponibile:
y ij = µ + αi + εij
Dove:
µ è la media generale dei punteggi sul campione totale;
αi è l’effetto dovuto al trattamento (livello i della variabile indipendente), ed ècostante all’interno del trattamento;
εij è una componente “residua”, o di errore causale, specifica per ognisoggetto
Il modello teorico dell’ANOVA
La devianza rappresenta la somma dei quadrati degli scostamenti tra ognipunteggio e la media.
I diversi tipi di devianza:
• devianza totale (SST): è la somma dei quadrati (sum of squares) degliscarti (differenza tra i singoli punteggi e la media generale della variabile);
• devianza tra i gruppi (o between, SSB): è la somma dei quadrati degliscarti (differenza tra i punteggi medi di gruppo e la media generale), ovverola variabilità tra i diversi gruppi;
• devianza entro i gruppi (o within, SSW): è la somma dei quadrati degliscarti tra i punteggi di ogni soggetto e la relativa media di gruppo, ovvero allavariabilità dei soggetti all’interno di ogni gruppo.
SCOMPOSIZIONE DELLA DEVIANZA
Il modello teorico dell’ANOVA
Gradi di libertà (gdl) per ognuna delle componenti della variabilità:
• devianza totale (SST): , n–1 gdl (il gdl perso è quellodella media totale);
• devianza tra i gruppi (o between, SSB): , k–1 gdl (il gdlperso è quello della media totale);
• devianza entro i gruppi (o within, SSW): , n–k gdl (siperde un gdl per ogni media di gruppo).
Dividendo le devianze per i rispettivi gradi di libertà si ottengono le varianze :
• Varianza totale (MST) = devianza totale / n–1;
• Varianza tra i gruppi (MSB) = devianza tra i gruppi / k–1;
• Varianza entro i gruppi (MSW) = devianza entro i gruppi / n–k.
GRADI DI LIBERTA’ E VARIANZE
2ij ..i j
( y y )−∑ ∑
2i ..i j
( y y )−∑ ∑
2ij i .i j
( y y )−∑ ∑
Il modello teorico dell’ANOVA
Il rapporto tra le varianze MSB / MSW segue la distribuzione F , quindi puòessere utilizzato per esaminare ipotesi sulla significatività della differenza trala variabilità dovuta al trattamento e quella residua
La F esamina le seguenti ipotesi:
H0: µ1 = µ2 = … = µk
H1: almeno due µ diverse
IL RAPPORTO «F»
Il modello teorico dell’ANOVA
Ci sono delle assunzioni che devono essere soddisfatte affinché i risultatidell’ANOVA possano essere interpretati in maniera affidabile:
• gli errori (εij) devono seguire la distribuzione normale ed avere mediauguale a 0;
• la varianza degli errori (σε) deve essere uguale in ogni gruppo (condizionedi omoschedasticità);
• gli errori (εij) devono essere indipendenti;
• gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge»qualcosa alla condizione-base e lo fa in maniera «identica» per tutti isoggetti.
ASSUNZIONI
Analisi della varianza univariata:
disegni fattoriali
Vengono definiti fattoriali (o più vie) i disegni di analisi della varianza in cuivi sono due o più variabili indipendenti. Nei disegni fattoriali vengonoesaminati gli effetti di due o più variabili indipendenti sulla variabiledipendente.
Il più semplice disegno è il «2 x 2», dove abbiamo due fattori ciascuno deiquali ha due differenti livelli.
Vantaggi dei disegni fattoriali:
• consentono lo studio dell’interazione. Cioè l’effetto congiunto delle VI sullaVD
• aumentano la potenza del test, cioè la probabilità di rilevare la presenza diun effetto, quindi la probabilità di rifiutare l’ipotesi nulla quando essa è falsa
• consentono una maggiore economia nel numero dei soggetti da esaminare,mantenendo la stessa potenza del test.
Analisi della varianza univariata:
disegni fattoriali
Nei disegni fattoriali abbiamo due tipi di effetti: gli effetti principali e leinterazioni.
L’effetto principale rappresenta l’effetto medio di una variabile indipendentesulla variabile dipendente, indipendentemente dai valori delle altre variabiliindipendenti.
L’interazione rappresenta l’effetto di una variabile indipendente sullavariabile dipendente non è lo stesso per tutti i livelli delle altre variabiliindipendenti.
EFFETTI PRINCIPALI E INTERAZIONI
Analisi della varianza univariata:
disegni fattoriali
Nei disegni fattoriali «tra i soggetti» tutti i fattori sono fattori betweensubjects, ovvero i soggetti vengono assegnati ad ognuna delle singole celle,quindi ogni soggetto è esposto solamente ad una particolare combinazionedelle condizioni sperimentali.
DISEGNI FATTORIALI «TRA SOGGETTI» (BETWEEN SUBJECTS )
A1 A2
B1
S1
S2
…
S6
S7
…
B2
S11
S12
…
S16
S17
…
Analisi della varianza univariata: disegni “entro i soggetti” ad un solo
fattore
I disegni entro i soggetti (o within subjects) sono disegni in cui si utilizzano glistessi soggetti nelle diverse condizioni sperimentali. Nel caso di disegni entroi soggetti l’analisi della varianza viene anche detta per prove (o misure)ripetute.
A B
S1 S1
S2 S2
… …
Sn Sn
Analisi della varianza univariata: disegni “entro i soggetti” ad un solo
fattore
SCOMPOSIZIONE DELLA DEVIANZA TOTALE
• devianza totale (SST): , [nk–1 gdl];
• devianza tra le prove (SSk): , [k–1 gdl];
• devianza entro i gruppi (o within, SSW): , [k(n–1) gdl]
• devianza tra i soggetti (SSS): , [n–1 gdl];
• devianza residua (SSres): SSW – SSs , [(n–1)(k–1) gdl];
2ij ..i j
( y y )−∑ ∑2
. j ..i j( y y )−∑ ∑
2ij . ji j
( y y )−∑ ∑2
i . ..i j( y y )−∑ ∑
Analisi della varianza univariata: disegni “entro i soggetti” ad un solo
fattore
Ci sono delle assunzioni che devono essere soddisfatte affinché i risultatipossano essere interpretati in maniera affidabile:
• gli errori (εij) devono essere indipendenti;
• gli errori (εij) devono seguire la distribuzione normale ed avere mediauguale a 0;
• la varianza delle differenze tra tutte le coppie delle misure ripetute deveessere uguale (sfericità o circolarità);
•gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge»qualcosa alla condizione-base e lo fa in maniera «identica» per tutti isoggetti.
ASSUNZIONI
Analisi della varianza disegni fattoriali «Misti»
Nei disegni fattoriali «misti», almeno un fattore è tra i soggetti ed almeno unfattore è entro i soggetti.
I soggetti vengono esposti a tutte le condizioni sperimentali della variabileentro, e soltanto ad un livello della variabile tra.
A1 A2
B1
S1
S2
…
S1
S2
…
B2
S6
S7
…
S6
S7
…
Analisi della varianza
- Le variabili -
La o le variabili dipendenti sono di tipo quantitativo (scala intervalli orapporto).
Le variabili indipendenti possono essere di due tipi:
• categoriale o qualitativo a loro volta distinte in variabili:
- tra soggetti o fattori beetween
- entro soggetti o fattori within
• quantitativo note anche come covariate .
Analisi della varianza Univariata
Il caso più semplice di analisi della varianza univariata è il t-test percampioni indipendenti. In quel caso l’obiettivo è quello di confrontare, peruna fissata variabile dipendente, le medie di due gruppi indipendenti disoggetti (fattore between a 2 livelli).
L’analisi della varianza univariata può essere vista come un’estensione delt-test per campioni indipendenti nei casi in cui:
- il fattore between ha più di due livelli (aov a una via);
- esiste più di un fattore between (aov a due o più vie, o aov fattoriale).
OBIETTIVO ANALISI DELLA VARIANZA UNIVARIATA BETWEEN
Analisi della varianza Univariata
Si supponga di aver somministrato un test di logica ad un campione disoggetti provenienti da tre tipi differenti di scuole superiori (liceo classico,liceo scientifico, liceo artistico); e di voler valutare se esiste un effetto “scuoladi provenienza” sul numero di risposte corrette al test.
Il modello da adottare sarà quello di analisi della varianza ad una via con:
� variabile dipendente : il numero di risposte corrette al test
� variablie indipendente � un fattore beetween a 3 livelli : scuola diprovenienza (classico, scientifico, artistico)
ESEMPI DI APPLICAZIONE AOV AD UNA VIA
Analisi della varianza Univariata
Riprendendo l’esempio precedente si supponga di disporre anche della classe di provenienza dei soggetti, e di voler valutare i seguenti aspetti:
• Complessivamente i soggetti rispondono in maniera diversa a seconda della scuola di provenienza?
• Complessivamente i soggetti rispondo in maniera diversa a seconda della classe frequentata?
• Esiste un interazione tra il tipo di scuola di provenienza e la classe frequentata? (le differenze tra i tipi di scuola sono costanti per ogni livello di classe frequentata? )
Il modello da adattare ai dati sarà di analisi della varianza 3x5 con:
� variabile dipendente : il numero di risposte corrette;
� un fattore between a 3 livelli : “scuola di provenienza” (classico, scientifico, artistico);
� un fattore between a 5 livelli : “classe” (Ia, IIa, IIIa, IVa, Va)
ESEMPI DI APPLICAZIONE AOV FATTORIALE
Analisi della varianza Univariata
• Le osservazioni seguono una distribuzione normale sulla variabile dipendente in ciascun gruppo.
• Le varianze dei gruppi sono uguali (omogenietà della varianza).
• Le osservazioni sono indipendenti.
ASSUNZIONI
Analisi della varianza Univariata ad una via
LA FORMULAZIONE DEL PROBLEMA
Nota: K è il numero di livelli del fattore between
L’APPROCCIO STATISTICO
H0 µ1 = µ2 = µ3 = ….. = µk
H1almeno una media è diversa dalle altre
Analisi della varianza Univariata ad una via
LA SCOMPOSIZIONE DELLA DEVIANZA
Nota: N è il numero di oservazioni K è il numero di livelli del fattore between
L’APPROCCIO STATISTICO
Devianza totale(N-1)
Devianza tra i gruppi(k-1)
Devianza entro i gruppi(N-k)
Analisi della varianza Univariata ad una via
IL RAPPORTO: (VARIANZA TRA SOGG.) / (VARIANZA ENTRO SOGG.)
Dividendo le devianze (SS) per i rispettivi gradi di libertà si ottengono le varianze (MS). Sotto H0 il rapporto tra le varianze ha una distribuzione nota:
Se la probabilità associata (p-value) al valore di F osservato è minore di un valore critico fissato a priori (ad esempio 0.05), si rifiuta H0.
In questo caso si può conludere che il fattore between, ha un effetto statisticamente significativo sulla variabile dipendente.
L’APPROCCIO STATISTICO
( , )TraTra EntroOss
Entro
MSF df df
MSF = ≈
Analisi della varianza Univariata ad una via
Se l’analisi della varianza è risultata significativa, si potrebbe essere interessati a capire quali tra le medie dei livelli del fattore between differiscono tra loro.
La tentazione potrebbe essere quella di applicare una serie di t-test per confrontare tutte le medie tra loro.
L’ANALISI POST-HOC
ERROREERRORE
Analisi della varianza Univariata ad una via
Infatti, aumentando il numero di test effettuati, aumenta la probabilità di errore di I° tipo: se testiamo un’ipotesi nulla che in effetti è vera, utilizzando α come valore critico, la probabilità di ottenere un risultato non significativo (corretto) è 1-α; se testiamo 2 ipotesi indipendenti la probabilità che nessuno dei 2 test sia significativo è data, per un teorema del calcolo delle probabilità, dal prodotto delle probabilità (1-α)*(1-α); più generalmente se testiamo K ipotesi indipendenti la probabilità che i test siano congiuntamente non significativi è data da (1-α)K; ne consegue che la probabilità di avere almeno un test significativo sarà 1-(1-α)K.
Esemplificando, se vengono testate 20 ipotesi indipendenti al livello di significatività α = 0,05, la probabilità che nessuna sia significativa è 0,9520 = 0,36. La probabilità che almeno una sia significativa per errore sarà 1-(1-0,05)20 = 0,64, ben superiore al valore nominale prescelto del 5%.
L’ANALISI POST-HOC
Analisi della varianza Univariata ad una via
Per “mantenere sotto controllo” la probabilità di errore globale esistono delle tecniche dette di “analisi post-hoc ” che mirano a correggere la probabilità di errore dei singoli confronti tra le medie, in modo da ottenere dei risultati statisticamente corretti.
L’ANALISI POST-HOC
Analisi della varianza Univariata
1. Identificazione della variabile dipendente e del fattore between (o dei fattori between).
2. Definizione del modello di analisi.
3. Analisi descrittiva dei dati.
4. Verifica delle assunzioni teoriche.
5. Adattamento del modello ai dati.
6. Verifica della significatività degli effetti.
7. Eventuale analisi post-hoc
I PASSI FONDAMENTALI
Analisi della varianza Univariata ad una via in
SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Confronta Medie”.
3. Selezionare l’opzione “Anova Univariata”.
4. Selezionare la variabili dipendente e il fattore between.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Analisi della varianza Univariata fattoriale in
SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Modello Lineare Generalizzato”.
3. Selezionare l’opzione “Univariata”.
4. Selezionare la variabile dipendente, i fattori between e le eventuali variabili indipendenti covariate.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Analisi della varianza Univariata ad una via
Si supponga di aver somministrato un test sulla memoria ad un campione di soggetti appartenenti a tre fasce d’età (20-29 anni, 30-49 anni, 50 anni e oltre).
Si vuole valutare se l’età ha un effetto sulla memoria.
Nota: i dati sono contenuti nel file “memoria.sav”
ESEMPIO PRATICO (I)
Analisi della varianza Univariata ad una via
Per valutare l’effetto dell’età sulla memoria si adotterà un modello di analisi della varianza univariata ad una via con:
• variabili dipendente : il numero di risposte corrette al test
• un fattore tra soggetti a 3 livelli : Età (20-29 anni, 30-49 anni, 50 e oltre)
IL MODELLO DI ANALISI
Analisi della varianza Univariata ad una via
ANALISI DESCRITTIVA DEI DATI
Analisi della varianza Univariata ad una via
VERIFICA DELL’IPOTESI DI NORMALITA’
Analisi della varianza Univariata ad una via
VERIFICA DELL’IPOTESI DI OMOGENEITA’ DELLE VARIANZE
Test di omogeneità delle varianze
numero di rispote corrette
1.407 2 42 .256
Statisticadi Levene df1 df2 Sig.
Osservando il valore di significatività del test di Levene si puòconcludere che le varianze dei tre gruppi di soggetti sono omogenee.
Analisi della varianza Univariata ad una via
I RISULTATI DELL’ANALISI DELLA VARIANZA
ANOVA univariata
numero di rispote corrette
1086.711 2 543.356 4.481 .017
5093.200 42 121.267
6179.911 44
Fra gruppi
Entro gruppi
Totale
Somma deiquadrati df
Media deiquadrati F Sig.
Osservando il valore di significatività (p-value) del test F si puòconcludere che l’età ha un effetto significativo sulla memoria.
Analisi della varianza Univariata ad una via
I RISULTATI DEL POST-HOC
Confronti multipli
Variabile dipendente: numero di rispote corrette
Bonferroni
3.26667 4.02106 1.000 -6.7605 13.2938
11.66667* 4.02106 .018 1.6395 21.6938
-3.26667 4.02106 1.000 -13.2938 6.7605
8.40000 4.02106 .128 -1.6272 18.4272
-11.66667* 4.02106 .018 -21.6938 -1.6395
-8.40000 4.02106 .128 -18.4272 1.6272
(J) età30-49 anni
50 anni e oltre
20-29 anni
50 anni e oltre
20-29 anni
30-49 anni
(I) età20-29 anni
30-49 anni
50 anni e oltre
Differenza framedie (I-J) Errore std. Sig.
Limiteinferiore
Limitesuperiore
Intervallo di confidenza95%
La differenza tra le medie è significativa al livello .05.*.
Dall’analisi post-hoc con il metodo di Bonferroni emerge che l’unicadifferenza significativa è quella tra la prima e la terza fascia d’età.
Analisi della varianza Univariata ad una via
L’analisi ha riscontrato un effetto significativo dell’età sulla capacità di memoria dei soggetti (F2,42=4,481 ; p<0.05).
In particolare si può notare, in seguito all’applicazione dell’analisi post-hoc con il metodo di Bonferroni, che i soggetti può giovani manifestano una capacità di memoria significativamente maggiore di quella dei soggetti più anziani (p=0.018).
CONCLUSIONI
Analisi della varianza Univariata fattoriale
Si supponga di voler studiare gli effetti del fumo da sigaretta su alcuni tipi di prestazione. A tale scopo è stato selezionato un campione i cui soggetti sono stati suddivisi in tre gruppi rispetto al fumo: non fumatori (NS), fumatori ma non prima-durante la prova (DS), fumatori attivi prima-durante la prova (AS). In maniera casuale all’interno di ciascun gruppo un terzo dei soggetti ha fatto un compito di pattern recognition, un terzo un compito di tipo cognitivo e un terzo una simulazione di guida con un video game. In ogni caso la variabile dipendente è il numero di errori commessi.
Le domande di ricerca riguardano la valutazione dell’effetto del fumo , dell’effetto del tipo di compito , e dell’eventuale interazione tra fumo e compito sulle perfomance dei soggetti .
Nota: i dati sono contenuti nel file “smoking.sav”
ESEMPIO PRATICO (II)
Analisi della varianza Univariata fattoriale
Per rispondere alle domande di ricerca si adotterà un modello di analisi della varianza univariata fattoriale 3×3 con:
• variabili dipendente : il numero di errori commessi
• un fattore tra soggetti a 3 livelli : Fumo (Non Fumatori, Fumatori ma non prima e durante la prova, Fumatori prima e durante la prova)
• un fattore tra soggetti a 3 livelli : Compito (Pattern Recognition, Cognitivo, Simulazione di Guida)
IL MODELLO DI ANALISI
Analisi della varianza Univariata fattoriale
RISULTATI DELL’ANALISI DELLA VARIANZA
Osservando i risultati dell’analisi della varianza si può affermare che:
• il fumo complessivamente non ha un effetto significativo sulla performance
• il tipo di compito ha un effetto significativo sulla performace
• esiste un effetto significativo dell’interazione fumo-tipo di compito sulla performance
Analisi della varianza Univariata fattoriale
pattern recognition cogn itive task driv ing simula tion
task
0,00
10,00
20,00
30,00
40,00
50,00
med
ie m
argi
nal
i atte
se
smokegrNo Smoker
Delay Smoker
Active Smoker
INTERPRETAZIONE GRAFICA DEI RISULTATI
Analisi della varianza Univariata fattoriale
L’analisi ha riscontrato un effetto significativo del tipo di compito (F2,81=73.865 ; p<0.05) e un effetto significativo dell’interazione fumo-tipo di compito (F4,81=3.261 ; p<0.05) sulle performance dei soggetti. L’effetto principale del fattore fumo non è invece risultato significativo.
Si può quindi concludere che;
• il fumo complessivamente non incide sulla performace;
• il tipo di compito complessivamente ha influenza sulla performance;
• esiste un effetto interattivo “fumo-tipo di compito” sulle performance (le differenze di performance tra i tre gruppi di fumatori non sono costanti nei tre diversi tipi di compito).
CONCLUSIONI
Analisi della varianza Multivariata
(MANOVA)
L’obiettivo dell’analisi della varianza multivariata è quello di studiare gli effetti di uno o più fattori tra soggetti su un insieme di variabili dipendenti .
(Mentre nell’Anova Univariata la variabile dipendente è una, nella Manova le variabili dipendenti sono più di una)
Esempio: Si vuole studiare se i maschi differiscono complessivamente dalle femmine sui punteggi totali di tre questionari che rilevano tre diversi aspetti dell’ansia.
In questo caso si adotterà un disegno di analisi della varianza multivariata (Manova) con:
- 3 variabili dipendenti (i 3 aspetti dell’ansia);
- 1 fattore tra soggetti (sesso).
L’OBIETTIVO DELL’ANALISI DELLA VARIANZA MULTIVARIAT A
Analisi della varianza Multivariata
(MANOVA)
• Le osservazioni seguono una distribuzione normale multivariata sulle variabili dipendenti in ciascun gruppo.
• Le matrici di covarianza sulle variabili dipendenti di ciascun gruppo sono uguali.
• Le osservazioni sono indipendenti.
ASSUNZIONI NELL’ANALISI DELLA VARIANZA MULTIVARIATA
Analisi della varianza Multivariata (MANOVA) in
SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Multivariato”.
4. Selezionare le variabili dipendenti, i fattori between e le eventuali covariate in modo appropriato.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Per capire se un nuovo approccio didattico nell’insegnamento del clarinetto è efficace, si vogliono confrontare due gruppi di alunni delle scuole elementari:
- Gruppo Sperimentale (alunni che hanno seguito le lezioni con il metodo innovativo);
- Gruppo di Controllo (alunni che hanno seguito le lezioni con il metodo tradizionale).
I dati raccolti riguardano le perfomance degli alunni valutate sui seguenti 6 aspetti: interpretazione, tono, ritmo, intonazione, tempo, articolazione. (Ambrose, 1985)
Nota: i dati sono contenuti nel file “clarinetto.sav”
ESEMPIO PRATICO (III)
Analisi della varianza Multivariata (MANOVA) in
SPSS
Per valutare l’efficacia del nuovo approccio si adotterà un modello di analisi della varianza multivariata (MANOVA) con:
• sei variabili dipendenti : Interpretazione, Tono, Ritmo, Intonazione, Tempo, Articolazione;
• un fattore tra soggetti a 2 livelli : Gruppo (Sperimentale vs. Controllo).
IL MODELLO DI ANALISI
Analisi della varianza Multivariata (MANOVA) in
SPSS
ANALISI DESCRITTIVA DEI DATI
Analisi della varianza Multivariata (MANOVA) in
SPSS
Confronto tra il Gruppo Sperimentale e il Gruppo di Controllo
0.00
0.50
1.00
1.50
2.00
2.50
3.00
3.50
4.00
interpretazione tono ritmo intonazione tempo articolazio ne
aspetti valutati
med
ia d
ei p
unte
ggi
sperimentale
controllo
RISULTATI DELLA MANOVA
Analisi della varianza Multivariata (MANOVA) in
SPSS
Test multivariatib
.991 278.492a 6.000 16.000 .000
.009 278.492a 6.000 16.000 .000
104.434 278.492a 6.000 16.000 .000
104.434 278.492a 6.000 16.000 .000
.584 3.749a 6.000 16.000 .016
.416 3.749a 6.000 16.000 .0161.406 3.749a 6.000 16.000 .0161.406 3.749a 6.000 16.000 .016
Traccia di Pillai
Lambda di Wilks
Traccia di Hotelling
Radice di Roy
Traccia di Pillai
Lambda di Wilks
Traccia di Hotelling
Radice di Roy
EffettoIntercetta
gruppo
Valore F Ipotesi df
Gradi dilibertà
dell'errore Sig.
Statistica esattaa.
Disegno: Intercept+gruppob.
Il fattore gruppo
ha un effetto
significativo
Il Gruppo Sperimentale differisce significativamente dal Gruppo di Controllo sui 6 aspetti valutati (F6,16= 3.749 ; p<0.05).
Si può quindi concludere che il nuovo approccio didattico è efficace.
CONCLUSIONI
Analisi della varianza Multivariata (MANOVA) in
SPSS
Analisi della varianza a misure ripetute
Il caso più semplice di analisi della varianza a misure ripetute è il t-test per dati appaiati . In quel caso i soggetti vengono misurati due volte, ad esempio prima e dopo un trattamento, e si vuole verificare l’effetto del trattamento (fattore within ).
L’analisi della varianza a misure ripetute può essere vista come un’estensione del test-t per dati appaiati nei casi in cui:
- il fattore within ha più di due livelli ;
- esiste più di un fattore within .
L’OBIETTIVO DELL’ANALISI DELLA VARIANZA A MISURE RI PETUTE
Analisi della varianza a misure ripetute
Valutazione dell’effetto del tempo .
Esempio: valutare se esistono variazioni dell’umore materno nel primo anno post-gravidanza.
Valutazione dell’effetto di più trattamenti .
Esempio: Valutare come incidono la lunghezza e la tipologia di un testo sulla comprensione.
ESEMPI DI APPLICAZIONE DELL’AOV A MISURE RIPETUTE
Analisi della varianza a misure ripetute
Controllo della variabilità entro soggetto
Le differenze tra Gruppo Sperimentale e Gruppo di controllo possono dipendere sia dall’effetto del trattamento sia dalla diversa composizione dei due gruppi. In un disegno a misure ripetute invece i soggetti fungono da “controllo di se stessi ” .
Minor numerosità campionaria richiesta rispetto all ’analisi della varianza between .
Se in un disegno di analisi della varianza between per valutare l’effetto di 3 diversi trattamenti sono richiesti 45 soggetti (15 per trattamento), in un disegno a misure ripetute ne bastano 15 !
Nota: non sempre si può utilizzare un disegno a misure ripetute (ad. esempio: valutazione dell’effetto genere)
I VANTAGGI DELL’AOV A MISURE RIPETUTE
Analisi della varianza a misure ripetute
• Le osservazioni sono indipendenti.
• Le osservazioni seguono una distribuzione normale multivariata sui livelli del fattore entro soggetti.
• Le osservazioni soddisfano l’ipotesi di sfericità.
Nota: Le prime due assunzioni sono richieste anche per l’analisi della varianza multivariata (MANOVA), mentre l’ipotesi di sfericità non lo è.
ASSUNZIONI NELL’ANALISI DELLA VARIANZA A MISURE RIP ETUTE
Analisi della varianza a misure ripetute
• L’ipotesi di sfericità implica che la matrice di covarianza sulle misure ripetute rispetti una forma particolare (varianze e covarianze pressoché costanti).
• In poche parole, l’idea è che le varianze delle differenze tra le misure ripetute devono essere pressoché uguali.
CHE COSA IMPLICA L’IPOTESI DI SFERICITA’?
Analisi della varianza a misure ripetute
Esempio: Si supponga di voler valutare la variazione di peso nel tempo in bambini neonati. Il peso dei neonati viene misurato ogni giorno per un periodo critico di 3 giorni.
Il modello da adattare potrebbe essere quello di un’AOV a misure ripetute con v.d. il peso dei bambini e fattore entro soggetti il tempo (3 livelli pari ai 3 giorni).
Osservando i dati si nota che:
- in media i bambini sono aumentati di 100 grammi tra il giorno 1 e 2 e di 150 grammi tra il giorno 2 e 3.
- la varianza degli aumenti tra il giorno 1 e 2 è di 20, mentre quella tra il giorno 2 e 3 è di 100.
In questo caso l’ipotesi di sfericità che presuppone che la varianza degli aumenti tra i giorni 1 e 2 e quella tra i giorni 2 e 3 ( e anche quella tra 1 e 3) siano uguali non è soddisfatta .
Il modello di AOV a misure ripetute potrebbe produrre una stima distorta della significatività dell’effetto del tempo.
CHE COSA IMPLICA L’IPOTESI DI SFERICITA’?
Analisi della varianza a misure ripetute
VALUTAZIONE DELL’IPOTESI DI SFERICITA’
Per valutare se i dati soddisfano l’ipotesi di sfericità si può utilizzare il test di Mauchly
Il test di Mauchly è significativo (p<0.05) ?
I dati non soddisfano l’ipotesi di sfericità.Per ottenere una stima non distorta deglieffetti si deve ricorrere a dei criteri dicorrezione (ad es. Greenhouse-Geisser)
I dati soddisfano l’assunzione di sfercità.La stima degli effetti non è distorta.
SìNo
Analisi della varianza a misure ripetute in SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Misure Ripetute”.
4. Nella finestra “Definisci Fattori” inserire i nomi dei fattori within ed il rispettivo numero di livelli. Cliccare “Definisci”.
5. Inserire le variabili within in modo appropriato rispetto le definizioni dei fattori fatte al punto 4.
6. Cliccare OK!
Si supponga di voler studiare l’effetto di 4 diversi tipi di vino sui tempi di reazione ad una particolare prova di abilità.
Nella conduzione dell’esperimento un tempo sufficiente viene fatto trascorrere tra una prova e l’altra, in modo da minimizzare gli effetti della “somministrazione” di un tipo di vino sui tempi di reazione legati alla “successiva somministrazione” (Winer, 1971).
Nota: i dati sono contenuti nel file “vini.sav”
ESEMPIO PRATICO (IV)
Analisi della varianza a misure ripetute in SPSS
Per valutare se il tipo di vino ha un effetto sui tempi di reazione dei soggetti si adotterà un modello di analisi della varianza a misure ripetute con:
- variabile dipendente : il Tempo di Reazione dei soggetti;
- un fattore entro-soggetti a 4 livelli : Tipo di Vino (Chianti, Merlot, Prosecco, Zibibbo).
IL MODELLO DI ANLISI
Analisi della varianza a misure ripetute in SPSS
ANALISI DESCRITTIVA DEI DATI
Analisi della varianza a misure ripetute in SPSS
Confronto dei tempi di reazione medi ottenuti per t ipo di vino
0
5
10
15
20
25
30
35
40
45
chianti merlot prosecco zibibbo
tipo di vino
med
ia d
ei te
mpi
di r
eazi
one
CONTROLLO DELL’IPOTESI DI SFERICITA’
Analisi della varianza a misure ripetute in SPSS
Test di sfericità di Mauchly b
Misura: MEASURE_1
.186 4.572 5 .495 .605 1.000 .333Effetto entro soggettitipo_v
W di Mauchly
Approssimazione
chi-quadrato df Sig.Greenhouse-Geisser Huynh-Feldt
Limiteinferiore
Epsilon a
Verifica l'ipotesi nulla per la quale la matrice di covarianza dell'errore della variabile dipendente trasformata ortonormalizzataè proporzionale a una matrice identità.
È possibile utilizzarlo per regolare i gradi di libertà per i test di significatività mediati. I test corretti vengonovisualizzati nella tabella dei test sugli effetti entro soggetti.
a.
Disegno: Intercept Disegno entro soggetti: tipo_v
b.
L’ipotesi di sfericità è soddisfatta.
RISULTATI DELL’ANALISI DELLA VARIANZA A MISURE RIPE TUTE
Analisi della varianza a misure ripetute in SPSS
Test degli effetti entro soggetti
Misura: MEASURE_1
698.200 3 232.733 24.759 .000698.200 1.815 384.763 24.759 .001
698.200 3.000 232.733 24.759 .000
698.200 1.000 698.200 24.759 .008
112.800 12 9.400
112.800 7.258 15.540
112.800 12.000 9.400
112.800 4.000 28.200
Assumendo la sfericità
Greenhouse-Geisser
Huynh-Feldt
Limite inferiore
Assumendo la sfericità
Greenhouse-Geisser
Huynh-Feldt
Limite inferiore
Sorgentetipo_v
Errore(tipo_v)
Somma deiquadratiTipo III df
Media deiquadrati F Sig.
Il fattore within Tipo di Vino ha un effetto statisticamente significativo.
Il fattore Tipo di Vino ha un effetto statisticamente significativo sui tempi di reazione dei soggetti (F3,12= 24.759 ; p<0.05).
Si può quindi concludere che a seconda del tipo di vino somministrato i tempi di reazione dei soggetti variano.
CONCLUSIONI
Analisi della varianza a misure ripetute in SPSS
Analisi della varianza con
Disegno Misto
Un modello analisi della varianza con disegno misto è un modello che comprende sia fattori between che fattori within .
COSA SI INTENDE PER “ANALISI DELLA VARIANZA CON DISE GNO MISTO?”
Analisi della varianza con
Disegno Misto
Si supponga di voler misurare l’effetto di tre diversi trattamenti somministrati ad un campione comprendente maschi e femmine.
La situazione può essere così rappresentata:
ESEMPIO DI UN PROBLEMA RISOLVIBILE ATTRAVERSO UN AO V CON DISEGNO MISTO
TRATTAMENTI
A B C
MaschiFemmine
Analisi della varianza con
Disegno Misto
Esiste un effetto trattamento?
Complessivamente i soggetti rispondono in maniera diversa a seconda del trattamento?
Esiste un effetto genere?
Complessivamente i maschi rispondono in maniera diversa rispetto alle femmine?
Esistono dei legami tra il tipo di trattamento e il genere dei soggetti?
Le differenze tra i maschi e le femmine sono costanti o variano a seconda del tipo di trattamento?
LE DOMANDE DI RICERCA
Effetto principale
del fattore within
Effetto principale
del fattore
between
Interazione tra
fattore within e
between
Analisi della varianza con
Disegno Misto
Il modello da adattare ai dati sarà un modello di analisi della varianza a disegno misto 3×2 con:
• variabile dipendente : le risposte dei soggetti
• un fattore within a 3 livelli : trattamento (A, B, C)
• un fattore between a 2 livelli : sesso (Maschi vs. Femmine)
IL MODELLO DI ANALISI
Analisi della varianza con Disegno Misto in SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Misure Ripetute”.
4. Nella finestra “Definisci Fattori” inserire i nomi dei fattori within ed il rispettivo numero di livelli. Cliccare “Definisci”.
5. Inserire le variabili within in modo appropriato rispetto le definizioni dei fattori fatte al punto 4.
6. Selezionare i fattori between e le eventuali covariate.
7. Cliccare OK!
A due gruppi, uno sottoposto a una condizione stressante (gruppo sperimentale ) ed uno sottoposto ad una condizione neutra (gruppo di controllo ), vengono letti tre brani di crescente difficoltà.
Dopo la lettura di ciascun brano vengono poste ai soggetti 10 domande di comprensione del testo e viene rilevato il numero di risposte corrette .
Si vogliono studiare i seguenti aspetti:
• la difficoltà dei brani ha un effetto sul numero di risposte corrette?
• il gruppo sottoposto ad una condizione di stress risponde complessivamente in maniera diversa rispetto al gruppo di controllo?
• esiste un’interazione tra la difficoltà dei brani ed il livello di stress (le differenze tra i due gruppi sono costanti per i tre livelli di difficoltà dei brani)?
Nota: i dati sono contenuti nel file “stress.sav”
ESEMPIO PRATICO (V)
Analisi della varianza con Disegno Misto in SPSS
Il modello da applicare sarà un modello di analisi della varianza a disegno misto 3×2 con:
• variabile dipendente : il numero di risposte corrette
• un fattore within a 3 livelli : difficoltà del brano (1,2,3)
• un fattore between a 2 livelli : gruppo (sperimentale vs. controllo)
IL MODELLO DI ANLISI
Analisi della varianza con Disegno Misto in SPSS
CONTROLLO DELL’IPOTESI DI SFERICITA’
Analisi della varianza con Disegno Misto in SPSS
Test di sfericità di Mauchly b
Misura: MEASURE_1
.673 6.733 2 .035Effetto entro soggettidifficol
W di Mauchly
Approssimazione
chi-quadrato df Sig. La sfericità non è soddisfatta. Bisognerà adottare un criterio correttivo.
RISULTATI DELL’ANALISI DELLA VARIANZA CON DISEGNO M ISTO
Analisi della varianza con Disegno Misto in SPSS
Effettosiginificativo delfattore within.
Effettosiginificativodell’interazionetra il fattore withine quello between
RISULTATI DELL’ANALISI DELLA VARIANZA CON DISEGNO M ISTO
Analisi della varianza con Disegno Misto in SPSS
Effetto significativo del fattore between.
INTERPRETAZIONE GRAFICA DEI RISULTATI
Analisi della varianza con Disegno Misto in SPSS
L’analisi condotta ha messo in evidenza i seguenti aspetti:
• emerge un effetto significativo del fattore within “difficoltà” (F1.507,27.129=20.028 ; p<0.05);
• emerge un effetto significativo del fattore between “gruppo” (F1.507,27.129=5.861 ; p<0.05);
• emerge un effetto significativo dell’interazione tra il fattore within e il fattore within (F1,18=9.227 ; p<0.05).
Si può quindi concludere che:
• la difficoltà del brano influenza il numero di risposte corrette;
• i due gruppi differiscono sulla base del numero di riposte corrette;
• le differenze tra i due gruppi non sono costanti per i tre livelli di difficoltà dei brani; in particolare si può notare che nella condizione “alta difficoltà” dei brani, la differenza tra i due gruppi è molto maggiore rispetto a quelle che si registrano nelle condizioni “media e bassa difficoltà”.
CONCLUSIONI
Analisi della varianza con Disegno Misto in SPSS
Se le assunzioni per l’analisi della varianza non sono soddisfatte, cioè ad esempio:
• la variabile dipendente non è quantitativa ma è su scala ordinale;
• la variabile dipendente non è distribuita normalmente;
• la numerosità campionaria è ridotta.
E’ POSSIBILE ADOTTARE UN APPROCCIO NON PARAMETRICO
COSA FARE QUANDO LE ASSUNZIONI PER L’ANALISI DELLA VARIANZA NON SONO SODDISFATTE?
Analisi della varianza
Le tecniche non-parametriche, che si basano sui ranghi e non sui valori originali come le tecniche parametriche, presentano i seguenti principali vantaggi:
� sono “distribution-free”, cioè indipendenti dalla distribuzione campionaria della variabile dipendente;
� sono particolarmente indicate nei casi di ridotta numerosità campionaria.
I vantaggi dell’approccio Non-parametrico
Alternative Non-parametriche all’analisi della varianza con fattore
between
NUMERO DI LIVELLI DEL
FATTORE BETWEEN
ANALISIPARAMETRICA
ANALISINON-
PARAMETRICA
duetest t per campioni
indipendenti
testdi Mann-Whitney
due o più di due
analisi della varianza ad un fattore between
testdi Kruskal-Wallis
Alternative Non-parametriche all’analisi della varianza a misure
ripetute con fattore within
NUMERO DI LIVELLI DEL
FATTORE WITHIN
ANALISIPARAMETRICA
ANALISINON-
PARAMETRICA
duetest t per campioni appaiati
testdi Wilcoxon
due o più di due
analisi della varianza a
misure ripetute
testdi Friedman
Alternative Non-parametriche all’analisi della varianza a misure ripetute con fattore within
(variabile dipendente dicotomica)
NUMERO DI LIVELLI DEL
FATTORE WITHIN
ANALISIPARAMETRICA
ANALISINON-
PARAMETRICA
due -test
di McNemar
due o più di due
-test
di Cochran
L’approccio Non-parametrico in SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Test non parametrici”.
3. Selezionare l’opzione che si intende utilizzare.
4. Selezionare le variabili di interesse in modo appropriato.
5. Cliccare OK!
“Mi conviene usare le tecniche parametriche o quelle non
parametriche?”
Quando le assunzioni per l’analisi della varianza sono soddisfatte, l’approccio parametrico è più “potente” (migliore) di quello non-parametrico.
Nel caso in cui le assunzioni per l’analisi della varianza sono dubbie, è conveniente utilizzare sia l’approccio parametrico che quello non-parametrico e confrontare i risultati.
Per approfondimenti
Per approfondire le tecniche di Analisi della Varianza si consigliano i seguenti testi:
“Using Multivariate Statistics” (5th edition) – Barbar a G. Tabachnick & Linda S. Fidell, 2007 – Pearson Education
“Applied Multivariate Statistics For The Social Scie nces, Fourth Edition” – James P. Stevens, 2002 – LEA, Publishers