26
L’analyse de variance L’analyse de variance

Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Embed Size (px)

Citation preview

Page 1: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

L’analyse de varianceL’analyse de variance

Page 2: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

L’analyse de varianceL’analyse de variance

L’analyse de variance: ANOVA (ANalysis Of L’analyse de variance: ANOVA (ANalysis Of VAriance)VAriance)

Utilité: tester 2 ou plusieurs hypothèses sur des Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantespopulation indépendantes

Page 3: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

ExempleExemple

Acrophobie: Acrophobie: groupe 1: contrôlegroupe 1: contrôlegroupe 2: behavioralgroupe 2: behavioralgroupe 3: rogériengroupe 3: rogérien

0 1 2 3

1 1 2 3

:

:

H

H

Hypothèses: (Les hypothèses directionnelles ne font Hypothèses: (Les hypothèses directionnelles ne font pas de sens lorsqu’il y a plus de deux groupes)pas de sens lorsqu’il y a plus de deux groupes)

Page 4: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Tests Tests tt

Pourquoi ne pas faire 3 tests Pourquoi ne pas faire 3 tests tt ? ?

0 1 2

0 1 3

0 2 3

:

:

:

H

H

H

Comme les Comme les teststests ne sont pas indépendants les uns des autres, ne sont pas indépendants les uns des autres, cela augmente l’erreur commune (familywise error)cela augmente l’erreur commune (familywise error)

Probabilité=(1-)c

Probabilité=(1-)3=0.14

Donc, si on fait trois comparaisons l’erreur de type I sera de 14%.

Page 5: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

LogiqueLogiqueEst-ce que les différences entre les moyennes est la conséquence Est-ce que les différences entre les moyennes est la conséquence

d’un effet de traitement? Ou est-ce uniquement de l’erreur ?d’un effet de traitement? Ou est-ce uniquement de l’erreur ?

2

Contrôle Behavioral Rogérien

5 1 3

6 2 3

8 3 4

6.33 2 3.33

1.53 1 0.57

2.34 1 0.33

x

s

s

Page 6: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

LogiqueLogiquePour répondre à la question:

- Variabilité à l’intérieur des groupes (erreur d’échantillonnage) « within error »

- Variabilité entre les groupes (erreur d’échantillonnage + effet de traitement ?) « between error »

Si la variabilité intergroupe est largement supérieur a variabilité intragroupe, alors nous aurons un indice de l’effet de traitement.

2

2

2

2

variabilité de l'erreur

variabilité de l'erreur + effet de traitement

intra

inter

interobs

intra

s

s

sF

s

Page 7: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

LogiqueLogiqueDegrés de liberté:

Il y a deux degrés de liberté

1- dlinter = nombre de groupes -1 = k-1

2- dlintra = nombre de participants -1 = n-k

Hypothèses:

0 1 2

1 1 2

: ...

: ... (pour au moins un groupe)k

k

H

H

Page 8: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

LogiqueLogiquePostulats de base:1- Indépendance

2- Normalité

3- Homogénéité des variances

2

2

max( )0.5 2

min( )i

i

s

s

Page 9: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

CalculCalculVariabilité totale = variabilité inter + variabilité intra

le groupe

la grande moyenne

la moyenne d'un groupe

le participant

G

i

i

x

x

p =

Les sommes des carrés

2

1 1

2

1 1

2

1

( )

( )

( )

k n

Total pi Gi p

k n

intra pi ii p

k

inter i i Gi

SC x x

SC x x

SC n x x

Total intra interSC SC SC

Page 10: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

CalculCalcul

Les degrés de liberté

1

1

total

intra

inter

dl n

dl n k

dl k

total intra interdl dl dl

Les carrés moyens

2

2

( )

( )

intraintra intra

intra

interinter inter

inter

SCCM s

dl

SCCM s

dl

F

intra

inter

CMF

CM

Page 11: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Table d’ANOVATable d’ANOVA

2

2 1

1

2

1 12

1 1

2

1 1

Source de variation

( )( ) 1

1

( )

( ) ( )

( ) 1

k

i i Gki Inter

i i Gi Intra

k n

pi ik ni p

pi ii p

k n

pi Gi p

SC dl CM F

n x xCM

Inter n x x kk CM

x x

Intra erreur x x n kn k

Total x x n

Page 12: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

ExempleExemple

2

Contrôle Behavioral Rogérien

5 1 3

6 2 3

8 3 4

6.33 2 3.33

1.53 1 0.57

2.34 1 0.33

x

s

s

(5 6 8 1 2 3 3 3 4) / 9 3.889Gx

Page 13: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

ExempleExemple

32 2

1 1

2 2 2

( ) ( )

3(6.33 3.889) 3(2.00 3.889) 3(3.33 3.889)

17.88 10.70 0.94 29.52

k

inter i i G i i Gi i

inter

inter

SC n x x n x x

SC

SC

3 32

1 1

2 2 2

2 2 2

2 2 2

( )

(5 6.33) (6 6.33) (8 6.33)

(1 2) (2 2) (3 2)

(3 3.33) (3 3.33) (4 6.33)

4.67 2 0.67 7.34

intra pi ii p

intra

intra

SC x x

SC

SC

3 3

2 2

1 1 1 1

2 2 2

2 2 2

2 2 2

( ) ( )

(5 3.889) (6 3.889) (8 3.889)

(1 3.889) (2 3.889) (3 3.889)

(3 3.889) (3 3.889) (4 3.889)

22.59 12.71 1.59 36.89

k n

total pi G pi Gi p i p

total

total

SC x x x x

SC

SC

Les sommes des carrés

7.34 29.52 36.86Total intra interSC SC SC

Page 14: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

ExempleExemple

Les degrés de liberté

1 9 1 8

9 3 6

1 3 1 2

total

intra

inter

dl n

dl n k

dl k

6 2 8total intra interdl dl dl

Les carrés moyens

29.5214.76

2

7.341.22

6

interinter

inter

intraintra

intra

SCCM

dl

SCCM

dl

F

14.7612.1

1.22intra

inter

CMF

CM

Page 15: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Table d’ANOVATable d’ANOVA

( , , ) (0.05,2,6) 5.14crit inter intra critF dl dl F

Puisque le Fobs(2,6)=12.1, p<0.05 nous rejetons l’hypothèse nulle. Par conséquent, il y a au moins une différence significative entre les groupes par rapport au traitement d’acrophobie.

Source de variation

29.52 2 14.76 12.1

( ) 7.34 6 1.22

36.89 8

SC dl CM F

Inter

Intra erreur

Total

Page 16: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Mesure de la force d’associationMesure de la force d’association

2 ( 1) 29.52 (3 1)1.22 27.080.71

36.89 1.22 38.11inter intra

total intra

SC k CM

SC CM

Idée: Semblable au r2ajusté

Proportion de la variation totale des données qui peuvent être expliquée par les niveaux des variables indépendantes.

Quelle quantité de la variance peut être expliqué par les différences dans les groupes de traitements?

Donc, 71% de la variance de la variable dépendante (peur des hauteurs) est déterminé par les différences dans les traitements thérapeutique (contrôle, behav. et rogér.)

Page 17: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

PuissancePuissance Mesure de la force Mesure de la force

d’associationd’association2

Page 18: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Comparaisons post hocsComparaisons post hocs

Page 19: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Test de SchefféTest de SchefféC’est bien beau savoir qu’il y a une différence significative globale, mais ce que l’on veut savoir c’est quels sont les groupes qui se distinguent des uns et des autres ?

Planification des hypothèses alternatives

1

2

3

:

:

:

C B

C R

B R

H

H

H

4 :2

B CCH

De plus

Page 20: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Test de SchefféTest de SchefféUtilisation des contrastes

1 : C BH

Exemple

1 1 2 2

1

ˆ ...

les "w" peuvent prendre n'importe quelle valeur en autant que

0

k k

k

ii

c w x w x w x

w

1

2

3

1

1

0

0

w

w

w

ˆ (1)6.33 ( 1)2.00 (0)3.33

ˆ 4.33

c

c

Page 21: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Test de SchefféTest de SchefféStatistique utilisée

2 2 222 21 2

1 2

ˆ 4.334.8

(1) ( 1) (0)1.22...

3 3 3

obs

kintra

k

ct

ww wCM

n n n

' 1 ( , , ) 3 1 5.14 3.21crit crit inter intrat k F dl dl

Puisque le tobs>t’crit, on rejette l’hypothèse nulle et nous concluons que le groupe contrôle est significativement (= 0.05) plus élevé que le groupe ayant suivi une thérapie behavioriste.

Page 22: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Test de TukeyTest de TukeyHSD (honestly significant difference)

Planification des hypothèses alternatives

0

1

: 0

: 0

où = , i j ij

H c

H c

c

( , , ) intraintra

CMHSD q dl k

n

Attention, n = nombre de sujet dans un groupe (n1~ n2~ …~ nk)

Si les le nombre de sujet diffère trop, il faut faire la moyenne harmonique

Page 23: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Test de TukeyTest de Tukey

Supposons que vous faites une balade à vélo : vous commencez par escalader une côte de 1km à 20km/h, puis vous redescendez cette même côte à 30km/h. Quelle est votre vitesse moyenne???

Vous avez répondu 25?? Faux!!!

Pour monter : 1km à 20km/h cela me prendra 3 minutes pour gravir la côte.

Pour descendre : 1km à 30km/h cela me prendra 2 minutes pour gravir la côte.

Pour calculer la vitesse moyenne il faut tenir compte du temps.

Distance totale=2 km, par conséquent la vitesse moyenne = 2/t.

Or, le temps total (t) = t1+t2, où t1=1/v1 et t2=1/v2

Donc si on remplace,

vitesse moyenne = 2/(1/v1+1/v2)

vitesse moyenne = 2/(1/20+1/30)=2/5 /60=120/5=24km/h

Moyenne harmonique

Page 24: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Test de TukeyTest de Tukey

Exemple: n1= 4; n2=6 et n3=6

1

3 3 365.143

1 1 1 71 74 6 6 12

4 6 6 165.3333

3 3

H k

i i

kx

n

x

Moyenne harmonique

1

1H k

i i

kx

n

Page 25: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Test de TukeyTest de TukeyTable des différences

1 2

1 1 2 1

2 2

... k

k

k

k

x x x

x x x x x

x x x

x

0Si , on rejette i jx x HSD H

Page 26: Lanalyse de variance. Lanalyse de variance: ANOVA (ANalysis Of VAriance) Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantes

Test de TukeyTest de TukeyExemple

2.00 3.33 6.33

2.00 1.33 4.33

3.33 3.00

6.33

B R C

B

R

C

x x x

x

x

x

0.05

1.22

6

3

3

inter

inter

CM

dl

k

n

(0.05,6,3) 4.34

1.22( , , ) 4.34 2.78

3intra

intra

q

CMHSD q dl k

n

****

* * pp<0.05<0.05