25
ANALYSE DE VARIANCE B.P alagos UM R ITA P Cem agref [email protected] ANALYSE DE VARIANCE M2 Sciences des Procédés - Sciences des Aliments

ANALYSE DE VARIANCE

  • Upload
    kris

  • View
    42

  • Download
    4

Embed Size (px)

DESCRIPTION

ANALYSE DE VARIANCE. M2 Sciences des Procédés - Sciences des Aliments. ANALYSE DE VARIANCE. Exemple. - PowerPoint PPT Presentation

Citation preview

Page 1: ANALYSE DE VARIANCE

ANALYSE DE VARIANCE

B. PalagosUMR ITAPCemagref

[email protected]

ANALYSE DE VARIANCE

M2 Sciences des Procédés - Sciences des Aliments 

Page 2: ANALYSE DE VARIANCE

2

ANALYSE DE VARIANCE

Forêt 1 Forêt 2 Forêt 3

23.424.424.624.9

25.026.2

18.921.121.122.122.523.524.5

22.522.923.724.024.0

Des forestiers ont réalisé des plantations d’arbres en 3 endroits. Plusieurs années plus tard ils souhaitent savoir si la hauteur des arbres est identique dans les trois forêts. Dans chaque forêt on tire un échantillon d’arbre et on mesure la hauteur de chaque arbre.

ANALYSE DE VARIANCE

Exemple

L’analyse de variance (ANOVA) consiste à chercher si la variabilité des observations peut être en partie expliquée par les différences entre variantes d’un facteur (ici fôret)

Page 3: ANALYSE DE VARIANCE

3

ANALYSE DE VARIANCE

OBJECTIF DE l’ANOVA

Analyser des données qui dépendent de plusieurs types d’effets agissant simultanément, afin de quantifier ces effets

= expliquer une variable quantitative par une ou des variables qualitatives (facteurs)

En amont de l’ANOVA : plan expérimental (nombre d’expériences pour chaque niveau ou modalité, facteurs)

Page 4: ANALYSE DE VARIANCE

4

ANALYSE DE VARIANCE

Analyse de la variance à 1 facteur

Page 5: ANALYSE DE VARIANCE

5

ANALYSE DE VARIANCE

Etude sur l’appréciation sensorielle de la texture de 3 viandes. Seul le caractère fibreux est considéré, noté sur une échelle de 15 points. 15 dégustateurs différents ont noté chacun une viande

13

11

7

11

8

10

8

5

7

5

3

5

6

3

3

CBA

viande

41 y 72 y 103 y

7y

notes pour le caractère fibreux

Exemple

Page 6: ANALYSE DE VARIANCE

6

ANALYSE DE VARIANCE

Modèle de l’analyse de la variance à 1 facteur :

ijiijy

ijy est la variable à expliquer ………………

est l’effet du ième niveau du facteur ….....

est l’effet moyen général ……………….

est la variable aléatoire résiduelle ………

Exemple de la viande :

texture fibreuse d’une viande

caractère fibreux de la viande i

caractère fibreux potentiel

due à l’ensemble des autres causes qui déterminent la note fibreuse

i

ij

Hypothèses :

- les sont indépendants

-

-

- suit une loi

ij

0)( ijE 2)var( ij

ij ),0( 2N

Page 7: ANALYSE DE VARIANCE

7

ANALYSE DE VARIANCE

Décomposition de l’élément :ijy

)()( iijiij yyyyyy

Exemple de la viande :

3 10 13

5 8 11

6 5 7

3 7 11

3 5 8

Y

=

7 7 7

7 7 7

7 7 7

7 7 7

7 7 7

M

+

-3 0 3

-3 0 3

-3 0 3

-3 0 3

-3 0 3

B

+

-1 3 3

1 1 1

2 -2 -3

-1 0 1

-1 -2 -2

W

données globales =

moyenne générale

+ +écartsinter-colonnes

écartsintra-colonnes

Page 8: ANALYSE DE VARIANCE

8

ANALYSE DE VARIANCE

En élevant au carré et en sommant, pour toutes les observations :222 )()()(

i jiiji

ii

i jij yyyynyy

Somme des carrés des écarts totaux

Somme des carrés des écarts inter-niveaux

Somme des carrés des écarts intra-niveaux= +

SCETotale = +SCEInter SCEIntra

Exemple de la viande : SCETotale = 140

SCEInter = 90

SCEIntra = 50

Décomposition de la variabilité

Page 9: ANALYSE DE VARIANCE

9

ANALYSE DE VARIANCE

On souhaite tester les hypothèses :

H0 : " Il n’y a pas d’effet produit "càd les moyennes pour les différents produits (niveaux du facteur) sont égales

contre H1 : " Il y a un effet produit "càd deux moyennes au moins sont différentes

Il s’agit donc de comparer la variabilité inter-niveaux à la

variabilité intra-niveaux du facteur

Page 10: ANALYSE DE VARIANCE

10

ANALYSE DE VARIANCE

Source de variation

SCE ddl

Inter-niveaux SCE Inter I-1

Intra-niveaux SCE Intra n-I

Totale SCE Totale n-1

On définit le carré moyen inter-groupes :

et le carré moyen intra-groupes :1I

SCECM inter

inter

In

SCECM intra

intra

I nombre de niveaux

Page 11: ANALYSE DE VARIANCE

11

ANALYSE DE VARIANCE

Pour tester H0 contre H1, on évalue la quantité :intra

inter

CM

CMF

Si l’hypothèse H0 est vraie, la valeur F est faible,sinon, en s’éloignant de cette hypothèse, le rapport F augmente

à partir de quelle valeur observée de F rejette-t-on H0 ?

Si les résidus du modèle de l’analyse de la variance suivent une loi normale, et si H0 est vraie, on sait que F est l’observation d’une variable qui suit la loi de Fisher ayant (I-1) ddl au numérateur et (n-I) ddl au dénominateur : notée F(I-1, n-I)

H0 est rejetée si Fobs > F (I-1, n-I) pour un niveau de significativité donné α, c’est-à-dire si p-value < α (cf. table de Fisher)

Page 12: ANALYSE DE VARIANCE

12

ANALYSE DE VARIANCE

Exemple de la viande :Tableau d’analyse de la variance

Source de variation SCE ddl CM F p-value

Type de viande 90 2 45

10,8 p < 0,01Résiduelle

(intra-produit)50 12 4,17

Totale 140 14

H0 rejetée = il existe un effet type de viande significatif concernant le caractère fibreux

Tables de la loi de Fisher :

pour α = 5 %, Fα,2,12 = 3,88

pour α = 1 %, Fα,2,12 = 6,93

p-value = p(Fα,1, 2 > Fobs)

Page 13: ANALYSE DE VARIANCE

13

ANALYSE DE VARIANCE

Analyse de la variance à 2 facteurs

Page 14: ANALYSE DE VARIANCE

14

ANALYSE DE VARIANCE

viande

juge A B C

1

2

3

4

5

3

5

6

3

3

10

8

5

7

5

13

11

7

11

84.1 x

notes pour le caractère fibreux

7.2 x 10.3 x 7x

7,81. x

82. x

63. x

74. x

3,55. x

Supposons maintenant que 5 juges aient évalué une série de 3

échantillons :

Dispositif complet sans répétition

Page 15: ANALYSE DE VARIANCE

15

ANALYSE DE VARIANCE

Modèle de l’analyse de la variance à 2 facteurs sans interaction :

ijjiijy

ijy est la variable à expliquer ………………

est l’effet du ième niveau du facteur A .....

est l’effet du jème niveau du facteur B ....

est l’effet moyen général ……………….

est la variable aléatoire résiduelle ………

Exemple de la viande :

texture fibreuse d’une viande

caractère fibreux de la viande i

effet lié au juge j

caractère fibreux potentiel

due à l’ensemble des autres causes qui déterminent la note fibreuse

i

ij

Hypothèses :

- les sont indépendants

-

-

- suit une loi

ij

0)( ijE 2)var( ij

ij ),0( 2N

III.2 – Dispositif complet sans répétition

j

Page 16: ANALYSE DE VARIANCE

16

ANALYSE DE VARIANCE

Equation de la décomposition de la variance :2

....2

...2

...2

.. )()()()( i j

jiiji j

jj i

ii j

ij yyyyyyyyyy

SCET = SCEA + SCEB + SCER

III.2 – Dispositif complet sans répétition

soit :

Source de variation

SCE ddl

Effet principal de A SCEA I-1

Effet principal de B SCEB J-1

Résiduelle SCER (I-1)(J-1)

Totale SCET n-1

Page 17: ANALYSE DE VARIANCE

17

ANALYSE DE VARIANCE

Tableau d’analyse de la variance

Source de variation SCE ddl CM F

Type de viande 90,0 2 45,0 13,2

Effet juge 22,7 4 5,7 1,7

Résiduelle 27,3 8 3,4

Totale 140 14

1er test : Fobs = 13,2 >> Fα,2,8 = 4,5 avec α = 5 % H0 rejetée avec un risque de 5 % = il existe un effet produit significatif concernant le caractère fibreux

2ème test : Fobs = 1,7 < Fα,4,8 = 3,8 avec α = 5 % H0 non rejetée = il n’existe pas d’effet juge significatif

On teste chaque facteur

Page 18: ANALYSE DE VARIANCE

18

ANALYSE DE VARIANCE

Comparaison de 3 types de sondes pédologiques pour 2 natures de sol

Type de sol

1 2

Type de sonde

1

43

45

46

53

40

40

40

43

2

41

42

43

44

35

37

40

40

3

42

44

46

48

37

39

40

40

Dispositif complet avec répétitions

Page 19: ANALYSE DE VARIANCE

19

ANALYSE DE VARIANCE

Modèle de l’analyse de la variance à 2 facteurs avec interaction :

ijkijjiijkx )(

ijkx est la variable à expliquer

est l’effet du ième niveau du facteur A

est l’effet du jème niveau du facteur B

est l’interaction des niveaux i et j des 2 facteurs

est l’effet moyen général

est la variable aléatoire résiduelle

i

ijk

Hypothèses :

- les sont indépendants

-

-

- suit une loi

ijk

0)( ijkE 2)var( ijk

ijk ),0( 2N

III.3 – Dispositif complet avec répétitions

j

ij)(

Page 20: ANALYSE DE VARIANCE

20

ANALYSE DE VARIANCE

B3 B1 B2

A2

A1

Effet moyen

PAS D’INTERACTION

D’INTERACTION

B3 B1 B2

A2

A1

Effet moyen

Avec répétition

Page 21: ANALYSE DE VARIANCE

21

ANALYSE DE VARIANCE

Equation de la décomposition de la variance :

SCET = SCEA + SCEB + SCEAB + SCER

i

ijj

ijkki j

jiijj

ji

ii j

ijkk

yyyyyyyyyyyy 2.

2........

2.....

2.....

2... )()(K)(IK)(JK)(

soit :

(I-1)(J-1)SCEABInteraction A x B

J-1SCEBEffet principal de B

n-1SCETTotale

IJK-IJSCERRésiduelle

I-1SCEAEffet principal de A

ddlSCESource de variation

3 tests d’hypothèse

Page 22: ANALYSE DE VARIANCE

22

ANALYSE DE VARIANCE

Tableau d’analyse de la variance

0,7890,241,523,0Sol x sonde

3,92

29,04

F

0,03924,5249,0Type de sonde

< 0,01

p-value

23346,0Totale

6,218112,5Résiduelle

181,51181,5Type de sol

CMddlSCESource de variation

Type de sol

1 2

Type de sonde

1

43

45

46

53

40

40

40

43

2

41

42

43

44

35

37

40

40

3

42

44

46

48

37

39

40

40

Page 23: ANALYSE DE VARIANCE

23

ANALYSE DE VARIANCE

Effets sol et sonde significatifs pour α = 5 %

Effet sol >> effet sonde

Sonde

Réponse

1 2 3

Sol 1

Sol 2

Pas d’effet d’interaction

Page 24: ANALYSE DE VARIANCE

24

ANALYSE DE VARIANCE

Si rejet de l’hypothèse testée : effet du facteur Le rejet signifie: il existe au moins 1 niveau différent des autresLe ou lesquels?Il existe des méthodes complémentaires :

- test LSD (Least Significance Difference) de Fischer (ppds)

- test de Scheffe

- test de Dunnett

- test de Duncan

- …

Tests de comparaisons multiples

Page 25: ANALYSE DE VARIANCE

25

ANALYSE DE VARIANCE

Pour chaque comparaison de 2 moyennes, on calcule une valeur seuil r (range), fonction du carré moyen résiduel de l’ANOVA

Si , alors la différence est déclarée significative, au niveau de signification α

ryy 21

Exemple : test LSD

21,

11

nnCMtr Rddl

ddl de la source de variation résiduelle

Tests de comparaisons multiples