INF L14INF L14Initiation aux statistiquesInitiation aux statistiques
6 – Variabilité
En Technicolor
IntroductionIntroduction Problème :Problème :
moyenne identiquemoyenne identique étalement différent étalement différent
des donnéesdes données Nécessité de mesurer Nécessité de mesurer
la la variabilitévariabilité, ou , ou dispersion dispersion des des donnéesdonnées
EtendueEtendue Max - MinMax - Min
Etendue = 17 –3 = 14
Prénoms étudiants
EtendueEtendue
Mesure fragileMesure fragile
Sans Thérèse-Charlotte, étendue = 15 – 3 = 12...
VarianceVariance VarianceVariance : :
Moyenne des carrés des Moyenne des carrés des écarts à la moyenneécarts à la moyenne
X X-M (X-M)2
1 -5,3 28,2
3 -3,3 10,9
3 -3,3 10,9
4 -2,3 5,3
5 -1,3 1,7
5 -1,3 1,7
6 -0,3 0,1
7 0,7 0,5
8 1,7 2,9
9 2,7 7,2
10 3,7 13,6
10 3,7 13,6
11 4,7 22,0
Moyenne 0,0 9,1
N
x
22 )(
Analogie mécaniqueAnalogie mécanique
Moyenne Moyenne centre de gravité centre de gravité Variance Variance moment d’inertie moment d’inertie
TableurTableur
ExempleExemple
SIMPLES COMPOSES
6,8 11,4
2 2,3 3,4
Prénoms simples Prénoms composés
ProblèmeProblème
La variance n’est pas dans ma même La variance n’est pas dans ma même unité que les donnéesunité que les données m m m m22
kg kg kg kg22
nb caractères nb caractères (nb caractères) (nb caractères)22
parfois difficile à
comprendre...
Ecart typeEcart type Ecart-typeEcart-type : :
racine carrée de la varianceracine carrée de la variance même unité que les donnéesmême unité que les données
m m m m2 2 m m kg kg kg kg2 2 kg kg nb caractères nb caractères (nb caractères) (nb caractères)2 2 nb caractères nb caractères
Formule :Formule :
N
x
2)(
ExempleExemple
X X-M (X-M)2
1 -5,3 28,2
3 -3,3 10,9
3 -3,3 10,9
4 -2,3 5,3
5 -1,3 1,7
5 -1,3 1,7
6 -0,3 0,1
7 0,7 0,5
8 1,7 2,9
9 2,7 7,2
10 3,7 13,6
10 3,7 13,6
11 4,7 22,0
Moyenne 0,0 9,14 3,02
variance écart-type
TableurTableur
Exemple (2)Exemple (2)
SIMPLES COMPOSES
6,8 11,4
1,5 1,8
on peut visualiser l’écart-type, car il s’agit de la même échelle
Coefficient de variationCoefficient de variation
Problème de comparaison...Problème de comparaison... DanseusesDanseuses
écart-type de 5,2 kgécart-type de 5,2 kg SumosSumos
écart-type de 10,8 kécart-type de 10,8 k
Y a-t-il une variabilité plus grande Y a-t-il une variabilité plus grande chez les sumos?chez les sumos? Pas nécessairement, car la moyenne est Pas nécessairement, car la moyenne est
plus élevée !plus élevée !
Coefficient de variationCoefficient de variation
Coefficient de variationCoefficient de variation expression de l’écart-type en expression de l’écart-type en
pourcentage de la moyennepourcentage de la moyenne
CV
Exemple (1)Exemple (1)
Danseuses Sumos
58,0 206,6
48,9 213,7
50,2 210,7
44,1 218,6
41,2 199,2
49,9 200,1
59,3 187,9
51,3 183,4
55,8 201,7
47,6 187,1
Moyenne 50,6 200,9
Ecart-type 5,2 10,8
Coeff. var. 10,3% 5,4%
Le poids des sumos varie moins que celui des
danseuses !
Exemple (2)Exemple (2) Fréquence des Fréquence des
lettreslettres 853 pages web853 pages web
CV
E 9,6% 2,3% 24,4%
Z 0,1% 0,1% 109,7%
La variabilité de Z est bien plus forte que celle
de E
ProblèmeProblème
La variance et l’écart-type sont très La variance et l’écart-type sont très sensibles aux valeurs extrêmessensibles aux valeurs extrêmes même problème que la moyennemême problème que la moyenne attention en linguistique (distributions attention en linguistique (distributions
très asymétriques)très asymétriques)
ExempleExemple
Danseuses A Danseuses B
58,0 58,0
48,9 48,9
50,2 50,2
44,1 44,1
41,2 41,2
49,9 49,9
59,3 59,3
51,3 51,3
55,8 55,8
47,6 235
Moyenne 50,6 69,4
Ecart-type 5,2 52,9
Coeff. var. 10,3% 76,3%
L’écart-type est multiplié par 10
!
Termes à retenirTermes à retenir
Variabilité (ou dispersion) Etendue Variance Ecart-type Coefficient de variation