Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Chapitre 3
Variables Quantitatives discrètes
1. Organisation des données
2. Représentation graphique
3. Principaux paramètres de position
4. Principaux paramètres de dispersion
1 Organisation des données
Les valeurs x1, x2, ..., xk d’une variable quantitative discrètesont des nombres entiers.
Exemple :
On a recensé le nombre de pièces des habitations d’une com-mune C et obtenu le tableau de distribution des effectifs sui-vant :
Nombre de pièces xi 1 2 3 4Effectifs ni 500 250 175 75
- population = habitations de la commune
- individu = une habitation.
- effectif total = 500 + 250 + 175 + 75 = 1000.
- variable = nombre de pièces de l’habitation.
- valeurs de la variable : x1 = 1, x2 = 2, x3 = 3, x4 = 4.
Comme pour les variables qualitatives, on peut considérer demanière équivalente le tableau de distribution des proportions :
Tableau de distribution des proportionsNombre de pièces xi 1 2 3 4Pourcentage pi 50% 25% 17,5% 7,5%
Effectif total N = 1000
2 Représentation graphique
Pour représenter une variable quantitative discrète, on peututiliser un graphique appelé diagramme en bâtons.
Le principe de ce graphique consiste à dessiner pour chaquevaleur de la variable un trait de hauteur l’effectif de cette valeurou la proportion de cette valeur.
Tableau de distribution des proportionsNombre de pièces xi 1 2 3 4Pourcentage pi 50% 25% 17,5% 7,5%Effectif total N = 1000
Nombre de pièces
proportion
0,1
0,2
0,3
0,4
0,5
1 2 3 4
effectif total=1000
Répartition du nombre de pièces des habitations de la commune C
Tableau de distribution des effectifs
Nombre de pièces xi 1 2 3 4Effectifs ni 500 250 175 75
Effectifs
100
200
300
400
500
1 2 3 4 Nombre de pièces
Répartition du nombre de pièces des habitations de la commune C
3 Principaux paramètres de position
Principaux paramètres de position ou de tendance centrale :le mode, la moyenne et la médiane.
3.1 Le mode
On appelle mode d’une variable quantitative discrète la ou lesvaleur(s) ayant le plus grand effectif ou la plus grande propor-tion.
Remarque : le mode correspond aussi à la ou aux valeur(s)ayant la plus grande hauteur dans la représentation graphiquede la variable.
Exemple : mode de la variable “nombre de pièces” = “1”
car la proportion de “1” (=50%) est la plus élevée,
ou bien car l’effectif de “1” (=500) est le plus élevé.
3.2 La Moyenne
La moyenne est un résumé numérique et correspond au centrede gravité de la distribution. On la note µ.
La moyenne se calcule
— à partir des données individuelles x(1), x(2), ...x(N) par :
µ =
Pvaleurs
effectif total=
x(1) + x(2) + ...+ x(N)
N
— à partir du tableau de distribution des effectifs par :
µ =
P(valeur× effectif de la valeur)
effectif total
µ =
kPi=1
(xi × ni)
N
=(x1 × n1) + (x2 × n2) + ..+ (xk × nk)
N
— à partir du tableau de distribution des proportions par :
µ =P(valeur× proportion de la valeur)
µ =kPi=1
(xi × pi)
= (x1 × p1) + (x2 × p2) + ..+ (xk × pk)
Exemple :
Tableau de distribution des effectifs
Nombre de pièces xi 1 2 3 4Effectifs ni 500 250 175 75
moyenne µ =1× 500 + 2× 250 + 3× 175 + 4× 75
1000=1825
1000=1,825
Le nombre de pièces moyen des habitations de la commune est1,825.
Remarque : la moyenne n’est pas en général un nombre entier.
Tableau de distribution des proportions
Nombre de pièces xi 1 2 3 4Pourcentage pi 50% 25% 17,5% 7,5%
Effectif total N = 1000
µ = 1× 0, 5 +2× 0, 25 + 3× 0, 175 + 4× 0, 075= 0, 5 + 0, 5 + 0, 525 +0, 3= 1, 825
Moyenne sur une population obtenue par regroupement dedeux populations
Exemple : Sur une première commune C1 composée de 1000habitations, le nombre de pièces moyen est µ1(C1) = 1,825.
Sur une seconde commune C2 composée de 5000 habitations,le nombre de pièces moyen est µ2(C2) = 2,304.
On souhaite alors calculer le nombre de pièces moyen des ha-bitations des deux communes réunies :
moyenne µ(C1∪C2)
=[µ1(C1)× Effectif(C1)] + [µ2(C2)× Effectif(C2)]
Effectif total(C1 ∪ C2)
=(1, 825× 1000) + (2, 304× 5000)
1000 + 5000
=13345
6000= 2, 224
Le nombre de pièces moyen sur les deux villes est de 2,224.
Intérêt de la moyenne
- Facile à calculer et à interpréter
- Dépend de toutes les observations
- Il est plus facile de comparer plusieurs populations en consi-dérant la moyenne et non toutes les données
Limites de la moyenne
- La moyenne est très sensible aux valeurs extrêmes et doncaux erreurs de mesure ou aux valeurs “aberrantes”.
Supposons qu’on rajoute cinq habitations de 60 pièces à lacommune. La moyenne de la variable “nombre de pièces” de-vient
µ2 =1825+ (60×5)
1005 = 2,114
La nouvelle moyenne est supérieure de 15,8% à 1,825 alorsque la proportion d’habitations supplémentaires a augmentéde 5
1000 = 0, 005 = 0, 5%
- La moyenne ne caractérise pas suffisamment une distributionstatistique :
Supposons que sur une autre commune, on ait obtenu la ré-partition des habitations par nombre de pièces suivante :
Nombre de pièces xi 1 2 3 4Proportions pi 0,725 0 0 0,275Effectif total N=3400
µ = (1×0,725) + (2×0) + (3×0) + (4×0,275) = 1,825
On obtient la même moyenne que pour la distribution précé-dente.
Cette non representativité de la moyenne implique le calculd’autres paramètres statistiques complémentaires.
3.3 La médiane
La médiane est la valeur qui partage les données en deux par-ties : 50% des observations sont inférieures à la médiane et50% lui sont supérieures.
Détermination de la médiane avec les effectifs
On classe les données dans l’ordre croissant.
— Si le nombre d’observations N est impair, alors la médiane
est exactement la valeur qui correspond à la³N+12
´eme
observation.Exemple : X : Nombre d’enfants par ménage.Nombre d’enfants xi 0 1 2 3 4Effectifs ni 3 6 5 1 0Effectifs cumulés Ni 3 9 14 15 15
L’effectif total est N =15. L’observation numéro 15+12 = 8
prend la valeur “1”. La médiane est “1”.
Il y a 7 observations inférieures (ou égales) à 1 et 7 obser-vations supérieures (ou égales) à 1.
— Si le nombre d’observations N est pair. On note x(N2 ) l’ob-servation numéro N2 et x(
N2 +1) la (
N2 +1)eme observation.
Alors la médiane est n’importe quelle valeur comprise dansl’intervalle médian [x(N2 );x(
N2 + 1)].
Par convention, on prend le milieu de cet intervalle.
Exemple : Nombre d’enfants
Nombre d’enfants xi 0 1 2 3 4Effectifs ni 4 5 4 1 0Effectifs cumulés Fi 4 9 13 14 14
L’effectif total estN =14. L’observation numéro 142 = 7 prendla valeur “1”. L’observation numéro 142 +1 = 8 prend aussi lavaleur “1”. Dans ce cas, la médiane est “1”.
Exemple : Nombre d’enfants
Nombre d’enfants xi 0 1 2 3 4Effectifs ni 5 2 5 1 1Effectifs cumulés Ni 5 7 12 13 14
L’effectif total est 14. L’observation numéro 142 = 7 prend lavaleur “1”. L’observation numéro 142 + 1 = 8 prend la valeur“2”. L’intervalle médian est [1 ; 2] et la médiane est “1,5”.
4 Principaux paramètres de dispersion
L’étendue, l’écart-type (dispersion par rapport à la moyenne)et les quantiles.
4.1 L’étendue
On appelle étendue la différence entre la plus grande valeur etla plus petite valeur prise par la variable.
Exemple :
Nombre de pièces 1 2 3 4Effectifs 500 250 175 75
L’étendue vaut 4− 1 = 3.
4.2 L’écart-type
L’écart-type mesure la dispersion des données autour de lamoyenne.
Variance =P(valeur-moyenne)2
effectif total
La variance est notée σ2 ; elle est exprimée dans l’unité aucarré de la variable.
σ2 =
NPi=1
(x(i)− µ)2
N
=(x(1)− µ)2 + (x(2)− µ)2 + ..+ (x(N)− µ)2
N
L’écart-type est exprimé dans la même unité que la variable.On le note σ.
Ecart-type =√Variance
σ =√σ2
Observations 1
Observations 2
Observations 3
µ
µ
µ
Plus l’écart-type est petit, plus les données individuelles sontregroupées autour de la moyenne.
Plus il est grand, plus les données individuelles sont disperséesautour de la moyenne.
4.2.1 Calcul de l’écart type à partir des données indivi-duelles
Exemple : On recense le nombre de pièces des habitations d’unhameau de 5 maisons.
Données x(i) : 1 ; 2 ; 4 ; 3 ; 2
- On commence par calculer la moyenne : ici elle vaut
µ =1 + 2 + 4 + 3 + 2
5= 2, 4
- Puis la variance σ2
=(1−2,4)2+(2−2,4)2+(4−2,4)2+(3−2,4)2+(2−2,4)2
5
= ...??
Formule pratique de calcul de la variance
On montre que l’on peut encore écrire la variance sous laforme :
Variance =P(valeur)2
effectif total−moyenne2
σ2 =
NPi=1
x(i)2
N− µ2 =
x(1)2 + x(2)2 + ...+ x(N)2
N− µ2
Le calcul est alors beaucoup plus rapide et offre moins derisques d’erreurs.
σ2 =12 + 22 + 42 + 32 + 22
5− 2, 42
σ2 =1 + 4 + 16 + 9 + 4
5− 2, 42 = 34
5− 2, 42 = 1, 04
Puis l’écart-type σ =√1, 04 = 1, 02.
4.2.2 Calcul de l’écart-type à partir de la distributiondes effectifs
Tableau de distribution des effectifs
Valeurs xi x1 x2 ... xkEffectifs ni n1 n2 ... nk
Variance =
Ph(valeur-moyenne)2 × effectif de la valeur
ieffectif total
σ2 =
kPi=1
h(xi − µ)2 × ni
iN
=[(x1−µ)2×n1]+[(x2−µ)2×n2]+..+[(xk−µ)2×nk]
N
Formule pratique de calcul de la variance
Variance =
Ph(valeur)2 × effectif
ieffectif total
−moyenne2
σ2 =
kPi=1[xi2 × ni]
N− µ2
=[x12×n1]+[x22×n2]+..+[xk2×nk]
N − µ2
Exemple :
Tableau de distribution des effectifs
Nombre de pièces xi 1 2 3 4Effectifs ni 500 250 175 75
Effectif total N = 1000 µ = 1, 825
Variance
σ2 =(1×500)+(4×250)+(9×175)+(16×75)
1000 − 1, 8252
=4275
1000− 1, 8252 = 0, 944
Ecart-type = σ =√0, 944 = 0, 972
4.2.3 Calcul de l’écart-type à partir de la distributiondes proportions
Tableau de distribution des proportions
Valeurs xi x1 x2 ... xkProportions pi p1 p2 ... pk
Variance=Ph(valeur-moyenne)2 × proportion de la valeur
i
σ2 =kPi=1
h(xi − µ)2 × pi
i
=h(x1 − µ)2 × p1
i+h(x2 − µ)2 × p2
i+...+
h(xk − µ)2 × pk
iFormule pratique de calcul de la variance
Variance =Ph(valeur)2 × proportion
i−moyenne2
σ2 =kPi=1
hx2i × pi
i− µ2
=hx21 × p1
i+hx22 × p2
i+ ...+
hx2k × pk
i− µ2
Exemple :
Tableau de distribution des proportions
Nombre de pièces xi 1 2 3 4Proportions pi 0,5 0,25 0,175 0,075
Effectif total N = 1000 µ = 1,825
σ2 = (1× 0, 5) + (4× 0, 25) + (9× 0, 175)
+(16× 0, 075)− 1, 8252
= 4,275 −1, 8252 = 0, 944
Ecart-type = σ =√0, 944 = 0, 972.