Chapitre 3 Variables Quantitatives discrètes...1 Organisation des données Les valeurs x1,x2,...,xkd’une variable quantitative discrète sont des nombres entiers. Exemple : On a

Chapitre 3

Variables Quantitatives discrètes

1. Organisation des données

2. Représentation graphique

3. Principaux paramètres de position

4. Principaux paramètres de dispersion

1 Organisation des données

Les valeurs x1, x2, ..., xk d’une variable quantitative discrètesont des nombres entiers.

Exemple :

On a recensé le nombre de pièces des habitations d’une com-mune C et obtenu le tableau de distribution des effectifs sui-vant :

Nombre de pièces xi 1 2 3 4Effectifs ni 500 250 175 75

- population = habitations de la commune

- individu = une habitation.

- effectif total = 500 + 250 + 175 + 75 = 1000.

- variable = nombre de pièces de l’habitation.

- valeurs de la variable : x1 = 1, x2 = 2, x3 = 3, x4 = 4.

Comme pour les variables qualitatives, on peut considérer demanière équivalente le tableau de distribution des proportions :

Tableau de distribution des proportionsNombre de pièces xi 1 2 3 4Pourcentage pi 50% 25% 17,5% 7,5%

Effectif total N = 1000

2 Représentation graphique

Pour représenter une variable quantitative discrète, on peututiliser un graphique appelé diagramme en bâtons.

Le principe de ce graphique consiste à dessiner pour chaquevaleur de la variable un trait de hauteur l’effectif de cette valeurou la proportion de cette valeur.

Tableau de distribution des proportionsNombre de pièces xi 1 2 3 4Pourcentage pi 50% 25% 17,5% 7,5%Effectif total N = 1000

Nombre de pièces

proportion

0,1

0,2

0,3

0,4

0,5

1 2 3 4

effectif total=1000

Répartition du nombre de pièces des habitations de la commune C

Tableau de distribution des effectifs


Effectifs

100

200

300

400

500

1 2 3 4 Nombre de pièces

Répartition du nombre de pièces des habitations de la commune C

3 Principaux paramètres de position

Principaux paramètres de position ou de tendance centrale :le mode, la moyenne et la médiane.

3.1 Le mode

On appelle mode d’une variable quantitative discrète la ou lesvaleur(s) ayant le plus grand effectif ou la plus grande propor-tion.

Remarque : le mode correspond aussi à la ou aux valeur(s)ayant la plus grande hauteur dans la représentation graphiquede la variable.

Exemple : mode de la variable “nombre de pièces” = “1”

car la proportion de “1” (=50%) est la plus élevée,

ou bien car l’effectif de “1” (=500) est le plus élevé.

3.2 La Moyenne

La moyenne est un résumé numérique et correspond au centrede gravité de la distribution. On la note µ.

La moyenne se calcule

— à partir des données individuelles x(1), x(2), ...x(N) par :

µ =

Pvaleurs

effectif total=

x(1) + x(2) + ...+ x(N)

N

— à partir du tableau de distribution des effectifs par :

µ =

P(valeur× effectif de la valeur)

effectif total

µ =

kPi=1

(xi × ni)

N

=(x1 × n1) + (x2 × n2) + ..+ (xk × nk)

N

— à partir du tableau de distribution des proportions par :

µ =P(valeur× proportion de la valeur)

µ =kPi=1

(xi × pi)

= (x1 × p1) + (x2 × p2) + ..+ (xk × pk)

Exemple :



moyenne µ =1× 500 + 2× 250 + 3× 175 + 4× 75

1000=1825

1000=1,825

Le nombre de pièces moyen des habitations de la commune est1,825.

Remarque : la moyenne n’est pas en général un nombre entier.

Tableau de distribution des proportions

Nombre de pièces xi 1 2 3 4Pourcentage pi 50% 25% 17,5% 7,5%

Effectif total N = 1000

µ = 1× 0, 5 +2× 0, 25 + 3× 0, 175 + 4× 0, 075= 0, 5 + 0, 5 + 0, 525 +0, 3= 1, 825

Moyenne sur une population obtenue par regroupement dedeux populations

Exemple : Sur une première commune C1 composée de 1000habitations, le nombre de pièces moyen est µ1(C1) = 1,825.

Sur une seconde commune C2 composée de 5000 habitations,le nombre de pièces moyen est µ2(C2) = 2,304.

On souhaite alors calculer le nombre de pièces moyen des ha-bitations des deux communes réunies :

moyenne µ(C1∪C2)

=[µ1(C1)× Effectif(C1)] + [µ2(C2)× Effectif(C2)]

Effectif total(C1 ∪ C2)

=(1, 825× 1000) + (2, 304× 5000)

1000 + 5000

=13345

6000= 2, 224

Le nombre de pièces moyen sur les deux villes est de 2,224.

Intérêt de la moyenne

- Facile à calculer et à interpréter

- Dépend de toutes les observations

- Il est plus facile de comparer plusieurs populations en consi-dérant la moyenne et non toutes les données

Limites de la moyenne

- La moyenne est très sensible aux valeurs extrêmes et doncaux erreurs de mesure ou aux valeurs “aberrantes”.

Supposons qu’on rajoute cinq habitations de 60 pièces à lacommune. La moyenne de la variable “nombre de pièces” de-vient

µ2 =1825+ (60×5)

1005 = 2,114

La nouvelle moyenne est supérieure de 15,8% à 1,825 alorsque la proportion d’habitations supplémentaires a augmentéde 5

1000 = 0, 005 = 0, 5%

- La moyenne ne caractérise pas suffisamment une distributionstatistique :

Supposons que sur une autre commune, on ait obtenu la ré-partition des habitations par nombre de pièces suivante :

Nombre de pièces xi 1 2 3 4Proportions pi 0,725 0 0 0,275Effectif total N=3400

µ = (1×0,725) + (2×0) + (3×0) + (4×0,275) = 1,825

On obtient la même moyenne que pour la distribution précé-dente.

Cette non representativité de la moyenne implique le calculd’autres paramètres statistiques complémentaires.

3.3 La médiane

La médiane est la valeur qui partage les données en deux par-ties : 50% des observations sont inférieures à la médiane et50% lui sont supérieures.

Détermination de la médiane avec les effectifs

On classe les données dans l’ordre croissant.

— Si le nombre d’observations N est impair, alors la médiane

est exactement la valeur qui correspond à la³N+12

´eme

observation.Exemple : X : Nombre d’enfants par ménage.Nombre d’enfants xi 0 1 2 3 4Effectifs ni 3 6 5 1 0Effectifs cumulés Ni 3 9 14 15 15

L’effectif total est N =15. L’observation numéro 15+12 = 8

prend la valeur “1”. La médiane est “1”.

Il y a 7 observations inférieures (ou égales) à 1 et 7 obser-vations supérieures (ou égales) à 1.

— Si le nombre d’observations N est pair. On note x(N2 ) l’ob-servation numéro N2 et x(

N2 +1) la (

N2 +1)eme observation.

Alors la médiane est n’importe quelle valeur comprise dansl’intervalle médian [x(N2 );x(

N2 + 1)].

Par convention, on prend le milieu de cet intervalle.

Exemple : Nombre d’enfants

Nombre d’enfants xi 0 1 2 3 4Effectifs ni 4 5 4 1 0Effectifs cumulés Fi 4 9 13 14 14

L’effectif total estN =14. L’observation numéro 142 = 7 prendla valeur “1”. L’observation numéro 142 +1 = 8 prend aussi lavaleur “1”. Dans ce cas, la médiane est “1”.

Exemple : Nombre d’enfants

Nombre d’enfants xi 0 1 2 3 4Effectifs ni 5 2 5 1 1Effectifs cumulés Ni 5 7 12 13 14

L’effectif total est 14. L’observation numéro 142 = 7 prend lavaleur “1”. L’observation numéro 142 + 1 = 8 prend la valeur“2”. L’intervalle médian est [1 ; 2] et la médiane est “1,5”.

4 Principaux paramètres de dispersion

L’étendue, l’écart-type (dispersion par rapport à la moyenne)et les quantiles.

4.1 L’étendue

On appelle étendue la différence entre la plus grande valeur etla plus petite valeur prise par la variable.

Exemple :

Nombre de pièces 1 2 3 4Effectifs 500 250 175 75

L’étendue vaut 4− 1 = 3.

4.2 L’écart-type

L’écart-type mesure la dispersion des données autour de lamoyenne.

Variance =P(valeur-moyenne)2

effectif total

La variance est notée σ2 ; elle est exprimée dans l’unité aucarré de la variable.

σ2 =

NPi=1

(x(i)− µ)2

N

=(x(1)− µ)2 + (x(2)− µ)2 + ..+ (x(N)− µ)2

N

L’écart-type est exprimé dans la même unité que la variable.On le note σ.

Ecart-type =√Variance

σ =√σ2

Observations 1

Observations 2

Observations 3

µ

µ

µ

Plus l’écart-type est petit, plus les données individuelles sontregroupées autour de la moyenne.

Plus il est grand, plus les données individuelles sont disperséesautour de la moyenne.

4.2.1 Calcul de l’écart type à partir des données indivi-duelles

Exemple : On recense le nombre de pièces des habitations d’unhameau de 5 maisons.

Données x(i) : 1 ; 2 ; 4 ; 3 ; 2

- On commence par calculer la moyenne : ici elle vaut

µ =1 + 2 + 4 + 3 + 2

5= 2, 4

- Puis la variance σ2

=(1−2,4)2+(2−2,4)2+(4−2,4)2+(3−2,4)2+(2−2,4)2

5

= ...??

Formule pratique de calcul de la variance

On montre que l’on peut encore écrire la variance sous laforme :

Variance =P(valeur)2

effectif total−moyenne2

σ2 =

NPi=1

x(i)2

N− µ2 =

x(1)2 + x(2)2 + ...+ x(N)2

N− µ2

Le calcul est alors beaucoup plus rapide et offre moins derisques d’erreurs.

σ2 =12 + 22 + 42 + 32 + 22

5− 2, 42

σ2 =1 + 4 + 16 + 9 + 4

5− 2, 42 = 34

5− 2, 42 = 1, 04

Puis l’écart-type σ =√1, 04 = 1, 02.

4.2.2 Calcul de l’écart-type à partir de la distributiondes effectifs


Valeurs xi x1 x2 ... xkEffectifs ni n1 n2 ... nk

Variance =

Ph(valeur-moyenne)2 × effectif de la valeur

ieffectif total

σ2 =

kPi=1

h(xi − µ)2 × ni

iN

=[(x1−µ)2×n1]+[(x2−µ)2×n2]+..+[(xk−µ)2×nk]

N

Formule pratique de calcul de la variance

Variance =

Ph(valeur)2 × effectif

ieffectif total

−moyenne2

σ2 =

kPi=1[xi2 × ni]

N− µ2

=[x12×n1]+[x22×n2]+..+[xk2×nk]

N − µ2

Exemple :



Effectif total N = 1000 µ = 1, 825

Variance

σ2 =(1×500)+(4×250)+(9×175)+(16×75)

1000 − 1, 8252

=4275

1000− 1, 8252 = 0, 944

Ecart-type = σ =√0, 944 = 0, 972

4.2.3 Calcul de l’écart-type à partir de la distributiondes proportions


Valeurs xi x1 x2 ... xkProportions pi p1 p2 ... pk

Variance=Ph(valeur-moyenne)2 × proportion de la valeur

i

σ2 =kPi=1

h(xi − µ)2 × pi

i

=h(x1 − µ)2 × p1

i+h(x2 − µ)2 × p2

i+...+

h(xk − µ)2 × pk

iFormule pratique de calcul de la variance

Variance =Ph(valeur)2 × proportion

i−moyenne2

σ2 =kPi=1

hx2i × pi

i− µ2

=hx21 × p1

i+hx22 × p2

i+ ...+

hx2k × pk

i− µ2

Exemple :


Nombre de pièces xi 1 2 3 4Proportions pi 0,5 0,25 0,175 0,075

Effectif total N = 1000 µ = 1,825

σ2 = (1× 0, 5) + (4× 0, 25) + (9× 0, 175)

+(16× 0, 075)− 1, 8252

= 4,275 −1, 8252 = 0, 944

Ecart-type = σ =√0, 944 = 0, 972.

Documents

Chapitre 3 Variables Quantitatives discrètes...1 Organisation des données Les valeurs x1,x2,...,xkd’une variable quantitative discrète sont des nombres entiers. Exemple : On a