15

Click here to load reader

1 Le Vocabulaire de Base

  • Upload
    lvtmath

  • View
    45

  • Download
    3

Embed Size (px)

Citation preview

Page 1: 1 Le Vocabulaire de Base

Vocabulaire spécifique des statistiques

______________________________

On considère un ensemble Ω fini appelé population, les unités statistiques ou les individus

sont les éléments de Ω, le nombre d’individus, N, est l’effectif total.

A chaque individu ω, on associe un seul nombre réel X(ω) ; la notation X est appelé caractère

quantitatif ou variable statistique numérique : X est une application de Ω vers ℝ.

I. Cas où X est une variable statistique discrète

C’est le cas où on précise bien toutes les valeurs prises par X. Il y en a p et elles sont rangées

en ordre strictement croissant : x1, x2,…, xp.

x1, x2,…, xp sont appelées les modalités de X.

A chaque modalité xi (pour 1≤ i≤ p et i entier), on associe son effectif ni qui est le nombre

d’individus prenant par X, la valeur xi ; fi = ni /N est la fréquence de la modalité xi.

La série statistique simple associée à X est donnée par un tableau qui indique bien toutes les

modalités rangées en ordre strictement croissant et l’effectif ou la fréquence de chaque

modalité :

Modalités x1 x2 x3 ……… xp

Effectifs n1 n2 n3 ……… np

Fréquences f1 f2 f3 ……… fp

Un mode de la série statistique est une modalité pour laquelle l’effectif est maximal .

Page 2: 1 Le Vocabulaire de Base

Exemple 1 Étude des avaries dans un atelier composé de 10 machines identiques pendant une période de 200 jours ouvrables Caractère étudié : X= nombre d’avaries dans l’atelier au cours d’une journée (on admettra

qu’une machine ne peut pas tomber en panne plus d’une fois par jour). X est une variable

discrète prenant ses valeurs dans l’ensemble 0 ; 1 ; 2 ;… ;10 ; les valeurs xi prises par X

sont les modalités.

La population est l’ensemble des 200 journées qui font l’objet de l’étude : N=200.

Les effectifs ni sont le nombre de journées ayant vu xi machines en panne.

La série statistique étudiée donne le tableau statistique ci-dessous :

xi 0 1 2 3 4 5

ni 86 74 30 7 2 1

fi 0,43 0,37 0,15 0,035 0,01 0,005

1°) Donner le mode.

Réponse :

2°) Calculer l’effectif des jours pour lesquels le nombre d’avaries est inférieur strictement à 2.

Réponse :

3°) Calculer l’effectif des jours pour lesquels le nombre d’avaries est supérieur strictement à 3.

Réponse :

Exemple 2

L’entreprise d’entretien A dispose d’un fichier clients comportant nom, nature de l’activité,

pièces et superficies à entretenir, produits achetés, dates de renouvellement, factures réglées

ou à récupérer, remises accordées…

On extrait du fichier de cette entreprise une liste de 50 clients disposant de bureaux, la liste du

nombre de bureaux par client constitue une série statistique à variable discrète. Un

regroupement fournit alors le tableau suivant des effectifs et des fréquences.

Nombre de bureaux 1 2 3 4 5 6 7 8 9 11

Effectifs 2 5 5 7 11 9 4 3 2 2

Fréquences 0,04 0,10 0,10 0,14 0,22 0,18 0,08 0,06 0,04 0,04

1°) Donner le mode.

Réponse :

2°) Calculer l’effectif des clients qui ont au plus 3 bureaux

Réponse :

3°) Calculer l’effectif des clients qui ont strictement plus de 7 bureaux.

Réponse :

Page 3: 1 Le Vocabulaire de Base

On représente une telle série par un diagramme en bâtons dont les hauteurs sont

proportionnelles aux effectifs et qui est d’interprétation immédiate.

Fréquences Effectifs

0,2

0,1

Nombre de bureaux

Exemple 3

Pour la vérification de véhicules en sortie de fabrication, on a établi 32 points de contrôle.

Sur un échantillon de 100 véhicules pris au hasard dans la chaîne, on relève la variable X,

nombre de points non satisfaisants par véhicule.

X prend les valeurs xi : xi ∈ 0 ; 1 ; 2 ;… ; 32, aux quelles on associe ni, nombre de véhicules

ayant xi contrôles non satisfaisant.

xi 0 1 2 3 4 5 6

ni 20 32 25 14 5 3 1

1°) Donner le mode.

2°) Calculer l’effectif des véhicules qui ont au moins 5 points non satisfaisants.

3°) Calculer l’effectif des véhicules qui ont au plus 2 points non satisfaisants.

4°) Dresser le diagramme en bâtons correspondant.

Réponse :

1°) Le mode est 1, c’est la modalité pour laquelle l’effectif est maximal.

2°) L’effectif des véhicules ayant au moins 5 points non satisfaisants est donné par 3+1=4.

Page 4: 1 Le Vocabulaire de Base

3°) L’effectif des véhicules ayant au plus 2 points non satisfaisants est donné par

20+32+25=77.

4°) Le diagramme en bâtons est le suivant :

32

25

20

14

5

3

1

Page 5: 1 Le Vocabulaire de Base

II. Cas où X est une variable statistique continue On se place dans le cas suivant :

- On se donne p + 1 (avec p dans ℕ*) nombres rangés en ordre strictement croissant α0,

α1, α2,…,αp-1, αp. - X ne prend ses valeurs que dans l’intervalle semi-ouvert [α0, αp+1[. - A chaque intervalle [αi-1, αi[ appelé classe (pour i entier avec 1≤ i≤ p), on associe son

effectif ni qui est le nombre d’individus prenant par X une valeur dans [αi-1, αi[ ; fi=ni/N est la fréquence de la classe [αi-1, αi[. xi=(αi-1+ αi)/2 est le centre de cette classe.

La série statistique continue, définie par X, est donnée par un tableau qui indique, pour chaque classe [αi-1, αi[ (avec i entier et 1≤ i ≤ p), son centre éventuellement, son effectif ou sa fréquence :

Classes [α0, α1[ [α1, α2[ … … … [αp-1, αp[ Centres x1 x2 ... … … xp

Effectifs n1 n2 ... … … np

Fréquences f1 f2 … … … fp

Avec i entier et 1≤ i ≤ p,

- L’effectif cumulé croissant de la classe [αi-1, αi[ est le nombre d’individus prenant par X, une valeur dans l’intervalle [α0, αi[ ; ce nombre vaut : n1+n2+…+ni. La fréquence cumulée croissante de cette classe vaut : (n1+n2+…+ni)/N = f1+f2+…+fi.

- L’effectif cumulé décroissant de la classe [αi-1, αi[ est le nombre d’individus prenant par X une valeur dans l’intervalle [αi-1, αp[ ; ce nombre vaut : ni+ni+1+…+np. La fré-quence cumulée décroissante de cette classe vaut : (ni+ni+1+…+np)/N = fi+fi+1+…+fp.

Une classe modale est une classe pour laquelle l’effectif est maximal. 1. Exemple, histogramme, polygone des effectifs ou des fréquences Énoncé : On a relevé et rassemblé dans un tableau les surfaces de plancher à nettoyer pour les 50 clients de l’entreprise de nettoyage A.

Surface en m2

[10, 30[ [30, 50[ [50, 70[ [70, 90[ [90, 110[ [110, 130[ Plus de 130

Effectifs 2 8 14 12 7 4 3 1ère Partie : 1°) Remplacer l’indication " Plus de 130" par un intervalle [a, b[ avec a et b réels et a< b. Dresser le tableau statistique donnant le centre, l’effectif et la fréquence de chaque classe.

2°) Quel est l’effectif de la classe [50, b[ ? Que représente ce nombre ? 3°) Quel est l’effectif de la classe [10, 70[ ? Que représente ce nombre ?

2ème Partie : Sur l’axe des modalités, 1 cm donne la distance des graduations 0 et 20. Sur l’axe des effectifs, 1 cm donne la distance des graduations 0 et 2.

1°) Tracer l’histogramme de la série statistique continue. 2°) Tracer, en pointillé, le polygone des effectifs.

Page 6: 1 Le Vocabulaire de Base

Résolution :

1ère

Partie : 1°) Les intervalles précédents ayant pour amplitude 20, on choisit l’intervalle [130,

150[ pour l’indication " Plus de 130".

On obtient le tableau statistique suivant ( L’effectif total est 50) :

Surfaces

en m2

[10, 30[

[30, 50[

[50, 70[

[70, 90[

[90, 110[

[110, 130[

[130, 150[

Centres

des classes

20

40

60

80

100

110

140

Effectifs 2 8 14 12 7 4 3

Fréquences 0,04 0,16 0,28 0,24 0,14 0,08 0,06

2°) L’effectif de la classe [50, 150[ vaut : 14+12+7+4+3=40. C’est l’effectif cumulé

décroissant de la classe [50, 70[.

3°) L’effectif de la classe [10, 70[ vaut : 2+8+14=24. C’est l’effectif cumulé croissant de la

classe [50, 70[.

2ème

Partie :

1°) On dessine des rectangles de hauteur les effectifs des classes pour obtenir l’histogramme.

2°) On joint par des segments de droite les points de coordonnées (0, 0), (20, 2), (40, 8), (60,

14), (80, 12), (100, 7), (120, 4), (140, 3), (160, 0) pour obtenir le polygone des effectifs.

En changeant l’échelle de l’axe des ordonnées, on obtient aussi le polygone des fréquences.

Le polygone des effectifs ou des fréquences est en pointillé.

Effectifs Fréquences

14

10 0,2

0,1

2

0 20 40 60 80 100 120 140

Page 7: 1 Le Vocabulaire de Base

2. Exemple avec les effectifs cumulés Énoncé : Un relevé du nombre d’année au service d’une entreprise fournit le tableau suivant : Nombre d’années

Moins de 4

4 à 8 8 à 12 12 à 16 16 à 20 20 à 30 Plus de 30

Effectifs 6 7 10 8 5 4 3 Remplacer les indications "Moins de 4" et "Plus de 30"par des intervalles et faire le tableau statistique donnant, en fonction des classes, les centres, les effectifs, les effectifs cumulés. Résolution : Le tableau statistique est donné de la manière suivante : Nombre d’années [0, 4[ [4, 8[ [8, 12[ [12, 16[ [16, 20[ [20, 30[ [30, 40[

Effectifs 6 7 10 8 5 4 3

Effectifs cumulés croissants 6 13 23 31 36 40 43

Effectifs cumulés décroissants 43 37 30 20 12 7 3

Page 8: 1 Le Vocabulaire de Base

3. Polygones d ‘effectifs ou de fréquences cumulés On reprend les notations précédant le paragraphe 1 : La série statistique continue X est représentée par le tableau statistique :

Classes [α0, α1[ [α1, α2[ … [αi–1, αi[ … [αp-1, αp[ Centres x1 x2 ... xi ... xp

Effectifs n1 n2 ... ni … np

Fréquences f1 f2 … fi … fp

où α1< α2< …< αi–1 < αi… αp-1< αp et N= n1+n2+…+np. ① On commence par dresser le tableau statistique donnant les classes, leurs effectifs cumulés :

Classes [α0, α1[ [α1, α2[ … [αi–1, αi[ … [αp-1, αp[ Effectifs n1 n2 ... ni … np

Effectifs cumulés croissants

A1 A2 ... Ai … Ap=N

Effectifs cumulés décroissants

B1=N B2 … Bi … Bp

② On trace une ligne polygonale en joignant par des segments de droites successivement les points de coordonnées (α0, 0), (α1, A1), (α2,A2),…( αi, Ai),...( αp, Ap) . On a obtenu la ligne polygonale des effectifs cumulés croissants ; c’est la représentation graphique d’une fonction F. On trace une ligne polygonale en joignant par des segments de droites successivement les points de coordonnées (α0, B1), (α1, B2)…(αi, Bi+1, ... (αp-1, Bp), (αp, 0) . On a obtenu la ligne polygonale des effectifs cumulés décroissants ; c’est la représentation graphique d’une fonction G. Propriétés et définitions

∗ On peut vérifier l’égalité : Pour tout x de [α 0, α p], F(x)+G(x)=N.

∗ Les 2 fonctions F et G sont affines sur chacun des intervalles [α0, α1], [α1, α2],… [αp-1, αp] ; on dit que ces fonctions sont affines par morceaux sur [α0, αp].

∗ Si les effectifs n1, n2,…,np sont tous strictement positifs :

F est continue et strictement croissante sur [α 0, α p] avec F(α 0)=0 et F(αp)= N,

G est continue et strictement décroissante sur [α 0, α p] avec G(α 0)= N et G(αp)= 0.

③ En remplaçant les effectifs cumulés par les fréquences cumulées dans les constructions précédentes, on obtient les polygones des fréquences cumulées qui sont les représentations

graphiques des 2 fonctions f et g définies par f(x)=N

1F(x) et g(x)=

N

1G(x).

Page 9: 1 Le Vocabulaire de Base

④ Fonction de répartition - Avec x dans [α0, αp], on considère que F(x) est l’effectif de la classe [α0, x[ tandis que f(x) est la fréquence de cette classe. On dit que F , ou que f, est la fonction de répartition de la variable statistique X.

- Avec α0 ≤ a ≤ b ≤ αp, F(b)–F(a) est l’effectif de la classe [a, b[ tandis que f(b)–f(a) est la fréquence de la classe [a, b [. ⑤ Étude d’un exemple On reprend l’exemple de l’entreprise A vue au paragraphe II.1 où l’on a obtenu le tableau statistique suivant ( L’effectif total est 50) : Surfaces en m2

[10, 30[

[30, 50[

[50, 70[

[70, 90[

[90, 110[

[110, 130[

[130, 150[

Effectifs 2 8 14 12 7 4 3 1°) Dresser le tableau statistique donnant les classes, leurs effectifs et leurs effectifs cumulés. 2°) Tracer les polygones des effectifs cumulés et des fréquences cumulées. 3°) Soit Me l’abscisse du point d’intersection I des polygones des effectifs cumulés. Quelle est l’ordonnée de ce point ? Sur l’axe des modalités, 4 cm donne la distance des graduations 0 et 50. Sur l’axe des effectifs cumulés, 2 cm donne la distance des graduations 0 et 10. Corrigé de l’exercice 1°) Classes

[10, 30[

[30, 50[

[50, 70[

[70, 90[

[90, 110[

[110, 130[

[130, 150[

Effectifs 2 8 14 12 7 4 3 Effectifs cumulés croissants

2

10

24

36

43

47

50

Effectifs cumulés décroissants

50

48

40

26

14

7

3

2°) Les ordonnées donnant les effectifs cumulés, le polygone des effectifs cumulés croissants passe par les points de coordonnées (10, 0), (30, 2), (50, 10), (70, 24), (90, 36), (110, 43), (130, 47), (150, 50). Le polygone des effectifs cumulés décroissants passe par les points de coordonnées (10, 50), (30, 48), (50, 40), (70, 26), (90, 14), (110, 7), (130, 3), (150, 0).

Page 10: 1 Le Vocabulaire de Base

y y/50

Effectifs Fréquences cumulés cumulées 50 1 40 30 25 0,5 20 10 O 50 Me 100 150 Surface (m2) 3) Le polygone des effectifs cumulés croissants est la représentation graphique de la fonction numérique F, le polygone des effectifs cumulés décroissants est la représentation graphique de la fonction numérique G.

∗ Les propositions suivantes sont équivalentes : F(Me)=G(Me), F(Me)+G(Me)=50 et F(Me)–G(Me)=0,2F(Me)=50 et F(Me)+G(Me)=50, F(Me)=25.

∗ On en déduit que 25 est l’ordonnée du point I, d’abscisse Me, commun aux 2 polygones des effectifs cumulés. Dans un paragraphe suivant, on va calculer la valeur de Me.

Page 11: 1 Le Vocabulaire de Base

5. Valeurs caractéristiques

On prend les notations précédant le paragraphe 1 et les notations du paragraphe 3.

a) La classe modale est la classe d’effectif maximal. Le mode est le centre de cette classe.

b) La médiane est le nombre Me qui vérifie Ê(Me)=N/2 soit Ĝ (Me)=1/2, c’est-à-dire

ê(Me)=N/2 soit ĝ(Me)=1/2.

Le nombre Me est ainsi le point d’intersection des polygones des effectifs ( ou des fréquences)

cumulées.

c) Quartiles

Le premier quartile Q1 est la valeur qui vérifie Ê(Q1) =N/4 ou Ĝ(Q1)= 1/4.

Le troisième quartile Q3 est la valeur qui vérifie Ê(Q3)= 3N/4 ou Ĝ(Q3)= 2/4.

La différence I=Q3–Q1 est l’(intervalle) interquartile ; c’est une caractéristique de dispersion

tandis que la médiane et les quartiles sont des caractéristiques de position.

Page 12: 1 Le Vocabulaire de Base

6.Calcul des caractéristiques de position

a) Préliminaires

∗ Soit R=(O, jirr

, ) un repère du plan et (D) la droite d’équation y= px+r (p et r sont 2 réels

constants).

Soit f une fonction numérique définie (au moins) sur I, un ensemble de réels, soit (C) la

représentation graphique de f dans R.

(D)

β B

γ C

α A

jr

O ir

a c b

On se place dans le cas où pour tout x de I, le point M de (C) d’abscisse x se trouve sur (D) ;

cela revient à dire que : f(x)=px+r pour tout x de I . On dit alors que f est une fonction affine

sur I.

Soient a, b et c trois réels de I et α, β et γ les images respectives de a, b et c par f.

Par exemple, on se place aussi dans le cas où α, β et γ sont 3 réels distincts deux à deux.

Forcément a,b et c sont aussi 3 réels distincts deux à deux.

Les 3 points A, B et C de coordonnées respectives (a, α), (b, β) et (c, γ) se trouvant sur la

droite (D) de pente p, on a p=abac −

−=

− αβαγsoit en passant aux inverses de ces réels non

nuls : αβαγ −

−=

− abac. On résumera ce résultat de la manière suivante :

La correspondance

βγα ;;

;; bca due à la fonction f affine sur I, donne par interpolation

linéaire : abac −

−=

− αβαγou

αβαγ −

−=

− abac.

∗ Pour la suite, on écrira tous les nombres à calculer sous la forme e+ s où e est un entier et s

un réel vérifiant 0≤ s < 1.

Page 13: 1 Le Vocabulaire de Base

b) Exemple de calcul

On a le tableau statistique suivant :

Classes [10 ; 30[ [30 ; 50[ [50 ; 70[ [70 ; 90[ [90 ; 110[ [110 ; 130[ [130 ; 150[

Effectifs 2 8 14 12 7 4 3

Effectifs

cumulés

croissants

2 10 24 36 43 47 50

Le polygone des effectifs cumulés croissants est la représentation graphique de la fonction F.

1° Donner les valeurs F(x) pour x dans 10, 30, 50, 70, 90, 110, 130, 150 .

2° Calculer la médiane Me.

3° Calculer le premier quartile.

4° Calculer le troisième quartile et l’interquartile.

5° Attribuer à la classe [65, 85[, son effectif et sa fréquence.

_____________________________

1° On donne les résultats sous forme de tableau :

x 10 30 50 70 90 110 130 150

F(x) 0 2 10 24 36 43 47 50

2° La moitié de l’effectif total est 25=50/2 et F(70)<25< F(90). F étant une fonction affine sur

[70, 90], elle prend la valeur 25 en Me de ]70, 90[. On a, par F, la correspondance :

36;25;24

90;;70 eM .

Cela donne par interpolation linéaire :

2436

7090

2425

70

−=

−eM soit Me–70= 20/12=5/3= 1+2/3 d’où : Me=71+2/3≈71,67 .

3° Le quart de l’effectif total est 50/4=12,5 et F(50)<12,5<F(70). F étant une fonction affine

sur [50, 70], elle prend la valeur 12,5 en Q1 de ] 50, 70[. On a par F la correspondance :

24;5,12;10

70;;50 1Q .

Cela donne par interpolation linéaire :

1024

5070

105,12

501

−=

−Q soit

7

10

14

20

5,2

501==

−Q d’où Q1–50 = 25/7= 3+4/7 soit :

Q1=53+4/7 ≈53,57 .

4° Trois quart de l’effectif total vaut 3× 50/4=37,5 et F(90)<37,5<F(110). F étant une

fonction affine sur [90, 110], elle prend la valeur 37,5 en Q3 de ] 90, 110[. On a par F la

correspondance :

43;5,37;36

110;;90 3Q .

Cela donne par interpolation linéaire :

Page 14: 1 Le Vocabulaire de Base

3643

90110

365,37

903

−=

−Q soit

7

20

5,1

903=

−Q d’où Q3–90 = 30/7= 4+2/7 soit Q3=94+2/7 ≈94,29 .

L’interquartile I vaut : I=Q3–Q1= 94–53+2/7–4/7=41–2/7=40+(1–2/7) soit :

I=40+5/7≈40,71 .

5° L’effectif attribué à la classe [65, 85[ est e=F(85)–F(65), sa fréquence est f=e/50.

a) F est une fonction affine sur [70, 90] qui donne la correspondance

36;;24

90;85;70

2e où

e2= F(85) ; par interpolation linéaire, on a : 7090

2436

7085

242

−=

−e soit

20

12

15

242=

−e=0,6.

Alors e2–24=9 d’où F(85)= e2=33.

b) F est une fonction affine sur [50, 70] qui donne la correspondance

24;;10

70;65;50

1e où

e1= F(65) ; par interpolation linéaire, on a : 5070

1024

5065

101

−=

−e soit

20

14

15

101=

−e=0,7.

Alors e1–10 = 10,7 d’où F(65)= e1=20,5.

c) Finalement : e= 33–20,5= 12,5 et f=12,5/50=0,25 .

Page 15: 1 Le Vocabulaire de Base

III. Cas des variables statistiques discrètes

En utilisant les effectifs cumulés croissants, les fréquences cumulées croissantes…on

définit aussi médiane, quartiles, écart interquartile.

Exemple : Le relevé du nombre journalier d’interventions demandée à une entreprise de

réparation à domicile s’établit comme suit pour les 60 jours ouvrables d’un trimestre.

Nombre

de demandes

15 18 19 20 21 22 23 24 25 26 27 28 29 30 32

Nombres

de jours

1 1 2 2 4 6 6 7 9 8 4 5 3 1 1

1° Effectuer la représentation en bâtons de cette série.

2° Donner le mode. Calculer la médiane Me et les quartiles Q1 et Q2.

Résolution : 1°

Effectifs

(Nombre de jours)

10

8

6

4

2

0

15 17 19 21 23 25 27 29 31 33 Modalités

(Nombre de demandes)

2° On a le tableau de calcul suivant :

Modalités 15 18 19 20 21 22 23 24 25 26 27 28 29 30 32

Effectifs 1 1 2 2 4 6 6 7 9 8 4 5 3 1 1

Effectifs

cumulés

croissants

1

2

4

6

10

16

22

29

38

46

50

55

58

59

60

60/4=15 ; 60/2=30 ; 3×60/4=45

Au vu du tableau : 22 est le 1er

quartile, 25 est la médiane, 26 est le 3ème

quartile .