Upload
cheryl
View
53
Download
2
Embed Size (px)
DESCRIPTION
Statistique Descriptive Chapitre 1 : Les tableaux et représentations graphiques. Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc. Statistiques descriptives à une variable : représentations. Objectifs de ce module. - PowerPoint PPT Presentation
Citation preview
Statistique DescriptiveChapitre 1 : Les tableaux et représentations graphiques Pr. Abdelkrim EL MOUATASIMEST de GuelmimMaroc
Tifawt.com
Objectifs de ce module
Savoir décrire et représenter une série statistique par un tableau et un ou plusieurs graphiques adaptés.
On fera des choix des représentations différents selon la nature du caractère.
Statistiques descriptives à une variable : représentations
Tifawt.com
Introduction La représentation tabulaire est préalable à
toute analyse statistique. Elle fait suite au travail préliminaire de
collecte des données. La représentation graphique d’un seul
caractère repose sur une règle de proportionnalité des hauteurs ou aires des graphiques aux effectifs (ou fréquences).
Le choix d’un type de graphique dépendra de la nature du caractère étudié.
Tifawt.com
Plan du chapitre 1
I. Caractères qualitatifs. II. Caractères quantitatifs
discrets.III. Caractères quantitatifs
continus.
Voici les parties que nous allons aborder :
Tifawt.com
Plan de la partie
1. Représentation tabulaire. 2. Diagramme à bande.3. Diagramme circulaire.
Voici les chapitres que nous allons aborder :
Ⅰ. Caractères qualitatifs
Tifawt.com
1. Représentation tabulaire
Tableau à simple entrée, sans hiérarchie (sauf si le caractère est ordinal).
La première colonne renseigne les modalités et les deux suivantes les effectifs et fréquences.
Si le caractère est ordinal, on pourra rajouter une dernière colonne avec les fréquences cumulées.
Ⅰ. Caractères qualitatifs
Tifawt.com
Noms Situation de f amille M.Azim Marié MFarid Veuf
Mme Latifi Mariée Melle Fatiha Célibataire M. Ahmed Divorcé M. Salih Marié
M. Berrada Divorcé Mme Réda Divorcée
Melle Fatiha Célibataire M. Halim Marié M. Chadi Veuf
Mme Faouzi Mariée ... ...
Exemple: On a noté la situation familiale des 150 employés d'une entreprise.
1. Représentation tabulaire
Ⅰ. Caractères qualitatifs
Tifawt.com
On ne s'intéresse pas à la situation personnelle de M. Azim ou de M. Farid, mais à la répartition du caractère "situation familiale" dans la population des 150 employés.
Pour cela il faut, pour chacune des modalités de la variable, déterminer l'effectif correspondant, c'est-à-dire le nombre de personnes ayant cette modalité : il faut dénombrer le nombre de célibataires, le nombre de mariés, etc..
Tifawt.com
Cela peut se résumer par :
Modalités Eff ectif s Marié 80
Célibataire 30 Veuf 20
Divorcé 20
Tifawt.com
On notera x1, x2, ..., xk les différentes modalités, et n1, n2, ... , nk les effectifs associés. Dans le tableau ci-dessus, x1 = "marié",
n1 =
k = La somme des effectifs vaut : La variable que nous venons de voirest…
Tifawt.com
On aurait pu tout aussi bien présenter les résultats sous la forme ci-dessus, par exemple.
Modalité Eff ectif Célibataire 30
Marié 80 Divorcé 20
Veuf 20
Tifawt.com
Par contre, s'il s'agit d'une variable ordinale, les modalités sont toujours présentées dans l'ordre :x1 x2 .... xk , comme dans l'exemple ci-dessous.
Modalités = tailles Eff ectif s = Nombre de personnes de
cette taille XS 10 S 25 M 40 L 32
XL 23 XXL 20
Tifawt.com
L'ensemble des couples { (xi , ni ), i = 1, ... , k } est une série statistique (ordonnée), ou distribution observée de la variable. La somme de tous les ni est-elle toujours égale à n, nombre des observations ? On notera ceci :
effectif total
Tifawt.com
On appellera fréquence relative la valeur
que l'on peut aussi exprimer en pourcentage par fi x 100, c'est le pourcentage d'individus pour lesquels la variable a pris la valeur xi.
Tifawt.com
Complétez le tableau :
Modalités xi Eff ectif ni Fréquence relative f i % Célibataire 30 0.2 20
Marié 80 Divorcé 20
Veuf 20 Eff ectif total : 150
A quoi est égal ici le total de la colonne fréquence ? Et celui de la colonne "pourcentage" ? Il y a, parmi les 150 employés, …….% qui sont mariés.
Tifawt.com
2. Diagramme à bandes Aussi appelé représentation par « tuyaux
d’orgue ». Les modalités sont placées sur un axe
horizontal. Les effectifs (ou fréquences) sont placés sur un
axe vertical. La hauteur de chaque tuyau est proportionnelle
à l’effectif correspondant. Permet de comparer d’un « coup d’œil » les
différentes modalités.
Ⅰ. Caractères qualitatifs
Tifawt.com
0
10
20
30
40
50
60
70
80
90
cadres ouvriers employés ouvriers
Série1
CSP ni fi Cadres 10 0,05 Agents de maîtrise 40 0,2 Employés 60 0,3 Ouvriers 90 0,45
Tifawt.com
3. Diagramme circulaire
L’aire, et donc l’angle au centre d’un secteur, est proportionnelle à la fréquence (ou l’effectif) de la modalité considérée (d’où un angle de fi x 360° pour la modalité i).
Permet de bien visualiser la part relative de chaque modalité.
Ⅰ. Caractères qualitatifs
Tifawt.com
Tifawt.com
Ⅱ. Caractères quantitatifs discrets
Statistiques descriptives à une variable : représentations
Tifawt.com
Plan de la partie
1. Représentation tabulaire. 2. Diagramme bâton.3. Courbe des fréquences
cumulées.
Voici les chapitres que nous allons aborder :
Ⅱ. Caractères quantitatifs discrets
Tifawt.com
1. Représentation tabulaire
Tableau à simple entrée, où les données sont classées par ordre croissant.
La première colonne renseigne les différentes valeurs du caractère, et les trois suivantes les effectifs, fréquences et fréquences cumulées.
Ⅱ. Caractères quantitatifs discrets
Tifawt.com
De même, pour une variable discrète, on notera x1 , x2 , ... , xk les valeurs rangées par ordre croissant, et n1 , n2 , ... , nk les effectifs correspondants.
Tifawt.com
Noms Nombre d'enfants M.Azim 2 MFarid 3
Mme Latifi 0 Melle Fatiha 0 M. Ahmed 1 M. Salih 0
M. Berrada 1 Mme Réda 0
Melle Fatiha 2 M. Halim 4 M. Chadi 1
Mme Faouzi 3 M. Ali 2
Melle Loubna 0 M Fatih 0 M. Said 1 M. Radi 2
Mme Faraj 2
Tifawt.com
Ainsi, à partir de la série brute ci-dessus, construisez le tableau :
Nombre d'enfants xi Eff ectifs ni 0 6
Tifawt.com
Nombre d'enf ants xi Eff ectif ni Fréquence relative f i 0 6 0.33 1 4 0.22
2 5 0.28
3 2 0.11 4 1 0.06
Total : 18 1
Tifawt.com
Voyons un autre exemple : Pour étudier les appels téléphoniques arrivant à un central, on a noté, sur 96 jours comparables, le nombre d'appels reçus entre 9 h et 9 h 10. Les résultats sont consignés dans ce tableau :
Tifawt.com
Quelle est la proportion de jours où le nombre d'appels a été de 2 ?
Nombre d'appels xi
Nombre de jours ni
Fréquence relative f i
% f i 100
0 2 0.0208 2.08 1 14 0.1458 14.58
2 23 0.2396 23.96
3 24 0.2500 25.00 4 18 0.1875 18.75 5 9 0.0938 9.38 6 6 0.0625 6.25
Total : 96 1 100
Tifawt.com
Quelle est la proportion de jours où le nombre d'appels a été supérieur ou égale à 3?
Nombre d'appels xi
Nombre de jours ni
Fréquence relative f i
% f i 100
0 2 0.0208 2.08 1 14 0.1458 14.58
2 23 0.2396 23.96
3 24 0.2500 25.00 4 18 0.1875 18.75 5 9 0.0938 9.38 6 6 0.0625 6.25
Total : 96 1 100
Tifawt.com
Combien y-a-t-il eu de jours où le nombre d'appels a été inférieur ou égal à 2 ?
Nombre d'appels xi
Nombre de jours ni
Fréquence relative f i
% f i 100
0 2 0.0208 2.08 1 14 0.1458 14.58
2 23 0.2396 23.96
3 24 0.2500 25.00 4 18 0.1875 18.75 5 9 0.0938 9.38 6 6 0.0625 6.25
Total : 96 1 100
Tifawt.com
Plus généralement, si { (xi , ni ), i = 1, ..., K }
est la distribution observée d'une variable discrète, n1 + n2 + ... + ni = Ni est le nombre d'individus pour lesquels la variable a été inférieure ou égale à xi..On peut calculer Ni de proche en proche : N1 = n1, N2 = N1 + n2, N3 = N2 + n3, etc ...Les Ni sont les effectifs cumulés croissants.
Tifawt.com
De même ni + ni+1 + ... + nk = N'i est le nombre d'individus pour lesquels la variable a été supérieure ou égale à xi.
Il peut se calculer de proche en proche :N'k = nk , N'k-1 = nk + nk-1 ,
Les N'i sont les effectifs cumulés décroissants.
Tifawt.com
On peut définir de même :Fi = f1 + f2 + ... + fi , fréquences relative cumulées croissantes obtenues de proche en proche par Fi+1 = fi+1 + Fi
F'i = fi + fi+1 + ... + fk , fréquences relative cumulées décroissantes obtenues de proche en proche par F'i = F'i+1 + fi
Fi et F'i peuvent s'exprimer aussi en pourcentage (en multipliant tout par 100).
Tifawt.com
Complétez le tableau :
Nombre d'appels
Fréquence relative en %
Fréquences cumulées croissantes
Fréquences cumulées décroissantes
0 2.08 2.08 1 14.58 16.66 97.92
2 23.96 83.34
3 25.00 65.62 59.38
4 18.75 84.37 5 9.38 93.75 15.63
6 6.25 6.25
Tifawt.com
2. Diagramme bâton
Diagramme bâton des effectifs
A chaque valeur du caractère portée en abscisse, on associe un « bâton » vertical dont la hauteur est proportionnelle à l’effectif.
Cette représentation permet de comparer les effectifs de chaque valeur du caractère.
Ⅱ. Caractères quantitatifs discrets
Tifawt.com
Tifawt.com
3. Courbe des fréquences cumulées
Représente l’évolution des fréquences cumulées.
Le caractère étant discret, la courbe est en « escalier ».
En effet, les valeurs étant séparées, entre chacune d’elle la fréquence cumulée est inchangée, d’où ces paliers.
Ⅱ. Caractères quantitatifs discrets
Tifawt.com
3. Courbe des fréquences cumulées
Ⅱ. Caractères quantitatifs discrets
Diagramme en Escalier
0
20
40
60
80
100
120
0 1 2 3 4 5 6 7
Fréq
uenc
e re
lativ
e cu
mul
ée
Tifawt.com
Ⅲ. Caractères quantitatifs continus
Statistiques descriptives à une variable : représentations
Tifawt.com
Plan de la partie
1. Représentation tabulaire. 2. Histogramme des densités de
fréquence.3. Polygone de fréquences4. Courbe des fréquences cumulées.
Voici les chapitres que nous allons aborder :
Ⅲ. Caractères quantitatifs continus
Tifawt.com
1. Représentation tabulaire
Tableau à simple entrée, où les classes de données sont triées par ordre croissant.
La première colonne renseigne les différentes classes de valeurs du caractère, et les trois suivantes les effectifs, fréquences relatifs et fréquences cumulées.
Si les classes ne sont pas toutes de même amplitude, on rajoute une colonne contenant les densités de fréquence, i.e. la fréquence de la classe divisée par son amplitude.
Ⅲ. Caractères quantitatifs continus
Tifawt.com
Lorsque la variable est continue, ou que la variable peut prendre un grand nombre de valeurs différentes, même si celle-ci est une variable discrète, il convient de regrouper ces valeurs en classes.
À chaque classe on fait correspondre une fréquence ou une fréquence relative, et l’on obtient alors une distribution de fréquence ou de fréquence relative pour valeurs groupées.
Pour construire une distribution de fréquence, de fréquence relative ou de fréquence relative cumulée pour valeurs groupées on doit procéder de la manière suivante :
1. Déterminer le nombre de classes 2. Déterminer l’amplitude des classes3. Déterminer les différentes classes
1. Représentation tabulaire
Tifawt.com
1. Déterminer le nombre de classes :
1) (règle de Sturges)
2)
)(3.31 nLogNC
nNC Nombre d’observationsdans la série statistique
1. Représentation tabulaire
Tifawt.com
2. Calculer l’amplitude des classes : 1) D’une façon plus ou moins arbitraire
2) En utilisant l’étendue
minmax xxE
CC N
EA
Des classes d’amplitudes égales
(Plus grande valeur de la série statistique – Plus petite valeur de la série statistique)
1. Représentation tabulaire
Tifawt.com
3. Déterminer les différentes classes :
cc AxClasseAx 2min2min
cAxClassex min1min
ckc kAxClasseAkx minmin )1(
ccNcc ANxClasseANxc
minmin )1(
1. Représentation tabulaire
Tifawt.com
Voyons l'exemple d'une série brute de 60 valeurs du CA mensuelle d’une entreprise (en 1000dh), et le tableau des effectifs obtenus.
L'inconvénient est que, comme on aura toujours un grand nombre de valeurs différentes, on obtiendra un grand nombre de petits effectifs, ne résumant finalement pas grande chose !
1. Représentation tabulaireExemple 1
Tifawt.com
Tifawt.com
CA (1000dh) Eff ectif s CA (1000dh) Eff ectif s 159 1 169 7 160 0 170 7 161 0 171 9 162 0 172 6 163 2 173 5 164 3 174 2 165 3 175 1 166 0 176 2 167 5 177 1 168 6 Total : 60
Tifawt.com
Une variable continue ne prend pas des valeurs isolées, mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs, on définira des effectifs par intervalles, appelés classes.
Tifawt.com
Afin de simplifier la présentation on peut, quitte à perdre un peu d'information, regrouper les effectifs proches, par exemple 175 d’ effectif 1176 d’ effectif 2177 d’ effectif 1peut être remplacé par [ 175 ; 178 [ d’ effectif 4.
Tifawt.com
On découpera ainsi l'intervalle des valeurs en classes contiguës, de la forme :[ e1 ; e2 [ [ e2 ; e3 [ [ e3 ; e4 [ ....
[ ek ; ek+1 [
et on notera n1, n2, ... , nk les effectifs associés.ni est le nombre d'individus appartenant à la classe [ ei ; ei+1 [.
Tifawt.com
Exemple 1
Classes de CA ( en 1000dh) Eff ectif s [159 - 165 [ 6 [165 - 168 [ 8 [168 - 171 [ 20 [171 - 174 [ 20 [174 - 177 [ 5 [177 - 179 [ 1
Tifawt.com
Exemple 1
Classes de CA ( en 1000dh) Eff ectif s moins de 160 1 [160 - 165 [ 5 [165 - 170 [ 21 [170 - 175 [ 29 175 et plus 4
Tifawt.com
Quel que soit le type de variable on a finalement, pour toute modalité, valeur xi , ou classe [ ei , ei+1 [, un effectif ni , tel que
Il est parfois utile, surtout pour faire des comparaisons entre plusieurs séries, de raisonner plutôt avec des fréquences relatifs.
Tifawt.com
Les définitions d'effectifs et de fréquences cumulés restent les mêmes dans le cas d'une variable continue.
Tifawt.com
Exemple 2 : Le tableau statistiqueExemple 2 : Le tableau statistique (valeurs groupées) (valeurs groupées)
Pour les trois dernières années, le débit mensuel moyen d'une rivière, exprimé en milliers de mètres cubes par seconde, a été le suivant :
Posons X = la variable statistique représentant le débit mensuel moyen d’une rivière.
Variable continue
Tifawt.com
Exemple 2 : Le tableau statistiqueExemple 2 : Le tableau statistique (valeurs groupées) (valeurs groupées)
(1) Nombre de classes :
classesLogNC 1358.6)36(3.31
classesNC 636
(2) L’amplitude des classes : 97.008.005.1 E
17.01617.0697.0
CA
)( 3mdemilliersen
10.193.093.076.076.059.059.042.042.025.025.008.0
6
5
4
3
2
1
ClasseClasseClasseClasseClasseClasse
(3) Détermination des classes :
Débit D
Tifawt.com
Exemple 2 : Le tableau statistiqueExemple 2 : Le tableau statistique (valeurs groupées) (valeurs groupées)
Distribution de fréquence, de fréquence relative et de fréquence relative cumulée :
Tifawt.com
2. Histogramme des densités de fréquence.
Ensemble de rectangles contigus. Pour chaque classe on trace un rectangle :
de base B proportionnelle à l’amplitude de la classe
de hauteur h proportionnelle à la densité de fréquence de la classe
L’aire du rectangle sera alors proportionnelle à la fréquence de la classe.
Ⅲ. Caractères quantitatifs continus
Tifawt.com
2. Histogramme des densités de fréquence.
Double interprétation :
On comparera les densités de fréquence des classes en comparant les hauteurs des rectangles.
On comparera les fréquences des classes en comparant les aires des rectangles.
Ⅲ. Caractères quantitatifs continus
Tifawt.com
Age (ans)
Nombre de personnes dans cette
tranche d'âge
20 à 30 10030 à 40 15040 à 50 90
50 à 65 20
Tifawt.com
Histogramme de fréquence pour valeurs groupées (exemple 2)
Histogramme de fréquence
0
5
10
15
20
25
0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus
Débit D (en milliers m3/sec)
Fréq
uenc
e
Tifawt.com
Histogramme de fréquence relative pour valeurs groupées (exemple 2)
Histogramme de fréquence relative
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus
Débit D (en milliers de m3/sec)
Fréq
uenc
e re
lativ
e
Tifawt.com
3. Polygone de fréquences pour valeurs groupées (exemple 2)
Polygone de fréquence
0
5
10
15
20
25
moins de0,08
0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus
Débit D (en milliers de m3/sec)
Fréq
uenc
e
Tifawt.com
3. Polygone de fréquence relative pour valeurs groupées
Polygone de fréquence relative
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
moins de0,08
0,08 - 0,249 0,25 - 0,419 0,42 - 0,589 0,59 - 0,759 0,76 - 0,929 0,93 et plus
Débit D ( en milliers m3/sec)
Fréq
uenc
e re
lativ
e
Tifawt.com
4. Courbe des fréquences cumulées
Représente l’évolution des fréquences cumulées.
Le caractère étant continu, la courbe l’est également.
Pour la construire, on joint les points de coordonnées (bi,Fi) où bi désigne l’extrémité supérieure de la ième classe.
Ⅲ. Caractères quantitatifs continus
Tifawt.com
Ogive de fréquence relative cumulée pour valeurs groupées
Ogive de fréquence relative cumulée
,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
moins de0,08
0,08 -0,249
0,25 -0,419
0,42 -0,589
0,59 -0,759
0,76 -0,929
0,93 etplus
Débit D (en milliers m3/sec)
Fréq
uenc
e re
lativ
e cu
mul
ée
Tifawt.com
Synthèse
En plus des tableaux et graphiques, on résume l'observation d'une variable quantitative par un petit nombre de paramètres.
Tifawt.com