32
Statistique Descriptive I Chapitre 3: Fractiles et Paramètres de Dispersion Pr. Abdelkrim EL MOUATASIM Pr. Abdelkrim EL MOUATASIM EST & FSE de Guelmim Maroc Site internet : www.el-mouatasim.webs.com

Statistiques chapitre 3 (prof el mouatasim)

Embed Size (px)

DESCRIPTION

statistique

Citation preview

Page 1: Statistiques chapitre 3 (prof el mouatasim)

Statistique Descriptive I Chapitre 3: Fractiles et Paramètres de Dispersion

Pr. Abdelkrim EL MOUATASIMPr. Abdelkrim EL MOUATASIMEST & FSE de GuelmimMaroc

Site internet : www.el-mouatasim.webs.com

Page 2: Statistiques chapitre 3 (prof el mouatasim)

1. Fractiles

� Quartiles� Q1: xi tel que Fi = 0,25 => 1/4 des valeurs lui sont

inférieures, 3/4 lui sont supérieures.� Q2 = Médiane� Q3 : xi tel que Fi = 0,75 => 3/4 des valeurs lui sont

inférieures, 1/4 lui sont supérieures.� Détermination graphique� interpolation (cf médiane)

� Percentiles� 10ième percentile : xi tel que Fi = 0,10

Page 3: Statistiques chapitre 3 (prof el mouatasim)

Les quartiles :

Ils divisent la série en 4 parties égales. Lepremier quartile correspond à 25%, le secondà 50% ( se confond avec la médiane) et letroisième à 75% des observations pour destroisième à 75% des observations pour dessérie rangée par ordre croissant oudécroissant.

Page 4: Statistiques chapitre 3 (prof el mouatasim)

Définition

Si F désigne la fonction des fréquences relative cumulées, le premier (resp. troisième) quartile d’une série statistique sera la plus petite valeur x telle que F(x) ≥ 0,25 (resp. 0,75) . On le note Q1(resp. Q ).

1(resp. Q3).

Interprétation : plus de 25 % des valeurs de la série seront inférieures à Q1 et plus de 75 % lui seront supérieures. De même plus de 75 % des valeurs de la série seront inférieures à Q3 et plus de 25 % lui seront supérieures.

Page 5: Statistiques chapitre 3 (prof el mouatasim)

Détermination pratique : caractère discret

� Si n désigne l’effectif total, Q1 sera égal à xi, où i est le plus petit entier supérieur ou égal à n/4.n/4.

� Q3 sera égal à xi, où i est le plus petit entier supérieur ou égal à 3n/4.

Page 6: Statistiques chapitre 3 (prof el mouatasim)

� Nombre de lettres du prénom des étudiants des PS1 et PS2 de

nombre ni fi Fi

4 3 6,12 6,12

5 2 4,08 10,20

6 20 40,82 51,02

Exemple 1

SUPINFO Tours en 2008.

� Dans l’exemple, on trouve Q1 = 6 et Q3 = 8.

6 20 40,82 51,02

7 9 18,37 69,39

8 5 10,20 79,59

9 7 14,29 93,88

10 1 2,04 95,92

12 1 2,04 97,96

14 1 2,04 100

Page 7: Statistiques chapitre 3 (prof el mouatasim)

La détermination graphique se fait comme pour la médiane :

quartiles : détermination graphique

80

90

100

0

10

20

30

40

50

60

70

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Page 8: Statistiques chapitre 3 (prof el mouatasim)

Détermination pratique : caractère continu

� On commence par déterminer dans quels intervalles se situent Q1 et Q3.

� On procède ensuite par interpolation linéaire.� On procède ensuite par interpolation linéaire.

Page 9: Statistiques chapitre 3 (prof el mouatasim)

� Salaire annuels en milliers d’euros des employés d’une entreprise.

Classes ni fi% Fi% di

]13;15] 12 12,77 12,77 6,38

]15;16] 12 12,76 25,53 12,76

]16;17] 14 14,89 40,42 14,89

Exemple 2Caractères quantitatifs continus

entreprise.� Où di=fi /Aci

96,1577,1253,25

77,1225)1516(15Q1 ====

−−−−−−−−××××−−−−++++====

]17;18] 15 15,96 56,38 15,96

]18;20] 20 21,28 77,66 10,64

]20;22] 12 12,77 90,43 6,38

]22;26] 9 9,57 100 3,19

75,1938,5666,77

38,5675)1820(18Q3 ====

−−−−−−−−××××−−−−++++====

Page 10: Statistiques chapitre 3 (prof el mouatasim)

quartiles : détermination graphique

80

90

100

0

10

20

30

40

50

60

70

12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

Page 11: Statistiques chapitre 3 (prof el mouatasim)

Déciles

� Après les quartiles, on peut définir de la même façon les déciles (voire les centiles) d’une série statistique.

� Il s’agit de regarder les valeurs de la série correspondant à des fréquences relative cumulées de 0,1 ; 0,2 … 0,9.cumulées de 0,1 ; 0,2 … 0,9.

� Pour visualiser la dispersion d’une série statistique, on peut alors représenter une « boîte à moustache ».

� Le graphique suivant se suffit à lui même pour la compréhension.

Page 12: Statistiques chapitre 3 (prof el mouatasim)

boîte à moustache

min max

1er quartile médiane 3éme quartile

1er décile 9éme décile

Page 13: Statistiques chapitre 3 (prof el mouatasim)

2. Paramètres de dispersion

� Deux distributions peuvent, tout en ayantdes caractéristiques de tendance centralevoisines, être très différentes.

� Il est donc nécessaire de mesurer la� Il est donc nécessaire de mesurer ladispersion des valeurs autour destendances centrales.

Page 14: Statistiques chapitre 3 (prof el mouatasim)

L'Étendue : R (Range)

� L'étendue (ou amplitude, ou intervalle de variation) d'une série statistique se définit, uniquement pour des variables quantitatives, comme la différence entre la valeur maximum comme la différence entre la valeur maximum et la valeur minimum de la série.

� R = Maximum (X) - Minimum (X)

= Xmax-Xmin

Page 15: Statistiques chapitre 3 (prof el mouatasim)

� Facile à déterminer, l'étendue ne dépend que des 2 observations extrêmes qui sont parfois le fait de situations exceptionnelles.

� Il est donc difficile de considérer l'étendue comme une mesure stable de la dispersion.dispersion.

Page 16: Statistiques chapitre 3 (prof el mouatasim)

Ecart interquartile

� Afin de diminuer l'influence des valeurs extrêmes on peut tenir compte de valeurs plus stables de la distribution.

� Intervalles interquartiles [ Q1 , Q3 ]: Pour un caractère ordinal ou quantitatif, on définit le quantile � Pour un caractère ordinal ou quantitatif, on définit le quantile d’ordre q (0<q<1) par la valeur de la variable qui correspond à la fréquence cumulée q.

� Si q=1/4, on obtient 3 quantiles: le premier quartile Q, le second Q2 et le 3ème Q3.

� L’écart interquartile est la différence entre le plus grand et le plus petit quartile = Q3 - Q1.

Page 17: Statistiques chapitre 3 (prof el mouatasim)

Exemples

Si l’on reprend les exemples 1 et 2, on obtient :

� Pour le premier exemple (caractère discret) : � Q3 – Q1 = 8-6 = 2.

� Pour le second exemple (caractère continu) :� Q3 – Q1 = 19,75 -15,96 = 3.79.

Page 18: Statistiques chapitre 3 (prof el mouatasim)

Écart absolu

Définition

� Écart absolu moyen : moyenne des valeurs absolues des écarts à la moyenne.absolues des écarts à la moyenne.

� Écart absolu médian : moyenne des valeurs absolues des écarts à la médiane.

e = 1n

ni x i − xi

e'= 1

nn i x i − M e

i

Page 19: Statistiques chapitre 3 (prof el mouatasim)

Écart absolu

Intérêts

� Paramètres simples à calculer, prenant en compte l’ensemble des données.compte l’ensemble des données.

� Très facile d’interprétation.

Inconvénient

� Mauvaises propriétés calculatoires (non linéaire).

� Peu utilisés par les logiciels de statistiques.

Page 20: Statistiques chapitre 3 (prof el mouatasim)

Écart type

Définition

� Écart quadratique moyen : moyenne des carrés des écarts à la moyenne. Souvent appelé variance.écarts à la moyenne. Souvent appelé variance.

� Écart type :

Vx = 1n

ni x i − x( )i

∑2

σ x = Vx

Page 21: Statistiques chapitre 3 (prof el mouatasim)

C'est pourquoi on le note V(x), étant l'écart-typeσ

∑∑∑∑ −−−−==== )²xxi(nin1

)x(σσσσ

s'exprime, contrairement à la variance, dans la même unité que les xi

les xi étant les centres de classes dans le cas continu

n

σ

Page 22: Statistiques chapitre 3 (prof el mouatasim)

� Une variance (et donc un écart-type) est d'autant plus faible que les données sont groupées autour de

car en moyenne les écarts sont plus faibles.

Page 23: Statistiques chapitre 3 (prof el mouatasim)

Propriétés calculatoires

On calcule généralement l'écart-type en complément de la moyenne.

� Formule de Koenig :� Formule de Koenig :

� Invariance par translation et conséquence d’un changement d’échelle :

Vx = 1n

ni x i( )i

∑2

− x( )2= x 2 − x

2

σ ax +b = aσ x

Page 24: Statistiques chapitre 3 (prof el mouatasim)

Écart type

Intérêts� Bonnes propriétés calculatoires. Prend en compte

l’ensemble des valeurs de la série.� Paramètre de dispersion le plus utilisé en statistiques. � Paramètre de dispersion le plus utilisé en statistiques.

Calculé par tous les logiciels et calculatrices.� Sous certaines hypothèses, il permet de construire des

intervalles de confiance autour de la moyenne.� Très utile pour effectuer des « tests statistiques ».

Page 25: Statistiques chapitre 3 (prof el mouatasim)

Écart type

Inconvénients

� La définition de l’écart type est moins naturelle que celle de l’écart absolu.naturelle que celle de l’écart absolu.

� Sa signification et son interprétation ne sont donc pas évidente.

Page 26: Statistiques chapitre 3 (prof el mouatasim)

Exemples

Si l’on reprend les exemples 1 et 2, on obtient :

� Pour le premier exemple (caractère discret) : � e = 1,375, Vx = 3,489, σx = 1,868.

� Pour le second exemple (caractère continu) :� e = 2,308, Vx = 8,023, σx = 2,832.

Page 27: Statistiques chapitre 3 (prof el mouatasim)

Calculons par exemple l'écart-type de la série "nombre d'enfants par famille" V(x) =

Nombre d'enfants

xi Nombre de

salariés ni

0 6

1 4

2 5

3 2

V(x) = donc = enfants

4 1

Total : n = 18

σ

Page 28: Statistiques chapitre 3 (prof el mouatasim)

Paramètres de dispersion relative

� La dispersion mesurée par les paramètres présentés précédemment est qualifiée d’absolue : ils s’expriment dans l’unité de mesure du caractère.

� Pour comparer la dispersion de deux séries statistiques ayant des unités différentes (ou même des ordres de ayant des unités différentes (ou même des ordres de grandeur différents), il faut considérer des paramètres de dispersion relative.

� Un paramètre de dispersion relative sera un rapport du type :

centrale tendance de parametreabsolue dispersion de parametre

=relative dispersion de parametre

Page 29: Statistiques chapitre 3 (prof el mouatasim)

Paramètres de dispersion relative

� Coefficient de variation :

Le coefficient de variation est indépendant des unités choisies, il est utile pour comparer des distributions qui ont des unités différentes.

CVx = σ x

x

utile pour comparer des distributions qui ont des unités différentes.

� Coefficient interquartile relatif :

� Écart moyen relatif :

Q3 − Q1

Me

x

moyen absoluécart

Page 30: Statistiques chapitre 3 (prof el mouatasim)

Paramètres de dispersion relative

Exemples

Pour les exemples 1 et 2, on obtient pour coefficient de variation, coefficient interquartile relatif et écart moyen variation, coefficient interquartile relatif et écart moyen relatif :

� Pour le premier exemple : 26,60%, 33,33% et 19,59%.� Pour le second exemple : 15,70%, 21,53% et 12,79%.� La seconde série apparaît donc moins dispersée que la

première.

Page 31: Statistiques chapitre 3 (prof el mouatasim)

La variance, l'écart-type et le coefficient de variation sont les paramètres de

dispersion les plus utilisés.

En particulier, le coefficient de variation permet de comparer la variabilité relative permet de comparer la variabilité relative

de plusieurs distributions qui diffèrent fortement par leur ordre de grandeur et éventuellement même par leur unité de

mesure

Page 32: Statistiques chapitre 3 (prof el mouatasim)

Pause-réflexion sur la partie ⅡⅡⅡⅡ