Opération et systèmes de décision Faculté des Sciences de l administration MQT-21919...

Preview:

Citation preview

Opération et systèmes de décisionFaculté des Sciences de l ’administration

MQT-21919 Probabilités et statistique

Les statistiques descriptives

LecturesLectures

Livre du cours : – Sections 2.1, 2.2, annexe 2.2

Volume recommandé: "Statistique et gestion en économie"– Sections 2.1, 2.2

Les statistiques descriptivesLes statistiques descriptives

Les trois étapes du traitement des données statistiques:

1) La synthèse des résultats à l’aide d’un tableau;2) La représentation graphique du phénomène

étudié;3) Le calcul des mesures caractéristiques.

Étape 1 : La présentation des donnéesÉtape 1 : La présentation des données

Les tableaux statistiques :

Distribution de fréquences absolues Distribution de fréquences relatives Distribution de fréquences relatives cumulées

Notation :

X: une variable statistique (caractère)

xi : (modalités) valeurs possibles prises par la variable statistique X

fi : le nombre d’unités (fréquence absolue) présentant la valeur xi

fi /n : la fréquence relative de xi

Fi: la fréquence cumulée des valeurs prises par la variable X qui sont inférieures ou égales à xi

Fi /n: fréquence relative cumulée - c'est la proportion des valeurs prises par la variable X qui sont inférieures ou égales à xi

n: taille de l'échantillon

Étape 1 : La présentation des donnéesÉtape 1 : La présentation des données(variable discrète)(variable discrète)

La distribution de fréquence d’une variable statistique X est une fonction qui, à chaque valeur xi de la variable, fait correspondre sa fréquence fi .

De façon similaire on définit la distribution de fréquence relative.

Étape 1 : La présentation des données Étape 1 : La présentation des données (variable discrète)(variable discrète)

La clinique médicale MD a fait une étude sur tous ses dossiers de varicelle recensée cette année et on y a notamment enregistré le nombre de frères et sœurs de chacun des patients atteints de cette maladie contagieuse. On relève les données brutes suivantes :Posons X = la variable statistique représentant le nombre de frères et sœurs de chacun des patients atteints de cette maladie contagieuse. Calculer les fréquences et dessiner le diagramme en bâtons.2 1 3 0 6 0 1 2 3 13 0 2 0 4 1 0 4 0 21 1 3 2 3 3 2 1 1 10 1 2 4 1 2 2 7 3 20 1 1 2 5 5 3 4 3 01 2 2 3 0 1 2 0 2 2

Voir chiffrier Excel: exemple 1: données non groupées (varicelle)

Exemple 1 Exemple 1 (données non groupées)(données non groupées)

Calcul des fréquencesCalcul des fréquences

n = 60 8 classes

xi fi fi/n Fi/n

Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique

Diagramme en bâtons

Distribution de fréquence

(données non groupées)

Le nombre de frères et soeurs

76543210

Fré

qu

en

ce

20

10

0 2

4

10

1615

11

Exemple 1 (pour valeurs quantitatives non groupées, ou données qualitatives, variable discrète)

Insertion de graphiqueInsertion de graphique

Utilitaire d'analyseUtilitaire d'analyse

Les données sont souvent groupées en classes lorsque la variable est continue ou que celle-ci peut prendre un grand nombre de valeurs différentes (même si cette variable est discrète).

Pour construire une distribution de fréquence, de fréquence relative ou de fréquence relative cumulée, on doit d’abord déterminer le nombre de classes.

Étape 1 : La présentation des données (valeurs Étape 1 : La présentation des données (valeurs groupées)groupées)

Valeurs groupées en classes

Comment calculer le nombre de classes ?

1) 1 + 3,3 log10 n (règle de Sturges)

2)

Étape 1 : La présentation des données (valeurs Étape 1 : La présentation des données (valeurs groupées)groupées)

n

Pour obtenir des classes d’amplitude égale :

Trouvons E (l’étendue):E=Valeur maximale - Valeur minimale

Calculons l’amplitude:Amplitude=E/nombre de classes

Étape 1 : La présentation des données (valeurs Étape 1 : La présentation des données (valeurs groupées)groupées)

Pour les trois dernières années, le débit mensuel moyen d'une rivière, exprimé en milliers de mètres cubes par seconde, a été le suivant :

0,22 0,09 0,08 0,10 1,05 0,36 0,18 0,15 0,150,22 0,11 0,09 0,09 0,19 0,68 0,78 0,42 0,150,66 0,39 0,34 0,19 0,15 0,08 0,08 0,37 0,670,23 0,16 0,35 0,34 0,21 0,11 0,32 0,22 0,36

Voir chiffrier Excel: exemple 2: données groupées (Rivière)

Exemple 2 - données groupéesExemple 2 - données groupées

Trouvons n le nombre de classes:n= =6

ou encore: 1 + 3,3 log n = 1+3,3 log 36= 6,1358Trouvons E (l’étendue):

E=1,05 - 0,08=0,97

Calculons l’amplitude:Amplitude=0,97/6=0,17

On choisit la limite de la dernière classe un peu plus élevée que 1,05, disons 1,06, et on construit les limites des classes précédentes à reculons, en soustrayant 0,17 à chaque fois

Étape 1 : La présentation des donnéesÉtape 1 : La présentation des données

36

Les classesLes classes

Les classes sont:

(0,04-0,21]

(0,21-0,38]

(0,38-0,55]

(0,55-0,72]

(0,72-0,89]

(0,89-1,06]

Règle de 3 pour les données groupées Règle de 3 pour les données groupées (interpolation linéaire)(interpolation linéaire)

Lorsqu’on est en présence de données groupées la ième valeur d’une classe: Vi est:

1i

i IV

CV B ( i )

f

BI: limite inférieure de la classe qui contient Vi

fVi: fréquence absolue de la classe contenant Vi

C: amplitude de la classe

Les représentations graphiques permettent de visualiser le résumé statistique que nous donne la distribution de fréquence, de fréquence relative et de fréquence relative cumulée.

Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique

Le diagramme en bâtons (en barres) pour les données non groupées

– En abscisse: les valeurs de la variable discrète– En ordonnée: bâton de longueur proportionnelle à la

fréquence de chaque variable L’histogramme (pour les données groupées)

– Rectangles juxtaposés dont chacune des bases est égale à l’intervalle de chaque classe, et dont la hauteur est telle que la surface soit proportionnelle à la fréquence de la classe correspondante

Le polygone de fréquences– Distribution des fréquences sous-forme de courbe

Ogive (polygone de fréquence relative cumulée)

Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique

Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique

Exemple 1 - Diagramme en barres (en bâtons)

Distribution de fréquence relative

pour variable discrète

Le nombre de frères et soeurs

76543210

Fré

qu

en

ce

re

lative

( P

ou

rce

nta

ge

)

30

20

10

03

7

17

2725

18

Utiliser: Insertion/Graphique/Histogramme dans Excel

Histogramme Histogramme

Nous avons déjà défini les classes

HistogrammeHistogramme

Les classes sont définies automatiquement par Excel

Exemple 2 (pour valeurs groupées)

- Histogramme et ogive

Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique

Histogramme

0

18

11

2 31 1 0

0

5

10

15

20

0.04 0.21 0.38 0.55 0.72 0.89 1.06 ouplus...

Classes

Fréquence

.00%

20.00%

40.00%

60.00%

80.00%

100.00%

120.00%

Fréquence

% cumulé

Utiliser Outils/Utilitaire d’analyse/Histogramme dans Excel

Exemple 2 (pour valeurs groupées )

- Polygone de fréquence doit commencer et se terminer à 0

Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique

Polygone de fréquences

0

5

10

15

20

1 2 3 4 5 6 7 8

Classes

Fréquence

Utiliser: Insertion/Graphique/Courbes dans Excel

Polygone de fréquence dans Polygone de fréquence dans ExcelExcel

Recommended