Upload
adelphe-rouyer
View
128
Download
13
Embed Size (px)
Citation preview
Cours de Iharantsoa Zoëla RAMANGASON
Programme
Partie introductiveLa statistiqueTerminologies
I. Distributions statistiques unidimensionnellesI.1. Distributions à caractère qualitatif
I.1.1. Tableau statistiqueI.1.2. Représentations graphiques
I.2. Distributions à caractère quantitatif
Cours de Iharantsoa Zoëla RAMANGASON
Programme (suite)
I.2.1. Variables statistiques discrètesI.2.1.1. Tableau statistiqueI.2.1.2. Représentations graphiques
I.2.2. Variables statistiques continuesI.2.2.1. Tableau statistiqueI.2.2.2. Représentations graphiques
Contrôle continu
Cours de Iharantsoa Zoëla RAMANGASON
I.3. Les caractéristiques de positionI.3.1. Le ModeI.3.2. Les quantiles
I.3.2.1. Détermination d’un quantileI.3.2.2. La MédianeI.3.2.3. Les quartilesI.3.2.4. Les déciles
I.3.3. La moyenne arithmétique pondérée
Programme (suite)
Cours de Iharantsoa Zoëla RAMANGASON
I.4. Les caractéristiques de dispersionI.4.1. L’écart moyen absoluI.4.2. La variance et l’écart-typeI.4.3. Le coefficient de variationI.4.4. Les moments centrés
I.5. Les caractéristiques de formeI.5.1. Le coefficient d’asymétrie de Fisher
Programme (suite)
I.5.2. Le coefficient d’aplatissement de Pearson
I.6. Les caractéristiques de concentrationI.6.1. La courbe de concentrationI.6.2. L’indice de Gini
Cours de Iharantsoa Zoëla RAMANGASON
Programme (suite)
Cours de Iharantsoa Zoëla RAMANGASON
II. Distributions statistiques bidimensionnellesII.1. Distributions marginales
II.1.1. Tableau à double entréeII.1.2. EffectifsII.1.3. Fréquences
II.2. Représentation graphique: nuage de points pondérés
Programme (suite)
Cours de Iharantsoa Zoëla RAMANGASON
II.3. Les caractéristiques globalesII.3.1. Les moyennesII.3.2. Les variances et les écart-types
II.4. Le moment centré d’ordre 1.1II.5. Le coefficient de corrélationII.6. La droite des moindres carrés
Programme (suite)
Cours de Iharantsoa Zoëla RAMANGASON
Partie introductive
La statistique
Etymologie: sciences de l’état
La statistique est une branche des mathématiques appliquées qui a pour objet l’étude des phénomènes mettant en jeu un
grand nombre d’éléments
Cours de Iharantsoa Zoëla RAMANGASON
Partie introductive
La statistique
La statistique est également l’ensemble de données numériques concernant l’état ou
l’évolution d’un phénomène qu’on étudie au moyen de la statistique
La statistique descriptive est la statistique utilisée en démographie
Cours de Iharantsoa Zoëla RAMANGASON
Partie introductive
La statistique
Les statistiques couvrent les domaines d’application telles que la gestion,
l’économétrie, la recherche démographique, l’agronomie, la médecine, la biologie …
Utilités: pour étudier objectivement un phénomène; pour aider à prendre une décision
rationnelle
Cours de Iharantsoa Zoëla RAMANGASON
Partie introductive
TerminologiesPhénomène: tout fait extérieur qui se manifeste
à la conscience par l’intermédiaire des sens; toute expérience intérieure qui se manifeste à la
conscienceDonnées: codes, compréhensibles ou non, que
nous voyons, entendons, ou percevons, mais qui n’ont aucune utilité si nous ne possédons pas les
clés pour les décrypter
Cours de Iharantsoa Zoëla RAMANGASON
Partie introductive
TerminologiesInformation: données traitées (sélectionnées,
transformées et diffusées aux personnes qui en ont besoin)
Population statistique: l’ensemble homogène des personnes, des animaux ou des objets
étudiés
Cours de Iharantsoa Zoëla RAMANGASON
Partie introductive
TerminologiesUnité ou individu statistique: l’élément représentatif composant la population
statistiqueEffectif total: nombre d’individus observés, noté
« n »Caractère: aspect particulier de l’individu auquel
on s’intéresse. Il peut être qualitatif ou quantitatif
Cours de Iharantsoa Zoëla RAMANGASON
Partie introductive
Exercices1. Prenez une décision quelconque que vous
devriez prendre. De quels éléments avez-vous besoin pour que vous puissiez prendre la bonne
décision?
2. Observez l’évolution d’un phénomène quelconque. Prenez note de cette évolution
Cours de Iharantsoa Zoëla RAMANGASON
I. Distributions statistiques unidimensionnelles
I.1. Distributions à caractère qualitatif
Un caractère est qualitatif s’il est lié à une observation ne faisant pas l’objet d’une mesure
Modalités « Ci »: ce sont les différentes rubriques associées à un caractère qualitatifEx: Le caractère « sexe » comporte deux modalités: « masculin » et « féminin »
Cours de Iharantsoa Zoëla RAMANGASON
I.1. Distributions à caractère qualitatif
Propriétés: Les modalités d’un caractère doivent être exhaustives et disjointes. A chaque individu, on doit pouvoir associer une modalité et une seule.Lorsque les modalités ne permettent pas l’exhaustivité, on peut ajouter une modalité « divers » ou « autres », regroupant les individus impossibles à classer
Cours de Iharantsoa Zoëla RAMANGASON
I.1. Distributions à caractère qualitatif
Effectif « ni »: nombre de fois où la modalité numéro « i » a été observéeFréquence « fi »: quotient de l’effectif « ni » par l’effectif total « n »
telle que
Démontrez que:
Cours de Iharantsoa Zoëla RAMANGASON
I.1. Distributions à caractère qualitatif
I.1.1. Tableau statistique
ModalitésCi
Effectifsni
Fréquencesfi %
C1 n1 f1
C2 n2 f2
… … …Ck nk fk
Cours de Iharantsoa Zoëla RAMANGASON
I.1. Distributions à caractère qualitatif
I.1.2. Représentations graphiquesDiagramme à barres
Colérique
Sanguin
Flegmatique
Mélancolique
0 2 4 6 8 10 12 14 16
Effectifs
Axe des abscisses: ni ou fi
Axe des ordonnées: Ci
Cours de Iharantsoa Zoëla RAMANGASON
I.1. Distributions à caractère qualitatif
I.1.2. Représentations graphiquesDiagramme en colonnes/en tuyaux d’orgue
Axe des abscisses: Ci
Axe des ordonnées:ni ou fi
Colérique Sanguin Flegmatique Mélancolique0
2
4
6
8
10
12
14
16
Effectifs
Cours de Iharantsoa Zoëla RAMANGASON
I.1. Distributions à caractère qualitatif
I.1.2. Représentations graphiquesDiagramme à secteurs
360° correspond à 100% de fi
3.4483%
51.7241%
20.6897%
24.1379%
ColériqueSanguinFlegmatiqueMélancolique
Cours de Iharantsoa Zoëla RAMANGASON
I.1. Distributions à caractère qualitatif
I.1.2. Représentations graphiquesDiagramme figuratif
Colérique Sanguin Flegmatique Mélancolique
Cours de Iharantsoa Zoëla RAMANGASON
I.1. Distributions à caractère qualitatif
Applications numériquesEtude des tempéraments des élèves de la classe
Cours de Iharantsoa Zoëla RAMANGASON
I. Distributions statistiques unidimensionnelles
I.2. Distribution à caractère quantitatifUn caractère est quantitatif s’il est mesurable par un nombre
Les variables statistiques comprennent les grandeurs liées à l’espace, au temps, à la masse ou aux combinaisons de ces diverses grandeurs
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.1. Variables statistiques discrètes (VSD)
Les variables statistiques discrètes (VSD) sont des variables dont les seules valeurs possibles sont distinctes et isoléesValeurs observées: « xi » au lieu de « Ci »
Effectifs: « ni »
Fréquences:
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.1. Variables statistiques discrètes (VSD)Fréquences cumulées croissantes: cumul des fréquences associées aux valeurs du caractère strictement inférieures à x. On les note « Fi »
Fi = Fi-1 + fi
I.2.1.1. Tableau statistiqueSur le tableau statistique, mettez xi, ni et fi entre les lignes et Fi sur les lignes
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.1. Variables statistiques discrètes (VSD)
I.2.1.1. Tableau statistiqueVariablexi
Effectifni
Fréquence relativefi %
Fréquence cumuléeFi %
F0 = 0 %x1 n1 f1
F1
x2 n2 f2F2
… … ……
xk nk fk
Fk = 100 %
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.1. Variables statistiques discrètes (VSD)
I.2.1.2. Représentations graphiquesDiagramme différentiel / en bâton
Axe des abscisses: xi
Axe des ordonnées: ni ou fi
15 16 17 18 19 210
2
4
6
8
10
12
14
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.1. Variables statistiques discrètes (VSD)
I.2.1.2. Représentations graphiquesDiagramme intégral / cumulatif
Axe des abscisses: xi
Axe des ordonnées: Fi
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.1. Variables statistiques discrètes (VSD)
Applications numériques1. Etude des âges des élèves de la classe2. Etude des années de naissance des élèves de
la classe
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.2. Variables statistiques continues (VSC)
Dans un intervalle de valeurs, les valeurs possibles des variables statistiques continues (VSC) sont en nombre infiniExtrémité de classe: « ei »
Amplitude: ai = ei – ei-1
Centre de classe:ei-1
ei
xi ai
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.2. Variables statistiques continues (VSC)
Effectifs: « ni »
Fréquences: Fréquences cumulées croissantes: cumul des fréquences associées aux valeurs du caractère strictement inférieures à x. On les note « Fi »
Fi = Fi-1 + fi
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.2. Variables statistiques continues (VSC)
I.2.2.1. Tableau statistiqueSur le tableau statistique, mettez ai, xi, ni et fi entre les lignes et ei et Fi sur les lignesei ai xi ni fi Fi
e0 F0 = 0%a1 x1 n1 f1e1 F1a2 x2 n2 f2e2 F2… … … …… …ak xk nk fkek Fk = 100%
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.2. Variables statistiques continues (VSC)
I.2.2.2. Représentations graphiquesHistogramme
Axe des abscisses: xi
Axe des ordonnées: ni ou fi
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.2. Variables statistiques continues (VSC)
I.2.2.2. Représentations graphiquesPolygone des fréquences
Axe des abscisses: xi
Axe des ordonnées: fi
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.2. Variables statistiques continues (VSC)
I.2.2.2. Représentations graphiquesDans le cas où les amplitudes sont différentes
- On utilise la densité pour tracer l’histogramme des effectifs- On utilise la fréquence rectifiée pour tracer l’histogramme ou le polygone des fréquences, et où a est le PGCD des amplitudes
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.2. Variables statistiques continues (VSC)
I.2.2.2. Représentations graphiquesCourbe des fréquences cumulées croissantes
Axe des abscisses: xi
Axe des ordonnées: Fi
16 17 18 19 20 21 220.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
Fi
Cours de Iharantsoa Zoëla RAMANGASON
I.2. Distributions à caractère quantitatif
I.2.1. Variables statistiques continues (VSC)
Applications numériques
Etude des âges des élèves de la classe
Cours de Iharantsoa Zoëla RAMANGASON
I.3.1. Le ModeNoté « Mo ». C’est la (les) valeur(s) observée(s) d’effectif maximum.Cas d’une VSC: on ne peut parler que d’« intervalle modal ».Une série possédant plusieurs modes est dite « plurimodale ».
I.3. Caractéristiques de position
Cours de Iharantsoa Zoëla RAMANGASON
I.3.2. Les quantilesOn appelle quantile d’ordre α%, noté Qα, la valeur xi du caractère telle que α% des valeurs observées soient strictement inférieures à xi.
I.3.2.1. Détermination d’un quantile d’ordre α% (0< α<100)
Cas d’une VSD: La courbe cumulative est constituée de paliers horizontaux.
I.3. Caractéristiques de position
Deux cas doivent être distingués:1° Aucun palier horizontal n’a pour ordonnée la valeur α%. On convient alors de considérer comme Qα la valeur observée xi telle que l’on ait: F(xi)<α%<F(xi+1). On a: Qα=xi.
2° Un palier horizontal a pour ordonnée la valeur α%. On n’a pas de Qα mais un intervalle [xi;xi+1[.
Cours de Iharantsoa Zoëla RAMANGASON
I.3. Caractéristiques de position
Cours de Iharantsoa Zoëla RAMANGASON
I.3. Caractéristiques de position
α%F(xi+1)
F(xi)
Xi-1 Xi Xi+1
Cas 1°
Cours de Iharantsoa Zoëla RAMANGASON
I.3. Caractéristiques de position
α%
F(xi)
Xi-1 Xi Xi+1
Cas 2°
Cours de Iharantsoa Zoëla RAMANGASON
Cas d’une VSC: Pour calculer le Qα, il faut déterminer la classe dans laquelle les Fi atteignent α%.Le Qα est, dans Fi, la valeur qui vérifie F(Qα)=α %
I.3. Caractéristiques de position
Cours de Iharantsoa Zoëla RAMANGASON
I.3.2.2. La MédianeLa médiane, notée Me, est le Q50. Elle partage la série des valeurs observées en deux séries de même taille.La médiane est, dans la fréquence cumulée, la valeur qui vérifie F(Me) = 50%.
I.3. Caractéristiques de position
Cours de Iharantsoa Zoëla RAMANGASON
I.3.2.3. Les quartilesLes trois quartiles partagent la série en 4 séries de même taille: Q25, Q50 et Q75.
I.3.2.4. Les décilesLes 9 déciles partagent la série en 10 séries de même taille: Q10, Q20, Q30, Q40, Q50, Q60, Q70, Q80, et Q90
I.3. Caractéristiques de position
Cours de Iharantsoa Zoëla RAMANGASON
I.3.3. La moyenne arithmétique pondérée
C’est le paramètre de position le plus utilisé. En effet, la moyenne arithmétique est définie de façon objective. En plus, elle possède une signification concrète.
I.3. Caractéristiques de position
Cours de Iharantsoa Zoëla RAMANGASON
I.4.1. L’écart moyen absolu1° Ecart moyen absolu par rapport à la moyenne
2° Ecart moyen absolu par rapport à la médiane
I.4 Les caractéristiques de dispersion
Cours de Iharantsoa Zoëla RAMANGASON
I.4.2. La variance et l’écart-type
La variance:
L’écart-type:
I.4 Les caractéristiques de dispersion
I.4.3. Le coefficient de variation
(en pourcentage)
I.4.4. Les moments centrés d’ordre r
Egalités remarquables:
Cours de Iharantsoa Zoëla RAMANGASON
I.4 Les caractéristiques de dispersion
Cours de Iharantsoa Zoëla RAMANGASON
I.5.1. Le coefficient d’asymétrie de Fisher
Si γ<0, la distribution est étalée vers la gauche (biais négatif)
I.5. Les caractéristiques de forme
Cours de Iharantsoa Zoëla RAMANGASON
Si γ>0, la distribution est étalée vers la droite (biais positif)
Si γ=0, la distribution est symétrique
I.5. Les caractéristiques de forme
I.5.2. Le coefficient d’aplatissement de Pearson
Si β=3, la distribution est « normale » (courbe « en cloche » de Gauss)
Cours de Iharantsoa Zoëla RAMANGASON
I.5. Les caractéristiques de forme
Si β<3, la distribution est plus aplatie que la normale (hyponormale ou platykurtique)
Si β>3, la distribution est moins aplatie que la normale (hypernormale ou leptokyrtique)
Cours de Iharantsoa Zoëla RAMANGASON
I.5. Les caractéristiques de forme
I.6.1. La courbe de concentration
Axe des abscisses: Fi
Axe des ordonnées: Qi
Qi sont les valeurs globales relatives cumulées croissantes: Qi=Qi-1+qi, avec:
Cours de Iharantsoa Zoëla RAMANGASON
I.6. Les caractéristiques de concentration
Faible concentration
Forte concentration
Cours de Iharantsoa Zoëla RAMANGASON
I.6. Les caractéristiques de concentration
I.6.2. L’indice de GiniMéthode des triangles:
g est toujours compris entre 0 et 1. Plus la valeur de g est grande, plus la concentration est forte.
Cours de Iharantsoa Zoëla RAMANGASON
I.6. Les caractéristiques de concentration
Cours de Iharantsoa Zoëla RAMANGASON
II.1. Distributions marginalesII.1.1. Tableau à double entrée
II. Distributions statistiques bidimensionnelles
xi yj y1 y2 y3 ni.
x1 n11 n12 n13 n1.
x2 n21 n22 n23 n2.
n.j n.1 n.2 n.3 n..
Cours de Iharantsoa Zoëla RAMANGASON
II.1. Distributions marginalesII.1.2. Effectifs
II. Distributions statistiques bidimensionnelles
Cours de Iharantsoa Zoëla RAMANGASON
II.1. Distributions marginalesII.1.3. Fréquences
II. Distributions statistiques bidimensionnelles
Cours de Iharantsoa Zoëla RAMANGASON
II.2. Représentation graphique: nuage de points pondérés
Abscisses: xi
Ordonnées: yj
(Mettez leseffectifs entreparenthèses,à côté despoints)
II. Distributions statistiques bidimensionnelles
0 1 2 3 4 5 6 7 8 90
1
2
3
4
5
6
7
Cours de Iharantsoa Zoëla RAMANGASON
II.3. Les caractéristiques globalesII.3.1. Les moyennes
II. Distributions statistiques bidimensionnelles
Cours de Iharantsoa Zoëla RAMANGASON
II.3. Les caractéristiques globalesII.3.2. Les variances et les écart-types
II. Distributions statistiques bidimensionnelles
Cours de Iharantsoa Zoëla RAMANGASON
II.4. Le moment centré d’ordre 1.1C’est la covariance du couple (x,y)
II. Distributions statistiques bidimensionnelles
Cours de Iharantsoa Zoëla RAMANGASON
II.5. Le coefficient de corrélation
On a:
Le nuage de points est une droite si et seulement si, r=-1 (droite descendante) ou r=1 (droite ascendante)
II. Distributions statistiques bidimensionnelles
Cours de Iharantsoa Zoëla RAMANGASON
II.6. La droite des moindres carrés
II. Distributions statistiques bidimensionnelles
Cours de Iharantsoa Zoëla RAMANGASON
Applications numériquesEtude de la variation des tailles en fonction des
âges des élèves de la classe
II. Distributions statistiques bidimensionnelles