Upload
guarin-guegan
View
108
Download
2
Embed Size (px)
Citation preview
Pr. A. SOULAYMANI Cours Statistique 2005 1
Fluctuations de l’échantillonnage
L’échantillonnage&
Ses Fluctuations
Pr. A. SOULAYMANI Cours Statistique 2005 2
Fluctuations de l’échantillonnage
Généralités
Recensement
Population
Echantillonnage
Tous les sujets de la
population sont « examinés »
Une partie des sujets de la population
sont « examinés »
Supposons une population infiniment grande sur laquelle on veut évaluer la fréquence ou la proportion d’un caractère.
Pr. A. SOULAYMANI Cours Statistique 2005 3
Fluctuations de l’échantillonnage
• Recensement = vérité• l’information que l’on désire est
disponible pour tous les individus de la population étudiée.
• Échantillon = estimation de la vérité• l’information n’est disponible que
pour un sous-ensemble des individus de la population étudiée.
Pr. A. SOULAYMANI Cours Statistique 2005 4
Fluctuations de l’échantillonnage
I- L’échantillon
Pr. A. SOULAYMANI Cours Statistique 2005 5
Fluctuations de l’échantillonnage
L’échantillon en lui-même n’est pas intéressant,
Plusieurs échantillons peuvent être constitués
En général,on procède à ce qu’on appelle échantillonnage.L’échantillon est donc un groupe restreint de la population dont il est issu.
Pop
ce sont les conclusions sur la population que l’on peut tirer de son observation qui en font l’intérêt : Inférence.
Pr. A. SOULAYMANI Cours Statistique 2005 6
Fluctuations de l’échantillonnage
Il s’agit là, d’un tirage non aléatoire ou biaisé.
Cet échantillon est dit non représentatif si au cours du tirage, on procède à un choix préalable ou à une sélection.
Pop
Les conclusions sur la population ne peuvent pas être tirer de l’observation de tels échantillons.
Tirage Biaisé
Echantillon non représentatif
Pr. A. SOULAYMANI Cours Statistique 2005 7
Fluctuations de l’échantillonnage
Pour que l’échantillon soit représentatif, il faut que tous les individus de la population aient la même chance d’être tirés.
Ceci peut être obtenu par un brassage adéquat et convenable des individus et permet de tirer véritablement au hasard un échantillon représentatif.
Tirage Aléatoire
Pr. A. SOULAYMANI Cours Statistique 2005 8
Fluctuations de l’échantillonnage
En définitif, un échantillon représentatif est un échantillon issu de façon
parfaitement aléatoire, non conditionné par un choix préalable ou sélection.
Tirage parfaitementau hasard
Pr. A. SOULAYMANI Cours Statistique 2005 9
Fluctuations de l’échantillonnage
• Un échantillon a pour but de représenter la population, donc être représentatif.
• En quelque sorte, l’échantillon est un modèle pour la population.
• Il n’est pas possible de déterminer si un échantillon est représentatif ou non.
• Un bon plan d’échantillonnage peut cependant contribuer à éliminer des échantillons non représentatifs.
Pr. A. SOULAYMANI Cours Statistique 2005 10
Fluctuations de l’échantillonnage
Étapes à suivre
• Déterminer l’objectif de l’échantillonnage• Déterminer la condition recherchée• Définir la population à vérifier• Déterminer la taille de l’échantillonnage• Sélectionner les échantillons• Effectuer les tests et évaluer les résultats• Analyser les erreurs projetées• Plans d’échantillonnage statistique
Pr. A. SOULAYMANI Cours Statistique 2005 11
Fluctuations de l’échantillonnage
II- Le Pari
Pr. A. SOULAYMANI Cours Statistique 2005 12
Fluctuations de l’échantillonnage
Considérons une population où la proportion théorique d’un caractère donné est pth (p théorique).
Population
Pthéorique
Tirage parfaitementau hasard
Échantillon
Pobservée.
Pr. A. SOULAYMANI Cours Statistique 2005 13
Fluctuations de l’échantillonnage
Population
Pthéorique
Échantillon
Pobservée.
Tirage parfaitement
au hasard
La proportion observée du caractère (sa fréquence) au niveau de l’échantillon Pobs n’est pas obligatoirement
identique à la proportion théorique au niveau de la population dont il est issu, même si l’échantillon est représentatif.
Elle peut prendre toutes les valeurs possibles comprise entre 0 et 1.
C’est les fluctuations de l’échantillonnage
Pr. A. SOULAYMANI Cours Statistique 2005 14
Fluctuations de l’échantillonnage
Exemple de Pari
Population
p théorique = 050 Échantillon
p observée
Tirage parfaitement au hasard
En générale pobs fluctue autour de pth et on peut
calculer la probabilité pour que pobs sorte d’une
certaine marge entourant pth.
Considérons une population où la proportion théorique d’un caractère donné est pth = 0,50 (p théorique).
Pr. A. SOULAYMANI Cours Statistique 2005 15
Fluctuations de l’échantillonnage
on peut parier que la fréquence au niveau d’un échantillon tiré au hasard de cette population sera comprise entre 40% et 60% (0.40 ≤ pobs .≤ 0.60).
- Qu’elle est la probabilité pour que notre pari soit juste ? (p ?)
- Quel est le risque qu’on a pris en choisissant cet intervalle [0.40-0.60] ? ( ?)
et p présente la relation = 1 – p et p = 1 - .
Une question s’impose à ce niveau et peut poser de deux façons différentes mais complémentaires:
Pr. A. SOULAYMANI Cours Statistique 2005 16
Fluctuations de l’échantillonnage
Intervalle de pari
L’intervalle de pari est défini par un écart e autour de pth. ; ainsi, l’intervalle 40 à 60% autour de 50% est défini par e = 10%.
La table de l’écart réduit ( loi normale) ne peut être utilisée directement pour évaluer le risque du pari ; de ce fait, l’écart e est transformé en écart réduit appelé écart réduit observé ou calculé tel que :
0,50 0,600,400 1
Pth.
Pr. A. SOULAYMANI Cours Statistique 2005 17
Fluctuations de l’échantillonnage
Npthpthpp
Npthpth
eeThObs
Obs )1()1(..
.
Dans l’exemple précédant, en supposant que l’effectif de l’échantillon est de 100, on aura :
205.0
10.0
10050.050.0
10.0
x
e
Pr. A. SOULAYMANI Cours Statistique 2005 18
Fluctuations de l’échantillonnage
La table de l’écart réduit donne pour tout écart observé le risque qui lui est associé.Pour la valeur de 2 de notre exemple, il n’y a pas de correspondance directe mais on peut remarquer que notre valeur est comprise entre deux risque :
th = 1,96 < os. = 2 < th = 2,058
Pr. A. SOULAYMANI Cours Statistique 2005 19
Fluctuations de l’échantillonnage
Donc, lorsqu’on a parié sur l’intervalle 40%-60% sur un échantillon de 100 tiré d’une population pour laquelle la fréquence théorique est de 50%, on a 5% de chance de se tromper contre une probabilité de 95% de tomber sur cet intervalle par tirage au hasard.
Sans chercher à interpoler,on
prendra toujours la valeur la
plus proche de 2 qui correspond
dans ce cas à = 5% et p = 95%.
th=1,96 < obs.=2 < th=2,058
Pr. A. SOULAYMANI Cours Statistique 2005 20
Fluctuations de l’échantillonnage
En conclusion, lorsqu’on a parié sur l’intervalle 40%-60% sur un échantillon de 100 tiré d’une population pour laquelle la fréquence théorique est de 50%, on a 5% de chance de se tromper contre une probabilité de 95% de tomber sur cet intervalle par tirage au hasard.
Remarque : La table de l’écart réduit ne peut être utilisée que si l’échantillon est « grand ». Pour le calcul; on considère que l’échantillon est « grand » si et seulement si Np ≥ 5 et N(1-p) ≥ 5.
Pr. A. SOULAYMANI Cours Statistique 2005 21
Fluctuations de l’échantillonnage
III- Loi des Grands Nombres
Pr. A. SOULAYMANI Cours Statistique 2005 22
Fluctuations de l’échantillonnage
Avec une urne présentant une fréquence pth.= 50% ;
on se propose d’estimer le risque d’erreur pour un même intervalle de pari [0.40-0.60] mais pour des effectifs différents (N1=16 ; N2=100 et N3=400).
N e
16 0,125 0,10 0,80 0,47
100 0,05 0,10 2 0,05
400 0,025 0,10 4 <0,001
Npthpth .)1.(
Npppp
thth
thobs
obs )1(
Pr. A. SOULAYMANI Cours Statistique 2005 23
Fluctuations de l’échantillonnage
Ainsi, pour le même écart absolu (10%), on prend beaucoup plus de risques avec des petits échantillons.
c’est la loi des grands nombre
Donc, l’écart entre la composition de l’échantillon et celle de la population a d’autant moins de chance d’être dépassé lorsque la taille de l’échantillon est grande.