Upload
others
View
9
Download
2
Embed Size (px)
Citation preview
Ch 5: Échantillonnage et Ch 5: Échantillonnage et estimation des paramètresestimation des paramètres
1. Échantillon, paramètre et statistique1. Échantillon, paramètre et statistique
1.1 Échantillon aléatoire1.1 Échantillon aléatoire
Un échantillon aléatoire est une suite de variablesUn échantillon aléatoire est une suite de variables
aléatoires aléatoires indépendantesindépendantes et de et de mêmemême
loiloi qu’une qu’une caractéristique caractéristique X d’une population. X d’une population.
nXX ,,1
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
1.2 Paramètre1.2 Paramètre
Un paramètre est un nombre qui décrit une Un paramètre est un nombre qui décrit une
caractéristique de la population étudiée. caractéristique de la population étudiée.
Citons, à titre d’exemples, la moyenne , la Citons, à titre d’exemples, la moyenne , la
variance , la médiane variance , la médiane MM et la proportion et la proportion pp d’une population. Notons que les d’une population. Notons que les paramètres sont souvent inconnus.paramètres sont souvent inconnus.
2
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
1.3 Statistique1.3 Statistique
Une statistique est une fonction de l’échantillon quiUne statistique est une fonction de l’échantillon qui
permet d’estimer un paramètre de la population. permet d’estimer un paramètre de la population.
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Par exemple :Par exemple :
a)a) La moyenne d’une population est La moyenne d’une population est estimée par la moyenne d’un estimée par la moyenne d’un échantillon de cette population : échantillon de cette population :
X
n
XXX n
⋯1
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
b)b) La variance La variance d’une population estd’une population est
estimée par la varianceestimée par la variance d’un échantillond’un échantillon
de cette population :de cette population :
22S
n
ii
n
ii XnX
nXX
nS
1
22
1
22
1
1)(
1
1
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
c)c) Soit une population ayant une caractéristique Soit une population ayant une caractéristique
qualitative (une maladie particulière). La qualitative (une maladie particulière). La
proportion proportion des individus ayant cette des individus ayant cette
caractéristique dans la population est estimée caractéristique dans la population est estimée
par :par :
p
n
Sp nˆ
où désigne le nombre d’individus del’échantillon qui possèdent cette caractéristique.
nS
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
RemarqueRemarque
Notons que les statistiquesNotons que les statistiques et sont et sont appelées aussi appelées aussi estimateursestimateurs. Par contre, la . Par contre, la valeur calculée par un estimateur pour un valeur calculée par un estimateur pour un échantillon donnée est appelée échantillon donnée est appelée estimation estimation ponctuelleponctuelle..
,X 2S p̂
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
2. Qualité d’un estimateur2. Qualité d’un estimateur 2.1 Estimateur sans biais2.1 Estimateur sans biais
Définition :Définition : Un estimateur d’un paramètreUn estimateur d’un paramètre
est dit sans biais si son espérance mathématique est est dit sans biais si son espérance mathématique est
égale à la vraie valeur du paramètre à estimer :égale à la vraie valeur du paramètre à estimer :
Notons qu’un estimateur sans biais Notons qu’un estimateur sans biais ne surestimene surestime ni ni sous-estimesous-estime systématiquement le paramètre. On dit systématiquement le paramètre. On dit d’un estimateur sans biais qu’il est bien centré.d’un estimateur sans biais qu’il est bien centré.
T
)(TE
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Remarque :Remarque : Notons que et Notons que et sont sont
respectivement des estimateurs sans biais respectivement des estimateurs sans biais desdes
paramètresparamètres , et , et c'est-à-dire :c'est-à-dire :
,X 2S p̂
2 p
,)( XE 22 )( SE et .)ˆ( ppE
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
2.2 Estimateur efficace2.2 Estimateur efficace
Définition :Définition : Soient et deux estimateurs sansSoient et deux estimateurs sans
biais d’un paramètre inconnubiais d’un paramètre inconnu . On dit que est . On dit que est
plus efficace que si plus efficace que si
1T 2T
1T2T
)()( 21 TVarTVar
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Un estimateur sans biais doit avoir une variance Un estimateur sans biais doit avoir une variance aussi petite que possible, afin d’être aussi précis aussi petite que possible, afin d’être aussi précis que possible. Ainsi les variances des estimateurs que possible. Ainsi les variances des estimateurs
nXVar
2
)(
etn
pppVar
)1()ˆ(
Ces formules montrent que les variances de et celle de diminuent lorsque la taille de l’échantillon augmente. Donc, plus l’échantillon est
grand, plus et sont précis.
Xp̂ n
X p̂Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHAPar Dr A. MERBOUHA
3. Distribution d’échantillonnage3. Distribution d’échantillonnage Une statistique est par définition basée sur un Une statistique est par définition basée sur un
échantillon qui n’est qu’une partie de la population échantillon qui n’est qu’une partie de la population étudiée; il est donc fort improbable que la valeur étudiée; il est donc fort improbable que la valeur prise par cette statistique coïncide avec le prise par cette statistique coïncide avec le paramètre étudié.paramètre étudié.
Définition Définition :: La distribution d’échantillonnage d’une La distribution d’échantillonnage d’une statistique est la distribution de toutes les valeurs statistique est la distribution de toutes les valeurs possibles de cette statistique. Ces valeurs sont possibles de cette statistique. Ces valeurs sont calculées à partir de tout les échantillons de même calculées à partir de tout les échantillons de même taille et issus de la même population.taille et issus de la même population.
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
3.13.1 Étude de la distribution échantillonnale deÉtude de la distribution échantillonnale de
a.a. Population normale de variance connuePopulation normale de variance connue : :
Si un échantillon issu d’une populationSi un échantillon issu d’une population
de loi normale de de loi normale de variancevariance connueconnue, alors, suit, alors, suit
une lois normale: une lois normale:
X
nXX ,,1 2 X
)1,0(/
Nn
XZ
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
bb. Population normale de variance inconnue. Population normale de variance inconnue : :
Si un échantillon issu d’une populationSi un échantillon issu d’une population
de loi normale de de loi normale de variancevariance in inconnueconnue, alors: , alors:
nXX ,,1 2
1/
ntnS
XT
où désigne la loi de Student de d.d.l 1nt .1n
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
cc. Population de loi inconnue. Population de loi inconnue : :
Si un échantillon issu d’une populationSi un échantillon issu d’une population
de loi de loi inconnueinconnue, alors le , alors le théorème central limitethéorème central limite
nous permet d’écrire :nous permet d’écrire :
nXX ,,1
n
)1,0(/
NnS
XZ
pourvue que la taille de l’échantillon soit assez grande ( ).30n
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
3.23.2 Étude de la distribution échantillonnale de la Étude de la distribution échantillonnale de la variance.variance.
a.a. Population normale de moyenne connuePopulation normale de moyenne connue : :
Si un échantillon aléatoire issu d’uneSi un échantillon aléatoire issu d’une population de loi normale de population de loi normale de moyennemoyenne connueconnue, ,
alors, alors,
la lois de Khi-carré à n d.l.l: la lois de Khi-carré à n d.l.l:
nXX ,,1
,)(1 2
1
22 n
n
iiX
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
b.b. Population normale de moyenne inconnue Population normale de moyenne inconnue : :
Si un échantillon aléatoire issu d’uneSi un échantillon aléatoire issu d’une
population de loi normale de population de loi normale de moyennemoyenne ininconnueconnue, alors, , alors,
la lois de Khi-carré à n-1 d.l.l. la lois de Khi-carré à n-1 d.l.l.
nXX ,,1
,1 2
12
2
nSn
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
4. Estimation par intervalle de confiance.4. Estimation par intervalle de confiance. 4.1 Estimation par intervalle de confiance4.1 Estimation par intervalle de confiance de la moyennede la moyenne La moyenne calculée La moyenne calculée à partir d’un échantillon à partir d’un échantillon
donné est presque toujours un peu plus grande donné est presque toujours un peu plus grande ou un peu plus petite que la vraie moyenne de la ou un peu plus petite que la vraie moyenne de la population . On cherche plutôt une population . On cherche plutôt une approximation qui tient compte de la marge approximation qui tient compte de la marge d’erreur d’estimation. Cette estimation se d’erreur d’estimation. Cette estimation se présente alors sous la forme :présente alors sous la forme :
X.
EX La marge d’erreur est appelée précision de l’estimateur E .X
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Ainsi l’estimation par intervalle de confiance deAinsi l’estimation par intervalle de confiance de
consiste à déterminer l’erreur de façon queconsiste à déterminer l’erreur de façon que
avec une probabilité égale à appelée niveau de avec une probabilité égale à appelée niveau de confiance.confiance.
E
1
EXEX ,
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Par exemple, on peut déterminer un intervalle de Par exemple, on peut déterminer un intervalle de confiance qui contient la valeur de avec un confiance qui contient la valeur de avec un niveau de confiance égal à niveau de confiance égal à 95%.95%. Cela veut dire que Cela veut dire que si on répète la même procédure d’estimation si on répète la même procédure d’estimation 100 100 foisfois, la moyenne sera dans , la moyenne sera dans 9595 intervalles parmi les intervalles parmi les 100100 intervalles établis. Cela signifie que si on intervalles établis. Cela signifie que si on construit un intervalle de confiance par un construit un intervalle de confiance par un seul seul échantillonéchantillon, il y aura un , il y aura un risquerisque de de 5%5% que la valeur que la valeur de ne sera pas dans cet intervalle. de ne sera pas dans cet intervalle.
Pour construire de tels intervalles de confiance, Pour construire de tels intervalles de confiance, nous aurons besoin des quantiles de la loi normale nous aurons besoin des quantiles de la loi normale et de la loi de Student définis ci-après.et de la loi de Student définis ci-après.
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
4.1.1 Quantile d’ordre des lois normale et 4.1.1 Quantile d’ordre des lois normale et
StudentStudent
Fixons un nombre dans l’intervalle et Fixons un nombre dans l’intervalle et notonsnotons et et les quantiles de la loi normale les quantiles de la loi normale et de la loi de Student définis par :et de la loi de Student définis par :
est la valeur telle queest la valeur telle que
est la valeur telle que est la valeur telle que
z vt ,
z )( zZP
vt , )( ,vtTP
1,0
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Exemple Exemple :: Calculez à l’aide des tables: Calculez à l’aide des tables:
,05.0z ,025.0z
10,05.0t et .12,025.0t
Tableau de certaines valeurs critiques de la loi normale: 1)(z
0.0050.005 0.010.01 0.0250.025 0.050.05 0.010.01
2.5752.575 2.3252.325 1.961.96 1.6451.645 1.2851.285
2.8072.807 2.5752.575 2.2412.241 1.961.96 1.6451.645
z
2/zCours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHAPar Dr A. MERBOUHA
4.1.2 Construction de l’intervalle de confiance4.1.2 Construction de l’intervalle de confiance dede
SoitSoit un intervalle de confiance deun intervalle de confiance de
Afin de déterminer la précision , on distingueAfin de déterminer la précision , on distingue
quatre cas :quatre cas :
.
EXEX , .
E
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Cas 1: Si Cas 1: Si est un échantillon issu d’une est un échantillon issu d’une population de loi normale de population de loi normale de variancevariance connueconnue, , alors l’intervalle de confiance de niveau de alors l’intervalle de confiance de niveau de est :est :
Ainsi la précision de l’estimation sera :Ainsi la précision de l’estimation sera :
nXX ,,1 21
nzX
nzX
2/2/ ,
nz
2/E
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Cas 2: Si Cas 2: Si est un échantillon issu d’une est un échantillon issu d’une population de loi normale de population de loi normale de variancevariance in inconnueconnue, , alors l’intervalle de confiance de niveau de alors l’intervalle de confiance de niveau de est :est :
La précision de l’estimation sera :La précision de l’estimation sera :
nXX ,,1 21
n
StX
n
StX nn 1;2/1;2/ ,
n
St n 1;2/ E
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Cas 3: Si Cas 3: Si est un échantillon issu d’une est un échantillon issu d’une
population de loi inconnue, alors pourvue que population de loi inconnue, alors pourvue que la taillela taille soit soit assez grandeassez grande (( )), l’intervalle de, l’intervalle de
confiance de niveau de est :confiance de niveau de est :
De même la précision de l’estimation sera :De même la précision de l’estimation sera :
nXX ,,1
1
n
SzX
n
SzX 2/2/ ,
n
Sz 2/E
n 30n
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
Cas 4: Si Cas 4: Si est un échantillon choisi est un échantillon choisi sans sans remise remise à partir d’une population de taille finie à partir d’une population de taille finie et de et de loi inconnueloi inconnue, alors pourvue que , alors pourvue que la taillela taille soit soit assez grandeassez grande ( ), l’intervalle de confiance de ( ), l’intervalle de confiance de niveau est :niveau est :
Dans cette situation la précision sera :
nXX ,,1
1
n30n
N
1
,1 2/2/ N
nN
n
SzX
N
nN
n
SzX
12/
N
nN
n
SzE
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
4.2. Intervalle de confiance d’une proportion4.2. Intervalle de confiance d’une proportion
Soit la proportion d’individus dans la population ayant une caractéristique qualitative donnée. 4.2. 1 Intervalle de confiance d’une proportion 4.2. 1 Intervalle de confiance d’une proportion pour une population infiniepour une population infinieL’intervalle de confiance de niveau de est de la forme :
p
1 p
n
ppzp
n
ppzp
)ˆ1(ˆˆ,
)ˆ1(ˆˆ 2/2/
pourvue que la taille soit assez grande et
que et
n
5np .5)1( pnCours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHAPar Dr A. MERBOUHA
4.2.2 Intervalle de confiance d’une proportion4.2.2 Intervalle de confiance d’une proportion
pour une population finie, avec tirage sanspour une population finie, avec tirage sans
remiseremise
L’intervalle de confiance de niveau de p est:
pourvue que et
1
)ˆ1(ˆˆ,
1
)ˆ1(ˆˆ 2/2/ N
nN
n
ppzp
N
nN
n
ppzp
1
5np .5)1( pn
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
5. Choix de la taille d’échantillon5. Choix de la taille d’échantillon
La qualité d’un intervalle de confiance se mesure par son La qualité d’un intervalle de confiance se mesure par son degré de confiancedegré de confiance et sa et sa marge d’erreur marge d’erreur Un choix Un choix adéquat de la taille de l’échantillon permet de contrôler adéquat de la taille de l’échantillon permet de contrôler simultanément ces deux facteurs. simultanément ces deux facteurs.
5.1 Cas d’une moyenne5.1 Cas d’une moyenne
Dans le cas d’une population Dans le cas d’une population normale de variance connuenormale de variance connue (cas 1), nous pouvons déterminer la taille minimale requise de (cas 1), nous pouvons déterminer la taille minimale requise de l’échantillon pour avoir un intervalle de confiance de niveau l’échantillon pour avoir un intervalle de confiance de niveau
au moins et de précision fixés au moins et de précision fixés ee à l’avance: à l’avance:
Lorsque est inconnu, on le remplacera par une pré-Lorsque est inconnu, on le remplacera par une pré-estimation estimation ..
1 .E
.
2
2/
e
zn
S
1
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
5.2 Cas d’une proportion5.2 Cas d’une proportion
Dans le cas d’une proportion, si l’on dispose d’une pré-Dans le cas d’une proportion, si l’on dispose d’une pré-estimation de , la taille minimale sera : estimation de , la taille minimale sera :
Par contre, si la pré-estimation n’est pas disponible, la taille Par contre, si la pré-estimation n’est pas disponible, la taille requise sera alors :requise sera alors :
.p
p̂ p
)ˆ1(ˆ2
2/ ppe
zn
2
2/
2
e
zn
Cours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3 Par Dr A. MERBOUHAPar Dr A. MERBOUHA
RemarqueRemarque :: Si la population est de Si la population est de taille finietaille finie et le et le tirage est tirage est sans remisesans remise, alors :, alors :
1)1) La taille requise pour la moyenne sera :La taille requise pour la moyenne sera :
Ainsi si la variance est inconnue, on la remplace Ainsi si la variance est inconnue, on la remplace par une pré-estimation.par une pré-estimation.
2)2) La taille requise pour la proportion sera : La taille requise pour la proportion sera :
Lorsqu’on ne possède pas de pré-estimation , on prendra:Lorsqu’on ne possède pas de pré-estimation , on prendra:
N
222/
2
222/
)1(
zeN
Nzn
)ˆ1(ˆ)1(
)ˆ1(ˆ22/
2
22/
ppzeN
ppNzn
p̂.5.0ˆ pCours de Proba/Stat Svi/Sem 3 Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHAPar Dr A. MERBOUHA