STATISTIQUE INFERENTIELLE L ESTIMATION. UN EXEMPLE Montant quotidien des dépôts en liquide dans la...
25
STATISTIQUE INFERENTIELLE L ’ESTIMATION
STATISTIQUE INFERENTIELLE L ESTIMATION. UN EXEMPLE Montant quotidien des dépôts en liquide dans la banque Ibardinescroak de Saint Jean de Luz. 500 5000
UN EXEMPLE Montant quotidien des dpts en liquide dans la banque
Ibardinescroak de Saint Jean de Luz. 500 5000 10 000 8000 Comment
obtenir une information sur la distribution des dpts, sur le
montant du dpt moyen, etc.?
Page 3
UNE SOLUTION SIMPLE 500 5000 10 000 8000 MAIS IMPOSSIBLE A
METTRE EN UVRE ... Observer tous les dpts car le nombre N
dobservations est trs grand, voire infini!
Page 4
UNE AUTRE SOLUTION 500 5000 10 000 8000 On observe un
chantillon, c..d. une partie de la population Statistique
descriptive chantillon
Page 5
INTERET DE LA STATISTIQUE DESCRIPTIVE 500 5000 10 000 8000
Echantillo n Montant des dpts Frquence Dpt moyen = 7500 cart-type
des dpts = 2500 Construction dun modle thorique
Page 6
Servir de base la construction dun modle thorique Pourquoi ?
Pour faire de la prvision: Quelle quantit de monnaie acheter la
Banque de France en dbut de semaine? Quelle quantit de liquide
va-ton pouvoir faire transiter par la Suisse ?.. INTERET DE LA
STATISTIQUE DESCRIPTIVE
Page 7
UN MODELE MATHEMATIQUE Test dajustement : On verra plus tard...
Estimation 3 affirmations vrifier X = Montant quotidien des dpts
est une variable alatoire de loi Normale de moyenne E(X) = de
variance V(X) =
Page 8
ESTIMATION DE LA MOYENNE Comment avoir une ide sur la valeur de
la moyenne ? 1) Prendre rendez-vous avec Irma la voyante Problmes:
a va me coter cher. Puis-je lui faire confiance ? Problme: je nai
rien compris aux probas Avantage: je pourrai prciser la confiance
apporter mon rsultat Cest pas grave car on ne va plus samuser jeter
des ds ou tirer des cartes... 2) Utiliser lintuition et quelques
notions de probabilits
Page 9
UNE METHODE INTUITIVE DESTIMATION DE LA MOYENNE Pour estimer la
moyenne inconnue de la population on utilise la moyenne x de
lchantillon. Est-on sr de faire mieux quIrma ?
Page 10
On observe n dpts x 1,.,x n sur un chantillon et on en fait la
moyenne va-t-elle tre proche de inconnue? Pas mal mais que se
serait-il pass si javais pris un autre chantillon ? Moins bien. Et
un autre ? Et si jinsiste lourdement ? Loi de Pourquoi les
observations de sont-elles concentres autour de la moyenne inconnue
? Thorme fondamental: Si X est une v.a. de moyenne et dcart-type,
alors la v.a. moyenne, note, obtenue sur un chantillon de taille n
tend vers une UNE METHODE INTUITIVE DESTIMATION DE LA MOYENNE
Page 11
Prcision Fiabilit Probabilit Prendre une dcision partir dun
chantillon, est-ce vraiment fiable ? Quelle est la probabilit que
la moyenne inconnue se trouve pas trop loin de observe ? Il y a 1-
= 95 chances sur 100 que lintervalle contienne
Page 12
Il y a 1- chances que la moyenne inconnue appartienne
lintervalle alatoire P[ +u > -u ] = 1- P[ - u < +u ] = 1-
suit une loi, UN PEU.. DE PROBAS. donc suit une N(0,1) P[-u <
< u] = 1- = 0,95 Table u = environ 2 (1,96) P[-u < - < u ]
= 1- P[- -u < - < -X+u ] = 1-
Page 13
UN PEU.. DE PROBAS. FIN . et donc un autre intervalle . qui ne
contient pas forcment Si on peut prendre une infinit dchantillons,
95% des intervalles contiennent Il y a 95 chances sur 100 que la
moyenne inconnue appartienne lintervalle alatoire Une autre
observation nous aurait donn une autre valeur, On dira (pour
simplifier) que la moyenne inconnue a 95 chances sur 100
dappartenir lintervalle numrique Une observation alatoire nous
donne la valeur de.
Page 14
Fiabilit et prcision lintervalle a 1- chances de contenir
fiabilit prcision P[-u < N(0,1) < u] = 1- P[-u < < u] =
1- 1- et u sont lis par la relation 1 - -u u Fiablit augmente u
augmente Prcision diminue
Page 15
1) Pour des raisons intuitives 2) Pour des raisons thoriques
est un estimateur sans biais est un estimateur convergent Plus la
taille de lchantillon grandit plus la variance diminue. Pour n
infini, lobservation tombe forcment sur. Pour quelles raisons
utiliser la moyenne de lchantillon pour estimer la moyenne de la
population ? On a une forte probabilit que lobservation soit dans
cette zone pour Pour T
Page 16
RESUME SUR LESTIMATION DUNE MOYENNE prcisionCoefficient de
confiance Pour estimer la moyenne dune population, on utilise la
moyenne de lchantillon Dtermination de la taille dchantillon pour
une prcision et un coefficient de confiance donns On veut que
lintervalle soit de la forme, donc et Estimation ponctuelle
Estimation par intervalle de confiance Pour avoir une ide de la
fiabilit et de la prcision du rsultat on utilise un intervalle de
confiance avec u dfini par P[-u < N(0,1) < u] = 1- RESUME SUR
LESTIMATION DUNE MOYENNE dune population Normale de variance
connue
Page 17
ESTIMATION PONCTUELLE DE LA VARIANCE 1) Pour des raisons
intuitives 2) Pour des raisons thoriques Il est naturel destimer la
variance dune population, par la variance de lchantillon On estime
la variance dune population par la variance corrige de lchantillon,
note aussi s. Pourquoi ? est un estimateur sans biais de est un
estimateur convergent de
Page 18
ESTIMATION PAR INTERVALLE DE CONFIANCE DE LA VARIANCE DUNE
POPULATION NORMALE (n-1) S suit une loi de (n-1) d.d.l. Table a et
b (> 0) pour 1- donn Do un intervalle de confiance
Page 19
Pour estimer la variance dune population, on utilise la
variance corrige s de lchantillon Estimation ponctuelle RESUME SUR
LESTIMATION DUNE VARIANCE Estimation par intervalle de confiance
Pour avoir une ide de la fiabilit et de la prcision du rsultat on
utilise un intervalle de confiance avec a et b dfinis par
Page 20
ESTIMATION PONCTUELLE DUNE PROPORTION Dans la population il y a
une proportion p dindividus possdant un certain caractre. 1) Pour
des raisons intuitives Il est naturel destimer la proportion p dune
population par la proportion f de lchantillon 2) Pour des raisons
thoriques F, proportion dchantillon, est une v.a. qui tend vers une
loi F est un estimateur sans biais de p F est un estimateur
convergent de p
Page 21
est peu prs une N(0,1) ds que n > 100 et 0,1 < p < 0,9
INTERVALLE DE CONFIANCE DUNE PROPORTION Table u pour 1- donn p
(dans les bornes de lintervalle alatoire) tant inconnu, il est
approch par une estimation f, do un intervalle de confiance F tend
vers une, ou encore
Page 22
Dtermination de la taille dchantillon pour une prcision et un
coefficient de confiance donns Pour estimer la proportion p dune
population, on utilise la proportion f de lchantillon Estimation
ponctuelle On veut que lintervalle soit de la forme, donc et RESUME
SUR LESTIMATION DUNE PROPORTION Estimation par intervalle de
confiance Pour avoir une ide de la fiabilit et de la prcision du
rsultat on utilise un intervalle de confiance avec u dfini par P[-u
< N(0,1) < u] = 1- pour n > 100 et 0,1 < f < 0,9
(sinon utiliser un abaque)
Page 23
ESTIMATION PONCTUELLE : UNE CONCLUSION X de loi quelconque de
moyenne E(X) =, de variance V(X) = La variance corrige s de
lchantillon est une bonne estimation de la variance de la
population La moyenne de lchantillon est une bonne estimation de la
moyenne de la population La proportion f de lchantillon est une
bonne estimation de la proportion p de la population s Proportion p
dun caractre f
Page 24
INTERVALLE DE CONFIANCE DUNE MOYENNE: EXTENSIONS La taille
dchantillon est grande La variance est connue ( ce qui en pratique
est trs rare ) Que peut-on faire si ces conditions ne sont pas
respectes ? Le taux de sondage n/N est faible (
INTERVALLE DE CONFIANCE DUNE MOYENNE EXTENSIONS Loi de Student
(n-1) d.d.l.qui est approximativement N(0,1) pour n > 30 Dans ce
tableau, on suppose que lchantillon est prlev avec remise, ou que
lchantillon est prlev sans remise et le taux de sondage n/N 10 %,
on multiplie ou s par le facteur dexhaustivit Ce correctif doit
aussi tre apport pour un intervalle de confiance dune
proportion