Upload
dartagnan-simonnet
View
103
Download
0
Embed Size (px)
Citation preview
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
UTILISATION DE LA LOI BINOMIALE
POUR UNE PRISE DE DÉCISION À
PARTIR D'UNE FRÉQUENCE
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
On considère une population statistique dans laquelle on étudie un caractère qualitatif prenant une modalité donnée dans une proportion p.
On cherche des renseignements sur p.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
On peut étudier toute la population et avoir une connaissance précise de p.
Recensement
Mais cela peut s'avérer :• long (la valeur de p pourra avoir changé entre temps)
•ou coûteux, •voire impossible lorsque l'étude est destructrice des individus.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
On détermine la fréquence f de la modalité dans l'échantillon, elle induit des résultats sur p avec une certaine marge d'erreur cependant.
Statistique inférentielle
On peut raisonner à partir d'un échantillon tiré au hasard dans la population.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
• l'estimation (ponctuelle ou par intervalle de confiance...)
Statistique inférentielle
Deux problèmes relèvent de la statistique inférentielle :
• les tests (tests d'hypothèse, tests d'adéquation...).
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Supposons que l'on travaille sur la proportion p de bonbons à la menthe délivrés par un distributeur.
• test d'hypothèse on cherche à savoir si p = 25 % (par exemple)
• estimation on cherche à connaître la valeur de p.
Exemple :
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
2 - Les programmes de Premières
Programmes de Première 2011
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Les programmes de premières conduisent à travailler dans le cadre des tests d'hypothèse.
2 - Les programmes de Premières
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
On émet une hypothèse sur la proportion p d'un caractère qualitatif dans une population statistique.
On cherche des raisons de rejeter cette hypothèse au vu d'un échantillon tiré au hasard.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
On travaille sur la proportion p de bonbons à la menthe délivrés par un distributeur.
On cherche à savoir si p = 25 % : c'est l'hypothèse que l'on cherche à vérifier.
On constitue au hasard un échantillon de 20 bonbons issus du distributeur.
Exemple :
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
Si l'hypothèse émise est vraie, on connaît la distribution d'échantillonnage de la fréquence Fn du caractère étudié dans les échantillons de taille n. On connaît alors les valeurs de Fn les plus fréquemment observables.
On observe la valeur f de Fn pour un échantillon.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
On constitue au hasard et avec remise un échantillon de 20 bonbons.
Exemple :
Si la proportion de bonbons à la menthe délivrés par le distributeur est 25 %, le nombre de bonbons à la menthe de l'échantillon se distribue selon la loi binomiale de paramètres 20 et 0,25.
Ce résultat nous permet de connaître la distribution de F20.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Contexte de travail
Exemple : Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,25
0
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/2
0
11/2
0
12/2
0
13/2
0
14/2
0
15/2
0
16/2
0
17/2
0
18/2
0
19/2
0
20/2
0
Fréquence dans l'échantillon
Pro
bab
ilité
Distribution de F20.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
On observe la valeur f de Fn pour un
échantillon. On considère que le hasard fait bien les choses et on adopte la démarche suivante :
•si f ne fait pas partie des valeurs les plus fréquemment observables, on rejette l'hypothèse émise.
•si f fait partie des valeurs les plus fréquemment observables, on ne rejette pas l'hypothèse émise.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3- Démarche des tests d'hypothèse sur une proportion
Cet ensemble des valeurs les plus fréquemment observables se déterminent à l'aide d'un niveau de probabilité, en général 95 %.
C'est un intervalle centré en p qui contient la valeur de Fn avec une probabilité d'au moins 95
% et qui soit d'amplitude minimale : c'est l'intervalle de fluctuation de p au niveau de probabilité de 95 %.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Travaillons au niveau de probabilité de 95 %.
Exemple :
3- Démarche des tests d'hypothèse sur une proportion
On détermine l'intervalle centré en 0,25, d'amplitude minimale, qui contient la valeur de F20 pour un échantillon tiré au hasard avec une probabilité d'au moins 95 %.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Exemple : Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,25
0
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/2
0
11/2
0
12/2
0
13/2
0
14/2
0
15/2
0
16/2
0
17/2
0
18/2
0
19/2
0
20/2
0
Fréquence dans l'échantillon
Pro
bab
ilité
L'intervalle [0,05 ; 0,45] contient F20 avec la probabilité d'environ 0,98.
3- Démarche des tests d'hypothèse sur une proportion
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
Règle de décision :
•Si la valeur observée de F20 dans l'échantillon n'appartient pas à [0,05 ; 0,45] alors on rejette l'hypothèse que p = 25 %.
•Si la valeur observée de F20 dans l'échantillon appartient à [0,05 ; 0,45] alors on ne rejette pas l'hypothèse que p = 25 %.
Exemple :
3- Démarche des tests d'hypothèse sur une proportion
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
INTERVALLE DE FLUCTUATION
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Dans le programme de Seconde 2009
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Dans le programme de Seconde 2009
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Dans les programmes de Première
Programmes de Première 2011
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Considérons un échantillon de taille 20, constitué "au hasard" et avec remise dans une population contenant
une sous-population A en proportion p = 14.
20 F20 est distribuée selon la loi binomiale de paramètres
20 et 14.
On s' intéresse à la f réquence f d'éléments de A dans l'échantillon, c'est l'observation de la variable aléatoire F20 sur l'échantillon.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
0/20
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/20
11/20
12/20
13/20
Fréquence de A
14/20
15/20
16/20
17/20
18/20
19/10
20/20
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20 0,03
1/20 0,021
2/20 0,067
3/20 0,134
4/20 0,190
5/20 0,202
6/20 0,169
7/20 0,112
8/20 0,061
9/20 0,027
10/20 0,010
11/20 0,003
12/20 0,001
13/20 0,000
Fréquence de A
Probabilité
14/20 0,000
15/20 0,000
16/20 0,000
17/20 0,000
18/20 0,000
19/10 0,000
20/20 0,000
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20 0,03
1/20 0,021
2/20 0,067
3/20 0,134
4/20 0,190
5/20 0,202
6/20 0,169
7/20 0,112
8/20 0,061
9/20 0,027
10/20 0,010
11/20 0,003
12/20 0,001
13/20 0,000
p = 25 %
Fréquence de A
Probabilité
14/20 0,000
15/20 0,000
16/20 0,000
17/20 0,000
18/20 0,000
19/10 0,000
20/20 0,000
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20 0,03
1/20 0,021
2/20 0,067
3/20 0,134
4/20 0,190
5/20 0,202
6/20 0,169
7/20 0,112
8/20 0,061
9/20 0,027
10/20 0,010
11/20 0,003
12/20 0,001
13/20 0,000
p = 25 %
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20 0,03
1/20 0,021
2/20 0,067
3/20 0,134
4/20 0,190
5/20 0,202 0,561
6/20 0,169
7/20 0,112
8/20 0,061
9/20 0,027
10/20 0,010
11/20 0,003
12/20 0,001
13/20 0,000
p = 25 %
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20 0,03
1/20 0,021
2/20 0,067
3/20 0,134
4/20 0,190
5/20 0,202 0,561 0,807
6/20 0,169
7/20 0,112
8/20 0,061
9/20 0,027
10/20 0,010
11/20 0,003
12/20 0,001
13/20 0,000
p = 25 %
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20 0,03
1/20 0,021
2/20 0,067
3/20 0,134
4/20 0,190
5/20 0,202 0,561 0,807 0,935
6/20 0,169
7/20 0,112
8/20 0,061
9/20 0,027
10/20 0,010
11/20 0,003
12/20 0,001
13/20 0,000
p = 25 %
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20 0,03
1/20 0,021
2/20 0,067
3/20 0,134
4/20 0,190
5/20 0,202 0,561 0,807 0,935 0,983
6/20 0,169
7/20 0,112
8/20 0,061
9/20 0,027
10/20 0,010
11/20 0,003
12/20 0,001
13/20 0,000
p = 25 %
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Fréquence de A
Probabilité
0/20 0,03
1/20 0,021
2/20 0,067
3/20 0,134
4/20 0,190
5/20 0,202 0,561 0,807 0,935 0,983 0,999
6/20 0,169
7/20 0,112
8/20 0,061
9/20 0,027
10/20 0,010
11/20 0,003
12/20 0,001
13/20 0,000
p = 25 %
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,250
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/2
0
11/2
0
12/2
0
13/2
0
14/2
0
15/2
0
16/2
0
17/2
0
18/2
0
19/2
0
20/2
0
Fréquence de A
Pro
bab
ilit
é
p = 25 %
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,250
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/2
0
11/2
0
12/2
0
13/2
0
14/2
0
15/2
0
16/2
0
17/2
0
18/2
0
19/2
0
20/2
0
Fréquence de A
Pro
babi
lité
p = 25 %
0,561
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,250
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/2
0
11/2
0
12/2
0
13/2
0
14/2
0
15/2
0
16/2
0
17/2
0
18/2
0
19/2
0
20/2
0
Fréquence de A
Pro
babi
lité
p = 25 %
0,807
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,250
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/2
0
11/2
0
12/2
0
13/2
0
14/2
0
15/2
0
16/2
0
17/2
0
18/2
0
19/2
0
20/2
0
Fréquence de A
Pro
babi
lité
p = 25 %
0,935
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,250
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/2
0
11/2
0
12/2
0
13/2
0
14/2
0
15/2
0
16/2
0
17/2
0
18/2
0
19/2
0
20/2
0
Fréquence de A
Pro
babi
lité
p = 25 %
0,983
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Échantillons de taille 20
0,00
0,05
0,10
0,15
0,20
0,250
1/20
2/20
3/20
4/20
5/20
6/20
7/20
8/20
9/20
10/2
0
11/2
0
12/2
0
13/2
0
14/2
0
15/2
0
16/2
0
17/2
0
18/2
0
19/2
0
20/2
0
Fréquence de A
Pro
babi
lité
p = 25 %
0,999
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
En résumé :
I l n'y a pas d' intervalle centré en p = 14 tel que la
probabilité que Fn appartienne à cet intervalle soit exactement 0,95.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
On adopte la définition suivante : L’intervalle de fluctuation de Fn au niveau de probabilité de 95 %, est le plus petit intervalle de la f orme [p ; p + ] tel que
P
p Fn p + 0,95.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Pour l'exemple :
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
3 - Un exemple de détermination de l'intervalle de fluctuation
Pour l'exemple :
Le plus petit intervalle de la f orme
1
4 a ., 14 + a tel
que P
1
4 a F20
14+a 0,95 est obtenu pour a = 0,2.
L' intervalle de fluctuation de F20 au niveau de probabilité de 95 % est : [0,05 ; 0,45].
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
PRISE DE DÉCISION
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Programmes de Première 2011
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
En 2000, dans le village de Xicun, en Chine, il est né 20 enfants, parmi lesquels 16 garçons. (Source : Washington Post du 29 mai 2001.)
Peut-on considérer que cette répartition est le fruit du seul hasard ?
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 : On veut rejeter ou non l'hypothèse que la distribution des sexes des enfants nés en 2000 à Xicun est due au seul hasard.
On considère que la variable aléatoire "sexe à la naissance" prend les deux valeurs fille et garçon avec la même probabilité 0,5.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
La distribution des sexes dans un tel échantillon suit la loi binomiale de paramètres 20 et 0,5.L'intervalle de fluctuation de la fréquence de garçons dans l'échantillon au niveau de probabilité de 95 % est [0,3 ; 0,7].
Si la distribution des sexes des enfants nés en 2000 à Xicun est due au seul hasard, les 20 enfants sont assimilés à un échantillon d'enfants choisis au hasard dans la population.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
La fréquence de garçons observée à Xicun est 0,8 qui n'appartient pas à [0,3 ; 0,7].
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 1 :
La fréquence de garçons observée à Xicun est 0,8 qui n'appartient pas à [0,3 ; 0,7]. On considère que la différence entre 0,8 et la valeur attendue 0,5 est significative et on rejette l'hypothèse que la répartition des sexes des enfants est due au seul hasard.On a pu, par la suite, établir un lien avec l’acquisition en 1999, dans ce village d’une machine à ultra-sons bon marché, permettant aux médecins de déterminer le sexe du fœtus.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :
Dans la réserve indienne d’Aamjiwnaag, située au Canada à proximité d’industries chimiques, il est né entre 1999 et 2003, 132 enfants dont 46 garçons. (Sources : Science et Vie février 2006 – Environmental Health Perspectives octobre 2005).Peut-on considérer que cette répartition est le fruit du seul hasard ?
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 : On veut rejeter ou non l'hypothèse que la distribution des sexes des enfants nés entre 1999 et 2003 à Aamjiwnaag est due au seul hasard. On considère que la variable aléatoire "sexe à la naissance" prend les deux valeurs fille et garçon avec la même probabilité 0,5.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :
La distribution des sexes dans un tel échantillon suit la loi binomiale de paramètres 132 et 0,5.L'intervalle de fluctuation de la fréquence de garçons dans l'échantillon au niveau de probabilité de 95 % est approché par [0,416 ; 0,584].
Si la distribution des sexes des enfants nés entre 1999 et 2003 à Aamjiwnaag est due au seul hasard, les 132 enfants sont assimilés à un échantillon d'enfants choisis au hasard dans la population.
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :
On considère que la différence entre 0,348 et la valeur attendue 0,5 est significative et on rejette que la répartition des sexes des enfants est due au seul hasard.
Ce résultat conduit à suspecter l'impact des usines chimiques voisines utilisant des polluants chimiques sur le sex-ratio.
La fréquence de garçons observée à Aamjiwnaag est environ 0,348 qui n'appartient pas à [0,416 ; 0,584].
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Brigitte CHAPUT - Journée de la Régionale APMEP de Toulouse - 19 janvier 2011
1 - Application à la prise de décision
Exemple 2 :