Tests de comparaison de pourcentages
Docteur Alexandrine Lambert
> Faculté de Pharmacie
Comparer deux pourcentages
• Pourcentage– Variable qualitative dichotomique(Présence/Absence, Malades/Non malades, Décès/Survie, …)
– est le pourcentage (inconnu) d’individus présentant la caractéristique dans la population
– est estimé par le pourcentage p observé sur un échantillon de taille n dont k individus présentent la caractéristique
nk
p
Comparer deux pourcentages
Comparaison de deux pourcentages dans le cas des grands échantillons.• Comparaison d’un pourcentage observé à un pourcentage théorique• Comparaison de deux pourcentages observés
– Échantillons indépendants– Échantillons appariés
Comparer deux pourcentages
Comparaison de deux pourcentages dans le cas des grands échantillons.• Comparaison d’un pourcentage observé à un pourcentage théorique• Comparaison de deux pourcentages observés
– Échantillons indépendants– Échantillons appariés
Comparer un pourcentageà une valeur théorique
• Problème : déterminer si un pourcentage observé p sur un échantillon de taille n est différent d’une valeur théorique th
Comparer à th
Population (inconnu)
Populationde référenceth (connu)
Échantillonp
Comparer un pourcentageà une valeur théorique
• Formuler une hypothèse– Hypothèse nulle H0
• = th où est le pourcentage de la population dont est issu l’échantillon
– Hypothèses alternatives H1
• Test bilatéral : ≠ th
• Test unilatéral à gauche ou à droite : < th ou > th
Comparer un pourcentageà une valeur théorique
• Fixer le risque α• Choisir la statistique
– Test du χ2 de conformité (loi du X2)– Test z (loi normale)
• Conditions d’application :– n. th ≥ 5 et n.(1- th) ≥ 5 (cas des grands échantillons)
Comparer un pourcentageà une valeur théorique
Test du χ2 de conformité• Calculer la valeur χ2 prise par la statistique du test
– Tableau
– Conditions d’application : C1 ≥ 5 et C2 ≥ 5
–
– Sous H0 la statistique suit une loi du X2 à 1 ddl2
222
1
2112
C)C(O
C)C(O
χ
Effectifs observés O1 = n.p O2 = n.(1-p) n
Effectifs calculés C1 = n.th C2 = n.(1-th) n
Comparer un pourcentageà une valeur théorique
Test du χ2 de conformité• Confronter à la valeur seuil
– Lecture de la valeur seuil dans la table de la loi du 2
– Test bilatéral : on rejette H0 au risque si • En pratique, si = 5%,
– Si : rejet de H0
– Si : non rejet de H0
2χ 21,αχ
21,α
2 χ χ
3,84 χ2
3,84χ21,α
3,84 χ2
Comparer un pourcentageà une valeur théorique
• Exemple 1– En France, 7% des personnes hospitalisées contractent une
infection nosocomiale dans l'établissement où elles sont soignées.
– Sur un échantillon de 250 personnes soignées à l’hôpital H,28 ont contracté une infection nosocomiale.
– Le pourcentage observé sur l’échantillon diffère-t-il de la référence nationale au risque α = 5% ?
Comparer un pourcentageà une valeur théorique
6,77232,5
232,5)(22217,5
17,5)(28χ
222
0,07π ; 0,11225028
p ; 250n th
Infection nosocomiale OUI NON Total
Effectifs observés O1 = 28 O2 = 222 250 Effectifs calculés C1 = 250x0,07 = 17,5 C2 = 250x0,93 = 232,5 250
Comparer un pourcentageà une valeur théorique
Test du χ2 : exemple 1• Lecture
• 3,84 : rejet de H0
On montre, au risque 5%, une différence significative entre le pourcentage de personnes hospitalisées contractant une infection nosocomiale à l’hôpital H et dans l’ensemble du pays (p < 0,01).
25% 1,
2 χ 6,77χ
Comparer un pourcentageà une valeur théorique
Test z• Calculer la valeur z prise par la statistique Z
n)π.(1π
πpz
thth
th
Équivalence entre χ2 et test z : χ2 = z2
χ2 à 1 ddl est le carré d’une loi normale centrée réduite
Équivalent à C1 et C2 ≥ 5
–
– Sous H0, Z suit une loi normale centrée réduite
– Conditions d’application : n.th ≥ 5 et n.(1- th) ≥ 5
Comparer un pourcentageà une valeur théorique
Test z• Confronter z à la valeur critique zα
– Test bilatéral : on rejette H0 si |z|≥ zα
– Test unilatéral :• si H1 s’écrit > th, on rejette H0 si z ≥ z2α
• si H1 s’écrit < th, on rejette H0 si z ≤ -z2α
Pour un même risque d’erreur, les valeurs seuil du 2 sont doncles carrés des valeurs seuil de z : 2
1,=(z)2 (3,84 =1,962)
Comparer un pourcentageà une valeur théorique
Test z : exemple 1• Données :
• Hypothèses : H0 : = 0,07 ; H1 : ≠ 0,07
• Calcul
–
– Conditions d’application vérifiées : 250 x 0,07 ≥ 5 et 250 x 0,93 ≥ 5
2,60
2500,93)0,07.(1
0,070,112z
0,07π ; 0,11225028
p ; 250n th
Comparer un pourcentageà une valeur théorique
Test z : exemple 1• Lecture
• z = 2,60 ≥ z0,05 =1,96 : rejet de H0
Degré de signification lu dans la table : p < 0,01(même conclusion que test précédent)
Comparer deux pourcentages
Comparaison de deux pourcentages dans le cas des grands échantillons.• Comparaison d’un pourcentage observé à un pourcentage théorique• Comparaison de deux pourcentages observés
– Échantillons indépendants– Échantillons appariés
Comparer 2 pourcentages observés- Échantillons indépendants -
• Problème : comparer 2 proportions (p1 et p2) dans 2 groupes indépendants de tailles n1 et n2 Comparer 1 à 2
Population1
Échantillonp1
Population2
Échantillonp2
Comparer 2 pourcentages observés- Échantillons indépendants -
• Formuler une hypothèse– Hypothèse nulle H0
• Les 2 échantillons sont issus de la même population ayant comme pourcentage0
1 = 2 (= 0) où 1 et 2 pourcentages de la population dont sont issus les échantillons 1 et 2
– Hypothèses alternatives H1
• Test bilatéral : 1 ≠ 2
• Test unilatéral : 1 < 2 ou 1 > 2
Comparer 2 pourcentages observés- Échantillons indépendants -
• Fixer le risque α• Choisir la statistique :
– Test du χ2 (loi du χ2)– Test z (loi normale)
• Conditions d’application :– n1. 0 ≥ 5 et n1.(1- 0) ≥ 5
– n2. 0 ≥ 5 et n1.(1- 0) ≥ 5
Comparer 2 pourcentages observés- Échantillons indépendants -
Test du χ2
• Calculer la valeur χ2 prise par la statistique– Tableau de contingence (tableau à 4 cases)
– Conditions d’application : Cij ≥ 5
–
– Sous HO la statistique suit une loi du X2 à 1 ddl
ji, ij
2ijij2
C)C(O
χ
Effectifs calculés sous H0 :
Nnn'
C ji ij
Succès Échec Total Groupe 1 O11 (C11) O12 (C12) n1 Groupe 2 O21 (C21) O22 (C22) n2 Total n’1 n’2 N
Comparer 2 pourcentages observés- Échantillons indépendants -
Test du χ2 : Remarques• Dans le cas des tableaux de contingence à 4 cases, il est
possible d’utiliser la correction de continuité, surtout lorsque les valeurs attendues sont faibles (en pratique Cij < 5)
• Petits échantillons : test exact de Fisher (hors programme)
ji, ij
ijij2
C
0,5-COχ
2
Comparer 2 pourcentages observés- Échantillons indépendants -
Test du χ2
• Confronter à la valeur critique – Lecture de la valeur seuil dans la table– Test bilatéral :
• Si : rejet de H0
• Si : non rejet de H0
2χ 21,αχ
21,α
2 χχ 21,α
2 χχ
Comparer 2 pourcentages observés- Échantillons indépendants -
• Exemple 2– On désire comparer l’efficacité de deux traitements T1 et T2
sur 100 patients atteints d’une maladie M.– On tire au sort 2 deux groupes de 50 patients, un groupe est
soumis à T1, le second à T2.– Le pourcentage de guérison chez les patients soumis à T1 est
de 30%, chez ceux soumis à T2 de 40%.– Le taux de guérison est-il différent entre les 2 traitements ?
Comparer 2 pourcentages observés- Échantillons indépendants -
Test du χ2 : exemple 2• Données : • Hypothèses : H0 : 1 = 2 ; H1 : 1 ≠ 2
• Calcul
– Conditions d’application vérifiées : Cij ≥ 5
– 1,1032,5
32,5)(3032,5
32,5)(3517,5
17,5)-(2017,5
17,5)-(15χ
22222
0,4p ; 50n et 0,3p ; 50n 2211
Guéris Non guéris Total Groupe T1 15 (17,5) 35 (32,5) 50 Groupe T2 20 (17,5) 30 (32,5) 50 Total 35 65 100
Comparer 2 pourcentages observés- Échantillons indépendants -
Test du χ2 : exemple 2• Lecture
• 3,84 : H0 acceptable.
On ne met pas en évidence, au risque 5%, de différence significative entre les taux de guérison avec les 2 traitements
25% 1,
2 χ 1,10χ
Comparer 2 pourcentages observés- Échantillons indépendants -
Test z• Calculer la valeur z prise par la statistique Z
–
– p0 est l'estimation de la proportion commune π0
– Z suit une loi normale centrée réduite
– Conditions d’application :• n1. π0 ≥ 5 et n1.(1- π0) ≥ 5 • n2. π0 ≥ 5 et n2.(1- π0) ≥ 5
2
00
1
00
21
n)p.(1p
n)p.(1p
ppz
χ2 = (z)2
Cij ≥ 5
Х2 à 1 ddl est le carré d’une loi normale
centrée réduite
21
22110 nn
.pn.pnp
avec
Comparer 2 pourcentages observés- Échantillons indépendants -
Test z
• Confronter z à la valeur critique zα
– Test bilatéral : on rejette H0 si |z|≥ zα
– Test unilatéral :• si H1 s’écrit π1 > π 2, on rejette H0 si z ≥ z2α
• si H1 s’écrit π 1 < π 2, on rejette H0 si z ≤ -z2α
Comparer 2 pourcentages observés- Échantillons indépendants -
Test z : exemple 2• Données : • Hypothèses : H0 : 1 = 2 ; H1 : 1 ≠ 2
• Calcul
– Conditions d’application vérifiées : 50 x 0,35 ≥ 5 et 50 x 0,65 ≥ 5
1,05
500,35x0,65
500,35x0,65
0,40,3z
0,4p ; 50n et 0,3p ; 50n 2211
0,35505050x0,450x0,3
p0
Comparer 2 pourcentages observés- Échantillons indépendants -
Test z : exemple 2• Lecture
• z = 1,05 < z0,05 = 1,96 : H0 acceptable(Même conclusion que le test précédent)
Comparer deux pourcentages
Comparaison de deux pourcentages dans le cas des grands échantillons.• Comparaison d’un pourcentage observé à un pourcentage théorique• Comparaison de deux pourcentages observés
– Échantillons indépendants– Échantillons appariés
Comparer 2 pourcentages observés- Séries appariées -
• Variable aléatoire qualitative dichotomique• Cas des grands échantillons• Individus de 2 échantillons liés
– Présence d’une caractéristique sur les mêmes sujets– Présence d’une caractéristique chez des sujets appariés
• Problème : on s’intéresse aux taux de guérison chez des sujets ayant reçus un traitement T1 et des sujets appariés ayant reçus un traitement T2 : on cherche à comparer p1 et p2 les taux de guérison avec T1 et T2.
Comparer 2 pourcentages observés- Séries appariées -
• Formuler une hypothèse– Hypothèse nulle H0
• π1 = π 2 où π1 et π2 pourcentages inconnus des 2 populations d’où sont issus les échantillons
– Hypothèses alternatives H1
• Test bilatéral : π1 ≠ π2
• Test unilatéral : π1 < π2 ou π1 > π2
Comparer 2 pourcentages observés- Séries appariées -
• Tableau des valeurs– Pour tenir compte de
l’appariement, il faut faire apparaître quels sont les sujets qui appartiennent aux mêmes paires.
– Pour chaque paire d’individus, on peut observer, selon s’il y a présence (+) ou absence (-) du caractère étudié, l’une des 4 configurations possibles.
Échantillon 1 Échantillon 2Nombre de paires
+ + a
+ - b
- + c
- - d
Comparer 2 pourcentages observés- Séries appariées -
– Les paires concordantes n’apportent pas d’information sur la liaison entre le traitement et la guérison. On doit donc se fonder sur la répartition des paires discordantes.
– Si l’hypothèse H0 est vraie, il doit y avoir autant de paires discordantes du type +- que de type -+
– Tester H0 revient donc à tester si le pourcentage observé de paires -+ est significativement différent de la valeur théorique 0,5.
Éch. 2 + - Total
Éch. 1 + a b a+b - c d c+d
Total a+c b+d n
Comparer 2 pourcentages observés- Séries appariées -
• Fixer le risque α• Choisir la statistique
– Test du χ2 de McNemar (loi du X2)– Test z (loi normale)– Conditions d’application
Comparer 2 pourcentages observés- Séries appariées -
cbc)(b
2cb
2cb
-c
2cb
2cb
-bχ
2
22
2
+- -+ Effectifs observés b c b+c
Effectifs calculés b+ c2 b+ c2 b+c
52
cb
Comparer 2 pourcentages observés- Séries appariées -
Test de McNemar (χ2) : remarques• Il est possible d’utiliser la correction de continuité, surtout
lorsque les valeurs attendues sont faibles
cb
1cb
2cb
0,5-2
cb-c
2cb
0,5-2
cb-b
χ2
22
20
Comparer 2 pourcentages observés- Séries appariées -
Test de McNemar (χ2)
• Confronter à la valeur critique – Lecture de la valeur seuil dans la table– Test bilatéral : on rejette H0 si
• Si : rejet de H0
• Si : non rejet de H0
2χ 21,αχ
2α 1,
2 χχ 21,α
2 χχ
Comparer 2 pourcentages observés- Séries appariées -
Test z• Calculer la valeur z prise par la statistique Z
–
– Z suit une loi normale centrée réduite
– Conditions d’application : b+c ≥ 10
cbcb
c).0,5.0,5(b2
cbb
z
χ2 = (z)2
Х2 à 1 ddl est le carré d’une loi normale
centrée réduite
Comparer 2 pourcentages observés- Séries appariées -
Test z
• Confronter z à la valeur critique zα
– Test bilatéral : on rejette H0 si |z|≥ zα
– Test unilatéral :• si H1 s’écrit π1 > π2, on rejette H0 si z ≥ z2α
• si H1 s’écrit π1 < π2, on rejette H0 si z ≤ -z2α
Comparer 2 pourcentages observés- Séries appariées -
• Exemple 3– On désire comparer l’efficacité de deux traitements T1 et T2 chez 100 patients atteint
d’une maladie M.– Les deux traitements sont administrés aux patients. L’ordre d’administration des 2
traitements est tiré au sort en ménageant une période dite de wash-out entre les 2 administrations.
– Les résultats sont les suivants :
– Le taux de guérison est-il différent entre les deux traitements ?
T1 Succès Échec
T2 Succès 24 16 Échec 6 54
Comparer 2 pourcentages observés- Séries appariées -
Test de McNemar : exemple 3• On cherche à comparer les pourcentages observés :
• Hypothèses : H0 : π1 = π2 ; H1 : π1 ≠ π2
• Conditions d’application vérifiées : nombre de paires discordantes = 16 + 6 = 22 ≥ 10
• 4,556)(16
6)-(16χ
22
30100
624,
1p 40
100
1624,
2p
Comparer 2 pourcentages observés- Séries appariées -
Test de McNemar : exemple 3• Lecture
• 3,84 : H0 rejetéeOn montre, au risque 5%, une différence significative entre les taux de guérison avec les 2 traitements (p<0,05).
25% 1,
2 χ 4,55χ