Download ppt - Tests de comparaison de pourcentages Docteur Alexandrine Lambert > Faculté de Pharmacie

Tests de comparaison de pourcentages

Docteur Alexandrine Lambert

> Faculté de Pharmacie

Comparer deux pourcentages

• Pourcentage– Variable qualitative dichotomique(Présence/Absence, Malades/Non malades, Décès/Survie, …)

– est le pourcentage (inconnu) d’individus présentant la caractéristique dans la population

– est estimé par le pourcentage p observé sur un échantillon de taille n dont k individus présentent la caractéristique

nk

p


Comparaison de deux pourcentages dans le cas des grands échantillons.• Comparaison d’un pourcentage observé à un pourcentage théorique• Comparaison de deux pourcentages observés

– Échantillons indépendants– Échantillons appariés




Comparer un pourcentageà une valeur théorique

• Problème : déterminer si un pourcentage observé p sur un échantillon de taille n est différent d’une valeur théorique th

Comparer à th

Population (inconnu)

Populationde référenceth (connu)

Échantillonp


• Formuler une hypothèse– Hypothèse nulle H0

• = th où est le pourcentage de la population dont est issu l’échantillon

– Hypothèses alternatives H1

• Test bilatéral : ≠ th

• Test unilatéral à gauche ou à droite : < th ou > th


• Fixer le risque α• Choisir la statistique

– Test du χ2 de conformité (loi du X2)– Test z (loi normale)

• Conditions d’application :– n. th ≥ 5 et n.(1- th) ≥ 5 (cas des grands échantillons)


Test du χ2 de conformité• Calculer la valeur χ2 prise par la statistique du test

– Tableau

– Conditions d’application : C1 ≥ 5 et C2 ≥ 5

–

– Sous H0 la statistique suit une loi du X2 à 1 ddl2

222

1

2112

C)C(O

C)C(O

χ

Effectifs observés O1 = n.p O2 = n.(1-p) n

Effectifs calculés C1 = n.th C2 = n.(1-th) n


Test du χ2 de conformité• Confronter à la valeur seuil

– Lecture de la valeur seuil dans la table de la loi du 2

– Test bilatéral : on rejette H0 au risque si • En pratique, si = 5%,

– Si : rejet de H0

– Si : non rejet de H0

2χ 21,αχ

21,α

2 χ χ

3,84 χ2

3,84χ21,α

3,84 χ2


• Exemple 1– En France, 7% des personnes hospitalisées contractent une

infection nosocomiale dans l'établissement où elles sont soignées.

– Sur un échantillon de 250 personnes soignées à l’hôpital H,28 ont contracté une infection nosocomiale.

– Le pourcentage observé sur l’échantillon diffère-t-il de la référence nationale au risque α = 5% ?


6,77232,5

232,5)(22217,5

17,5)(28χ

222

0,07π ; 0,11225028

p ; 250n th

Infection nosocomiale OUI NON Total

Effectifs observés O1 = 28 O2 = 222 250 Effectifs calculés C1 = 250x0,07 = 17,5 C2 = 250x0,93 = 232,5 250


Test du χ2 : exemple 1• Lecture

• 3,84 : rejet de H0

On montre, au risque 5%, une différence significative entre le pourcentage de personnes hospitalisées contractant une infection nosocomiale à l’hôpital H et dans l’ensemble du pays (p < 0,01).

25% 1,

2 χ 6,77χ


Test z• Calculer la valeur z prise par la statistique Z

n)π.(1π

πpz

thth

th

Équivalence entre χ2 et test z : χ2 = z2

χ2 à 1 ddl est le carré d’une loi normale centrée réduite

Équivalent à C1 et C2 ≥ 5

–

– Sous H0, Z suit une loi normale centrée réduite

– Conditions d’application : n.th ≥ 5 et n.(1- th) ≥ 5


Test z• Confronter z à la valeur critique zα

– Test bilatéral : on rejette H0 si |z|≥ zα

– Test unilatéral :• si H1 s’écrit > th, on rejette H0 si z ≥ z2α

• si H1 s’écrit < th, on rejette H0 si z ≤ -z2α

Pour un même risque d’erreur, les valeurs seuil du 2 sont doncles carrés des valeurs seuil de z : 2

1,=(z)2 (3,84 =1,962)


Test z : exemple 1• Données :

• Hypothèses : H0 : = 0,07 ; H1 : ≠ 0,07

• Calcul

–

– Conditions d’application vérifiées : 250 x 0,07 ≥ 5 et 250 x 0,93 ≥ 5

2,60

2500,93)0,07.(1

0,070,112z

0,07π ; 0,11225028

p ; 250n th


Test z : exemple 1• Lecture

• z = 2,60 ≥ z0,05 =1,96 : rejet de H0

Degré de signification lu dans la table : p < 0,01(même conclusion que test précédent)




Comparer 2 pourcentages observés- Échantillons indépendants -

• Problème : comparer 2 proportions (p1 et p2) dans 2 groupes indépendants de tailles n1 et n2 Comparer 1 à 2

Population1

Échantillonp1

Population2

Échantillonp2



• Les 2 échantillons sont issus de la même population ayant comme pourcentage0

1 = 2 (= 0) où 1 et 2 pourcentages de la population dont sont issus les échantillons 1 et 2


• Test bilatéral : 1 ≠ 2

• Test unilatéral : 1 < 2 ou 1 > 2


• Fixer le risque α• Choisir la statistique :

– Test du χ2 (loi du χ2)– Test z (loi normale)

• Conditions d’application :– n1. 0 ≥ 5 et n1.(1- 0) ≥ 5

– n2. 0 ≥ 5 et n1.(1- 0) ≥ 5


Test du χ2

• Calculer la valeur χ2 prise par la statistique– Tableau de contingence (tableau à 4 cases)

– Conditions d’application : Cij ≥ 5

–

– Sous HO la statistique suit une loi du X2 à 1 ddl

ji, ij

2ijij2

C)C(O

χ

Effectifs calculés sous H0 :

Nnn'

C ji ij

Succès Échec Total Groupe 1 O11 (C11) O12 (C12) n1 Groupe 2 O21 (C21) O22 (C22) n2 Total n’1 n’2 N


Test du χ2 : Remarques• Dans le cas des tableaux de contingence à 4 cases, il est

possible d’utiliser la correction de continuité, surtout lorsque les valeurs attendues sont faibles (en pratique Cij < 5)

• Petits échantillons : test exact de Fisher (hors programme)

ji, ij

ijij2

C

0,5-COχ

2


Test du χ2

• Confronter à la valeur critique – Lecture de la valeur seuil dans la table– Test bilatéral :

• Si : rejet de H0

• Si : non rejet de H0

2χ 21,αχ

21,α

2 χχ 21,α

2 χχ


• Exemple 2– On désire comparer l’efficacité de deux traitements T1 et T2

sur 100 patients atteints d’une maladie M.– On tire au sort 2 deux groupes de 50 patients, un groupe est

soumis à T1, le second à T2.– Le pourcentage de guérison chez les patients soumis à T1 est

de 30%, chez ceux soumis à T2 de 40%.– Le taux de guérison est-il différent entre les 2 traitements ?


Test du χ2 : exemple 2• Données : • Hypothèses : H0 : 1 = 2 ; H1 : 1 ≠ 2

• Calcul

– Conditions d’application vérifiées : Cij ≥ 5

– 1,1032,5

32,5)(3032,5

32,5)(3517,5

17,5)-(2017,5

17,5)-(15χ

22222

0,4p ; 50n et 0,3p ; 50n 2211

Guéris Non guéris Total Groupe T1 15 (17,5) 35 (32,5) 50 Groupe T2 20 (17,5) 30 (32,5) 50 Total 35 65 100


Test du χ2 : exemple 2• Lecture

• 3,84 : H0 acceptable.

On ne met pas en évidence, au risque 5%, de différence significative entre les taux de guérison avec les 2 traitements

25% 1,

2 χ 1,10χ



–

– p0 est l'estimation de la proportion commune π0

– Z suit une loi normale centrée réduite

– Conditions d’application :• n1. π0 ≥ 5 et n1.(1- π0) ≥ 5 • n2. π0 ≥ 5 et n2.(1- π0) ≥ 5

2

00

1

00

21

n)p.(1p

n)p.(1p

ppz

χ2 = (z)2

Cij ≥ 5

Х2 à 1 ddl est le carré d’une loi normale

centrée réduite

21

22110 nn

.pn.pnp

avec


Test z

• Confronter z à la valeur critique zα


– Test unilatéral :• si H1 s’écrit π1 > π 2, on rejette H0 si z ≥ z2α

• si H1 s’écrit π 1 < π 2, on rejette H0 si z ≤ -z2α


Test z : exemple 2• Données : • Hypothèses : H0 : 1 = 2 ; H1 : 1 ≠ 2

• Calcul

– Conditions d’application vérifiées : 50 x 0,35 ≥ 5 et 50 x 0,65 ≥ 5

1,05

500,35x0,65

500,35x0,65

0,40,3z

0,4p ; 50n et 0,3p ; 50n 2211

0,35505050x0,450x0,3

p0


Test z : exemple 2• Lecture

• z = 1,05 < z0,05 = 1,96 : H0 acceptable(Même conclusion que le test précédent)




Comparer 2 pourcentages observés- Séries appariées -

• Variable aléatoire qualitative dichotomique• Cas des grands échantillons• Individus de 2 échantillons liés

– Présence d’une caractéristique sur les mêmes sujets– Présence d’une caractéristique chez des sujets appariés

• Problème : on s’intéresse aux taux de guérison chez des sujets ayant reçus un traitement T1 et des sujets appariés ayant reçus un traitement T2 : on cherche à comparer p1 et p2 les taux de guérison avec T1 et T2.



• π1 = π 2 où π1 et π2 pourcentages inconnus des 2 populations d’où sont issus les échantillons


• Test bilatéral : π1 ≠ π2

• Test unilatéral : π1 < π2 ou π1 > π2


• Tableau des valeurs– Pour tenir compte de

l’appariement, il faut faire apparaître quels sont les sujets qui appartiennent aux mêmes paires.

– Pour chaque paire d’individus, on peut observer, selon s’il y a présence (+) ou absence (-) du caractère étudié, l’une des 4 configurations possibles.

Échantillon 1 Échantillon 2Nombre de paires

+ + a

+ - b

- + c

- - d


– Les paires concordantes n’apportent pas d’information sur la liaison entre le traitement et la guérison. On doit donc se fonder sur la répartition des paires discordantes.

– Si l’hypothèse H0 est vraie, il doit y avoir autant de paires discordantes du type +- que de type -+

– Tester H0 revient donc à tester si le pourcentage observé de paires -+ est significativement différent de la valeur théorique 0,5.

Éch. 2 + - Total

Éch. 1 + a b a+b - c d c+d

Total a+c b+d n


• Fixer le risque α• Choisir la statistique

– Test du χ2 de McNemar (loi du X2)– Test z (loi normale)– Conditions d’application


cbc)(b

2cb

2cb

-c

2cb

2cb

-bχ

2

22

2

+- -+ Effectifs observés b c b+c

Effectifs calculés b+ c2 b+ c2 b+c

52

cb


Test de McNemar (χ2) : remarques• Il est possible d’utiliser la correction de continuité, surtout

lorsque les valeurs attendues sont faibles

cb

1cb

2cb

0,5-2

cb-c

2cb

0,5-2

cb-b

χ2

22

20


Test de McNemar (χ2)

• Confronter à la valeur critique – Lecture de la valeur seuil dans la table– Test bilatéral : on rejette H0 si

• Si : rejet de H0

• Si : non rejet de H0

2χ 21,αχ

2α 1,

2 χχ 21,α

2 χχ



–

– Z suit une loi normale centrée réduite

– Conditions d’application : b+c ≥ 10

cbcb

c).0,5.0,5(b2

cbb

z

χ2 = (z)2

Х2 à 1 ddl est le carré d’une loi normale

centrée réduite


Test z

• Confronter z à la valeur critique zα


– Test unilatéral :• si H1 s’écrit π1 > π2, on rejette H0 si z ≥ z2α

• si H1 s’écrit π1 < π2, on rejette H0 si z ≤ -z2α


• Exemple 3– On désire comparer l’efficacité de deux traitements T1 et T2 chez 100 patients atteint

d’une maladie M.– Les deux traitements sont administrés aux patients. L’ordre d’administration des 2

traitements est tiré au sort en ménageant une période dite de wash-out entre les 2 administrations.

– Les résultats sont les suivants :

– Le taux de guérison est-il différent entre les deux traitements ?

T1 Succès Échec

T2 Succès 24 16 Échec 6 54


Test de McNemar : exemple 3• On cherche à comparer les pourcentages observés :

• Hypothèses : H0 : π1 = π2 ; H1 : π1 ≠ π2

• Conditions d’application vérifiées : nombre de paires discordantes = 16 + 6 = 22 ≥ 10

• 4,556)(16

6)-(16χ

22

30100

624,

1p 40

100

1624,

2p


Test de McNemar : exemple 3• Lecture

• 3,84 : H0 rejetéeOn montre, au risque 5%, une différence significative entre les taux de guérison avec les 2 traitements (p<0,05).

25% 1,

2 χ 4,55χ