37
Test de Student Stéphane Canu [email protected] M8 - Principes du traitement de l’information June 2, 2020

Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Test de Student

Stéphane [email protected]

M8 - Principes du traitement de l’information

June 2, 2020

Page 2: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Plan

1 Comparaisons d’une variable quantitative et d’une variables qualitative :le test de Student

L’exemple de l’effet d’un médicamentSi la variance est connueSi la variance est inconnue

La loi de StudentDéfinitionPropriétés et approximationLe cas de la moyenne d’un échantillon gaussienLe cas de deux échantillons gaussien

Le test de Student (t-test)

2 Comparaisons de deux variables quantitatives : le test de Student

3 Conclusion

Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 2020 2 / 34

Page 3: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

L’exemple de l’effet d’un médicamentpatient Groupe Pression sanguine

t1 traitement 88t2 traitement 83t3 traitement 82t4 traitement 101t5 traitement 99t6 traitement 85t7 traitement 87t8 traitement 89t9 traitement 88p10 placebo 88p11 placebo 82p12 placebo 101p13 placebo 106p14 placebo 96p15 placebo 92p16 placebo 112p17 placebo 97

qualitative quantitative

Question : le traitement fait-ildiminuer significativement la pressionsanguine ?les hypothèses :{H0 : le traitement est inefficaceH1 : le traitement la fait baisser

Réponse : comparer les deuxéchantillons à travers la différenceentre leurs moyennes

x t − xp = 90, 2− 96, 7 = −6, 5

La question posée se résume ainsicette valeur de -6,5 peut elle s’expliquer par un hasard raisonnable ?

Page 4: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Un hasard raisonnablex t − xp = −6, 5 peut elle s’expliquer par un hasard raisonnable ?

x t =1nt

nt=9∑i=1

xti xp =1np

np∑i=1

xpi

Figure: Illustration des eux cas de figure. Dans le premier cas (à gauche) la variance est grandeet donc la distance de 6.5 est petite et due au hasard. Dans le second cas (à droite) la varianceest petite et la distance de 6,5 est grande.

pour répondre......il faut prendre en compte la variance

Page 5: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Prendre en compte la variance : le modèleLes trois hypothèses

1 l’hypothèse gaussiènne :I mesure des patients avec traitement : Xt ∼ N

(µt , σ

2)

I mesure des patients sous placébo : Xp ∼ N(µp, σ

2)

2 même variance : σ2t = σ2p = σ2

3 avec la variance connue donc par exemple : σ2 = 60.

les hypothèses :{H0 : inefficace µt = µpH1 : la pression baisse µt < µp

Nous savons que les moyennes des échantillons suivent une loi normalemoyenne avec traitement : X t ∼ N

(µt ,

σ2

nt

)moyenne sous placébo : X p ∼ N

(µp,

σ2

np

)

carIE(X ) = IE( 1

n

∑ni=1 Xi )

= 1n

∑ni=1 IE(Xi )

= 1n

∑ni=1 µ = µ

V (X ) = V ( 1n

∑ni=1 Xi )

= 1n2

∑ni=1 V (Xi )

= 1n2

∑ni=1 σ

2 = σ2

n

Page 6: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Prendre en compte la variance : le modèleLes trois hypothèses

1 l’hypothèse gaussiènne :I mesure des patients avec traitement : Xt ∼ N

(µt , σ

2)

I mesure des patients sous placébo : Xp ∼ N(µp, σ

2)

2 même variance : σ2t = σ2p = σ2

3 avec la variance connue donc par exemple : σ2 = 60.

les hypothèses :{H0 : inefficace µt = µpH1 : la pression baisse µt < µp

Nous savons que les moyennes des échantillons suivent une loi normalemoyenne avec traitement : X t ∼ N

(µt ,

σ2

nt

)moyenne sous placébo : X p ∼ N

(µp,

σ2

np

)La différence des moyennes suit aussi une loi normale :

X t − X p ∼ N(µt − µp, σ2

( 1nt

+1np

))

Page 7: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Le test 1(variance connue)

Le modèle : X t − X p ∼ N(µt − µp, σ2

( 1nt

+ 1np

))Le test se rapporte aux deux hypothèses suivantes :{

H0 : le traitement n’a pas d’effet µt − µp = 0H1 : le traitement est efficace µt − µp < 0

Maintenant nous faisons l’hypothèse que le traitement n’a pas d’effet.

sous H0 : U =X t − X p√σ2( 1nt

+ 1np

) ∼ N (0, 1)Avec les données dont nous disposons nous pouvons calculer

u =90, 2− 96, 7√60( 1

9 + 18

) = −1.73

-1,73 est-ce grand ou petit ?

Page 8: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Le test 2 (variance connue)

sous H0 : U =X t − X p√σ2( 1nt

+ 1np

) ∼ N (0, 1)Avec les données dont nous disposons nous pouvons calculer

u =90, 2− 96, 7√60( 1

9 + 18

) = −1.73

En prenant les tables de la loi normale nous constatons que

IP(U ≤ −1.7343) = 0, 041

Il y a donc moins de 5% de chances d’observer un tel résultat. Il ne nousapparait donc pas raisonnable d’expliquer cette différence entre le moyennespar le hasard seul. Nous concluons dans ce cas en rejetant cette hypothèse.Il nous semble plus raisonnable d’admettre que le traitement à un effet.

Page 9: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Récapitulons : le test de comparaison des moyennes1 la question : les deux groupes sont ils des réalisation de la même loi2 le modèle : gaussien3 les hypothèses : même variance σ2 connue4 caclul de

u =x t − xp√σ2( 1nt

+ 1np

)x t moyenne avec traitementxp moyenne sans traitementnt nombre de cas avec traitementnp nombre de cas sans traitement

5 calcul de la p-valeur U ∼ N(0, 1)(ou lecture sur les tables)

pval = IP(U ≤ u)

6 on décide qu’on ne peut pas conclure à l’efficacité du traitement si lap-valeur est supérieure à 0,05, si pval ≥ 0, 05

Page 10: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Les trois variantes :la pression :

diminue augmente varie .{H0 : µt − µp = 0H1 : µt − µp < 0

{H0 : µt − µp = 0H1 : µt − µp > 0

{H0 : µt − µp = 0H1 : µt − µp 6= 0

pval =

IP(U ≤ u) IP(U ≥ u) IP(U ≤ −|u|) + IP(U ≥ |u|)

quand la question change...le calcul de la pval change

Exemple : pour u = −1, 73, pval =

dim : IP(U ≤ −1, 73) = 0, 041

aug : IP(U ≥ −1, 73) = 1− 0, 041 = 0, 959

var : IP(U ≤ −1, 73) + IP(U ≥ 1, 73) = 0, 041 + 0, 041 = 0, 082

Page 11: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

une interprétation de la statistique

u = signalbruit

= écart entre les moyennes des deux groupesvariabilité des observations

=x t−xp√

σ2(

1nt+ 1

np

)

Page 12: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Plan

1 Comparaisons d’une variable quantitative et d’une variables qualitative :le test de Student

L’exemple de l’effet d’un médicamentSi la variance est connueSi la variance est inconnue

La loi de StudentDéfinitionPropriétés et approximationLe cas de la moyenne d’un échantillon gaussienLe cas de deux échantillons gaussien

Le test de Student (t-test)

2 Comparaisons de deux variables quantitatives : le test de Student

3 Conclusion

Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 2020 11 / 34

Page 13: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Si la variance est inconnueDans ce cas on remplace la variance inconnue σ2 par son estimateur σ2.En conséquence la nouvelle variable aléatoire ainsi construite n’est plusdistribué selon une loi normale mais suit une loi et Student à nt + np − 2degrés de liberté.

Tnt+np−2 =X t − X p√σ2( 1nt

+ 1np

) ∼ Tnt+np−2

avec σ2 = 1nt+np−2

(∑nti=1(Xti − X t)2 +

∑npi=1(Xpi − X p)2

).

t =90, 2− 96, 7√63, 4

(19 + 1

8

) = −1.68

En prenant les tables de la loi de Student nous constatons que

pval = IP(Tnt+np−2 ≤ −1.68) = 0, 056

Il y a dans ce cas plus de 5% de chances d’observer un tel résultat. Il nous apparait doncplausible d’expliquer cette différence entre le moyennes par le seul effet du hasard. Nousconcluons dans ce cas en gardant cette hypothèse. Il n’y a pas assez d’évidence expérimentalepour nous convaincre que le traitement a vraiment un effet. Si le médecin souhaite poursuivre, illui faut refaire une expérience sur plus de sujets.

Page 14: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Récapitulons : le test de comparaison des moyennes1 la question : les deux groupes sont ils des réalisation de la même loi2 le modèle : gaussien3 les hypothèses : même variance σ2 inconnue4 caclul de

t =x t − xp√σ2( 1nt

+ 1np

)x t moyenne avec traitementxp moyenne sans traitement

σ2 = 1nt+np−2

( nt∑i=1

(xti − x t)2 +

np∑i=1

(xpi − xp)2)

nt nombre de cas avec traitementnp nombre de cas sans traitement

5 calcul de la p-valeur T ∼ Tnt+np−2 (ou lecture sur les tables)

pval = IP(T ≤ t)

6 on décide qu’on ne peut pas conclure à l’efficacité du traitement si lap-valeur est supérieure à 0,05, si pval ≥ 0, 05

Page 15: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Plan

1 Comparaisons d’une variable quantitative et d’une variables qualitative :le test de Student

L’exemple de l’effet d’un médicamentSi la variance est connueSi la variance est inconnue

La loi de StudentDéfinitionPropriétés et approximationLe cas de la moyenne d’un échantillon gaussienLe cas de deux échantillons gaussien

Le test de Student (t-test)

2 Comparaisons de deux variables quantitatives : le test de Student

3 Conclusion

Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 2020 14 / 34

Page 16: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

La loi de Student : définition

Soit N ∼ N (0, 1) une variable aléatoire normale centrée réduite.

Soit Xn la variable aléatoire distribuée suivant une loi du χ2 à n ddlI C’est le cas par exemple, si N1,N2, ...,Nn un échantillon de n réalisation

i.i.d. une variable aléatoire normale centrée réduite quand Xn =n∑

i=1

N2i

supposons que N et Xn sont indépendantes (i.e. cov(Y ,Xn) = 0)

Definition (La loi de student)On appelle loi de student à n degrés de libertés la loi de la variablealéatoire Tn

Tn =N√Xnn

N ∼ N (0, 1)

Xn ∼ χ2n

Page 17: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

La loi de Student : Tn =N√Xnn

Figure: Exemples de loi de student pour 1 (bleu), 2 (rouge), 5 (vert), 10 (violet) et 20 (bleuciel) degrés de liberté. La courbe en pointillés noir est la courbe de Gauss donnée commeréférence. La figure de droite montre un zoom sur la « queue » de la distribution.

Loi de Student et loi normale

Tn −−−−→n→+∞

N (0, 1)

Page 18: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Propriétés et approximationPubliée pour la première fois en 1908 par William Sealy Gosset quitravaillait chez Guinness (la brasserie de Dublin). Pour des raisonscommerciales, il a du utiliser le pseudonyme de Student, qui resteraattaché à cette loi.

tend vers une loi normale n > 30

attention la différence est plus importante dans les « queue » de ladistribution :

I N ∼ N (0, 1) : IP(N > 2) = 0, 023 p1 = 1-cdf(’norm’,2,0,1)I T ∼ T1 : IP(T > 2) = 0, 148 p2 = 1-cdf(’t’,2,1)I T ∼ T2 : IP(T > 2) = 0, 092 p2 = 1-cdf(’t’,2,2)I T ∼ T10 : IP(T > 2) = 0, 038 p2 = 1-cdf(’t’,2,10)

U ∼ N (0, σ2) N =U

σ∼ N (0, 1) T =

N

σ=

N√N2

1+N22

2

∼ T2

Page 19: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Le cas de la moyenne d’un échantillon gaussien

Soit X ∼ N (µ, σ2) une variable aléatoire normale d’espérance µ et devariance σ2. Soit X1,X2, ...,Xn un échantillon de n réalisation i.i.d. decette variable aléatoire. La moyenne X = 1

n

∑ni=1 Xi de cet échantillon suit

aussi une loi normale

X ∼ N(µ,σ2

n

)car IE(X ) = µ et V (X ) = σ2

n :

IE(X ) = IE( 1n∑n

i=1 Xi )= 1

n

∑ni=1 IE(Xi )

= 1n

∑ni=1 µ = µ

V (X ) = V ( 1n∑n

i=1 Xi )= 1

n2

∑ni=1 V (Xi )

= 1n2

∑ni=1 σ

2 = σ2

n

Page 20: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Le cas de la moyenne d’un échantillon gaussienSoit X ∼ N (µ, σ2) une variable aléatoire normale d’espérance µ et devariance σ2. Soit X1,X2, ...,Xn un échantillon de n réalisation i.i.d. decette variable aléatoire. La moyenne X = 1

n

∑ni=1 Xi de cet échantillon suit

aussi une loi normale

X ∼ N(µ,σ2

n

)On peut donc construire la variable normale centrée réduite

Y = X−µ√σ2n

∼ N (0, 1). Or Zn−1 =∑n

i=1(Xi−X )2

σ2 ∼ χ2n−1

On peut construire une variable aléatoire suivant une loi de Student

Tn−1 =Y√Zn−1n−1

=

X−µ√σ2n√∑n

i=1(Xi−X )2

σ2n−1

=X − µ√

1n−1

∑ni=1(Xi−X )2

n

=X − µSn−1√

n

avec S2n−1 = 1

n−1

∑ni=1(Xi − X )2.

Page 21: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Le test de Student (t-test) : deux échantillons gaussien

Soit X ∼ N (µx , σ2) et Y ∼ N (µy , σ

2) deux loi de même variance.

On tire deux échantillons suivant ces deux loi.Soient X1, ...,Xnx et Y1, ...,Yny ces deux échantillons.Les variables suivantes X = 1

n

∑nxi=1 Xi et S2

x =∑nx

i=1(Xi − X )2 sontcaractérisées par les lois :

X ∼ N(µx ,

σ2

nx

); Y ∼ N

(µy ,

σ2

ny

);

S2x

σ2∼ χ2nx−1 ;

S2y

σ2∼ χ2ny−1

et donc

X − Y ∼ N(µx − µy ,

( 1nx

+1ny

)σ2)

;S2x

σ2+

S2y

σ2∼ χ2nx+ny−2

Page 22: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Le test de Student (t-test)

X − Y ∼ N(µx − µy ,

( 1nx

+1ny

)σ2)

;S2x

σ2+

S2y

σ2∼ χ2nx+ny−2

On définit alors la variable de Student suivante :

Tnx+ny−2 =√nx + ny − 2

X − Y − (µx − µy )√(1nx

+ 1ny

)S2xy

avec S2xy = S2

x + S2y =

nx∑i=1

(Xi − X )2 +

ny∑i=1

(Yi − Y )2

Si l’on fait l’hypothèse que µx = µy

T =√nx + ny − 2

X − Y√(1nx

+ 1ny

)S2xy

suit une loi de Student à nx + ny − 2 degrés de liberté.

Page 23: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Plan

1 Comparaisons d’une variable quantitative et d’une variables qualitative :le test de Student

L’exemple de l’effet d’un médicamentSi la variance est connueSi la variance est inconnue

La loi de StudentDéfinitionPropriétés et approximationLe cas de la moyenne d’un échantillon gaussienLe cas de deux échantillons gaussien

Le test de Student (t-test)

2 Comparaisons de deux variables quantitatives : le test de Student

3 Conclusion

Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 2020 21 / 34

Page 24: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Le test de Student (t-test)les deux échantilons : Xt1, ...,Xti , ...,Xtnt ,Xp1, ...,Xpi , ...,Xpnp i.i.d

Les deux hypothèses1 l’hypothèse gaussiènne :

I soit Xti ∼ N(µt , σ

2)

I et Xpi ∼ N(µp, σ

2)

2 même variance : σ2t = σ2p = σ2

la question : les deux échantillons que nous observons sont-ils desréalisations d’une même variable aléatoire ?

les hypothèses :{H0 : échantillons de même loi µt = µpH1 : de lois différentes µt > µp

la statistique : T =X t − X p√σ2( 1nt

+ 1np

) ∼ Tnt+np−2

avec σ2 = 1nt+np−2

( nt∑i=1

(Xti − X t)2 +

np∑i=1

(Xpi − X p)2)

Page 25: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Mise en œuvre du test de student

1 caclul de

x t =1nt

nt∑i=1

xti moyenne avec traitement

xp =1np

np∑i=1

xpi moyenne sans traitement

2 caclul de σ2 = 1nt+np−2

( nt∑i=1

(xti − x t)2 +

np∑i=1

(xpi − xp)2)

3 caclul det =

x t − xp√σ2( 1nt

+ 1np

) nt nombre de cas avec traitementnp nombre de cas sans traitement

4 calcul du nombre de degrés de liberté d = nt + np − 25 calcul de la p-valeur T ∼ Td (ou lecture sur les tables)

pval = IP(T > t)

6 on décide qu’on ne peut pas conclure à l’efficacité du traitement si lap-valeur est supérieure à 0,05, si pval > 0, 05

Page 26: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Exemple de mise en œuvre du test de studentgroupe avec traitement (t) 30.02 29.99 30.11 29.97 30.01 29.99groupe sans traitement (p) 29.89 29.93 29.72 29.98 30.02 29.98

Question : le traitement augmente-t-il la mesure ?

Réponse : on effectue le test de student :1 x t = 30.015, xp = 29.92 x t − xp = 0.095

2 σ2 = 110

( 6∑i=1

(xti − 30.015)2 +6∑

i=1

(xpi − 29.92)2)≈ 0.0071

3

t =x t − xp√σ2( 1nt

+ 1np

) ≈ 0.095√0.0071

( 16 + 1

6

) = 1.959

4 calcul du nombre de degrés de liberté d = nt + np − 2 = 105 calcul de la p-valeur T ∼ Td (ou lecture sur les tables)

pval = IP(T ≥ 1.959) = 1-cdf(’t’,1.959,10) = 0.0393

6 on décide qu’on peut conclure à l’efficacité du traitement car la p-valeur estinférieure à 0,05.

Page 27: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Exemple de mise en œuvre du test de studentgroupe avec traitement (t) 30.02 29.99 30.11 29.97 30.01 29.99groupe sans traitement (p) 29.89 29.93 29.72 29.98 30.02 29.98

Question : le traitement augmente-t-il la mesure ?

Réponse : on effectue le test de student :1 x t = 30.015, xp = 29.92 x t − xp = 0.095

2 σ2 = 110

( 6∑i=1

(xti − 30.015)2 +6∑

i=1

(xpi − 29.92)2)≈ 0.0071

3

t =x t − xp√σ2( 1nt

+ 1np

) ≈ 0.095√0.0071

( 16 + 1

6

) = 1.959

4 calcul du nombre de degrés de liberté d = nt + np − 2 = 105 calcul de la p-valeur T ∼ Td (ou lecture sur les tables)

pval = IP(T ≥ 1.959) = 1-cdf(’t’,1.959,10) = 0.0393

6 on décide qu’on peut conclure à l’efficacité du traitement car la p-valeur estinférieure à 0,05.

Page 28: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Le test de student en Python et matlab

PythonStatistical tests (from scipy.stats)

-> ttest_1samp(a, popmean[, axis, nan_policy])Calculate the T-test for the mean of ONE group of scores.

-> ttest_ind_from_stats(mean1, std1, nobs1, mean2, std2, nobs2, equal_var=True)T-test for means of two independent samples from descriptive statistics.This is a two-sided test for the null hypothesis that two independentsamples have identical average (expected) values.

-> ttest_ind_from_stats(mean1, std1, nobs1, ?)T-test for means of two independent samples fromdescriptive statistics.

-> ttest_rel(a, b[, axis, nan_policy])Calculate the t-test on TWO RELATEDsamples of scores, a and b.

Matlab

[H,P,CI,STATS] = TTEST2(...) returns a structure with the following fields:’tstat’ -- the value of the test statistic’df’ -- the degrees of freedom of the test’sd’ -- the pooled estimate of the population standard deviation

(for the equal variance case) or a vector containing theunpooled estimates of the population standard deviations(for the unequal variance case)

[...] = TTEST2(X,Y,ALPHA,TAIL,VARTYPE,DIM) works along dimension DIM ofX and Y. Pass in [] to use default values for ALPHA, TAIL, or VARTYPE.

See also ttest, ranksum, vartest2, ansaribradley.

Page 29: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Plan

1 Comparaisons d’une variable quantitative et d’une variables qualitative :le test de Student

L’exemple de l’effet d’un médicamentSi la variance est connueSi la variance est inconnue

La loi de StudentDéfinitionPropriétés et approximationLe cas de la moyenne d’un échantillon gaussienLe cas de deux échantillons gaussien

Le test de Student (t-test)

2 Comparaisons de deux variables quantitatives : le test de Student

3 Conclusion

Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 2020 26 / 34

Page 30: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

L’exemple de la relation entre oxygène dissout et pressionpatient O2 Pression sanguinep1 0,31 88p2 0,30 83p3 0,29 82p4 0,35 101p5 0,33 99p6 0,31 85p7 0,30 87p8 0,34 89p9 0,32 88p10 0,28 88p11 0,30 82p12 0,33 101p13 0,31 106p14 0,32 96p15 0,30 92p16 0,35 112p17 0,31 97

quantitative quantitative

Question : Il y a t’il une relation entreces deux variables ?

les hypothèses{H0 : indépendanceH1 : dépendance

Réponse : tester la pente de la droite

pression = aO2 + b + ε

les hypothèses{H0 : a = 0H1 : a 6= 0

la regression donne a = 0, 12Cette valeur peut elle s’expliquer par un hasard raisonnable ?

Page 31: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

un hasard raisonnable...

1 supposons qu’il y a indépendance a = 0

2 générons plein (m = 1000, 1000000,+∞) d’échantillons

(xi , yij = axi + b + εij), i = 1, n j = 1,m

3 pour chacun de ces échantillon calculons aj

4 regardons la probabilité IP(|a| > 0, 12)

5 si cette probabilité est trop petite, il n’est pas « raisonnable » deconsidérer que l’hypothèse d’indépendance est exacte.

Page 32: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Comparaisons de deux variables quantitatives et régression

yi = axi + b + εi εi ∼ N (0, σ2)indépendance des εi

a =

∑ni=1(xi − x)(yi − y)∑n

i=1(xi − x)2

a ∼ N(a, σ2 1∑n

i=1(xi−x)2

) a− a√σ2∑n

i=1(xi−x)2∼ N (0, 1)

εi = yi − (axi + b)

εiσ∼ N (0, 1) ⇒ 1

σ2

n∑i=1

ε2i ∼ χ2n1σ2

n∑i=1

ε2i ∼ χ2n−2

Page 33: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Pente de la droite de régression et loi de student

a− a√σ2∑n

i=1(xi−x)2∼ N (0, 1)

1σ2

n∑i=1

ε2i ∼ χ2n−2

or N√χ2nn

∼ T 2n suit une loi de student à n degrés de libertés

a−a√σ2∑n

i=1(xi−x)2√1

σ2(n−2)∑n

i=1 ε2i

∼ Tn−2 =⇒ a− a√σ2

S2x

∼ Tn−2

avec σ2 = 1n−2

n∑i=1

(yi − (axi + b)

)2 et S2x =

n∑i=1

(xi − x)2

Page 34: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Mise en œuvre du test sur la pente de la régression

1 les hypothèses :{H0 : indépendance a = 0H1 : dépendance a 6= 0

2 caclul de a =

∑ni=1(xi − x)(yi − y)∑n

i=1(xi − x)2

3 calcul de σ2 = 1n−2

n∑i=1

(yi − (axi + b)

)2 et de S2x =

n∑i=1

(xi − x)2

4 caclul det =

a√σ2

S2x

5 calcul du nombre de degrés de liberté d = n − 26 calcul de la p-valeur T ∼ Td (ou lecture sur les tables)

pval = 2IP(T ≥ |t|)

7 on décide qu’on ne peut pas conclure à l’efficacité du traitement si lap-valeur est supérieure à 0,05, si pval ≥ 0, 05

Page 35: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

Plan

1 Comparaisons d’une variable quantitative et d’une variables qualitative :le test de Student

L’exemple de l’effet d’un médicamentSi la variance est connueSi la variance est inconnue

La loi de StudentDéfinitionPropriétés et approximationLe cas de la moyenne d’un échantillon gaussienLe cas de deux échantillons gaussien

Le test de Student (t-test)

2 Comparaisons de deux variables quantitatives : le test de Student

3 Conclusion

Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 2020 32 / 34

Page 36: Plateforme e-learning Moodle de l'INSA de Rouen - …Stéphane Canu (INSA Rouen - ASI) Test de Student June 2, 20202/34 L’exempledel’effetd’unmédicament patient Groupe Pressionsanguine

ConclusionLa question

I cette variable quantitative est elle indépendantes de cette variablequalitative ?

I comparaison de deux échantillons quantitatifs

il vérifier les hypothèses avant d’effectuer un test de studentI distribution normale (par exemple un test du χ2 adapté)I égalité de variances (test de Fisher)

sinon il faut faire un autre test comme celui de Wilcoxon ou de Mannet Whitney

il existes plusieurs variations du test de student...I un échantillon (test d’une valeur de l’espérance) puisque X−µ

Sn−1√n

∼ Tn−1

I deux échantillons appariésI test de la pente de la régression simple

Il existe une théorie et des théorèmes pour définir les testI théorème de Neyman Pearson