47
Nemparaméteres próbák 1 A binomiális eloszláson alapuló próbák • Binomiális próba: Hipotézisvizsgálat az előfordulások arányára, egy minta esetén • Két arány összehasonlítása

A binomiális eloszláson alapuló próbák

  • Upload
    jarvis

  • View
    40

  • Download
    2

Embed Size (px)

DESCRIPTION

A binomiális eloszláson alapuló próbák. Binomiális próba: Hipotézisvizsgálat az előfordulások arányára, egy minta esetén Két arány összehasonlítása. Binomiális próba Hipotézisvizsgálat az előfordulások arányára, egy minta esetén. 9. példa - PowerPoint PPT Presentation

Citation preview

Page 1: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 1

A binomiális eloszláson alapuló próbák

• Binomiális próba: Hipotézisvizsgálat az előfordulások arányára, egy minta esetén

• Két arány összehasonlítása

Page 2: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 2

9. példaAz újszülöttek között a tapasztalatok szerint a fiúk aránya 50/100. Egy kórházban egy napon 8 fiú és 4 lány születik. Jelent-e ez bármi szokatlant?

Előfordulhat ilyen? Milyen valószínűséggel?

5.0:H 00 01 :H

Binomiális próba Hipotézisvizsgálat az előfordulások arányára, egy minta esetén

5.0:H 00 5.0:H 01

Page 3: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 3

Kismintás (egzakt) eljárás

A próbastatisztika a mintában a lányok k0 száma.

knk

kn

kP

)1(

5.04kP

Annak vsz-e, hogy 4 vagy kevesebb lány legyen 12 közül, 0.194Döntés?

Page 4: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 4

Mekkora annak vsz-e, hogy 1 vagy kevesebb lány legyen 12 közül, ha p=0.5? (H0: p=0.5)

Elhiggyük?

a nullhipotézis igazsága esetén annak valószínűsége, hogy a talált vagy még szélsőségesebb adódjék p

Ha p0.05, elutasítjuk a nullhipotézist.

Pontosabban, ha p, elutasítjuk a nullhipotézist. a szignifikanciaszintHogy döntünk, ha = 0.05, 0.01, 0.001?

Page 5: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 5

Nagymintás eljárás 111

nnp

n

)1(0

0

nnku nem ismert

Wald: ˆ

0

)ˆ1(ˆ0

0

nnku

score)1( 00

00

nnku

nk

Page 6: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 6

Wald: ˆ

5.00 score

333.0124ˆ

nk

225.1667.0333.012

5.0124)ˆ1(ˆ

000

nnku

155.1)5.01(5.012

5.0124)1( 00

000

nnku

11.089.01 p

124.0876.01 p

Page 7: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 7

Wald: ˆ

score

919.0667.0333.012

5.0125.04)ˆ1(ˆ

5.0 000

nnku

A folytonossági (Yates-) korrekcióval

4 vagy kevesebb → 4.5 vagy kevesebb : +0.5

-1.155 ill. p0.124 helyett

867.0)5.01(5.012

5.0125.04)1(

5.0

00

000

nnku

-1.225 ill. p=0.11 helyett

konzervatív (a nullhipotézist megtartó) irányban változott

18.082.01 p

193.0807.01 p

Page 8: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 8

Döntés?

333.012040124

10. példa

Az illető kórházban egy napon 80 fiú és 40 lány születik. Jelent-e ez bármi szokatlant?

Page 9: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 9

11. példa

Mekkora minta szükséges ahhoz, hogy 90% biztonsággal észrevegyük, ha 0.5 helyett 0.4 (0.45, 0.49) a lányok születésének valószínűsége?

90% (0.9) a próba ereje (Power)p=0.5 a nullhipotézisp=0.4 (0.45, 0.49) az ellenhipotézis (alternative)

Sample Size Calculation One Proportion, Z, Chi-Square TestH0: Pi >= Pi0Value

Null Proportion (Pi0)Population Proportion (Pi)Alpha (Nominal)Actual Alpha (Exact)Power GoalActual Power (Normal Approx.)Actual Power (Exact)Required Sample Size (N)

0.50000.40000.05000.05440.90000.89450.9017

206.0000

Page 10: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 10

One Proportion: Sample Size CalculationTest on One Proportion (H0: Pi >= Pi0)

N vs. Pi (Alpha = 0.05, Pi0 = 0.5, Power = 0.9)

0.38 0.40 0.42 0.44 0.46

Population Proportion (Pi)

100

200

300

400

500

600

700

800

900

Sam

ple

Siz

e (E

xact

)

One Proportion: Sample Size CalculationTest on One Proportion (H0: Pi >= Pi0)

N vs. Pi (Alpha = 0.05, Pi0 = 0.5, Power = 0.9)

0.38 0.40 0.42 0.44 0.46 0.48 0.50 0.52

Population Proportion (Pi)

-2500

2500

7500

12500

17500

22500

Sam

ple

Siz

e (E

xact

)

Page 11: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 11

A binomiális eloszláson alapuló kétmintás próbák12. példa(M.J. Campbell, D. Manchin, Medical Statistics. A commonsense approach,

2nd edition, J. Wiley & Sons, 1993, p. 71)

A páciensek kétféle gyógyszert kaptak, kisorsolva, hogy ki melyiket. Kettős vak vizsgálatot végeztek: az orvos és a páciens sem tudja, hogy ki melyik gyógyszert kapja.

Van-e a két gyógyszer között különbség a tekintetben, hogy egyforma arányban gyógyultak-e tőlük a betegek? Gyógyszer típusa Gyógyult Nem gyógyult A 23 7 30 B 18 13 31 41 20 61

Page 12: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 12

1 annak valószínűsége, hogy a beteg az A gyógyszertől meggyógyul2 annak valószínűsége, hogy a beteg a B gyógyszertől meggyógyul

210 :H 211 :H

Az A és B gyógyszernél a gyógyulás relatív gyakorisága külön-külön binomiális eloszlást követ 1 és 1 paraméterrel

Page 13: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 13

7667.03023ˆ1 5806.0

3118ˆ2

)ˆ()ˆ(

ˆˆ)ˆˆ(

ˆˆ

21

2121

21

2121

VarVarVaru

Elég nagy minták esetén

Gyógyszer típusa Gyógyult Nem gyógyult A 23 7 30 B 18 13 31 41 20 61

Nagymintás eljárás

Page 14: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 14

)ˆ()ˆ(ˆˆ

21

210

VarVar

u

n

Var )1()ˆ(

2

22

1

1121

)1()1()ˆ()ˆ(nn

VarVar

2

22

1

11

210 )1()1(

ˆˆ

nn

u

2

22

1

11

2121

0 )1()1(

1121ˆˆ

nn

nnu

A folytonossági korrekcióval

Page 15: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 15

1 és 2 nem ismert

2

22

1

11

210 )1()1(

ˆˆ

nn

u

Wald 11 2 2ˆ

2

22

1

11

210 )ˆ1(ˆ)ˆ1(ˆ

ˆˆ

nn

u

583.1

31)5806.01(5806.0

30)7667.01(7667.0

5806.07667.0

057.0.94331583.11 F 114.0057.02 p

Page 16: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 16

1 és 2 nem ismert

2

22

1

11

210 )1()1(

ˆˆ

nn

u

score 672.061

1823ˆˆˆ

21

221`1

nnnn

547.1

311

301)672.01(672.0

3118

3023

11)ˆ1(ˆ

ˆˆ

21

210

nn

u

061.0939.01547.11 F 122.0061.02 p

Page 17: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 17

Wald

Gyógyszer típusa Gyógyult Nem gyógyult A 23 7 30 B 18 13 31 41 20 61

2

22

1

11

2121

0 )ˆ1(ˆ)ˆ1(ˆ

1121ˆˆ

nn

nnu

folytonossági korrekcióval

304.1

31)5806.01(5806.0

30)7667.01(7667.0

311

301

215806.07667.0

0

u

konzervatívabb 1.583 ill. p=0.114 helyett

p=0.904

Page 18: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 18

Módosított kérdés: Az A (új) gyógyszer jobb-e a B (elfogadott jelenlegi) gyógyszernél?

210 :H 211 :H

061.0939.01547.11 Fp

547.1

311

301)672.01(672.0

3118

3023

11)ˆ1(ˆ

ˆˆ

21

210

nn

u

Page 19: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 19

Gyógyszertípusa

Gyógyult Nemgyógyult

A 23 7 30B 18 13 31 41 20 61

Statistics>Nonparametrics

Page 20: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 20

2 x 2 Table (creditscoring)Column 1Column 2 Row

TotalsFrequencies, row 1Percent of totalFrequencies, row 2Percent of totalColumn totalsPercent of totalChi-square (df=1)V-square (df=1)Yates corrected Chi-squarePhi-squareFisher exact p, one-tailedtwo-tailedMcNemar Chi-square (A/D)Chi-square (B/C)

23 7 3037.705% 11.475%49.180%

18 13 3129.508% 21.311%50.820%

41 20 6167.213% 32.787%

2.39 p= .12182.35 p= .12491.62 p= .2025

.03925p= .1009p= .1737

2.25 p= .13364.00 p= .0455

dbcadcba

bcadN

220

dbcadcba

NbcadN

2

20

2

(folytonossági korrekcióval)

Gyógyszertípusa

Gyógyult Nemgyógyult

A 23 7 30B 18 13 31 41 20 61

Page 21: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 21

A szükséges minta-elemszám meghatározása

210 :H

nn

u2211

210 11

ˆˆ

uu 0elfogadjuk, ha

00 HuuPAz elsőfajú hiba valószínűsége:

211 :H

Page 22: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 22

A szükséges minta-elemszám meghatározása

nn

u2211

210 11

ˆˆ

uu 0elfogadjuk, ha

210 :H

13. példaMekkora mintákra van szükség, ha 80% biztonsággal észre akarjuk venni, hogy az egyik gyógyszerrel a betegek 20%-a, a másikkal 30%-a gyógyul meg?

Az elsőfajú hiba valószínűsége: 00 HuuP

211 :H

Page 23: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 23

nn

u2211

210 11

ˆˆ

nnnn2211

21

2211

2121

1111ˆˆ

uu 0elfogadjuk, ha

1

2221

21 H11

u

nn

uP

10 H uuP

Page 24: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 24

uuP

nn

uuP

2222

H21

111

nn

uu H

1122

21

111

1

1

H22112H21

2

11

uun

Page 25: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 25

Példa ?21 nnn

=0.05, =0.2, A=0.2, B=0.3

645.1u 84.0u

4.2283.013.02.012.03.02.084.0645.1

2

2

n

1

1

H22112H21

2

11

uun

Page 26: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 26

Page 27: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 27

Comparing 2 Proportions: Sample Size CalculationTwo Proportions, Z-Test (H0: Pi1 <= Pi2)

N vs. Power (Pi1 = 0.3, Pi2 = 0.2, Alpha = 0.05)

0.70 0.75 0.80 0.85 0.90 0.95 1.00

Power Goal (No Continuity Correction)

150

200

250

300

350

400

450S

ampl

e S

ize

for E

ach

Gro

up (N

1 =

N2)

Page 28: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 28

A Statistica Power Analysis eredményei:

A B n (korr. nélkül) n (korrekcióval)0.2 0.3 231 2510.3 0.4 281 3000.3 0.5 71 830.1 0.3 49 580.4 0.6 77 860.4 0.3 281 300

Nagyobb javulás (vagy romlás) kimutatásához kevesebb kísérlet is elég.A placebóval való kísérletezést egyre többször tiltják.

Page 29: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 29

Kismintás (egzakt) eljárás

Gyógyszer típusa Gyógyult Nem gyógyult A 1 9 10 B 3 1 4 4 10 14 Gyógyszer típusa Gyógyult Nem gyógyult A a b r1 B c d r2 c1 c2 N

210 :H 211 :H

(az előző példához képest fordított)

14. példa

Page 30: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 30

210 :H 211 :H

Annak valószínűsége, hogy r1 közül (akik az A gyógyszert szedik) a gyógyuljon meg

ara

ar

axP

1

111

1 1

Annak valószínűsége, hogy r2 közül (akik a B gyógyszert szedik) c gyógyuljon meg:

crc

cr

cxP

2

222

2 1 független események

a b r1

c d r2c1 c2 N

Page 31: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 31

021 H; bxaxP

carrcacrcara

cr

ar

cr

ar

2121 111 2121

p annak valószínűsége, hogy a kapott vagy annál is szélsőségesebb eredmény adódjék, ha a nullhipotézis igaz

1 9 0 10 1 9 0 10 3 1 3 1 4 0 4 0

212121

1

2

2

1H,0 2

2

1

1021

xxrrxxa

x

r

cx xr

xr

cxaxPp

a b r1

c d r2

c1 c2 N

Page 32: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 32

Hogy a képlettel számolni tudjunk, számértékére is szükség van

, ami mellett p maximális: =0.3

(0,10,4,0)(1,9,4,0)(0,10,3,1)(1,9,3,1) PPPPp

0.012495150.00915220.00213550.00098060.0002288

a b r1

c d r2c1 c2 N

212121

1

2

2

1H,0 2

2

1

1021

xxrrxxa

x

r

cx xr

xr

cxaxPp

Page 33: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 33

A nagymintás (közelítő) eljárással:

2857.014

31ˆ

N

ca

a b c d

1 9 3 1

43.2

41

1012857.012857.0

43

101

11ˆ1ˆ

ˆˆ

21

210

nn

u

p=0.0075folytonossági korrekcióval p=0.038

0.0125p

Page 34: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 34

A hatás nagyságának értelmezése

2

1

RR kockázati arány (Risk Ratio )

2

1

ˆˆ

RR1

1ˆrb

2

2ˆrc

1

2

crbrRR

a b r1

c d r2c1 c2 N

Page 35: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 35

21

21 ˆlnˆlnlncrd

arbVarVarRRVar

212

1

2

212

1

2 expexpcrd

arbu

crbr

RRcrd

arbu

crbr

Konfidencia-intervallum a kockázati arányraa b r1

c d r2

c1 c2 N

212

1

2

212

1

2 lnlnlncrd

arbu

crar

RRcrd

arbu

crar

41.124.1 RRA 13. példára

Page 36: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 36

15. példa(B. Rosner: Fundamentals of Biostatistics, Duxbury Press, 5th ed. 2000, p. 358)

A 40 és 44 év közötti életkorú nőknél a fogamzásgátló tabletta szedése növeli-e a szívinfarktus kockázatát?

kapott-e infarktust? szedett-e tablettát? igen nem igen 13 4987 5000 nem 7 9993 10000 20 14980 15000

Page 37: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 37

1 annak valószínűsége, hogy aki szedett fogamzásgátló tablettát (exposed), infarktust kapjon 2 …aki nem szedett (unexposed) …

0026.0500013ˆ1 0007.0

100007ˆ2

71.30007.00026.0

100007

500013

ˆˆ

2

1 RR

kapott-e infarktust? szedett-e tablettát? igen nem igen 13 4987 5000 nem 7 9993 10000 20 14980 15000

Page 38: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 38

1000079993

500013498796.1

50007100004987lnln

212

1

2

crd

arbu

crbr

394.04685.096.1312.1

230.24685.096.1312.1

A kockázati arány logaritmusára a 95%-os konfidencia-intervallum alsó határa:

fölső határa:

A 95%-os konfidencia-intervallum magára a kockázati arányra:

3.9,5.1, 230.2394.0 ee (retrospektív!)

Page 39: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 39

Esélyhányados

1

odds

Esélyhányados-arány (odds ratio)

2

2

1

1

1

1

OR

a megbetegedés esélyhányados-aránya (disease odds ratio)

bcad

dcddccbabbaa

OR

a b r1

c d r2

c1 c2 N

Page 40: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 40

1

2

11

RROR

1,1 21 ha RROR

Page 41: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 41

A vizsgálatok esetei

Prospektív (prospective)

clinical trial (kisorsolják, hogy ki melyik gyógyszert kapja)cohort study*

Retrospektív (retrospective)case-control*matched pair (?)cross-sectional*

*observational (/experimental)

Page 42: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 42

16. példa(A. Agresti: Categorical data analysis, J. Wiley, 2002, p. 41)

709 tüdőrákkal diagnosztizált páciens mellé választottak 709 olyan pácienst, akit ugyanabban a kórházban kezeltek, ügyelve arra, hogy nem- és kor-eloszlásuk hasonló legyen.

dohányos tüdőrákban szenvedigen (T) nem (T)

igen (D) 688 650nem (D) 21 59 709 709

DTP

DTP

DTPRR

Page 43: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 43

A dohányzás szerinti két csoportba nem válogathatták véletlenül a pácienseket, mint a szokásos gyógyszer-kísérleteknél,

nem a dohányzás (igen/nem) a rögzített, és a tüdőrák előfordulása a valószínűségi változó, hanem fordítva

ezért csak az esély-hányados-arányt számíthatjuk ki:

TDP

TDPOR

a veszélyeztetettség esélyhányados-aránya (exposure odds ratio)

Page 44: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 44

DTP

DTPOR

a megbetegedés esélyhányados-aránya (disease odds ratio), ez lenne érdekes, de…

TDP

TDPOR

a veszélyeztetettség esélyhányados-aránya (exposure odds ratio)

Page 45: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 45

97.22165059688

bcad

dbd

dbb

cac

caa

OR

a b r1

c d r2

c1 c2 N

dohányos tüdőrákban szenvedigen (T) nem (T)

igen (D) 688 650nem (D) 21 59 709 709

dcba

ORVar 1111ln

0676.0591

211

6501

6881ln ORVar

599.1,579.00676.096.1089.1:ln OR OR: (1.745, 4.948)

Page 46: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 46

97.22165059688

bcad

dbd

dbb

cac

caa

OR

A veszélyeztetettség becsült esélyhányados-arányának kifejezése pon-tosan ugyanaz, mint a megbetegedés becsült esélyhányados-arányáé!

97.22165059688

bcad

dcd

dcc

bab

baa

OR

Page 47: A binomiális eloszláson alapuló próbák

Nemparaméteres próbák 47

TPTDPTPTDP

TPTDPDTP

P(T) prevalencia ismerete szükséges

Bayes-tétel:

1

2

11

RROR ha 1< <1, 2< <1 ORRR