12
1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petroveþki PDDS Molekularne bioznanosti Poþela biostatistike, akad. god. 2009/10. Analiza preživljenja 1. temeljni pojmovi 2. izra²un vjerojatnosti preživljenja a) tablice preživljenja b) Kaplan-Meierov postupak 3. rizik umiranja 4. programska potpora 5. usporedba podataka o preživljenju 6. statisti²ko zaklju²ivanje 7. regresijska analiza cenzuriranih podataka Obrada podataka o preživljenju bolesnika analiza preživljenja survival analysis ponekad analiza tablica preživljenja analiza osiguravateljskih (aktuarskih) podataka actuarial analysis Analiza preživljenja Edmund Halley, 17. st engleski astronom, geofizi²ar, matemati²ar, meteorolog i fizi²ar http://en.wikipedia.org/wiki/Edmond_Halley komet, 1986. (sljede°i: 2061.) www.aktuari.hr aktuar – stru²njak koji se bavi problemima financijske neizvjesnosti i rizika koriste°i matemati²ke metode teorije vjerojatnosti, statistike i financijske matematike posao – analiza podataka iz prošlosti, procjenu postoje°ih rizika i razvoj modela za projekciju budu°ih dogaaja zaposlenje – osiguranje i mirovinsko osiguranje znanja – matematika, ekonomija, praksa i zakoni države u kojoj radi, demografska i financijska kretanja, vještina komunikacije Aktuarske tablice preživljenja (tablice smrtnosti) http://en.wikipedia.org/wiki/Actuarial_table

Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

1

Analiza cenzuriranih podataka ikrivulje preživljenja

Mladen Petrove ki

PDDS Molekularne bioznanostiPo ela biostatistike, akad. god. 2009/10.

Analiza preživljenja1. temeljni pojmovi2. izra un vjerojatnosti preživljenja

a) tablice preživljenjab) Kaplan-Meierov postupak

3. rizik umiranja4. programska potpora5. usporedba podataka o preživljenju6. statisti ko zaklju ivanje7. regresijska analiza cenzuriranih podataka

Obrada podataka opreživljenju bolesnika

• analiza preživljenja• survival analysis• ponekad

• analiza tablica preživljenja• analiza osiguravateljskih (aktuarskih) podataka• actuarial analysis

Analiza preživljenja• Edmund Halley, 17. st• engleski astronom, geofizi ar, matemati ar,

meteorolog i fizi ar• http://en.wikipedia.org/wiki/Edmond_Halley

komet, 1986.(sljede i: 2061.)

www.aktuari.hr• aktuar – stru njak koji se bavi problemima financijske

neizvjesnosti i rizika koriste i matemati ke metodeteorije vjerojatnosti, statistike i financijske matematike

• posao – analiza podataka iz prošlosti, procjenupostoje ih rizika i razvoj modela za projekciju budu ihdoga aja

• zaposlenje – osiguranje i mirovinsko osiguranje• znanja – matematika, ekonomija, praksa i zakoni države

u kojoj radi, demografska i financijska kretanja, vještinakomunikacije

Aktuarske tablice preživljenja(tablice smrtnosti)

http://en.wikipedia.org/wiki/Actuarial_table

Page 2: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

2

Analiza preživljenja• psihijatrija – 1%• patologija – 1%• kirurgija – 12%• onkologija – 14%• izvorni znanstveni radovi u The New England Journal od

Medicine – 32%

• podaci 1986.-2001., Dawson Saunders& Trapp, Basic and Clinical Biostatistics

Analiza preživljenja• analiza podataka vezanih uz vremensko

pra enje doga aja• dvije to ke pra enja:

• po etak (P) (time origin)• kraj (K) (end point)

vrijeme pravrijeme pra enja (enja (followfollow--upup))

PP KK

vrijemevrijeme

Po etak pra enja

• ro enje• pojava znaka bolesti• postavljanje dijagnoze• po etak lije enja• dan operativnog zahvata

vrijeme pravrijeme pra enjaenja

PP KK

vrijemevrijeme

Kraj pra enja

• smrt od osnovne bolesti• smrt (svi ostali mogu i uzroci)• ponovno javljanje bolesti• postizanje u inka lije enja• gubitak iz uzorka (ispitne skupine)

vrijeme pravrijeme pra enjaenja

PP KK

vrijemevrijeme

Kraj pra enja

• smrt od osnovne bolesti• smrt (svi ostali mogu i uzroci)

Manual for Staging of Cancer3rd ed., AJCC

ukupnoukupno preprežživljenjeivljenjeengl.engl. observedobserved survivalsurvival raterate

uskla enouskla enopreprežživljenjeivljenjeengl.engl. adjustedadjustedsurvivalsurvival raterate

Vrijeme pra enja• raspodjela u pravilu nije simetri na• podaci su nepotpuni, pra enje je nepotpuno,

“cenzurirano” (censored data)

• podaci za primjere:• istraživanje karcinoma usne šupljine• MFK KBD• dr. Ivica Lukši• n = 52; 1. sije nja 2000. – 31. prosinca 2004.• reprezentativni probrani uzorak

• dio populacije tog razdoblja• prva dg. karcinoma, bez regionalnih metastaza, itd.

Page 3: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

3

Vrijeme pra enja (1)• raspodjela u pravilu nije simetri na

0 12 24 36 48 60 72 84 96 108 120

12

10

8

6

4

2

0

Vrijeme pra enja (mjeseci)

Aps

olut

na u

esta

lost

N=52ca. usne šupljine

Vrijeme pra enja (2)

P2P2 K2K2

vrijemevrijeme

P1P1 K1K1

vrijeme istravrijeme istražživanjaivanja

• potpuni podaci (potpuno pra enje)

Vrijeme pra enja (2)• podaci su nepotpuni, pra enje je nepotpuno,

“cenzurirano”• cenzurirano vrijeme pra enja = jedinka tijekom

pra enja ne dostiže o ekivani doga aj

P2P2 K2K2

vrijemevrijeme

P1P1 K1K1

vrijeme istravrijeme istražživanjaivanja

Vrijeme pra enja (3)• podaci su nepotpuni, pra enje je nepotpuno,

“cenzurirano”• cenzurirano vrijeme pra enja = jedinka tijekom

pra enja ne dostiže o ekivani doga aj

P2P2 gubitak (K2 = ?)gubitak (K2 = ?)

vrijemevrijeme

P1P1 K1K1

vrijeme istravrijeme istražživanjaivanja

Cenzuriranje• doga aj se ostvaruje = 1• sve ostalo = 0 (cenzurirani podaci)

• kraj istraživanja (end of the study)• gubitak iz pra enja (lost to follow-up)• ostali doga aji

“Izgubljen iz pra enja”Figure 3. Outcome

The mean length of survival forour patients was 7 months.Patient 3 was lost to follow up.

Page 4: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

4

Cenzuriranje: bolesnici s postavljenom dijagnozom (P) uzadanih pet godina

P2P2 K2K2

vrijemevrijeme

P1P1 K1K1

1. sije1. sije nja 00. vrijeme istranja 00. vrijeme istražživanja 31. prosinca 04.ivanja 31. prosinca 04.

P3P3

P4P4 ??? (gubitak)??? (gubitak)

P5P5 smrtsmrt K5K5

11

XX

00

00

00

Cenzuriranje: bolesnici lije eni u zadanompetogodišnjem razdoblju

P2P2 K2K2

vrijemevrijeme

P1P1 K1K1

1. sije1. sije nja 00. vrijeme istranja 00. vrijeme istražživanja 31. prosinca 04.ivanja 31. prosinca 04.

P3P3

P4P4 ??? (gubitak)??? (gubitak)

P5P5 smrtsmrt K5K5

11

11

00

00

00

Cenzuriranje: bolesnici lije eni u zadanompetogodišnjem razdoblju

P2P2 K2K2

vrijemevrijeme

P1P1 K1K1

vrijeme pravrijeme pra enja bolesnika (enja bolesnika (patientpatient timetime))

P3P3 kraj istrakraj istražživanjaivanja

P4P4 gubitakgubitak

P5P5 ostaloostalo

11

11

00

00

00

danasdanas Cenzuriranje• desno (right censoring)

• nije lijevo• nije intervalno

• neinformativno (non informative)• nije “informativno”• vrijeme preživljenja neke jedinke neovisno je od

svakog mogu eg mehanizma koji možeuzrokovati da ista jedinka bude cenzurirana

• npr. cenzuriranje bolesnika s pogoršanjemzdravstvenog stanja

A sada – veselje!

• funkcija preživljenja• biomedicina• survival function

• funkcija pouzdanosti• inženjerstvo• reliability function

S(t) ili R(t):• vjerojatnost da e jedinka

preživjeti ili to no doživjetivrijeme od t jedinica pra enja,ili

• vjerojatnost preživljenja jedinkeu rasponu od po etka pra enjado trenutka pra enja t

A sada – još ve e veselje!

• funkcija rizika• hazard function

• kumulativna funkcijarizika umiranja• H(t) = - log S(t)

h(t):• vjerojatnost da e jedinka

umrijeti u trenutku t, uz uvjetda je preživjela do togatrenutka, i uz uvjet da je

• F(t) funkcija gusto e

Page 5: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

5

Zaklju ak: podaci o preživljenju

• vjerojatnost preživljenja• S(t)

• rizik umiranja• H(t) = - log S(t)

Izra unavanje preživljenja• neparametrijski postupci

• Cutler-Edererov postupak (tablice preživljenja)• Kaplan-Meireov postupak

• parametrijski

I. Tablice preživljenja• osiguravateljske tablice• tablice smrtnosti

Kako do preživljenja?

1. upis podataka2. preure enje

podataka3. izra un

podataka

1. Upis podataka, Excel® 2. Preure enje podataka

Page 6: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

6

3. Izra un podataka 3. Izra un podataka

d – smrtni ishod u intervalu

n – živi na po etku intervala

w – izgubljeni u intervalu

3. Izra un podataka

0

0,2

0,4

0,6

0,8

1

0 12 24 36 48 60

mjeseci

p ku

mul

.

II. Kaplan-Meierov postupak• nema zadane intervale pra enja• vjerojatnost preživljenja se izra unava za

svakog bolesnika koji umre• cenzurirani ispitanici nisu dio izra unavanja

vjerojatnosti• dugotrajno izra unavanje kod velikih skupina

ispitanika

KM podaci o preživljenju KM krivulja preživljenja

0 12 24 36 48 60

100

80

60

40

20

0

mjeseci

p ku

mul

. (%

)

0

0 ,2

0 ,4

0 ,6

0 ,8

1

0 12 24 36 48 60

mje se ci

p k

um

ul.

Page 7: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

7

Kaplan, Meier• Kaplan EL, Meier P.

Nonparametricestimation fromincomplete observations.J Am Stat Assoc1958;53:457-81.

Kaplan, Meier• me u 5 najcitiranijih radova u znanosti od

trenutka objavljivanja (M. Zhou, KentuckyUniversity; http://www.ms.uky.edu/~mai/)

• prikaz krivulje u zavisnosti od Nhttp://www.ms.uky.edu/~mai/java/stat/KapMei.html

Rizik umiranja• H(t) = - log S(t)• snaga mortaliteta (epidemiologija)• ...

http://www.bips.uni-bremen.de/handbook_of_epidemiology.php

Primjer…

90

80

70

60

50

40

30

20

10

0mjeseci

cenzus = 0mjeseci

cenzus = 1

Preživljenje, MedCalc®

npr., prosje no petogodišnjepreživljenje: 69,2±7,7%

Krivulja preživljenja, MedCalc®

npr., prosje no petogodišnjepreživljenje: 69,2±7,7%

0 12 24 36 48 60 72 84 96 108

100

95

90

85

80

75

70

65

Vrijeme pra enja (mj.)

Vjer

ojat

nost

pre

živl

jenj

a (%

)

Page 8: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

8

Granice pouzdanosti

npr., prosje no petogodišnjepreživljenje: 69,2±7,7%

0 12 24 36 48 60 72 84 96 108

100

95

90

85

80

75

70

65

Vrijeme pra enja (mj.)

Vjer

ojat

nost

pre

živl

jenj

a (%

)

0 12 24 36 48 60 72 84 96 108

100

90

80

70

60

50

Vrijeme pra enja (mj.)

Vjer

ojat

nost

pre

živl

jenj

a (%

)

Izra un granica pouzdanosti• granice pouzdanosti (Confidence Intervals)• CI = x ± z SE(x)

• 95%CI = x ± 1,96 SE(x)• 99%CI = x ± 2,56 SE(x)

0 12 24 36 48 60 72 84 96 108

100

90

80

70

60

50

Vrijeme pra enja (mj.)

Vje

roja

tnos

t pre

živl

jenj

a (%

)

http://www.fourmilab.ch/rpkp/experiments/analysis/zCalc.html (pazi: p/2!)

Granice pouzdanosti Cenzurirani podaci

0 12 24 36 48 60 72 84 96 108

100

95

90

85

80

75

70

65

Vrijeme pra enja (mj.)

Vje

roja

tnos

t pre

živl

jenj

a (%

)

Broj bolesnika pod rizikom

0 12 24 36 48 60 72 84 96 108

100

95

90

85

80

75

70

65

Vrijeme pra enja (mj.)

Vje

roja

tnos

t pre

živl

jenj

a (%

)

Number at risk43 38 33 24 16 6 3 1 1 1

Standardni prikaz podataka

0 12 24 36 48 60 72 84 96

100

90

80

70

60

50

Vrijeme pra enja (mj.)

Vje

roja

tnos

t pre

živl

jenj

a (%

)

0 20 40 60 80 100

100

90

80

70

60

50

Vrijeme pra enja (mj.)

Vje

roja

tnos

t pre

živl

jenj

a (%

)

Page 9: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

9

Tablice preživljenja, SPSS® Kaplan-Meier, SPSS®

Kaplan-Meier, Statistica® “Preživljenje"• generalno: preživljenje

• survival• pra enje

• po etak• smrt od osnovne bolesti

• posebno: preživljenje bez znakova bolesti• disease-free survival (DFS)• pra enje

• po etak• relaps bolesti ili smrt od osnovne bolesti

DFS, primjer

Survival curves for 277 patients with T2tongue carcinoma treated with an 192Ir,137Cs or 226Ra needle;

thin – regional disease-free survival

thick – distant metastasis-free survival

http://www.ro-journal.com/content/1/1/21/figure/F5

Usporedba podataka o preživljenju• usporedba dvije skupine podataka

• log-rank (logrank) test• Mentelov ili Mentel-Coxov test

• Wilcoxonov test• generalizirani Wilcoxonov test• Gehanov test• Gehan-Breslowljev test• op i Kruskal-Wallisov test za cenzurirane podatke

• Mantel-Haenszelov test• Tarone-Wareov test

• usporedba triju i više skupina

Page 10: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

10

Usporediti dvije skupine… Primjer• N = 43

cenzus

0 20 40 60 80 100

100

95

90

85

80

75

70

65

Time

Surv

ival

pro

babi

lity (

%)

Dvije skupine, MedCalc®

radioth01

cenzus

0 12 24 36 48 60 72 84 96

100

90

80

70

60

50

Time

Surv

ival

pro

babi

lity

(%)

Dvije skupine, SPSS®

radioth01

0 12 24 36 48 60 72 84 96 108

100

90

80

70

60

50

Time

Sur

viva

l pro

babi

lity

(%)

Omjer izgleda• odds ratio, hazard ratio

probability vjerojatnost

odds slu ajnostsklonostizgled

chance šansamogu nostslu ajnost

likelihood mogu nostvjerojatnost

Usporedba triju skupina

strana123

0 24 48 72 96 120

100

80

60

40

20

0

Time

Surv

ival

pro

babi

lity

(%)

1, lijevo

2, desno

3, medijalno

Page 11: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

11

Zaklju ivanje• granice pouzdanosti• p-vrijednosti

Regresijska analiza podataka• korelacija

• pravocrtna regresija• višestruka regresija• logisti ka regresija• Coxova regresija• Passing-Bablokova regresija

Coxov regresijski test• multivarijatni postupak• Cox regression

• Cox, 1972.• proportional hazard

model

Podaci &• zavisni pokazatelji

• vrijeme pra enja• podatak o ishodu (cenzuriranje)

• nezavisni pokazatelji• prediktori ili kovarijate (covariates)• sve mjerene ljestvice dopuštene

• rezultat• regresijski koeficijenti

omjer rizika (hazard ratio (HR), ratio of the hazard function)mjera rizika (relativni rizik; relative risk (RR))

Primjer, MedCalc®Coxov regresijski test

• analiza preživljenja (smrt od osnovne bolesti)• podaci – cenzurirani• nezavisni pokazatelji

• spol (M, Ž)• zahva ena strana lica (L, D, M)• T-klasifikacija• resekcija donje eljusti (1-5 kao nije, segmentalna,

marginalna...)• lije enje zra enjem (da, ne)• najve i promjer tumora (cm)

Primjer, MedCalc®“svi pokazatelji”

RR = Exp(b) ili Exp( ) = eb = 2,72b

Page 12: Analiza cenzuriranih podataka i krivulje preživljenjami.medri.hr/assets/Analiza_prezivljenja.pdf1 Analiza cenzuriranih podataka i krivulje preživljenja Mladen Petrove þki PDDS Molekularne

12

Primjer, MedCalc®“postupno biranje, unaprijed”

Primjer, MedCalc®“postupno biranje, unaprijed”

strana123

0 24 48 72 96 120

100

80

60

40

20

0

Time

Surv

ival

pro

babi

lity

(%)

lijevo

desno

medijalno

[email protected]