28
SMID a.a. 2005/2006 20/3/2006 Test sopravvivenza Corso di Statistica per la Ricerca Sperimentale

Corso di Statistica per la Ricerca Sperimentale · SMID a.a. 2005/2006 20/3/2006 Test sopravvivenza Corso di Statistica per la Ricerca Sperimentale

Embed Size (px)

Citation preview

SMIDa.a. 2005/2006

20/3/2006

Test sopravvivenza

Corso di Statistica per la Ricerca

Sperimentale

Rischio assolutoValutare il rischio è un elemento chiave per predire gli eventi futuriAl medico interessa poco il rischio generico di un infarto miocardico dopo i 50 anni

Stima del rischio un preciso arco temporale

perché questa stima non è utilizzabile né per la prognosi né per altre decisioni cliniche

il medico vuole conoscere quale è il rischio di infarto di un paziente di 50 anni con ben definite caratteristiche cliniche entro, ad esempio, 1 anno

fruibile nella prognosi e nelle decisioni cliniche

Sopravvivenza

In maniera diretta (casi di follow-up)come rischio incidente (incidenza cumulativa)

cioè come tasso di incidenza (incidence rate)In maniera indiretta

• forma tabulare (tavole di sopravvivenza)• forma grafica (curve di sopravvivenza)

Quando occorre formulare una prognosiil clinico (oltre che sull’esperienza)

si basa sulle conoscenze da letteratura scientificarelative al rischio di malattia oppure di morte su pazienti il più possibile simili al proprio caso

Rischio incidenteGli epidemiologi in genere riportano l’incidenza della morbilità e della mortalità in termini di tasso di incidenza (incidence rate)Questa stima del rischio non può essere utilizzata direttamente dai clinici

Rischio incidente = 1 − e−(tasso di incidenza)

Vogliamo stimare il rischio della malattia di Alzheimer a 15 anni

negli uomini di 65 anni

Il rischio assoluto (o incidente) può essere calcolato dal tasso incidente con la formula:

Tabella ricavataTasso di incidenza per fasce di età

in un uomo di 65 anniVogliamo stimare il rischio della malattia di Alzheimer a 15 anni

R = 1 − e−(5 · 0.8/1000 + 5 · 1.9/1000 + 5 · 4.4/1000) = 0.035

età tasso di incidenza (pazienti per anno)65-69 0.8 / 100070-74 1.9 / 100075-79 4.4 / 1000

(3.5%)

Punti criticiInizio dell’osservazionel’approccio metodologicamente corretto èstudiare solo quei pazienti in cui l’esordio della malattia è stato chiaramente identificato

opportunamente definita (minuti, ore, giorni) in rapporto alla rapidità attesa dell’evento Termine dell’osservazione

Scelta della scala temporale

data in cui lo studio ha termine deve essere ben definita ed è necessario avere informazioni sulla situazione di tutti i pazienti a quella data

Analisi della sopravvivenzaFissare un punto di partenza ben identificabile

Esiste un evento finale (non sempre nefasto!)

La probabilità di essere “persi allo studio” non dipende dall’evento finale (tendenze temporali)

ad esempio: inizio di un “mal di schiena”? primo sintomo, visita dal medico, ricordo paziente

esame di laurea (tempo dall’iscrizione)decesso (morte) ricovero ospedale (non sempre evento singolo!)

come considerare in uno studio sul cancro un caso di suicidio (o rifiuto a continuare la cura)?

Grafico di sopravvivenza

M

MM

M

P

P

Pabcde f ghij

pazienti

C

C

C0 1 2 3 4 5 6 7 8 9 10

anni di calendario censurati a destra

Studio epidemiologico

45j14i76h37g22f92e46d29c

111b61a

eventotempo (mesi)soggetto

10 pazienti seguiti per 10 anni

4 deceduti deceduto

decedutodeceduto

deceduto

Esame pazienti con melanoma

3 persi perso

perso

perso

3 censurati “a destra”

censurato

censurato

censurato

da quando?

504 mesi in totale

Sopravvivenza mediaPrendere in considerazione solo i pazienti di cui si conosce tutta la storia

la statistica si riduce solo ai casi a,c,d,ftempo trascorso fino evento finale numero casi che lo raggiungono

sopravviv.media=

(di questi si sa tutto!)

sm = (61 + 29 + 46 + 22) / 4 = 39.5 mesiAbbiamo perso la maggioranza dei casi (60%!)

Gli altri 6 avrebbero avuto stesso comportamento?verosimile pensare che non sarebbe stato lo stesso!

Percentuale di sopravvivenzaIl problema non è solo chi sopravvive

ma quanto sopravviveDopo un anno 100%, dopo 99 quasi certamente 0%Occorre fissare una data limite (backdating) che fissa il termine in cui faccio la mia analisi

Il cancro: chi risulta vivo dopo 5 anni dall’inizio dello studio dei dati è considerato sopravvissutoindipendentemente da quello che gli accade dopo!

numero sopravissuti al tempo Tnumero totale dei casi considerati

sopravviv.% =

riduce l’impatto dei censurati (solo per T =5 anni!)

Anni-personaAl denominatore abbiamo contato “persone”creando problemi su come considerare i censuratiSi può utilizzare il tempo (es. anni) trascorso da ciascun soggetto nello studio cioè il numero totale di anni-persona (tempo-persona) di osservazione

Si utilizzano anche le informazioni delle persone che per una ragione o per l’altra sono uscite dallo studio

numero dei morti numero mesi

decessi/mese = = 4 / 503 =0.008

rischio di decesso costante da un mese all’altro!

Tavole di sopravvivenzaQuello che possiamo calcolare è quante persone sopravvivono almeno un anno, almeno 2 anni ….

non siamo obbligati ad utilizzare intervalli ugualigiorni il primo anno, settimane il secondo, poi mesiLe tavole di sopravvivenza (life table)

possiedono i vantaggi degli “anni-persona” con la massima utilizzazione dei dati disponibilisenza lo svantaggio di dover considerare il rischio costante per lunghi periodi di tempoApproccio attuarialeApproccio alla Kaplan-Meier

Riporto a inizio studio

abcde f ghij

pazienti

M

MM

M

P

P

P

C

C

C0 12 24 36 48 60 72 84 96 108 120

mesi di permanenza nello studio

Tabella attuariale

01234478

1010

soggetti a rischio

0000101110

soggetti deceduti

0111002010

soggetti persi

9-108-97-86-75-64-53-42-31-2

0-1 anni

permanenzanello studio

Approccio attuarialeTrattare persone che si ritirano dallo studio (P) e le censurate (C) allo stesso modo come “perse”

i soggetti ancora vivi all’atto dello studio

p(decesso) = numero persone decedute nel periodo numero persone a rischio di morte

L’hazard è la probabilità che si verifichi l’evento in un soggetto che è in osservazione al momento in cui inizia uno specifico intervallo di tempoLe persone perse sono (per compromesso) considerate come mezzo anno-persona:

numero delle persone perse o censurate / 2

Calcolo probabilitàqi = probabilità di morire nel corso dell’anno ipi = (1 – qi) probabilità sopravvivere nell’anno iDi = numero delle persone decedute nell’anno iLi = numero delle persone perse (lost) nell’anno i

qi = Di / [ Ri – (Li / 2)]

q1 = 0 / [10 – (0 / 2)] = 0

Ri = numero soggetti a rischio all’inizio dell’anno i

q2 = 1 / [10 – (1 / 2)] = 0,10510 persone arrivano al 2o anno

p2 = 0,895 P2 = 0,895

q3 = 1 / [ 8 – (0 / 2)] = 0,125 p3 = 0,875 P3 = 0,783

Pi è la probabilità cumulativa = pi · Pi-1

Tabella probabilità

0000

0,2500

0,1670,1250,1050,000

probabilitàdecesso

1,0001,0001,0001,0000,7501.0000,8330,8750,8951,000

probabilitàsopravviv.

0,4890,4890,4890,4890,4890,6520,6520,7830,8951,000

probabilitàcumulativa

9-108-97-86-75-64-53-42-31-2

0-1 anni

permanenza nello studio

Curva di sopravvivenza attuariale

Tutti gli eventi riportati alla fine dell’intervalloLa differenza tra la probabilità di sopravvivenza pi e la probabilità cumulativa Pi

questa è una probabilità condizionata pi|Pi-1

0,40,50,60,70,80,9

1

0 2 4 6 8 10

numero di anniprob

abili

tà s

opra

vviv

enza

Metodo di Kaplan-MeierNon porre i soggetti deceduti in un intervallo (fisso ma arbitrario) ma al tempo esatto dell’eventoLa funzione di sopravvivenza è calcolata esattamente quando accade l’eventoLa curva della probabilità di sopravvivenza picambia ogniqualvolta accade l’evento

nell’approccio attuariale si hanno intervalli uguali sull’asse x dei tempi

I soggetti persi (ritirati o censurati) sono considerati a rischio fino al momento del ritiro

nell’approccio alla Kaplan-Meier gli intervalli sono (uguali) sull’asse y delle probabilità

Utilizzo di Kaplan-MeierOrdiniamo tutti i dati in ordine di tempo

segnando (*) quelli persi14*, 22, 29, 37*, 45*, 46, 61, 76*, 92*, 111*

tempo (mesi)

numero a rischio

numero deceduti

tasso mortalità

sopravv. (%)

percent. cumul.

22 9 1 0,111 0,889 0,889

29 8 1 0,125 0,875 0,778

46 5 1 0,200 0,800 0,622

61 4 1 0,250 0,750 0,467

0,40,50,60,70,80,9

1

0 12 24 36 48 60 72 84 96 108 120

numero di mesi

prob

abili

tà d

i so

prav

vive

nza

Curva di sopravvivenza Kaplan-Meier

Con meno di 50 soggetti Kaplan-Meier è piùefficiente: utilizza esattamente l’istante dell’evento

Problema: i “persi” tra due eventi sono ignorati!

Paragone tra curve di sopravvivenzaLa sopravvivenza dopo un infarto è peggiore nei più anziani o in quelli che hanno una compromissione della funzione ventricolare o che hanno malattie concomitanti (i diabetici) Per individuare i fattori che influenzano rischi post-infartuali

è necessario comparare la sopravvivenza di due gruppi di pazienti che differiscono solo per essere stati esposti o non esposti a quel fattore

paragone che potrebbe essere effettuato disegnando le due curve di sopravvivenza

Log-rank testDue curve di sopravvivenza possono fra loro sovrapporsi parzialmente o incrociarsi più volte

ma non risolve il problema! Paragonare per ogni intervallo di tempo la sopravvivenza dei pazienti esposti e non esposti

Log-rank test dovuto a Mantel-Cox

confronto tra le probabilità attese dell’evento (il decesso) con il numero di eventi osservato

anche se il nome del test li richiama non ha nulla a che fare con i logaritmi e con i ranghi

ConfrontoImmaginiamo di avere due gruppi di pazienti

nel primo ci aspettiamo un più basso numero di decessi rispetto al secondo

La mortalità attesa si calcola assumendo che essa sia casuale

la ripartizione è espressa, intervallo per intervallo, dal numero di soggetti a rischio di ciascun gruppo

cioè che essa si ripartisca tra i due gruppi in misura proporzionale al numero di soggetti che sono presenti in ciascun gruppo

diviso per il totale dei soggetti a rischio (l’insieme dei due gruppi) nello stesso intervallo

EsempioElenchiamo nei due gruppi il tempo degli eventi (in giorni) o della censura (tempo di censura, *, èl’ultimo tempo in cui è noto lo stato del paziente) I gruppo: 23, 43, 38*, 61, 66*, 83

In base a questi dati costruiamo una tavola di sopravvivenza di Kaplan-Meyer

II gruppo: 25, 26, 36, 60*, 71, 78

indicando gli eventi nel I gruppo e calcolando la mortalità osservata e attesa nello stesso gruppo

La mortalità attesa si dovrebbe distribuire in eguale misura nei due gruppi (0.5 e 0.5)

Tabella

Il numeratore può essere calcolato utilizzando i dati del primo o del secondo indifferentemente

(mortalità attesa - mortalità osservata)2

somma mortalità attese nei due gruppiχ2 =

numeratore = 1.132

giorni

Valore del χ2

Il denominatore si calcola moltiplicando i dati dell’ultima colonna dei due gruppi e sommandoli 0.50 · 0.50 + 0.454 · 0.546 + ...... + 1.00 · 0.00 = 1.98

Il risultato finale è 1.132/1.98Il risultato ottenuto va tradotto in probabilitàconsultando la tavola della distribuzione del χ2

in corrispondenza di un numero di gradi di libertà ν pari al numero dei gruppi meno uno

χ2sper = 0.64

χ2ν=1 = 3.841 > 0.64 non è pertanto significativo

Non vi è differente mortalità nei primi 83 giorni!