47
Studi caso-controllo

Studi caso-controllo - - Università degli Studi di Cassino · comunemente chiamato outcome), e a un fattore di rischio o esposizione. Se ad es. la nostra esposizione è il fumo e

Embed Size (px)

Citation preview

Studi caso-controllo

Con gli studi di tipo descrittivo e trasversale si possono formulare ipotesi sulla presenza di fattori di rischio, ma non dimostrare la presenza reale di un nesso causale tra il fattore e la malattia: ciò può essere possibile invece negli studi caso-controllo e di coorte.

Lo studio caso-controllo è tipicamente retrospettivo, nel senso che si raccolgono informazioni sul passato, ovvero dopo che la malattia si è già verificata e sono noti coloro che sono malati (i casi) e coloro che non lo sono (i controlli).

Esempio:

Grande cena per un matrimonio. Il giorno dopo la cena, tra i 600 invitati si verificano 200 casi di intossicazione alimentare con febbre, dissenteria e dolori addominali.

Questi 200 ammalati rappresentano i “casi”, mentre i 400 sani sono i “controlli”.

La prima azione in questi casi è raccogliere informazioni sugli alimenti consumati durante la cena, e creare una serie di tabelle 2x2 per ogni alimento.

Dalla tabella 2x2 del gelato alla crema, ad esempio, si nota come la percentuale di soggetti che hanno consumato il gelato sia 7 volte più elevata tra i casi (i malati) rispetto ai controlli (i sani).

Casi Controlli Totale

(malati) (sani)

Esposti 140 40 180

(consumo

di gelato)

Non esposti 60 360 420

(no gelato)

Totale 200 400 600

In questo caso, è ovvio ipotizzare che il gelato alla crema possa essere stato contaminato.

Ma sono necessarie a questo punto due ulteriori precisazioni. In primo luogo, 60 soggetti hanno contratto l’intossicazione nonostante non abbiano consumato il gelato.

Per tale motivo, si dovrebbe valutare se anche altri alimenti risultano associati alla patologia.

In secondo luogo, occorre tenere presente l’eventualità di un bias ecologico (o confondimento).

Se infatti, valutando le altre tabelle 2x2 relative agli altri alimenti, risultasse che tutti e 200 i casi avevano consumato le tartine al salmone e solo 10 dei 400 controlli le avevano toccate, sembra evidente ritenere che l’alimento realmente responsabile dell’intossicazione non sia il salmone, bensì le tartine.

Il fatto che dei 200 che avevano consumato le tartine 140 avessero consumato anche il gelato, ci ha fatto incorrere nel più classico dei confondimenti.

Le persone alle quali piaceva il gelato erano evidentemente le stesse alle quali piacevano le tartine.

Casi Controlli Totale

(malati) (sani)

Esposti 200 10 210

(consumo

di tartine)

Non esposti 0 390 390

(no tartine)

Totale 200 400 600

La metodologia tipica degli studi caso-controllo èretrospettiva, e prevede che si sappia già chi sono i casi e chi sono i controlli.

E’ chiaro che tale metodologia può non essere semplice come nell’esempio appena illustrato: i casi e i controlli devono essere il più possibile simili per quanto concerne gli aspetti demografici e devono provenire dalla stessa popolazione.

Per chiarire meglio questo concetto, veniamo a pregi e difetti di questo tipo di studio.

Gli studi caso-controllo sono abbastanza semplici, solitamente brevi e poco costosi.

Tuttavia, hanno una serie di difetti molto importanti.

In primo luogo, poiché devono essere già noti i malati e i sani, non permettono di calcolare l’incidenza, cioè il numero di nuovi casi nella popolazione in un determinato periodo di tempo, perché si conosce solo il numero di casi che già ci sono.

In secondo luogo, poiché i rilevamenti sono svolti sul passato, i dati potrebbero non essere attendibili.

Infine, nel caso l’espisizione fosse rara (ovvero nel caso in cui l’alimento incriminato fosse stato, ad esempio, consumato solo da 5 persone), sarebbe molto difficile provare l’esistenza reale di un’associazione. Visti dei numeri così scarsi, il margine di errore sarebbe molto elevato.

Per queste ragioni, quando è possibile si preferisce svolgere uno studio di coorte, più preciso e affidabile. Tuttavia, gli studi caso-controllo sono molto diffusi in diverse situazioni in cui non èpossibile effettuare uno studio di coorte.

In primo luogo, quando vi sono pochi fondi e non si è certi della relazione che si intende studiare, èsempre utile svolgere prima uno studio caso-controllo, e solo nel caso che questo confermi l’ipotesi, provare uno studio di coorte.

In secondo luogo, esistono tante situazioni in cui davvero uno studio di coorte risulta impossibile, e l’unico disegno di studio praticabile è il caso-controllo.

Ciò si verifica, ad esempio, quando la patologia da studiare è rara.

Tipicamente, tante patologie di tumori rare sono studiate tramite studi caso-controllo

Studi Caso-Controllo

EspostiEsposti

Non espostiNon esposti

EspostiEsposti

Non espostiNon esposti

MalatiMalati

Non malatiNon malati

Retrospettivi

Passato Presente Futuro

Uno studio caso-controllo

Casi

Controlli

Misure di frequenza: prevalenza e incidenza

Le misure epidemiologiche fondamentali, che derivano solitamente dalle tabelle 2x2, rappresentano i risultati finali che si ottengono dagli studi epidemiologici.

In altri termini, si conducono gli studi epidemiologici proprio per arrivare ad ottenere queste misure.

Conoscere il significato dei termini prevalenza, incidenza e rischio relativo è un prerequisito indispensabile per chiunque si trovi a decidere di (o a commentare su…) politiche di intervento, perché esse devono basarsi sui risultati di evidenze scientifiche, e queste evidenze sono proprio gli studi epidemiologici.

Prevalenza

Sebbene esprimano due concetti simili, si distinguono due tipi di prevalenza: la prevalenza puntuale e quella periodale.

La prevalenza puntuale ad es. di una determinata patologia è il rapporto tra il n. di malati presenti in una popolazione in un certo momento e il n. totale di individui (malati e non) in quella popolazione in quel momento.

Si tratta quindi della fotografia di una particolare situazione in un momento specifico, da noi scelto.

La prevalenza puntuale è una semplice percentuale e varia da 0 a 100% (o da 0 a 1).

La prevalenza che incorpora il fattore “tempo”viene chiamata prevalenza periodale.

E’ data dal rapporto tra il n. di malati (vecchi e nuovi) presenti in una popolazione durante un determinato periodo di tempo, e il n. totale di soggetti di quella popolazione nello stesso periodo di tempo.

In ogni caso, sia la prevalenza puntuale che quella periodale esprimono lo stesso concetto di fondo: la prevalenza è un indice della probabilità di essere malati in un certo momento (puntuale) o periodo (periodale).

Prevalenza puntuale =

N. di malati presenti nella popolazione in un determinato momento

_________________________________________N. totale di persone (malati e sani) nella popolazione

Prevalenza periodale=

N. di malati (vecchi e nuovi) presenti nella popolazione in un certo periodo

_________________________________________________

N. totale di persone (malati e sani) nella popolazione in quel periodo

Per chiarire quanto detto, prendiamo come esempio una patologia di lunga durata come la tubercolosi (può durare da pochi mesi a diversi anni).

Se noi volessimo calcolare la prevalenza periodale di tubercolotici in Italia nell’anno 2005, al numeratore dovremmo sommare i casi giàesistenti di TBC al 1 gennaio, e tutti i casi che invece si sono ammalati durante l’anno, fino al 31 dicembre (i “nuovi” casi).

Al denominatore dovremmo invece mettere la media della popolazione italiana durante l’anno 2005.

In conclusione, è chiaro che la prevalenza puntuale comprende al numeratore solo coloro che sono già malati in quel momento, ed è quindi una stima della probabilità di essere malati in quel momento preciso.

Se essa, ad es., è pari a 3.3%, ciò significa che ogni individuo di quella popolazione ha il 3.3% di probabilità di essere malato della patologia che si sta valutando.

La prevalenza periodale è molto simile: il fatto che essa includa al numeratore sia i casi vecchi sia quelli nuovi fa sì che anch’essa sia una misura della probabilità di essere malati, ma in un determinato periodo.

In ogni caso, il dato è molto importante: per es., conoscere la prevalenza di malati di TBC nell’anno 2012 permette di programmare quanti farmaci ordinare per l’anno successivo, il n. di posti letto dedicati ai reparti di Pneumologia etc.

IncidenzaMentre la prevalenza include al numeratore tutti i

casi di malattia, sia vecchi sia nuovi, l’incidenza viene invece calcolata escludendo tutti i casi “vecchi”, ovvero gli individui già malati al momento della rilevazione, sia dal numeratore che dal denominatore.

Infatti, l’incidenza è il rapporto tra il n. di nuovi casi di malattia che si verificano in un certo periodo di tempo in una popolazione e il n. complessivo di persone che compongono questa popolazione e che possono essere a rischio di insorgenza di malattia in quel periodo.

Incidenza cumulativa=

N. di nuovi casi malattia nella popolazione in un determinato periodo

_____________________________________________

N. totale di persone sane nella popolazione all’inizio di quel periodo

Tasso di incidenza=

N. di nuovi casi malattia nella popolazione in un determinato periodo

_________________________________________________

N. totale di unità di tempo di osservazione

Esempio:

L’incidenza di TBC in Italia nel 2005 è pari al n. di persone che si sono ammalate di TBC nel corso del 2005, diviso per un n. che deriva dalla media della popolazione italiana nel 2005, sottratta di quegli individui che erano già malati all’inizio dell’anno, e che non potevano quindi riammalarsi.

L’incidenza quindi, rispetto alla prevalenza, misura solo i nuovi casi e non tutti i casi.

Per questo motivo, i casi vecchi devono anche essere esclusi dal totale della popolazione (dal denominatore), poiché essendo già malati non potrebbero riammalarsi.

Misure di associazione: rischio relativo e affini

Insieme alle principali misure di frequenza (prevalenza e incidenza), le misure di associazione rappresentano le misure fondamentali di tutti gli studi epidemiologici.

Rischio relativo:

Il Rischio relativo (RR) viene calcolato partendo da una tabella 2x2. Esso è sempre riferito a una patologia (o evento che ci interessa, comunemente chiamato outcome), e a un fattore di rischio o esposizione.

Se ad es. la nostra esposizione è il fumo e la nostra patologia è il tumore del polmone, il rischio relativo ci dice quanto i fumatori (gli esposti) sono a rischio di sviluppare un tumore rispetto ai non fumatori (i non esposti).

Facendo un altro esempio, prendiamo stavolta come esposizione le radiazioni ionizzanti (a basse dosi); la patologia è il tumore della tiroide.

Le radiazioni ionizzanti sono associate a un maggior rischio di sviluppare il cancro della tiroide. Tuttavia, se questo rischio non fosse piùalto dello 0.01% non ci preoccuperemmo più di tanto, mentre se fosse del 10% dovremmo fare molta attenzione.

Tutta l’epidemiologia si basa sul concetto di esposizione associata a malattia, ma questa associazione va assolutamente quantificata.

Il rischio relativo risulta quindi fondamentale poiché fornisce una stima della forza dell’associazione tra fattore di rischio e malattia.

Esso non è altro che il rapporto tra l’incidenza di malattia negli esposti e l’incidenza di malattie nei non esposti.

Esempio: richiamiamo la tabella già fornita per gli studi di coorte. In questa tabella avevamo visto che l’incidenza di patologie respiratorie negli esposti (tassisti di città più inquinate) era pari al 25%, mentre la percentuale nei non esposti (tassisti di città meno inquinate) era pari al 20%.

Studi di coorte: tabella 2x2

Malati Sani Totale

Esposti 100 300 400

(residenti in città

inquinate)

Non esposti 60 240 300

(residenti in città

meno inquinate)

Totale 160 540 700

Riferendoci a questo esempio, il RR è molto facile da calcolare: basta dividere l’incidenza negli esposti (100/400 x 100) per quella nei non esposti (60/300 x 100).

Nel nostro caso, quindi, il RR sarà 25%/20% = 1.25%.

Il dato ottenuto significa che gli esposti hanno un rischio di sviluppare patologie respiratorie piùalto del 25% rispetto ai non esposti.

Come è facilmente intuibile considerando che esso è un rapporto, il RR può assumere valori compresi tra 0 e infinito.

RR = 1 ----------� l’esposizione non èassociata alla malattia

RR > 1 ----------� l’esposizione è associata a un maggior rischio di malattia – fattore di rischio

RR < 1 ----------� l’esposizione è associata a un minor rischio di malattia – fattore protettivo

Se il RR risulta un valore maggiore di 1, questo significa che la percentuale di malati negli esposti (numeratore) è più grande della percentuale di malati nei non esposti (denominatore).

Di conseguenza, concluderemo che l’esposizione èassociata a un maggior rischio di malattia, ovvero essa è un fattore che predispone allo sviluppo della stessa.

Se invece il RR risulta minore di 1, questo significa che il denominatore (malati tra i non esposti) èpiù alto del numeratore (malati tra gli esposti).

Ovviamente ciò ci porta a pensare che il rischio sia minore tra gli esposti, e quindi che l’esposizione sia un fattore protettivo (es. carnagione scura associata a un RR < 1 per il melanoma)

Odds Ratio:Nonostante il RR sia una misura fondamentale,

esso può essere calcolato negli studi di coorte ma non negli studi trasversali o caso-controllo.

Questo perché solo negli studi di coorte èpossibile calcolare l’incidenza, da cui il RR deriva.

Per gli studi caso-controllo o trasversali, la misura utilizzata è l’Odds ratio (OR).

Anche l’OR come il RR, è una stima della forza di un’associazione tra un’esposizione e una patologia, e va interpretata in tutto e per tutto in modo analogo al RR.

Per comprendere questa misura, occorre introdurre il concetto di "odds" (termine che non ha un corrispondente in italiano; può essere reso con "probabilità a favore"). Gli odds sono rappresentati dal il rapporto fra il numero di volte in cui l'evento si verifica (o si è verificato) ed il numero di volte in cui l'evento non si verifica ( o si è verificato).

Gli odds si utilizzano nel mondo delle scommesse, perché consentono allo scommettitore di calcolare facilmente la somma da incassare.

Ad esempio, la vittoria della nazionale italiana di calcio nella semifinale Italia-Francia ai mondiali del 1998 era data dai bookmakers a 4:1 "a sfavore". Questo equivale a dire che, su una scala da 1 a 5, le probabilità di sconfitta (p) dell'Italia erano considerate 4 volte più alte di quelle di una sua vittoria (1-p), e quindi la vittoria dell’Italia sarebbe stata pagata 4 volte la cifra scommessa [per i curiosi: vinse la Francia 4-3 ai rigori].

L'"odds ratio" si calcola attraverso i semplici rapporti (odds) fra le frequenze osservate e non attraverso le proporzioni.

Notare che si utilizzano i semplici rapporti tra le frequenze osservate (a/c, b/d) e non le proporzioni (a/a+c e b/b+d). Notare anche che, applicando le proprietà delle frazioni, l'odds ratio può venire più facilmente calcolato attraverso i prodotti delle celle incrociate della tabella (a*d e b*c); perciò viene anche detto, in italiano, "rapporto incrociato".

Calcolo dell’Odds ratio:

Malattia

+ -

Esposizione +

-

OR = a/c a x d

------ = -------

b/d b x c

A B

C D

In termini matematici, non è importante se l'OR viene calcolato come (a/c)/(b/d) oppure come (a/b)/(c/d), perché in entrambi i casi si ottiene lo stesso rapporto incrociato: ad/bc. Tuttavia, in termini razionali non ha senso usare la seconda formula. Infatti in uno studio retrospettivo, il rapporto a/b (così come il rapporto c/d), non dipende dalla malattia né dall'esposizione, ma bensì soltanto dallo sperimentatore stesso che ha avuto libertà di reclutare un numero di casi e di controlli a suo piacimento.

Esempio:

Vogliamo capire se l’uso di lampade abbronzanti superiore a 5 volte al mese con regolarità èassociata a un maggior rischio di melanoma.

Finito lo studio, con i dati dei 600 partecipanti possiamo costruire una tabella 2x2.

La frequenza di esposti tra i casi è del 10%, mentre tra i controlli è solo del 2.5%

E’ possibile calcolare la nostra OR che sarà pari a 4.3 (20x390)/(10x180).

Questo valore significa che chi fa uso di lampade abbronzanti almeno 5 volte al mese ha circa 4 volte in più il rischio di ammalarsi di melanoma rispetto a chi ne fa un uso minore.

Casi Controlli Totale

Esposti 20 10 30

(5 o più lampade

UV al mese)

Non esposti 180 390 570

(meno di 5

lampade UV

al mese)

Totale 200 400 600

Riprendiamo la tabella 2x2 relativa a uno studio trasversale. Se dobbiamo calcolare il RR di essere stressati, questo sarebbe pari a 16.7%/3% = 5.6.

Ciò significherebbe che gli esposti rispetto ai non esposti hanno un rischio pari circa a 6, ovvero superiore del 500% di avere un forte stato di stress. Questo RR in particolare descrive il rapporto tra due prevalenze, non tra due incidenze, ed è anch’esso denominato RR, piùspecificatamente RR di prevalenza (Prevalence Ratio).

Il Prevalence Ratio esprime la forza dell’associazione tra un fattore e la presenza di malattia, non l’insorgenza della stessa (che èmisurata dal RR classico, basato sull’incidenza)

Malati Non malati Totale

(forte stress) (no stress)

Esposti 50 250 300

(fumatori)

Non esposti 21 679 700

(non fumatori)

Totale 71 929 1000

Risultati dello studio

Percentuale (prevalenza puntuale) di stressati nel campione totale = 71/1000 = 7.1%

Percentuale (prevalenza puntuale) di stressati negli esposti = 50/250 = 16.7%

Percentuale (prevalenza puntuale) di stressati nei non esposti = 21/700 = 3%

Rischio relativo di essere stressati = 16.7%/3% = 5.6 (prevalence ratio)

Odds ratio di essere stressati = (50x679)/(21x250) = 6.5

Essendo anche l’OR una misura di rischio relativo, esso può assumere valori da 0 a infinito, e l’interpretazione è identica al RR.

Però, a causa della modalità di calcolo, l’OR èspesso meno preciso dell’RR nella stima della forza di un’associazione, e questo deve assolutamente essere tenuto presente.

In particolare, l’OR tende ad aumentare i risultati: l’OR è sempre più alto del RR se questo èmaggiore di 1; è invece sempre più basso se questo è minore di 1.

Tale approssimazione è trascurabile negli studi in cui l’incidenza o la prevalenza della malattia siano relativamente basse (meno del 15%) nel campione (sia negli esposti sia nei non esposti): in questi casi l’OR e il RR sono quasi coincidenti.

La differenza tra OR e RR diviene invece tanto piùgrande quanto più l’incidenza e la prevalenza sono elevate.

La sovrastima della forza dell’associazione da parte dell’OR è tanto più marcata quanto più si nota un’incidenza o prevalenza elevata.

Nell’esempio precedente, si può notare come, a un valore di prevalenza puntuale pari al 16.% negli esposti, l’RR sia pari a 5.6, mentre l’OR risulti 6.5.

Se ci basiamo sul RR concludiamo che il rischio per gli esposti è maggiore del 460%, mentre se ci basiamo sull’OR concludiamo invece che il rischio è superiore del 560%

A rigore, l‘OR non è una autentica misura del rischio in quanto si riferisce alla probabilità di avere già una malattia, mentre nel termine "rischio" è implicita l'idea di un evento che si verificherà in futuro. Tuttavia, se si suppone che la durata media della malattia negli esposti sia simile a quella nei non-esposti (e che la malattia non influenzi lo stato di esposizione), allora l‘OR rappresenta una buona misura del rischio relativo.

Negli studi retrospettivi caso-controllo, dove non viene studiata l'efficacia di un intervento ma piuttosto il nesso causale tra un outcome giàpresente al tempo zero e una pregressa esposizione a qualche fattore che si suppone in grado di condizionare l'outcome, l'OR è l'unica unità di misura che può essere utilizzata per descrivere l'avvenuta esposizione.