Download pdf - Università Cattolica del Sacro Cuore Scuola di ... · • E' lo studio della frequenza e della distribuzione dei fenomeni salute/malattia ... • Parametro chiave: probabilità della

Università Cattolica del Sacro Cuore

Scuola di Specializzazione in

Igiene e Medicina Preventiva e Medicina Legale

Anno accademico 2010/2011

Metodologia epidemiologica

Bruno Federico

Cattedra di Igiene - Università degli Studi di Cassino

[email protected]

Organizzazione del corso

• Le lezioni sono parte del corso di Metodologia Epidemiologica e Igiene

• Il corso è articolato in lezioni frontali ed esercitazioni– Alcune esercitazioni saranno svolte con carta e penna

• È consigliabile portare con sé una calcolatrice

– Altre esercitazioni saranno svolte al PC col software Episheet

• Il materiale del corso è disponibile su– http://www.docente.unicas.it/bruno_federico

Programma del corso

• L’epidemiologia clinica– Diagnosi

– Eziologia

– Prognosi

– Terapia

• Applicazioni dell’epidemiologia– Episheet

• Standardizzazione

• Life-table

Che cos’è l’epidemiologia?

Definizione di Epidemiologia

• E' lo studio della frequenza e della distribuzione dei fenomeni salute/malattia nelle popolazioni e dei fattori che le determinano

Qual è l’oggetto di interesse dell’epidemiologia?

Oggetto di interesse dell’Epidemiologia

• È la relazione

Frequenza malattia = f(x1, x2, x3, …)

– X è un determinante

• Ogni caratteristica associata con la malattia

• Può essere numerica, dicotomica, nominale, ordinale

Problemi nella pratica clinica

1. Spiegazione del profilo clinicoDato il profilo clinico di un paziente, quale malattia ha?

2. Spiegazione della malattiaPerché questa malattia si è manifestata in questo

paziente in questo momento?

3. Previsione del corso della malattiaData la malattia del paziente, la sua eziologia, il suo

profilo, … quale sarà il futuro corso della malattia considerando anche la terapia?

4. Decisione sulla terapia

5. Terapia

Problemi nella pratica clinica

• I punti 1-3 richiedono conoscenze su:– Diagnosi– Eziologia– Prognosi

• Esse rappresentano l’obiettivo dell’epidemiologia clinica

• Il punto 4 richiede conoscenze sulla prognosi e giudizio clinico

• È l’obiettivo dell’epidemiologia clinica e dell’analisi delle decisioni

Ricerca in campo diagnostico

• Diagnosi di cancro alla prostata (PC) in pazienti con disturbi sintomatici della prostata

• Esami: ispezione rettale (R), antigene prostatico specifico (PSA)

• Obiettivo della ricerca

• Prevalenza del PC come funzione dell’ispezione rettale e del livello di antigene prostatico specifico

• PPC =f(R, PSA)

Ricerca in campo diagnostico

• La relazione può considerare ulteriori parametri, clinici e non clinici

• Prevalenza del PC come funzione dell’età, dell’ispezione rettale, del livello di antigene prostatico specifico e dell’esame a ultrasuoni

• PPC =f(AGE, R, PSA, US)

• Nota bene: l’obiettivo è descrittivo, si vuole cioè stimare la probabilità della malattia, non cercare spiegazioni alla malattia

Ricerca in campo eziologico

• Eziologia del malattia infiammatoria intestinale cronica (IBD) nei bambini in relazione ad un’infezione virale (V)


• Incidenza del colon irritabile come funzione dell’infezione virale controllando per l’effetto di altri fattori estranei (EF)

• IIBD =f(V|EF)

Ricerca in campo eziologico

• Fattori estranei: fattori che non rappresentano l’oggetto della ricerca ma possono diminuirne la validità

• Sono i fattori confondenti

Confondimento

MALATTIA

CONFONDENTE

ESPOSIZIONE

Confondimento

• Un confondente

– È associato con la malattia tra i non esposti

– È associato con l’esposizione nella popolazione che dà origine ai casi

– Non è una causa intermedia

Esempio di confondimento

Dati grezzi

Esposti Non esposti

Casi 40 101 Tempo-persona 1100 1100 RR=0.4

Giovani Anziani

Esposti Non esposti

Esposti Non esposti

Casi 20 1 Casi 20 100 Tempo-persona

1000 100 Tempo-persona

100 1000

RR=2.0 RR=2.0

Ricerca in campo prognostico

• La prognosi di pazienti con linfoma allo stadio I dipende dal livello sierico di beta-2 microglobuline?


• Il futuro corso della malattia, ovvero il fallimento della terapia (TF) in relazione ai livelli di beta-2 microglobuline (β-2m) in pazienti con linfoma allo stadio I

• ITF =f(β-2m)

Studi relativi alla diagnosi

Le proprietà dei test

Malattia

Presente Assente

Test

Positivo Veri positivi Falsi positivi

Negativo Falso negativi Veri negativi

Misure di validità del test

• Sensibilita’: la percentuale di soggetti malati che il test classifica come positivi

– = Malati positivi / Tutti i malati

– P(T+|D+)

• Specificita’: la percentuale di soggetti sani che il test identifica come negativi

– = Sani negativi / Tutti i sani

– P(T-|D-)

• La sensibilità, che riguarda la capacità di un test di individuare una malattia quando essa sia presente, è calcolata come a/(a+c)

True positive False positive

False negative True negative

Disease

Test

Positive

Present Absent

Negative

a b

c d

• Se un test non è sensibile, mancherà di individuare la malattia in qualche soggetto malato, e questi individui appariranno nella cella c



Disease

Test

Positive

Present Absent

Negative

a b

c d

• La specificità, che si riferisce alla capacità di individuare l'assenza di malattia quando la malattia non è presente, è calcolata come d/(b+d)



Disease

Test

Positive

Present Absent

Negative

a b

c d

• Se un test non è specifico indicherà falsamente la malattia in soggetti non malati, e questi appariranno nella cella b



Disease

Test

Positive

Present Absent

Negative

a b

c d

Valore predittivo

• Parametro chiave: probabilità della malattia dato il risultato del test

• valore predittivo del test

– Valore predittivo di un test positivo

– Valore predittivo di un test negativo


• Valore predittivo del test positivo: la probabilità di essere malati dei soggetti risultati positivi al test

– = Malati positivi / Tutti i positivi

– P(D+|T+)

• Valore predittivo del test negativo: la probabilità di essere sani dei soggetti risultati negativi al test

– = Sani negativi / Tutti i negativi

– P(D-|T-)


• Il likelihood ratio (rapporto di verosimiglianza) associato al risultato di un test è il rapporto tra la probabilità di avere quel risultato se la malattia è presente diviso per la probabilità di avere quello stesso risultato nel caso la malattia sia assente


– Il likelihood ratio di un test positivo è il rapporto tra la probabilità di avere un risultato positivo tra chi ha la malattia diviso per la probabilità di avere un risultato positivo tra chi non ha la malattia

• LR+=P(T+|D+)/P(T+|D-)

– Il likelihood ratio di un test negativo è il rapporto tra la probabilità di avere un risultato negativo tra chi ha la malattia diviso per la probabilità di avere un risultato negativo tra chi non ha la malattia

• LR-=P(T-|D+)/P(T-|D-)

Probabilità pre e post-test

• Probabilità a priori (pre-test): è la probabilità che la malattia sia presente sulla base dell’informazione disponibile prima di eseguire il test

• Probabilità a posteriori (post-test): è la probabilità che la malattia sia presente data l’informazione disponibile prima del test ed il risultato del test

Teorema di Bayes

• A è il risultato del test• B è la malattia

• Il teorema di Bayes può anche essere scritto sotto forma di odds

Post-test odds=Pre-test odds*likelihood ratio

Drug testing

• An example of the use of Bayes' theorem is the evaluation of drug test results.

• Suppose a certain drug test is 99% sensitive and 99% specific, that is, the test will correctly identify a drug user as testing positive 99% of the time, and will correctly identify a non-user as testing negative 99% of the time.

• This would seem to be a relatively accurate test, but Bayes' theorem can be used to demonstrate the relatively high probability of misclassifying non-users as users. Let's assume a corporation decides to test its employees for drug use, and that only 0.5% of the employees actually use the drug.

• What is the probability that, given a positive drug test, an employee is actually a drug user? Let "D" stand for being a drug user and "N" indicate being a non-user. Let "+" be the event of a positive drug test.

Drug testing

• We need to know the following:• P(D), or the probability that the employee is a drug user, regardless of any

other information. This is 0.005, since 0.5% of the employees are drug users. This is the prior probability of D.

• P(N), or the probability that the employee is not a drug user. This is 1 − P(D), or 0.995.

• P(+|D), or the probability that the test is positive, given that the employee is a drug user. This is 0.99, since the test is 99% accurate.

• P(+|N), or the probability that the test is positive, given that the employee is not a drug user. This is 0.01, since the test will produce a false positive for 1% of non-users.

• P(+), or the probability of a positive test event, regardless of other information. This is 0.0149 or 1.49%, which is found by adding the probability that a true positive result will appear (= 99% x 0.5% = 0.495%) plus the probability that a false positive will appear (= 1% x 99.5% = 0.995%). This is the prior probability of +.

Drug testing

• Given this information, we can compute the posterior probability P(D|+) of an employee who tested positive actually being a drug user:

Drug testing

• Despite the specificity and sensitivity of the test, the low base-rate of use renders the accuracy of the test low: the probability that an employee who tests positive actually using drugs is only about 33%, so it is in fact more likely that the employee is not a drug user.

• The rarer the condition for which we are testing, the greater the percentage of positive tests that will be false positives.

Valore predittivo e prevalenza della malattia

• La prevalenza della malattia nella popolazione oggetto di studio può influenzare la capacità predittiva di un test

• Lo stesso test, se applicato in contesti diversi (i.e. a popolazioni con prevalenza differente della malattia) può fornire risultati diversi


• Immaginiamo di adoperare un test (PCR) per valutare la presenza o assenza di una malattia sessualmente trasmessa, l’infezione da Clamydia– Questo test possiede eccellenti valori di sensibilità (97%) e di

specificità (97%)

• Applichiamo il test in due contesti differenti– Una clinica per malattie sessualmente trasmesse, in cui la

prevalenza della malattia è alta (30%)

– Gli assistiti di un medico di famiglia, in cui la prevalenza della malattia è bassa (3%)

• Calcoliamo il valore predittivo positivo del test nei due contesti

Predictive values and prevalence of the disease

Chlamydia

infection

PCR

Test

Positive

Present Absent

Negative

Sexually trasmitted disease

clinic (prevalence = 30%) • 1000 soggetti

• 300 soggetti con infezione da Clamydia

• 700 soggetti privi di infezione da Clamydia

• Calcolare il valore predittivo di un test positivo


291 21

9 679

Chlamydia

infection

PCR

Test

Positive

Present Absent

Negative

Sexually trasmitted disease

clinic (prevalence = 30%) • 1000 soggetti



• VP+=291/(291+21)= 93%


• Ora applichiamo lo stesso test in un contesto in cui la prevalenza della malattia è molto più bassa rispetto a prima (3%)

• Calcoliamo di nuovo il valore predittivo positivo del test


Private practice

(prevalence = 3%) • 1000 soggetti



• Calcolare il valore predittivo di un test positivo

Chlamydia

infection

PCR

Test

Positive

Positive Negative

Negative


Private practice

(prevalence = 3%) • 1000 soggetti



• VP+=29/(29+29)= 50%

29 29

1 941

Chlamydia

infection

PCR

Test

Positive

Positive Negative

Negative

La curva ROC

• La curva ROC (receiver operating characteristic curve) è un grafico che rappresenta tutte le possibili combinazioni di sensibilità e specificità ottenibili con un test variando il criterio di positività

• È una rappresentazione grafica dellasensibilità (o proporzione di veri positivi) rispetto alla proporzione di falsi positivi (1-specificità)

La curva ROC

EsercitazioneSensibilità e specificità di una misura