Università Cattolica del Sacro Cuore
Scuola di Specializzazione in
Igiene e Medicina Preventiva e Medicina Legale
Anno accademico 2010/2011
Metodologia epidemiologica
Bruno Federico
Cattedra di Igiene - Università degli Studi di Cassino
Organizzazione del corso
• Le lezioni sono parte del corso di Metodologia Epidemiologica e Igiene
• Il corso è articolato in lezioni frontali ed esercitazioni– Alcune esercitazioni saranno svolte con carta e penna
• È consigliabile portare con sé una calcolatrice
– Altre esercitazioni saranno svolte al PC col software Episheet
• Il materiale del corso è disponibile su– http://www.docente.unicas.it/bruno_federico
Programma del corso
• L’epidemiologia clinica– Diagnosi
– Eziologia
– Prognosi
– Terapia
• Applicazioni dell’epidemiologia– Episheet
• Standardizzazione
• Life-table
Definizione di Epidemiologia
• E' lo studio della frequenza e della distribuzione dei fenomeni salute/malattia nelle popolazioni e dei fattori che le determinano
Oggetto di interesse dell’Epidemiologia
• È la relazione
Frequenza malattia = f(x1, x2, x3, …)
– X è un determinante
• Ogni caratteristica associata con la malattia
• Può essere numerica, dicotomica, nominale, ordinale
Problemi nella pratica clinica
1. Spiegazione del profilo clinicoDato il profilo clinico di un paziente, quale malattia ha?
2. Spiegazione della malattiaPerché questa malattia si è manifestata in questo
paziente in questo momento?
3. Previsione del corso della malattiaData la malattia del paziente, la sua eziologia, il suo
profilo, … quale sarà il futuro corso della malattia considerando anche la terapia?
4. Decisione sulla terapia
5. Terapia
Problemi nella pratica clinica
• I punti 1-3 richiedono conoscenze su:– Diagnosi– Eziologia– Prognosi
• Esse rappresentano l’obiettivo dell’epidemiologia clinica
• Il punto 4 richiede conoscenze sulla prognosi e giudizio clinico
• È l’obiettivo dell’epidemiologia clinica e dell’analisi delle decisioni
Ricerca in campo diagnostico
• Diagnosi di cancro alla prostata (PC) in pazienti con disturbi sintomatici della prostata
• Esami: ispezione rettale (R), antigene prostatico specifico (PSA)
• Obiettivo della ricerca
• Prevalenza del PC come funzione dell’ispezione rettale e del livello di antigene prostatico specifico
• PPC =f(R, PSA)
Ricerca in campo diagnostico
• La relazione può considerare ulteriori parametri, clinici e non clinici
• Prevalenza del PC come funzione dell’età, dell’ispezione rettale, del livello di antigene prostatico specifico e dell’esame a ultrasuoni
• PPC =f(AGE, R, PSA, US)
• Nota bene: l’obiettivo è descrittivo, si vuole cioè stimare la probabilità della malattia, non cercare spiegazioni alla malattia
Ricerca in campo eziologico
• Eziologia del malattia infiammatoria intestinale cronica (IBD) nei bambini in relazione ad un’infezione virale (V)
• Obiettivo della ricerca
• Incidenza del colon irritabile come funzione dell’infezione virale controllando per l’effetto di altri fattori estranei (EF)
• IIBD =f(V|EF)
Ricerca in campo eziologico
• Fattori estranei: fattori che non rappresentano l’oggetto della ricerca ma possono diminuirne la validità
• Sono i fattori confondenti
Confondimento
• Un confondente
– È associato con la malattia tra i non esposti
– È associato con l’esposizione nella popolazione che dà origine ai casi
– Non è una causa intermedia
Esempio di confondimento
Dati grezzi
Esposti Non esposti
Casi 40 101 Tempo-persona 1100 1100 RR=0.4
Giovani Anziani
Esposti Non esposti
Esposti Non esposti
Casi 20 1 Casi 20 100 Tempo-persona
1000 100 Tempo-persona
100 1000
RR=2.0 RR=2.0
Ricerca in campo prognostico
• La prognosi di pazienti con linfoma allo stadio I dipende dal livello sierico di beta-2 microglobuline?
• Obiettivo della ricerca
• Il futuro corso della malattia, ovvero il fallimento della terapia (TF) in relazione ai livelli di beta-2 microglobuline (β-2m) in pazienti con linfoma allo stadio I
• ITF =f(β-2m)
Malattia
Presente Assente
Test
Positivo Veri positivi Falsi positivi
Negativo Falso negativi Veri negativi
Misure di validità del test
• Sensibilita’: la percentuale di soggetti malati che il test classifica come positivi
– = Malati positivi / Tutti i malati
– P(T+|D+)
• Specificita’: la percentuale di soggetti sani che il test identifica come negativi
– = Sani negativi / Tutti i sani
– P(T-|D-)
• La sensibilità, che riguarda la capacità di un test di individuare una malattia quando essa sia presente, è calcolata come a/(a+c)
True positive False positive
False negative True negative
Disease
Test
Positive
Present Absent
Negative
a b
c d
• Se un test non è sensibile, mancherà di individuare la malattia in qualche soggetto malato, e questi individui appariranno nella cella c
True positive False positive
False negative True negative
Disease
Test
Positive
Present Absent
Negative
a b
c d
• La specificità, che si riferisce alla capacità di individuare l'assenza di malattia quando la malattia non è presente, è calcolata come d/(b+d)
True positive False positive
False negative True negative
Disease
Test
Positive
Present Absent
Negative
a b
c d
• Se un test non è specifico indicherà falsamente la malattia in soggetti non malati, e questi appariranno nella cella b
True positive False positive
False negative True negative
Disease
Test
Positive
Present Absent
Negative
a b
c d
Valore predittivo
• Parametro chiave: probabilità della malattia dato il risultato del test
• valore predittivo del test
– Valore predittivo di un test positivo
– Valore predittivo di un test negativo
Misure di validità del test
• Valore predittivo del test positivo: la probabilità di essere malati dei soggetti risultati positivi al test
– = Malati positivi / Tutti i positivi
– P(D+|T+)
• Valore predittivo del test negativo: la probabilità di essere sani dei soggetti risultati negativi al test
– = Sani negativi / Tutti i negativi
– P(D-|T-)
Misure di validità del test
• Il likelihood ratio (rapporto di verosimiglianza) associato al risultato di un test è il rapporto tra la probabilità di avere quel risultato se la malattia è presente diviso per la probabilità di avere quello stesso risultato nel caso la malattia sia assente
Misure di validità del test
– Il likelihood ratio di un test positivo è il rapporto tra la probabilità di avere un risultato positivo tra chi ha la malattia diviso per la probabilità di avere un risultato positivo tra chi non ha la malattia
• LR+=P(T+|D+)/P(T+|D-)
– Il likelihood ratio di un test negativo è il rapporto tra la probabilità di avere un risultato negativo tra chi ha la malattia diviso per la probabilità di avere un risultato negativo tra chi non ha la malattia
• LR-=P(T-|D+)/P(T-|D-)
Probabilità pre e post-test
• Probabilità a priori (pre-test): è la probabilità che la malattia sia presente sulla base dell’informazione disponibile prima di eseguire il test
• Probabilità a posteriori (post-test): è la probabilità che la malattia sia presente data l’informazione disponibile prima del test ed il risultato del test
Teorema di Bayes
• A è il risultato del test• B è la malattia
• Il teorema di Bayes può anche essere scritto sotto forma di odds
Post-test odds=Pre-test odds*likelihood ratio
Drug testing
• An example of the use of Bayes' theorem is the evaluation of drug test results.
• Suppose a certain drug test is 99% sensitive and 99% specific, that is, the test will correctly identify a drug user as testing positive 99% of the time, and will correctly identify a non-user as testing negative 99% of the time.
• This would seem to be a relatively accurate test, but Bayes' theorem can be used to demonstrate the relatively high probability of misclassifying non-users as users. Let's assume a corporation decides to test its employees for drug use, and that only 0.5% of the employees actually use the drug.
• What is the probability that, given a positive drug test, an employee is actually a drug user? Let "D" stand for being a drug user and "N" indicate being a non-user. Let "+" be the event of a positive drug test.
Drug testing
• We need to know the following:• P(D), or the probability that the employee is a drug user, regardless of any
other information. This is 0.005, since 0.5% of the employees are drug users. This is the prior probability of D.
• P(N), or the probability that the employee is not a drug user. This is 1 − P(D), or 0.995.
• P(+|D), or the probability that the test is positive, given that the employee is a drug user. This is 0.99, since the test is 99% accurate.
• P(+|N), or the probability that the test is positive, given that the employee is not a drug user. This is 0.01, since the test will produce a false positive for 1% of non-users.
• P(+), or the probability of a positive test event, regardless of other information. This is 0.0149 or 1.49%, which is found by adding the probability that a true positive result will appear (= 99% x 0.5% = 0.495%) plus the probability that a false positive will appear (= 1% x 99.5% = 0.995%). This is the prior probability of +.
Drug testing
• Given this information, we can compute the posterior probability P(D|+) of an employee who tested positive actually being a drug user:
Drug testing
• Despite the specificity and sensitivity of the test, the low base-rate of use renders the accuracy of the test low: the probability that an employee who tests positive actually using drugs is only about 33%, so it is in fact more likely that the employee is not a drug user.
• The rarer the condition for which we are testing, the greater the percentage of positive tests that will be false positives.
Valore predittivo e prevalenza della malattia
• La prevalenza della malattia nella popolazione oggetto di studio può influenzare la capacità predittiva di un test
• Lo stesso test, se applicato in contesti diversi (i.e. a popolazioni con prevalenza differente della malattia) può fornire risultati diversi
Valore predittivo e prevalenza della malattia
• Immaginiamo di adoperare un test (PCR) per valutare la presenza o assenza di una malattia sessualmente trasmessa, l’infezione da Clamydia– Questo test possiede eccellenti valori di sensibilità (97%) e di
specificità (97%)
• Applichiamo il test in due contesti differenti– Una clinica per malattie sessualmente trasmesse, in cui la
prevalenza della malattia è alta (30%)
– Gli assistiti di un medico di famiglia, in cui la prevalenza della malattia è bassa (3%)
• Calcoliamo il valore predittivo positivo del test nei due contesti
Predictive values and prevalence of the disease
Chlamydia
infection
PCR
Test
Positive
Present Absent
Negative
Sexually trasmitted disease
clinic (prevalence = 30%) • 1000 soggetti
• 300 soggetti con infezione da Clamydia
• 700 soggetti privi di infezione da Clamydia
• Calcolare il valore predittivo di un test positivo
Predictive values and prevalence of the disease
291 21
9 679
Chlamydia
infection
PCR
Test
Positive
Present Absent
Negative
Sexually trasmitted disease
clinic (prevalence = 30%) • 1000 soggetti
• 300 soggetti con infezione da Clamydia
• 700 soggetti privi di infezione da Clamydia
• VP+=291/(291+21)= 93%
Valore predittivo e prevalenza della malattia
• Ora applichiamo lo stesso test in un contesto in cui la prevalenza della malattia è molto più bassa rispetto a prima (3%)
• Calcoliamo di nuovo il valore predittivo positivo del test
Predictive values and prevalence of the disease
Private practice
(prevalence = 3%) • 1000 soggetti
• 30 soggetti con infezione da Clamydia
• 970 soggetti privi di infezione da Clamydia
• Calcolare il valore predittivo di un test positivo
Chlamydia
infection
PCR
Test
Positive
Positive Negative
Negative
Predictive values and prevalence of the disease
Private practice
(prevalence = 3%) • 1000 soggetti
• 30 soggetti con infezione da Clamydia
• 970 soggetti privi di infezione da Clamydia
• VP+=29/(29+29)= 50%
29 29
1 941
Chlamydia
infection
PCR
Test
Positive
Positive Negative
Negative
La curva ROC
• La curva ROC (receiver operating characteristic curve) è un grafico che rappresenta tutte le possibili combinazioni di sensibilità e specificità ottenibili con un test variando il criterio di positività
• È una rappresentazione grafica dellasensibilità (o proporzione di veri positivi) rispetto alla proporzione di falsi positivi (1-specificità)