Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
STATISTICA MEDICA
Prof.ssa Donatella Siepi
tel: 075 5853525
UNIVERSITA’ DEGLI
STUDI DI PERUGIA
11 LEZIONE
STATISTICA E
DECISIONI MEDICHE
STATISTICA MEDICA
Processo diagnostico • Se il test preso in esame ha dato risultato positivo, quale è la
probabilità che il paziente sia effettivamente malato?
• Se il test preso in esame ha dato risultato negativo, quale è la
probabilità che il paziente sia effettivamente sano?
Come posso schematizzare le fasi del processo diagnostico
per un paziente?
• Anamnesi, segni e sintomi, ipotesi in iniziale del medico
(basata su esperienza, letteratura scientifica..) associata a
probabilità di malattia
• Raccolta di altre informazioni con esami specifici (test di
laboratorio strumentali ecc) e affinamento della ipotesi iniziale
• Aggiornamento della probabilità iniziale sulla base delle
nuove conoscenze
• Tale processo induttivo può essere
modellizzato attraverso il Teorema di
Bayes
• Il teorema permette di ricavare le
probabilità a posteriori
• È necessario conoscere le probabilità a
priori e le verosimiglianze (evento/malattia
presente-evento/malattia assente)
Il Teorema di Bayes , si ottiene, a partire
dalla definizione di probabilità condizionata,
applicando la regola della probabilità
composta
Il Teorema di Bayes permette di
aggiornare una probabilità sulla base di
nuove informazioni e di calcolare la
probabilità che un certo effetto sia il
risultato di una particolare causa
• Dai suddetti assiomi derivano alcuni teoremi fondamentali, quali
• il teorema della probabilità totale: P(A U B) = P(A) + P(B) - P(A ∩ B)
• il teorema della probabilità composta: P(A ∩ B) = P(B) P(A | B) = P(A) P(B | A)
• il teorema della probabilità assoluta : P(B) = ΣiP(Ai)P(B|Ai)
• il teorema di Bayes: P(Ak | B) = P(Ak)P(B|Ak) / ΣiP(Ai)P(B|Ai)
• nonché concetti chiave come
• la probabilità condizionata: P(A | B) = P(A ∩ B) / P(B)
• L’indipendenza stocastica: P(A | B) = P(A)
La probabilità composta (o congiunta) può essere ottenuta
moltiplicando la probabilità condizionata per quella marginale
La probabilità marginale si riferisce ad un evento
semplice
La probabilità condizionata è la probabilità che si verifichi un
evento sapendo che un altro evento si è verificato; quando il
verificarsi di un evento non influenza la probabilità che se ne
verifichi un altro, si dice che i due eventi sono statisticamente
indipendenti
Un reverendo matematico Thomas Bayes nacque a Londra nel
1701; studiò logica e teologia
all’Università di Edimburgo e nel 1733
fu ordinato pastore nella cappella
presbiteriana di Tunbridge Wells, dove
visse fino alla morte, nel 1761.
Thomas Bayes
(Londra, 1701? - Tunbridge Wells, 1761)
Noto come abile matematico, tanto da
essere accettato nell’esclusiva cerchia
della Royal Society, non pubblicò nella
sua vita alcuno scritto degno di
attenzione, ma alla sua morte lasciò
all’amico Richard Price i suoi
manoscritti.
Tra questi, uno studio dal titolo Essay
toward solving a problem in the
doctrine of chance che conteneva
alcune idee nuove, e un teorema sulla
probabilità.
Il teorema di Bayes Su sollecitazione di Price, lo scritto di Bayes fu pubblicato postumo nel 1764
nella rivista della Royal Society Phylosophical Transactions. Inizialmente
passò quasi inosservato, ma ben presto matematici e statistici ne
apprezzarono il contenuto, fino alla piena valorizzazione che giungerà pochi
anni dopo con Pierre-Simon Laplace.
L’idea centrale di Bayes metteva in relazione le probabilità
condizionate di due eventi correlati A e B, con questa intuizione
fondamentale:
Bayes formulò inoltre un teorema che permette di quantificare la
probabilità che un dato evento abbia alla sua origine una
determinata causa
Non commutatività della
probabilità condizionata
Teorema di Bayes
Se B è un evento che si verifica insieme ad n eventi incompatibili A1,…,An se
sappiamo che B si è verificato, ci si può porre il problema di calcolare la
probabilità che B venga da uno di tali eventi, un generico Ai
)()|(...)()|(
)()|(
)(
)()|(
)(
)(|
0)(,,,,...,
11
1
nn
ii
ii
i
n
APABPAPABP
APABP
BP
BPABP
BP
BAPBAP
BPBAA
cause
effetto
Bayes formulò inoltre un teorema che permette di quantificare la
probabilità che un dato evento abbia alla sua origine una
determinata causa
Il teorema di Bayes
(la causa | dato l’effetto) (l’effetto | data la causa)
P(A|B) =
P(B|A) ⋅ P(A) + P(B|non A) ⋅ P(non A)
P(B|A) ⋅ P(A)
Probabilità
(questa particolare espressione del teorema è utile per esprimere i risultati di
due situazioni mutuamente esclusive come affetto ovvero non affetto dalla
malattia A)
Il teorema di Bayes svolge un ruolo centrale nel
pensiero razionale, consentendo di aggiornare le
informazioni sulla base dell’esperienza.
Abbiamo una informazione “a priori”: il teorema
consente di combinarla con l’informazione data
dall’esperienza e quindi di ottenere in uscita una
informazione “a posteriori” che è quella a priori
incrementata dell’informazione che l’esperienza è in
grado di fornire.
Lo schema di aggiornamento del grado di fiducia
mediante il meccanismo bayesiano
pregiudizio + indizi → conclusioni
PROBABILITA’ E TEST
DIAGNOSTICI
IL TEST E’
POSITIVO..
La patologia medica
insegna
come si comportano i segni data la malattia.
Ci insegna ad esempio che
nell'epatite virale di tipo A
è presente
un aumento moderato delle transaminasi.
(l’effetto | data la causa)
La clinica medica
insegna
a diagnosticare la malattia dati i segni.
Un soggetto con aumento moderato
delle transaminasi,
che probabilità ha di essere affetto
a una epatite A?
(la causa | dato l’effetto)
GLI ESAMI DIAGNOSTICI SERVONO PER DETERMINARE L’EVENTUALE PRESENZA/ASSENZA DI UNA MALATTIA IN UN DETERMINATO SOGGETTO
Questi esami hanno come obiettivo il discriminare i soggetti malati da quelli sani, relativamente alla condizione esaminata
TEST DIAGNOSTICI
- amniocentesi
- duo/triplo test
- Ecografie, TAC
PROGRAMMI DI SCREENING
- neoplasia della mammella
- neoplasia della cervice uterina
- insufficienza tiroidea (neonati)
VALUTAZIONE DELLA PERFORMANCE DI UN TEST
DIAGNOSTICO
Non esistono test diagnostici che forniscono risultati certi ed affidabili in
tutte le situazioni e nel 100% dei casi.
L'esito deve essere visto come una indicazione di «probabilità».
La probabilità di ottenere risultati «veri» (cioè aderenti alla realtà) è
soprattutto legata al tipo di test, non tutti i test raggiungano la stessa
probabilità, è possibile invece stilare una sorta di “classifica” della
performance dei vari test.
Nella situazione più semplice un esame diagnostico fornisce un risultato
che può essere espresso come: “esame positivo”/”esame negativo”.
Anche gli esami il cui il risultato è espresso su scala continua sono
interpretati come Positivi e negativi, identificando dei valori soglia
Un test di laboratorio ideale
Un test di laboratorio inutile
Un test di laboratorio reale
Il teorema di Bayes si addice perfettamente a queste
situazioni, nelle quali è assolutamente importante valutare la
probabilità che la causa di un dato reale e oggettivo (l’esito del
test) sia proprio la presenza della malattia.
Classificazione in base a un test
• L’obiezione che in una classificazione dicotomica si perde il senso del risultato
numerico viene superata dal fatto che il valore soglia tra T+ e T- può essere variato in
continuo (lo vedremo successivamente)
Le tre grandezze in gioco
Le tre grandezze in gioco
Teorema di Bayes
• Il teorema permette di ricavare le
probabilità a posteriori
• Conoscendo la probabilità a priori
• Verosimiglianze
Il teorema di Bayes
Questa espressione particolare del teorema di Bayes si applica a due
situazioni mutuamente esclusive (affetto o non affetto dalla malattia A).
Il teorema di Bayes
Il teorema di Bayes
• Consente, conoscendo la prevalenza di
una malattia, e la sensibilità e la
specificità di un test per la sua diagnosi,
di calcolare la probabilità di malattia in
caso di test positivo (o la probabilità di
assenza della malattia in caso di test
negativo).
Consente, in altre parole, il passaggio dalla patologia
medica alla clinica medica.
Tutte le probabilità in gioco
Valore predittivo T+
Valore predittivo T-
Valore predittivo T+
Statistica Bayesiana
probabilità soggettiva + teorema di Bayes = statistica Bayesiana
A = ipotesi che una certa teoria sia vera
B = ipotesi che un esperimento darà un certo
risultato, i.e. dei dati
teorema di Bayes assume la forma:
P (teoria | dati) ∝ P(dati | teoria) P (teoria)
probabilità a priori
che la teoria sia vera
probabilità a posteriori che
la teoria è corretta dopo
aver osservato il risultato
dell’esperimento
probabilità, sotto
l’assunzione della
teoria, di osservare i
dati effettivamente
ottenuti
MASSIMIZZAZIONE DI SENSIBILITA’ E SPECIFICITA’:
L’INFLUENZA DEL VALORE SOGLIA
Finora abbiamo illustrato le caratteristiche di un ipotetico test
presumendo che esso fornisse risultati del tipo
positivo/negativo oppure sano/malato oppure si/no.
In altri casi, però, i test forniscono risultati classificabili in più
di due categorie oppure su scala continua.
In questo ultimo caso i risultati del test devono essere
comunque “ dicotomizzati ” e la scelta della soglia che
identifica il passaggio da POSITIVO A NEGATIVO (cut-off)
influenza sensibilità e specificità del test e la loro
massimizzazione contemporanea
1)
2)
DISTRIBUZIONI DEI VALORI DEL TEST NELLE DUE POPOLAZIONI
TEST NEGATIVI TEST POSITIVI
SOGLIA = 1
SENS =
100%
SPEC =
100%
Il valore di cut-off influenza sia la sensibilità che la
specificità del test.
Esso viene scelto in base ad una serie di considerazioni:
ad esempio, deve essere ben nota la storia naturale
della malattia, nonché le conseguenze sanitarie ed
economiche dei falsi negativi e dei falsi positivi.
Nel caso di alcune malattie infettive, talvolta anche un
solo falso negativo può risultare particolarmente
pericoloso, in quanto escretore dell'agente di malattia e
quindi “disseminatore” del contagio.
LA SCELTA MIGLIORE E’
QUELLA DEL COMPROMESSO
UN TEST SENSIBILE DOVREBBE ESSERE SCELTO QUANDO LE CONSEGUENZE DI UNA MANCATA DIAGNOSI SONO PARTICOLARMENTE GRAVI (es. malattie ad esito solitamente mortale, ma che possono essere efficacemente curate).
I test sensibili sono utili anche durante il processo diagnostico iniziale, al fine di ridurre il ventaglio di possibilità (diagnosi differenziale) quando esso è ampio. In tal caso, il test sensibile viene applicato soprattutto allo scopo di escludere una o più malattie. Infatti, un test sensibile è di maggior aiuto al clinico quando fornisce un risultato negativo.
UN TEST SPECIFICO E’ PARTICOLARMENTE UTILE QUANDO UN RISULTATO FALSO POSITIVO E’ PARTICOLARMENTE DANNOSO (sotto l'aspetto organico, emotivo per il proprietario, finanziario ecc.).
SCELTA DEL CUT-OFF: PRIVILEGIARE LA SENSIBILITA’ O
LA SPECIFICITA’
• Mentre la sensibilità e la specificità, il potere predittivo
negativo e positivo classificano gli individui come affetti o
non affetti da una specifica malattia sulla base di un
predefinito valore del test (valore soglia), la curva ROC
viene costruita considerando tutti i possibili valori del test
e, per ognuno di questi, si calcola la proporzione di veri
positivi (la sensibilità) e la proporzione di falsi positivi. La
proporzione di falsi positivi si calcola con la formula
standard: 1 - specificità.
• Congiungendo i punti che mettono in rapporto la
proporzione di veri positivi e di falsi positivi (le cosiddette
coordinate) si ottiene una curva chiamata curva ROC.
L’area sottostante alla curva ROC (AUC, acronimo dei
termini inglesi “Area Under the Curve”) è una misura di
accuratezza.
LE CURVE R.O.C.
(Receiver Operating Characteristic)
Le Curve ROC sono un ulteriore e più moderno approccio per valutare la capacità discriminatoria di un Test (ACCURATEZZA DIAGNOSTICA).
Questa rappresentazione grafica :Traccia la probabilità di un risultato vero positivo (sensibilità) in funzione della probabilità di un risultato falso positivo per una serie di punti di cut-off
Le curve ROC si utilizzano per:
-Scegliere il valore soglia + o – consono alle conseguenze diagnostiche del test in base ai punti che formano la retta
-Paragonare due diversi Test per la diagnosi della stessa malattia in base alla grandezza dell’area sotto le curve
La curva si ottiene a partire dai valori di sensibilità e di specificità del test a
varie soglie mediante la rappresentazione di punti in un piano cartesiano i
cui assi sono definiti da “Sensibilità” e “1 – Specificità”
DISEGNARE LE CURVE ROC
A
A
TEST PERFETTO
TEST INUTILE
TEST A
TEST B
TEST SENS=SPEC
• LE CURVE PARTONO SEMPRE DAL PUNTO (SE=0, SP=1) CHE INDICA CHE NESSUN PAZIENTE RISULTERA’ POSITIVO AL TEST E TERMINANO NEL PUNTO (SE=1,SP=0) CHE EQUIVALE A DIRE CHE TUTTI I SOGGETTI RISULTERANNO POSITIVI AL TEST
• UN TEST INFALLIBILE E’ QUELLO NEL QUALE ESISTE UNA SOGLIA TALE PER CUI LA CURVA COINCIDE CON IL PUNTO (SE=1, SP=1), L’AREA SOTTO LA CURVA IN QUESTO CASO E’ UGUALE A 1
• IL TEST PEGGIORE E’ QUELLO CHE GENERA UN NUMERO DI VERI POSITIVI UGUALE A QUELLI DI FALSI NEGATIVI, L’AREA SOTTO LA CURVA IN QUESTO CASO E’ 0.5
• PIU’ LA CURVA E’ ARCUATA VERSO IL PUNTO DI MASSIMO, MIGLIORE E’ LA CAPACITA’ DISCRIMINATORIA DEL TEST (AREA GRIGIA AREA DI ERRORE)
• IL PUNTO DI MASSIMO DELLA CURVA E’ QUELLO PIU’ VICINO ALL’ANGOLO IN ALTO A SINISTRA, IN QUESTO PUNTO SI MASSIMIZZANO CONTEMPORANEAMENTE SENSIBILITA’ E SPECIFICITA’
•NON SEMPRE SIAMO INTERESSATI AL PUNTO DI
MASSIMO DELLA CURVA, NEI TEST DI SCREENING
PER CANCRO INFATTI SI PREDILIGONO SOGLIE CHE
MASSIMIZZANO LA SENSIBILITA’ A SCAPITO DI
MOLTI FALSI POSITIVI CHE VERRANNO
DIAGNOSTICATI IN MANIERA CORRETTA CON
SUCCESSIVI TEST
•NEL CASO DI TEST MISURATI SU SCALA CONTINUA
LA CURVA ROC E’ FONDAMENTALE PER
IDENTIFICARE I VALORI OTTIMI DI CUT-OFF
Curve di ROC area
sotto la curva AUC