STATISTICA MEDICA STATISTICA... · • Se il test preso in esame ha dato risultato positivo, quale è la probabilità che il paziente sia effettivamente malato? • Se il test preso

STATISTICA MEDICA

Prof.ssa Donatella Siepi

[email protected]

tel: 075 5853525

UNIVERSITA’ DEGLI

STUDI DI PERUGIA

mailto:[email protected]

11 LEZIONE

STATISTICA E

DECISIONI MEDICHE

STATISTICA MEDICA

Processo diagnostico • Se il test preso in esame ha dato risultato positivo, quale è la

probabilità che il paziente sia effettivamente malato?

• Se il test preso in esame ha dato risultato negativo, quale è la

probabilità che il paziente sia effettivamente sano?

Come posso schematizzare le fasi del processo diagnostico

per un paziente?

• Anamnesi, segni e sintomi, ipotesi in iniziale del medico

(basata su esperienza, letteratura scientifica..) associata a

probabilità di malattia

• Raccolta di altre informazioni con esami specifici (test di

laboratorio strumentali ecc) e affinamento della ipotesi iniziale

• Aggiornamento della probabilità iniziale sulla base delle

nuove conoscenze

• Tale processo induttivo può essere

modellizzato attraverso il Teorema di

Bayes

• Il teorema permette di ricavare le

probabilità a posteriori

• È necessario conoscere le probabilità a

priori e le verosimiglianze (evento/malattia

presente-evento/malattia assente)

Il Teorema di Bayes , si ottiene, a partire

dalla definizione di probabilità condizionata,

applicando la regola della probabilità

composta

Il Teorema di Bayes permette di

aggiornare una probabilità sulla base di

nuove informazioni e di calcolare la

probabilità che un certo effetto sia il

risultato di una particolare causa

• Dai suddetti assiomi derivano alcuni teoremi fondamentali, quali

• il teorema della probabilità totale: P(A U B) = P(A) + P(B) - P(A ∩ B)

• il teorema della probabilità composta: P(A ∩ B) = P(B) P(A | B) = P(A) P(B | A)

• il teorema della probabilità assoluta : P(B) = ΣiP(Ai)P(B|Ai)

• il teorema di Bayes: P(Ak | B) = P(Ak)P(B|Ak) / ΣiP(Ai)P(B|Ai)

• nonché concetti chiave come

• la probabilità condizionata: P(A | B) = P(A ∩ B) / P(B)

• L’indipendenza stocastica: P(A | B) = P(A)

La probabilità composta (o congiunta) può essere ottenuta

moltiplicando la probabilità condizionata per quella marginale

La probabilità marginale si riferisce ad un evento

semplice

La probabilità condizionata è la probabilità che si verifichi un

evento sapendo che un altro evento si è verificato; quando il

verificarsi di un evento non influenza la probabilità che se ne

verifichi un altro, si dice che i due eventi sono statisticamente

indipendenti

Un reverendo matematico Thomas Bayes nacque a Londra nel

1701; studiò logica e teologia

all’Università di Edimburgo e nel 1733

fu ordinato pastore nella cappella

presbiteriana di Tunbridge Wells, dove

visse fino alla morte, nel 1761.

Thomas Bayes

(Londra, 1701? - Tunbridge Wells, 1761)

Noto come abile matematico, tanto da

essere accettato nell’esclusiva cerchia

della Royal Society, non pubblicò nella

sua vita alcuno scritto degno di

attenzione, ma alla sua morte lasciò

all’amico Richard Price i suoi

manoscritti.

Tra questi, uno studio dal titolo Essay

toward solving a problem in the

doctrine of chance che conteneva

alcune idee nuove, e un teorema sulla

probabilità.

Il teorema di Bayes Su sollecitazione di Price, lo scritto di Bayes fu pubblicato postumo nel 1764

nella rivista della Royal Society Phylosophical Transactions. Inizialmente

passò quasi inosservato, ma ben presto matematici e statistici ne

apprezzarono il contenuto, fino alla piena valorizzazione che giungerà pochi

anni dopo con Pierre-Simon Laplace.

L’idea centrale di Bayes metteva in relazione le probabilità

condizionate di due eventi correlati A e B, con questa intuizione

fondamentale:

Bayes formulò inoltre un teorema che permette di quantificare la

probabilità che un dato evento abbia alla sua origine una

determinata causa

Non commutatività della

probabilità condizionata

Teorema di Bayes

Se B è un evento che si verifica insieme ad n eventi incompatibili A1,…,An se

sappiamo che B si è verificato, ci si può porre il problema di calcolare la

probabilità che B venga da uno di tali eventi, un generico Ai

)()|(...)()|(

)()|(

)(

)()|(

)(

)(|

0)(,,,,...,

11

1

nn

ii

ii

i

n

APABPAPABP

APABP

BP

BPABP

BP

BAPBAP

BPBAA

cause

effetto

Bayes formulò inoltre un teorema che permette di quantificare la

probabilità che un dato evento abbia alla sua origine una

determinata causa

Il teorema di Bayes

(la causa | dato l’effetto) (l’effetto | data la causa)

P(A|B) =

P(B|A) ⋅ P(A) + P(B|non A) ⋅ P(non A)

P(B|A) ⋅ P(A)

Probabilità

(questa particolare espressione del teorema è utile per esprimere i risultati di

due situazioni mutuamente esclusive come affetto ovvero non affetto dalla

malattia A)

Il teorema di Bayes svolge un ruolo centrale nel

pensiero razionale, consentendo di aggiornare le

informazioni sulla base dell’esperienza.

Abbiamo una informazione “a priori”: il teorema

consente di combinarla con l’informazione data

dall’esperienza e quindi di ottenere in uscita una

informazione “a posteriori” che è quella a priori

incrementata dell’informazione che l’esperienza è in

grado di fornire.

Lo schema di aggiornamento del grado di fiducia

mediante il meccanismo bayesiano

pregiudizio + indizi → conclusioni

PROBABILITA’ E TEST

DIAGNOSTICI

IL TEST E’

POSITIVO..

La patologia medica

insegna

come si comportano i segni data la malattia.

Ci insegna ad esempio che

nell'epatite virale di tipo A

è presente

un aumento moderato delle transaminasi.

(l’effetto | data la causa)

La clinica medica

insegna

a diagnosticare la malattia dati i segni.

Un soggetto con aumento moderato

delle transaminasi,

che probabilità ha di essere affetto

a una epatite A?

(la causa | dato l’effetto)

GLI ESAMI DIAGNOSTICI SERVONO PER DETERMINARE L’EVENTUALE PRESENZA/ASSENZA DI UNA MALATTIA IN UN DETERMINATO SOGGETTO

Questi esami hanno come obiettivo il discriminare i soggetti malati da quelli sani, relativamente alla condizione esaminata

TEST DIAGNOSTICI

- amniocentesi

- duo/triplo test

- Ecografie, TAC

PROGRAMMI DI SCREENING

- neoplasia della mammella

- neoplasia della cervice uterina

- insufficienza tiroidea (neonati)

VALUTAZIONE DELLA PERFORMANCE DI UN TEST

DIAGNOSTICO

Non esistono test diagnostici che forniscono risultati certi ed affidabili in

tutte le situazioni e nel 100% dei casi.

L'esito deve essere visto come una indicazione di «probabilità».

La probabilità di ottenere risultati «veri» (cioè aderenti alla realtà) è

soprattutto legata al tipo di test, non tutti i test raggiungano la stessa

probabilità, è possibile invece stilare una sorta di “classifica” della

performance dei vari test.

Nella situazione più semplice un esame diagnostico fornisce un risultato

che può essere espresso come: “esame positivo”/”esame negativo”.

Anche gli esami il cui il risultato è espresso su scala continua sono

interpretati come Positivi e negativi, identificando dei valori soglia

Un test di laboratorio ideale

Un test di laboratorio inutile

Un test di laboratorio reale

Il teorema di Bayes si addice perfettamente a queste

situazioni, nelle quali è assolutamente importante valutare la

probabilità che la causa di un dato reale e oggettivo (l’esito del

test) sia proprio la presenza della malattia.

Classificazione in base a un test

• L’obiezione che in una classificazione dicotomica si perde il senso del risultato

numerico viene superata dal fatto che il valore soglia tra T+ e T- può essere variato in

continuo (lo vedremo successivamente)

Le tre grandezze in gioco

Le tre grandezze in gioco

Teorema di Bayes

• Il teorema permette di ricavare le

probabilità a posteriori

• Conoscendo la probabilità a priori

• Verosimiglianze

Il teorema di Bayes

Questa espressione particolare del teorema di Bayes si applica a due

situazioni mutuamente esclusive (affetto o non affetto dalla malattia A).

Il teorema di Bayes

Il teorema di Bayes

• Consente, conoscendo la prevalenza di

una malattia, e la sensibilità e la

specificità di un test per la sua diagnosi,

di calcolare la probabilità di malattia in

caso di test positivo (o la probabilità di

assenza della malattia in caso di test

negativo).

Consente, in altre parole, il passaggio dalla patologia

medica alla clinica medica.

Tutte le probabilità in gioco

Valore predittivo T+

Valore predittivo T-

Valore predittivo T+

Statistica Bayesiana

probabilità soggettiva + teorema di Bayes = statistica Bayesiana

A = ipotesi che una certa teoria sia vera

B = ipotesi che un esperimento darà un certo

risultato, i.e. dei dati

teorema di Bayes assume la forma:

P (teoria | dati) ∝ P(dati | teoria) P (teoria)

probabilità a priori

che la teoria sia vera

probabilità a posteriori che

la teoria è corretta dopo

aver osservato il risultato

dell’esperimento

probabilità, sotto

l’assunzione della

teoria, di osservare i

dati effettivamente

ottenuti

MASSIMIZZAZIONE DI SENSIBILITA’ E SPECIFICITA’:

L’INFLUENZA DEL VALORE SOGLIA

Finora abbiamo illustrato le caratteristiche di un ipotetico test

presumendo che esso fornisse risultati del tipo

positivo/negativo oppure sano/malato oppure si/no.

In altri casi, però, i test forniscono risultati classificabili in più

di due categorie oppure su scala continua.

In questo ultimo caso i risultati del test devono essere

comunque “ dicotomizzati ” e la scelta della soglia che

identifica il passaggio da POSITIVO A NEGATIVO (cut-off)

influenza sensibilità e specificità del test e la loro

massimizzazione contemporanea

1)

2)

DISTRIBUZIONI DEI VALORI DEL TEST NELLE DUE POPOLAZIONI

TEST NEGATIVI TEST POSITIVI

SOGLIA = 1

SENS =

100%

SPEC =

100%

Il valore di cut-off influenza sia la sensibilità che la

specificità del test.

Esso viene scelto in base ad una serie di considerazioni:

ad esempio, deve essere ben nota la storia naturale

della malattia, nonché le conseguenze sanitarie ed

economiche dei falsi negativi e dei falsi positivi.

Nel caso di alcune malattie infettive, talvolta anche un

solo falso negativo può risultare particolarmente

pericoloso, in quanto escretore dell'agente di malattia e

quindi “disseminatore” del contagio.

LA SCELTA MIGLIORE E’

QUELLA DEL COMPROMESSO

UN TEST SENSIBILE DOVREBBE ESSERE SCELTO QUANDO LE CONSEGUENZE DI UNA MANCATA DIAGNOSI SONO PARTICOLARMENTE GRAVI (es. malattie ad esito solitamente mortale, ma che possono essere efficacemente curate).

I test sensibili sono utili anche durante il processo diagnostico iniziale, al fine di ridurre il ventaglio di possibilità (diagnosi differenziale) quando esso è ampio. In tal caso, il test sensibile viene applicato soprattutto allo scopo di escludere una o più malattie. Infatti, un test sensibile è di maggior aiuto al clinico quando fornisce un risultato negativo.

UN TEST SPECIFICO E’ PARTICOLARMENTE UTILE QUANDO UN RISULTATO FALSO POSITIVO E’ PARTICOLARMENTE DANNOSO (sotto l'aspetto organico, emotivo per il proprietario, finanziario ecc.).

SCELTA DEL CUT-OFF: PRIVILEGIARE LA SENSIBILITA’ O

LA SPECIFICITA’

• Mentre la sensibilità e la specificità, il potere predittivo

negativo e positivo classificano gli individui come affetti o

non affetti da una specifica malattia sulla base di un

predefinito valore del test (valore soglia), la curva ROC

viene costruita considerando tutti i possibili valori del test

e, per ognuno di questi, si calcola la proporzione di veri

positivi (la sensibilità) e la proporzione di falsi positivi. La

proporzione di falsi positivi si calcola con la formula

standard: 1 - specificità.

• Congiungendo i punti che mettono in rapporto la

proporzione di veri positivi e di falsi positivi (le cosiddette

coordinate) si ottiene una curva chiamata curva ROC.

L’area sottostante alla curva ROC (AUC, acronimo dei

termini inglesi “Area Under the Curve”) è una misura di

accuratezza.

LE CURVE R.O.C.

(Receiver Operating Characteristic)

Le Curve ROC sono un ulteriore e più moderno approccio per valutare la capacità discriminatoria di un Test (ACCURATEZZA DIAGNOSTICA).

Questa rappresentazione grafica :Traccia la probabilità di un risultato vero positivo (sensibilità) in funzione della probabilità di un risultato falso positivo per una serie di punti di cut-off

Le curve ROC si utilizzano per:

-Scegliere il valore soglia + o – consono alle conseguenze diagnostiche del test in base ai punti che formano la retta

-Paragonare due diversi Test per la diagnosi della stessa malattia in base alla grandezza dell’area sotto le curve

La curva si ottiene a partire dai valori di sensibilità e di specificità del test a

varie soglie mediante la rappresentazione di punti in un piano cartesiano i

cui assi sono definiti da “Sensibilità” e “1 – Specificità”

DISEGNARE LE CURVE ROC

A

A

TEST PERFETTO

TEST INUTILE

TEST A

TEST B

TEST SENS=SPEC

• LE CURVE PARTONO SEMPRE DAL PUNTO (SE=0, SP=1) CHE INDICA CHE NESSUN PAZIENTE RISULTERA’ POSITIVO AL TEST E TERMINANO NEL PUNTO (SE=1,SP=0) CHE EQUIVALE A DIRE CHE TUTTI I SOGGETTI RISULTERANNO POSITIVI AL TEST

• UN TEST INFALLIBILE E’ QUELLO NEL QUALE ESISTE UNA SOGLIA TALE PER CUI LA CURVA COINCIDE CON IL PUNTO (SE=1, SP=1), L’AREA SOTTO LA CURVA IN QUESTO CASO E’ UGUALE A 1

• IL TEST PEGGIORE E’ QUELLO CHE GENERA UN NUMERO DI VERI POSITIVI UGUALE A QUELLI DI FALSI NEGATIVI, L’AREA SOTTO LA CURVA IN QUESTO CASO E’ 0.5

• PIU’ LA CURVA E’ ARCUATA VERSO IL PUNTO DI MASSIMO, MIGLIORE E’ LA CAPACITA’ DISCRIMINATORIA DEL TEST (AREA GRIGIA AREA DI ERRORE)

• IL PUNTO DI MASSIMO DELLA CURVA E’ QUELLO PIU’ VICINO ALL’ANGOLO IN ALTO A SINISTRA, IN QUESTO PUNTO SI MASSIMIZZANO CONTEMPORANEAMENTE SENSIBILITA’ E SPECIFICITA’

•NON SEMPRE SIAMO INTERESSATI AL PUNTO DI

MASSIMO DELLA CURVA, NEI TEST DI SCREENING

PER CANCRO INFATTI SI PREDILIGONO SOGLIE CHE

MASSIMIZZANO LA SENSIBILITA’ A SCAPITO DI

MOLTI FALSI POSITIVI CHE VERRANNO

DIAGNOSTICATI IN MANIERA CORRETTA CON

SUCCESSIVI TEST

•NEL CASO DI TEST MISURATI SU SCALA CONTINUA

LA CURVA ROC E’ FONDAMENTALE PER

IDENTIFICARE I VALORI OTTIMI DI CUT-OFF

Curve di ROC area

sotto la curva AUC

Documents

STATISTICA MEDICA STATISTICA... · • Se il test preso in esame ha dato risultato positivo, quale è la probabilità che il paziente sia effettivamente malato? • Se il test preso