41
1 Unità 12 Probabilità condizionata Teorema di Bayes Classificazione bayesiana

Unità 12

  • Upload
    winona

  • View
    27

  • Download
    0

Embed Size (px)

DESCRIPTION

Unità 12. Probabilità condizionata Teorema di Bayes Classificazione bayesiana. PROBABILITÀ E PROCESSI DECISIONALI SEMPLICE DEFINIZIONE DI DIAGNOSI CLINICA PRESUPPOSTI: Studio del quadro nosografico del paziente Conoscenza della descrizione nosologica delle varie malattie - PowerPoint PPT Presentation

Citation preview

Page 1: Unità  12

1

Unità 12

Probabilità condizionata

Teorema di Bayes

Classificazione bayesiana

Page 2: Unità  12

2

PROBABILITÀ E PROCESSI DECISIONALIPROBABILITÀ E PROCESSI DECISIONALI

SEMPLICE DEFINIZIONE DI DIAGNOSI CLINICA

PRESUPPOSTI:

Studio del quadro nosografico del pazienteStudio del quadro nosografico del paziente

Conoscenza della descrizione nosologica delle varie malattieConoscenza della descrizione nosologica delle varie malattie

Soddisfatti i due presupposti sarà possibile prendere decisioni circa il tipo di malattia che meglio si adatta ai dati conosciuti dal medico che dovrà effettuare la diagnosi (informazioni e conoscenze possedute).

In realtà il processo diagnostico è un processo decisionale complesso ed esistono differenti tipi di approccio alla diagnosi.

Di seguito sono definiti tre possibili diversi approcci alla diagnosi.

Page 3: Unità  12

3

A. APPROCCIO CAUSALEA. APPROCCIO CAUSALE

Esempio.Dati in possesso del medico: tetania, calcio basso e recente tiroidectomia parziale.Diagnosi: ipoparatiroidismo.Infatti: tetania ipocalcemia asportazione accidentale paratiroidi.

B. APPROCCIO DEL TIPO RICONOSCIMENTO DEL MODELLOB. APPROCCIO DEL TIPO RICONOSCIMENTO DEL MODELLO

Esempio.Dati in possesso del medico: febbre, un ginocchio tumefatto e dolente, sfregamento pericardico, alto tasso di antistrepotisine.Diagnosi: febbre reumatica.Il quadro corrisponde infatti alla descrizione presente nei manuali.

C. APPROCCIO PROBABILISTICO O BAYESIANOC. APPROCCIO PROBABILISTICO O BAYESIANO

Esempio.Dati in possesso del medico: paziente con dolori colici e clisma opaco che ha evidenziato un restringimento del colon.Diagnosi: cancro del colon.In realtà, in presenza di questo quadro, c’è un’alta probabilità (non una certezza assoluta) di cancro al colon.

Page 4: Unità  12

4

INSIEMI

Un insiemeinsieme è una collezione di oggetti, detti membrimembri o

elementielementi.

Simbolismo

Gli insiemi saranno normalmente indicati con lettere

maiuscole (AA, BB, CC, ecc.), mentre i loro elementi saranno

indicati con lettere minuscole (a, b, c, ecc.).

Il simbolo indica appartenenzaappartenenza (es.: aB), mentre indica

non appartenenzanon appartenenza (es.: aC).

Page 5: Unità  12

5

Metodi di definizione di un insieme

Un insieme può essere definito:

elencando i suoi elementi (metodo della tabellametodo della tabella);

descrivendo le proprietà dei suoi elementi (metodo della metodo della proprietàproprietà).

SOTTOINSIEMI

Se ogni elemento di A appartiene a B allora A è un sottoinsieme di B (si utilizza il simbolismo AB [si legge A è contenuto in B] oppure BA [B contiene A]).

Se AB e BA allora A e B sono uguali (A = B).

N.B. A è un sottoinsieme proprio di B quando AB e AB.

Page 6: Unità  12

6

INSIEME TOTALE E INSIEME VUOTOINSIEME TOTALE E INSIEME VUOTO

Verranno considerati sottoinsiemi di un particolare insieme che verrà detto universouniverso. Riferendoci a questo insieme lo chiameremo anche l’insieme totaleinsieme totale o lo spaziospazio e lo indicheremo con UU. Gli elementi dello spazio saranno detti anche punti dello spaziopunti dello spazio.

Un insieme privo di elementi è detto insieme vuotoinsieme vuoto (o insieme insieme nullonullo) ed è indicato con il simbolo .

I DIAGRAMMI DI VENNI DIAGRAMMI DI VENN

Un universo U può essere geometricamente rappresentato mediante l’insieme dei punti interni ad un rettangolo, mentre un sottoinsieme di U è rappresentato dall’insieme dei punti interni ad una circonferenza. I diagrammi così ottenuti (detti diagrammi di Venndiagrammi di Venn) sono spesso utili per indicare intuitivamente le relazioni fra insiemi.

Page 7: Unità  12

7

OPERAZIONI INSIEMISTICHE

1.1. UnioneUnione. L’insieme di tutti gli elementi (o punti) che appartengono ad A oppure a B oppure ad entrambi è detto l’unione di A e B ed è indicato come AABB (ombreggiato in figura sotto).

2.2. IntersezioneIntersezione. L’insieme di tutti gli elementi che appartengono sia ad A sia a B è detto l’intersezione di A e B ed è indicato con AABB (ombreggiato in figura sotto).

Se AB=, allora A e B sono detti insiemi disgiunti.

Page 8: Unità  12

8

3.3. DifferenzaDifferenza. L’insieme di tutti gli elementi di A che non appartengono a B è detta la differenza fra A e B ed è indicata con A – BA – B (ombreggiato in figura sotto).

4.4. ComplementoComplemento. Il complemento dell’insieme A è l’insieme dei

punti di U che non appartengono ad A e verrà indicato con A’A’

(ombreggiato in figura sotto). Si noti che A’ = A’ = UU – A – A.

Page 9: Unità  12

9

ESPERIMENTI CASUALI

Pensando ai classici esperimenti che lo studente ha fatto nei laboratori di chimica e/o di fisica, non è immediato rendersi conto della variabilità dei dati di tipo biomedicovariabilità dei dati di tipo biomedico. Infatti, ad esempio, se si immerge ripetutamente una cartina blu di tornasole in una soluzione acida, essa si colora di rosso il 100% delle volte, non nella maggior parte (diciamo il 95%) dei casi. In questo caso è valido il principio fondamentale secondo cui, se si esegue ripetutamente l’esperimento nelle medesime condizioni, si arriva a risultati che sono essenzialmente uguali.

Ci sono tuttavia esperimenti che, nonostante siano condotti nelle medesime condizioni, portano a risultati diversi. Esperimenti di questo tipo sono detti casualicasuali. Ad esempio, se si somministra aspirina ad un gruppo di persone affette da cefalea, non tutti ne trarranno un beneficio sintomatico. Allo stesso modo il risultato ottenuto lanciando un dado o una moneta non è sempre lo stesso.

Page 10: Unità  12

10

SPAZIO DEI CAMPIONI

Un insieme SS contenente tutti i possibili risultati di un esperimento casuale è detto lo spazio dei campionispazio dei campioni e ciascun risultato è detto un punto campione. In pratica, con riferimento ad un esperimento

casuale, S corrisponde all’insieme totale dei risultati dell’esperimento.

Lo spazio dei campioni è detto finito se contiene un numero finito di punti.

Lo spazio dei campioni è detto numerabile se i suoi punti possono essere numerati (messi in relazione con i numeri naturali).

Lo spazio dei campioni è più che numerabile se i punti sono quelli contenuti in un determinato intervallo (ad esempio l’intervallo [0,1]).

Uno spazio dei campioni finito o numerabile è detto discretodiscreto.

Uno spazio dei campioni più che numerabile è detto continuocontinuo.

Page 11: Unità  12

11

EVENTIEVENTI

Un evento è un sottoinsieme A dello spazio dei campioni

S, cioè dei risultati possibili.

Se il risultato di un esperimento è un elemento di A, si dirà che l’evento A si è verificatosi è verificato.

Un evento può consistere di uno o più punti; se consiste di un solo punto è detto semplicesemplice o elementareelementare.

SS è l’evento sicuroevento sicuro o certocerto, mentre è l’evento impossibileevento impossibile.

Dal momento che gli eventi sono insiemi, ogni affermazione concernente gli eventi può essere traslata nel linguaggio della teoria degli insiemi e viceversa.

Page 12: Unità  12

12

Usando le operazioni insiemistiche sugli eventi di S, si possono

definire nuovi eventi di S. Così, dati gli eventi A e B, possiamo definire:

AAB come l’evento “A oppure B o entrambi”;B come l’evento “A oppure B o entrambi”;

AAB come l’evento “sia A sia B”;B come l’evento “sia A sia B”;

A’ come l’evento “non A”;A’ come l’evento “non A”;

A – B come l’evento “A ma non B”.A – B come l’evento “A ma non B”.

Se gli insiemi corrispondenti agli eventi A e B sono disgiunti, cioè se AB=, si dirà che gli eventi A e B sono mutuamente mutuamente esclusiviesclusivi. In altre parole, due eventi sono mutuamente In altre parole, due eventi sono mutuamente esclusivi quando non possono verificarsi esclusivi quando non possono verificarsi contemporaneamente.contemporaneamente.

Page 13: Unità  12

13

ESEMPIO

Si consideri l’esperimento consistente nel doppio lancio di una moneta. Indichiamo con A l’evento “si presenta almeno una testa” e con B l’evento “il risultato del secondo lancio è croce”. Allora:

A = {TC,CT,TT}

B = {TC,CC}

ed anche:

AB = {TC,CT,TT,CC} = S

AB = {TC}

A’ = {CC}

A-B = {CT,TT}

Page 14: Unità  12

14

IL CONCETTO DI PROBABILITÀ

In ogni esperimento casuale non si sa mai se un determinato evento si presenterà oppure no. Per misurare questa chancechance o probabilitàprobabilità è conveniente allora assegnargli un numero un numero compreso fra 0 e 1compreso fra 0 e 1 (o, in modo equivalente, fra 0 e 100%).

Se siamo sicuri che l’evento si presenterà, diremo che la sua probabilità è pari a 1 (o al 100%), mentre se siamo sicuri che l’evento non si verificherà, diremo che la sua probabilità è 0.

Se poi, ad esempio, la probabilità di un evento è 0,3, diremo che c’è una probabilità del 30% che l’evento si verifichi e del 70% che non si verifichi.

Esistono diversi approcci per definire la probabilità di un evento.

Page 15: Unità  12

15

1. APPROCCIO CLASSICO O A PRIORI1. APPROCCIO CLASSICO O A PRIORISe un evento si può verificare in hh modi diversi su nn possibili, essendo questi tutti ugualmente possibili, allora la probabilità di tale evento è hh//nn.

2. APPROCCIO FREQUENTISTICO O A POSTERIORI2. APPROCCIO FREQUENTISTICO O A POSTERIORISe, dopo avere ripetuto nn volte un esperimento (n deve essere n deve essere molto grandemolto grande) un evento si è verificato hh volte, allora la probabilità di questo evento è h/nh/n. Questa probabilità è anche detta probabilità empirica di un evento.

3. APPROCCIO ASSIOMATICO3. APPROCCIO ASSIOMATICOSia l’approccio classico sia quello frequentistico vanno incontro a serie difficoltà: il primo a causa dell’espressione “ugualmente possibile” e il secondo per avere supposto “n molto grande”. Per queste difficoltà i matematici preferiscono un approccio assiomatico alla probabilità, che si basa su un modello che parte dalla si basa su un modello che parte dalla definizione di tre assiomi ed impiega la teoria degli insiemidefinizione di tre assiomi ed impiega la teoria degli insiemi.

Page 16: Unità  12

16

GLI ASSIOMI DELLA PROBABILITÀGLI ASSIOMI DELLA PROBABILITÀ

Si supponga di avere uno spazio dei campioni S. A ciascun evento A ciascun evento

AA si associa un numero reale si associa un numero reale PP(A)(A), detto , detto probabilità dell’evento Aprobabilità dell’evento A..

PP sarà chiamata sarà chiamata funzione di probabilitàfunzione di probabilità e dovranno essere e dovranno essere soddisfatti i seguenti assiomi.soddisfatti i seguenti assiomi.

ASSIOMA 1.ASSIOMA 1. Per ogni evento A si ha P(A)0.

ASSIOMA 2.ASSIOMA 2. Per l’evento certo S si ha P(S)=1.

ASSIOMA 3.ASSIOMA 3. Per ogni numero di eventi mutuamente esclusivi A1,

A2, A3,.... si ha:

PP(A(A11AA22AA33...) = ...) = PP(A(A11) + ) + PP(A(A22) + ) + PP(A(A33) +....) +....

In particolare per due eventi A1 e A2 mutuamente esclusivi si ha:

PP(A(A11AA22) = ) = PP((AA11) + ) + PP(A(A22))

Page 17: Unità  12

17

ALCUNI IMPORTANTI TEOREMI SULLA PROBABILITÀ

TEOREMA 1.TEOREMA 1. Per ogni evento A si ha 0P(A)1.

TEOREMA 2.TEOREMA 2. PP(()=0)=0.

TEOREMA 3.TEOREMA 3. Se A=A1A2....AN ed A1, A2, ...., AN sono mutuamente

esclusivi allora P(A)=P(A1)+P(A2)+ ....+P(AN).

In particolare, se A = S allora P(A1)+P(A2)+ ....+P(AN) = 1.

TEOREMA 4.TEOREMA 4. Se A e B sono due eventi qualunque, allora

PP(A(AB) = B) = PP(A)+(A)+PP(B)–(B)–PP(A(AB)B).

TEOREMA 5.TEOREMA 5. PP(A’)=1–(A’)=1–PP(A)(A).

TEOREMA 6.TEOREMA 6. Se A1A2 allora PP(A(A11))PP(A(A22)) e PP(A(A22–A–A11)=)=PP(A(A22)–)–PP(A(A11)).

TEOREMA 7.TEOREMA 7. Se un evento A segue da uno degli eventi mutuamente esclusivi A1, A2, ...., AN allora

PP(A)=(A)=PP(A(AAA11)+)+PP(A(AAA22)+ ....+)+ ....+PP(A(AAANN)).

Page 18: Unità  12

18

ASSEGNAZIONE DI PROBABILITÀASSEGNAZIONE DI PROBABILITÀ

Se uno spazio dei campioni S contiene solo n eventi elementari A1, A2, ...., An, allora per il teorema 3 vale la relazione

P(A1) + P(A2) + .... + P(An) = 1

Ne consegue che è possibile scegliere arbitrariamente qualunque numero non negativo come probabilità di questi eventi elementari, purché sia soddisfatta la relazione riportata sopra.

Una particolare scelta è quella di supporre gli n eventi elementari equiprobabili, ovvero PP(A(Aii) = 1/) = 1/n n per i=1, 2, ..., n. In questo caso, se A è un qualunque evento formato a partire da hh di tali eventi semplici, si ha:

PP(A) = (A) = hh//nn

N.B. Una tale procedura equivale ad utilizzare l’approccio classico o a priori.

Page 19: Unità  12

19

Naturalmente è possibile usare procedure diverse da quella sopra descritta per assegnare le probabilità. Ad esempio si potrebbe scegliere di assegnare le probabilità ai singoli eventi elementari:

☐☐ utilizzando l’approccio frequentistico o a posteriori,

☐☐ utilizzando conoscenze che si hanno sul problema in esame,

☐☐ facendo ipotesi ragionevoli sulla probabilità che si intende assegnare ai vari eventi elementari.

Un’assegnazione di probabilità costituisce un modello matematico la cui validità deve essere verificata sperimentalmente.

Page 20: Unità  12

20

ESEMPIO

In un problema di genetica si suppone che ci siano solo due alleli diversi AA e aa in una certa posizione. Si accoppia il genotipo AaAa e AaAa secondo la seguente regola:

Page 21: Unità  12

21

Una regola della genetica afferma che le quattro combinazioni AAAA, AaAa, aAaA, aaaa sono ugualmente probabiliugualmente probabili. Questa conoscenza che si ha sul problema ci permette di assegnare ad ognuna delle precedenti combinazioni una probabilità pari a ¼.una probabilità pari a ¼.

Va però tenuto conto anche del fatto che i due accoppiamenti AaAa e aAaA non possono essere distinti biologicamentenon possono essere distinti biologicamente, per cui queste combinazioni costituiranno un unico evento che verrà semplicemente indicato con AaAa e che corrisponde ad una combinazione AaAa o aAaA.

Dato che le due combinazioni AaAa e aAaA sono mutuamente esclusive, la probabilità dell’evento unione delle due sarà

P(Aa) = ¼ + ¼ = ½P(Aa) = ¼ + ¼ = ½

Il risultato dell’incrocio AaAa xx AaAa è quindi caratterizzato dalle probabilità:

P(AA) = ¼ = 0,25 P(Aa) = ½ =0,50 P(aa) = ¼ = 0,25P(AA) = ¼ = 0,25 P(Aa) = ½ =0,50 P(aa) = ¼ = 0,25

Page 22: Unità  12

22

PROBABILITÀ CONDIZIONATA

Siano A e B due eventi (figura sotto) tali che P(A)>0.

Si denoti con Si denoti con PP(B(BA)A) la probabilità dell’evento B quando si la probabilità dell’evento B quando si suppone che A si sia verificato.suppone che A si sia verificato.

Dal momento che A si è verificato, A diviene il nuovo spazio dei

campioni in sostituzione di S. Da questa considerazione siamo condotti alla seguente definizione

PP(B(BA) = A) = PP(A(AB)/B)/PP(A)(A) PP(A(AB) = B) = PP(A)·(A)·PP(B(BA)A)

PP(B(BA) è detta A) è detta probabilità di B condizionata ad Aprobabilità di B condizionata ad A

Page 23: Unità  12

23

ESEMPIO 1

Dato un mazzo di carte (52 carte), eliminiamo dal mazzo le sei carte di quadri più basse. Rimarranno 46 carte di cui 7 carte sono quadri (insieme A) e 12 sono figure (insieme B).

Lo spazio dei campioni S è l’insieme di tutte le 46 carte, mentre il sottoinsieme AB è formato da 3 elementi (le 3 figure di quadri).

Page 24: Unità  12

24

Da quanto detto è possibile trarre le seguenti conclusioni:

☐☐ probabilità di estrarre una carta di quadri PP(A) = 7/46(A) = 7/46;

☐ ☐ probabilità di estrarre una figura PP(B) = 12/46(B) = 12/46;

☐☐ probabilità condizionata di una figura data una carta di quadri

PP(B(BA) = A) = PP(B(BA)/A)/PP(A) = (3/46)/(7/46)=3/7(A) = (3/46)/(7/46)=3/7

☐☐ probabilità condizionata di una carta di quadri data una figura

PP(A(AB) = B) = PP(A(AB)/B)/PP(B) = (3/46)/(12/46)=1/4(B) = (3/46)/(12/46)=1/4

OSSERVAZIONE IMPORTANTE.OSSERVAZIONE IMPORTANTE. È immediato notare che:

PP(A(AB) B) PP(B(BA)A)

e inoltre: PP(A(AB) = B) = PP(A) (A) PP(B(BA) = A) = PP(B) (B) PP(A(AB)B)

Page 25: Unità  12

25

ESEMPIO 2

Si consideri la probabilità di morte nella nostra società. La tabella sotto ci fornisce qualche informazione.

In base a questi dati quale è la probabilità che una persona di 20 anni muoia prima di raggiungere i 30 anni?

Page 26: Unità  12

26

È chiaro che non possiamo prendere semplicemente il quoziente di mortalità del terzo decennio riportato in tabella. Dobbiamo infatti trovare una probabilità condizionata P(BA), tenendo conto che la persona in esame è già sopravvissuta per 20 anni.

Quindi lo spazio dei campioni AA a cui si deve fare riferimento consiste nell’evento morti dopo il secondo decenniomorti dopo il secondo decennio. Dalla tabella precedente ricaviamo dunque:

PP(A) = 1,21 + 1,84 + 4,31 + 9,69 + 18,21 + 27,28 + 33,58 = 96,12(A) = 1,21 + 1,84 + 4,31 + 9,69 + 18,21 + 27,28 + 33,58 = 96,12

BB indicherà l’evento morto prima del quarto decenniomorto prima del quarto decennio.

AABB è l’evento intersezione che ci interessa nel calcolo della probabilità condizionata che si vuole valutare. La probabilità di La probabilità di questo evento è quella riportata in tabella nella classe di età questo evento è quella riportata in tabella nella classe di età 20-30 anni, cioè 20-30 anni, cioè 1,21%1,21%..

Page 27: Unità  12

27

In conclusione si ha:

PP(B(BA) = A) = PP(A(AB)/B)/PP(A) = 1,21/96,12 = 0,0126 = 1,26%(A) = 1,21/96,12 = 0,0126 = 1,26%

Page 28: Unità  12

28

TEOREMI SULLA PROBABILITÀ CONDIZIONATA

TEOREMA 1.TEOREMA 1. Per 3 eventi qualunque A, B, C vale la relazione

PP(A(ABBC) = C) = PP(A) (A) PP(B(BA) A) PP(C(CAAB)B)

Il teorema si generalizza facilmente a n eventi.

TEOREMA 2.TEOREMA 2. Se un evento A segue da uno degli eventi

A1, A2,...., An, tra loro mutuamente esclusivi, allora

PP(A) = (A) = PP(A(A11) ) PP(A(AAA11) + ) + PP(A(A22) ) PP(A(AAA22) + .... + ) + .... + PP(A(Ann) ) PP(A(AAAnn))

Page 29: Unità  12

29

EVENTI INDIPENDENTI

Se, dati due eventi A e B, P(BA) = P(B) allora diremo che A e B sono eventi indipendentieventi indipendenti. In questo caso si ha:

PP(A(AB) = B) = PP(A) (A) PP(B)(B)

Inversamente se vale la precedente relazione, allora A e B sono eventi indipendenti.

Più in generale, presi tre eventi A1, A2, A3, essi sono indipendenti se:

• sono indipendenti a due a due, ovvero

PP(A(AiiAAjj) = P(A) = P(Aii) P(A) P(Ajj)) con ij e i, j=1,2,3

• e, inoltre,

PP(A(A11AA22AA33) = ) = PP(A(A11) ) PP(A(A22) ) PP(A(A33))

Le due precedenti condizioni devono valere contemporaneamente perché i tre eventi siano indipendenti.

Anche in questo caso è facile generalizzare a più di tre eventi.

Page 30: Unità  12

30

REGOLA O TEOREMA DI BAYES

Si supponga che A1, A2, ...., An siano eventi mutuamente esclusivi,

la cui unione è lo spazio dei campioni SS (uno di questi eventi si deve perciò necessariamente verificare).

Se allora A è un generico evento, vale il seguente teorema

Questo teorema (regola di Bayesregola di Bayes) ci permette di calcolare le probabilità degli eventi A1, A2, ...., An che possono essere la

causacausa del verificarsi dell’evento A.

n

iii

kkk

AAPAP

AAPAPAAP

1

)|()(

)|()()|(

Page 31: Unità  12

31

Per questa ragione il teorema di Bayes è anche conosciuto come un teorema che tratta delle

probabilità delle causeprobabilità delle cause.

N.B. Già nell’esempio delle carte si era trovato il teorema di

Bayes nella sua formulazione più sempliceformulazione più semplice; avevamo infatti

osservato che

)(

)|()()|(

AP

BAPBPABP

Page 32: Unità  12

32

TEOREMA DI BAYES ED ESPERIENZA CLINICA

L’esempio delle carte da gioco interessa da vicino il processo diagnostico che si basa sull’approccio probabilistico o bayesiano.

Infatti nei testi di medicina interna si può trovare l’informazione che una certa percentuale di pazienti sofferenti di una malattia presentano particolari caratteri nosograficicaratteri nosografici.

Tale informazione rappresenta, da un punto di vista formale, una probabilità condizionata del tipo P(A|B)P(A|B) dove A è un certo tipo di carattere nosografico e B una determinata malattia.

Page 33: Unità  12

33

ESEMPIOESEMPIO

L’emottisi è il sintomo iniziale del 10% dei casi di cancro del polmone, per cui si ha:

PP(emottisi|cancro del polmone) = 0,10(emottisi|cancro del polmone) = 0,10

Questa probabilità condizionata rappresenta una probabilità nosologica ed ha uno scarso valore diretto.

Infatti il medico si trova di fronte ad un problema differente:

Un paziente ha avuto emottisi. Quale è la probabilità che esso abbia un cancro del polmone?

Page 34: Unità  12

34

Questa seconda probabilità condizionata rappresenta una probabilità diagnosticaprobabilità diagnostica, che può essere calcolata può essere calcolata usando il teorema di Bayesusando il teorema di Bayes.

Infatti, indicato con A l’evento emottisi e con B l’evento cancro del polmone, la probabilità diagnostica che il medico vuole valutare può essere ricavata come:

Il calcolo della probabilità diagnostica P(cancro del polmone|emottisi) richiede quindi di conoscere, oltre alla probabilità nosologica P(emottisi|cancro del polmone), anche le due probabilità assolute P(cancro del polmone) e P(emottisi).

Se le conoscenze del medico sulle P(cancro del polmone) e P(emottisi) sono imprecise anche la stima della probabilità diagnostica P(cancro del polmone|emottisi) sarà scarsamente precisa e quindi inutile dal punto di vista clinico.

)(

)|()()|(

AP

BAPBPABP

Page 35: Unità  12

35

Teorema di Bayes e test diagnostici

È noto che la valutazione della validità di un test diagnostico viene effettuata sottoponendo al test stesso un gruppo di soggetti sicuramente affetti dalla malattia (MM++) ed un gruppo di soggetti sicuramente non affetti da tale patologia (MM––).

I risultati ottenuti possono essere schematizzati nella seguente tabella 2x2, dove con TDTD++ e TDTD–– si intende rispettivamente la positività o negatività al test diagnostico.

Page 36: Unità  12

36

aa è il numero di pazienti veri positivi (VP)veri positivi (VP);

bb è il numero di pazienti falsi positivi (FP)falsi positivi (FP);

cc è il numero di pazienti falsi negativi (FN)falsi negativi (FN);

dd è il numero di pazienti veri negativi (VN)veri negativi (VN).

La sensibilità del test (SE)sensibilità del test (SE) è stimata come

mentre la specificità (SP)specificità (SP) è

100

FNVP

VPSE

100

FPVN

VNSP

Page 37: Unità  12

37

SESE rappresenta dunque la probabilità di risultare positivi al test sotto la condizione di essere malati, mentre SPSP è la probabilità di risultare negativi al test sotto la condizione di non essere malati.

Esse sono cioè probabilità condizionateprobabilità condizionate ed esattamente

Analogamente a quanto visto per la specificità e sensibilità possiamo concludere che anche il valore predittivo positivo (VPP)valore predittivo positivo (VPP) e il valore valore predittivo negativo (VPN)predittivo negativo (VPN) del test diagnostico sono probabilità condizionate. In particolare

)|()|( MTDPSPMTDPSE

)|(100

)|(100

TDMPFNVN

VNVPN

TDMPFPVP

VPVPP

Page 38: Unità  12

38

VPPVPP è pertanto la probabilità di essere malato, sotto la condizione di risultare positivo al test diagnostico, mentre VPNVPN è la probabilità di non essere affetto dalla patologia in studio, sotto la condizione di risultare negativo al test diagnostico.

Applicando il teorema di Bayes si ha

Si può inoltre notare che P(M+) è la prevalenza vera della malattia (PVPV) e che P(M –) sarà uguale a 1 – P(M+).

)|()()|()(

)|()(

)(

)|()()|(

MTDPMPMTDPMP

MTDPMP

TDP

MTDPMPTDMP

)|()()|()(

)|()(

)(

)|()()|(

MTDPMPMTDPMP

MTDPMP

TDP

MTDPMPTDMP

Page 39: Unità  12

39

Infine è immeditato vedere che:

Tutto ciò ci porta a trovare le seguenti relazioni che legano Tutto ciò ci porta a trovare le seguenti relazioni che legano sensibilità, specificità, valore predittivo positivo, valore predittivo sensibilità, specificità, valore predittivo positivo, valore predittivo negativo e prevalenza in un test diagnostico.negativo e prevalenza in un test diagnostico.

Emerge quindi che VPP e VPN dipendono non solo da SE e da SP, Emerge quindi che VPP e VPN dipendono non solo da SE e da SP, ma anche dalla prevalenza della malattia in studio.ma anche dalla prevalenza della malattia in studio.

)|(1)|()|(1)|( MTDPMTDPMTDPMTDP

)1()1(

)1(

)1()1(

SEPVSPPV

SPPVVPN

SPPVSEPV

SEPVVPP

Page 40: Unità  12

40

CLASSIFICATORI BAYESIANI

L’applicazione del teorema di Bayes per calcolare il VPP ed il VPN di test diagnostici è un semplice esempio di classificatore bayesiano.

Più in generale, un classificatore bayesianoclassificatore bayesiano è un modello che, utilizzando il teorema di Bayes, classifica un paziente in una determinata classe.

Il classificatore bayesiano ha prestazioni ottimaliprestazioni ottimali, cioè minimizza il rischio di errata classificazione.

OSSERVAZIONE La regola di Bayes implica la conoscenza delle probabilità assolute (a priori) e condizionate relative al problema. Queste non sono però note nella pratica clinica.

Page 41: Unità  12

41

Nella pratica, non conoscendo le probabilità relative al problema, si cerca di stimarlestimarle utilizzando i dati a disposizione.

Facendo riferimento all’esempio precedente, i valori di PVPV, SESE e SPSP sono stimati basandosi sui dati misurati nel campione impiegatostimati basandosi sui dati misurati nel campione impiegato.

Quando è possibile ottenere stime affidabili delle probabilità coinvolte nel teorema, il classificatore bayesiano è un buon modello da utilizzare in ambito clinico.

Nel linguaggio comune, con il termine classificatore bayesiano ci si riferisce spesso al classificatore bayesiano naifclassificatore bayesiano naif (Naive Bayes Classifier), ossia ad un classificatore bayesiano semplificato con un modello di probabilità sottostante che fa l'ipotesi di indipendenza delle feature (variabili misurate sul paziente).

In queste ipotesi semplificate (dette appunto naif o anche idiot), il modello è di solito facilmente realizzabile.