Transcript
Page 1: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

- Il significato di probabilità- Cenni di calcolo combinatorio- Cenni di calcolo combinatorio- Cenni di calcolo delle probabilità

Page 2: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Un trial clinico ha mostrato che 50 pazienti che ricevono il farmaco A per una malattia guariscono più velocemente (in media) di 50 pazienti che ricevono il farmaco B.

(1) E' giusto affermare, in generale, che A è migliore di B per curare questa malattia?

(2) Il medico dovrà usare in futuro A piuttosto che B per trattare al meglio i suoi pazienti?

(1) Domanda di tipo "inferenziale": quali conclusioni possono essere tratte dal campionerispetto alla popolazione da cui è stato estratto?

(2) Domanda è di tipo "decisionale":qual è la scelta piu' razionale per il futuro trattamento, tenendo conto dell'informazione offerta dal trial?

Page 3: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Le risposte ad entrambe le domande, e a tutte le domanderiguardanti studi campionari, sono caratterizzate da un certo livello diincertezza.

Ci puo' essere infatti un' indicazione dal campione che A sia migliore di B, ma…possiamo essere certi che i pazienti che hanno ricevuto B non fossero piu' gravemente malati di quelli che hanno ricevuto A, e che questa variabilità tra i due gruppi non fosse il motivo per le loro differenti risposte?

Le risposte alle domande devono quindi essere formulate in termini di 'incertezza‘:se l'incertezza è bassa, la conclusione campionaria sarà affidabile e la decisionesarà sicura. Se viceversa l'incertezza è alta, l'esperimento sarà considerato non conclusivo e non sarà di aiuto nella decisione.

Per avere una 'misura dell'incertezza' di un risultato campionario, lo strumento matematico appropriato è la teoria della probabilità .

Page 4: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Definizione di probabilità

Se una moneta viene lanciata un grande numero di volte e si guarda l’esito di ogni lancio i risultati potrebbero presentarsi come segue:

TTCTCCTCTTTCTCCTCCCCTTC....T=testa; C=croce

La probabilità rappresenta in termini matematici i fenomeni caratterizzati da comportamenti variabili

T=testa; C=croce

Tale sequenza è definita una sequenza casuale o una sequenza random; ogni posto nella sequenza rappresenta una prova o estrazione (trial) ed ogni risultato del lancio viene definito come un evento.

Una sequenza random è caratterizzata dal fatto che non è possibile predire (indovinare) l'evento successivo sulla base dei precedenti.

La probabilità di avere ‘croce’ in un certo passo è la stessa che ad ogni altro, e non è influenzata da cio' che è successo prima

Page 5: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Quanti piu' lanci vengono fatti tanto piu' le proporzioni (frequenze) di un evento edell'altro, diventano sempre meno variabili e sempre piu' vicine ad un valore limite:tale proporzione 'di lungo periodo' viene definita probabilità dell'evento.

La frequenza di ‘testa’ tende ad avvicinarsi al valore ½, e sarebbe ragionevole affermare che:“ la probabilità di Testa è di circa ½”.Poiché la moneta è simmetrica (una faccia è testa, l’altra è croce), lo avremmo intuito anchesenza dover effettuare alcun esperimento…a meno che la moneta non fosse stata “truccata”!!

Page 6: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

La definizione “classica” di probabilità è:

La probabilità di un evento è data dal rapporto tra il numero dei casi favorevoli all’evento ed il numero dei casi possibili , purchè questi ultimi siano tutti ugualmente probabili .

Per la moneta i casi possibili sono 2 (testa o croce) e quindi la probabilità che esca testa (o che esca croce) è pari ad 1/2.

Limite “concettuale” di questa definizione:per definire la probabilità occorre sapere preliminarmente che cosasignifica che due casi sono ugualmente probabili, cioè sapere già che cosa è laprobabilità!

Page 7: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Un’altra definizione di probabilità è nota come la legge empirica del caso:

In una successione di prove fatte nelle stesse condizioni, la frequenza di un evento si avvicina alla probabilità dell’evento stesso, e l’approssimazionetende a migliorare con l’aumentare del numero delle prove.

E quindi, secondo questa definizione “frequentista”:

“La probabilità di un evento è il limite della frequ enza (relativa) dei successi(cioè delle prove in cui l’evento si verifica) quan do il numero delle provetende all’infinito”.tende all’infinito”.

La probabilità dell’evento Testa sarà quindi data dal rapporto tra il numero delle prove favorevoli all’evento ed il numero totale delle prove: all’aumentare del numero dei lanci tale frequenza tende a ½ .

Page 8: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Anche questa definizione di probabilità è pero’ alquanto criticabile:in generale, non potremo mai osservare una sequenza infinita di prove !!

..e se osserviamo solo una ‘parte’ di sequenza non possiamo affermare con precisione la probabilità di un certo evento, perchè la probabilità, come si è detto, è una proprietà a lungo termine…

…in pratica, il concetto di sequenza 'infinita' deve essere interpretato come unacornice teorica ideale che pero' descrive in modo soddisfacente alcuni fenomenianche a livello campionario.anche a livello campionario.

Per esempio: se si lancia un dado la frequenza relativa di ogni singola faccia del dado, da 1 a 6, è circa pari ad 1/6 in una lunga successione di lanci; per ogni nuovo nato la probabilità che sia maschio (o femmina) oscilla intorno a ½…

Page 9: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Complichiamo un po’ la faccenda…

Qual è la probabilità che il fumo contribuisca al cancro al polmone

?

Difficile rispondere in termini di una sequenza casuale di 'prove' in cui in alcune il fumo è una causa di cancro al polmone ed in altre no…

Page 10: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

La probabilità è la misura del grado di fiduciache si ha sulla verità di un'affermazione .

Definizione “soggettiva” di probabilità:

In altri termini, e usando il linguaggio delle scommesse:

Indipendentemente da quale sia la definizione di probabilità che usiamo, abbiamo bisogno di strumenti matematici per poterla calcolare ed applicare in pratica !!!

La probabilità di un evento è il prezzo che un individuo ritiene equopagare per ricevere 1 se l’evento si verifica, e 0 se l’evento non si verifica. Le probabilità degli eventi devono essere attribuite in modo tale che non sia possibile ottenere con un insieme di scommesse una vincita certa o una perdita certa.

Page 11: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

La probabilità si misura con un numero tra 0 e 1:- se un evento non capita mai - in nessuno dei trials della sequenzarandom- la sua probabilità è 0.- se un evento capita sempre - in tutti i trials della sequenza random-la sua probabilità è 1.

Quando gli eventi si fanno più complessi, la valutazione della probabilità richiede nozioni di calcolo combinatoriorichiede nozioni di calcolo combinatorio

Parliamo di: • permutazioni• disposizioni semplici o con ripetizione• combinazioni

Page 12: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Cenni di calcolo combinatorio: permutazioni

Le permutazioni sono come gli anagrammi ed indicano in quanti modi (ordinamenti) diversi possono essere presi n oggetti.

Le permutazioni di n elementi sono date dallo ‘sviluppo fattoriale’ di n (ossia n è moltiplicato per tutti i numeri interi inferiori ad n).

…ad esempio, date 4 lettere (ABCD), in quanti ordini si possono presentare (ABCD, BACD, DACB, ....)?BACD, DACB, ....)?

...*)3(*)2(*)1(*! −−−= nnnnn

241*2*3*4!4 ==

Page 13: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Cenni di calcolo combinatorio: disposizioni (I)

Disposizioni semplici:

Sono le possibili scelte di k elementi ordinati da un insieme composto da n oggetti (disposizioni di n elementi di classe k).

Ad esempio, quali sono i possibili podi (1,2,3) in una gara tra 8 atleti? Al primo posto possono esserci 8 persone diverse, al secondo posto ce ne possono essere 7 e al terzo 6; le combinazioni possibili possono essere 8 x 7 x 6 = 336.

In generale:

Le disposizioni coincidono con le permutazioni se n = k.

Nota bene: 0!=1

3366*7*81*2*3*4*5

1*2*3*4*5*6*7*8

)!38(

!8 ===−

Page 14: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Cenni di calcolo combinatorio: disposizioni (II)

Disposizioni con ripetizione:

Le disposizioni con ripetizione (disposizioni con ripetizione di n elementi di classe k) sono come le disposizioni, ma ogni oggetto, dopo essere stato scelto viene rimesso nell’ insieme di partenza.

Date 10 lettere (da A a L), quante combinazioni ordinate da 4 lettere posso effettuare?

Si parla di combinazioni ordinate perchè l'ordine delle lettere conta, cioè ABCD,Si parla di combinazioni ordinate perchè l'ordine delle lettere conta, cioè ABCD,ad esempio, è diverso da BACD.

Per la prima lettera ho dieci possibilità, altrettante per la seconda e così via, cioè:

10 x 10 x 10 x 10 = 104 = 10'000

In generale, le disposizioni con ripetizione di n elementi di classe k sono:kn

Page 15: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Cenni di calcolo combinatorio: combinazioni

Nelle combinazioni (di n elementi di classe k, con k <= n) non viene considerato l'ordine con cui gli oggetti si presentano.

Coefficiente binomiale

Page 16: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Date le 10 (n) lettere da A ad L, le combinazioni a gruppi di 4 (k) che posso avere sono:

( ) 2107*3*101*2*3*4*1*2*3*4*5*6

1*2*3*4*5*6*7*8*9*10

!4!6

!10

!4!410

!10 ====−

In un trial clinico di tipo caso-controllo, su 10 controlli eligibili se ne devono scegliere 5. Si hanno:scegliere 5. Si hanno:

252 possibili campioni di 5 controlli.

Page 17: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Cenni di calcolo delle probabilità

Le operazioni di base del calcolo delle probabilità sono l'addizione e la moltiplicazione.

Esempio: qual è la probabilità che esca 1 oppure 3 in un lancio di un dado?

Se il dado è perfettamente bilanciato, la probabilità di 1 è 1/6,e la probabilità di 3 è 1/6.

In nessun lancio potranno uscire contemporaneamente 1 e 3.In nessun lancio potranno uscire contemporaneamente 1 e 3.

L'evento "composto" definito come: "esce la faccia 1 oppureesce la faccia 3" avverrà con probabilità: (1/6 +1/6)=1/3.

La faccia 1 e la faccia 3 non possono uscire contemporaneamente: sono due eventi mutualmente esclusivi.

Altrimenti, la regola di addizione non sarebbe stata valida.

Page 18: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Complichiamoci un po’ la vita…

Supponiamo che il nome di un infermiere/a viene estratto a caso da un registro ospedaliero di Roma, e la probabilità che l'infermiere sia maschio è di 0.4 (40%),mentre la probabilità che un infermiere/a si sia diplomato a Roma è di 0.8 (80%)…

…qual è la probabilità che l'infermiere sia maschio oppure si sia diplomato a Roma,oppure entrambe le cose?

Se le due probabilità separate venissero semplicemente addizionate, il risultato sarebbe: (0.4+0.8)=1.2, che è chiaramente un risultato sbagliatoil risultato sarebbe: (0.4+0.8)=1.2, che è chiaramente un risultato sbagliatopoichè la probabilità di un evento, anche composto, non puo' mai superare 1.

L'errore risiede nel fatto che la probabilità del doppio evento:"infermiere maschio e diplomato a Roma" è stata contata due volte,una volta come parte della probabilità di essere infermiere maschioe una volta come parte della probabilità di essere infermiere diplomato a Roma.

i due eventi NON SONO mutualmente esclusivi !!

Page 19: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Indichiamo con:

P=probabilità dell’evento;A= evento [‘infermiere maschio’]; B=evento [‘infermiere diplomato a Roma’]P(A e B)=probabilità dell’evento composto [‘infermiere maschio e diplomato a Roma’]

La forma piu' generale della regola di addizione è:

P(A o B) = P(A)+P(B)-P(A e B)

Supponiamo che la probabilità dell'evento composto P(A e B) è pari a 0.3; allora:

P(A o B)=(0.4+0.8) - 0.3=0.9.

Se i due eventi A e B sono mutualmente esclusivi, allora:

P(A e B)=0, e cosi' si ottiene la forma semplice della regola di addizione:

P(A o B)= P(A) + P(B)

Page 20: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Supponiamo adesso che ad ogni prova vengono lanciati contemporaneamenteuna moneta ed un dado: qual è la probabilità congiunta di testa (T) sulla moneta e 5come faccia sul dado?

Regola di moltiplicazione:

P(T e 5)=P(T)*P(5, dato testa)

P(5, dato testa) = ‘probabilità condizionata’

In questo particolare esempio, non c'è in realtà ragione di supporre che laprobabilità di 5 sul dado sia in qualche modo ‘condizionata’ dall'evento Testasulla moneta; in altre parole:

P(5, dato testa) = P(5)

Notazione matematica: P(A, dato B) = P(A|B)

Page 21: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Se la probabilità condizionata è uguale alla probabilità non condizionata, i due eventi sono definiti indipendenti, e si ottiene la forma semplice della regola di moltiplicazione:

P(T e 5)=P(T)*P(5)=1/2 * 1/6=1/12

Nell'esempio dell'infermiere maschio (A) e diplomato a Roma (B), se questi due eventi fossero indipendenti avremmo:eventi fossero indipendenti avremmo:

P(A e B)=P(A)*P(B)=0.4*0.8=0.3

Se questi due eventi invece non fossero indipendenti, perchè per esempio i corsi dilaurea per infermieri a Roma accettano come regola piu' donne che uomini, il valorecorretto per P(A e B) andrebbe ottenuto accertando il valore della probabilitàcondizionata: P(B=diplomato a Roma|A=maschio) .

Page 22: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

• Le variabili casuali

• Distribuzione Binomiale

• Curva di Gauss o Normale• Curva di Gauss o Normale

Page 23: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Immaginiamo un mazzo di carte con i quattro assi, tre due, due tre e un quattro (10 carte) e definiamo la variabile casuale:

Variabili casuali

La funzione o variabile casuale P(x) assegna una probabilità ad ogni carta; ovviamente, la somma delle probabilità di tutti gli eventi è sempre pari ad 1.

In questo caso i valori che la v.c. può assumere sono discreti e quindi si ottiene una distribuzione di probabilità discreta o una distribuzione di frequenza.

Page 24: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Oltre alla distribuzione di frequenza, si può definire anche la funzione cumulata di frequenza, detta anche funzione di ripartizione con la quale si assegna ad ogni evento la sua probabilità più quella di tutti gli eventi precedenti:

Possiamo definire poi la media (valore atteso) di una variabile casuale discreta come:

Expected value

Page 25: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Possiamo definire anche la varianza di una variabile casuale discreta come:

Se abbiamo invece una variabile casuale continua (dove ciò che si ottiene è detto funzione di densità o densità di frequenza) la funzione di ripartizione (=probabilità cumulata), la media e la devianza sono definite ricorrendo al concetto di integrale:

Funzione di densità

Funzione di ripartizione

Media o valore atteso

Varianza

Page 26: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

In analisi matematica l'integrale di una funzione è un operatore matematico che associa alla funzione l'area sottesa dalla funzione rispetto all'ascissa nel caso di una funzione a una variabile:

Per calcolare la probabilità di un fenomeno X misurato su scala continua che segue una certa funzione di densità, si deve calcolare l'integrale della funzione, nell'intervallo di esistenza di X.

Page 27: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Densità di probabilità per la DBP (pressione diastolica) in un uomo di età 35-44 anni.A, B, C sono rispettivamenteBorderline, Moderatamente iperteso e Iperteso.

Densità di probabilità per i trigliceridi.

Page 28: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

La distribuzione di probabilità cumulativa di una variabile casuale continua X valutata in un punto a è pari alla probabilità che X abbia valori <= a.

Rappresenta l'area sotto la curva ‘alla sinistra’ del valore a

Es: la distribuzione cumulativa del peso alla nascita valutata in 88 once (˜2,5 kg) è pari a P(X<= 88) ed corrisponde all'area sotto la curva a sinistra di 88 once.

Questo valore è usato come limite per possibili outcomes sfavorevoli nel primo anno di vita:anno di vita:

Page 29: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

• Una variabile casuale (v.c) è una quantità che assume valori differenti con specifiche probabilità.

• Una variabile casuale che assume un insieme discreto di valori con probabilità specificata è detta variabile casuale discreta.

Ricapitolando:

• Una variabile casuale che assume un insieme continuo e infinito di valori, in modo che intervalli di tali valori abbiano probabilità specificata è detta variabile casuale continua.

• Una funzione di una variabile casuale è una variabile casuale.

Page 30: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

• Le variabili casuali sono estremamente importanti perchè ci permettono di studiare la probabilità dei fenomeni facendo riferimento a funzioni matematiche note.

• Quando estraiamo un campione dalla popolazione per studiare un certo fenomeno X, facciamo l’ipotesi che X segua una certa legge di probabilità nella popolazione e quindi i dati campionari che osserviamo siano una realizzazione (casuale) della legge di X.

• Sulla base dei dati campionari faremo quindi “inferenza ” sulla popolazione, cioè stimeremo delle quantità (per es. media e varianza) del fenomeno X e le riporteremo a livello della popolazione, ad un certo grado di probabilità (o confidenza ).a livello della popolazione, ad un certo grado di probabilità (o confidenza ).

• Tutto ciò che viene stimato sul campione è per sua natura “casuale” proprio perché il campione è estratto dalla popolazione in modo casuale. Per cui tutto ciò che si afferma da studi campionari può essere accettato come vero con un certo grado di probabilità.

Vediamo ora alcuni esempi di variabili casuali che possono essere utilizzate per interpretare fenomeni di interesse.

Page 31: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Si consideri un insieme di n=100 pazienti, cui viene somministrato un farmaco. Dopo un certo periodo di trattamento, si riscontrano 60 guarigioni. Si puo’ allora affermare che l’insieme dei pazienti A=a1, a2, …, a100 puo’ essere suddiviso nei due insiemi A1 dei “guariti” e A2 dei “non guariti”. Attribuendo agli eventi appartenenti ad A1 il valore numerico x1=1 e a quelli di A2 il valore x2=0, si ottiene la probabilità di osservare una guarigione come:

P(A1)=0.6=P(X=1)

Variabili casuali discrete: la distribuzione binomi ale

P(A1)=0.6=P(X=1)

N=100

pazienti

A1=60

A2=40

Page 32: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

6.0,4.0

1,0

,

1,0:

pqX

Indicando questa probabilità con p e P(A2)=P(X=0)=q, si ottiene la variabile casuale binomiale o di Bernoulli:

P(A1)=0.6=P(X=1)=p

Ogni esperimento che consiste in un insieme di prove indipendenti ripetute, per ognuna delle quali abbiamo solo 2 esiti possibili (successo ed insuccesso), con una probabilità di successo costante, viene detto esperimento Bernoulliano.

Nell'ambito di questi esperimenti, spesso siamo interessati a conoscere la probabilità di ottenere k successi su n prove, evento che può essere descritto attraverso la variabile casuale binomiale.

Page 33: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Poniamo di sapere che in una Facoltà di Medicina con un alto numero di studenti il rapporto tra maschi e femmine sia pari a 0.7 e quindi che la probabilità di incontrare un maschio sia pari a p = 0.7 (evento semplice).

Deve essere estratto a sorte un viaggio studio per 4 studenti e, per unaquestione di pari opportunità, si preferirebbe che fossero premiati in ugualmisura maschi e femmine.

Un altro esempio:

Qual è la probabilità che un simile evento si realizzi?

Abbiamo un evento estrazione che può dare 2 risultati possibili (maschio o femmina) e che deve essere ripetuto 4 volte.

Se consideriamo ‘successo’ estrarre una femmina, allora la probabilità di successo in ogni estrazione è p=0.3 mentre quella di ‘insuccesso’ (evento complementare) è pari a 1 - p = q = 0.7.

Page 34: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

La probabilità che su 4 estrazioni si abbiano 2 successi (evento femmina) e 2 insuccessi (evento maschio) è data da:

0.3 *0.3 *0.7 * 0.7 = 0.32 * 0.72

In generale, data una popolazione numerosa, nella quale ci interessa valutare un fenomeno con 2 modalità possibili, e posto di sapere che la frequenza con cui si presenta una modalità nella popolazione è pari a p (in questo caso la frequenza presenta una modalità nella popolazione è pari a p (in questo caso la frequenza dei maschi è pari a 0.7), mentre la frequenza della seconda modalità è pari a q = 1 - p , se estraiamo da questa popolazione n elementi, la probabilità che k di questi presentino la prima modalità è:

Page 35: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

La formula precedente non risolve del tutto il problema, in quanto si vuole che vengano estratte 2 femmine, indipendentemente dall'ordine (prima, seconda, terza o quarta estrazione) mentre la probabilità precedente è quella relativa all'evento in cui le 2 femmine sono estratte al primo e secondo posto.

Di conseguenza alla probabilità dell'evento indicato in precedenza (estrazione di 2 femmine in prima e seconda posizione) dobbiamo aggiungere la probabilità

di tutti gli altri eventi utili (2 femmine in seconda e terza posizione, oppure in terza e seconda, oppure in terza e quarta e così via…). terza e seconda, oppure in terza e quarta e così via…).

Il numero delle combinazioni possibili per 2 femmine in 4 estrazioni (combinazione di 4 elementi di classe 2) è dato dal coefficiente binomiale:

Page 36: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Moltiplicando le due equazioni otteniamo la equazione della v.c. binomiale:

Nell’esempio delle 2 femmine in 4 estrazioni:

Page 37: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Valore atteso di una v.c. discreta

Valore atteso della variabile binomiale:

Varianza della variabile binomiale:

Page 38: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

La distribuzione gaussiana (normale)

C.F. Gauss (1777-1855)

Distribuzione delle altezze in un campione

Molti parametri biologici rilevati su campioni diindividui sembrano seguire la legge di distribuzione gaussiana o “normale”.

Distribuzione della pressione sanguigna in un campione

Page 39: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

La distribuzione gaussiana puo’ essere descritta usando essenzialmente due indici:

µ

σσ ,2

MEDIA

VARIANZA/DEVIAZIONE STANDARD

Circa il 95% dei valori di X sono compresi in un intervallo definito dalla media e deviazione standard di X: µ±1.96σ

σµ−= x

z

Variabile normale standard

N(0;1)

Page 40: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Page 41: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

L’area delimitata dalla curva della distribuzione normale e dall’asse delle ascissevale 1 (=intero spazio di probabilità). L’area sotto la curva compresa tra due valoriX=a e X=b, dove a<b, rappresenta la probabilità che X sia compreso tra a e b. Taleprobabilità viene indicata con l’espressione: P(a<X<b). Quando la variabile X vieneespressa in termini di unità standard, z, è possibile ‘tabulare’ i valori di z chedelimitano particolari aree della curva, corrispondenti a determinati intervalli diprobabilità.

Se conosciamo µ ed σ di un fenomeno che segue la legge di distribuzione normale, possiamo determinare facilmente intervalli di valori in cui con una certa probabilità

sono compresi i valori del fenomeno stesso.

Page 42: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Densità della Curva Gaussiana

P(x) N(µ;σµ;σµ;σµ;σ)=N(5;3)

exp=e

π=3.14

x

µ= media della v.c. gaussianaσ2=varianza della v.c. gaussiana

Page 43: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Densità della Curva Gaussiana standard:N(µ;σµ;σµ;σµ;σ)=N(0;1)

Distribuzione cumulativa:

Page 44: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Calcolo dei percentili di una Normale standard

Il (100-u) percentile di una normale standard è indicato con zu ed è definito dalla relazione:

Page 45: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Per trovare zu si deve trovare l'area u e quindi trovare il valore che corrisponde a tale area.

Si può usare la simmetria della distribuzione: zu = -z1-u

Page 46: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Φ

rappresentazione cumulativarappresentazione cumulativa

Page 47: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Se:

Allora:

Dalla Normale alla Normale Standard:Ricapitolando:

in tali condizioni si ha che:

Page 48: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Page 49: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Es: Una persona borderline per ipertensione è definita come una DBP compresa tra 90 e 95 mm Hg. Nei maschi tra i 35 ed i 44 anni la DBP è distribuita normalmente con media 80 e varianza 144 (dev std=12).Si vuole la probabilità di essere borderline per un maschio in quella classe di età

La probabilità di essere borderline per un maschio tra 35 e 44 anni è pari a 0.098

Page 50: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Es: Si supponga che i diametri di alcuni arbusti siano distribuiti normalmente con media 8 cm e deviazione standard 2 cm.

La probabilità per un arbusto di avere un diametro eccezionalmente grande (> 12cm) è pari a:

> 12 cm

Page 51: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Es: Nella popolazione generale la pressione vascolare cerebrale CBF è distribuita con media 75 e deviazione standard 17.

Un paziente è definito a rischio di stroke se ha una CBF < 40.

La probabilità di essere a rischio è pari a:

< 40

Page 52: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

Es: Il glaucoma è una malattia che si presenta con una pressione intraoculare eccessiva.

Nella popolazione generale, la pressione intraoculare è normale con media 16 mm Hg e deviazione standard 3 mm Hg.

Se il range di normalità è tra i 12 ed i 20 mm Hg, la probabilità di essere normali è pari a:

La probabilità di ricadere nel range di normalitàè pari a 0.82 (82%).

Page 53: Il significato di probabilità Cenni di calcolo ... Giulia lezione 2.pdf · Cenni di calcolo delle probabilità Le operazioni di base del calcolo delle probabilità sono l'addizione

Corso di Statistica Medica

N.B.: Le distribuzioni normali sono infinite (perchè infiniti sono i valori possibili per µ e σ), ma possono tutte essere ricondotte ad una sola essere ricondotte ad una sola distribuzione di riferimento con µ= 0 e σ= 1: la distribuzione normale standardizzata.

-> permette di risolvere il problema del calcolo di frequenza o di probabilità semplicemente ricorrendo alle tavoledegli integrali della distribuzione normale standardizzata.


Recommended