20
Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli

Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

  • Upload
    vinnie

  • View
    45

  • Download
    0

Embed Size (px)

DESCRIPTION

TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli. Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate. Una teoria molto utile per la pratica. Una branca della matematica, detta. Calcolo delle probabilità. - PowerPoint PPT Presentation

Citation preview

Page 1: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Lezione B.2

Introduzione alla probabilità e alle probabilità condizionate

TQuArs – a.a. 2010/11Tecniche quantitative per l’analisi nella ricerca sociale

Giuseppe A. Micheli

Page 2: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Una teoria molto utile per la pratica..

Una branca della matematica, detta

Calcolo delle probabilità

ricostruisce per via deduttiva (non induttiva!) la ‘struttura’ di tutti i possibili campioni, quando:

Sia nota la composizione dell’intera popolazione

Il campione sia estratto rigorosamente ‘a caso’

L’inferenza funziona dunque:

assumendo che siano soddisfatte le regole del calcolo delle probabilità

risalendo dal risultato empirico ottenuto nel campione a una valutazione generale del collettivo

Page 3: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Breve storia del concetto di probabilità

Fino al tardo Rinascimento la parola ‘probabile’ indicava una opinione ‘approvata’ da una auctoritasauctoritas degna di rispetto (Aristotele, le Scritture).

Lungo il XVI secolo come fornitore di probabilità tende ad essere accettato un nuovo tipo di testimonianza autorevole: l’evidenza dei ‘segni’ che la Natura offre, ma che richiedono di essere interpretati (G. Fracastoro, De contagione, 1546).

Così il concetto moderno di probabilità matura con gradualità ma insieme le sue due anime:

L’anima ‘frequentistafrequentista’ (l’evidenza sta nei segni naturali a favore, donde il calcolo degli ‘azzardi’ di combinazioni possibili)

L’anima ‘soggettivistasoggettivista’ (l’evidenza sta nella coerenza interna del ragionamento che inter-preta i segni a favore)

Page 4: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

L’emergenza della probabilità

Il concetto di probabilità ‘calcolabile’ emerge in modo maturo tutto insieme in più studiosi nell’arco di soli 10 anni, mante-nendo la sua dualità di fondo tra:

Una probabilità ‘aleatoria’ Una probabilità ‘epistemica’

C.Huysgens 1657, De ratiociniis in aleae ludo (scommesse e vita-lizi)

J.Graunt 1662,Natural & political observations (funzione di morta-lity hazard)

B.Pascal 1662, Logique ou l’art de penser (scommessa sulla esisten-za di Dio)

G.Leibniz 1665, De conditionibus (diritti condizionali, grado di pro-babilità di un verdetto)

Page 5: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

La legge empirica del caso

1.0

0.5

1 10 100

L’approccio frequentista interpreta la probabilità come qualità primaria di un fenomeno, approssimata dalla frequenza relativa al ripetersi di molti esperimenti sempre uguali.

Questa concezione discende da un risultato ‘di senso comune’:

Legge empirica del casoLegge empirica del casoSia {XSia {Xnn} una successione di ri-} una successione di ri-levazioni sulle misure di un e-levazioni sulle misure di un e-sperimento sperimento (per es. la succes-(per es. la succes-sione di lanci di una moneta).sione di lanci di una moneta).

Sia mSia mnn la media di tutti gli e- la media di tutti gli e-sperimenti dal primo all’ultimo sperimenti dal primo all’ultimo condotto condotto (per es. la frequenza di (per es. la frequenza di ‘teste’ nei lanci).‘teste’ nei lanci).

Empiricamente si trova che la Empiricamente si trova che la media tende a stabilizzarsi al media tende a stabilizzarsi al crescere delle misure.crescere delle misure.

frequenza di ‘teste’

Numero dei lanci

Definiamo probabilità il valo-Definiamo probabilità il valo-re a cui ‘converge’ la media re a cui ‘converge’ la media mmnn degli esperimenti. degli esperimenti.

Page 6: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Definizioni frequentista e classica di probabilità

La legge empirica del caso giustifica una definizione frequentista del concetto di probabilità:

questa definizione presuppone la ripetibilità ripetibilità di un esperi-mento. Il concetto di probabilità si estende invece anche ad eventi non ripetibili, o unici (se non ci fosse stato Serajevo, è probabile che la guerra mondiale sarebbe scoppiata più tardi)

““Per un evento che si ritiene si ripeta sempre nelle stesse Per un evento che si ritiene si ripeta sempre nelle stesse condizioni, la probabilità è il rapporto tra il numero di volte condizioni, la probabilità è il rapporto tra il numero di volte che l’evento capita e il numero totale delle osservazioni”.che l’evento capita e il numero totale delle osservazioni”.

ma…

Definizione più formale è quella ‘classica’ (Laplace 1795):

Essa è viziata da una clamorosa tautologia, ‘riparata’ dal princi-princi-pio di ragione insufficientepio di ragione insufficiente:

PROBABILITA’PROBABILITA’ di un evento A è il rapporto tra il numero di casi fa-vorevoli al verificarsi di A e il to-tale dei casi possibili, a condizione che siano tutti EQUIPOSSIBILIEQUIPOSSIBILI.

I casi sono equipossibili se non vi sono valide ragioni per sostenere il contrario

Page 7: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Calcolare la probabilità di un evento semplice

F

M F M

M

M

F

Uno spazio degli eventi è come un barattolo in cui siano stati inseriti tutti gli eventi semplici.

In questo ‘barattolo’ siano rinchiusi, per esempio, i sette studenti di una classe: quattro maschi, tre femmine. Supponiamo che si sappia che uno solo di loro verrà promosso, e non per merito ma ‘a caso’!

Se l’esperimento consiste nell’estrarre a caso l’unico studente che verrà promosso, la definizione di Laplace ci consente già di calcolare la pro-babilità che sia promossa una ragazza piuttosto che un ragazzo:

P(F/esperimento unico) = (casi favorevoli)/(casi possibili) = 3/7 = 0,429

P(M/esperimento unico) = (casi favorevoli)/(casi possibili) = 4/7 = 0,571

Page 8: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Calcolare probabilità ‘composte’

F

M F M

M M F

Come calcolare, per esempio, la probabilità che entrambi gli studenti in-terrogati siano ragazze? Per rispondere va sciolto un dubbio preliminare:

Ma supponiamo che ora il professore voglia fare un paio di interrogazioni (non una sola), e che anche in questo caso selezioni gli studenti da interrogare rigorosamente a caso.

Ora l’esperimento si complica: esso non si risol-ve più in una sola estrazione, ma nella combi-nazione di due esperimenti.

Sono due interrogazioni nello stesso giorno?Gli studenti devonoessere due distinti

Sono due interrogazioni in giorni differenti? Può

anche essere ‘estratto’ lostesso studente due volte

Page 9: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Prima via di calcolo: esperimenti composti

Un approccio combinatorioUn approccio combinatorio

Un approccio assiomaticoUn approccio assiomatico

Perviene alla probabilità vincolata tramite il calcolo di tutte le combinazioni di risultati fa-vorevoli all’accadere di un dato evento.

Il ‘calcolo’ delle probabilità vincolata avviene a partire dall’algebra degli eventi e dalla teoria delle probabilità che diamo già per acquisita.

Per calcolare una probabilità condizionata seguiremo due vie equivalenti:

Seguiamo la prima strada, e consideriamo una classe di 7 studenti, 4 ragazzi (M) e 3 ragazze (F), che racchiudiamo in un barattolo (lo possiamo definire ‘spazio degli eventi’). Sappiamo che due di loro saranno interrogati oggi, e saranno scelti (orrore!) a caso. Saranno ragazzi o ragazze?

F

M

M

FM

MM

Due in- terroga- ti:M o F?

Non si tratta di un esperimento semplice (una singola estrazione), ma di un esperimento composto. Composto cioè a sua volta da due esperimenti sem-plici che però sono forse legati tra loro dal disegno di campionamento pre-scelto: dal modo cioè in cui avviene la selezione delle unità estratte a sorte.

Page 10: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Campionamento con/senza reimmissione

Supponiamo che la prima estratta sia stata una ragazza (F). E’ sensato che essa non possa essere conteggiata (e interrogata) due volte (una persecuzione!); cioè che non venga reinserita nell’urna per la seconda estrazione.

F

M

M

FM

M

F Così facendo, alla seconda estrazione il baratto-lo (l’urna) avrà una composizione differente (4 M, 2 F) e la probabilità di estrarre ancora F cambia:

P(F/I esp=F) = 2/6

M

M M

M

F

F

F

Ma supponiamo che l’estrazione non riguardi una interrogazione (non reiterabile) ma la sottoposizione di una domanda (due domande a uno stesso studente ‘se po ffà’!). Ora la ragazza già interpellata è reinserita nell’urna e la probabilità cercata è

P(F/I esp=F) = 3/7

ed è ora immutata rispetto al primo esperimento!Siamo dunque di fronte a due differenti disegni di campionamento: senza reimmissione, con reim-missione. La probabilità che cerchiamo è ‘condi-zionata’ dal tipo di campionamento prescelto.

Page 11: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Principio delle probabilità composte

Abbiamo usato una scrittura nuova: P(II=F/I=F) per indicare la probabi-lità di osservare (alla II estrazione) una F, vincolata al (condizionata dal) fatto che nella I estrazione sia stata osservata una F.

Chiamiamo questa espressione probabilità condizionata. Essa compare in un fondamentale postulato del calcolo delle probabilità, il

Principio Principio delle delle probabilità probabilità compostecomposte

La probabilità dell’intersezioneprobabilità dell’intersezione di due eventi A e B è pari al prodotto tra la probabilità del primo evento e la pro-babilità del secondo condizionata al verificarsi del primo

P(A B)= P(A).P(B/A) = P(B).P(A/B)

P(I=FII=F)=P(I=F).P(II=F/I=F)=(3/7).(2/6)=6/42= 0,14

Nel caso di estrazione dalla popolazione di sette studenti senza reimmissione nella urna (al mas-simo una interrogazione a testa) la probabilità che siano interrogate due ragazze è quindi:

Nota bene: spesso scriveremouna probabilità congiunta P(AB)per brevità in questo modo: pAB

Page 12: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Eventi indipendenti

MM

M

MM

M

M

M

F F FF

F F Supponiamo ora che le due estrazioni avvengano da urne distinte, con la stessa composizione.

Estrarre una F dalla I urna non condiziona l’esito della II estrazione!

Definiamo indipendenti due eventi A e B se la probabilità di accadi-mento dell’uno non è influenzata dall’esito dell’altro

P(B/A) = P(B) o anche P(A/B) = P(A) e quindi…

Se due eventi sono indipendenti la probabilità dell’intersezione è pari al prodotto delle probabilità

P(A B)= P(A).P(B)

Esempio dei sette studenti ‘con reimmis-sione’ (regola di ‘estrazione’: possibili più domande allo stesso studente):

P(I=FII=F)=P(I=F).P(II=F)= =(3/7).(3/7) = 9/49 = 0,18

Fin qui gli eventi A e B sono risultati di uno stesso esperimento, ripetuto sulla stes-sa popolazione. L’intersezione (AB) può anche abbinare: a) risultati riferiti a due caratteri diversi rilevati sulla stessa popolazione o b) risultati riferiti a uno stesso carattere rilevato in due popolazioni distinte

Page 13: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Un esempio: dai quattro salti in compagnia

Facciamo un secondo esempio. La prima volta che vanno fuori insie-me la sera 10 ragazzi (5 maschi, 5 femmine) decidono di andare a ballare. Dei maschi 3 sono biondi (MA) e 2 castani (MB), tra le ra-gazze 2 sono bionde (FA) e 3 castane (FB).

E’ la prima volta che escono, s’è detto, e gli abbinamenti per ballare avvengono quindi ‘a caso’. E’ come se la formazione delle coppie avvenisse per estrazione da urne distinte per popolazioni distinte (una per i maschi, una per le femmine). I risultati della prima urna non condizionano quelli della seconda (nessuna simpatia o nessun veto preconcetto). La probabilità di ogni possibile combinazione è quindi calcolabile a partire dalle probabilità dei singoli eventi, tra loro indipendenti:

P(FB MA)= P(FB).P(MA/FB) = P(FB).P(MA) = (3/5)x(3/5)= 9/25

P(FB MB)= P(FB).P(MB/FB) = P(FB).P(MB) = (3/5)x(2/5)= 6/25

P(FA MA)= P(FA).P(MA/FA) = P(FA).P(MA) = (2/5)x(3/5)= 6/25

P(FA MB)= P(FA).P(MB/FA) = P(FA).P(MB) = (2/5)x(2/5)= 4/25

MA

MB

MB

MA

FA

FB

FA

FB

FBMA

Page 14: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

.. alla formazione di coppie fisse

MA

MAMA

MB

MB FA Passa qualche tempo, e le coppie tra gli 8 ragazzi sono ormai fisse. Non c’è più indipendenza tra i due eventi ‘estrazione di un lui’ e ‘estrazione di una lei’.

Ora anche se conosco sia la probabilità di un ragazzo casta-no (P(MB)=2/5) sia la probabilità di una ragazza castana (P(FB)=3/5) non sono in grado di calcolare la probabilità di trovarmi di fronte a una coppia di ragazzi entrambi castani. Essa infatti dipende da come si sono ‘combinate’ le coppie:

Per esempio così:

2(MAFA),1(MAFB), 2(MBFB)

In questo caso

P(FA/MB)=0

(chi si somiglia si piglia)

Ma anche così:

3(MAFB), 2(MBFA)

In questo caso

P(FA/MB)=1

(attrazione degli opposti)

Oppure così:

1(MAFA),2(MAFB),1(MBFA),1(MBFB)

In questo caso

P(FA/MB)=0,5

(una via di mezzo)

Le probabilità condizionate dipendono dall’effettiva distribuzione delle probabilità congiunte.

Page 15: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Tabella di distribuzione congiunta

FA FB

MA #(MA,FA)=2 #(MA,FB)=1 #(MA)=3

MB #(MB,FA)=0 #(MB,FB)=2 #(MB)=2

#(FA)=2 #(FB)=3 S=5

FA FB

MA #(MA,FA)=0 #(MA,FB)=3 #(MA)=3

MB #(MB,FA)=2 #(MB,FB)=0 #(MB)=2

#(FA)=2 #(FB)=3 S=5

Possiamo ricondurre le numerosità (#) congiunte che abbiamo elencato a una forma compatta, quella di una tabella a doppia entrata.

Come nel gioco della battaglia navale (F7: affondato!), ogni casella interna alla tabella riporta il numero di casi in cui si osservano congiuntamente l’evento indicato in testa a quella riga e l’evento indicato in testa a quella colonna. Dividendo la numerosità di casi favorevoli a una certa combina-zione di caratteri (per es. ragazzi biondi e ragazze castane) per il numero totale delle coppie si trova la corrispondente probabilità congiunta. Per es.

P(MBFA) = P(MB,FA) = 0/5

P(FA/MB)=#(MB,FA)/#(MB)=0/2=0

Biondi con bionde: chi si somiglia si piglia

P(MBFA) = P(MB,FA) = 2/5

P(FA/MB)=#(MB,FA)/#(MB)=2/2=1

Biondi con castane:gli opposti si attirano

Page 16: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Un altro esempio: disoccupazione e natalità

Facciamo un altro esempio, ragionando più in grande.

Delle 90 province di un paese 60 abbiano un tasso di disoccupazione alto (D+), le altre 30 un tasso basso (D-). Quindi P(D+)=0,67.

Sappiamo anche che 40 province su 90 hanno un tasso di natalità alto (N+), le altre 50 basso (N-). Quindi P(N+)=0,44.

Ci domandiamo: qual è la probabilità di una provincia ad alta nata-lità e ad qual è la probabilità di una provincia ad alta nata-lità e ad alta disoccupazione P(N+/D+) e qual è la probabilità di una provincia ad alta disoccupazione P(N+/D+) e qual è la probabilità di una provincia ad alta natalità e bassa disoccupazione P(N+/D-)?alta natalità e bassa disoccupazione P(N+/D-)?

La risposta è: “chi lo sa?”. Infatti per definizione P(B/A)=P(AB)/P(A), quindi si possono determinare le probabilità condizionate solo se si conosce la forma della distribuzione delle probabilità congiunte. Ancora una volta si possono dare tante distinte distribuzioni congiunte di pro-babilità, a cui si associano probabilità condizionate differenti. Noi facciamo tre ipotesi di combinazioni possibili (voi fatene altre!): in tutte tre sono rispettate le probabilità ‘semplici’ indicate.

Page 17: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Flip-flop theory..

Notate bene: nel primo caso P(N+/D+)=40/60 è maggiore di P(N+/D-)=0/30. In questo caso ci butteremmo sull’ipotesi che disoccupazione vuol dire pover-tà e i poveri si sa fan molti figli.

Nel secondo caso invece P(N+/D+)=20/60 è minore di P(N+/D-)=20/30. In questo caso ci butteremmo sull’ipotesi che una coppia razionale farà figli solo ha un lavoro.

Se poi P(+/D+) e P(N+/D-) sono grosso modo uguali, come nel terzo caso, non sapremmo (per fortuna!) che interpreta-zione dare..

N+ N-

D+ 40 20 60

D- 0 30 30

40 50 90

N+ N-

D+ 20 40 60

D- 20 10 30

40 50 90

N+ N-

D+ 27 33 60

D- 13 17 30

40 50 90

Morale: spesso ad ogni possibile forma della associazione tra due caratteri sappiamo abbinare una diversa teoria (gli studiosi parlano di flip-flop theories..)

Anche in questo caso invece di elencare le combinazioni (DN) in diverse possibili distribuzioni adottiamo la forma più compatta della tabella a tabella a doppia entratadoppia entrata.

Page 18: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Probabilità composte di più di due eventi

Qual è la probabilità che:

a) sia composta tutta da P?

b) sia composta tutta da U?

c) abbia maggioranza P? P

PP

P

PP P

U

U U

U

Il problema dunque è di campionamento senza reimmissione nell’urna

Con l’introduzione del concetto di probabilità condizionata siamo in grado di calco-lare probabilità composte (o congiunte) in cui gli esperimenti non siano solo due. Torniamo quindi a modelli probabilistici con un esperimento ripetuto più volte sulla stessa popolazione. Ci troveremo di nuovo davanti al bivio tra esperimenti indipendenti (con reimmissione) o dipendenti.

Partiamo da un esempio classico, sulla composizione di una delegazione estratta a caso. Una Commissione della Camera composta da 11 deputati, 7 del Polo (P) e 4 dell’Ulivo (U), deve affidare a una delegazione ristretta di 3 un compito delicato,ma non riesce a mettersi d’accordo sui nomi. Deve allora estrarla a sorte. Ci si chiede:

Ovviamente nessun deputato può essere nominato due volte in una stessa commissione!

Page 19: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Maggioranza e unanimità (senza reimmissione)

Probabilità che la commissione sia composta tutta da P:

P(P,P,P) = P(I=P)*P(II=P/I=P)*P(III=P/(I=P)(II=P)) =

= (7/11)*(6/10)*(5/9) = (7*6*5)/(11*10*9) = 0,212

Probabilità che la commissione sia composta tutta da U:

P(U,U,U) = P(I=U)*P(II=U/I=U)*P(III=U/(I=U)(II=U)) =

= (4/11)*(3/10)*(2/9) = (4*3*2)/(11*10*9) = 0,024

Probabilità che la commissione abbia maggioranza P:

P(P,P,P P,P,U P,U,P U,P,P) = P(P,P,P)+3 P(P,P,U)

P(P,P,U) = P(I=P)*P(II=P/I=P)*P(III=U/(I=P)(II=P)) =

=(7/11)*(6/10)*(4/9)=(7*6*4)/(11*10*9)=0,170

Dunque P(maggioranza P) = 0,212 + (3*0,170) = 0,722

Verificate o dimostrate voi che P(P,P,U) = P(P,U,P) = P(U,P,P) !

Page 20: Lezione B.2 Introduzione alla probabilità e alle probabilità condizionate

Maggioranza e unanimità (con reimmissione)

Torniamo alla nostra Commissione. Ora deve nominare un Presidente a rotazione per ogni settimana, per tre settimane. Ma anche in questo caso litigano a sangue e decidono di rimettere alla sorte le tre nomine. Solo, è legittimo in questo caso che una stessa persona svolga più volte lo stesso ruolo. Si tratta quindi di campionamento con reimmissione.

Prob (commissione tutta di P) =

= P(P,P,P) = P(P)*P(P)*P(P) =

= [(7/11)3] = [(0,6363] = 0,258

Prob (commissione tutta di U) =

= P(U,U,U) = P(U)*P(U)*P(U) =

= [(4/11)3] = [(0,3643] = 0,048

Prob (maggioranza di P) =

= P(P,P,P) + 3 P(P,P,U) =

= 0,258 + 3 [P(P)*P(P)*P(U)]=

= 0,258 + 3[(7/11)2 * (4/11)]=

= 0,258 + 3[0,147]= 0,699

Di quale combinazione non abbiamo calcolato la probabilità? Calcolatela, e verificate che la som-ma di probabilità disgiunte è = 1!!