Author
nguyencong
View
217
Download
1
Embed Size (px)
13/04/2015
1
Calcolo delle probabilità
Il problema di Monty Hill nel film 21
Elementare!! Statistiche, cambio di variabili….
13/04/2015
2
X 1,6 2 3,5 3 3,2 4
Y 1000 1500 2000 2100 2400 3000
Il coefficiente di correlazione tra Indice e Stipendio vale 0,94. E’ possibile asserire che la
relazione tra X e Y è lineare, ad esempio, al 100%? Oppure c’è un margine di errore del 5%?
La probabilità è il grado di fiducia che si ripone in un evento che può accadere nel futuro.
Definizioni di probabilità:
� Classica: la probabilità di un evento è il rapporto tra il numero di
casi favorevoli e il numero di casi possibili (equiprobabili –
tautologia) .
� Soggettiva: la probabilità è il grado di fiducia che una persona
ripone in un certo evento.
� Empirica: la probabilità di un evento è il rapporto tra il numero di
volte in cui l’evento si è verificato, nelle prove effettuate, e il numero
delle prove effettuate.
Probabilità
Buffon (1707-1788)
Lanciò una moneta 4040
volte= 2.048 C e 1.992 T
Pearson (1857-1936)
Lanciò una moneta 24000
volte= 12.012 T e 11.998C
Sostenitori della definizione frequentista
Perci Diaconis (1945)
13/04/2015
3
% di volte in cui si verifica testa
nel lancio n volte di una moneta
equa (frequenza relativa).
TCTTCCTTTCTCTTCCTTTCTCTTCCTTTCTCTTCCTTTC
Simulazione al computer
del lancio di una moneta
n=10
n=100
n=1000
Sulla definizione frequentista
Ogni singola esecuzione dell’esperimento dà luogo ad un risultato non prevedibile.
� Selezionare una persona da un collettivo per misurare una sua
caratteristica
� Effettuare la misurazione di una grandezza fisica
� Estrazioni del lotto
� Lancio del dado
Esito: un particolare risultato dell’esperimento
Evento: un insieme di risultati dell’esperimento.
«Numeri pari estrazioni del lotto» «Persone di altezza tra 1,5 e 2,0 metri»
«Reddito tra 10.000 e 20.000 euro»
«Almeno due teste nel lancio di una moneta tre volte»
Esperimento casuale
� Lancio moneta
13/04/2015
4
Esperimento casuale: lancio di un dado.
Evento: uscita di un numero pari
� � 2,4,6Casi possibili: � � 1,2,3,4,5,6Casi favorevoli:
� � � |�||�| �
36
Come si calcola la probabilità di un evento?
Esperimento casuale: selezione di una persona con peso tra (50;60] da un collettivo così suddiviso:
Peso Freq.
Ass.
[40;50] 10
(50;60] 15
(60;70] 23
(70;80] 12
(80;90] 8
|�| � 15
|�| � 68� � � 15
68
Esperimento casuale: all’indagine effettuata presso il Liceo Galilei, hanno partecipato 163 studenti di cui 91 Maschi.Scelto a caso un questionario, qual è la probabilità che sia statocompilato da un maschio?
|�| � 91
|�| � 163� � � 91
163
Unione di eventi disgiunti:
A
B
Esempio: Una macchina per la produzione di buste di vegetali contiene un mix di fagioli,
broccoli e altri vegetali. La maggior parte dei prodotti è imbustata correttamente, ma a
causa della variazione della taglia dei vegetali la busta può essere sovrappeso o sottopeso.
Un controllo su 4000 buste ha riportato le seguenti valutazioni:
Peso No. Di pacchi
Sottopeso 100
Soddisfacente 3.600
Sovrappeso 300
� Qual è la probabilità che una busta scelta a
caso tra le 4000 non soddisfi le specifiche ri-
chieste?
Peso
A
B
C
� 100 � 3004000
Complementare di eventi:
A
� Qual è la probabilità che la busta
selezionata non sia sottopeso?
� �� � 1 � � � � 1 � 1004000
Regole del calcolo delle probabilità
13/04/2015
5
Se e quanto l’acquisizione di informazioni sull’esperimento modifica le nostre valutazioni probabilistiche?
Vuoi cambiare?
Il problema di Monty Hill nel film 21
��: ��������Il testardo:
nodo
decisionale
��
Se e quanto l’acquisizione di informazioni sull’esperimento modifica le nostre valutazioni probabilistiche?
Il problema di Monty Hill nel film 21
��: ��������Il testardo:
nodo
decisionale
�������1 33%=perdi
Primo scenario
13/04/2015
6
Se e quanto l’acquisizione di informazioni sull’esperimento modifica le nostre valutazioni probabilistiche?
Il problema di Monty Hill nel film 21
��: ��������Il testardo:
nodo
decisionale
�������1 33%=perdi
Secondo scenario�����3
33%=perdi
Se e quanto l’acquisizione di informazioni sull’esperimento modifica le nostre valutazioni probabilistiche?
Il problema di Monty Hill nel film 21
��: ��������Il testardo:
nodo
decisionale
�������1 33%=perdi
Terzo scenario�����3
33%=perdi
33%=vinci
13/04/2015
7
Se e quanto l’acquisizione di informazioni sull’esperimento modifica le nostre valutazioni probabilistiche?
Il problema di Monty Hill nel film 21
� : �����Non sei testardo:
nodo
decisionale
� �����1!��2 33%=Vinci
Primo scenario
Se e quanto l’acquisizione di informazioni sull’esperimento modifica le nostre valutazioni probabilistiche?
Il problema di Monty Hill nel film 21
� : �����Non sei testardo:
nodo
decisionale
� �����1!��2 33%=Vinci
Secondo scenario
33%=Vinci�����3!��2
13/04/2015
8
Se e quanto l’acquisizione di informazioni sull’esperimento modifica le nostre valutazioni probabilistiche?
Il problema di Monty Hill nel film 21
� : �����Non sei testardo:
nodo
decisionale
� �����1!��2 33%=Vinci
Terzo scenario
33%=Vinci�����3!��2
�����2!��1�����1!��2 33%=Perdi
Unione di eventi:
A B
Esempio: Riprendendo l’esempio del questionario degli studenti del liceo Galilei , scelto un
questionario a caso determinare la probabilità che lo studente che ha risposto sia maschio
oppure porta gli occhiali.
Occhiali
Genere Occhiali NO Occhiali SI
Maschi 62 29
Femmine 31 41
� � "#$%&��������%&������è&�������!�(�����$���&�)��"* � "#$%&��������%&������è&�������!�(�����$��!%�&����)%!����+(����)��(�"
� � � 91163 � * � 70
163
Probabilità congiunta
Regole del calcolo delle probabilità
� � ∩ * � 29163
13/04/2015
9
Probabilità condizionata
Si lancino due dadi distinguibili.
Casi possibili: � � ��!!�%������
Casi favorevoli:
� � � |�||�| �
536
Evento: «uscita di una coppia di risultati la cui somma è 8»
A= 2,6 ; 3,5 ; 4,4 ; 5,3 ; 6,2
Se un dado, ad esempio quello bianco, si ferma prima di quello rosso e mostra la faccia 5,
qual è ora la probabilità di totalizzare 8?
L’insieme dei casi possibili è ora cambiato. �� � 6Anche l’insieme dei casi favorevoli è cambiato. �� =1
���� � 1
6 � � ��
L’evento «il dado bianco mostra la faccia 5» condiziona l’evento «uscita di una coppia di risultati
la cui somma è 8».
Si definisce probabilità condizionata di un evento A dato l’evento B il seguente rapporto:
� � * � � � ∩ *�/*0
* ∩ �
*
� Quando si verifica l’evento B,
l’insieme dei casi possibili si riduce
� → *
� L’evento A si riduce
� → � ∩ *
� � * � � � ∩ *�/*0 �
136636
� ��
Regola della moltiplicazione:
� � ∩ * � � �|* �/*0
�
A
* = nuovo spazio campione
� ∩ *
B
13/04/2015
10
Esempio: Una azienda decide di effettuare un sondaggio circa la fedeltà dei propri dipendenti.
Ad un campione casuale viene chiesto cosa sceglierebbe se un’altra compagnia proponesse
un impiego di pari guadagno o leggermente superiore. L’intento della azienda è capire se la
risposta dipende dal numero di anni di servizio maturati.
< 1 anno Da 1 a 5 anni Da 6 a 10 anni > 10 anni Totale
Rimangono 10 30 5 75 120
Vanno via 25 15 10 30 80
Totale 35 45 15 105 200
Rimangono
Vanno via
Meno di 1 anno
Da 1 a 5 anni
Da 6 a 10 anni
Più di 10 anni
Meno di 1 anno
Da 1 a 5 anni
Da 6 a 10 anni
Più di 10 anni
120 200280 2002
10 120230 12025 120275 1202
25 80215 802
10 80230 802
=P(«< 1anno»| «Rimangono»)
=P(«1 a 5 anni»| «Rimangono»)
=P(«6 a 10 anni»| «Rimangono»)
=P(« >10 anni»| «Rimangono»)
P(«Rimangono»)
P(«Vanno via»)
Meno di 1 anno
Da 1 a 5 anni
Da 6 a 10 anni
Più di 10 anni
Meno di 1 anno
Da 1 a 5 anni
Da 6 a 10 anni
Più di 10 anni
P(«< 1anno»| «Rimangono»)
P(«1 a 5 anni»| «Rimangono»)
P(«6 a 10 anni»| «Rimangono»)
P(« >10 anni»| «Rimangono»)
� � ∩ * � � �|* �/*0Regola della moltiplicazione
P(«Rimangono») =P(« >10 anni»| «Rimangono») 3P(«> 10 anni») =P(«Rimangono»|« >10 anni») 3 P(«Rimangono» ∩ «> 10 anni»)
P(«> 10 anni»∩ «Rimangono»)
Verifica:
13/04/2015
11
� � ∩ * � � �|* �/*0Regola della moltiplicazione
P(«Rimangono») =P(« >10 anni»| «Rimangono») 3P(«> 10 anni») =P(«Rimangono»|« >10 anni») 3 P(«Rimangono» ∩ «> 10 anni»)
P(«> 10 anni»∩ «Rimangono»)
Verifica:
< 1 anno Da 1 a 5 anni Da 6 a 10 anni > 10 anni Totale
Rimangono 10 30 5 75 120
Vanno via 25 15 10 30 80
Totale 35 45 15 105 200
P(« >10 anni»| «Rimangono»)
P(«Rimangono») P(«Rimangono»|« >10 anni»)
= �45 44� 75120 P(«> 10 anni»)
= � 4 44 =
65�45
Rimangono
Vanno via
<1 anno
Da 1 a 5 anni
Da 6 a 10 anni
> 10 anni
< 1 anno
Da 1 a 5 anni
Da 6 a 10 anni
> 10 anni
120 2002
80 2002
10 120230 12025 1202
75 1202
25 80215 80210 802
30 802
� �4� 4 3� 4 44 = �/"rimangono" ∩ ">1anno"0
� ?4� 4 3� 4 44 = �/"rimangono" ∩ "da1a5"0
� 5� 4 3
� 4 44 = �/"rimangono" ∩ "da6a10"0
� 65� 4 3� 4 44 = �/"rimangono" ∩ "A10anni"0
0,05
0,15
0,025
0,375
0,125
0,0750,05
0,15
< 1 anno 1 - 5 anni 6 - 10 anni > 10 anni
Fedeltà all'azienda
Restano Vanno via
0,60,4
0,38
0,03
0,15
0,05
13/04/2015
12
Il problema inverso
Rimangono
Vanno via
<1 anno
Da 1 a 5 anni
Da 6 a 10 anni
> 10 anni
0,15
0,05
Se si conoscono le probabilità sui singoli rami…
0,175
0,225
0,075
0,525
Rimangono
Vanno via
Rimangono
Vanno via
Rimangono
Vanno via
0,286
0,667
0,333
0,71
0,714
0,333
0,667
0,29
… calcolare la probabilità che un impiegato scelto a caso, abbia risposto che rimane nell’
azienda.
<1 anno
Da 1 a 5 anni
Da 6 a 10 anni
> 10 anni
0,71
0,667
0,286
0,333
Prob. che avrebbre
questo evento se
lo spazio campione
fosse
l’insieme rosso
Il problema inverso
Rimangono
Vanno via
Da 1 a 5 anni
Da 6 a 10 anni
> 10 anni
0,15
0,05
Se si conoscono le probabilità sui singoli rami…
0,175
0,225
0,075
0,525
Rimangono
Vanno via
Rimangono
Vanno via
Rimangono
Vanno via
0,286
0,667
0,333
0,71
0,714
0,333
0,667
0,29
… calcolare la probabilità che un impiegato scelto a caso, abbia risposto che rimane nell’
azienda.
<1 anno
� "rimangono" � � "rimangono" >"1anno" 3 �/">1anno"0 +
� "rimangono" >"��1�5����" 3 �/"��1�5����"0 +
� "rimangono" >"��6�10����" 3 �/"��6�10����"0 +
� "rimangono" >"A10anni" 3 �/" A 10����"0� 0,286 3 0,175 � 0,667 3 0,225 � 0,333 3 0,075 � 0,71 3 0,525= 0,59
13/04/2015
13
� "rimangono" � � "rimangono" >"1anno" 3 �/">1anno"0 +
� "rimangono" >"��1�5����" 3 �/"��1�5����"0 +
� "rimangono" >"��6�10����" 3 �/"��6�10����"0 +
� "rimangono" >"A10anni" 3 �/" A 10����"0� 0,286 3 0,175 � 0,667 3 0,225 � 0,333 3 0,075 � 0,71 3 0,525= 0,59
Teorema delle alternative
Assegnati n eventi *�, * , … , *C tali che ∪E *E � � e *E ∩ *F � ∅ risulta
� � �H� �|*E � *EE
0,15
*� * *?
*I
� � ∩ *E � � �|*E � *E
Media pesata delle probabilità condizionate
Eventi indipendenti
Due eventi A e B si dicono indipendenti se � �|* � � �Esempio: Da una scatola di 10 pellicole fotografiche vengono estratte 2 pellicole a caso.
Qual è la probabilità che entrambe siano difettose, sapendo che nella scatola ci sono 3
pellicole difettose?
Cosa cambia nella risposta rispetto al caso precedente?
� J� ∩ J � � J |J� � J� = K ×
?�4
Indipendenza stocastica: lancio di due monete,
lancio di due dadi, etc… Indipendenza statistica: quando si effettuano
estrazioni da un collettivo molto numeroso
Esempio: Da una scatola di 100 pellicole fotografiche vengono estratte 2 pellicole a caso.
Qual è la probabilità che entrambe siano difettose, sapendo che nella scatola ci sono 3 pelli-
cole difettose?
J� � "!����!%((���(�%&��������L%���&�"J � "&%�����!%((���(�%&��������L%���&�"
� 0,03 3 0,03� J� ∩ J � � J |J� � J�
13/04/2015
14
Se ad ogni estrazione, la pallina viene rimessa nell’urna la
composizione dell’urna non cambia
Popolazione infinita
L’esito di ogni estrazione dipende da quelli precedenti.
Se ad ogni estrazione, la pallina non viene rimessa nell’urna la composizione dell’urna
cambia e dopo 90 estrazioni, il procedimento termina.
Popolazione finita
Eventi indipendenti
Eventi dipendenti
M � �M � 1
M � ��+(���%((�!�!�(�N���%� � ��+(���%(���!���%
Fattore di correzione da una popolazione finita.
Se il fattore di correzione è circa 1, allora le due estrazioni possono ritenersi equivalenti e
l’indipendenza è spesso usata per calcolare probabilità congiunte.
Esempio: Da un’urna contenente 10 palline rosse e 5 blue, si estraggono tre palline.
Qual è la probabilità che tutte e tre le palline estratte siano rosse?
Estrazione con reimmissione
Estrazione senza reimmissione
�/J� ∩ J ∩ J?)
=�/J�) �/J )� J? =0,5×0,5×0,5
� J� ∩ J ∩ J? � � J?|J� ∩ J � J |J� �(J�) � 38 3
49 3
510
*�
J�
* J
* J
*?J?
*?J?
*?J?
*?J?
5 152
10 152
3 132
10 142
5 142
9 142
10 1324 1329 132
9 1324 132
5 1328 132
Qual è la probabilità che
alla terza estrazione, la
pallina sia rossa?
4 142
13/04/2015
15
Teorema di Bayes
Reverendo Thomas Bayes (1750)
Logico e teologo
«A partire da una serie di dati già in nostro
possesso possiamo formulare un’ipotesi;
collezionando sempre nuovi dati possiamo
continuamente aumentare (o rivedere) il
grado di bontà delle nostre ipotesi»
Teorema di Bayes
La percentuale di studenti iscritti al secondo anno di economia che frequenta il corso di stati-
stica è 90%. Tra questi, il 90% supera l’esame. Supponendo inoltre che la percentuale di stu-
denti che non supera l’esame tra quelli che non frequentano è del 12% si calcoli:
a) qual è la % di studenti che non supera l’esame tra quelli che frequentano il corso;
b) qual è la % di studenti che non frequentano, tra quelli che si ipotizza non superanno l’esame.
90%
10%Non
frequenta
90%
Frequenta
Supera l’esame
10% Non supera l’esame
88% Supera l’esame
12% Non supera l’esame
* � &�$�%��%&�%(�����&����&$!%��(O%&��%� � &�$�%��%&�%(�����&�L�%#$%����(���&�
�0� * � � 0,10
� � * � ?
� � � ∩ *�/*0
= P Q R P/R0
P/Q0
� ∪ �� � � � ∩ �� � ∅� * � � * � � � � � * �� � �� � � * � � * � �/�0
� * � � � � � * �� � ��=
4,�434,K44,�434,K4S4,� 34,�4
13/04/2015
16
Un po’ di terminologia
�/�0 probabilità a priori (o verosimiglianza)
La probabilità dell’evento A senza conoscere l’effetto B
� � * probabilità aposteriori
La probabilità dell’evento A avendo riconosciuto l’effetto B
�/*0 Costante di normalizzazione
Il teorema di Bayes noto l’effetto B, valuta la probabilità che la causa sia stata A.
Applicazioni di metodi bayesiani: � filtri anti-spamming
� medicina e biologia
� ingegneria
� finanza
� scienza forense
� intelligenza artificiale: reti bayesiane (presenti in Windows dalla versione 98)
� motori di ricerca: Google «We can’t hire smart people fast enough»
Il punto di vista frequentista Il punto di vista bayesiano
La probabilità si calcola sul lungo periodo La probabilità è un grado di fiducia
C’è un modello vero che genera i dati e i
dati ne sono una rappresentazione
I dati sono veri/fissati.
I modelli hanno delle probabilità.
E’ possibile calcolare la probabilità che i
dati si verifichino in base al modello che si
ritiene vero
E’ possibile calcolare la probabilità di un
modello (ipotesi) in base ai dati osservati
Ogni esperimento va fatto in condizioni di
non conoscenza del modello vero
Le probabilità possono essere aggiornate
via via che si acquisiscono i dati
13/04/2015
17
Teorema di Bayes
<1 anno
Da 1 a 5 anni
Da 6 a 10 anni
> 10 anni
0,71
0,667
0,286
0,333
Si assuma di aver selezionato un impiegato a caso, e che questo impiegato ha risposto che
rimarrebbe comunque in azienda. Qual è la probabilità che lavori in quella azienda da 6 a
10 anni?
� "da6a10anni" "rimangono"Bisogna calcolare
Si conosce � "rimangono" "da6a10anni" = 0,333
0,175
0,225
0,075
0,525
� "da6a10anni" � 0,286?
� "da6a10anni" "rimangono" = P "TUVU�4UCCE"∩"WEXUCYZCZ"
P/"WEXUCYZCZ"0
=P "rimangono" "da6a10anni" P("da6a10anni")
P/"rimangono"0 =4,???34, [V
4,5K
Calcolata
precedentemente
Si ha la seguente situazione:
- l'1% della popolazione ha una certa malattia rara;
- un test diagnostico rivela la presenza della malattia all'80% (sensibilità);
- il test diagnostico ha il 90,4% di specificità (negativo su pazienti sani).
Supponiamo di essere risultati positivi al test. Qual è la probabilità che siamo malati?
0,01
0,99
M
S
Test positivo
Test negativo
Test positivo
Test negativo
0,80
0,20
0,096
0,904
� ��(��� �%&�!�&���\�0 � � �%&�!�&���\� ��(��� �/��(���0�/�%&�!�&���\�0
� �%&�!�&���\� � � �%&�!�&���\� ��(���0� ��(��� � � �%&�!�&���\� &���0� &���= 0,80×0,01+ 0,096×0,99 = 0,008 + 0,09504
� ��(��� �%&�!�&���\�0 � 4,[434,4�4,�4?4I =0,07764
Teorema di Bayes
13/04/2015
18
Più in generale, indicata con ! la percentuale di malati (prevalenza), si ottiene:
� ��(��� �%&�!�&���\�0 � 0,80 3 !0,80 3 ! � 0,096 3 /1 � !0
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,0
1
0,0
2
0,0
3
0,0
4
0,0
5
0,0
6
0,0
7
0,0
8
0,0
9
0,1
0,1
1
0,1
2
0,1
3
0,1
4
0,1
5
0,1
6
0,1
7
0,1
8
0,1
9
0,2
0,2
1
0,2
2
0,2
3
0,2
4
0,2
5
� ��(��� �%&�!�&���\�0
!
A volte è sufficiente stabilire
delle semplici disuguaglianze.
Per quale livello di prevalenza della malattia
la probabilità finale
risulterà maggiore di una certa soglia?
� ��(��� �%&�!�&���\�0
0,80 3 !0,80 3 ! � 0,096 3 /1 � !0 A 0,5 ! A 0,048
0,448 � 0,11
nodo
decisionale
M�������
]����
Porta 1 = Non vinci
Porta 2 = Vinci
Porta 3 = Non vinci
Porta 1 = Vinci
Porta 2 = Non vinci
Porta 3 = Vinci
Cambi Non Cambi Totale
Vinci 2 1 3
Non Vinci 1 2 3
Totale 3 3 6
Cambi Non cambi Totale
Vinci 33% 17% 50%
Non Vinci 17% 33% 50%
Totale 50% 50% 100%
Cambi Non cambi
Vinci 0,33/0,5×100=66% 0,17/0,5×100=34%
Non Vinci 0,17/0,5×100=34% 0,33/0,5×100=66%
Totale 100% 100%
^ � \���� ^� � ���\����C� ����� ]� � ��������
Cambi Non cambi Totale
Vinci � ^⋂] � ^⋂]� � ^Non Vinci � ^�⋂] � ^�⋂]� � ^�
Totale � ] � ]�
Distribuzione congiunta
Distribuzione condizionata
Cambi Non Cambi
Vinci � ^|] � ^|]�
Non Vinci � ^�|] � ^�|]�
� ^ � � ^ ] � ] � � ^ ]� �/]�0
Il problema di Monty Hill nel film 21
13/04/2015
19
� ^ � � ^ ] � ] � � ^ ]� �/]�0Cambi Non cambi
Vinci 0,33/0,5×100=66% 0,17/0,5×100=34%
Non Vinci 0,17/0,5×100=34% 0,33/0,5×100=66%
Totale 100% 100%
Distribuzione condizionata
Se decidi di cambiare lanciando una
moneta (onesta)…
Posto e si ha ! � �/]0 ` � �/^0
` � 0,66 3 ! � 0,34 3 1 � ! � 0,32 3 ! � 0,34
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
! � �/]0
` � �/^0
Il problema di Monty Hill(Altro punto di vista)
M1= ����)�����%���!����1M2= ����)�����%���!����2M3= ����)�����%���!����3
� a1 � � a2 � � a3 � 1/3* � &�%+(�(�!����1%�(!�%&%������%�!�%!����3
� * a1 � 0,5� * a2 � 1� * a3 � 0
�/a1|*0 ��/a2|*0 � P Q c P/c 0
P/Q0 = �34,???
4,5 � 0,66
� * � 0,5
Conviene cambiare….
� * a1 �/a10�/*0 � 4,534,???
4,5 � 0,34
Può aprire una delle due porte
non scelte da te