120
Calcolo delle Probabilità Paolo Baldi, Università di Roma Tor Vergata McGraw-Hill 2011 Prima parte: soluzioni pag. 3 Seconda parte: risultati degli esercizi proposti pag. 105 Paolo Baldi Calcolo delle Probabilità McGraw-Hill 2011

Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

  • Upload
    buiminh

  • View
    225

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Calcolo delle ProbabilitàPaolo Baldi, Università di Roma Tor Vergata

McGraw-Hill 2011

Prima parte: soluzioni pag. 3

Seconda parte: risultati degli esercizi proposti pag. 105

Paolo BaldiCalcolo delle ProbabilitàMcGraw-Hill 2011

Page 2: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di
Page 3: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

1Soluzioni

1.1 Due modi possibili: possiamo innanzitutto considerare tutti i numeri di telefono comeequiprobabili. Essi sono dunque 9· 107 (9 possibilità per la prima cifra, 10 per le altre 7). Tradi essi quelli chenoncontengono lo 0 sono 9· 97 (9 possibilità per ognuna delle 8 cifre). Laprobabilità che un numero scelto a caso non contenga lo 0 è dunque

9 · 97

9 · 107 =( 9

10

)7= 0.48 .

Alternativamente, indichiamo conAi, i = 2, . . . ,8 l’evento ‘‘la i-esima cifra del numeroda chiamare è diversa da 0’’. La probabilità richiesta è quella dell’intersezione degli eventiAi, i = 2, . . . ,8. Ora P(Ai) = 9

10, i = 2, . . . ,8, poiché è ragionevole supporre che tutte lecifre abbiano la stessa probabilità di apparire alloi-esimo posto. E se supponiamo che i valoridelle diverse cifre che appaiono in un numero siano indipendenti ritroviamo ancora

P(A2 ∩ . . . ∩ A8) = P(A2) . . .P(A8) =( 9

10

)7.

1.2 a) L’insieme dei possibili risultati è costituito da tutti i numeri da 000000 a 999999 (chesono 1 milione). Possiamo scegliere questo insieme come�. Naturalmente su� considereremola distribuzione uniforme di probabilità, poiché non c’è motivo di supporre che alcuni numerisiano più probabili di altri. Poiché� ha cardinalità 1 milione, la probabilità che il biglietto diOle Kamp vinca è 10−6.

b) L’eventoA è costituito da tutti i numeri le cui prime 4 cifre sono 0096, che sono 100.Dunque P(A) = #A

#� = 10−4. Seω ∈ A allora P({ω} ∩ A) = P({ω}) = 10−6 e quindi

P({ω}|A) = P({ω})P(A) = 10−2 = 1

#A . Se inveceω 6∈ A allora l’evento{ω} ∩ A è vuoto eP({ω}|A) = 0. In conclusione la probabilità che un numeroω sia estratto è ora

P({ω}|A) =P({ω} ∩ A)

P(A)={

1#A seω ∈ A0 seω 6∈ A .

Paolo BaldiCalcolo delle ProbabilitàMcGraw-Hill 2011

Page 4: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

4 Parte 1: soluzioni

In altre parole la probabilità condizionale datoA vale 0 se il numeroω non si trova inA, mentretutti i numeri che si trovano inA sono equiprobabili. La probabilità del biglietto di Ole Kampè ora 1

#A , cioè 1100. Se inveceA fosse l’evento costituito dai numeri che iniziano con 00967, la

probabilità P( |A) varrebbe110 (cioè sempre1

#A ) per tutti i bigliettiω le cui cifre iniziano con00967 e 0 per gli altri.

1.3 Risolveremo il problema con due modelli diversi.1) Primo modello. Supponiamo di numerare le palline nell’urna e di indicarleB1,B2,B3,B4,N1, N2, N3. Consideriamo come spazio� l’insieme di tutte le coppie del tipoω = (ω1, ω2),doveω1 eω2 possono prendere i valoriB1, B2, B3, B4, N1, N2 oppureN3; ovvero

� = {B1, B2, B3, B4, N1, N2, N3}2 .

Poiché siamo in una situazione di estrazioni con rimpiazzo è naturale supporre che tutti glielementi di� siano equiprobabili. In questo caso sappiamo che per calcolare la probabilitàdi un eventoA basta contare quanti elementi esso contiene, perché poi si ha P(A) = #A

#� . Inparticolare ogniω ∈ � ha probabilità

P({ω}) =1

#�=

1

72 =1

49·

a) L’eventoA di cui si richiede la probabilità è quello formato dalle coppie(ω1, ω2) per lequaliω1 eω2 sono entrambiB oppure entrambiN . In altre parole

A = {B1, B2, B3, B4}2 ∪ {N1, N2, N3}2

e dunque #A = 42 + 32 = 25 e

P(A) =25

49·

b) Ora si tratta di calcolare la probabilità dell’eventoD delle coppie(ω1, ω2)dove uno almenotraω1 eω2 è diverso daB1, B2, B3, B4. Dunque il complementare diD è l’evento

Dc = {B1, B2, B3, B4}2

e poiché #Dc = 16 allora P(D) = 1 − P(Dc) = 1 − 1649 = 33

49.2) Secondo modello. Consideriamo gli eventi

Z1 = una pallina bianca viene estratta alla prima estrazione

Z2 = una pallina bianca viene estratta alla seconda estrazione

W1 = una pallina nera viene estratta alla prima estrazione

W2 = una pallina nera viene estratta alla seconda estrazione.

Senza preoccuparci per ora di definirlo esplicitamente, è chiaro che, in uno spazio(�,!,P)adeguato a descrivere questa situazione, gli eventiZ1 eZ2 devono risultare indipendenti e così

Page 5: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 1.4 5

pureW1 eW2 (poiché le palline vengono rimesse nell’urna i risultati di estrazioni successivedevono essere indipendenti). Inoltre dovrà essere

P(Z1) = P(Z2) =4

7

P(W1) = P(W2) =3

7

poiché in ogni singola estrazione è ragionevole considerare la distribuzione uniforme di proba-bilità.

a) L’evento ‘‘vengono estratte due palline dello stesso colore’’ non è altro che(Z1 ∩ Z2) ∪(W1 ∩W2). Poiché i due eventiZ1 ∩ Z2 eW1 ∩W2 sono disgiunti (se si estraggono pallinebianche non se ne possono estrarre di nere) e per le relazioni d’indipendenza che abbiamo giàsegnalato, deve essere

P((Z1 ∩ Z2) ∪ (W1 ∩W2)) = P(Z1 ∩ Z2)+ P(W1 ∩W2) =

= P(Z1)P(Z2)+ P(W1)P(W2) =(4

7

)2+(3

7

)2=

25

49·

b) L’evento ‘‘una almeno delle palline estratte è nera’’ con la formulazione appena introdottanon è altro cheW1 ∪W2. Usando la formula della probabilità della unione di eventi (osservarecheW1 eW2 non sono disgiunti) abbiamo

P(W1 ∪W2) = P(W1)+ P(W2)− P(W1 ∩W2) =3

7+

3

7−(3

7

)2=

33

49·

• Questo esercizio mostra che, in generale, lo spazio di probabilità adatto a descrivere unproblema non è unico (pur portando allo stesso risultato). Inoltre qui vediamo l’uso dei due prin-cipali strumenti elementari nella costruzione dello spazio di probabilità, cioè l’equiprobabilitàe l’indipendenza.

Da segnalare l’idea di calcolare la probabilità di un evento spezzandolo nella unione di eventila cui probabilità è facile da calcolare e l’uso della formula, (1.8), della probabilità della riunionedi due eventi non disgiunti.

1.4 Anche questo esercizio può essere risolto in (almeno) due modi, uno usando la formuladelle probabilità totali (1.12), l’altro costruendo esplicitamente lo spazio di probabilità e usandoi metodi del calcolo combinatorio (cioè contando la cardinalità degli eventi).

Come abbiamo già visto negli esempi il metodo della partizione dell’evento certo consiste nelcercare degli eventiA1, . . . , Am disgiunti, tali che la loro unione abbia probabilità 1 e tali cheil calcolo delle probabilità condizionali P(C |Ai) sia facile. In questo caso una buona scelta ècostituita dagli eventiAi =‘‘la prima pallina estratta è la numeroi’’, i = 1, . . . ,6. È chiaroche gli eventiA1, . . . , A6 costituiscono una partizione dell’evento certo (sono disgiunti e la lorounione esaurisce tutte le possibilità). Inoltre P(Ai) = 1

6 per ognii = 1, . . . ,6. Se indichiamoconC l’evento ‘‘le due estrazioni danno luogo a due numeri consecutivi’’, allora si ha

P(C |A2) =2

Page 6: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

6 Parte 1: soluzioni

Infatti dopo la prima estrazione (della pallina con il numero 2) nell’urna sono rimaste 5 pallinee l’eventoC si verifica se vengono estratte le palline numero 1 oppure 3, con probabilità2

5,appunto. Per lo stesso motivo si ha anche

P(C |A3) = P(C |A4) = P(C |A5) =2

Se invece la prima pallina estratta è la numero 1, nell’urna restano sempre 5 palline, ma oral’eventoC si verifica solo se la seconda estratta è la numero 2, con probabilità1

5. Lo stesso valese la prima pallina estratta è la numero 6, perché anche in questo caso si ha lo stesso ‘‘effettodi bordo’’. Dunque

P(C |A1) = P(C |A6) =1

Possiamo ora applicare la formula (1.12):

P(C) = P(C |A1)P(A1)+ . . .+ P(C |A6)P(A6) =1

6

(

2 ·1

5+ 4 ·

2

5

)

=1

Secondo modo: se poniamoE = {1,2,3,4,5,6}, l’estrazione delle due palline dall’urnaequivale alla scelta a caso di un sottoinsieme di due elementi dell’insiemeE. L’insieme deipossibili risultati dell’esperimento casuale è dunque�=‘‘insieme di tutti i sottoinsiemi di dueelementi diE’’.

Sappiamo dalle formule del calcolo combinatorio (Proposizione 1.24) che #� =(62

)

= 15.L’eventoC corrisponde in questo modello al sottoinsieme di� dei sottoinsiemi diE formati dadue elementi consecutivi. Poiché la cardinalità di� è piccola possiamo semplicemente passarein rivista tutti i possibili sottoinsiemi di due elementi e trovare cheC è formato dai sottoinsiemi{1,2}, {2,3}, {3,4}, {4,5}, {5,6}. Dunque la cardinalità diC è uguale a 5 e P(C) = 5

15 = 13.

Osserviamo che gli elementi di� sono sottoinsiemi di cardinalità 2 enoncoppie ordinate.Sarebbe stato comunque possibile anche scegliere come spazio� l’insieme delle coppie ordinatedi elementi diE (cioè ledisposizionidi elementi diE a due a due). La cardinalità di� sarebbeperò ora pari a6!

4! = 30 ed il calcolo della cardinalità dell’evento corrispondente aC diventasolo un po’ più complicato.

1.5 a) Indichiamo conω1, ω2 le posizioni dei due amici nella coda. L’insieme{ω1, ω2} èun sottoinsieme di{1, . . . , n} di cardinalità 2. Possiamo dunque considerare come modello diquesto problema l’insieme� dei sottoinsiemi di cardinalità 2 di{1, . . . , n} con la probabilitàuniforme. La cardinalità di� è

(n2

)

= n(n−1)2 (Proposizione 1.24) e l’evento di cui vogliamo

calcolare la probabilità corrisponde al sottoinsiemeA ⊂ � formato dagli{ω1, ω2} tali che|ω1 − ω2| = k + 1.

Osserviamo che gli elementi di� sono sottoinsiemi e non coppie ordinate, cioè{1,2} e{2,1} rappresentano lo stesso elemento di�. Per rappresentare un elemento di� in manieraunivoca indicheremo un sottoinsieme con la coppia(ω1, ω2) doveω1 è il numero più piccolo,(cioè ω1 < ω2). Per calcolare la probabilità diA è abbastanza naturale usare la formuladelle probabilità totali (1.12) usando la partizioneA1, . . . , An, doveAi = {ω1 = i} (cioèAi

Page 7: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 1.6 7

corrisponde all’evento ‘‘quello dei due amici che nella coda ha il numero più basso si trova alloi-esimo posto’’). È facile vedere che

A ∩ Ai ={(i, i + k + 1) sei + k + 1 ≤ n

∅ altrimenti

ovveroA ∩ Ai contiene un solo elemento sei + k + 1 ≤ n ed è vuoto altrimenti. Quindi

P(A ∩ Ai) ={ 1

#�sei ≤ n− k − 1

0 altrimenti

e dunque

P(A) = P(A ∩ A1)+ . . .+ P(A ∩ An) =n− k − 1

#�=

2(n− k − 1)

n(n− 1)·

b) Scegliere due palline dall’urna senza rimpiazzo equivale a scegliere un sottoinsieme dicardinalità 2 dall’insieme{1, . . . , n}. Sceglieremo dunque� costituito dai sottoinsiemi dicardinalità 2 di{1, . . . , n} e l’evento di cui vogliamo calcolare la probabilità corrisponde alsottoinsiemeA ⊂ � formato dai sottoinsiemi{ω1, ω2} tali che |ω1 − ω2| = k. Il problemadunque, anche se la sua formulazione è diversa, si riconduce esattamente allo stesso modellodel punto a) (solamente conk al posto dik + 1). Dunque la probabilità richiesta vale

n− k

#�=

2(n− k)

n(n− 1)·

• In particolare scegliendok = 1 otteniamo che la probabilità di estrarre dall’urna duenumeri consecutivi è

2(n− 1)

n(n− 1)=

2

Ciò fornisce una nuova soluzione all’esercizio precedente (dove si avevan = 6).

1.6 Se indichiamo conA e B gli eventi corrispondenti rispettivamente alla presenza delprimo e del secondo difetto, allora P(A) = 0.03,P(B) = 0.07 ed inoltre gli eventiA e Bdevono risultare indipendenti.

a) La probabilità che entrambi i difetti siano presenti è

P(A ∩ B) = P(A)P(B) = 0.03 · 0.07 = 0.0021.

b) La probabilità che uno almeno dei difetti sia presente è

P(A ∪ B) = P(A)+ P(B)− P(A ∩ B) = 0.03+ 0.07− 0.0021= 0.0979.

c) La probabilità che un pezzo abbia il primo difetto sapendo che è difettoso è

P(A|A ∪ B) =P(A ∩ (A ∪ B))

P(A ∪ B)=

P(A)

P(A ∪ B)=

0.03

0.0979= 0.306= 30.6%

Page 8: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

8 Parte 1: soluzioni

(infatti A ⊂ A ∪ B e quindiA ∩ (A ∪ B) = A).d) La probabilità che vi sia uno solo dei difetti sapendo che il pezzo è difettoso è uguale

a 1 meno la probabilità che entrambi i difetti siano presenti (sempre sapendo che il pezzo èdifettoso). Dunque, poichéA ∩ B ⊂ A ∪ B, la probabilità richiesta è

1 − P(A ∩ B |A ∪ B) = 1 −P(A ∩ B)P(A ∪ B)

= 1 −0.0021

0.0979= 0.978= 97.8 .%

1.7 Indichiamo conA1 l’evento ‘‘viene scelta la carta 1’’ (quella con i due lati neri) e conA2 l’evento ‘‘viene scelta la carta 2’’. ConB invece indichiamo l’evento ‘‘viene scelto un latonero’’. È chiaro che P(A1) = P(A2) = 1

2, poiché non vi è motivo di supporre che le due cartenon siano equiprobabili. Inoltre P(B |A1) = 1,P(B |A2) = 1

2, poiché se viene scelta la carta 2,allora vi sono due lati possibili, uno bianco e l’altro nero, entrambi con probabilità1

2. Ancheil secondo lato è nero se si è scelta la carta 1. Dunque la probabilità richiesta non è altro cheP(A1|B) e basta dunque applicare la formula di Bayes:

P(A1|B) =P(B |A1)P(A1)

P(B)·

Resta ora solo da calcolare P(B). Ma con il metodo della partizione dell’evento certo, dato cheA1, A2 è una partizione,

P(B) = P(B ∩ A1)+ P(B ∩ A2) = P(B |A1)P(A1)+ P(B |A2)P(A2) =1

2+

1

4=

3

Dunque P(A1|B) = 23.

1.8 a) Indichiamo conAi, i = 1,2,3 l’evento ‘‘lo i-esimo lancio ha dato 6’’; è chiaro cheP(A1) = P(A2) = P(A3) = 1

6. Ci viene richiesto di calcolare P(A1 ∪ A2 ∪ A3). Gli eventiA1, A2, A3 non sono però disgiunti (ad esempioA1 ∩A2 non è altro che l’evento ‘‘i primi duelanci danno entrambi 6’’) e dunque la probabilità della unione non è uguale alla somma delleprobabilità. Possiamo però sfruttare il fatto che gli eventiA1, A2, A3 sono indipendenti comepure i loro complementari e usare la formula

P(A1 ∪ A2 ∪ A3) = 1 − P(

(A1 ∪ A2 ∪ A3)c)

= 1 − P(Ac1 ∩ Ac2 ∩ Ac3) =

= 1 − P(Ac1)P(Ac2)P(A

c3) = 1 −

(5

6

)3= 0.42

(abbiamo usato le formule di De Morgan, vedi in fondo a pag. 3 del libro).b) Ripetendo questo ragionamento si vede che la probabilità che inn lanci si ottenga 6 almeno

una volta è 1− (56)n. Perché questa quantità sia più grande di 0.9 occorrerà che sia

1 −(5

6

)n

> 0.9

Page 9: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 1.10 9

Cioè, svolgendo la disuguaglianza, 0.1 > (56)n, ovvero, prendendo i logaritmi e dividendo per

log 56,

n > log(0.1)

log 56

e cioè

n > 12.62 .

Attenzione: quando si divide per log56 occorre invertire il verso della disuguaglianza, perché sitratta di una quantità negativa. Dunque deve esseren ≥ 13.

• Da segnalare l’uso della formula P(A) = 1 − P(Ac). Talvolta il calcolo della probabilitàdi Ac è più facile del calcolo diretto della probabilità diA.

1.9 Con la distribuzione ipergeometrica si trova che, se i voti si ripartissero a caso tra icommissari, essi si distribuirebbero come è avvenuto con probabilità

(55

)(30

)

(85

) =1

56= 1.78 .%

Il giudice può probabilmente decidere che l’evento verificatosi è effettivamente troppo impro-babile per essere il frutto del caso. Se invece i 5 voti fossero stati dati da 4 donne e un uomo,la probabilità sarebbe stata

(54

)(31

)

(85

) =15

56= 26.78%

che è un valore abbastanza alto perché l’evento possa non essere giudicato improbabile.

1.10 a) Possiamo considerare le 52 carte del mazzo divise in due gruppi, uno composto dai 4assi e l’altro dalle altre 48 carte. La probabilità di ottenere esattamentek assi, perk = 1,2,3,4,non è altro che la probabilità di ottenerek elementi dal primo gruppo in una estrazione di 5elementisenza rimpiazzo. La distribuzione ipergeometrica dà

pk :=(4k

)( 485−k)

(525

) =4! 48! 5! 47!

k! (4 − k)! (43+ k)! (5 − k)! 52!·

Se indichiamo l’evento ‘‘si ricevono (esattamente)k assi’’ conAk, l’evento ‘‘si ricevono almeno2 assi’’ non è altro che la riunioneA2∪A3∪A4. Poiché gli eventiAk al variare dik = 1,2,3,4sono disgiunti, la probabilità richiestap è allora uguale a P(A2)+P(A3)+P(A4) = p2+p3+p4.Non ci resta che calcolare queste tre quantità, il che si fa con una calcolatrice dopo avere

Page 10: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

10 Parte 1: soluzioni

semplificato al massimo i coefficienti binomiali e i fattoriali che ne risultano:

p2 =(42

)(483

)

(525

) =4! 48! 5! 47!

2! 2! 45! 3! 52!=

5! 47 · 46

52 · 51 · 50 · 49= 0.04

p3 =(43

)(482

)

(525

) =4! 48! 5! 47!

3! 46! 2! 52!=

2 · 5! 47

52 · 51 · 50 · 49= 0.0017

p4 =(44

)(481

)

(525

) =48! 5! 47!

47! 52!=

5!

52 · 51 · 50 · 49= 1.847· 10−5

e dunquep = p2 + p3 + p4 = 0.042. Da notare chep4 = 1.847 · 10−5 è la probabilità diricevere poker d’assi servito.

b) Cominciamo col fissare un colore, quadri ad esempio. La probabilità di ricevere cinquecarte di quadri (cioè colore servito a quadri) si calcola considerando le carte del mazzo ancorasuddivise in due gruppi: le 13 carte di quadri e le altre 39. Le formule della distribuzioneipergeometrica dicono che la probabilità di ricevere 5 carte del primo gruppo e 0 dal secondo è

(135

)(390

)

(525

) =13! 5! 47!

5! 8! 52!=

13 · 12 · 11 · 10 · 9

52 · 51 · 50 · 49 · 48=

11 · 3

17 · 5 · 49 · 16= 4.95 · 10−4 ·

Se indichiamo conA♦ l’evento ‘‘si riceve colore a quadri servito’’ e conA♥, A♣, A♠, glianaloghi eventi per gli altri semi, allora ognuno di questi ha probabilità 4.95 · 10−4, grazie alcalcolo appena fatto. Inoltre la probabilità richiesta non è altro che la probabilità della unioneA♦ ∪A♥ ∪A♣ ∪A♠. Poiché si tratta di eventi disgiunti, la probabilità di ricevere colore servitoè 4· 4.95 · 10−4 = 0.00198= 0.198%.

c) Abbiamo già calcolato in a) la probabilità di ricevere un poker servito di assi. Naturalmentequesta è la stessa che la probabilità di ricevere un poker servito di un altro numero. Poiché inumeri (comprese le figure) sono 13 e poiché gli eventi ‘‘si riceve poker servito di assi’’, ‘‘. . .di2’’, ‘‘ . . .di 3’’ etc. sono tra di loro disgiunti, la probabilità di ricevere un poker servito è ugualea 13· 1.847· 10−5 = 2.4 · 10−4.

• La risoluzione di questo esercizio usa, in modo ripetitivo, solo due idee: il fatto che glieventi considerati si possono ricondurre a un modello di prove ripetute senza rimpiazzo (chepermette di servirsi delle formule della distribuzione ipergeometrica) e il metodo della partizionedell’evento certo: in ognuno dei punti a), b) e c) abbiamo suddiviso l’evento che ci interessavain sottoinsiemi disgiunti, per ciascuno dei quali era facile calcolare la probabilità.

1.11 È facile calcolare la probabilità che le due palline numero 1 vengano estratte insieme:basta considerare le 93 palline presenti nell’urna come suddivise in due gruppi, il primo formatodalle due palline n◦ 1 ed il secondo dalle 91 rimanenti. Si tratta di calcolare la probabilità diestrarre 2 palline dal primo gruppo e 3 dal secondo in cinque estrazioni senza rimpiazzo. Laprobabilità richiesta si può calcolare con le formule della distribuzione ipergeometrica e vale

p =(22

)(913

)

(935

) = 2.34× 10−3 .

Page 11: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 1.11 11

Se ora indichiamo conAi, i = 1,2,3, l’evento ‘‘le due palline numeroi vengono estratte en-trambe’’ è chiaro che i tre eventi hanno la stessa probabilità e dunque P(A1) = P(A2) =P(A3) = p. Inoltre la probabilità richiesta non è altro che la probabilità della riunionedegli eventiA1, A2, A3. Questi non sono però disgiunti, poiché, ad esempio, la cinquina(1,1,2,2,37) si trova sia inA1 che inA2 (ovvero è possibile che simultaneamente venganoestratte le due palline n◦1 e le due n◦2). Possiamo però ricorrere alla formula della probabilitàdella unione di tre eventi non disgiunti (formula (1.9) a pag. 8 del libro).

Chiaramente l’eventoA1 ∩A2 ∩A3 ha probabilità 0 (non è possibile estrarre insieme le duepalline 1, le due 2 e le due 3, visto che ne vengono estratte 5 in totale). Il problema è quindirisolto se sappiamo calcolare P(A1 ∩ A2) (le probabilità delle altre intersezioni è la stessa persimmetria). Ancora usando la distribuzione ipergeometrica (probabilità di estrarre 4 elementidal gruppo{1,1,2,2} ed 1 dal gruppo formato dalle altre 89 palline) si ha

P(A1 ∩ A2) = q =(44

)(891

)

(935

) = 1.71× 10−6

per cui in definitiva la probabilità richiesta è

3p − 3q = 0.007= 0.7% .

b) Cominciamo col calcolare la probabilità di fare terno in un’estrazione normale: ci possiamoancora ricondurre alla distribuzione ipergeometrica (probabilità di estrarre 3 palline dal gruppocomposto dalle palline numero 1,2,3 e 2 da quello composto da tutte le altre):

(33

)(872

)

(905

) = 8.51× 10−5 .

Il calcolo della probabilità di fare terno con l’urna manomessa è un po’ più complicato. Bastaperò dare un’occhiata alla parte finale dell’Esempio 1.28: il numero totale di cinquine è

(935

)

,mentre il numero di cinquine che contengono esattamente una pallina col numero 1, una colnumero 2 e una col numero 3 è (

2

1

)(2

1

)(2

1

)(87

2

)

.

La probabilità di fare terno con l’urna manomessa è dunque

(21

)(21

)(21

)(872

)

(935

) = 5.76× 10−4 .

• Nella soluzione di questo esercizio abbiamo usato due idee utili anche in altre situazioni: laprima consiste nel calcolare la probabilità di un evento scrivendolo come riunione di altri eventie poi usando la formula sulla probabilità della unione di eventi non (necessariamente) disgiunti.La seconda consiste nel ricondursi, se possibile, ad un modello già studiato e universale (cioèche può applicarsi a molte situazioni diverse) come quello delle prove ripetute senza rimpiazzo,che dà luogo alla distribuzione ipergeometrica.

Page 12: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

12 Parte 1: soluzioni

1.12 a) Indichiamo conEi, i = 1, . . . , n, l’evento ‘‘la i-esima pallinanon viene messanell’urna 1’’. Per come il problema è stato posto gli eventiEi si possono supporre indipendenti;inoltre, poiché ogni volta ognuna delle tre urne ha la stessa probabilità di essere scelta, laprobabilità dell’eventoEi è 2

3. L’evento ‘‘l’urna 1 rimane vuota’’ non è altro che l’intersezioneE1 ∩ . . . ∩ En. Quindi

P(E1 ∩ . . . ∩ En) = P(E1) . . .P(En) =(2

3

)n

.

Alternativamente avremmo potuto osservare che siamo in presenza di uno schema di Bernoulli(Esempio 1.20), cioè di una sequenza di prove ripetute e indipendenti ciascuna delle qualiha due possibili risultati:successo(corrispondente in questo caso all’evento ‘‘l’urna 1 vieneprescelta’’) con probabilitàp (= 1

3 nel nostro caso) einsuccessocon probabilità 1−p. Abbiamovisto nell’Esempio 1.20 che in questa situazione la probabilità che non si verifichi nessunsuccesso è appunto(1 − p)n. Il nostro calcolo non è altro che una ridimostrazione di questofatto.

b) La probabilità che una singola pallina non finisca né nell’urna 1 né nella 2 (ovvero chefinisca nell’urna 3) vale1

3. Siamo quindi nella situazione di uno schema successo-insuccessocome lo abbiamo appena descritto conp = 2

3. La probabilità richiesta è dunque(13)n.

c) Consideriamo gli eventi

A1 = l’urna 1 è rimasta vuota

A2 = l’urna 2 è rimasta vuota

A3 = l’urna 3 è rimasta vuota.

L’evento di cui dobbiamo calcolare la probabilità è l’unioneA1 ∪A2 ∪A3 e possiamo usare laformula (1.9) sulla probabilità della unione di tre eventi non disgiunti: l’eventoA1 ∩ A2 ∩ A3ha chiaramente probabilità 0 (non è possibile che tutte e tre le urne restino vuote). Inoltreabbiamo già calcolato le altre probabilità che figurano nella formula: gli eventiA1, A2, A3hanno chiaramente la stessa probabilità, per motivi di simmetria, che vale(2

3)n per il punto a);

così pure le probabilità delle intersezioni a due a due valgono(13)n per il punto b). In conclusione

la probabilità richiesta vale

3(2

3

)n

− 3(1

3

)n

.

• In questo esercizio ritroviamo alcune idee già viste:a) l’uso di modelli standard (in questo caso lo schema successo-insuccesso, o di Bernoulli) a

cui ci si riconduce per sfruttare formule stabilite una volta per tutte;b) il calcolo della probabilità di un evento ottenuta scrivendolo come riunione di altri, la cui

probabilità è facile da calcolare, per poi usare la formula della unione di eventi non disgiunti.Osserviamo infine che in questa risoluzione non abbiamo precisato quale sia lo spazio di

probabilità. Abbiamo semplicemente supposto che ne esistesse uno contenente degli eventiE1, . . . , En, A1, A2, A3 aventi certe proprietà. In realtà sarebbe stato possibile costruire unospazio(�,!,P) adatto, ma ciò avrebbe appesantito lo svolgimento senza renderlo né più chiaro

Page 13: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 1.13 13

né più rigoroso. La costruzione completa dello spazio di probabilità verrà spesso sottintesa neglialtri esercizi.

1.13 a) Indichiamo conAi l’evento ‘‘viene scelta l’urnai-esima’’ e conB l’evento ‘‘vengonoestratte due palline di colori diversi’’; poiché si tratta di estrazioni senza rimpiazzo la probabilitàdi estrarre una pallina bianca e una rossa è data dalla distribuzione ipergeometrica. Poichénell’urnai-esima vi sono 4 pallineR e i pallineB, deve essere

(1.1) P(B |Ai) =(i1

)(41

)

(4+i2

) =8i

(4 + i)(3 + i):= qi .

Inoltre P(Ai) = 110; dunque, con la formula delle probabilità totali (1.12) e una calcolatrice,

P(B) =10∑

i=1

P(B |Ai)P(Ai) =1

10

10∑

i=1

8i

(4 + i)(3 + i)= 0.506.

b) Possiamo applicare la formula di Bayes

P(Ai |B) =P(B |Ai)P(Ai)

P(B)=

qi

10 P(B).

Determinare l’urna più probabile significa trovare il valore dii per cuiqi è massima. Ciò sipuò fare (oltre che con un calcolo numerico con un PC o una calcolatrice) studiando per qualivalori di i si ha qi+1

qi≥ 1. Si trova

qi+1

qi=

8(i + 1)

(5 + i)(4 + i)

(4 + i)(3 + i)

8i=i2 + 4i + 3

i2 + 5i·

La disuguaglianzax2 + 4x + 3

x2 + 5x> 1

è soddisfatta per 0< x < 3; inoltre la frazione è= 1 perx = 3 ed è< 1 perx > 3. Dunque

qi+1 > qi i = 1,2

qi+1 = qi i = 3

qi+1 < qi i = 4, . . . ,10 .

Il massimo dii → qi è quindi raggiunto peri = 3 ei = 4: e urne 3 e 4 sono le più probabili.

1 2 3 4 5 6 7 8 9 10

•• • • • • • • • •

Figura 1.1 Andamento del valore di P(Ai |B) = qi10 P(B) peri = 1, . . . ,10.

Page 14: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

14 Parte 1: soluzioni

c) Basta ripetere gli argomenti dei punti precedenti, solo che ora P(Ai) = 111 peri = 1, . . . ,9

e P(A10) = 211. Dunque

P(B) =1

11

9∑

i=1

qi +2

11q10 = 0.500 .

1 2 3 4 5 6 7 8 9 10

•• • • • • • • •

Figura 1.2 Andamento del valore di P(Ai |B) quando le urne sono 11.

Applicando ancora la formula di Bayes si trova

P(Ai |B) = P(B|Ai)P(Ai)

P(B)·

Ora però P(Ai |B) = 111 P(B) qi peri = 1, . . . ,9 (valore massimo raggiunto ancora peri = 3,4),

mentre P(A10|B) = 211 P(B) q10. Un confronto numerico mostra che ora il valorei = 10 è il

più probabile, poiché P(A3|B) = P(A4|B) = 0.103 mentre P(A10|B) = 0.158.• Gli aspetti importanti di questo esercizio sono l’uso della nozione di probabilità con-

dizionale e della formula di Bayes.

1.14 Vari modi sono possibili (il secondo è in realtà il più semplice).Primo modo: indichiamo conAi, i = 1, . . . , k l’evento ‘‘nelle primei assegnazioni non si

sono avuti conflitti’’. È chiaro cheA1 ⊃ A2 ⊃ . . . ⊃ Ak ed inoltre la probabilità richiesta èproprio P(Ack). Calcoliamo P(Ai |Ai−1). Se l’eventoAi−1 è verificato ciò vuol dire che alleprime i − 1 variabili sono state assegnatei − 1 celle di memoria diverse. Ne restano dunqueliberen− i + 1 e la probabilità di non avere conflitti allai-esima assegnazione è

P(Ai |Ai−1) =n− i + 1

Quindi la probabilità chenonvi siano conflitti è

P(Ak) = P(Ak |Ak−1)P(Ak−1) = P(Ak |Ak−1)P(Ak−1|Ak−2)P(Ak−2) == . . . =

= P(Ak |Ak−1)P(Ak−1|Ak−2) . . .P(A2|A1)P(A1)︸ ︷︷ ︸

=1

=

=n− k + 1

n

n− k + 2

n. . .

n− 1

n=

n!

nk(n− k)!

Page 15: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 1.15 15

e quindi la probabilità che vi sia almeno un conflitto è 1− P(Ak) = 1 − n!nk(n−k)! .

Secondo modo: Scegliere a caso un’assegnazione di variabili alle celle di memoria significascegliere a caso un’applicazione da{1, . . . , k} (l’insieme delle variabili) a valori in{1, . . . , n}(l’insieme delle celle di memoria). Indichiamo con� l’insieme di queste applicazioni. Si puòvedere� come l’insieme dellek-uple(i1, . . . , ik) dovei1, . . . , ik sono numeri interi compresida 1 an (non necessariamente distinti); dunque #� = nk.

L’insiemeB delle assegnazioni chenondanno luogo a conflitto non è altro che l’insieme delleapplicazioniiniettiveda{1, . . . , k} in {1, . . . , n}, ovvero l’insieme dellek-uple(i1, . . . , ik) dovenumerii1, . . . , ik sono distinti. In altre paroleB è l’insieme delle disposizioni din elementi akak ed ha dunque cardinalitàn!

(n−k)! (Proposizione 1.23). Inoltre, poiché si può supporre che tuttele possibili assegnazioni siano equiprobabili, considereremo su� la distribuzione uniforme diprobabilità e dunque la probabilità che non vi siano conflitti è

P(B) =#B

#�=

n!

nk(n− k)!·

Pern = 1000, k = 25, facendo attenzione a semplificare al massimo numeratore e denominatoreper evitare errori di arrotondamento, la probabilità di avere almeno un conflitto è

1 −999

1000

998

1000. . .

976

1000= 0.261= 26.1%

che è una probabilità inaspettatamente elevata per così tante celle di memoria rispetto allevariabili.

• Un esempio classico quando si parla di calcolo combinatorio è quello dei compleannidell’Esempio 1.26: qual è la probabilità che in un gruppo dik persone ve ne siano almeno dueche sono nate nello stesso giorno dell’anno? È abbastanza utile rendersi conto che l’esempio deicompleanni ‘‘è lo stesso’’ di questo appena svolto, nel senso che entrambi si riconducono allostesso modello. In entrambi, infatti, si considera come spazio di probabilità lo stesso insieme� delle k-uple di numeri{i1, . . . , ik} scelti in {1, . . . , n} (n = 365 nel caso dei compleanni)e si deve poi calcolare la cardinalità dello stesso insiemeA delle k-uple formate da numeridiversi tra loro. La morale è che problemi che nascono in situazioni applicative diverse possonoricondursi allo stesso modello (e quindi risolversi con gli stessi calcoli).

1.15 a)A vince se l’ultima pallina rimasta nell’urna è rossa, ovvero se tra le prime 5 palline e-stratte ve ne sono una rossa e quattro nere. Usando la distribuzione ipergeometrica la probabilitàche ciò accada è

(21

)(44

)

(65

) =2 · 5!

6!=

1

Più semplicemente si sarebbe anche potuto osservare che in uno schema di estrazioni senzarimpiazzo la probabilità di avere un determinato risultato alla prima, alla seconda,. . . , allak-esima estrazione è sempre la stessa (vedi l’Esempio 1.30). La probabilità di avere una pallinarossa alla sesta (e ultima) estrazione è dunque la stessa che alla prima e cioè1

3.

Page 16: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

16 Parte 1: soluzioni

b) Se la prima estrazione dà una pallina rossa, nell’urna ne rimangono 4 nere e 1 rossa.A

dunque vince se dalle successive 4 estrazioni risultano tutte palline nere. Ancora la distribuzioneipergeometrica dà come probabilità

(11

)(44

)

(54

) =4!

5!=

1

c) Se indichiamo conD l’evento ‘‘il giocatoreA vince’’ e conE l’evento ‘‘la prima pallinaestratta è rossa’’, allora dobbiamo calcolare P(D ∩ E). Ora P(D ∩ E) = P(D |E)P(E).Ma P(E) = 2

6 = 13 mentre abbiamo calcolato nel punto b) che P(D |E) = 1

5. DunqueP(D ∩ E) = 1

15.

1.16 Il risultato dell’esperimento casuale è una 5-upla{k1, . . . , k5} di numeri compresi tra1 e 100. Poiché le palline sono estratte a caso e con rimpiazzo possiamo considerare tutte le5-uple equiprobabili. Uno spazio di probabilità ragionevole per descrivere questo problemaè dunque lo spazio� formato da queste 5-uple (ovvero il prodotto cartesiano di{1, . . . ,100}moltiplicato per se stesso 5 volte) e munito della distribuzione uniforme di probabilità. Lacardinalità di� è naturalmente 1005; l’evento di cui vogliamo calcolare la probabilità è invecerappresentato dall’insiemeA ⊂ � delle 5-uple(k1, . . . , k5) tali che tra i numerik1, . . . , k5 vene siano almeno due uguali. Il problema è quindi ridotto al calcolo della cardinalità diA. Ilcalcolo diretto non è semplice; ma un attimo di riflessione mostra che il suo complementareAc non è altro che l’insieme delle 5-uple(k1, . . . , k5) tali che i numerik1, . . . , k5 siano tuttidiversi tra loro, ovvero l’insieme delledisposizionidi 100 elementi a 5 a 5; dunque #Ac = 100!

95! .Quindi

P(A) = 1 − P(Ac) = 1 −#Ac

#�=

= 1 −100!

100595!= 1 −

99

100

98

100

97

100

96

100= 0.096= 9.6% .

• Qui vale la stessa osservazione che abbiamo fatto alla fine dell’Esercizio 1.14: il problemadei compleanni, quello dell’assegnazione delle variabili e questo sono ‘‘lo stesso’’ problema,nel senso che si riconducono al calcolo della probabilità dello stesso evento nello stesso modello.

1.17 a) Indichiamo conFA l’evento ‘‘il primo genitore fornisce un allele di tipoA’’ e conA1, A2, A3 rispettivamente gli eventi ‘‘il primo genitore è di tipoAA,Aa, aa rispettivamente’’.Per come il problema è stato posto sarà

P(FA |A1) = 1, P(FA |A2) =1

2, P(FA |A3) = 0

e dunque

P(FA) = P(FA |A1)P(A1)+ P(FA |A2)P(A2)+ P(FA |A3)P(A3) = p +1

2q .

Page 17: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 1.18 17

La probabilità che anche il secondo genitore trasmetta un allele di tipoA sarà la stessa e, sup-ponendo che i geni trasmessi dai due genitori siano indipendenti, otteniamo che un discendentesarà di tipoAA con probabilitàp1 = (p + 1

2q)2. Analogamente esso sarà di tipoaa con

probabilitàr1 = (r + 12q)

2 e di tipoAa con probabilità

q1 = 1 − p1 − r1 = 1 −(

p + 12 q)2 −

(

r + 12 q)2 = 2

(

p + 12 q)(

r + 12 q)

.

b) Alla generazione successiva, la probabilità di osservare dei discendenti di dato tipo geneticosi otterrà dalle formule precedenti, sostituendo ap, q, r i valori p1, q1, r1 appena calcolati.Otteniamo

p2 = (p1 + 12 q1)

2 =(

(p + 12 q)

2 + (p + 12 q)(r + 1

2 q))2 =

=(

(p + 12 q)

(

p + 12 q + r + 1

2 q)

︸ ︷︷ ︸

=1

)2 = (p + 12 q)

2 = p1 .

Con calcoli simili si vede che ancheq2 = q1, r2 = r1. Quindi le proporzioni dei tre genotipirestano costanti in tutte le generazioni successive. In altre parole, nel modello di Hardy-Weinberg la popolazione raggiunge l’equilibrio genetico dopo la prima generazione.

1.18 Tra Est e Ovest vanno ripartite 26 carte di cui 5 atout. Se indichiamo conAi, i =0, . . . ,5 l’evento ‘‘Ovest hai atout’’, allora usando la distribuzione ipergeometrica

P(Ai) =(5i

)( 2113−i

)

(2613

)

e peri = 2

P(A2) =(52

)(2111

)

(2613

) =13 · 3

23 · 5= 0.339

che è la probabilità richiesta.b) Se in Ovest vi sono 2 atout, allora laQ cadrà con due giri di atout solo se in Ovest si trova

anche laQ (altrimenti essa sarebbe terza in Est). Dunque se indichiamo conC l’evento ‘‘laQcade con due giri di atout’’, la quantità P(C |A2) non è altro che la probabilità che laQ si troviin Ovest sapendo che Ovest ha due carte di atout. Quindi P(C |A2) = 2

5.c) Usando il metodo della partizione dell’evento certo:

P(C) =5∑

i=0

P(C ∩ Ai) =5∑

i=0

P(C |Ai)P(Ai)

(dove gli eventiAi sono quelli definiti in a)). In quest’ultima somma vi sono molti termini dicui già conosciamo il valore: sono note infatti le probabilità P(Ai), le probabilità condizionaliP(C |Ai) peri = 2 (calcolata in b)) e peri = 0,5 (uguali a 0 perché se Ovest possiede 5 atoutoppure nessuno, laQ è quinta e non può cadere con solo due giri). Inoltre peri = 1, ripetendo

Paolo BaldiCalcolo delle ProbabilitàMcGraw-Hill 2011

Page 18: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

18 Parte 1: soluzioni

il ragionamento del punto b), P(C |A1) = 15, poiché, se inO vi è un solo atout, laQ cadrà solo

se questo è proprio laQ e ciò si verifica appunto con probabilità15. In modo simile si possonocalcolare le probabilità condizionali peri = 3,4, ma è più semplice osservare che

P(C ∩ A2) = P(C ∩ A3), P(C ∩ A1) = P(C ∩ A4)

per motivi di simmetria: se Ovest ha 2 atout allora Est ne ha 3 e viceversa e la situazione traEst e Ovest è chiaramente simmetrica. Lo stesso vale peri = 1,4. Basta ora sostituire i valorinumerici:

P(A2) = P(A3) =13 · 3

23 · 5= 0.339

P(A1) =13

4 · 23= 0.141

P(C) = 2 (0.2 · 0.141+ 0.4 · 0.339) = 0.328.

d) Si tratta di ripetere gli stessi ragionamenti dei punti precedenti, solo che ora Est e Ovesthanno insieme 3 atout. Se indichiamo ancora conAi, i = 0,1,2,3 gli eventi ‘‘Ovest haiatout’’, allora P(C ∩ A0) = 0 perché se Ovest ha 0 atout, ciò vuole dire che laQ si trova inEst insieme ad altri due atout e non cadrà al giro successivo. Per lo stesso motivo, scambiandoi ruoli di Est e Ovest, P(C ∩ A3) = 0. Dunque

P(C) = P(C ∩ A1)+ P(C ∩ A2) = 2P(C ∩ A1) = 2P(C |A1)P(A1) .

Ora P(C |A1) = 13 perché se Ovest ha un atout laQ cadrà solo se essa è uno di questi. Inoltre

P(A1) =(31

)(2111

)

(2412

) =9

23= 0.391.

Quindi P(C) = 623 = 0.260. La probabilità è un po’ diminuita.

2.1 Supponiamo che il comportamento di ogni singolo passeggero sia indipendente daquello degli altri e poniamoZi = 1 se loi-esimo passeggero si presenta alla partenza eZi = 0altrimenti. Il numero di passeggeri che si presenta alla partenza è dunque lo stesso che il numerodi successi in uno schema di Bernoulli e dunque (Esempio 2.4) segue una legge binomiale.

Il numero di passeggeri che si presenta su un volo in cui si è accettato il massimo di prenotazioniè quindi una v.a.X1 di leggeB(22,0.9) per il primo tipo di aereo ed una v.a.X2 di leggeB(11,0.9) per il secondo. La probabilità di lasciare a terra almeno un passeggero nel volo da20 posti vale

P(X1 ≥ 21) =(

22

21

)

0.921 · 0.1 +(

22

22

)

0.922 = 0.339

mentre vale

P(X2 = 11) =(

11

11

)

0.911 = 0.314

Page 19: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.4 19

per l’altro tipo di aereo. Il rischio è maggiore per il volo da 20 passeggeri.• Il punto chiave della soluzione di questo esercizio consiste nel riconoscere che il problema

si può ricondurre a un modello generale. In questo caso lo schema di Bernoulli.

2.2 SeX indica il numero di volte in cui si ottiene il 6 inn lanci, alloraX ∼ B(n, 16).

Dunquea) la probabilità che in tre lanci il 6 sia uscito due volte è

(32

) 162

56 = 5

72 = 0.07.b) La probabilità che inn lanci il 6 sia uscito 2 volte è

pn =(n

2

)1

62

(5

6

)n−2=n(n− 1)

72

(5

6

)n−2.

Calcolando numericamente si vede che il massimo è raggiunto pern = 11 en = 12. Piùrigorosamente si sarebbe potuto fare uno studio della funzionet → t (t − 1)(5

6)t−2, che è

crescente fino at = 11.49 e poi decrescente; ciò implica che il massimo dipn può essereraggiunto o pern = 11 o pern = 12 e un controllo diretto mostra che entrambi questi valorirealizzano il massimo. Per questi due valori la probabilità vale 0.296.

2.3 Supponiamo che i 24 operatori siano indipendenti. Ognuno di essi ad un dato istantesi troverà in uno stato di collegamento (che indicheremo convenzionalmente con 1) oppure no(0). Quindi seXi indica lo stato delloi-esimo operatore, si modellizza il problema con dellev.a.X1, . . . , X24 indipendenti e di BernoulliB(1, p) conp = 0.6. Sappiamo che la somma din v.a. di Bernoulli indipendentiB(1, p) segue una legge binomialeB(n, p). Quindi il numerototale di utenti collegatiX = X1 + . . .+X24 ha leggeB(24,0.6) ed il problema proposto nonè altro che il calcolo della probabilità

P(X ≥ 20) =24∑

k=20

(24

k

)

0.6k0.424−k = 0.0135= 1.35%.

2.4 a) Il calcolo dip si riconduce alla distribuzione ipergeometrica: probabilità di estrarre1 pallina dal gruppo formato dal solo elemento 67 e 4 dal gruppo degli altri 89 numeri in 5estrazioni senza rimpiazzo:

p =(11

)(894

)

(905

) =5

90=

1

18= 0.0556= 5.56 .%

Poiché è ragionevole supporre che le estrazioni di settimane diverse siano indipendenti tra loro,sappiamo che il numeroT di settimane che trascorrono fino alla prima estrazione del 67 segueuna distribuzione geometrica modificata di parametrop = 1

18. Dunque, ricordando il valoredella speranza matematica di una v.a. geometrica modificata (Esempi 2.38 e)), il numero mediodi settimane prima della prima estrazione è

E(T ) =1

p= 18 .

Page 20: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

20 Parte 1: soluzioni

b) In due modi: poiché le estrazioni di settimane diverse sono indipendenti, il numero di voltein cui il 67 viene estratto in 30 settimane si modellizza come il numero di successi in 30 proveindipendenti con probabilitàp = 1

18 di successo in ogni singola prova. Il numero di estrazioniche contengono il 67 tra i numeri estratti è dunque una v.a. di legge binomialeB(30, p). Laprobabilità di avere 0 successi è dunque

(30

0

)

(1 − p)30 = 0.18 = 18%.

Alternativamente si può osservare che, poiché il primo istanteT di successo in uno schemasuccesso-insuccesso ha una distribuzione geometrica modificata, ricordando le regole di sommadelle serie geometriche (vedi il riquadro pag. 39),

P(T > 30) =∞∑

k=31

p(1 − p)k−1 =p(1 − p)30

1 − (1 − p)= (1 − p)30 .

c) Ancora in due modi: indichiamo conA l’evento ‘‘il 67 non è uscito nelle prime 100estrazioni’’ e conB eC rispettivamente gli eventi ‘‘il 67 esce entro la 101-esima estrazione’’e ‘‘il 67 esce solo dopo la 130-esima estrazione’’. Per ottenere P(B |A) calcoleremo primaP(Bc |A) (qualche volta è più facile calcolare la probabilità del complementare di un evento. . . ).In effetti

P(B |A) = 1 − P(Bc |A) = 1 −P(Bc ∩ A)

P(A)·

L’eventoBc ∩ A è l’evento ‘‘il 67 non esce nelle prime 101 estrazioni’’ ed ha probabilità(1 − p)101 (probabilità di ottenere 0 successi in 101 prove), mentre, per lo stesso motivoP(A) = (1 − p)100. Quindi

P(B |A) = 1 − P(Bc |A) = 1 −(1 − p)101

(1 − p)100 = 1 − (1 − p) = p

cioè la probabilità è la stessa che se le prime 100 estrazioni non avessero avuto luogo, unfatto abbastanza intuitivo dato che le estrazioni sono indipendenti. Allo stesso modo si risolvel’ultima parte del punto c):

P(C |A) =P(C ∩ A)

P(A)=(1 − p)130

(1 − p)100 = (1 − p)30 .

Alternativamente seT , come prima, indica il numero di settimane fino alla prima estrazione del67, allora gli eventiA,B,C appena definiti si possono scrivere

A = {T > 100}, B = {T ≤ 10}, C = {T > 130} .

Per la proprietà di mancanza di memoria della legge geometrica

P(Bc |A) = P(T > 101|T > 100) = P(T > 1) = 1 − p

P(C |A) = P(T > 130|T > 100) = P(T > 30) = (1 − p)30 .

Page 21: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.5 21

d) Il numero di volte in cui il 67 viene estratto in 50 settimane segue una legge binomialeB(50, p) con p = 1

18. Dunque la probabilità che il 67 sia presente almeno 6 volte in 50settimane vale

50∑

k=6

(50

k

)

pk(1 − p)50−k .

Si tratta di una somma di 45 termini che occorre calcolare numericamente. È utile osservareche la relazione

50∑

k=6

(50

k

)

pk(1 − p)50−k = 1 −5∑

k=0

(50

k

)

pk(1 − p)50−k = 1 − 0.94 = 0.06

permette di ricondurre il calcolo alla somma di 6 termini solamente.

2.5 Indichiamo conA l’evento ‘‘viene scelto uno dei dadi truccati’’ e conB ‘‘viene sceltouno dei dadi che non sono truccati’’. Naturalmente P(A) = P(B) = 1

2.a) Con la formula delle probabilità totali (1.12) (A eB formano una partizione dell’evento

certo)

P(X = 3) = P(X = 3|A)P(A)+ P(X = 3|B)P(B) =1

10

1

2+

1

6

1

2=

2

15·

La speranza matematica diX è data da

E(X) =6∑

k=1

kP(X = k) .

Conosciamo già la probabilità di avere 3, ed anche quella di ottenere ognuno dei risultati2,4,5,6, che sarà uguale a quella di avere 3. D’altra parte la probabilità di avere 1 sarà

P(X = 1) = 1 − P(X = 2)− P(X = 3)− . . .− P(X = 6) = 1 − 5 ·2

15=

1

Dunque

E(X) =1

3+

2

15(2 + . . .+ 6) = 3 .

b) SeX eY indicano i risultati del primo e del secondo lancio rispettivamente allora

P(X = 2, Y = 3) = P(X = 2, Y = 3|A)P(A)+ P(X = 2, Y = 3|B)P(B) =

=1

2

( 1

100+

1

36

)

=17

900·

Viceversa se poniamoC = {X = 2, Y = 3}, la probabilità che si tratti di uno dei dadi truccatisapendo che i due lanci hanno dato 2 e 3 non è altro che P(A|C). Per la formula di Bayes

P(A|C) =P(C |A)P(A)

P(C)·

Page 22: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

22 Parte 1: soluzioni

Abbiamo appena calcolato P(C) = 17900 e sappiamo che P(A) = 1

2. Inoltre P(C |A) = 1100,

perché ognuno dei due risultati 2 e 3 ha probabilità110 di essere ottenuto da un dado truccato.

In conclusione

P(A|C) =900

17

1

200=

9

34= 0.26 .

c) No. Per mostrarlo basta trovare dei valorii, j tali che P(X = i, Y = j) 6= P(X = i)P(Y =j). Ad esempio

P(X = 2)P(Y = 3) =2

15

2

15=

4

225=

16

900

che è diverso dal valore di P(X = 2, Y = 3) calcolato in b).• L’intuizione potrebbe spingere a rispondere immediatamente alla domanda c) che le vari-

abili sono indipendenti. Ma abbiamo già visto (vedi il riquadro pag. 13) che in probabilitàl’intuizione, se non adeguatamente addestrata, può portare a conclusioni errate. In questo casol’errore consiste nell’aver trascurato il fatto che il risultato del primo lancio dà informazioni suquale delle due urne sia stata scelta.

2.6 Primo modo: consideriamo la v.a.T =‘‘numero di tentativi necessari’’. La domandaposta in questo esercizio non è altro che il calcolo della legge diT . Per determinarla convieneprima calcolare la quantità P(T > k) = 1 − FT (k), doveFT è la f.r. diT , per poi ricavare ladensità diT con la formula

(1.2) P(T = k) = P(T > k − 1)− P(T > k) .

Ora la probabilità che la chiave giusta non si trovi tra le primek è la stessa che la probabilità diottenere 0 successi ink estrazioni (senza rimpiazzo) sun oggetti, dei quali uno solo corrispondea ‘‘successo’’. Possiamo applicare la distribuzione ipergeometrica e si ha

P(T > k) =(10

)(n−1k

)

(nk

) =(n− 1)!

k!(n− k − 1)!

k!(n− k)!

n!=n− k

n

e usando la (1.2)

P(T = k) =n− k + 1

n−n− k

n=

1

n

ovvero la probabilità di trovare la chiave giusta alk-esimo tentativo è la stessa per ognik e vale1n.Secondo modo: consideriamo un’urna contenenten − 1 palline bianche e una rossa e di

effettuare delle estrazioni senza rimpiazzo. La probabilità richiesta è chiaramente la stessa chequella di estrarre la pallina rossa alk-esimo tentativo. Abbiamo già visto (Esempio 1.30) chequesta probabilità non dipende dak e che vale1

n.

• I due modi in cui abbiamo risolto questo esercizio sono abbastanza diversi. Mentre ilsecondo usa una tecnica tipica del calcolo combinatorio, il primo fa ricorso alla nozione difunzione di ripartizione di una v.a. con un metodo di calcolo che useremo spesso nel seguito(per calcolare la legge di una v.a. si determina prima la f.r., per poi usare la (1.2) o formule

Page 23: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.7 23

simili). Il primo metodo è certo più semplice ed è tipico soprattutto (ma non solo) per v.a. che,come in questo caso, rappresentanotempi d’attesa.

2.7 a) Indichiamo conA, B eC rispettivamente gli eventi ‘‘il pezzo proviene dalla lineaA’’, ‘‘proviene dalla lineaB ’’ e ‘‘il pezzo è difettoso’’. I dati del problema ci permettono diaffermare che

P(A) = 0.3, P(B) = 0.7, P(C |A) = 0.1, P(C |B) = 0.17 .

Inoltre gli eventiA eB costituiscono una partizione dell’evento certo (sono disgiunti e la sommadelle loro probabilità vale 1). Dunque per la formula delle probabilità totali (1.12),

P(C) = P(C |A)P(A)+ P(C |B)P(B) = 0.1 · 0.3 + 0.17 · 0.7 = 0.15 .

b) Se consideriamo una scatola contenente 10 pezzi provenienti dalla lineaA, allora ciascunodi essi può essere difettoso con probabilità 0.1. Possiamo inoltre supporre che ogni pezzo siadifettoso oppure no indipendentemente dagli altri. Dunque il numero di pezzi difettosi in unascatola di 10 proveniente dalla lineaA si modellizza con una v.a. di legge binomialeB(10,0.1).Analogamente se la scatola proviene dalla lineaB il numero di pezzi difettosi seguirà una leggeB(10,0.17). Se ora indichiamo conC1 l’evento ‘‘nella scatola vi è (esattamente) un pezzodifettoso’’, allora avremo

P(C1|A) =(

10

1

)

0.1 · 0.99 = 10 · 0.1 · 0.99 = 0.39

P(C1|B) =(

10

1

)

0.17 · 0.839 = 10 · 0.17 · 0.839 = 0.32 .

La probabilità che un pezzo difettoso provenga dalla lineaA non è altro che la probabilitàcondizionale P(A|C1). Per calcolarla si usa la formula di Bayes:

P(A|C1) =P(C1|A)P(A)

P(C1)·

Nella frazione a destra nella formula precedente conosciamo tutte le quantità che intervengonotranne P(C1). Il calcolo di questa probabilità è però facile, sempre usando la formula delleprobabilità totali (1.12):

P(C1) = P(C1|A)P(A)+ P(C1|B)P(B) = 0.39 · 0.3 + 0.32 · 0.7 = 0.341.

Dunque

P(A|C1) =0.39 · 0.3

0.34= 0.343.

Allo stesso modo

P(B |C1) =P(C1|B)P(B)

P(C1)=

0.32 · 0.7

0.34= 0.657.

Page 24: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

24 Parte 1: soluzioni

È quindi più probabile che la scatola provenga dalla lineaB.

2.8 a) La probabilità vale452 (è un caso particolare dell’Esempio 1.30: è come se facessimo

delle estrazioni senza rimpiazzo da un’urna con 4 palline rosse e 48 nere, la probabilità diestrarre una pallina rossa allak-esima estrazione è la stessa che alla prima estrazione).

b) Indichiamo conT il numero di carte necessario per ottenere il primo asso: dobbiamocalcolare la legge diT . Come abbiamo visto uno dei metodi possibili consiste nel calcolopreliminare della f.r. oppure della ‘‘funzione di sopravvivenza’’k → P(T > k). È questospesso il caso quando, come ora, si ha a che fare con v.a. che rappresentano tempi di attesa. Oral’evento{T > k} corrisponde al fatto che siano state giratek carte ottenendone 0 dal gruppo dei4 assi ek dal gruppo delle altre 48. Possiamo quindi applicare la distribuzione ipergeometricache dà

P(T > k) =(40

)(48k

)

(52k

)

e sviluppando i coefficienti binomiali

pk = P(T = k) = P(T > k − 1)− P(T > k) =

=48!

52!

( (52− k + 1)!

(48− k + 1)!−(52− k)!

(48− k)!

)

=48!

52!

( (52− k + 1)! − (52− k)!(48− k + 1)

(48− k + 1)!

)

=

=48!

52!

( (52− k)![(52− k + 1)− (48− k + 1)]

(48− k + 1)!

)

= 4 ·48!

52!

(52− k)!

(48− k + 1)!·

Per vedere per quali valori dik pk è massima basta osservare che per ogni valore dik si ha

pk

pk+1=

52− k

49− k≥ 1

e dunque la probabilità è massima perk = 1.

2.9 Un attimo di riflessione mostra che la probabilità che tra le 24 figurine acquistate ve nesiano esattamentek di quelle già possedute è la stessa che la probabilità che in un’estrazionesenzarimpiazzo da un’urna contenente 60 palline di un tipo (corrispondenti alle figurine giàpossedute) e 40 di un altro, su 24 palline estratte ve ne sianok del primo tipo. La probabilità diquesto evento è data dalla distribuzione ipergeometrica e vale

(60k

)( 4024−k

)

(10024

) ·

Dunque la probabilità richiesta è24∑

k=20

(60k

)( 4024−k

)

(10024

)

Page 25: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.10 25

e con un calcolo numerico si ottiene il valore 0.00594= 0.594%. Il numero medio di nuovefigurine non è altro che la speranza matematica E(X)della v.a.X =‘‘numero di nuove figurine’’.La speranza matematica di una v.a. di legge ipergeometrica è calcolata nell’Esempio 2.39 edè uguale al numero di ‘‘tentativi’’ (qui sono 24) per la probabilità di successo in un singolotentativo (= 40

100 = 25) ovvero

E(X) =48

5= 9.6 .

2.10 a) Supponiamo per semplicitài = 1 (per valori dii diversi da 1 procedimento e risultatosono identici). Si tratta di calcolare

P(X1 = 1|Sn = r) =P(X1 = 1, Sn = r)

P(Sn = r)·

Ser = 0 si vede subito che la probabilità condizionale vale 0, perchéSn ≥ X1 e quindi gli eventi{X1 = 1} e {Sn = 0} hanno intersezione vuota. Altrimenti sappiamo già che il denominatorevale

(nr

)

pr(1 − p)n−r , poichéSn è binomialeB(n, p). Per il numeratore invece

P(X1 = 1, Sn = r) = P(X1 = 1, X1 + . . .+Xn = r) == P(X1 = 1, X2 + . . .+Xn = r − 1) = P(X1 = 1)P(X2 + . . .+Xn = r − 1) =

= p ·(n− 1

r − 1

)

pr−1(1 − p)n−r =(n− 1

r − 1

)

pr(1 − p)n−r

e dunque

P(X1 = 1|Sn = r) =(n−1r−1

)

(nr

) =r

La legge condizionale diX1 datoSn = r è di BernoulliB(1, rn) (e non dipende dap!).

b) Sfruttiamo la stessa idea del punto a). Ser ≥ k abbiamo

P(Sm = k, Sn = r) = P(Sm = k, Sm +Xm+1 + . . .+Xn = r) == P(Sm = k,Xm+1 + . . .+Xn = r − k) = P(Sm = k)P(Xm+1 + . . .+Xn = r − k) =

=(m

k

)

pk(1 − p)m−k(n−m

r − k

)

pr−k(1 − p)n−m−r+k =(m

k

)(n−m

r − k

)

pr(1 − p)n−r .

Quindi P(Sm = k |Sn = r) = 0 sek > r mentre sek ≤ r

P(Sm = k |Sn = r) =P(Sm = k, Sn = r)

P(Sn = r)=(mk

)(n−mr−k

)

(nr

) ·

Riconosciamo una distribuzione ipergeometrica: P(Sm = k |Sn = r) è uguale alla probabilitàdi estrarrek palline di tipo 1 da un’urna contenentem palline di tipo 1 en − m di tipo 2 in restrazioni senza rimpiazzo. Osserviamo ancora che la legge condizionale ottenuta non dipende

Page 26: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

26 Parte 1: soluzioni

dap. Ricordando il valore della media delle v.a. ipergeometriche si ha immediatamente che lamedia della legge condizionale diSm sapendo cheSn = r vale rm

n.

2.11 a) Il numero totale di telefonate ricevute dai due centralini èX + Y ed ha legge diPoisson di parametroλ + µ = 6, per la regola della somma di v.a. indipendenti di Poisson(Esempio 2.28). Dunque la probabilità richiesta è

P(X + Y ≤ 3) = e−6(

1 + 6 +62

2+

63

6

)

= 0.15 .

b) Se indichiamo conpX|X+Y (·|n) la probabilità condizionale diX datoX + Y = n, allora,se 0≤ k ≤ n,

pX|X+Y (k |n) =P(X = k,X + Y = n)

P(X + Y = n)=

P(X = k, Y = n− k)

P(X + Y = n)=

=P(X = k)P(Y = n− k)

P(X + Y = n)=

e−λ λkk! e−µ µn−k

(n−k)!

e−(λ+µ) (λ+µ)nn!

=(n

k

)( λ

λ+ µ

)k( µ

λ+ µ

)n−k.

La legge condizionale è dunque binomialeB(n, λλ+µ ). La sua media è uguale anλ

λ+µ .c) Per il punto precedente la probabilità richiesta vale

pk :=(

8

k

)(1

3

)k(2

3

)8−k.

Per determinare il valore dik per cui questa quantità è massima studiamo per quali valori dik

si hapk+1

pk≥ 1 .

Poichépk+1

pk=

1

2

8 − k

k + 1≥ 1

dallo studio della disuguaglianza si ha che

pk+1

pkè

{> 1 perk = 0,1= 1 perk = 2< 1 perk = 3,4, . . .

Se ne deduce che il massimo valore dipk si raggiunge perk = 2 oppurek = 3.d) La retta di regressione diX rispetto aX + Y èx = az+ b dove

a =Cov(X,X + Y )

Var(X + Y ), b = E(X)− aE(Y ) .

OraCov(X,X + Y ) = Cov(X,X)+ Cov(X, Y )

︸ ︷︷ ︸

=0

= Cov(X,X) = Var(X) = λ

Page 27: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.12 27

mentre Var(X + Y ) = λ+ µ. Dunque

a =λ

λ+ µ

b = λ−λ

λ+ µ(λ+ µ) = 0

La retta dunque èx = λλ+µ z.

• SeX e Y sono v.a. indipendenti e a valori discreti, la legge congiunta diX eX + Y sicalcola sempre con facilità, come in questo esercizio, usando la relazione

P(X = k,X + Y = n) = P(X = k, Y = n− k) = P(X = k)P(Y = n− k) .

2.12 a) Se indichiamo conX il numero di palline rosse estratte dalla prima urna, alloranaturalmenteX ∼ B(n, p). D’altra parte, se indichiamo conA l’evento ‘‘la pallina estratta(dalla seconda urna) è rossa’’ allora naturalmente

P(A|X = k) =k

n

perché seX = k, ciò vuol dire che nella seconda urna vi sonok palline rosse su un totale din.Possiamo ora usare la formula delle probabilità totali:

P(A) =n∑

k=0

P(A|X = k)P(X = k) =n∑

k=0

k

n

(n

k

)

pk(1 − p)n−k =

=1

n

n∑

k=0

k

(n

k

)

pk(1 − p)n−k = p ,

dove abbiamo riconosciuto nella somma la speranza matematica di una v.a.B(n, p).b) Si tratta di calcolare

P(X = k |A) =P(A|X = k)P(X = k)

P(A)·

Vediamo subito che la probabilità condizionale vale 0 perk = 0 mentre sek = 1, . . . , n

P(X = k |A) =1

p

k

n

(n

k

)

pk(1 − p)n−k =(n− 1

k − 1

)

pk−1(1 − p)n−k .

La media della legge condizionale diX sapendo cheA si è verificato è

E(X |A) =n∑

k=1

k

(n− 1

k − 1

)

pk−1(1 − p)n−k .

Page 28: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

28 Parte 1: soluzioni

Per calcolare questa somma conviene cercare di ricondursi alla somma che dà la speranzamatematica delle leggi binomiali; sostituendoi = k − 1 si ha

E(X |A) =n−1∑

i=0

(i + 1)

(n− 1

i

)

pi(1 − p)n−1−i =

=n−1∑

i=0

i

(n− 1

i

)

pi(1 − p)n−1−i

︸ ︷︷ ︸

=media di unaB(n−1,p)=(n−1)p

+n−1∑

i=0

(n− 1

i

)

pi(1 − p)n−1−i

︸ ︷︷ ︸

=1

= (n− 1)p + 1 .

2.13 a) X non è altro che l’istante di primo successo in uno schema di prove ripetuteindipendenti, nelle quali ad ogni prova si ha successo con probabilità1

6. Sappiamo quindi cheX è una v.a. geometrica modificata di parametrop = 1

6, ovvero

P(X = k) =1

6

(5

6

)k−1k = 1,2, . . .

Per lo stesso motivoY è una v.a. geometrica modificata di parametro26 = 1

3. Sappiamo che unav.a. geometrica modificata di parametrop ha speranza matematica1

p(Esempi 2.38); dunque

E(X) = 6, E(Y ) = 3 .

b) Per calcolare la densità discreta diZ conviene calcolarne prima la f.r. Poniamo per sem-plicità p = 1

6 eq = 13. Allora, poichéX eY sono indipendenti,

P(Z ≤ k) = P(max(X, Y ) ≤ k) = P(X ≤ k, Y ≤ k) =

= P(X ≤ k)P(Y ≤ k) =k∑

i=1

p(1 − p)i−1k∑

i=1

q(1 − q)i−1 =

= p1 − (1 − p)k

1 − (1 − p)q

1 − (1 − q)k

1 − (1 − q)= (1 − (1 − p)k)(1 − (1 − q)k) .

perk = 1,2, . . . Dunque la densità diZ, sempre perk = 1,2, . . . , è data da

P(Z = k) = P(Z ≤ k)− P(Z ≤ k − 1) == (1 − (1 − p)k)(1 − (1 − q)k)− (1 − (1 − p)k−1)(1 − (1 − q)k−1) =

= 1 − (1 − p)k − (1 − q)k + [(1 − p)(1 − q)]k+−1 + (1 − p)k−1 + (1 − q)k−1 − [(1 − p)(1 − q)]k−1 =

= p(1 − p)k−1 + q(1 − q)k−1 − (p + q − pq)[(1 − p)(1 − q)︸ ︷︷ ︸

=1−p−q+pq

]k−1 .

Infine

E(Z) =∞∑

k=1

kP(Z = k) =

=∞∑

k=1

kp(1 − p)k−1 +∞∑

k=1

kq(1 − q)k−1 −∞∑

k=1

k(p + q − pq)(1 − p − q + pq)k−1 .

Page 29: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.14 29

Riconosciamo però nella prima serie la speranza matematica diX, cioè 1p

= 6. Per lo stesso

motivo la somma della seconda serie vale1q

= 3 e quella della terza 1p+q−pq = 9

4. Dunque

E(Z) = 6 + 3 −9

4=

27

c) Usiamo il metodo della partizione dell’evento certo: gli eventi{Y = i}, al variare dii = 1,2, . . . , sono disgiunti e la loro unione ha probabilità 1, dunque

P(X ≥ Y ) =∞∑

i=1

P(X ≥ Y, Y = i) =∞∑

i=1

P(X ≥ i, Y = i) =∞∑

i=1

P(X ≥ i)P(Y = i) .

D’altra parte

P(X ≥ i) =∞∑

k=ip(1 − p)k−1 = (1 − p)i−1

e quindi

P(X ≥ Y ) =∞∑

i=1

(1 − p)i−1q(1 − q)i−1 = q

∞∑

i=1

[(1 − p)(1 − q)]i−1 =

=q

1 − (1 − p)(1 − q)=

q

p + q − pq

e sostituendo i valorip = 16, q = 1

3 si ottiene P(X ≥ Y ) = 34.

2.14 a) Fissiamo una letterai e consideriamo l’eventoAi=‘‘la lettera i viene usata’’. Laprobabilità che la letterai non venga usata come prima lettera della parola èn−1

n= 1 − 1

n.

Poiché le apparizioni di una lettera nelle posizioni successive della parola sono indipendenti, laprobabilità che la lettera non venga mai usata sarà(1 − 1

n)k. Dunque

P(Ai) = 1 − (1 − 1n)k .

Sek = n alloraP(Ai) = 1 − (1 − 1

n)n →

n→∞1 − e−1 .

b) Poniamo

Xi ={

1 se la letterai-esima viene utilizzata0 altrimenti .

Il numeroX di lettere utilizzate è dunqueX = X1 + . . .+Xn e il numero medio richiesto è

E(X) = E(X1)+ . . .+ E(Xn) .

D’altra parte le v.a.X1, . . . , Xn sono di Bernoulli e{Xi = 1} = Ai , dove gli eventiAisono quelli definiti nel punto a). Sono dunqueB(1, p) conp = P(Ai) = (1 − 1

n)k. Dunque

E(Xi) = 1 − (1 − 1n)k e

E(X) = n(

1 − (1 − 1n)k)

.

Page 30: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

30 Parte 1: soluzioni

Pern = 21, k = 100 si ha E(X) = 20.84; pern = 21, k = 50 si ha E(X) = 19.17.Se la probabilità di apparizione della letterai èpi , allora la probabilità che la letterai-esima

venga utilizzata divieneP(Ai) = 1 − (1 − pi)

k

e dunque anche E(Xi) = 1 − (1 − pi)k, per cui

E(X) =n∑

i=1

(1 − (1 − pi)k) .

Con i dati numerici assegnati la somma vale

7 ·(

1 − (1 − 328)

100)+ 7 ·(

1 − (1 − 3112)

100)+ 7 ·(

1 − (1 − 1112)

100) = 17.68 .

2.15 a) Poniamo

Zi ={

1 se loi-esimo assicurato deve essere indennizzato0 altrimenti .

Allora il numero totale di indennizzi nel corso del primo anno si modellizza con la v.a.X =Z1 + . . .+ ZN . Poiché le v.a.Zi sono indipendenti si haX ∼ B(N, p). Ma seN è grande ep piccolo, la legge diX si può approssimare con una legge di Poisson di parametroλ = Np.Ripetendo lo stesso ragionamento si vede che ancheY è di Poisson di parametroλ. Poiché sisupponeY indipendente daX, alloraZ = X + Y è di Poisson di parametro 2λ. Calcoliamo lalegge congiunta diX eZ: se 0≤ k ≤ m

P(X = k, Z = m) = P(X = k, Y = m− k) = P(X = k)P(Y = m− k) =

= e−λ λk

k!e−λ λm−k

(m− k)!= e−2λ λm

k!(m− k)!

mentre naturalmente P(X = k, Z = m) = 0 sem < k oppurek < 0.b) La compagnia incassa ogni anno un ammontare pari a5

4pNI e paga in indennizziX · I .Quindi in media il beneficio è

5

4pNI − I · E(X) =

5

4pNI − pNI =

1

4pNI ·

c) La probabilità richiesta si esprime, in termini delle v.a.X eZ come

P({X > 2} ∪ {Z > 3}) = 1 − P(X ≤ 2, Z ≤ 3) == 1 − P(X = 0, Z = 0)− P(X = 0, Z = 1)− P(X = 1, Z = 1)− P(X = 0, Z = 2)+

−P(X = 1, Z = 2)− P(X = 2, Z = 2)− P(X = 0, Z = 3)+−P(X = 1, Z = 3)− P(X = 2, Z = 3) =

= 1 − e−2λ(

1 + λ(1 + 1)+ λ2(12 + 1 + 1

2

)

+ λ3(16 + 1

2 + 12

))

·

Page 31: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.16 31

Sostituendo il valoreλ = Np = 1 si ottiene che la probabilità richiesta vale 0.165.

2.16 a) Dire che il programma deve accedere all’unità 1 significa dire che tra le 40 reg-istrazioni che gli sono necessarie ce n’è almeno una che si trova nel disco 1. Se indichiamoconZ1 il numero di file necessari all’esecuzione del programma che si trovano nell’unità 1, siriconosce facilmente cheZ1 segue una distribuzione ipergeometrica e in particolare, osservandoche i file in totale sono 3000 di cui 100 nell’unità 1, che

P(Z1 = i) =(100i

)(290040−i

)

(300040

) i = 0, . . . ,40 .

La probabilità che l’unità 1 sia necessaria all’esecuzione del programma vale quindi

(1.3)p = P(Z1 > 0) = 1 − P(Z1 = 0) = 1 −

(1000

)(290040

)

(300040

) =

= 1 −2900· 2899· . . . · 2861

3000· 2999· . . . · 2961= 0.745.

b) SeZ indica il numero di file necessari che si trovano nell’unità 1 oppure nell’unità 2,ripetendo il ragionamento del punto a),Z segue anch’essa una distribuzione ipergeometrica,solo che ora considereremo i 3000 file suddivisi nelle due classi formate dalle 200 registrazioniche si trovano in una delle prime due unità disco e dalle altre 2800. Dunque

P(Z = i) =(200i

)(280040−i

)

(300040

) i = 0, . . . ,40

e la probabilità che una delle prime due unità sia necessaria vale ora

(1.4)w = P(Z > 0) = 1 − P(Z = 0) = 1 −

(2000

)(280040

)

(300040

) =

= 1 −2800· 2799· . . . · 2761

3000· 2999· . . . · 2961= 0.938.

Se indichiamo conA1 l’evento ‘‘l’unità 1 è necessaria’’ e conA2 l’analogo evento per l’unità2, abbiamo appena calcolato P(A1 ∪ A2), mentre la probabilità che entrambe le unità sianonecessarie è P(A1∩A2); ma dalla formula della probabilità della unione di due eventi otteniamo

P(A1 ∩ A2) = P(A1)+ P(A2)− P(A1 ∪ A2) = 0.745+ 0.745− 0.938= 0.552 .

c) Le v.a.Yi sono di Bernoulli (prendono solo i valori 0 e 1) di parametrop = P(Yi = 1) =0.745, calcolato in a). L’intuizione vorrebbe che le v.a.Yi non siano indipendenti, perché se, adesempio, fosseY1 = 1 ciò vorrebbe dire che almeno una delle registrazioni si trova nell’unità1 e ciò rende minore la probabilità che siano necessarie le altre unità. Per rendere rigorosaquesta intuizione calcoliamo il coefficiente di correlazione: se esso risulterà diverso da 0 ciò

Page 32: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

32 Parte 1: soluzioni

implicherà che le v.a.Yi, i = 1, . . . ,40 sono correlate e quindi non sono indipendenti e neancheindipendenti a due a due. Il coefficiente di correlazione diY1 eY2 è per definizione

Y1,Y2=

Cov(Y1, Y2)√

Var(Y1)Var(Y2)=

E(Y1Y2)− E(Y1)E(Y2)√

Var(Y1)Var(Y2)·

Sappiamo già che Var(Y1) = Var(Y2) = p(1 − p) ed inoltre che E(Y1)E(Y2) = p2, poichéY1 e Y2 sono entrambeB(1, p). Resta da calcolare E(Y1Y2). Ma anche la v.a.Y1Y2 è diBernoulli, poiché anch’essa può prendere solo i valori 0 oppure 1. Resta dunque da calcolareP(Y1Y2 = 1) = P(Y1 = 1, Y2 = 1). Ma quest’ultima non è altro che la probabilità che sial’unità 1 che la 2 siano necessarie per l’esecuzione del programma e dunque vale 0.552 per ilpunto b). In conclusione

Y1,Y2=

0.552− 0.7452

0.745· 0.255= −0.016

che conferma l’intuizione iniziale di una correlazione negativa tra le variabili. Inoltre il valoredel coefficiente di correlazione, vicino a 0, indica che la dipendenza tra le variabili è abbastanzapiccola.

d) Il calcolo della media diX secondo la definizione di speranza matematica richiederebbepreliminarmente il calcolo della legge diX, che è abbastanza complicato. Si può però osservarecheX = Y1 + . . . + Y30 e dunque E(X) = E(Y1) + . . . + E(Y30) (la speranza matematica diuna somma di v.a. èsempreuguale alla somma delle speranze matematiche, anche se le v.a.non sono indipendenti). Inoltre, poiché leYi sono tutte di BernoulliB(1, p) conp = 0.745,

E(X) = 30 · p = 22.35 .

• Questo esercizio usa alcune idee di cui ci serviamo ripetutamente. Ci limitiamo a segnalareil modo di calcolare la speranza matematica di una v.a.X scrivendo che essa è uguale alla sommaX1 + . . . + Xn, doveX1, . . . , Xn sono v.a. di cui è facile calcolare la speranza matematica.Talvolta questa idea è fondamentale: il calcolo della legge diX, necessario per applicare ladefinizione di speranza matematica, può risultare molto complicato.

2.17 a) Converrà fare i calcoli scrivendon al posto di 90. La probabilità che allak-esimaestrazione si ottenga la pallinai-esima è naturalmente uguale a1

n(Esempio 1.30). In particolare,

scegliendok = i si ha P(Ai) = 1n.

Per studiare l’indipendenza degli eventiAi, i = 1, . . . , n, conviene costruire esplicitamenteuno spazio di probabilità. Una scelta naturale può essere quella di porre� =insieme dellepermutazioni din elementi. Con questo modello si haAi = {ω,ωi = i}, cioèAi corrispondeall’insieme delle permutazioni che lascianoi allo i-esimo posto. Ora

A1 ∩ A2 = {ω,ω1 = 1, ω2 = 2}

e dunqueA1 ∩A2 ha cardinalità(n− 2)! (la cardinalità delle permutazioni che lasciano fissi 1e 2 è la stessa che la cardinalità delle permutazioni di{3, . . . , n}). Dunque

P(A1 ∩ A2) =(n− 2)!

n!=

1

n(n− 1),

Page 33: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.17 33

mentre sappiamo che P(A1)P(A2) = 1n2 . Dunque gli eventiAi, i = 1, . . . , n non sono a due a

due indipendenti e quindi neppure indipendenti.b) Poniamo

Xi ={

1 se si ha coincidenza allai-esima estrazione0 altrimenti .

Allora X = X1 + . . . + Xn ed inoltre le v.a.Xi sono di Bernoulli di parametrop = P(Xi =1) = P(Ai) = 1

n. Per la proprietà di additività della speranza matematica

E(X) = E(X1)+ . . .+ E(Xn) = n ·1

n= 1 .

Dunque il numero medio di coincidenze è 1 qualunque sia il numero di palline nell’urna.c) Sempre con le notazioni del punto b), per la formula della varianza della somma di v.a.

abbiamo

(1.5) Var(X) =n∑

i=1

Var(Xi)+n∑

i,j=1i 6=j

Cov(Xi, Xj ) .

Sappiamo già che Var(Xi) = 1n(1 − 1

n), perché le v.a.Xi sono di Bernoulli di parametro

p = 1n; resta da calcolare Cov(Xi, Xj ) = E(XiXj )− E(Xi)E(Xj ). Quanto vale E(XiXj )? La

v.a.XiXj è di Bernoulli di parametrop = P(XiXj = 1) = P(Xi = 1, Xj = 1); ma

{Xi = 1, Xj = 1} = Ai ∩ Aj

dove gli eventiAi, i = 1, . . . , n sono definiti in a). Per motivi di simmetria la probabilitàdi questi eventi non dipende dai, j (purchéi 6= j ) e sappiamo, dal punto a), che scegliendoi = 1, j = 2,

P(X1 = 1, X2 = 1) = P(A1 ∩ A2) =1

n(n− 1)

per cui

Cov(Xi, Xj ) = Cov(X1, X2) =1

n(n− 1)−

1

n2 ·

Infine osserviamo che nella prima somma della (1.5) vi sonon termini, mentre nella secondan(n− 1). Dunque

Var(X) = n ·1

n

(

1 −1

n

)

+ n(n− 1)( 1

n(n− 1)−

1

n2

)

= 1 .

Anche la varianza del numero di coincidenze è uguale a 1 e non dipende dal numero di palline.• Anche qui l’idea di scrivereX come somma delleXi per calcolare la speranza matematica è

fondamentale. Il calcolo della legge del numero di coincidenzeX, che è abbastanza importantein combinatoria, è in effetti possibile ma non facile.

Paolo BaldiCalcolo delle ProbabilitàMcGraw-Hill 2011

Page 34: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

34 Parte 1: soluzioni

2.18 a) Definiamo i seguenti eventi:

A = {viene scelta l’urnaA}B = {viene scelta l’urnaB}Ri = {alla i-esima estrazione si ottiene una pallina rossa}Ni = {alla i-esima estrazione si ottiene una pallina nera} .

Osserviamo che gli eventiA e B costituiscono una partizione dell’evento certo. Dunque laprobabilità richiesta vale

P(R1) = P(R1 ∩ A)+ P(R1 ∩ B) = P(R1|A)P(A)+ P(R1|B)P(B) .

Per come il problema è stato posto è chiaro che deve essere

P(R1|A) = 1, P(R1|B) = rn, P(A) = P(B) = 1

2

e dunqueP(R1) = 1

2 + 12rn

= 12

(

1 + rn

)

.

b) Indichiamo conC l’evento ‘‘le prime due estrazioni danno palline di colori diversi’’.La probabilità che in due estrazioni dall’urnaA si ottengano una pallina rossa e una nera èchiaramente 0. Invece il numero di palline rosse estratte dall’urnaB in due estrazioni segueuna legge binomialeB(2, r

n). Dunque

P(C |A) = 0

P(C |B) =(

2

1

)r

n

(

1 −r

n

)

= 2r(n− r)

n2

P(C) = P(C |A)P(A)+ P(C |B)P(B) =r(n− r)

n2 ·

c) Indichiamo conT la v.a. ‘‘tempo d’attesa della prima estrazione di una pallina rossa’’.Dobbiamo calcolare la speranza matematica diT e per farlo calcoliamone prima la legge. Ora,sempre con la formula delle probabilità totali (1.12),

P(T = k) = P(T = k |A)P(A)+ P(T = k |B)P(B) .

Ma, poiché l’urnaA contiene solo palline rosse,

P(T = k |A) ={

1 sek = 10 altrimenti

mentre

P(T = k |B) ={

p(1 − p)k−1 sek = 1,2, . . .0 altrimenti

Page 35: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.19 35

dove abbiamo postop = rn

e dunque

E(T ) =∞∑

k=1

kP(T = k) =∞∑

k=1

k(

P(T = k |A)P(A)+ P(T = k |B)P(B))

=

=1

2+

1

2

∞∑

k=1

kp(1 − p)k−1 =1

2

(

1 +1

p

)

=1

2

(

1 +n

r

)

dove abbiamo riconosciuto nell’ultima serie la speranza matematica di una legge geometricamodificata, che vale appunto1

p.

d) PoniamoEk = R1∩ . . .∩Rk. Ek è l’evento ‘‘le primek estrazioni hanno dato tutte pallinerosse’’. La probabilità richiesta non è altro che P(A|Ek). Per la formula di Bayes

P(A|Ek) =P(Ek |A)P(A)

P(Ek)·

Ora P(Ek |A) = 1 mentre P(A) = 12. Resta da calcolare P(Ek). Ancora la formula delle

probabilità totali (1.12) dà

P(Ek) = P(Ek |A)︸ ︷︷ ︸

=1

P(A)+ P(Ek |B)P(B) .

Ma se l’urna prescelta è laB il numero di palline rosse estratte segue una legge binomialeB(k, r

n). Dunque

P(Ek |B) = P(R1|B) . . .P(Rk |B) = ( rn)k

e in conclusione P(Ek) = 12(1 + ( r

n)k) e

P(A|Ek) =1

1 + ( rn)k

·

Pern = 12,r = 4

P(A|Ek) =1

1 + 3−k

e dopo qualche manipolazione algebrica si vede che perché sia

1

1 + 3−k ≥ 0.99

deve essere 3k ≥ 99 e cioèk ≥ 5.

2.19 a) Poniamo

Xi ={

1 se lai-esima pallina finisce nella scatola 10 altrimenti .

Page 36: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

36 Parte 1: soluzioni

La probabilità che una singola pallina finisca nella scatola 1 vale1r

poiché, per come il problemaè posto, possiamo supporre che tutte le scatole abbiano la stessa probabilità di essere scelte.Dunque P(Xi = 1) = 1

re cioèXi ∼ B(1, 1

r). Inoltre le v.a.X1, . . . , Xn si possono supporre

indipendenti.Il numero di palline finite nella scatola 1 è dunqueY1 = X1 + . . .+Xn; se ne ricava cheY1

è binomialeB(n, 1r) per cui la probabilità richiesta vale

P(Y1 = i) =(n

i

)(1

r

)i(

1 −1

r

)n−i.

b) Indichiamo conY1, Y2, Y3 il numero di palline che finiscono rispettivamente nella scatola1, nella 2 e in una qualunque delle scatole dalla 3 allar. Allora la loro legge congiunta èmultinomiale di parametri1

r, 1r,1 − 2

rrispettivamente. Quindi

P(Y1 = i, Y2 = j) =n!

i!j !(n− i − j)!

(1

r

)i(1

r

)j(

1 −2

r

)n−i−j.

2.20 a) Indichiamo conA l’evento ‘‘il messaggio proviene dalla sorgenteA’’ e naturalmenteconB l’evento ‘‘il messaggio proviene dalla sorgenteB ’’. Indichiamo conC l’evento ‘‘unmessaggio di lunghezza 10 contiene 4 bit uguali a 1’’. Si richiede di calcolare P(A|C). Per laformula di Bayes

(1.6) P(A|C) =P(C |A)P(A)

P(C)·

Se il messaggio proviene dalla sorgenteA, allora il numero di bit uguali a 1 segue una leggebinomialeB(n, 1

2). Dunque

P(C |A) =(

10

4

)1

210 ·

Invece se esso proviene dalla sorgenteB il numero di bit uguali a 1 seguirà una leggeB(n, 14).

Dunque

P(C |B) =(

10

4

)(1

4

)4(3

4

)6.

Per il calcolo di P(C) useremo la formula delle probabilità totali:

P(C) = P(C |A)P(A)+ P(C |B)P(B) =

=1

2

(10

4

)1

210 +1

2

(10

4

)(1

4

)4(3

4

)6=

1

2

(10

4

)1

210

(

1 +36

210

)

e dunque, riprendendo la (1.6),

P(A|C) =1

1 + 36

210

= 0.584 .

Page 37: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.21 37

Poiché P(B |C) = 1− P(A|C) = 0.416, la sorgenteA è la più probabile. Se fossen = 100, la(1.6) resta valida, ma ora

P(C |A) =(

100

40

)1

2100

P(C |B) =(

100

40

)(1

4

)40(3

4

)60

per cui

P(C) = P(C |A)P(A)+ P(C |B)P(B) =

=1

2

(100

40

)1

2100 +1

2

(100

40

)(1

4

)40(3

4

)60=

1

2

(100

40

)1

2100

(

1 +360

2100

)

e quindi

P(A|C) =1

1 + 360

2100

= 0.968

e la sorgenteA è di gran lunga la più probabile.b) Basta ripetere i calcoli del punto a) sostituendo P(A) = 0.3,P(B) = 0.7. Quindi

P(C) = P(C |A)P(A)+ P(C |B)P(B) = 0.3 ·(

10

4

)1

210 + 0.7 ·(

10

4

)(1

4

)4(3

4

)6.

Sostituendo nella (1.6) e semplificando

P(A|C) =P(C |A)P(A)

P(C)=

0.3

0.3 + 0.7 36

210

= 0.376

mentre pern = 100

P(A|C) =P(C |A)P(A)

P(C)=

0.3

0.3 + 0.7 360

2100

= 0.928.

Quindi pern = 100 la sorgenteA resta la più probabile, mentre pern = 10 prevale il fatto chea priori la più probabile fosseB.

2.21 a) La legge delle v.a.Xi è data da

p0 = P(Xi = 0) = 14

, p1 = P(Xi = 1) = 12

, p2 = P(Xi = 2) = 14

mentrepk = P(Xi = k) = 0 per gli altri valori dik. La funzione generatrice delle probabilitàdi Xi vale dunque

ψ(t) =1

4+t

2+t2

4=(1

2+t

2

)2.

Page 38: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

38 Parte 1: soluzioni

b) Per il calcolo della legge della somma di v.a. indipendenti tra i metodi possibili c’è l’usodelle funzioni generatrici delle probabilità, che in questo caso sembra praticabile, visto chela f.g.p. calcolata nel punto precedente ha un’espressione semplice. Poiché si tratta di v.a.indipendenti, la f.g.p.ψn di X1 + . . .+Xn vale

ψn(t) = ψ(t)n =(1

2+t

2

)2n.

Per calcolare la densità diX1 + . . . + Xn non resta che sviluppare la funzioneψn(t) con laregola del binomio

ψn(t) =2n∑

k=0

(2n

k

)( t

2

)k(1

2

)2n−k=

2n∑

k=0

(2n

k

)1

22n tk

per cui P(X1 + . . .+Xn = k) =(2nk

) 122n .

L’osservatore acuto avrebbe anche potuto riconoscere che la funzione generatrice delle pro-babilità diXi è quella di una v.a. binomialeB(2, 1

2). DunqueXi ∼ B(2, 12) eX1 + . . .+Xn ∼

B(2n, 12).

2.22 a) Consideriamo le v.a.

Xi ={

1 se loi-esimo lancio dà testa0 se dà croce.

LeXi hanno tutte legge di BernoulliB(1, p) e le v.a.N,X1, X2, . . . possono essere considerateindipendenti. Il numero di teste ottenute si modellizza quindi mediante la somma aleatoriaX = X1 + . . .+ XN , con l’intesa cheX = 0 seN = 0. Per calcolare la legge diX possiamoprima calcolarne la funzione generatrice delle probabilitàψ . Quest’ultima è data dalla formula

ψ(t) = ψN (ψXi (t))

(vedi la Proposizione 2.62) doveψN e ψXi indicano le funzioni generatrici diN e di Xirispettivamente. Ricordando l’espressione delle funzioni generatrici delle probabilità delleleggi di Poisson e di Bernoulli si haψN (z) = eλ(z−1) eψXi (t) = 1 − p + pt . Dunque

ψ(t) = eλ(pt+1−p−1) = eλp(t−1) .

Riconosciamo qui la funzione generatrice delle probabilità di una legge di Poisson di parametroλp, che è quindi la legge cercata. Per lo stesso motivoY è di Poisson di parametroλ(1 − p).

• In realtà il calcolo appena fatto era già stato sviluppato nell’Esempio 2.63. Lo stessorisultato si può ottenere senza l’uso delle f.g., come nell’Esempio 2.32.

b) Come al solito la prova dell’indipendenza diX eY si riconduce al calcolo delle loro leggicongiunte. PoichéX + Y = N , si ha{X = k, Y = m} = {X = k,N = m+ k} e

P(X = k, Y = m} = P(X = k,N = m+ k) = P(X1 + . . .+Xm+k = k,N = m+ k) .

Page 39: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.23 39

Ma le v.a.N,X1, X2, . . . sono indipendenti eX1 + . . .+Xm+k ∼ B(m+ k, p), quindi

P(X = k, Y = m) = P(X1 + . . .+Xm+k = k)P(N = m+ k) =

=(m+ k

k

)

pk(1 − p)me−λ λm+k

(m+ k)!= e−λp (pλ)

k

k!e−λ(1−p) ((1 − p)λ)m

m!=

= P(X = k)P(Y = m)

e quindiX e Y sono indipendenti. In realtà volendo essere precisi il calcolo precedente valesolo quando uno almeno tra i numerik em è> 0. Se entrambi sono nulli il calcolo è comunqueimmediato, tenendo conto del punto a):

P(X = 0, Y = 0) = P(N = 0) = e−λ

P(X = 0)P(Y = 0) = e−λpe−λ(1−p) = e−λ .

2.23 a) Consideriamo, per cominciare, il casok = 1 e poniamo

(1.7) Zi ={

1 se loi-esimo errorenonviene individuato0 altrimenti

peri = 1, . . . , N . È chiaro che il numero di errori rimasti dopo il passaggio del primo revisore èX1 = Z1+. . .+ZN . Poiché, per la natura del problema, si possono supporre le v.a.Z1, . . . , ZNindipendenti ed inoltre P(Zi = 1) = 1 − p, si vede subito cheX1 ∼ B(N,1 − p).

Per studiare la legge diX2, si può osservare cheX2 è ancora una somma di v.a.Zi comenella (1.7), solo che ora l’indicei varia tra 1 eX1 (numero di errori rimasti). OvveroX2 =Z1+. . .+ZX1

. Poiché possiamo supporre le v.a.Zi eX1 indipendenti, sappiamo (Proposizione2.62) che la funzione generatrice delle probabilitàψX2

è data da

ψX2(t) = ψX1

(ψZ1(t)) = (p + (1 − p) (p + (1 − p)t)

︸ ︷︷ ︸

f .g.p. di Z1

)N =

= (p(2 − p)+ (1 − p)2t)N =(

1 − (1 − p)2 + (1 − p)2t)N.

Si riconosce quindi cheX2 è binomialeB(N, (1 − p)2). Ciò suggerisce che la v.a.Xk abbialeggeB(N, (1 − p)k). La verifica rigorosa di questo fatto si può fare per ricorrenza: seXk ∼ B(N, (1 − p)k), alloraXk+1 = Z1 + . . .+ ZXk e dunque

ψXk+1(t) = ψXk (ψZ1

(t)) = (1 − (1 − p)k + (1 − p)k(p + (1 − p)t))N =

= (1 − (1 − p)k+1 + (1 − p)k+1t)N

che è appunto la funzione generatrice delle probabilità di una v.a.B(N, (1 − p)k+1).La probabilità che dopo il lavoro dik revisori restino ancora degli errori è

P(Xk > 0) = 1 − P(Xk = 0) = 1 − (1 − (1 − p)k)N .

Page 40: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

40 Parte 1: soluzioni

b) Se supponiamo che il numeroN di errori sia a sua volta aleatorio il ragionamento è similea quello appena visto: il numero di errori rimasti dopo il lavoro del primo revisore è

X1 = Z1 + . . .+ ZN .

Poiché la funzione generatrice delle probabilità diN èψ(z) = eλ(z−1), quella diX1 è

ψX1(t) = ψN (ψZ1

(t)) = eλ((p+(1−p)t)−1) = eλ(1−p)(t−1)

e quindiX1 è di Poisson di parametroλ(1 − p). Analogamente la funzione generatrice delleprobabilità diX2 = Z1 + . . .+ ZX1

sarà

ψX2(t) = ψX1

(ψZ1(t)) = eλ(1−p)((p+(1−p)t)−1) = eλ(1−p)2(t−1)

per cuiX2 è di Poisson di parametroλ(1 − p)2. Per ricorrenza, come nel punto a) si vede cheXk è di Poisson di parametroλ(1 − p)k.

Con i valori numerici assegnatiX3 segue una legge di Poisson di parametroλ(1 − p)3 =300· 10−3 = 0.3. Dunque la probabilità che restino degli errori è

P(X3 > 0) = 1 − P(X3 = 0) = 1 − e−0.3 = 0.259= 25.9% .

Il numero medio di errori rimasti è

E(X3) = λ(1 − p)3 = 0.3 .

2.24 Perché una funzioneg sia la funzione generatrice di qualche v.a.X occorre che sianosoddisfatte alcune proprietà: essa deve intanto essere sviluppabile in serie di potenze con unintervallo di convergenza che deve contenere [−1,1]. Inoltre tutti i coefficientipk dello sviluppodevono essere≥ 0, poiché deve esserepk = P(X = k); infine deve essereg(1) = 1, perchég(1) =

∑∞k=0pk = 1.

Da quest’ultima condizione si vede chec, se esiste, deve essere uguale a(log 12)

−1 =−(log 2)−1. Per questo valore dic si ha, ricordando lo sviluppo in serie di potenze dellafunzionez → log(1 − z),

g(z) =∞∑

n=1

1

n2n log 2zn

eg è dunque realmente una funzione generatrice (tutti i coefficienti dello sviluppo sono≥ 0).SeX è una v.a. avente funzione generatriceg, allora

P(X = n) =1

n2n log 2·

La media diX si calcola facilmente osservando cheg è derivabile inz = 1 e

E(X) = g′(1) =1

(2 − z) log 2

∣∣∣z=1

=1

log 2·

Page 41: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.2 41

3.1 a) La v.a. X prende i suoi valori, con probabilità 1, nell’intervallo [0,10]: infattiP(0 ≤ X ≤ 10) = F(10)− F(0) = 1.

b) La f.r. F è derivabile a tratti con derivata continua. DunqueX ha densità che si ottienederivando la f.r. La densità è dunque data da

f (t) =

125 t se 0≤ t ≤ 5− 1

25 t +25 se 5≤ t ≤ 10

0 altrimenti .

La densitàf è lineare a tratti ed il suo grafico è dato dalla Figura 1.3.

0 1 2 3 4 5 6 7 8 9 10

0.2

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

Figura 1.3

c) La simmetria del grafico della densità diX suggerisce immediatamente il valore di E(X).Ad ogni modo il calcolo dà

E(X) =∫ +∞

−∞tf (t) dt =

∫ 5

0

1

25t2 dt +

∫ 10

5

(

−1

25t2 +

2

5

)

t dt =

=125

3 · 25−

1000

3 · 25+

125

3 · 25+

100

5−

25

5= 5 .

3.2 a) Calcoliamo la f.r. diZ = X2; poiché la densità diX è> 0 solo pert > 0, si haFZ(t) = 0 pert ≤ 0, mentre pert > 0 essa vale

P(X2 ≤ t) = P(X ≤√t) =

∫√t

0

2x

θe−x2/θ dx = −e−x2/θ

∣∣∣

√t

0= 1 − e−t/θ .

Riconosciamo la f.r. di una legge esponenziale di parametro1θ.

b) Calcoliamo la f.r. diW ; sfrutteremo il fatto che conosciamo già la f.r. diX2. Intantoosserviamo che, poichéX2 è a valori positivi,W prenderà valori tra 0 e 1. Se 0< t < 1

P(e−X2/θ ≤ t) = P(X2 ≥ −θ log t) = e(θ log t)/θ = t .

DunqueW è uniforme su [0,1].• Da notare, in questo esercizio, il calcolo della densità di una v.a. eseguito passando prima

per il calcolo della f.r.: è un metodo semplice e che è possibile applicare in molti casi.

Page 42: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

42 Parte 1: soluzioni

3.3 a) Si ha∫ +∞

−∞f (x) dx = c

∫ +∞

r

x−(λ+1) dx =c

λrλ

e dunque, poiché l’integrale deve valere 1,c = λrλ.b) Calcoliamo la f.r. diY : set > 0

P(Y ≤ t) = P(

log Xr

≤ t)

= P(X ≤ ret ) = λrλ∫ ret

r

x−(λ+1) dx =

= −1

λ

(

(et r)−λ − r−λ)

λrλ = 1 − e−λt .

Y è dunque esponenziale di parametroλ.• Un calcolo tipico che viene richiesto durante la soluzione di molti esercizi è il seguente:

viene data una funzione nella formak · g(x) e si richiede di determinarek in modo chex →k ·g(x) sia una densità di probabilità. La costantek è sempre determinata dal fatto che l’integraledella densità deve valere 1 e dunque

k =( ∫

g(x) dx)−1

.

3.4 Poiché la funzione tangente è monotona crescente nell’intervallo ]− π2 ,

π2 [, il calcolo

della f.r. diY è immediato:

FY (y) = P(tanX ≤ y) = P(X ≤ arctany) = P(

X ∈ ] − π2 ,arctany]

)

= 1π

(

arctany + π2

)

e derivando

fY (y) =1

π (1 + y2)·

3.5 a) Se indichiamo conT1, T2, T3 i tempi di vita dei singoli elementi, è chiaro cheT =min(T1, T2, T3). Il punto a) si riduce quindi al calcolo delle legge del minimo di tre v.a.indipendenti di cui si conosce la legge. Questo problema si può risolvere passando per ilcalcolo della f.r.FT di T , oppure, che è lo stesso, di 1− FT . Ricordando che la f.r. di una v.a.esponenziale di parametroλ vale, set > 0,

F(t) = λ

∫ t

0e−λs ds = 1 − e−λt

si ha facilmente, pert > 0,

1 − FT (t) = P(min(T1, T2, T3) > t) = P(T1 > t, T2 > t, T3 > t) == P(T1 > t)P(T2 > t)P(T3 > t) = e−λte−µte−γ t = e−(λ+µ+γ )t .

Page 43: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.5 43

La v.a. T ha quindi la stessa f.r. di una v.a. esponenziale di parametroλ + µ + γ . È quindianch’essa esponenziale con questo parametro e

E(T ) =1

λ+ µ+ γ= 1.67 .

b) SeT eW sono i tempi di vita di ognuno dei due componenti in parallelo, il tempo di vitadel complesso formato dai due componenti non è altro cheX = max(T ,W). Calcoliamo la f.r.GX di questa v.a. Set > 0

GX(t) = P(max(T ,W) ≤ t) = P(T ≤ t,W ≤ t) = P(T ≤ t)P(W ≤ t) = (1 − e−(λ+µ+γ )t )2

mentreGX(t) = 0 pert ≤ 0. Da quest’espressione si ricava per derivazione la densitàg di X:

gX(t) = GX′(t) = 2(λ+ µ+ γ )e−(λ+µ+γ )t (1 − e−(λ+µ+γ )t )

set > 0, mentre naturalmentegX(t) = 0 set ≤ 0. Infine

E(X) =∫ +∞

0t gX(t) dt = 2(λ+µ+ γ )

(∫ +∞

0te−(λ+µ+γ )t dt −

∫ +∞

0te−2(λ+µ+γ )t dt

)

=

= 2(λ+µ+γ )( 1

(λ+ µ+ γ )2−

1

(2(λ+ µ+ γ ))2

)

=2

λ+ µ+ γ−

1

2(λ+ µ+ γ )= 2.49 .

c) Possiamo ancora dire che il tempoT di vita del complesso della Figura 3.20 è ugualea min(T1, T2, T3), dove però oraT1 è il tempo di vita del componente formato dai primi treelementi in parallelo,T2 quello formato dal secondo elemento,T3 quello formato dagli ultimidue in parallelo. Ripetendo i ragionamenti del punto b) per calcolare la legge del max di variabilialeatorie, si ricava facilmente

P(T1 ≤ t) = (1 − e−λt )3, P(T2 ≤ t) = 1 − e−µt , P(T3 ≤ t) = (1 − e−γ t )2 .

Ripercorrendo i metodi del punto a) per calcolare la legge del min di v.a. abbiamo

P(T > t) = P(T1 > t)P(T2 > t)P(T3 > t) = (1 − (1 − e−λt )3)e−µt (1 − (1 − e−γ t )2) .

Dunque, sviluppando con un po’ di pazienza il quadrato e il cubo si ottiene che la funzione diripartizioneG di T è data da

1 −G(t) = P(T > t) = (3e−λt − 3e−2λt + e−3λt )e−µt (2e−γ t − e−2γ t ) == 6e−(λ+µ+γ )t−6e−(2λ+µ+γ )t+2e−(3λ+µ+γ )t−3e−(λ+µ+2γ )t+3e−(2λ+µ+2γ )t−e−(3λ+µ+2γ )t

e dunque la densità è

g(t) = G′(t) = 6(λ+ µ+ γ )e−(λ+µ+γ )t − 6(2λ+ µ+ γ )e−(2λ+µ+γ )t++2(3λ+ µ+ γ )e−(3λ+µ+γ )t − 3(λ+ µ+ 2γ )e−(λ+µ+2γ )t++3(2λ+ µ+ 2γ )e−(2λ+µ+2γ )t − (3λ+ µ+ 2γ )e−(3λ+µ+2γ )t

Page 44: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

44 Parte 1: soluzioni

da cui, ricordando l’espressione della speranza matematica di una legge esponenziale,

E(T ) =∫ +∞

0g(t) dt =

=6

λ+ µ+ γ−

6

2λ+ µ+ γ+

2

3λ+ µ+ γ−

3

λ+ µ+ 2γ+

3

2λ+ µ+ 2γ−

1

3λ+ µ+ 2γ·

Il calcolo numerico dà il risultato E(T ) = 3.26, sensibilmente migliore che nel caso b).• Da segnalare in questo esercizio il calcolo della legge del massimo di due v.a. indipendenti

effettuato determinandone prima la f.r. Per calcolare la densità del minimo invece si opera inmaniera del tutto analoga usando piuttosto la funzione di sopravvivenza 1− F .

3.6 a)

E(X) =∫ +∞

0x ·

2x

θe−x2/θ dx = −xe−x2/θ

∣∣∣

+∞

0︸ ︷︷ ︸

=0

+∫ +∞

0e−x2/θ dx .

L’ultimo integrale si calcola con il cambio di variabiley√2

= x√θ

in modo da ricondurlo a quello

di e−x2/2:∫ +∞

0e−x2/θdx =

√θ

√2

∫ +∞

0e−y2/2dy =

√θ

2√

2

∫ +∞

−∞e−y2/2dy =

√θ

2√

2

√2π =

√πθ

Per ottenere la varianza calcoliamo prima il momento del second’ordine

E(X2) =2

θ

∫ +∞

0x3e−x2/θ dx .

L’integrale si può fare per parti oppure con il cambio di variabilex2 = y riconducendolo aquello di una densitàŴ(2, 1

θ):

E(X2) =1

θ

∫ +∞

0ye−y/θ dy =

1

θθ2Ŵ(2) = θ

e quindiVar(X) = E(X2)− E(X)2 = θ

(

1 − π4

)

.

b) Una v.a.Y è di Cauchy se ha densità

fY (y) =1

π (1 + y2)·

PerchéY abbia speranza matematica finita deve essere assolutamente convergente l’integrale

∫ +∞

−∞

y

π (1 + y2)dy .

Page 45: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.8 45

L’integrando però per|y| → ∞ tende a zero in modulo come|y|−1 e l’integrale non è dunqueassolutamente convergente.Y quindinonha speranza matematica finita.

c) La speranza matematica è finita se e solo se è convergente l’integrale∫ +∞

r

x · x−(λ+1) dx =∫ +∞

r

x−λ dx

e cioè seλ > 1. Seλ > 1 si trova immediatamente

E(X) = λrλ∫ +∞

r

x−λ dx = −λrλ

λ− 1x−λ+1

∣∣∣

+∞

r=

λr

λ− 1·

Perché la varianza sia finita occorre invece che sia convergente anche l’integrale∫ +∞

r

x2 · x−(λ+1) dx =∫ +∞

r

x−λ+1 dx

e cioè che siaλ > 2. In questo caso si ha

E(X2) = λrλ∫ +∞

r

x−λ+1 dx = −λrλ

λ− 2x−λ+2

∣∣∣

+∞

r=

λr2

λ− 2·

e dunque la varianza vale

Var(X) = E(X2)− E(X)2 =λr2

λ− 2−

λ2r2

(λ− 1)2=λr2(λ− 1)2 − λ2r2(λ− 2)

(λ− 2)(λ− 1)2=

=λr2

(λ− 2)(λ− 1)2·

Perλ → +∞ la media tende ar, mentre la varianza converge a 0.

3.7 Basta osservare che la v.a.X − Y = X + (−Y ) segue una leggeN(0,2) e dunque1√2(X − Y ) ∼ N(0,1). Dunque

P(X > Y) = P(X − Y > 0) = P( 1√

2(X − Y ) > 0

)

= 1 −8(0) = 12

mentre allo stesso modo

P(

X > Y + 12

)

= P(

X − Y > 12

)

= P( 1√

2(X − Y ) > 1

2√

2

)

=

= 1 −8( 1

2√

2

)

= 1 −8(0.35) = 0.36 .

3.8 Se il modello normale è valido, la probabilità che uno studente ottenga un voto superioreal 24 è pari a P(X ≥ 24), doveX ∼ N(21,9). Ma sappiamo che si può scrivereX = 3Z+ 21,doveZ ∼ N(0,1). Dunque

P(X ≥ 24) = P(3Z + 21 ≥ 24) = P(

Z ≥ 24−213

)

= P(Z ≥ 1) = 1 −8(1)

Page 46: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

46 Parte 1: soluzioni

dove8 indica la f.r. di una leggeN(0,1). Uno sguardo alle tavole dà il valore8(1) = 0.84.Dunque la probabilità richiesta è 1−8(1) = 0.16.

Allo stesso modo la probabilità che uno studente ottenga un voto≤ 17 è

P(X ≤ 17) = P(3Z + 21 ≤ 17) = P(

Z ≤ 17−213

)

= P(Z ≤ −1.33) = 8(−1.33) == 1 −8(1.33) = 1 − 0.908= 0.092 .

La probabilità che uno studente non ottenga la sufficienza alla prova scritta è del 9.2%.• L’argomento chiave di questo esercizio è il fatto che seX èN(µ, σ 2), allora si può scrivere

X = σZ + µ, doveZ ∼ N(0,1). Questo metodo, che consiste nel ridursi sempre al caso diuna leggeN(0,1), è quello che conviene usaresempreper calcolare quantità legate alle legginormali.

3.9 La probabilità che un individuo abbia un’altezza superiore ai 190 cm è P(X > 190)doveX ∼ N(175,81). Ma sappiamo che si può scrivereX = 9Z + 175, doveZ ∼ N(0,1).Dunque

P(X > 190) = P(

Z > 190−1759

)

= P(Z > 53) = 1 −8(1.67)

dove8 è la f.r. di una v.a.N(0,1). Uno sguardo alle tavole dà8(1.67) = 0.95 e dunque1 −8(1.67) = 0.05. La percentuale d’italiani di statura> 190 cm sarebbe del 5%.

Allo stesso modo la probabilità che un italiano sia riformato alla visita di leva sarebbe

P(X ≤ 153) = P(

Z ≤ 153−1759

)

= P(

Z ≤ −229

)

= 8(−2.44) = 0.008.

Dunque la percentuale di reclute scartate sarebbe dello 0.8%.

3.10 La probabilità che una bottiglia risulti insufficientemente riempita è P(X < 730).Osserviamo di nuovo che si può scrivereX = σZ + µ conZ ∼ N(0,1). Dunque

P(X < 730) = P(σZ + µ < 730) = P(

Z <730−µσ

)

.

Uno sguardo alle tavole ci informa che, perché questa probabilità sia inferiore a 0.002, occorreche sia730−µ

σ≤ −2.88, ovveroµ ≥ 730+ σ · 2.88 = 802. Se invece la varianza fosse

σ 2 = 400 si otterrebbeµ ≥ 787.6.

3.11 a) k deve essere scelto in modo che l’integrale dif valga 1, cioè deve essere ugualeall’inverso di ∫ +∞

0x3e−x/2 dx .

In questo caso però basta riconoscere chef è una densitàŴ(4, 12) e dunquek = 1

24Ŵ(4)= 1

243!.

b) X + Y ha leggeŴ(8, 12), per la regola della somma di due v.a. Gamma indipendenti.

Sappiamo inoltre che in generale la v.a.aX ha densità

faX(x) =1

|a|f(xa

)

.

Page 47: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.12 47

Dunque nel nostro caso

f2X(x) =1

2fX(x2

)

= kx3

24 e−x/4

ovvero 2X èŴ(4, 14).

3.12 a) La f.r. si calcola con il cambio di variabilesα = u, αsα−1 ds = du: set > 0

F(t) =∫ t

0λαsα−1e−λsαds =

∫ tα

0λe−λudu = 1 − e−λtα .

Per mostrare chef è una densità occorre calcolarne l’integrale e mostrare che esso vale 1. Ma,poiché già abbiamo calcolato la f.r., basta osservare che

∫ +∞

−∞f (s) ds = lim

t→+∞

∫ t

−∞f (s) ds = lim

t→+∞F(t) = 1 .

b) SeX è esponenziale di parametroλ, ricordando i valori delle costanti per le leggi Gamma,si ha

E(Xβ) = λ

∫ +∞

0tβe−λtdt =

λŴ(β + 1)

λβ+1 =Ŵ(β + 1)

λβ·

Per calcolare la legge diXβ usiamo il solito metodo della funzione di ripartizione: seG è laf.r. di Xβ allora, pert > 0,

G(t) = P(Xβ ≤ t) = P(X ≤ t1/β) = 1 − e−λt1/β

da cui si vede cheXβ è di Weibull di parametriλ eα = 1β

(ha la stessa f.r.). Dunque una v.a.Y

di Weibull di parametriλ eα è della formaX1/α, doveX è esponenziale di parametroλ; essaha dunque media

E(Y ) = E(X1/α) =Ŵ(1 + 1

α)

λ1/α ·

Per la varianza, evidentemente

E(Y 2) = E(X2/α) =Ŵ(1 + 2

α)

λ2/α

e

Var(Y ) = E(Y 2)− E(Y )2 =Ŵ(1 + 2

α)− Ŵ(1 + 1

α)2

λ2/α

c) Basta osservare cheŴ(1+2t)−Ŵ(1+ t)2 è la varianza di una v.a. di Weibull di parametriλ = 1 eα = 1

te quindi si tratta di una quantità positiva.

d) Per simulare una v.a. di Weibull di parametriα, λ basta dunque simulare una v.a. espo-nenzialeY di parametroλ e poi porreX = Y 1/α. In maniera equivalente si può anche ricordareda a) (o dall’Esempio 3.48) che la funzione di ripartizione di una v.a. di Weibull è

F(t) = 1 − e−λ tα , t > 0,

Page 48: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

48 Parte 1: soluzioni

È facile ora vedere che, pery > 0, si ha

F−1(y) =(

−1

λlog(1 − y)

)1/α

La funzione di ripartizione in questo caso è quindi invertibile e quindi, come indicato a pag.142,basta porreX = F−1(Z), doveZ è uniforme su [0,1].

3.13 a) Sappiamo che seX ∼ N(µ, σ 2) alloraZ = X − µ ∼ N(0, σ 2). Sappiamo peròche i momenti di ordine dispari delle leggi normali centrate sono tutti nulli, quindi

E((X − µ)3) = E(Z3) = 0

e dunqueγ = 0. In effetti in questo calcolo abbiamo utilizzato unicamente il fatto che lev.a. normali hanno una legge che è simmetrica rispetto alla media, cioè sono tali cheX − µ e−(X − µ) hanno la stessa legge. Per tutte le v.a. con questa proprietà si ha

E[(X − µ)3] = E[−(X − µ)3] = −E[(X − µ)3]

per cui E((X − µ)3) = 0 eγ = 0. Tutte le v.a. simmetriche intorno alla media (cioè tali cheX − µ e−(X − µ) hanno la stessa legge) hanno dunque indice di skewness= 0.

b) Ricordiamo che per una v.a.X ∼ Ŵ(α, λ) il momento di ordinek vale

E(Xk) =Ŵ(α + k)

λkŴ(α)=(α + k − 1)(α + k − 2) . . . α

λk

ovvero per i primi tre momenti:

E(X) =α

λ, E(X2) =

α(α + 1)

λ2, E(X3) =

α(α + 1)(α + 2)

λ3 ·

Sviluppando il binomio di terzo grado (quiµ = αλ

)

E((X − µ)3) = E(X3)− 3E(X2)µ+ 3E(X)µ2 − µ3 =

=1

λ3

(

α(α + 1)(α + 2)− 3α2(α + 1)+ 3α3 − α3) =

λ3

(

α2 + 3α + 2 − 3α2 − 3α + 2α2) =

=2α

λ3 ·

D’altra parte la varianza valeσ 2 = αλ2 per cui

γ =2αλ3

α3/2

λ3

= 2α−1/2 .

Page 49: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.13 49

In particolare l’indice di skewness non dipende daλ e quello di una legge esponenzialeŴ(1, λ)è sempre uguale a 2. Osserviamo anche che la skewness di una leggeŴ è sempre positiva, il cheè in accordo con l’intuizione (il grafico delle densità è sempre come nella Figura 3.21, almenoperα > 1).

c) Useremo sempre lo sviluppo del binomio di terzo grado, ma occorre ora calcolare il mo-mento del terz’ordine di una legge di Poisson. In effetti già conosciamo i momenti di ordineuno: E(X) = λ e di ordine due: E(X2) = Var(X) + E(X)2 = λ + λ2. Il momento di ordinetre può essere ottenuto in modi diversi: intanto direttamente con la definizione:

E(X3) = e−λ∞∑

k=0

k3 λk

k!= e−λ

∞∑

k=1

k2 λk

(k − 1)!= e−λ

∞∑

i=0

(i + 1)2λi+1

i!=

= λe−λ∞∑

i=0

(i2 + 2i + 1)λi

i!= λ(λ2 + λ+ 2λ+ 1) = λ3 + 3λ2 + λ

Oppure anche derivando, a scelta, la funzione caratteristica oppure la funzione generatrice deimomenti. Ricordiamo che, per quest’ultima, si ha (vedi la (3.68))

(1.8)d3

dθ3mX(0) = E(X3) .

La funzione generatrice dei momenti di una v.a. di Poisson di parametroλ è (Esempio 3.71 b))

mX(θ) = eλ(eθ−1) .

Derivando pazientemente

d

dθmX(θ) = λeθeλ(e

θ−1)

d2

dθ2mX(θ) = (λeθ + λ2e2θ )eλ(eθ−1)

d3

dθ3mX(θ) = (λeθ + 3λ2e2θ + λ3e3θ )eλ(eθ−1)

da cui, ponendoθ = 0,

E(X3) =d3

dθ3mX(0) = λ+ 3λ2 + λ3 .

Finalmente

E((X − µ)3) = E(X3)− 3E(X2)µ+ 3E(X)µ2 − µ3 == λ+ 3λ2 + λ3 − 3(λ+ λ2)λ+ 3λ3 − λ3 = λ

e quindi

γ =λ

λ3/2 = λ−1/2 .

Paolo BaldiCalcolo delle ProbabilitàMcGraw-Hill 2007

Page 50: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

50 Parte 1: soluzioni

3.14 a) SeX ∼ N(0,1), ripetendo i calcoli dell’Esempio 3.72,

E(esX) =1

√2π

∫ +∞

−∞esxe−x2/2dx =

=1

√2π

∫ +∞

−∞e− 1

2 (x−s)2dx es

2/2 =↑

y=x−s

es2/2 1

√2π

∫ +∞

−∞e−y2/2dy = es

2/2 .

b1) SeY è lognormale di parametriµ e σ 2, alloraY = eX, doveX ∼ N(µ, σ 2); d’altraparte sappiamo che si può rappresentareX = σZ + µ, doveZ ∼ N(0,1). Dunque, per ilcalcolo precedente

E(Y ) = E(eX) = E(eσZ+µ) = eµeσ2/2 .

Per la varianza invece calcoliamo prima

E[(eX)2] = E[e2X] = E[e2(σZ+µ)] = e2µe2σ2

e dunque

Var(eX) = e2µe2σ2 −(

eµeσ2/2)2 = e2µeσ

2(eσ

2 − 1)

.

1

0.9

..

..

..

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

..

..

..

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

..

..

..

......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

............. .............

.............

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.............

.............

.............

.............

.

.

.

.

.

........

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

.............

..........................

..........................

ւσ2= 1

4

σ2=1ր

Figura 1.4 Grafico della densità lognormale per diversi valori diσ 2 eµ = 0. Da notare che al cresceredi σ 2 la media cresce, come si è visto nell’esercizio, mentre la moda (cioè il punto di massimo delladensità) diventa più piccolo. Sempre perµ = 0, la mediana vale 1 per ogni valore diσ 2.

b2) SeY è lognormale di parametriµ eσ 2 eZ ∼ N(0,1), allora

P(Y ≤ z) = P(eσZ+µ ≤ z) = P(

Z ≤ 1σ(logz− µ)

)

Poiché P(Z ≤ x) = 12 se e solo sex = 0, si ha P(Y ≤ z) = 1

2 se e solo sez = eµ, che dunqueè il valore cercato della mediana. La mediana dunque non dipende daσ 2 e, se si tiene fissoil valore diµ e si fa variareσ 2, la media cresce al crescere diσ 2, mentre la mediana rimanecostante (vedi anche la Figura 1.4).

Page 51: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.17 51

3.15 Nella risoluzione di questo esercizio supporremo che il lettore sappia come simularele v.a.N(0,1) e le esponenziali, come indicato nel paragrafo 3.10.χ2(n) è la legge della somma dei quadrati din v.a. N(0,1). Basterà quindi simularen v.a.

N(0,1) indipendentiX1, . . . , Xn, dopo di cheX21 + . . .+X2

n avrà leggeχ2(n).Ŵ(n, λ) è la legge della somma din v.a. indipendenti ed esponenziali di parametroλ. Queste

si ottengono considerando che, seX è uniforme su [0,1], alloraY = − 1λ

logX è appuntoesponenziale di parametroλ.

Allo stesso modo per ottenere una v.a.Ŵ(n2, λ) si possono sommaren v.a. indipendenticiascuna di leggeŴ(1

2, λ). Per ottenere ciascuna di queste basta osservare che èŴ(12, λ) la

legge del quadrato di una v.a.N(0, 1√2λ) (Esempio 3.42).

3.16 a) La v.a. Y è a valori discreti (interi≥ 0). Inoltre è chiaro cheY = k se e solo sek ≤ X < k + 1. Dunque

P(Y = k} = P(k ≤ X < k + 1) = λ

∫ k+1

k

e−λtdt = e−λk − e−λ(k+1) = e−λk(1 − e−λ) .

Si può riconoscere cheY ha legge geometrica di parametrop = 1 − e−λ e quindi media

e−λ

1 − e−λ ·

b) Simulare una v.a. esponenziale è facile, poiché è esponenziale di parametroλ la v.a.X = − 1

λlogU , doveU è uniforme su [0,1]. Abbiamo ora visto che è geometrica la v.a.⌊X⌋,

che si calcola facilmente a partire daX. Occorre solo scegliereλ in modo che siap = 1− e−λ,cioèλ = − log(1 − p). Dunque la procedura di simulazione è la seguente:

1) Si simula una v.a.U uniforme su [0,1].2) Si pone

X =⌊ 1

log(1−p) logU⌋

che è allora geometrica di parametrop.

3.17 a) Il calcolo delle leggi del massimo o del minimo di v.a. indipendenti è stato vistovarie volte nei Capitoli 2 e 3. Ricordando che la f.r. di una v.a. esponenziale di parametroλ èF(t) = 1− e−λt pert > 0, mentreF(t) = 0 pert < 0, la f.r. diX(3) è data, sempre pert > 0,da

G(t) = P(X(3) ≤ t) = P(X1 ≤ t, X2 ≤ t, X3 ≤ t) == P(X1 ≤ t)P(X2 ≤ t)P(X3 ≤ t) = (1 − e−λt )3

da cui derivando si ottiene la densità diX(3): set > 0,g(t) = G′(t) = 3λe−λt (1− e−λt )2 (pert ≤ 0 naturalmenteg(t) = 0). La speranza matematica diX(3) vale dunque

E(X(3)) = 3λ∫ +∞

0t e−λt (1 − e−λt )2dt =

= 3λ∫ +∞

0t(

e−λt − 2e−2λt + e−3λt) dt =3

λ

(

1 −1

2+

1

9

)

=11

6λ·

Page 52: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

52 Parte 1: soluzioni

Per il calcolo della legge diX(1) invece, seH ne indica la f.r. et > 0,

H(t) = 1 − P(X(1) > t) = 1 − P(X1 > t,X2 > t,X3 > t) == 1 − P(X1 > t)P(X2 > t)P(X3 > t) = 1 − e−3λt .

QuindiX(1) è esponenziale di parametro 3λ ed ha media13λ .

b) Pert fissato poniamo, peri = 1,2,3,

Yi ={

1 seXi ≤ t

0 altrimenti

allora le v.a.Yi sono indipendenti e di Bernoulli di parametrop = P(Xi ≤ t) = 1 − e−λt .PoichéZt = Y1 + Y2 + Y3, alloraZt ∼ B(3,1 − e−λt ).

c) L’idea per il calcolo della f.r.K di X(2) consiste nel collegare la f.r. diX(2) con la leggedi Zt , dato che gli eventi{X(2) ≤ t} e {Zt ≥ 2} sono uguali. Quindi, pert > 0,

K(t) = P(X(2) ≤ t) = P(Zt ≥ 2) = P(Zt = 2)+ P(Zt = 3) == 3(1 − e−λt )2e−λt + (1 − e−λt )3 .

Derivandok(t) = K ′(t) = 6λe−2λt (1 − e−λt )

per cui la speranza matematica diX(2) vale

E(X(2)) = 6λ∫ +∞

0t e−2λt (1 − e−λt ) dt =

5

6λ·

Poiché E(X2) = 1λ, E(X2) > E(X(2)).

d) Se indichiamo conX1, X2 i tempi di vita dei due elementi, il tempo di vita del componenteformato dai due elementi in serie è dato da min(X1, X2) ed il tempo medio è la speranzamatematica di questa v.a.; ripetendo il calcolo fatto in a) per determinare la legge diX(1) si vedefacilmente che la legge di min(X1, X2) è ancora esponenziale ma di parametro 2λ, per cui lasua media vale1

2λ .e) Se indichiamo conX1, X2, X3 il tempo di vita di ciascuno degli elementi, allora chiara-

mente il tempo di vita del componente è dato daX(2) e sappiamo dal punto c) che

E(X(2)) =5

6λ·

3.18 a) Calcoliamo la f.r. diZ: passando in coordinate polari si ha, perz ≥ 0,

FZ(z) = P(Z ≤ z) = P(

(X, Y ) si trova nella palla di centro 0 e raggioz)

=

=1

{x2+y2≤z2}e− 1

2 (x2+y2) dx dy =

1

∫ 2π

0dθ

∫ z

0e−2/2 d = 1 − e−z2/2

Page 53: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.19 53

da cui derivando si ottiene la densità diZ: fZ(z) = ze−z2/2 sez > 0, mentref (z) = 0 perz ≤ 0. Uno sguardo al paragrafo 3.8 mostra che si tratta di una densità di Weibull.

b) Abbiamo appena calcolato la f.r. diZ. Dunque la quantità richiesta è

P(Z > 1) = 1 − FZ(1) = e−1/2 .

3.19 La prima probabilità richiesta si può scrivere P((X, Y ) ∈ A) doveA è la regione delpiano formata dai punti(x, y) tali chexy > 1

2. Limitandoci ai punti che hanno entrambe lecoordinate positive, si vede facilmente che si tratta della regione al di sopra dell’iperbole dellaFigura 1.5.

...

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

....................................................................................................................................

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

ւxy = 12

Figura 1.5

La probabilità richiesta è dunque l’area della porzione di quadrato che si trova inA, cioè ilvalore dell’integrale

∫ 1

12

dx

∫ 1

12x

dy =∫ 1

12

(

1 −1

2x

)

dx =1

2(1 − log 2) .

Inoltre

P(

XY < 14 |X > 1

2

)

=P(XY < 1

4, X > 12)

P(

X > 12

) ·

La porzione della regione{y < 14x , x >

12} che è contenuta nel quadrato è quella ombreggiata

nella Figura 1.6. La probabilità condizionale P(XY < 14 |X > 1

2) è dunque uguale all’areadella superficie ombreggiata divisa per P(X > 1

2) = 12, cioè

2∫ 1

12

dx

∫ 14x

0dy = 2

∫ 1

12

1

4xdx =

1

2log 2 .

12

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

....................................................................................................................................

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.ւxy = 1

4

Figura 1.6

Page 54: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

54 Parte 1: soluzioni

Allo stesso modo si calcola l’ultima probabilità condizionale richiesta

P(

XY > 14 | XY> 2

)

=P(XY > 1

4,XY> 2)

P(XY> 2)

·

La probabilità al denominatore è pari all’area della porzione di quadrato che si trova sotto larettay = x

2 (ed è quindi14), mentre il numeratore è uguale all’area della superficie ombreggiatanella Figura 1.7. Quest’ultima vale

∫ 1

√2

2

dx

∫ x2

14x

dy =∫ 1

√2

2

(x

2−

1

4x

)

dx =1

8(1 − log 2)

e quindi

P(

XY > 14 | XY> 2

)

=1

2(1 − log 2) .

2√2

..................................................................................................................................................................................................................................................................

.................................................................................................................................................................................................................................................................

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

ւxy = 14

ցy = x2

Figura 1.7

• I due esercizi precedenti illustrano come il calcolo della probabilità di eventi legati a piùv.a. si riconduca spesso a quello dell’integrale della densità congiunta su opportune regioni delpiano, ovvero, nel caso di densità uniformi, al calcolo di aree.

3.20 a) Dobbiamo calcolare la probabilità

P(

X2 ≤ min(X1, X3))

.

Ciò si può fare calcolando prima la densitàf di min(X1, X3). Una volta effettuato questocalcolo, indicando conf2 la densità diX2 potremo scrivere

(1.9) P(X2 ≤ min(X1, X3)) =∫

A

f2(x) f (y) dx dy

doveA = {(x, y); x ≤ y} ⊂ R2 è l’insieme dei punti del piano che hanno l’ascissa più piccola

dell’ordinata. Tutto quindi si riconduce al calcolo dif e dell’integrale della (1.9). Se 0≤ t ≤ 1eF indica la f.r. di min(X1, X3), allora

1 − F(t) = P(min(X1, X3) > t) = P(X1 > t)P(X3 > t) .

Page 55: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.21 55

Poiché

P(X1 > t) = P(X2 > t) =∫ 1

t

ds = 1 − t

si ha 1− F(t) = (1 − t)2. QuindiF(t) = 1 − (1 − t)2, per 0≤ t ≤ 1, mentre, naturalmente,F(t) = 0 set < 0 eF(t) = 1 set > 1. La densità di min(X1, X3) si ottiene per derivazione:

f (t) = F ′(t) ={

2(1 − t) se 0≤ t ≤ 10 altrimenti .

Riprendendo la (1.9) e ricordando che la densitàf2 di X2 vale 1 su [0,1] e 0 fuori di [0,1], siha infine

P(X2 ≤ min(X1, X3)) =∫

A

f2(x) f (y) dx dy = 2∫ 1

0(1 − y) dy

∫ y

0dx =

= 2∫ 1

0y(1 − y) dy = 1 −

2

3=

1

b) Se si suddividono i 30 numeri in terzine si vede che in tutte il numero di mezzo è piùpiccolo sia del primo che del terzo. Se il generatore fornisse numeri aleatori uniformi su [0,1] eindipendenti, la probabilità che in una singola terzina il numero in mezzo sia minore degli altridue sarebbe13. La probabilità che ciò succeda per dieci terzine è quindi 3−10 = 1.7 · 10−5. Unvalore così piccolo fa almeno sospettare che i numeri aleatori successivi non siano indipendenti.Il generatore aleatorio quindi meriterebbe qualche controllo.

3.21 a) Se indichiamo conX1, X2, . . . gli intervalli di tempo tra le telefonate successive,allora il tempo di arrivo della seconda telefonata èY = X1 + X2. Y ha dunque una leggeŴ(2, λ), e la sua f.r. è (vedi la (3.52))

FY (t) ={

1 − e−λt (1 + λt) set > 00 altrimenti .

La probabilità richiesta è dunque 1− e−2(1 + 2) = 0.59.b) Occorre determinare la legge condizionale diX1 datoY = T . Per fare ciò useremo il

solito metodo di calcolare prima la densità congiunta diX1 eY , che sarà ottenuta con il teoremadi cambio di variabile. La v.a.(X1, Y ) si ottiene infatti da(X1, X2)mediante la trasformazionelineare associata alla matrice

A =(

1 01 1

)

la cui inversa è

A−1 =(

1 0−1 1

)

La densità congiunta di(X1, X2) è

f (x, y) ={

λ2e−λ(x+y) sex > 0, y > 00 altrimenti .

Page 56: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

56 Parte 1: soluzioni

Poiché detA = 1 la densità di(X1, Y ) = (X1, X1 +X2) è quindi

g(x, y) = f (A−1(xy

)

) = f (x, y − x) .

g(x, y) è dunque= 0 sex ≤ 0 oppurey ≤ x, mentre valeλ2e−λy per 0< x < y. La densitàcondizionale diX1 datoY vale

gX1|Y (x|y) =g(x, y)

fY (y)·

Essa è nulla sex non si trova nell’intervallo ]0, y[ mentre in questo intervallo vale

gX1|Y (x|y) =λ2e−λy

λ2ye−λy =1

Dunque la distribuzione condizionale diX1 dato Y = y è semplicemente la distribuzioneuniforme su ]0, y[. La probabilità che la prima telefonata sia giunta dopo il tempoT

2 sapendoche la seconda è giunta al tempoT è uguale a1

2.

3.22 a) Perchéf sia una densità occorre che sia

f (u, v) du dv = c

∫ +∞

0du

∫ u

0

2u

θe−u2/θv dv =

c

θ

∫ +∞

0u3e−u2/θ du = 1 .

L’ultimo integrale dell’espressione precedente si calcola per parti (vedi comunque il punto a)dell’Esercizio 3.2). Esso vale dunqueθ

2

2 , per cui deve essere

c =2

θ·

b) Un modo per investigare l’indipendenza delle v.a.U e UV

consiste nel calcolo della lorodensità congiunta, per poi verificare che questa si può scrivere come prodotto di due funzioniciascuna delle quali dipende solo da una delle variabili. Il calcolo della legge congiunta diU eUV

si può fare osservando che(

U, UV

)

= φ(U, V )

doveφ è la funzioneφ(u, v) = (u, uv); questa funzione è certo infinite volte derivabile per

u > 0, v > 0: se essa fosse anche invertibile e la sua inversa derivabile potremmo calcolarela densità congiuntag di U e U

Vcon il teorema di cambio di variabile negli integrali multipli,

grazie al quale si ha che

(1.10) g(x, y) = f (φ−1(x, y))| detDφ−1(x, y)| .

Le tappe successive per mostrare cheU e UV

sono indipendenti sono dunque le seguenti: primaoccorre mostrare cheφ è invertibile e calcolarne l’inversa (ovvero calcolarne l’inversa, il che

Page 57: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.23 57

proverà cheφ è invertibile). Poi bisogna calcolare il differenzialeDφ−1 (che in questo caso èuna matrice 2× 2) e il suo determinante. A questo punto avremo la densità congiuntag tramitela (1.10) e vedremo che essa è il prodotto di una funzione della sola variabilex moltiplicataper una funzione della sola variabiley. Come si vede si tratta di un programma abbastanzacomplesso, ma nel quale ogni singola parte non presenta grosse difficoltà.

Per calcolare l’inversa diφ, fissati dei valorix e y dobbiamo determinare dei numeriu e vtali cheφ(u, v) = (x, y). In altre parole dobbiamo risolvere rispetto au ev il sistema

{

u = xuv

= y

che dà facilmenteu = x, v = xy. Dunqueφ−1(x, y) = (x, x

y). È immediato ora il calcolo del

differenziale diφ−1:

Dφ−1(x, y) =(

1 01y

− xy2

)

per cui detDφ−1(x, y) = − xy2 . Abbiamo quindi calcolato tutte le quantità che compaiono nella

(1.10). Sostituendo i valori trovati dobbiamo però ricordare chef (u, v) è= 0 a meno che nonsia 0< v < u. Dunque otteniamof (φ−1(x, y)) = f (x, x

y) = 0 a meno che non siay > 1 e

x > 0. In conclusione

g(x, y) =2

θ

2x

θe−x2/θ1{x>0}(x)1{y>1}(y)

x

y︸ ︷︷ ︸

=f (φ−1(x,y))

x

y2︸︷︷︸

=| detDφ−1(x,y)|

=

=4

θ2 x3e−x2/θ1{x>0}(x)

︸ ︷︷ ︸

funzione della solax

1

y3 1{y>1}(y)

︸ ︷︷ ︸

funzione della solay

e dunqueU e UV

sono indipendenti.• Il metodo di calcolo della densità congiunta (a cui si è talvolta condotti per provare

l’indipendenza di due v.a.) con l’uso il teorema di cambio di variabile negli integrali mul-tipli, illustrato in questo esercizio, è un tecnica che risulta utile in molte situazioni. Si trattadi un calcolo piuttosto complesso ed al quale conviene ricorrere solo quando non ci sono altrepossibilità. Uno sguardo più da vicino mostra però che le diverse tappe del calcolo sono relati-vamente semplici: calcolo dell’inversaφ−1 (spesso l’operazione più difficile), calcolo del suodifferenziale e del determinante di quest’ultimo, sostituzione dei valori nella (1.10).

3.23 Ricordiamo che la media di una v.a. esponenziale di parametroλ è 1λ.

a) Poniamoλ = 110, µ = 1

6. Indichiamo conS1 e S2 i tempi di vita di ciascuno dei dueelementi che compongono il secondo componente. SeT2 è il tempo di vita di quest’ultimo,alloraT2 = max(S1, S2). Se supponiamo cheS1 e S2 siano indipendenti allora abbiamo gi]a‘visto altre volte come si fa il calcolo della f.r. diT2:

P(T2 ≤ t) = P(max(S1, S2) ≤ t) = P(S1 ≤ t, S2 ≤ t) == P(S1 ≤ t)P(S2 ≤ t) = (1 − e−µt )2 .

Page 58: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

58 Parte 1: soluzioni

Derivando otteniamo la densità diT2: f2(t) = 2µe−µt (1 − e−µt ) per t > 0, f2(t) = 0 pert ≤ 0; possiamo quindi calcolare la media

E(T2) =∫ +∞

0tf2(t) dt = 2µ

∫ +∞

0t (e−µt − e−2µt ) dt =

2

µ−

1

2µ=

3

2µ= 9 .

Il secondo componente dura in media meno del primo.b) Indichiamo conT1 il tempo di vita del primo componente e conf1 la sua densità. SeA = {(x, y), x > y} allora dire cheT1 > T2 è lo stesso che dire che(T1, T2) ∈ A. Dunque, secome appare ragionevole supponiamo cheT1 eT2 siano indipendenti,

P(T1 > T2) = P((T1, T2) ∈ A) =∫

A

f1(x)f2(y) dx dy =∫ +∞

02µe−µy(1 − e−µy) dy

∫ +∞

y

λe−λx dx =∫ +∞

02µe−(λ+µ)y(1 − e−µy) dy =

= 2µ∫ +∞

0e−(λ+µ)y dy − 2µ

∫ +∞

0e−(λ+2µ)y dy =

λ+ µ−

λ+ 2µ=

25

52= 0.48

Quindi, nonostante in media duri più, la probabilità che il primo componente resti funzionantepiù a lungo del secondo è minore di1

2. Naturalmente l’integrale doppio precedente si sarebbeanche potuto calcolare integrando prima iny e poi inx, cioè

P(T1 > T2) =∫

A

f1(x)f2(y) dx dy =∫ +∞

0λe−λx dx

∫ x

02µe−µy(1 − e−µy) dy .

Il risultato naturalmente resta lo stesso, ma i conti sono un po’ più complicati.• Da segnalare in questo esercizio il calcolo della probabilità di eventi della forma{T1 > T2}

effettuato usando la densità congiunta, che è un metodo di uso frequente.

3.24 a) I dati del problema permettono di affermare che la densità condizionale diY datoX = x deve esserefY |X(y |x) = xe−xy per y > 0 e fY |X(y |x) = 0 altrimenti. Poichéconosciamo anche la legge diX, possiamo calcolare la legge congiunta di(X, Y ), da cuipotremo ricavare la legge diY , che ne è una marginale, e poi la legge condizionale diX datoY = y. La legge congiunta di(X, Y ) è

f (x, y) = fX(x)fY |X(y |x) ={

λα

Ŵ(α)xαe−(λ+y)x sex > 0, y > 0

0 altrimenti .

Calcoliamo la densità diY come marginale dif . Pery ≤ 0 fY (y) = 0, mentre pery > 0

fY (y) =∫ +∞

−∞f (x, y) dx =

λα

Ŵ(α)

∫ +∞

0xαe−(λ+y)x dx =

λα

Ŵ(α)

Ŵ(α + 1)

(λ+ y)α+1 =

=αλα

(λ+ y)α+1 ·

Page 59: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.25 59

Il valore dell’integrale è stato ottenuto immediatamente riconoscendo che l’integrando è, a menodella costante, una densitàŴ(α + 1, λ+ y).

b) Y ha speranza matematica finita se e solo se è convergente l’integrale∫ +∞

0

y

(λ+ y)α+1 dy .

L’integrando tende a 0 pery → +∞ comey−α ed è quindi convergente se e solo seα > 1.QuindiY non ha speranza matematica finita seα ≤ 1. Se inveceα > 1, integrando per parti siha

E(Y ) = αλα∫ +∞

0

y

(λ+ y)α+1 dy = −λαy

(λ+ y)α

∣∣∣

+∞

0︸ ︷︷ ︸

=0

+∫ +∞

0

λα

(λ+ y)αdy =

= −λα

α − 1

1

(λ+ y)α−1

∣∣∣

+∞

0=

λ

α − 1·

c) La legge condizionale diX datoY = y, y > 0, si ottiene facendo il quoziente tra la densitàcongiunta e quella diY , cioè

fX|Y (x |y) =(λ+ y)α+1

αŴ(α)xαe−(λ+y)x

per x > 0, mentre è uguale a 0 perx ≤ 0. Riconosciamo che la legge condizionale è unaŴ(α + 1, λ+ y). Quindi la sua media valeα+1

λ+y .• Due sono gli aspetti interessanti di questo esercizio: in primo luogo come si usano i dati

del problema per indicare le leggi marginali e/o condizionali delle v.a. che si considerano ecome da queste si ottiene la densità congiunta; poi come dalla densità congiunta si riesce acalcolare tutto il resto.

3.25 a) La v.a.X − Y si può scrivere

X − Y = X + (−Y ) .

Le v.a.X e −Y sono ancora indipendenti ed inoltre−Y ha leggeN(0,1). Per la regola dellasomma di v.a. normali indipendenti,X − Y ha leggeN(0,2).

b) Per calcolare la legge di(X,√

2Y ) basta osservare cheX e√

2Y sono ancora v.a. in-dipendenti. La prima èN(0,1) mentre la seconda èN(0,2). Dunque la densità congiuntaè

g(x, y) =1

2√

2πe−x2/2e−y2/4 .

Avremmo anche potuto osservare che il vettore aleatorio(X,√

2Y ) segue una legge normalemultivariata, essendo una funzione lineare del vettore(X, Y ). La sua legge risulta determinatadal fatto che la matrice di covarianza è

K =(

1 00 2

)

Page 60: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

60 Parte 1: soluzioni

come risulta dal calcolo delle varianze diX e√

2Y e dal fatto cheX e√

2Y sono indipendentie quindi non correlate.

Per il calcolo della legge di(X,X − Y ) osserviamo che si tratta di una v.a congiuntamentegaussiana, essendo una funzione lineare delle v.a.X, Y che sono esse stesse gaussiane.

La legge di(X,X − Y ) resta dunque determinata una volta che se ne conoscano media ematrice di covarianza. È chiaro che E(X) = E(X − Y ) = 0 e dunque anche(X,X − Y ) ècentrata. Per la matrice di covarianzaC basta osservare che

Var(X) = 1

Var(X − Y ) = Var(X)+ Var(−Y ) = 2

Cov(X,X − Y ) = Cov(X,X)︸ ︷︷ ︸

=Var(X)=1

− Cov(X, Y )︸ ︷︷ ︸

=0

= 1 .

Dunque

C =(

1 11 2

)

Avremmo anche potuto ricavare la matrice di covarianzaC mediante la formula

C = AIA∗ =(

1 01 −1

)(

1 10 −1

)

=(

1 11 2

)

(I indica sempre la matrice identità

I =(

1 00 1

)

che è la matrice di covarianza del vettore(X, Y )).In conclusione(X,X − Y ) ha leggeN(0, C).Il calcolo delle marginali si fa immediatamente, poiché sappiamo cheX ∼ N(0,1),

√2Y ∼

N(0,2), X − Y ∼ N(0,2). In particolare le due v.a.(X,X − Y ) e (X,√

2Y ) hanno le stessedistribuzioni marginali ma leggi congiunte diverse.

Per calcolare la legge condizionale diX datoX− Y = z si può usare la definizione, secondola quale

gX|X−Y (x |z) =g(x, z)

gX−Y (z)

doveg indica la densità congiunta diX eX − Y , appena calcolata. Dunque

(1.11) gX|X−Y (x |z) =1

√π

e− 12 (2x

2−2xz+z2)ez2/4 =

1√π

e−(x2−xz− 14 z

2) .

In generale però conviene ricordare che per le leggi condizionali di variabili congiuntamentenormali valgono le (3.89) e (3.90), cioè seU eZ hanno legge congiunta normale, allora la leggecondizionale diU datoZ = z è ancora normale di varianza

σ 2 = Var(U)−Cov(U,Z)2

Var(Z)

Page 61: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.26 61

e media

µ = E(U)+Cov(U,Z)

Var(Z)(z− E(Z)) .

Nel nostro caso, in cuiU = X e Z = X − Y , la densità condizionalex → gX|X−Y (x |z)è dunque normale di mediaµ = z

2 e varianzaσ 2 = 12. Un calcolo diretto mostrerebbe che

l’espressione di questa densità è data proprio dalla (1.11). Questo secondo modo di derivare ladensità condizionale, che vale solo per le v.a. congiuntamente normali, è molto più pratico, adesempio perché fornisce immediatamente il valore della media condizionale,z

2, che altrimentiavrebbe richiesto il calcolo diretto della media della densità data dalla (1.11).

c) Per mostrare cheX − Y eX + Y sono indipendenti si può calcolare, con il teorema dicambio di variabile, la legge congiunta diX − Y eX + Y e vedere che la si può spezzare nelprodotto di due funzioni che dipendono ciascuna da una sola delle variabili. Ma in questo casosappiamo che le v.a.X − Y eX + Y sono congiuntamente normali, essendo funzioni linearidelle v.a.X, Y che sono congiuntamente normali.

Sappiamo inoltre che v.a. congiuntamente normali e non correlate sono indipendenti. Ora

Cov(X − Y,X + Y ) = Cov(X,X)︸ ︷︷ ︸

=Var(X)=1

+ Cov(X, Y )︸ ︷︷ ︸

=0

+ Cov(−Y,X)︸ ︷︷ ︸

=0

+ Cov(−Y, Y )︸ ︷︷ ︸

=− Var(Y )=−1

= 0 .

e dunqueX − Y eX + Y sono non correlate e indipendenti. Il fatto cheX − Y eX + Y sianonon correlate si può vedere anche calcolandone matrice di covarianzaC con la formula

C = AIA∗ =(

1 −11 1

)(

1 1−1 1

)

=(

2 00 2

)

PoichéC è diagonale le due v.a. sono non correlate.

• Questo esercizio mette bene in evidenza alcuni fatti che rendono semplici i calcoli con leleggi normali:

a) La proprietà che la somma di v.a. (reali) normali indipendenti è ancora normale con mediapari alla somma delle medie e varianza uguale alla somma delle varianze.

b) La proprietà che trasformazioni lineari trasformano leggi normali in leggi normali. Questofatto è particolarmente utile perché la legge cercata rimane determinata non appena si sappianocalcolare matrice di covarianza e media (che in questo esercizio era sempre uguale a 0). Il calcolodella matrice di covarianza si fa facilmente o calcolando una per una varianze e covarianze oppureusando la formula che dice che se la v.a.m-dimensionaleZ ha matrice di covarianzaCZ eA èuna matricen × m, allora la v.a.W = AZ ha matrice di covarianzaCW = ACZA

∗ (A∗ è latrasposta), il che riduce il calcolo della matrice di covarianza a quello di un prodotto di matrici.

c) Per ultimo ricordiamo che esistono formule molto semplici che danno, per v.a. congiun-tamente normali, le leggi condizionali (vedi le (3.89) e (3.90)). Esse in particolare dannoimmediatamente il valore della media condizionale (che non è altro che la media della leggecondizionale e che quindi è data dalla (3.90)).

3.26 a) Calcoliamo la f.r. diT . Indichiamo conA l’evento ‘‘il pezzo prescelto è statoprodotto dalla prima linea’’ e conB l’evento ‘‘il pezzo prescelto è stato prodotto dalla seconda

Page 62: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

62 Parte 1: soluzioni

linea’’. A eB hanno probabilitàp eq rispettivamente, mentre, condizionalmente aA eB, T halegge esponenziale di parametriλ eµ rispettivamente. Dunque, ricordando l’espressione dellaf.r. delle leggi esponenziali si ha, pert ≥ 0

P(T ≤ t) = P(T ≤ t |A)P(A)+ P(T ≤ t |B)P(B) == p(1 − e−λt )+ q(1 − e−µt ) = 1 − pe−λt − qe−µt .

Naturalmente la f.r. è nulla pert ≤ 0. Derivando si ottiene la densità diT , che vale

f (t) ={

pλe−λt + qµe−µt set > 00 altrimenti

e quindi

E(T ) =∫ +∞

0t (pλe−λt + qµe−µt ) dt =

p

λ+q

µ·

b) Si tratta di calcolare P(A|T > s). Con la formula di Bayes si trova

P(A|T > s) =P(T > s |A)P(A)

P(T > s)=

pe−λs

pe−λs + qe−µs =p

p + qe−(µ−λ)s ·

Pers che tende all’infinito, ricordando che supponiamoµ > λ, questa probabilità tende a 1 edunque piùs è grande e più è probabile che il componente provenga dalla lineaA.

Questo è in accordo con l’intuizione: infatti la condizioneλ > µ implica che i pezzi dellaprima linea di produzione hanno in media vita più lunga. Dunque era ragionevole aspettarsiche più il pezzo risulta longevo, più è probabile che provenga dalla prima linea.

3.27 a) SeZ eW sono i tempi d’esecuzione della prima e della seconda fase rispettivamente,il tempo di esecuzione totale èT = Z +W ; basta ora ricordare che la speranza matematica diuna v.a. esponenziale di parametroλ vale 1

λ, per cui

E(T ) = E(Z)+ E(W) =1

λ+

1

µ·

b) Seλ = µ possiamo usare la proprietà di somma delle leggi gamma:T è dunqueŴ(2, λ)e, perx > 0, ha densità

f (x) = λ2xe−λx .

Se inveceλ 6= µ calcoliamo la densità diT con la formula

f (x) =∫ +∞

−∞f1(t)f2(x − t) dt

dovef1 ef2 sono densità esponenziali di parametriλ eµ rispettivamente. Ricordando che ledensità esponenziali sono uguali a 0 per valori negativi della variabile, si ha

f (x) = λµ

∫ x

0e−λte−µ(x−t)dt = λµe−µx

∫ x

0e−(λ−µ)tdt =

=λµ

λ− µe−µx(1 − e−(λ−µ)x) =

λµ

λ− µ(e−µx − e−λx) .

Page 63: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.27 63

c) La probabilità che il programma non sia terminato ancora al tempot + s sapendo che essonon era terminato al tempos

P(T > t + s |T > s) =P(T > t + s, T > s)

P(T > s)=

P(T > t + s)

P(T > s)=

1 − F(t + s)

1 − F(s)

doveF è la f.r. diT . Calcoliamola:

F(t) =∫ t

0

λµ

λ− µ(e−µx − e−λx) dx =

λ

λ− µ(1 − e−µt )−

µ

λ− µ(1 − e−λt ) =

= 1 −λe−µt − µe−λt

λ− µ

dunque

P(T > t + s |T > s) =λe−µ(t+s) − µe−λ(t+s)

λe−µs − µe−λs .

Sostituendo i valori numerici si hanno i valori 0.42 pers = 1, 0.38 pers = 2.d) La probabilità che la prima fase non sia ancora terminata, sapendo che il programma stesso

è ancora in corso al tempos, è la probabilità condizionale P(Z > s | Z+W > s). Ora l’evento{Z > s} è contenuto nell’evento{Z + W > s}, perchéW è comunque una quantità> 0.Dunque, seλ 6= µ,

P(Z > s |Z +W > s) =P(Z > s,Z +W > s)

P(Z +W > s)=

P(Z > s)

P(Z +W > s)=

=1 − FZ(s)

1 − F(s)=

e−λs

λe−µs − µe−λs (λ− µ)

dove abbiamo utilizzato il fatto cheZ è esponenziale di parametroλ (la f.r. F di T = Z +W

è stata calcolata in c)). Dunque

P(Z > s |Z +W > s) =λ− µ

λe(λ−µ)s − µ·

Possiamo ora analizzare il comportamento di questa probabilità condizionale pers grande.Abbiamo due casi:

i) Seλ > µ (cioè se in media l’esecuzione della prima fase è più rapida della seconda) allorae(λ−µ)s → +∞ e dunque P(Z > s |Z +W > s) → 0 pers → +∞.

ii) Seλ < µ allora e(λ−µ)s → 0 e quindi P(Z > s |Z+W > s) → 1− λµ

. Con i dati numerici

indicati la probabilità che la prima fase non sia ancora terminata tende a23 pers → +∞.

Se invece fosseλ = µ, lo svolgimento dell’esercizio è lo stesso, solo che ora la f.r. diZ è

F(s) = 1 − e−λs(1 + λs)

come afferma la formula (3.52) del libro. Dunque

P(Z > s |Z +W > s) =1 − FZ(s)

1 − F(s)=

e−λs

e−λs(1 + λs)=

1

1 + λs

Page 64: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

64 Parte 1: soluzioni

che è una quantità che tende a 0 pers → ∞.

3.28 La quantità P(X + Y ≤ t) che dà la f.r. diX + Y è pari all’area ombreggiata nellaFigura 1.8. Dunque

F(t) ={

t2

2 se 0≤ t ≤ 11 − 1

2(2 − t)2 se 1≤ t ≤ 2

.............................................................................................................................................................................................................................................................................................................................................................

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.ւ(1, t − 1)

ւx + y = t

Figura 1.8

eF(t) = 0 altrove. Derivando si ottiene la densità

f (t) ={t se 0≤ t ≤ 12 − t se 1≤ t ≤ 2

ef (t) = 0 pert al di fuori dell’intervallo [0,2]; f ha il caratteristico grafico ‘‘a casetta’’ dellaFigura 1.9.

0 1 2

1

..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

Figura 1.9

Naturalmente sarebbe stato possibile anche usare la Proposizione 3.23: la densitàf diX+Yè data da

(1.12) f (t) =∫

g(t − s)g(s) ds

doveg(t) =

{1 se 0≤ t ≤ 10 altrimenti .

Page 65: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.30 65

Però il calcolo esplicito dell’integrale della (1.12) è abbastanza antipatico: la determinazione,al variare dit , dei valori dis per i quali l’integrando vale 1 (esso può valere solo 0 oppure 1) èpoco agevole.

3.29 a) X e Y hanno distribuzione congiunta uniforme sul quadrato [0,1] × [0,1]. Laprobabilità richiesta è P((X, Y ) ∈ A) doveA ⊂ R

2 è la regione dei punti(x, y) tali che|x − y| > 1

2. Cioè l’area della regione ombreggiata nella Figura 1.10, che vale14.

...............................................................................................................................................................................................................

...............................................................................................................................................................................................................

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.տ12

Figura 1.10

b) Calcoliamo la f.r. diZ. Se 0≤ t ≤ 1, allora P(Z > t) = P(|X − Y | > t) non è altro chela probabilità che il punto(X, Y ) si trovi in una regione simile a quella della Figura 1.10 (solocon il valoret al posto di12). Dunque, sempre per 0≤ t ≤ 1,

P(Z > t) = (1 − t)2 .

La f.r. diZ è dunque

FZ(t) ={

1 − (1 − t)2 se 0≤ t ≤ 10 altrimenti

per cui la densità èfZ(t) = 2(1 − t) per 0≤ t ≤ 1, fZ(t) = 0 altrimenti. La distanza mediatraX eY è quindi

E(Z) = 2∫ 1

0t (1 − t) dt =

1

3.30 Indichiamo conY la v.a. che rappresenta il valore assunto daθ . La legge congiunta diX, Y è dunque data dalla densità mista

g(θ, k) = λe−λθe−θ θk

k!, θ > 0, k = 0,1, . . .

La legge diX è la seconda marginale, cioè

pX(k) =∫ +∞

−∞g(θ, k) dθ =

λ

k!

∫ +∞

0e−λθe−θθk dθ =

λ

k!

∫ +∞

0e−θ(λ+1)θk dθ

Paolo BaldiCalcolo delle ProbabilitàMcGraw-Hill 2011

Page 66: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

66 Parte 1: soluzioni

dovek = 0,1, . . . Dunque, a meno della costante, l’integrando è una densitàŴ(k + 1, λ+ 1).L’integrale vale dunque

Ŵ(k + 1)

(λ+ 1)k+1 =k!

(λ+ 1)k+1

da cui

pX(k) =λ

(λ+ 1)k+1, k = 0,1, . . .

Con un po’ d’immaginazione si riconosce una legge geometrica di parametrop = λλ+1. Ricor-

dando che la media di una v.a. geometrica di parametrop è 1−pp

otteniamo E(X) = 1λ.

b) La legge condizionale diY datoX = k si ottiene facendo il quoziente tra la densitàcongiunta e la marginale diX: seθ > 0

pY |X(θ |k) =g(θ, k)

pX(k)=λe−θ(λ+1) θk

k!λ

(λ+1)k+1

=(λ+ 1)k+1

k!θke−θ(λ+1) .

Cioè la legge condizionale diY datoX = k èŴ(k + 1, λ + 1). Quindi la media condizionalevale k+1

λ+1.

3.31 a) NaturalmenteY ha leggeN(0,1 + σ 2), per la regola sulla somma di v.a. normaliindipendenti. La legge congiunta diX eY si può calcolare osservando che(X, Y )è una funzionelineare di(X,W). Dunque anche(X, Y ) ha legge normale multivariata; per determinarla bastacalcolarne media e matrice di covarianza. Entrambe le componenti hanno media nulla

E(X) = 0, E(Y ) = E(X +W) = 0

mentre Var(X) = 1, Var(Y ) = 1 + σ 2 e

Cov(X, Y ) = Cov(X,X +W) = Cov(X,X)︸ ︷︷ ︸

=Var(X)

+ Cov(X,W)︸ ︷︷ ︸

=0

= 1 .

Quindi (X, Y ) ha matrice di covarianza

C =(

1 11 1+ σ 2

)

La legge diY risulta quindi individuata: èN(0, C). Volendo, ciò permette di calcolare la densitàcongiunta (cosa che però non è esplicitamente richiesta dall’enunciato). Indicandoz = (x, y)

essa è infatti

f (z) =1

2π√

detCe− 1

2 〈C−1z,z〉 .

Ora detC = σ 2 mentre

C−1 =1

σ 2

(

1 + σ 2 −1−1 1

)

Page 67: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.32 67

e quindi

f (x, y) =1

2πσexp

[

−1

2σ 2 ((1 + σ 2)x2 − 2xy + y2)]

.

b) Sappiamo, vedi le (3.89) e (3.90), che la legge condizionale diX datoY è normale divarianza

Var(X)−Cov(X, Y )2

Var(Y )= 1 −

1

1 + σ 2 =σ 2

1 + σ 2

e media

E(X)+Cov(X, Y )

Var(Y )(y − E[Y ]) =

y

1 + σ 2

che è quindi la speranza condizionale richiesta.c) Abbiamo visto nel punto precedente che la legge condizionale diX datoY = y = 11

20 e per

σ 2 = 0.1 è normale di media y

1+σ2 = 12 e varianza σ2

1+σ2 = 111, ovvero che èN(1

2,111). Dunque

la probabilità cheX si trovi in [14,

34] sapendo cheY = 11

20 è pari alla probabilità che una v.a.Z ∼ N(1

2,111) si trovi in [1

4,34]. Ma seZ ∼ N(1

2,111) alloraZ è della formaZ = 1√

11W + 1

2doveW ∼ N(0,1) e quindi

P(1

4 ≤ Z ≤ 34

)

= P(−

√11

4 ≤ W ≤√

114

)

= P(−0.82 ≤ Z ≤ 0.82) == 8(0.82)−8(−0.82) = 0.58 .

3.32 a) Le v.a.X1, X2, X3 sono congiuntamente normali, dunque anche le v.a.U,V,W losono, come funzioni lineari di v.a. congiuntamente normali. In particolare ciascuna delle treha legge normale e per determinarla basta calcolarne media e varianza. Le tre v.a. hanno tuttemedia nulla, mentre

Var(U) = Var(2X1 −X2 −X3) = 4 Var(X1)+ Var(−X2)+ Var(−X3) = 6

Var(V ) = Var(X1 +X2 +X3) = Var(X1)+ Var(X2)+ Var(X3) = 3

Var(W) = Var(X1 − 3X2 + 2X3) = Var(X1)+ 9 Var(−X2)+ 4 Var(−X3) = 14 .

b) Poiché, come abbiamo osservato,U,V eW sono congiuntamente normali, le coppie sonoindipendenti se e solo se sono non correlate. Ora sappiamo che Cov(X1, X2) = Cov(X1, X3) =Cov(X2, X3) = 0, mentre Cov(Xi, Xi) = Var(Xi) = 1, i = 1,2,3. Dunque

Cov(U, V ) = Cov(2X1 −X2 −X3, X1 +X2 +X3) == 2 Cov(X1, X1)

︸ ︷︷ ︸

=1

+2 Cov(X1, X2)︸ ︷︷ ︸

=0

+2 Cov(X1, X3)︸ ︷︷ ︸

=0

− Cov(X2, X1)︸ ︷︷ ︸

=0

− Cov(X2, X2)︸ ︷︷ ︸

=1

− Cov(X2, X3)︸ ︷︷ ︸

=0

− Cov(X3, X1)︸ ︷︷ ︸

=0

− Cov(X3, X2)︸ ︷︷ ︸

=0

− Cov(X3, X3)︸ ︷︷ ︸

=1

=

= 2 − 1 − 1 = 0

e quindiU eV sono indipendenti. Analogamente

Cov(U,W) = Cov(2X1 −X2 −X3, X1 − 3X2 + 2X3) = 2 + 3 − 2 = 3 6= 0

Cov(V ,W) = Cov(X1 +X2 +X3, X1 − 3X2 + 2X3) = 1 − 3 + 2 = 0

Page 68: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

68 Parte 1: soluzioni

per cuiV eW sono indipendenti, mentreU eW non lo sono.Alternativamente si sarebbe potuto ragionare nel modo seguente:(U, V,W) si ottiene da

(X1, X2, X3) mediante la trasformazione lineare associata alla matrice

A =(2 −1 −1

1 1 11 −3 2

)

cioè (2 −1 −11 1 11 −3 2

)(X1X2X3

)

=(U

V

W

)

Dunque il vettore(U, V,W)ha legge congiunta normale e tutte le sue componenti sono centrate.Poiché la matrice di covarianza di(X1, X2, X3) è la matrice identità,(U, V,W) ha matrice dicovarianza

C = AA∗ =(2 −1 −1

1 1 11 −3 2

)( 2 1 1−1 1 −3−1 1 2

)

=( 6 0 3

0 3 03 0 14

)

da cui si può rispondere insieme alle questioni dei punti a) e b):U ∼ N(0,6), V ∼ N(0,3),W ∼ N(0,14) (gli elementi sulla diagonale diC sono le varianze diU , V eW ); inoltreU,VeV,W sono coppie di v.a. indipendenti, mentreU eW non sono indipendenti (le covarianzedelle variabili si trovano, nella matrice di covarianza, fuori della diagonale).

3.33 a) PoichéS = T +W , si tratta di calcolare la legge della somma di due v.a. esponenzialiindipendenti di parametri rispettivamenteλ eµ. Se indichiamo confT , fW le densità diT eWrispettivamente, la densitàfS di S si può calcolare come indicato dalla Proposizione 3.23, cioè

fS(x) =∫ +∞

−∞fT (t)fW (x − t) dt .

Il calcolo di questo integrale è già stato effettuato nel punto b) dell’Esercizio 3.27 e dà comerisultato

fS(s) =λµ

µ− λ(e−λs − e−µs) .

Il calcolo della legge congiunta diS e T si può fare osservando che(T , S) = (T , T + W).PoichéT eW sono indipendenti, la loro densità congiunta è

g(z,w) ={

λµe−λze−µw sez ≥ 0, w ≥ 00 altrimenti .

La v.a. (T , S) è quindi una trasformazione di(T ,W) tramite l’applicazione lineare associataalla matrice

A =(

1 01 1

)

Page 69: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.33 69

e per il teorema di cambio di variabile negli integrali multipli la densitàf di (T , S) è data da

f (t, s) =1

| detA|g(

A−1(ts

))

.

Ma detA = 1 e

A−1 =(

1 0−1 1

)

per cuiA−1(ts

)

=(ts−t)

ef (t, s) = g(t, s − t). Quindi intantof (t, s) = 0 a meno che non sia0 ≤ t ≤ s (se fosset > s allora sarebbes − t < 0 e dunqueg(t, s − t) = 0). Sostituendonell’espressione dig a z ew i valori t e s − t rispettivamente, otteniamo

f (s, t) ={

λµe−λte−µ(s−t) se 0≤ t ≤ s

0 altrimenti .

b) La densità condizionale diT datoS = s è, per definizione,

fT |S(t |s) =f (t, s)

fS(s)·

Sostituendo le espressioni perf e perfS calcolate in a) otteniamo pers > 0

fT |S(t |s) ={

(µ− λ)e−µs

e−λs − e−µs e(µ−λ)t se 0≤ t ≤ s

0 altrimenti .

La speranza condizionale diT datoS = s è dunque uguale a

E(T |S = s) =(µ− λ)e−µs

e−λs − e−µs

∫ s

0t e(µ−λ)t dt .

Integrando per parti e semplificando

E(T |S = s) =(µ− λ)e−µs

e−λs − e−µs

( s

µ− λe(µ−λ)s +

1

(µ− λ)2(1 − e(µ−λ)s)

)

=

=s

1 − e−(µ−λ)s −1

µ− λ·

Sostituendo i valori si ottieneper s = 1.5 1.3889per s = 0.1 0.0574

c) La retta di regressione diT rispetto aS èy = ax+ b, dove i valori dia eb sono dati dalle(2.52) e (2.53). Dunque, poiché Cov(T , S) = Cov(T , T )+Cov(T , S) = Cov(T , T ) = Var(T )

a =Cov(T , S)

Var(S)=

Var(T )

Var(S)=

1λ2

1λ2 + 1

µ2

=µ2

λ2 + µ2

Page 70: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

70 Parte 1: soluzioni

mentre, con un po’ di semplificazioni,

b = E(T )− aE(S) =1

λ−

µ2

λ2 + µ2

( 1

µ+

1

λ

)

=λ− µ

λ2 + µ2 ·

Calcolando il valore diy in corrispondenza dis = 1.5 e dis = 0.1, si trova

per s = 1.5 1.3960 (1.3889)per s = 0.1 0.0099 (0.0574)

Si vede che per valori molto piccoli dis la retta di regressione e la funziones → E(T |S = s)

sono abbastanza diverse.

3.34 a) Si vede subito chef è una densità: poiché si tratta di una funzione pari

∫ +∞

−∞f (x) dx =

1

2

∫ +∞

−∞e−|x| dx =

∫ +∞

0e−x dx = 1 .

Si tratta del resto della densità di Laplace di parametroλ = 1, che s’incontra anche negli Esercizi3.40, 3.46, 3.55, 3.56, 3.58 e 3.63. Il grafico di questa densità si può vedere nella Figura 1.11.

−3 −2 −1 0 1 2 3

λ2

................................................................................................................

...........................................

.....................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

Figura 1.11Calcoliamo la sua funzione caratteristica. Dato chex → sinθx è una funzione dispari, mentre

x → cosθx è pari,

φX(θ) =1

2

∫ +∞

−∞e−|x|eiθx dx =

1

2

∫ +∞

−∞e−|x| cosθx dx =

∫ +∞

0e−x cosθx dx

e integrando due volte per parti

∫ +∞

0e−x cosθx dx = −e−x cosθx

∣∣∣

+∞

0− θ

∫ +∞

0e−x sinθx dx =

1 + θe−x sinθx∣∣∣

+∞

0− θ2

∫ +∞

0e−x cosθx dx = 1 + θ2

∫ +∞

0e−x cosθx dx

da cui si ricava

φX(θ) =1

1 + θ2 ·

Page 71: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 4.1 71

b1) θ → 11+θ2 è una funzione integrabile suR; dunque, per il Teorema 3.82 d’inversione

delle funzioni caratteristiche,

f (x) =1

2e−|x| =

1

∫ +∞

−∞e−ixθφX(θ) dθ =

1

∫ +∞

−∞

e−ixθ

1 + θ2 dθ .

Scambiandox conθ si ricava1

π

∫eixθ

1 + x2 dx = e−|θ |

dunqueφY (θ) = e−|θ |.b2) Calcoliamo la funzione caratteristica diZ = 1

2(Y1+Y2): per i punti1) e3) del paragrafo3.13,

φZ(θ) = φY1( θ2) φY2

( θ2) = e−|θ |/2e−|θ |/2 = e−|θ | .

Dunque12(Y1 + Y2) ha ancora legge di Cauchy.

• Osserviamo cheφY non è derivabile in 0; d’altra parte abbiamo visto nell’Esercizio 3.4cheY non ha speranza matematica finita. Si tratta quindi di un esempio di v.a. che non hasperanza matematica finita e non ha funzione caratteristica derivabile.

4.1 Primo metodo. Calcoliamo media e varianza delle v.a.1nXn: ricordando che una v.a.

χ2(n) ha median e varianza 2n (vedi la (3.49)),

E[ 1nXn]

=1

n· n = 1

Var( 1nXn)

=1

n2 · 2n =2

n→n→∞

0 .

Le v.a. 1nXn, n = 1,2, . . . hanno tutte la stessa mediaµ = 1 e varianza che tende a 0 per

n → ∞. Per la disuguaglianza di Chebyshev dunque per ogniη > 0

P(∣∣ 1nXn − 1

∣∣ > η

)

≤Var

( 1nXn)

η2 →n→∞

= 0

e ciò, per definizione, implica che( 1nXn)n converge in probabilità alla costante 1. La conver-

genza ha luogo anche in legge (la convergenza in probabilità implica sempre quella in legge,vedi l’Osservazione 4.10).

Secondo metodo. Se(Zn)n è una successione di v.a. indipendenti tutte di leggeŴ(12,

12),

allora, per ognin, Z1 + . . .+ Zn ha leggeχ2(n), cioè la stessa diXn; dunque le due v.a.

(1.13) 1nXn e 1

n(Z1 + . . .+ Zn)

hanno la stessa legge. Ma di queste la seconda converge in probabilità alla media E(Z1) = 1per la Legge dei Grandi Numeri. Dunque, per ogniη > 0,

P(∣∣ 1nXn − 1

∣∣ > η

)

= P(∣∣ 1n(Z1 + . . .+ Zn)− 1

∣∣ > η

)

→n→∞

0

Page 72: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

72 Parte 1: soluzioni

che, ancora, permette di affermare la convergenza in legge della successione( 1nXn)n alla

costante 1.• Il primo dei due metodi che abbiamo visto fornisce un criterio semplice per provare la

convergenza in probabilità verso una costanteµ di una successione di v.a.: si calcola, perciascun termine media e varianza (cosa che è spesso facile); se la media è costante= µ ela varianza tende a zero allora la disuguaglianza di Chebyshev permette di concludere che lasuccessione converge in probabilità alla costanteµ.

4.2 a) Per la disuguaglianza di Chebyshev e ricordando che la varianza di una v.a. di Poissondi parametroλ vale appuntoλ,

P(|Xn − λ| ≥ η) ≤Var(Xn)

η2 =λ

nη2 ·

b) Basta usare l’approssimazione normale nella forma (4.8):

P(|Xn − λ| ≥ η) ≈ 28(−

√nη

√λ

)

.

c) La disuguaglianza di Chebyshev afferma che la probabilità in (4.17) è maggiorata da

λ

nη2 = 1

che non è una stima particolarmente utile (che una probabilità sia più piccola di 1 lo sapevamogià da prima. . . ). Con l’approssimazione normale invece

P(|Xn − λ| ≥ η) ≈ 28(−

√nη

√λ

)

= 28(−1) = 0.3173.

Il risultato esatto (ottenuto, ad esempio, con uno dei software menzionati a pag. 45) è 0.3173;dunque in questo caso l’approssimazione normale dà un valore preciso fino alle prime 4 cifredecimali.

• Non è male però ricordare che la Disuguaglianza di Chebyshev ha applicazioni comunqueimportanti (la Legge dei Grandi Numeri ne è un esempio) ed è vera per ogni valore din,mentre l’approssimazione normale è, appunto, un’approssimazione e vale solo sen è abbastanzagrande.

4.3 a) PoichéX1 è una v.a.Ŵ(1, λ) (cioè esponenziale di parametroλ), se indichiamo conF1 la sua f.r.,

P(

X1 >1λ

)

= 1 − F1(1λ) = e−λ· 1

λ = e−1 = 0.37 .

PerX3 sappiamo che la f.r. di una v.a.Ŵ(3, λ) è data da

F3(t) = 1 − e−λt(

1 + λt +(λt)2

2

)

Page 73: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 4.5 73

e quindi

P(X3 >3λ) = e−3

(

1 + 3 + 92

)

= 0.42 .

b) Usiamo il Teorema Limite Centrale: sianoZ1, Z2, . . . delle v.a. indipendenti e tutte dileggeŴ(1, λ). Allora

Z1 + . . .+ Zn ∼ Ŵ(n, λ) .

Osservando chenλ

è proprio il valore della media diXn e che Var(Xn) = nλ2 ,

P( 1nXn >

)

= P(

Xn >nλ

)

= P(

Xn − nλ> 0

)

= P(

Z1 + . . .+ Zn − nλ> 0

)

=

= P(Z1 + . . .+ Zn − n

λ√

n/λ2> 0

)

→n→∞

1 −8(0) =1

4.4 Se indichiamo conXi la v.a. che rappresenta il risultato delloi-esimo lancio, cioè la v.a.che vale 1 se alloi-esimo lancio Marco vince e 0 altrimenti, allora il numero di volte che Marcovince in 100 prove si modellizza con la v.a.X = X1 + . . .+X100. Se la moneta è equilibratale v.a.Xi hanno ciascuna legge di BernoulliB(1, 1

2) e dunque media12 e varianza14. Usando

l’approssimazione normale (4.7), la probabilità che Marco vinca meno (≤) di 36 volte è

P(X1 + . . .+X100 ≤ 36) ≈ 8(36.5 − 50

5

)

= 8(−2.7) = 0.0035= 0.35%.

Una probabilità un po’ troppo piccola perché si possa pensare a semplice sfortuna. . .

• In questo esercizio essenzialmente l’approssimazione normale si usa per stimare la f.r.di una legge binomialeB(n, p) conn grande. La stessa idea può servire per avere dei valoriapprossimati di altre leggi di probabilità per le quali non ci sono formule semplici della f.r.(Poisson, Gamma,. . . ).

4.5 Indichiamo conX una v.a.N(0,1) (e quindi tale cheσX ∼ N(0, σ 2)). Per il TeoremaLimite Centrale si ha

P(Zn ≤ t) = P( (X1 + . . .+Xn)

2

n≤ t

)

=

= P(

−√t

σ≤X1 + . . .+Xn

σ√n

≤√t

σ

)

→n→∞

8(√

)

−8(

−√tσ

)

Dunque le f.r. delle v.a.Zn convergono. Occorre ora verificare che il limite sia la f.r. di unav.a. e individuarla. Ma

8(√

)

−8(

−√tσ

)

= P(

−√t

σ≤ X ≤

√t

σ

)

= P(−√t ≤ σX ≤

√t ) = P((σX)2 ≤ t) .

DunqueZn converge in legge verso la v.a.(σX)2, che è una v.a.Ŵ(12,

12σ2 ) (Esempio 3.42).

Page 74: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

74 Parte 1: soluzioni

4.6 a) Si ha

E(Xi) =1

2a

∫ 2a

0x dx = a

E(X2i ) =

1

2a

∫ 2a

0x2 dx =

4

3a2

Var(Xi) = E(X2)− E(X)2 =a2

b) Per il Teorema Limite Centrale

P(X1 + . . .+Xn > na + x√n) =

P(X1 + . . .+Xn − na

a2n3

> x

3a2

)

→n→∞

1 −8(

x

3a2

)

dove8 indica al solito la f.r. di una leggeN(0,1). Con i valori numerici assegnati e le tavolesi ottiene

x = a 1 −8(√

3) = 1 −8(1.732) = 0.041

x = −12a 1 −8(−1

2

√3) = 1 −8(−0.866) = 0.807.

4.7 Se indichiamo conXi l’errore commesso nellai-esima addizione, allora l’errore com-plessivo èX = X1 + . . .+X106. Osserviamo che le v.a.Xi hanno densità (discreta)

f (t) ={

1010 se−0.5 · 10−10 ≤ t ≤ 0.5 · 10−10

0 altrimenti .

Esse hanno dunque media nulla (per simmetria, chi non ci crede può calcolare l’integrale. . . ).Inoltre

Var(Xi) = E(X2i ) = 1010

∫ 0.5·10−10

−0.5·10−10t2 dt =

1

1210−20 := σ 2 .

Dunque con l’approssimazione normale e scrivendon = 106,

P(−0.5 · 10−7 ≤ X ≤ 0.5 · 10−7) = P(X ≤ 0.5 · 10−7)− P(X ≤ −0.5 · 10−7) =

= P(X1 + . . .+Xn ≤ 0.5 · 10−7)− P(X1 + . . .+Xn ≤ −0.5 · 10−7) ≈

≈ 8(0.5 · 10−7

√n σ

)

−8(0.5 · 10−7

√n σ

)

Ora

8(0.5 · 10−7

√n σ

)

= 8(

0.5 · 10−7 · 10−3 · 1010√

12)

= 8(√

3) = 8(1.732) = 0.958.

8(

−0.5 · 10−7

√n σ

)

= 8(

0.5 · 10−7 · 10−3 · 1010√

12)

= 8(√

3) = 8(−1.732) = 0.041.

Page 75: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 4.9 75

e dunque la probabilità che la settima cifra sia significativa è 0.958−0.041= 0.917. Ripetendoi calcoli per 0.5 · 10−8 si ha facilmente

P(−0.5 · 10−8 < X ≤ 0.5 · 10−8) ≈ 8(0.173)−8(−0.173) = 0.568− 0.431= 0.137.

La probabilità che la settima cifra decimale sia corretta è molto elevata, mentre per l’ottava nonsi può dire lo stesso.

4.8 a) Poniamo

Xi ={

1 se loi-esimo lancio ha dato 60 altrimenti .

Allora il numero totale di 6 in 900 lanci èX = X1 + . . . + X900, dove le v.a. Xi sonoindipendenti e di BernoulliB(1, p), p = 1

6. Poiché E(Xi) = 16 e Var(Xi) = 1

656 = 5

36, usandol’approssimazione normale

P(X ≥ 180) = P(X1 + . . .+X900> 179.5) ≈ 1 −8

(179.5 − 900· 1

6√

900· 536

)

=

= 1 −8(2.63) = 0.0044= 0.44%.

b) Se un dado è truccato allora il numero totaleX di 6 ottenuti in 900 lanci si può ancorascrivereX = X1 + . . .+ X900, dove però ora le v.a.X1, . . . , X900 sono di BernoulliB(1, 2

9).Dunque, ancora con l’approssimazione normale

P(X ≥ 180) = P(X1 + . . .+X900> 179.5) ≈ 1 −8

(179.5 − 900· 2

9√

900· 29 · 7

9

)

=

= 1 −8(−1.64) = 0.95 .

Dunque un dado truccato viene individuato con una probabilità del 95%.

4.9 a) SeX è il numero di bit distorti, è chiaro cheX segue una leggeB(1000,0.01) (numerodi successi in 1000 prove indipendenti con probabilità di ‘‘successo’’p = 0.01 in ogni singolaprova). Dunque E(X) = 1000· 0.01 = 10. La probabilità che vi siano bit distorti è

P(X ≥ 1) = 1 − P(X = 0) = 1 − (1 − 0.01)1000 ≃ 1

(0.991000 = 4.3 · 10−5), mentre la probabilità che vi siano almeno 10 bit distorti è

(1.14) P(X ≥ 10) = 1 − P(X ≤ 9) = 1 −9∑

i=0

(1000

i

)

0.01i0.991000−i .

Page 76: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

76 Parte 1: soluzioni

Per calcolarla conviene usare l’approssimazione normale:

P(X ≥ 10) = P(X > 9.5) = 1 − P(X ≤ 9.5) =

≈ 1 −8( 9.5 − 1000· 0.01√

0.01 · 0.99√

1000

)

= 1 −8(−0.159) = 0.563.

A titolo di paragone la somma in (1.14), che viene ottenuta facilmente con un software adatto,vale 0.543. In questo caso l’approssimazione normale è discreta, ma non particolarmenteprecisa.

b) Un singolo bit risulta distorto se almeno due delle tre ritrasmissioni vengono distorte.Ognuna di queste lo è con probabilità 0.01 e dunque il numero di ritrasmissioni distorte, per unsingolo bit, segue una distribuzioneB(3,0.01). La probabilità che almeno due ritrasmissionisiano distorte per un singolo bit è

q :=(

3

2

)

0.0120.99+(

3

3

)

0.013 = 0.012(3 · 0.99+ 0.01) = 2.98 · 10−4 .

La probabilità che vi siano bit distorti ora è

1 − (1 − q)1000 = 0.258.

• La probabilità che vi siano più di 10 bit distorti, che abbiamo ottenuto in a), si potrebbecalcolare anche approssimando la leggeB(1000,0.01) con una legge di Poisson di parametroλ = 10 (ricordiamo che una densitàB(n, p) pern grande ep piccolo si può approssimare conuna densità di Poisson di parametronp, vedi l’Osservazione 4.9). Un calcolo numerico avrebbedato

(1.15) P(X ≥ 10) = 1 − e−109∑

i=0

λ10

i!= 0.543

e 0.543 è lo stesso valore che avremmo ottenuto se avessimo effettuato la somma in (1.14).In questo caso dunque l’approssimazione con le leggi di Poisson dà risultati migliori chel’approssimazione normale. Quest’ultima rimane comunque più pratica perché il calcolo dellaf.r. in (1.15) richiede comunque un certo lavoro numerico (inoltre, di solito, per le leggi diPoisson non ci sono tavole, anche se i pacchetti software statistici sono in grado di fornire le f.r.anche delle leggi di Poisson).

• Si potrebbe pensare di usare l’approssimazione normale per stimare, nella situazione delpunto b), quale sia la probabilità che vi siano più (≥) di k bit distorti, per qualche valore dikfissato. In realtà in questo caso l’approssimazione normale non funziona bene. Ad esempio perk = 2 la probabilità di avere più (>) di un bit distorto è 1− (1− q)1000− 1000· q(1− q)999 =0.0365 mentre l’approssimazione normale dà

1 −8( 1.5 − 1000· q√q(1 − q)

√1000

)

= 1 −8(2.2) = 0.0138

che è un’approssimazione abbastanza scadente dal vero valore 0.0365. In effetti una regolaaccettata in pratica per potere utilizzare l’approssimazione normale con leggi binomialiB(n, p)è

Page 77: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 4.12 77

che i numerinp en(1−p) siano entrambi più grandi di 5, mentre in questo caso (p = 2.98·10−4)np = 0.298.

4.10 a) Fissiamo l’attenzione su un singolo pixel e indichiamo conAi, i = 1, . . . ,8, l’evento‘‘lo i-esimo bit è non distorto’’ e conA l’evento ‘‘nessuno degli 8 bit è distorto’’. Per leipotesi del problema, gli eventiA1, . . . , A8 sono indipendenti eA = A1 ∩ . . . ∩ A8. DunqueP(A) = P(A1) . . .P(A8) = (1 − p)8 = 0.9984.

b) Se poniamo

Xi ={

1 se loi-esimo pixel è distorto0 altrimenti

per i = 1, . . . ,131 072, allora il numero di pixel distorti nell’immagine èX = X1 + . . . +X131 072. Inoltre le v.a. Xi sono di Bernoulli (possono prendere solo i valori 0 oppure 1)B(1,0.0016) (0.0016= 1 − 0.9984 è la probabilità che un singolo pixel venga distorto nellatrasmissione). Dunque

E(X) = 131 072· 0.0016= 209.7 .

Per calcolare la probabilità che vi siano più di 200 pixel distorti si può usare l’approssimazionenormale. In effetti la v.a.X è la somma din = 131 072 v.a. di Bernoulli di parametroq =0.0016. Sappiamo che in questo caso una regola euristica per la validità dell’approssimazionenormale è che i due numerinq en(1−q) siano entrambi≥ 5. Abbiamo già visto chenq = 209.7,mentren(1 − q) è certo un numero molto grande. L’approssimazione normale dà quindi

P(X ≥ 200) = 1 − P(X < 200) = 1 − P(X ≤ 199.5) =

= 1 −8( 199.5 − nq√nq(1 − q)

)

= 1 −8(−0.706) = 0.773.

4.11 a) Una v.a. Beta(α, β) ha media αα+β e varianza αβ

(α+β)2(α+β+1)(vedi il paragrafo 3.9).

Dunque

E(Xn) =α

α + β, Var(Xn) =

αβ

(α + β)2(nα + nβ + 1)·

Dunque le v.a.Xn hanno tutte la stessa mediaαα+β , mentre la loro varianza tende a 0 per

n → ∞. Come abbiamo visto nell’osservazione successiva all’Esercizio 4.1, ciò implica, perla disuguaglianza di Chebyshev,

P(|Xn − αα+β | ≥ η) ≤

Var(Xn)

η2 →n→∞

0

e dunque

XnP→

n→∞α

α + β·

4.12 Ricordiamo che vi sono vari modi per studiare il limite in legge: calcolando il limitedelle funzioni di ripartizione oppure delle funzioni caratteristiche, soprattutto.

Page 78: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

78 Parte 1: soluzioni

0 25 1

1

2

3

4

5

................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ...........

...............

.............

.............

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

....

.............

.............

.............

.............

.............

.............

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.............

.............

.............

.............

............. ............. ............. ............. ............. ............. ...................................................................................................................................................................

Figura 1.12 Andamento della densità Beta(nα, nβ) perα = 2, β = 3 en = 1 (tratto pieno),n = 3(trattini) en = 8 (puntini). La densità tende a concentrarsi intorno alla media.

Primo modo: funzioni di ripartizione. Se indichiamo conFn la f.r. di Yn = 1nXn, allora

Fn(t) = 0 per t < 0, mentre pert ≥ 0, calcolando la somma geometrica come indicato apag. 39 del libro,

Fn(t) = P(Xn ≤ nt) = P(Xn ≤ ⌊nt⌋) =⌊nt⌋∑

k=0

λ

n

(

1 −λ

n

)k

n

1 −(

1 − λn

)⌊nt⌋+1

1 −(

1 − λn

) =

= 1 −(

1 −λ

n

)⌊nt⌋+1

e dunque per ognit ≥ 0limn→∞

Fn(t) = 1 − e−λt .

Riconosciamo ora nel termine a destra la f.r. di una legge esponenziale di parametroλ. DunqueYn converge in legge ad una v.a. che ha questa distribuzione.

Secondo modo: funzioni caratteristiche. Ricordando l’espressione della funzione caratteri-stica di una v.a. geometrica (Esempi 3.77 b) a pag.155), si ha

φXn(θ) =λn

1 − (1 − λn)eiθ

n(1 − eiθ )+ λeiθ

e dunque

φYn(θ) = φXn

(θn

)

n(1 − eiθ/n)+ λeiθ/n·

Osservando che

limn→∞

n(1 − eiθ/n) = θ limn→∞

1 − eiθ/n

θn

= −θd

dθeiθ |θ=0 = −iθ

Page 79: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 4.14 79

si ha

limn→∞

φYn(θ) =λ

λ− iθ

che è appunto la funzione caratteristica di una legge esponenziale di parametroλ.Come si vede, in questo caso tutti e due i metodi si possono applicare in maniera semplice.

4.13 PoniamoSn = X1 + . . .+Xn. Per la Legge dei Grandi Numeri la v.a.Snn

converge inprobabilità a E(X1) = λ. Possiamo scrivere

P(X1 + . . .+Xn ≤ n) = P( 1nSn ≤ 1

)

= Fn(1)

doveFn indica la f.r. di Snn

. La v.a. costante uguale aλ ha f.r. data da

F(t) ={0 set < λ

1 set ≥ λ .

Ora, seλ 6= 1, 1 è un punto di continuità perF e poiché la convergenza in probabilità implicaquella in legge (Osservazione 4.10)

limn→∞

P(X1 + . . .+Xn ≤ n) = limn→∞

Fn(1) = F(1) ={

0 seλ > 11 seλ < 1 .

Se inveceλ = 1 il valore 1 non è un punto di continuità perF e questo ragionamento non basta,perché la definizione di convergenza in legge e la Legge dei Grandi Numeri non permettono distabilire quanto valga il limite. Si ha però per il Teorema Limite Centrale

P(X1 + . . .+Xn ≤ n) = P(X1 + . . .+Xn − n ≤ 0) =

= P(X1 + . . .+Xn − n

√n

≤ 0)

→n→∞

8(0) =1

(ricordiamo che stiamo supponendoλ = 1, per cui le v.a.Xi hanno tutte media e varianzauguali a 1). In conclusione

limn→∞

P(X1 + . . .+Xn ≤ n) ={

0 seλ > 112 seλ = 11 seλ < 1 .

4.14 a) Calcoliamo la densitàf di X1: è chiaro che la f.r.F è

F(x) = 1 − P(X1 > x) ={

1 − x−λ sex ≥ 10 sex < 1 .

Dunque la densità diX1 èf (x) = F ′(x) = λx−(λ+1) perx ≥ 1, mentref (x) = 0 perx < 1.Quindi

E(X1) =∫ +∞

−∞tf (t) dt = λ

∫ +∞

1t−λ dt .

Page 80: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

80 Parte 1: soluzioni

Si vede dunque cheX1 ha speranza matematica finita se e solo seλ > 1 e in questo caso

E(X1) =λ

λ− 1·

Inoltre

E(X21) = λ

∫ +∞

1t−λ+1dt

per cui la varianza è finita solo seλ > 2. In questo caso si ha

E(X21) =

λ

λ− 2,

Var(X1) = E(X21)− E(X1)

2 =λ

λ− 2−( λ

λ− 1

)2=

λ

(λ− 2)(λ− 1)2·

b) Usiamo il metodo della funzione di ripartizione. Poiché P(Yi ≤ 0) = P(Xi ≤ 1) = 0, ladensità diYi è nulla pert ≤ 0. Pert > 0 invece la f.r.G di Yi è data da

G(t) = P(Yi ≤ t) = P(logXi ≤ t) = P(Xi ≤ et ) = 1 − e−λt .

La densità diYi si può calcolare come al solito per derivazione. Qui però basta riconoscere cheG è la f.r. di una legge esponenziale di parametroλ.

c) Osserviamo che

log(

(X1X2 . . . Xn)1/n) =

1

n

n∑

i=1

log(Xi) =1

n

n∑

i=1

Yi .

Dunque per la Legge dei Grandi Numeri

log(

(X1X2 . . . Xn)1/n) P→

n→∞E(Y1) =

1

λ

e quindi (Osservazione 4.2)

(X1X2 . . . Xn)1/n P→

n→∞e1/λ .

4.15 La v.a.X1X2 è il prodotto di due v.a. indipendenti, aventi entrambe speranza matemat-ica finita. Sappiamo quindi (Proposizioni 3.38 oppure 2.41) che anch’essa ha speranza matem-atica finita e anzi che

E(X1X2) = E(X1)E(X2) = 0 .

Anche la v.a. X21X

22 è il prodotto delle due v.a.X2

1 e X22 che sono indipendenti ed hanno

speranza matematica finita (perché per ipotesiX1 eX2 hanno varianza finita). Dunque

Var(X1X2) = E(X21X

22) = E(X2

1)E(X22) < +∞ .

Page 81: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 4.16 81

b) Le v.a.X1X2, . . . , X2n−1X2n sono indipendenti, centrate ed hanno varianza finita. Inoltrehanno tutte la stessa legge. Dunque per la Legge dei Grandi Numeri

Vn =1

n(X1X2 +X3X4 + . . .+X2n−1X2n)

P→n→∞

E(X1X2) = 0 .

c) La normalizzazione con√n invece chen deve far pensare al Teorema Limite Centrale:

applicandolo alle v.a.X1X2, . . . , X2n−1X2n, che sono indipendenti, equidistribuite e centratesi ha

X1X2 + . . .+X2n−1X2n

σ√n

+→n→∞

N(0,1)

doveσ 2 = Var(X1X2). DunqueVn+→N(0, σ 2).

d) Le v.a.X41, X

42, . . . hanno tutte varianza finita (perché E(X8

i ) < +∞ per ipotesi) e sonoindipendenti. Per la Legge dei Grandi Numeri dunque

Wn =1

n(X4

1 + . . .+X4n)

P→n→∞

E(X41) .

Inoltre si può scrivere

Un =X2

1 + . . .+X2n

X41 + . . .+X4

n

=1n(X2

1 + . . .+X2n)

1n(X4

1 + . . .+X4n)

e dunque per la Legge dei Grandi Numeri applicata al numeratore e al denominatore

UnP→

n→∞

E(X21)

E(X41)

,

(vedi l’Osservazione 4.2).

4.16 Le v.a.Zn che intervengono in questo esercizio sono definite come il minimo delle v.a.X1, . . . , Xn. Siamo dunque in una situazione in cui è facile calcolare le f.r., mentre lo stessonon si può dire per le funzioni caratteristiche. Nel calcolo dei limiti in legge proposti useremoquindi piuttosto il metodo basato sulle f.r.

a) Si ha, per 0≤ t ≤ 1,

P(Zn > t) = P(X1 > t, . . . , Xn > t) = (1 − t)n

e dunque la f.r.Fn di Zn vale

Fn(t) = 1 − P(Zn > t) ={0 pert < 0

1 − (1 − t)n per 0≤ t ≤ 11 pert > 1 .

Page 82: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

82 Parte 1: soluzioni

È chiaro quindi che

limn→∞

Fn(t) ={

0 pert ≤ 01 pert > 0 .

Ora la f.r. di una v.a. che assume il solo valore 0 con probabilità 1 è

F(t) ={

0 pert < 01 pert ≥ 0 .

PoichéFn(t) → F(t) pern → ∞ per ognit , tranne che pert = 0, che non è punto di continuitàperF , possiamo concludere cheZn converge in legge ad una v.a. che ha questa distribuzione.

La convergenza ha luogo anche in probabilità, dato che, seη > 0,

P(|Xn| ≤ η) = P(−η ≤ Xn ≤ η) = Fn(η)− Fn(−η) →n→∞

1

e dunqueP(|Xn| > η) = 1 − P(|Xn| ≤ η) →

n→∞0

b) SeGn è la f.r. dinZn, allora, se 0≤ t ≤ n,

Gn(t) = P(nZn ≤ t) = P(

Zn ≤ tn

)

= Fn(tn

)

= 1 −(

1 − tn

)n.

Basta ora applicare un limite ben noto per avere

limn→∞

Gn(t) = G(t) ={

0 pert ≤ 01 − e−t pert > 0 .

Dunque la successione(nZn)n converge ad una legge esponenziale di parametroλ = 1. Perngrande dunque

P(

min(X1, . . . , Xn) ≤ 2n

)

≈ 1 − e−2 = 0.86 .

4.17 a) Le v.a.X1, X2, . . . assumono tutte due valori, il che rende semplice lo studio dellaconvergenza in legge sia con le funzioni di ripartizione che con le funzioni caratteristiche.Usando quest’ultimo metodo vediamo che

φXn(θ) = (1 − αn)eiθ ·0 + αne

iθn = 1 − αn + αneiθn

e quindi, seαn → 0 pern → ∞,

φXn(θ) →n→∞

1, per ogniθ

che è la funzione caratteristica di una v.a.X che assume il valore 0 con probabilità 1.b) Le v.a. del punto a) hanno media e varianza date da

E(Xn) = (1 − αn) · 0 + αn · n = nαn

E(X2n) = (1 − αn) · 02 + αn · n2 = n2αn

Var(Xn) = E(X2n)− E(Xn)

2 = n2αn(1 − αn)

Page 83: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 4.19 83

Dunque se, ad esempio,αn = 1n

allora Var(Xn) → +∞, mentre la varianza del limite in leggeX è uguale a zero. Ed inoltre E(Xn) ≡ 1, mentre E(X) = 0.

4.18 a) Poniamo

Xi ={

1 se loi-esimo bit vale 10 altrimenti .

Il numero totale di bit che assumono il valore 1 nel segnale èSn = X1 + . . . + Xn, mentre laproporzione di bit che valgono 1 èpn = 1

nSn. Per il Teorema Limite Centrale la v.a.

Sn − 0.2 · n√n(0.2 · 0.8)

segue una legge che, pern abbastanza grande, è approssimativamenteN(0,1). Dunque, conl’approssimazione normale,

P(pn > 0.23) = P(Sn > 0.23 · n) = P( Sn − 0.2 · n√n(0.2 · 0.8)

>(0.23− 0.2) ·

√n

√0.2 · 0.8

)

≈ 1 −8(0.03 ·

√n

√0.16

)

sostituendo il valore numericon = 1000 si ottiene 1−8(2.37) = 0.009.b) Poniamo per comoditàp = 0.2. Allora ripetendo il ragionamento del punto a) e usando

la (4.8) si ha, poichéσ =√p(1 − p) =

√0.16 = 0.4,

P(|pn − p| > ε) ≈ 2(

1 −8(√n

40

))

= 28(−

√n

40

)

Perché questa quantità sia più piccola diη = 4 · 10−3 occorre (dopo uno sguardo alle tavole)che sia

−√n

40≤ −2.88

ovveron > (40 · 2.88)2 = 13271.

4.19 a) logSi assume i valori log(1+ σ√n) e− log(1+ σ√

n), entrambi con probabilità12. La

funzione caratteristica diSi è dunque

φ(θ) =1

2

(

eiθ log(1+ σ√

n) + e

−iθ log(1+ σ√n))

= cos(

θ log(

1 +σ

√n

))

La v.a. logXn è uguale a log(xt )+ logS1 + . . .+ logSn. La sua funzione caratteristica valedunque

φn(θ) = eiθ log(xt )(

cos(

θ log(

1 +σ

√n

)))n

Page 84: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

84 Parte 1: soluzioni

b) Nel calcolo del limite pern → ∞ di φn(θ) siamo quindi ricondotti ad una forma 1∞.Ricordando gli sviluppi di Taylor perx e z vicini a 0

cosx = 1 −x2

2+ o(x2)

log(1 + z) = z+ o(z)

si ottiene facilmente, pern → ∞,

cos(

θ log(

1 +σ

√n

))

= 1 −1

2

θ2σ 2

n+ o

(θ2

n

)

e dunque

(

cos(

θ log(

1 +σ

√n

)))n

=(

1 −1

2

θ2σ 2

n+ o

(θ2

n

))n

→n→∞

= e−θ2σ2/2

Dunque

φn(θ) →n→∞

eiθ log(xt )e−θ2σ2/2

Se ne deduce che log(Xn) converge in legge ad una v.a. normale di media log(xt ) e varianzaσ 2.

c) SiaZ una v.a. normaleN(log(xt ), σ 2). Abbiamo appena visto che logXn+→Z, dunque,

poiché la f.r. diZ è continua,

P(logXn ≤ x) →n→∞

P(Z ≤ x)

per ognix ∈ R. Da ciò si ricava

P(Xn ≤ x) = P(logXn ≤ logx) →n→∞

P(Z ≤ logx) = P(eZ ≤ x)

DunqueXn converge in legge ad una v.a. lognormale di parametri log(xt ) eσ 2.

La media di questa legge èxteσ2/2. Hanno quindi un rendimento medio maggiore gli effetti

finanziari per cuiσ 2 è grande.Uno sguardo all’andamento delle densità lognormali, come nella Figura 1.4, fa però pensare

che il valore medio non sia forse qui il criterio giusto di valutazione.

4.20 a) Per provare una convergenza in legge abbiamo a disposizione due metodi: quellodella funzione di ripartizione e quello delle funzioni caratteristiche. In questo caso, dato chele funzioni caratteristiche delle leggi normali sono ben note, è quest’ultimo probabilmente ilmetodo più semplice. Infatti

φXn(θ) = eibnθe−σ2n θ

2/2 →n→∞

eibθe−σ2θ2/2︸ ︷︷ ︸

f .c. di una v.a. N(b,σ2)

.

Page 85: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 4.20 85

Anche il metodo delle funzioni di ripartizione comunque non crea problemi: basta ricordareche se8b,σ2 e8 indicano le f.r. di v.a.N(b, σ 2) eN(0,1) rispettivamente, allora si ha

8b,σ2(t) = 8( t − b

σ

)

e dunque, poiché8 è continua,

8bn,σ2n(t) = 8

( t − bn

σn

)

→n→∞

8( t − b

σ

)

= 8b,σ2(t) .

b1) Cominciamo con l’osservare cheX1 ha legge normale (è una funzione lineare-affinedella v.a. normaleZ1) di mediaαx e varianzaσ 2.

AncheX2 = αX1 + Z2 è normale, essendo la somma delle due v.a.αX1 e Z2, che sononormali e indipendenti. Poiché media e varianza sono date da

E(X2) = E(αX1)+ E(Z2)︸ ︷︷ ︸

=0

= α2x

Var(X2) = Var(αX1)+ Var(Z2) = α2σ 2 + σ 2 .

se ne deduce cheX2 ∼ N(α2x, σ 2(1 + α2)).b2) Lo stesso ragionamento, per ricorrenza, prova cheXn ∼ N(αnx, σ 2(1+α2+. . .+α2n)):

supponiamo che ciò sia vero per un valoren e dimostriamolo pern + 1. PoichéXn+1 =αXn + Zn+1 e le due v.a.Xn eZn+1 sono indipendenti e entrambe di legge normale, ancheXn+1 ha legge normale. Restano da controllare i valori della media e della varianza diXn+1:

E(Xn+1) = E(αXn)+ E(Zn)︸ ︷︷ ︸

=0

= α · αnx = αn+1x

Var(Xn+1) = Var(αXn)+ Var(Zn) = α2 · σ 2(1 + α2 + . . .+ α2n)+ σ 2 == σ 2(1 + α2 + . . .+ α2(n+1)) .

Poiché|α| < 1 abbiamo (vedi il riquadro a pag. 39)

αnx →n→∞

0

σ 2(1 + α2 + . . .+ α2n) →n→∞

σ 2

1 − α2 ·

e per il punto a)(Xn)n converge in legge ad una v.a.N(0, σ2

1−α2 ).

b3) Con i valori numerici assegnatiXn converge ad una v.a.N(0, 43). Dunque pern grande

Xn ha approssimativamente la stessa legge di√

43 Z, doveZ ∼ N(0,1) e quindi

P(|Xn| ≤ 1) = P(

|Z| ≤√

34

)

≈ 8(√

34

)

−8(

−√

34

)

=

= 8(0.866)−8(−0.866) = 0.807− 0.193= 0.614 .

Page 86: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

86 Parte 1: soluzioni

5.1 a) Le probabilità di transizione in due passi si possono calcolare facendo il prodotto dimatriciP 2 = P · P , che dà

P 2 = (p(2)ij )ij =

716 0 9

16 0516

14

716 0

38 0 5

8 01336 0 19

3619

.

Dunque si è in 2 dopo due passi con probabilitàp(2)22 = 14 partendo da 2 e con probabilità

p(2)32 = 0 partendo da 3.b) Sappiamo che uno statoi è transitorio se esso comunica con uno statoj che però non

comunica coni; questa è una condizione sufficiente per la transitorietà di uno stato, che è anchenecessaria se per di più la catena, come in questo caso, è finita. Uno stato è ricorrente se non ètransitorio.

La determinazione di ricorrenza e transitorietà consiste quindi nel verificare, per ogni statoi,con quali altri stati esso comunica e se questi altri stati a loro volta comunichino coni.

Ora partendo da 1 si può solo restare in 1 oppure andare in 3; invece partendo da 3 si può solorestare in 3 oppure passare in 1. Gli stati 1 e 3 costituiscono quindi una classe chiusa e sonoricorrenti, poiché non soddisfano alla condizione di transitorietà che abbiamo appena ricordato(non comunicano con un altro statoj che non comunica con loro).

Invece lo stato 2 comunica sia con 1 che con 3 che, come abbiamo visto, non comunicano con2 che quindi è transitorio. Per lo stesso motivo anche 4, che comunica con 1 e 3, è transitorio.

Partendo da 2 la catena può restare in 2 oppure passare in uno degli stati 1 oppure 3. In questaeventualità la catena non tornerà mai più in 2, perché abbiamo visto che 1 e 3 costituiscono unaclasse chiusa. Dunque la sola possibilità di essere in 2 dopo 12 passi consiste nel restare in 2 intutte le 12 transizioni; quindi la probabilità richiesta èp(12)

22 = 1212 .

c) La nuova matrice di transizione è

14 0 3

4 014

12

14 0

12 0 1

414

0 13

13

13

.

Ma ora si vede facilmente che tutti gli stati comunicano tra loro, e sono quindi ricorrenti.

5.2 a) Abbiamo già ricordato che uno statoi è transitorio se esso comunica con uno statoj

che a sua volta non comunica coni.• 1 comunica con 2 (p12 = 1

2 > 0) ma 2 non comunica con 1 (in effetti la probabilitàpi1 èuguale a 0 per ogni statoi) e dunque 1 è transitorio.

• 4 comunica con 4 e 5 e lo stesso vale per 5; 4 e 5 sono dunque ricorrenti e costituisconouna classe irriducibile.

Page 87: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.2 87

• 2 comunica con 4 che, come abbiamo visto, non comunica con 2: 2 è transitorio.• 3 comunica con 2 che comunica con 4. Dunque 3 comunica con 4, che però non comunica

con 3: 3 è transitorio. Avremmo anche potuto osservare che 3 comunica con 2, che sappiamogià essere transitorio, e ciò basta a stabilire la transitorietà di 3 (uno stato ricorrente non puòcomunicare con uno transitorio).

Osserviamo che in tutti questi ragionamenti non era importante conoscere i valori dei numeripij , ma solo se essi fossero o no> 0. In particolare la classificazione degli stati che abbiamoottenuta è valida per ogni matrice della forma

0 ∗ ∗ 0 00 ∗ ∗ ∗ 00 ∗ ∗ 0 00 0 0 ∗ ∗0 0 0 ∗ ∗

dove gli asterischi indicano numeri qualunque, purché> 0. Per tutte le matrici di questa formagli stati 1,2,3 saranno transitori, mentre 4 e 5 ricorrenti.

b) Sappiamo che una distribuzione invariante è data da dei numeriv1, . . . , v5, tutti ≥ 0, talichev1 + . . .+ v5 = 1 e che siano soluzione del sistema di equazioni lineari

v1p1j + . . .+ v5p5j = vj j = 1, . . . ,5

ovvero in forma matriciale

(1.16)

(v1, . . . , v5)

p11 . . . p15. . .

p51 . . . p55

= (v1, . . . , v5) .

Sostituendo i valori dipij si tratta di risolvere il sistema composto dalle equazioni

(1.17)

0 = v112 v1 + 1

4 v2 + 12 v3 = v2

12 v1 + 1

4 v2 + 12 v3 = v3

12 v2 + 1

4 v4 + 12 v5 = v4

34 v4 + 1

2 v5 = v5

più l’equazionev1 + v2 + v3 + v4 + v5 = 1 .

Questo sistema si semplifica però considerevolmente ricordando che una distribuzione invarianteè sempre nulla sugli stati transitori. Dunquev1 = v2 = v3 = 0 e il sistema diviene

(1.18)

14 v4 + 1

2 v5 = v434 v4 + 1

2 v5 = v5

v4 + v5 = 1 .

Page 88: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

88 Parte 1: soluzioni

Esprimendov5 = 1 − v4 dalla terza equazione e sostituendo nella prima, questa dà

14 v4 + 1

2 − 12 v4 = v4

cioè12 = 5

4 v4

e quindiv4 = 25 ev5 = 1 − v4 = 3

5. Quindi

v1 = 0, v2 = 0, v3 = 0, v4 = 25, v5 = 3

5

è una distribuzione invariante. Essa è anche unica, perché il sistema (1.18) ammette solo questasoluzione.

c) Gli stati 4 e 5 sono i soli stati ricorrenti. Sappiamo che una catena di Markov con probabilità1 lascia prima o poi l’insieme costituito dagli stati transitori. Quindi la probabilità di giungerein {4,5} è uguale a 1.

• Un errore molto comune nel calcolo della distribuzione invariante consiste nel considerareil sistema

(1.19) pj1v1 + . . .+ pjNvN = vj j = 1, . . . , N

(N è il numero degli stati), cioè in forma matriciale

p11 . . . p1N. . .

pN1 . . . pNN

v1...

vN

=

v1...

vN

invece di quello corretto (1.16)

(1.20) p1jv1 + . . .+ pNjvN = vj j = 1, . . . , N

cioè nel considerare il sistema i cui coefficienti sono dati dalla matriceP invece che dalla suatrasposta. C’è però un modo facile per accorgersi di questo errore: la soluzione del sistema(1.19) è infattisempredata dav1 = . . . = vN = 1

N, cioè dalla distribuzione uniforme, come è

facile accorgersi osservando chepj1 + . . . + pjN = 1 (la somma degli elementi di ogni rigadella matrice di transizione vale 1).

Si può però dimostrare che la distribuzione uniforme è invariante se e solo se la matriceP

è bistocastica, cioè se e solo se anche la somma degli elementi di ogni colonna vale 1. Inconclusione: se trovate come distribuzione invariante la legge uniforme, verificate cheP siaeffettivamente bistocastica, altrimenti rivedete i vostri conti, probabilmente avete commessol’errore di considerare il sistema (1.19) invece di quello corretto (1.20).

• In pratica nel calcolo della distribuzione stazionaria occorre risolvere il sistema (1.20) conin più l’equazione

(1.21) v1 + . . .+ vN = 1 .

Page 89: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.3 89

Infatti (1.20) non ha soluzione unica (sev = (v1, . . . , vN ) è soluzione, allora ancheαv, α ∈ R

è soluzione). Ciò vuole dire che tra le equazioni (1.20) ce n’è sempre almeno una che èlinearmente dipendente dalle altre (nel caso di (1.18) la seconda equazione è uguale alla prima).Concretamente per trovare la distribuzione invariante occorre risolvere il sistema che si ottienedalla (1.20) eliminando una equazione che dipende dalle altre ed aggiungendo la (1.21). Neicasi in cui c’è una sola distribuzione invariante in questo modo si ottiene un sistema che hasoluzione unica.

5.3 a) La matrice di transizione di questa catena è

P =( 0 p 1 − p

1 − p 0 p

p 1 − p 0

)

.

La catena è irriducibile perché, per ipotesi, siap che 1− p sono numeri> 0 e dunque ognistato comunica con tutti gli altri. Per mostrare che la catena è regolare basta mostrare che esisteunn tale che la matriceP n abbia tutti gli elementi> 0. In questo caso bastan = 2: infatti

P 2 =(2p(1 − p) (1 − p)2 p2

p2 2p(1 − p) (1 − p)2

(1 − p)2 p2 2p(1 − p)

)

.

Calcoliamo la distribuzione invariante. Prima però di lanciarsi nella risoluzione del sistemalineare (che in questo caso è in 3 incognite) conviene controllare che non vi siano ‘‘scorciatoie’’,come succede ad esempio con le matrici di transizione bistocastiche (per le quali anche la sommadegli elementi delle colonne sono= 1). In effetti questa è la situazione e sappiamo dunque chela distribuzione stazionaria è quella uniformev = (1

3,13,

13).

b) Si ha

P(Xn = 1, Xn+1 = 2) = P(Xn+1 = 2|Xn = 1)P(Xn = 1) == p12P(Xn = 1) = pP(Xn = 1) .

Poiché pern grande P(Xn = 1) ≈ 13, P(Xn = 1, Xn+1 = 2) ≈ p

3 . Allo stesso modo

P(Xn = 2, Xn+1 = 1) = P(Xn+1 = 1|Xn = 2)P(Xn = 2) = p21P(Xn = 2) ≈1 − p

c) Perché la catena sia reversibile occorre che siavipij = vjpji per tutti gli statii, j . Inquesto caso i valorivi della distribuzione stazionaria non dipendono dai. Dunque abbiamo lareversibilità sepij = pji per ognii, j , cioè se e solo se la matrice di transizione è simmetrica.

Uno sguardo aP e si vede subito che ciò si verifica se e solo sep = 12 (che è anche il valore

per cui le due probabilità calcolate in b) sono uguali).

Page 90: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

90 Parte 1: soluzioni

5.4 a) Il problema si può chiaramente modellizzare con una catena di Markov del tipo dellarovina del giocatore, avente cioè come insieme degli statiE = {0,1, . . . ,1001} e matrice ditransizione

pij ={p sej = i + 1q sej = i − 10 altrimenti

se 0< i < 1001 dovep = 1837, q = 19

37, mentre invece gli statii = 0 ei = 1001 sono assorbenti.Si vede subito che tutti gli stati, tranne 0 e 1001, sono transitori, poiché comunicano con glistati assorbenti 0 e 1001 che non comunicano con altri stati. Dunque pern → ∞ la catenaconverge (viene assorbita) in 0 oppure in 1001. Se indichiamo conλi la probabilità di passaggioin 0 della catena con stato inizialei allora la probabilità che il giocatore vinca è 1− λ1000. Leformule per le probabilità di passaggio della rovina del giocatore danno

λi =γ i + . . .+ γ 1000

1 + . . .+ γ 1000

doveγ = qp

= 1918. Per calcolareλ1000 conviene effettuare qualche manipolazione algebrica

per evitare gli errori di arrotondamento:

λ1000 =γ 1000

1 + . . .+ γ 1000 =1

γ−1000+ . . .+ 1=

1 − γ−1

1 − γ−1001 ≃1

19= 0.053

(γ−1001 = 3.33 · 10−24). Quindi la probabilità che il giocatore vinca è 1− 0.053 = 0.947.Invece con probabilità del 5.3% il giocatore finisce rovinato.

b) La v.a.Y può assumere i soli valori 0 oppure 1001, poiché sappiamo che con probabilità1 il gioco finisce dopo un numero finito di giocate. Più precisamente, considerando come statoiniziale i = 1000

P(Y = 0) = λ1000 = 0.053

P(Y = 1001) = 1 − λ1000 = 0.947.

QuindiE(Y ) = 0 · 0.053+ 1001· 0.947= 947.9 .

In media dunque, come ci si poteva aspettare, il giocatore perde (alla fine ha un capitale inferiorea quello iniziale).

5.5 Il problema in realtà più difficile in questo tipo di esercizi consiste nella modellizzazionedel problema, cioè nello scrivere la matrice di transizione della catena di Markov da usare comemodello. Ciò del resto si può fare in molti modi. In questo caso il più semplice consiste nelconsiderare una catena di Markov con 6 stati:

1 → ‘‘ A tiene il gioco’’

2 → ‘‘ B tiene il gioco’’

3 → ‘‘ C tiene il gioco’’

4 → ‘‘ A vince’’

5 → ‘‘ B vince’’

6 → ‘‘ C vince’’ .

Page 91: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.6 91

Gli stati 4,5,6 saranno assorbenti, il che equivale a dire che il gioco si ferma non appena ungiocatore vince. Se supponiamo cheA,B,C siano seduti in senso antiorario intorno al tavolo,dovrà essere

p11 = 38 (probabilità che il giocatoreA conservi il gioco)

p12 = 38 (probabilità cheA passi il gioco a destra)

p13 = 18 (probabilità cheA passi il gioco a sinistra)

p14 = 18 (probabilità cheA vinca)

p15 = p16 = 0 (B eC non possono vincere in un passo se èA a tenere il gioco).

Le relazioni precedenti determinano la prima riga della matrice di transizione (in esse38 è la

probabilità di ottenere 2 teste e una croce e anche quella di ottenere una croce e due teste, mentre18 è la probabilità di tre teste o tre croci). Le altre righe si determinano in maniera analoga. Lamatrice di transizione risulta

P =

38

38

18

18 0 0

18

38

38 0 1

8 038

18

38 0 0 1

8

0 0 0 1 0 0

0 0 0 0 1 0

0 0 0 0 0 1

La probabilità che il giocatore che inizia il gioco vinca è chiaramente la stessa qualunque sia ilgiocatore che inizia. Dunque questa probabilità è la stessa che la probabilità di assorbimentoin 4 partendo da 1. Il calcolo diλi =probabilità di assorbimento in 4 partendo dai, si effettuarisolvendo il sistema (5.9) che qui diventa

λi = pi4 + pi1λ1 + pi2λ2 + pi3λ3 i = 1,2,3

e cioèλ1 = 1

8 + 38 λ1 + 3

8 λ2 + 18 λ3

λ2 = 18 λ1 + 3

8 λ2 + 38 λ3

λ3 = 38 λ1 + 1

8 λ2 + 38 λ3 .

La soluzione del sistema èλ1 = 1126, λ2 = 7

26, λ3 = 826. Dunque la probabilità che il giocatore

che inizia il gioco vinca è1126.

5.6 a) Indichiamo conXn il numero di palline nere nell’urna dopon estrazioni.• SeXn = 1 nell’urna si trovano 1 pallinaN e 2R e da essa verrà dunque estratta una pallina

N con probabilità13 ed una pallinaR con probabilità2

3; dunqueXn+1 = 0 con probabilità13 e

Xn+1 = 2 con probabilità23.

Ripetendo questo ragionamento si vede che

Page 92: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

92 Parte 1: soluzioni

• seXn = 2 alloraXn+1 = 1 con probabiltà12 eXn+1 = 3 con probabilità1

2;

• seXn = 3 alloraXn+1 = 4 con probabilità25 eXn+1 = 2 con probabilità3

5.Gli stati 0 e 4 vengono scelti assorbenti in quanto corrispondono alla fine della partita. In

conclusione la matrice di transizione è

0↓

1↓

2↓

3↓

4↓

0 → 1 0 0 0 01 → 1

3 0 23 0 0

2 → 0 12 0 1

2 03 → 0 0 3

5 0 25

4 → 0 0 0 0 1

.

b) Si richiede di calcolare P2(X3 ≥ 2) (P2 è la probabilità partendo dallo stato 2). Ricordiamoche sep(n)ij indica la probabilità di fare una transizione inn passi dai aj , allora Pi(Xn = j) =p(n)ij . Dunque

P2(X3 ≥ 2) = P2(X3 = 2)+ P2(X3 = 3)+ P2(X3 = 4) = p(3)22 + p

(3)23 + p

(3)24 .

Le probabilitàp(3)ij si determinano calcolando il prodottoP 3 = P · P · P della matrice ditransizione per se stessa 3 volte. Un calcolo paziente dà

P 3 =

1 0 0 0 049 0 19

45 0 215

16

1960 0 19

6015

110 0 19

50 0 1350

0 0 0 0 1

dunque la probabilità che vi siano almeno due pallineN nell’urna dopo tre estrazioni è1960+ 1

5 =3160 (bisogna guardare la terza riga, perché gli stati sono numerati a partire da 0). Attenzioneanche a non confondere P2 (probabilità partendo dallo stato 2) conP 2 (matrice di transizionein due passi).

c) La probabilità richiesta non è altro che la probabilità di assorbimento in 4 partendo da 2. Seλi è la probabilità di assorbimento in 4 partendo dai, allora i numeriλ1, λ2, λ3 sono soluzionedel sistema lineare

λ1 = 23 λ2

λ2 = 12 λ1 + 1

2 λ3

λ3 = 25 + 3

5 λ2 .

La soluzione è( 411,

611,

811) e quindi la probabilità cheA vinca èλ2 = 6

11. La probabilità cheBvinca sarà invece 1− 6

11 = 511. Il giocatoreA è favorito.

Page 93: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.7 93

d) Se indichiamo conζi il tempo medio di assorbimento in{0,4} partendo dai, allora i numeriζi, i = 1,2,3 sono soluzione di

ζ1 = 1 + 23 ζ2

ζ2 = 1 + 12 ζ1 + 1

2 ζ3

ζ3 = 1 + 35 ζ2 .

Il sistema ha per soluzione(5111,

6011,

4711). Poiché supponiamo di partire inizialmente dallo stato

2 (due palline nere nell’urna), la partita dura in media6011 = 5.45 estrazioni.

5.7 a)

r p 0 0 0 q

q r p 0 0 00 q r p 0 00 0 q r p 00 0 0 q r p

p 0 0 0 q r

.

b) Ricordiamo che, per definizione, una catena è irriducibile se tutti gli stati comunicano traloro. Supponiamo che siap > 0. Allora lo stato 1 comunica ( ) con 2. Poiché 2 3 perlo stesso motivo, anche 1 3. Ripetendo lo stesso ragionamento vediamo che 1 comunicacon 4,5, . . . , N . Dunque 1 comunica con tutti gli altri stati. Lo stesso ragionamento si puòripetere per ogni altro stato, ottenendo che tutti gli stati comunicano tra loro e quindi la catenaè irriducibile. Lo stesso ragionamento permette di provare l’irriducibilità nell’ipotesi che siaq > 0.

c) Ricordiamo che una matrice di transizione è regolare se esiste un numerom tale chePm

abbiatutti i suoi elementi> 0; una condizione semplice (ma è solo una condizione sufficiente)è che la catena sia irriducibile e vi sia almeno un elemento sulla diagonale diP che sia> 0.

Se uno almeno tra i numerip eq è> 0 abbiamo visto che la catena è irriducibile; se per di piùr > 0, dato che tutti gli elementi della diagonale diP sono uguali ar (come si vede anche dalpunto a)), sono soddisfatte le condizioni del criterio di regolarità: catena irriducibile ed almenoun elemento sulla diagonale> 0; la catena è quindi regolare.

Se invecer = 0 il criterio non è soddisfatto ed occorre verificare direttamente la definizione,cioè se esista un numerom tale chep(m)ij > 0, tale cioè che la probabilità di passare dai a j inm passi, sia> 0 per ognicoppia di statii, j .

SeN è pari la catena non è regolare. Basta osservare che ad ogni transizione da uno statoi

si può passare solo in uno stato contiguo. Se il poligono ha un numeroN pari di vertici, allorasei è uno stato di indice pari gli stati ad esso contigui hanno indice dispari e, viceversa, sei

è di indice dispari gli stati ad esso contigui sono di indice pari (Vedi la Figura 5.8). Quindi sesi parte dallo stato inizialei dispari, dopo un numero pari di passi ci troveremo certamente inuno stato dispari, mentre dopo un numero dispari di passi la catena si troverà in uno stato pari.

Page 94: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

94 Parte 1: soluzioni

Quindi, nell’esempio dell’esagono, la matrice di transizione inm passiPm sarà della forma

0 ∗ 0 ∗ 0 ∗∗ 0 ∗ 0 ∗ 00 ∗ 0 ∗ 0 ∗∗ 0 ∗ 0 ∗ 00 ∗ 0 ∗ 0 ∗∗ 0 ∗ 0 ∗ 0

oppure

∗ 0 ∗ 0 ∗ 00 ∗ 0 ∗ 0 ∗∗ 0 ∗ 0 ∗ 00 ∗ 0 ∗ 0 ∗∗ 0 ∗ 0 ∗ 00 ∗ 0 ∗ 0 ∗

a seconda chem sia dispari o pari rispettivamente.Pm non può dunque mai avere tutti i suoielementi> 0.

Se invece il numero di verticiN è dispari, allora il ragionamento appena svolto non si puòripetere perché lo stato 1 è contiguo sia a uno stato pari che a uno dispari. Del resto nell’Esercizio5.3, dove avevamoN = 3, si avevar = 0 ma la catena era regolare. In realtà si potrebbedimostrare che se il numero di vertici è dispari, allora sep > 0, q > 0, la catena è sempreregolare (anche ser = 0).

d) È facile rendersi conto che la matrice di transizione è bistocastica. Dunque la distribuzioneuniformeπi = 1

Nè stazionaria. Poiché con i valori dip, r, q assegnati la catena è regolare,

questa è anche l’unica distribuzione invariante. Inoltre, pern grande

P(Xn = 1, Xn+1 = 2) = P(Xn+1 = 2|Xn = 1)P(Xn = 1) ≈ p121

N=p

Allo stesso modo si vede che P(Xn = 2, Xn+1 = 1) = qN

. La relazione di reversibilitàπipij = πjpji diviene quip = q: la catena è reversibile se e solo se sono uguali le probabilitàdi spostarsi in senso orario e antiorario.

5.8 a) La descrizione dell’evoluzione dello stato della stampante determina subito la matricedi transizione che è

P =(

0↓

1↓

0 → 1 − b b

1 → a 1 − a

)

.

b) Sea = 0, b = 0 la matrice di transizione diventa

P =(

1 00 1

)

e i due stati 0 e 1 sono assorbenti. La catena non è dunque irriducibile e non può essere regolare.Se invecea = 1, b = 1 la matrice di transizione è

P =(

0 11 0

)

.

La catena è ora irriducibile (gli stati comunicano), ma non può essere regolare: ad ogni intervallodi tempo essa cambia di stato con probabilità 1. Dunque se lo stato iniziale è 0, la catena si

Page 95: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.9 95

troverà in 1 ai tempi dispari ed in 0 ai tempi pari. Non è quindi possibile cheP n possa averetutti i suoi elementi> 0. Sea = 1, b = 1

2 invece

P =( 1

212

1 0

)

.

La catena è regolare. Infatti essa è irriducibile e vi è almeno un elemento> 0 sulla diagonale.Se infine 0< a < 1,0 < b < 1 la catena è certo regolare perché giàP ha tutti i suoi elementi> 0. In quest’ultima situazione la probabilità che la catena si trovi nello stato 1 pern grandesi può valutare approssimativamente con il valoreπ1, doveπ = (π0, π1) è la distribuzionestazionaria, la cui unicità è garantita dal Teorema di Markov 5.15. Essa si ottiene risolvendo ilsistema (5.9), più la condizioneπ0 + π1 = 1. Cioè il sistema lineare

(1 − b)π0 + aπ1 = π0

π0 + π1 = 1

che ha come soluzioneπ = ( aa+b ,

ba+b ). Dunque la probabilità che la stampante sia occupata

ad un tempon grande è ba+b . Coi valori numerici proposti si ottieneπ1 = 0.7

1.1 = 0.636.c) La catena è irriducibile (abbiamo anzi visto che è regolare). Dunque, per il Teorema

ergodico 5.28,Nn converge in probabilità al valore della distribuzione stazionaria in 1, cheabbiamo calcolato in b). Con i valori numerici proposti la stampate risulterebbe dunque occupatail 63.6% del tempo.

5.9 a) La v.a.D1 può assumere i valori:4 se le coccinelle si spostano entrambe in senso orario oppure entrambe in senso antiorario;2 se la prima si sposta in senso orario e la seconda in senso antiorario oppure, viceversa, la

prima in senso antiorario e la seconda in senso orario.Poiché ognuna delle coccinelle sceglie una delle due eventualità con probabilità1

2 e in manieraindipendente dall’altra, è presto visto che

P(D1 = 4) = 12 P(D1 = 2) = 1

b) Abbiamo già calcolato in a) che seDn = 4 alloraDn+1 può assumere i valori 4 oppure 2con probabilità1

2.D’altra parte se a un determinato istante la distanza tra le due coccinelle vale 2, allora all’istante

successivo essa potrà essere:0 se esse si spostano l’una verso l’altra (cioè una in senso orario e l’altra in senso antiorario,

ma dalla parte in cui esse sono più vicine (probabilità14).

2 se esse si spostano entrambe in senso orario oppure entrambe in senso antiorario (probabilità12);

4 se esse si spostano in sensi opposti, ma allontanandosi (probabilità14).

Se inveceDn = 0 (cioè le due coccinelle si trovano sullo stesso vertice) alloraDn+1 = 0se esse si spostano insieme nella stessa direzione (probabilità1

2) oppureDn+1 = 2 se esse sispostano in direzioni opposte (probabilità ancora1

2).

Page 96: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

96 Parte 1: soluzioni

In conclusione abbiamo visto tre stati possibili,{0,2,4}, con la matrice di transizione:

P =

0↓

2↓

4↓

0 → 12

12 0

2 → 14

12

14

4 → 0 12

12

.

c) La matrice di transizioneP è regolare, perché tutti gli stati comunicano tra di loro edinoltre vi sono elementi non nulli sulla diagonale. Per il Teorema di Markov esiste dunqueun’unica distribuzione invarianteπ = (π0, π2, π4) e la probabilità P(Dn = 0) pern grande sipuò approssimare con il valoreπ0 della distribuzione invariante nello stato 0. Calcoliamo ladistribuzione invariante. Essa è soluzione del sistemaπ = πP , ovvero

π0 = 12 π0 + 1

4 π2

π2 = 12 π0 + 1

2 π2 + 12 π4

π4 = 14 π2 + 1

2 π4

π0 + π2 + π4 = 1 .

La soluzione è facile perché dalla seconda equazione si ha

π2 = 12 π0 + 1

2 π2 + 12 π4 = 1

2 (π0 + π2 + π4) = 12

da cui si ricava facilmenteπ0 = π4 = 14. Quindi pern grande le due coccinelle si trovano nello

stesso vertice con probabilità14 (qualunque sia lo stato iniziale).d) Per calcolare il tempo medio necessario perché le due coccinelle si trovino nello stesso

vertice possiamo ragionare così: rendiamo lo stato 0 assorbente (il che equivale ad arrestarela catena nel momento in cui essa giunge in 0). Se indichiamo conζ2, ζ4 i tempi medi diassorbimento in 0 partendo da 2 e 4 rispettivamente, allora sappiamo cheζ2 eζ4 sono soluzionedi

ζ2 = 1 + 12 ζ2 + 1

4 ζ4

ζ4 = 1 + 12 ζ2 + 1

2 ζ4

che ha soluzioneζ2 = 6, ζ4 = 8. Poiché supponiamo che le coccinelle partano da verticiopposti, il tempo medio perché esse si ritrovino sullo stesso vertice èζ4 = 8.

5.10 a) È chiaro che, se chiamiamo ‘‘5’’ lo stato ‘‘fine del programma’’, la matrice ditransizione è

0 12

12 0 0

12 0 0 1

414

34 0 0 1

4 0

0 0 12 0 1

2

0 0 0 0 1

.

Page 97: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.11 97

b) Se indichiamo conζi il tempo medio di assorbimento in 5 partendo dai allora i numeriζisono soluzione di

ζ1 = 1 + 12 ζ2 + 1

2 ζ3

ζ2 = 1 + 12 ζ1 + 1

4 ζ4

ζ3 = 1 + 34 ζ1 + 1

4 ζ4

ζ4 = 1 + 12 ζ3

che ha per soluzione

(136

15, 104

15, 46

5, 28

5

)

= (9.06,6.93,9.2,5.6) .

Il tempo medio partendo da 1 vale 9.06 ed è minore di quello partendo da 3.c) Con i nuovi valori la matrice di transizione diviene

0 12

12 0 0

12 0 0 1

414

14 0 0 3

4 0

0 0 12 0 1

2

0 0 0 0 1

mentre ora il sistema lineare che dà i tempi medi di assorbimento è

ζ1 = 1 + 12 ζ2 + 1

2 ζ3

ζ2 = 1 + 12 ζ1 + 1

4 ζ4

ζ3 = 1 + 14 ζ1 + 3

4 ζ4

ζ4 = 1 + 12 ζ3

che ha per soluzione

(128

21, 104

21, 110

21, 76

21

)

= (6.09,4.95,5.23,3.62) .

Quindi ora l’esecuzione è più veloce, qualunque sia lo stato iniziale.

5.11 a) SeXn = i ciò vuole dire che nelle due urne la situazione è la seguente

palline bianche palline rosseurnaA i r − i

urnaB r − i i

La probabilità che siaXn+1 = i + 1 è dunque uguale a(r−i)2

r2 : infatti si haXn+1 = i + 1 solo

se nell’urnaA viene scelta una pallina rossa (probabilitàr−ir

) e simultaneamente nell’urnaB

Page 98: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

98 Parte 1: soluzioni

viene scelta una pallina bianca (ancorar−ir

). Ripetendo questo genere di ragionamenti si vedeche, peri = 1, . . . , r − 1, deve essere

pij =

(r−i)2r2 sej = i + 1

2i(r−i)r2 sej = i

i2

r2 sej = i − 10 altrimenti .

Naturalmente sei = 0 oppurei = r si hap01 = 1, pr,r−1 = 1.b) L’insieme degli stati èE = {0,1, . . . , r}. Tutti gli stati comunicano tra loro: ogni stato

infatti comunica con i suoi vicini a destra e a sinistra; quindi sei, j ∈ E e supponiamo persemplicitài < j , allora i i + 1 . . . j , da cui segue chei j . D’altra parte si haanchej j − 1 . . . i e dunquej i. Quindi ogni stato comunica con tutti gli statialla sua destra e con tutti quelli alla sua sinistra, ovvero tutti gli stati comunicano tra di loro ela catena è irriducibile. Poiché vi è almeno uno stato ricorrente (la catena è finita), tutti gli statisono ricorrenti. Essa è anche regolare perché nella matrice di transizione vi sono degli elementi> 0 sulla diagonale.

c) Primo modo. Intanto osserviamo che la somma delle probabilitàπk, k = 0, . . . , n è ugualea 1 (è l’ultima delle (1.16)). Per mostrare cheπ è invariante proviamo prima di vedere se percaso è reversibile. Infatti, anche se la reversibilità è solo una condizione sufficiente per lastazionarietà, d’altra parte verificare la reversibilità è più facile. La distribuzioneπ è reversibilese si haπkpkj = πjpjk per ognij, k ∈ E. Poichépkj è uguale a 0 a meno chej non sia uno

dei tre numerik − 1, k, k + 1, basta fare la verifica perj = k + 1. Ma, ponendoc = 1/(2nn

)

,

πkpk,k+1 = c

(r

k

)2( r − k

r

)2= c

( (r − 1)!

k!(r − k − 1)!

)2

πk+1pk+1,k = c

(r

k + 1

)2(k + 1

r

)2= c

( (r − 1)!

k!(r − k − 1)!

)2

e dunqueπ è reversibile.Secondo modo. Il lettore attento avrà osservato che questa è una catena di nascita e morte e

per queste catene ci sono delle formule esplicite per la distribuzione stazionaria (vedi l’Esempio5.26). La formula (5.31) afferma infatti che la distribuzione stazionarie (che per queste cateneè sempre reversibile) è data da

vi =ξi

∑∞h=0 ξh

dove

ξj =p0 . . . pj−1

q1 . . . qj

Qui si ha

pi = pi,i+1 =(r − i)2

r2, qi = pi,i−1 =

i2

r2

Page 99: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.13 99

Dunque

ξj =r2(r − 1)2 . . . (r − j + 1)2

12 22 . . . j2 =(r

j

)2

ed ora la (5.31) e l’ultima delle (1.16) permettono di concludere.

5.12 a) SeXn = k, al tempon+ 1 nell’urna vi sarannok − 1 palline se la pallina presceltaè una dellek che si trovano nella prima urna, oppurek + 1 se la pallina prescelta e una dellem − k che si trovano nell’altra urna. Si tratta dunque di una catena di nascita e morte suE = {0,1, . . . , m} con

pk = pk,k+1 =m− k

m

rk = pk,k = 0

qk = pk,k−1 =k

perk = 0,1, . . . , m.b) Trattandosi di una catena di nascita e morte, sappiamo (Esempio 5.26) che la distribuzione

stazionaria è

πi =ξi

∑mh=0 ξh

dove i numeriξi sono definiti daξ0 = 1 e

ξi =p0 . . . pi−1

q1 . . . qi=m(m− 1) . . . (m− i + 1)

1 . . . i=(m

i

)

Evidentemente si ham∑

h=0

ξh =m∑

h=0

(m

h

)

= 2m

(vedi il riquadro a pag. 18) e dunque

πi =(m

i

)

2−m

Le distribuzioni stazionarie delle catene di nascita e morte sono sempre reversibili.c) Se al tempo 0 la catena si trova in uno stato pari, al tempo successivo essa si troverà in uno

stato dispari e poi in uno pari e così via. Quindi, qualunque sian, la matrice di transizione innpassiP n non può avere tutti gli elementi positivi: la catena non è regolare.

5.13 a) Tutti gli stati comunicano tra loro, perché il grafo è connesso; dunque la catena èirriducibile e la distribuzione stazionaria è unica. Per calcolarla ci sono due possibilità: la primaconsiste nel risolvere il sistema lineareπP = π più la condizioneπ1+. . .+π10 = 1. Non è unavia troppo complicata perché per motivi di simmetria è chiaro che deve essereπ2 = π3 = π4 eπ5 = π6 = π7 = π8 = π9 = π10. Ci si riconduce quindi a un sistema lineare in tre incognite.

Page 100: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

100 Parte 1: soluzioni

La seconda possibilità consiste nel ricordare che per una catena di Markov sui vertici di ungrafo c’è una formula esplicita della distribuzione stazionaria: seki è il numero di spigoli delgrafo che arrivano nel verticei ek è la somma dei numeriki , allora

πi =ki

k

è la distribuzione invariante. Quiki è uguale a 3 per 4 vertici e uguale a 1 per 6. Dunquek = 18.La distribuzione invariante vale16 per gli stati 1,2,3,4 e 1

18 per gli altri.La catena non è regolare. Basta osservare che gli stati si possono suddividere in due classi:

la prima formata da 1,5,6,7,8,9,10 e la seconda da 2,3,4. Se la catena si trova in uno statodella prima classe, all’istante successivo si troverà in uno della seconda e viceversa. Non èdunque possibile che esistan tale che, partendo dai, si possa essere in ognuno degli stati conprobabilità positiva.

b) Con le nuove regole di transizione la catena è ora regolare: essa è infatti ancora irriducibilee per di piùpii = 1

2 per gli stati da 5 a 10. Vi sono dunque degli elementi> 0 sulla diagonaledella matrice di transizione e questo, insieme alla irriducibilità, assicura la regolarità dellacatena. La formula della distribuzione invariante per le catene sui vertici di un grafo dà orak = 24 e quindi

πi ={ 1

8 sei = 1,2,3,4112 sei = 5, . . . ,10 .

c) Il tempo medio di passaggio nella classe{5, . . . ,10} partendo dai, i = 1,2,3,4, indicatoζi , si ottiene risolvendo il sistema

ζi = 1 +4∑

j=1

pij ζj , i = 1,2,3,4 .

Questo si risolve facilmente osservando che, per motivi di simmetria, deve essereζ2 = ζ3 = ζ4.Giungiamo quindi al sistema

ζ2 = 1 + 13 ζ1

ζ1 = 1 + ζ2

che dà facilmenteζ1 = 3, ζ2 = 2. Partendo da 1 dunque si giunge in uno degli stati 5, . . . ,10in media in 3 passi.

5.14 Come nell’Esempio 5.36, si possono modellizzare i lanci successivi con una catena diMarkov formata dagli stati

0 → C

1 → CT

. . .

n → CT n

dove conCT i indichiamo che negli ultimii + 1 lanci si sono avute una croce seguita dai testeconsecutive. Ad ogni lancio si può passare daCT i a CT i+1 con probabilità1

2 (se il lancio

Page 101: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.14 101

dà ancora testa) e aC con probabilità12 (se invece dà croce), se 0≤ i ≤ n − 1. Imporremo

invece che lo staton sia assorbente. Dire che con probabilità 1 si ottengono prima o poin testeconsecutive significa dire che la catena appena descritta passa prima o poi nello statoCT n.Ma questo è immediato perché tutti gli stati comunicano con lo statoCT n, che è l’unico statoassorbente. Quindi tutti gli stati tranneCT n sono transitori e la catena con probabilità 1 entranello statoCT n.

Il tempo medio di assorbimentoζi nello staton partendo dallo statoi, i = 0,1, . . . , n− 1 siottiene risolvendo il sistema lineare

ζi = 1 +n−1∑

j=0

pij ζj

che in questo caso diventaζn−1 = 1 + 1

2 ζ0

ζn−2 = 1 + 12 ζ0 + 1

2 ζn−1

. . .

ζi = 1 + 12 ζ0 + 1

2 ζi+1

. . .

ζ0 = 1 + 12 ζ0 + 1

2 ζ1 .

Il tempo medio per otteneren teste consecutive èζ0. Sostituendo il valore diζn−1 dato dallaprima equazione nella seconda si ottiene

ζn−2 = 1 +1

2ζ0 +

1

2

(

1 +1

2ζ0

)

= 1 +1

2+

1

2

(

1 +1

2

)

ζ0 .

Sostituendo questo valore nell’equazione perζn−3

ζn−3 = 1 +1

2+

1

4+

1

2

(

1 +1

2+

1

4

)

ζ0

e più in generale, per ricorrenza,

ζi = 1 +1

2+ . . .+

1

2n−i−1 +1

2

(

1 +1

2+ . . .+

1

2n−i−1

)

ζ0

da cui peri = 0

ζ0 = 1 +1

2+ . . .+

1

2n−1 +1

2

(

1 +1

2+ . . .+

1

2n−1

)

ζ0 =

=1 − 1

2n

1 − 12

+1

2

1 − 12n

1 − 12

ζ0 = 2(

1 −1

2n

)

+(

1 −1

2n

)

ζ0 .

Quindi, finalmente,ζ0 = 2(2n − 1) = 2n+1 − 2 .

Page 102: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

102 Parte 1: soluzioni

Ad esempio pern = 6 sono necessari in media 27 − 2 = 126 lanci.

5.15 a) Ricordiamo che una catena di nascita e morte è ricorrente se e solo se è divergentela serie di termine generale

γi =q1 . . . qi

p1 . . . pi=(1 + 3 − k)(2 + 3 − k) . . . (i + 3 − k)

(1 + k)(2 + k . . . (i + k)·

Cominciamo con il casok = 0: nell’espressione diγi il numeratore è il prodotto di tutti i numeriinteri da 4 ai + 3, mentre il denominatore è il prodotto dei numeri da 1 ai. Semplificando ifattori comuni al numeratore e al denominatore otteniamo

γi =(i + 1)(i + 2)(i + 3)

6(k = 0)

che è il termine generale di una serie divergente (anziγi stesso tende all’infinito peri → ∞).Ripetendo lo stesso argomento, semplificando cioè numeratore e denominatore che contengonosempre molti termini in comune, si ottengono le espressioni diγi per gli altri valori dik:

γi =i + 2

2(k = 1)

γi =2

i + 2(k = 2)

γi =6

(i + 1)(i + 2)(i + 3)(k = 3) .

La serie di termine generaleγi è dunque ancora divergente perk = 1,2, ma è convergente perk = 3. In conclusione la catena è ricorrente perk = 0,1,2 e transitoria perk = 3.

Per stabilire quando la catena sia ricorrente positiva oppure ricorrente nulla basta vederequando essa ammetta una distribuzione invariante. La catena ammette una distribuzione invari-ante se e solo se è convergente la serie di termine generale

ξj =p0 . . . pj−1

q1 . . . qj=

1

2

(1 + k) . . . (j + k − 1)

(4 − k) . . . (j + 3 − k)(2j + 3)

(vedi l’Esempio 5.26). Perk = 0 il numeratore nella frazione a destra nell’espressione prece-dente è il prodotto dei numeri interi da 1 aj − 1, mentre il denominatore contiene i prodotti da4 aj + 3. Dunque perk = 0

ξj =3(2j + 3)

j (j + 1)(j + 2)(j + 3)

che è il termine generale di una serie convergente (va a 0 all’infinito come1j3 ). Ripetendo lo

stesso ragionamento perk = 1,2 e semplificando numeratore e denominatore abbiamo

ξj =2j + 3

(j + 1)(j + 2)(k = 1)

ξj =2j + 3

4(k = 2) .

Page 103: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.15 103

Dunque la serie di termine generaleξj è divergente perk = 1,2; in conclusione la catena èricorrente positiva perk = 0 e ricorrente nulla perk = 1,2.

b) Il limite in (5.60) è certamente= 0 perk = 3, perché la catena è transitoria e così pureperk = 1 ek = 2 (ricorrente nulla). Perk = 0 invece esiste una distribuzione invariante cheindicheremoπ . Sappiamo che

limn→∞

Pi(Xn = 3) = π3

qualunque sia lo stato inizialei, a condizione che la catena sia aperiodica. Questa condizioneè verificata in questo caso, poiché l’ipotesi che siar0 = 1

2 implicap(n)0,0 ≥ rn0 > 0. Dunque lostato 0 è aperiodico, e, poiché la catena è irriducibile, tutti gli stati sono aperiodici. Come notola distribuzione stazionaria è data da

πj =ξj

∑∞h=0 ξh

(dove si poneξ0 = 1).

Page 104: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di
Page 105: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

2Risultati degli esercizi proposti

1.19 a) 15. b) 4

25.

1.20 512 = 0.416.

1.21 a1) 0.15. a2) 0.2. b1)C = (A ∩ Bc) ∪ (B ∩ Ac). b3) 0.12.

1.22 a) 1−(1− 16365)

10 = 0.36, che è una probabilità non trascurabile, ma non particolarmentealta. b)≥ 50%: ≥ 25 giorni,≥ 90%: ≥ 76 giorni. c)≥ 50%: ≥ 16 partecipanti,≥ 90%:≥ 52 partecipanti.

1.23 a) 0.95 · 0.03+ 0.2 · 0.97 = 0.2225. b)0.95·0.030.2225 = 0.128. c) (1−0.95)·0.03

0.7775 = 0.0019.

1.24 a) 45

18 + 1

5827 = 0.16. b1) è più probabile che sia equilibrata. b2)

45

116 + 1

51681

45

18 + 1

5827

= 0.56

c) n ≥ 5.

1.25 a)n ≥ 3. b) 1− 0.8n, 1− 0.8n1−0.2n . c) 0.8

1−0.2n .

Paolo BaldiCalcolo delle ProbabilitàMcGraw-Hill 2011

Page 106: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

106 Parte 2: risultati degli esercizi proposti

1.26 a) 13. b) 1

2.

1.27 a) Le sequenze sono equiprobabili. b)T T T T T T T T .

1.28 a) (130 )(

3913)

(5213)

= 0.013. b)

4

(130

)(3913

)

(5213

) − 6

(260

)(2613

)

(5213

) + 4

(390

)(1313

)

(5213

) = 0.051

1.29 a) 16. b) 1

6. c) 211.

1.30 4 (120 )(

2810)

(4010)

− 6 (120 )(

2820)

(4020)

∼ 4 (120 )(

2810)

(4010)

= 0.062.

1.31 a) (82)(

74)

(156 )

= 0.196. b) (80)(

76)+(

81)(

75)+(

82)(

74)

(156 )

= 0.23 c) 0.034; è una probabilità un po’

troppo piccola.

1.32 a) 12. b) 4

7. c) 13.

1.33 a) (42)(

62)

(104 )

= 37. b) 1

14. c) 114.

1.34 a) (131 )(

131 )(

131 )(

131 )

(524 )

= 0.1. b) (132 )(

132 )(

130 )(

130 )

(524 )

= 0.022. c) 6× (132 )(

132 )(

130 )(

130 )

(524 )

= 0.13. d)

(264 )(

260 )

(524 )

= 0.055.

1.35 a) qk = (30)(7k)

(10k )

, k = 1, . . . ,7, q8 = 0. b)pk = 310·9·8 (10− k)(9 − k), k = 1, . . .8,

massima perk = 1. c)p1 + p3 + p5 + p7 = 0.583.

1.36 a) 12. b) 1

6.

1.37 (2n)!2n

Page 107: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 1.48 107

1.38 n!.

1.41 La probabilità di estrarre palline dello stesso colore è49, quella di estrarre palline di

colori diversi 59 ed è più grande.

1.42 a) (100 )(

11010)

(12010)

= 0.404. b) (1010)(

1100 )

(12010)

≃ 8.16 · 10−15.

1.43 a)(51)(

71)(

n

1)

(12+n3 )

. b) n = 5 oppuren = 6.

1.44 a) P(N) = 13, P(R) = 1

4, P(G) = 512. b1) 2

3. b2) 67.

1.45 a) (6010)(

300 )

(9010)

= 0.013. b) (4510)(

450 )

(9010)

= 5.6 · 10−4.

1.46 a)

3R →(10

7

)(1515

)

(2522

) =8 · 9 · 10

23 · 24 · 25= 0.05

2R e 1B →(10

8

)(1514

)

(2522

) =9 · 10 · 15 · 3

23 · 24 · 25= 0.29

1R e 2B →(10

9

)(1513

)

(2522

) =10 · 14 · 15 · 3

23 · 24 · 25= 0.46

3B →(1010

)(1512

)

(2522

) =13 · 14 · 15

23 · 24 · 25= 0.2 .

1.47 a) 3× (102 )(

101 )(

101 )

(304 )

= 0.492. b) 3× (103 )(

101 )(

101 )

(305 )

+ 3 × (102 )(

102 )(

101 )

(305 )

= 0.68.

1.48 a) 1− (40)(4813)

(5213)

= 0.696. b) 1− (40)(3513)

(3913)

= 0.818. c1)

3

(40

)(4813

)

(5213

) − 3

(40

)(4826

)

(5226

) +(40

)(4839

)

(5239

) = 0.748 := r .

c2)1

r

(

3(

1 −(40

)(3513

)

(3913

)

)(40

)(4813

)

(5213

) − 3(

1 −(40

)(2213

)

(2613

)

)(40

)(4826

)

(5226

) +(40

)(4839

)

(5239

)

)

= 0.813

Page 108: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

108 Parte 2: risultati degli esercizi proposti

(A è calcolata in c1).

1.49 a) Figura 1.1 a): 2p2 −p4; Figura 1.1 b): 2p2 +p−p4 − 2p3 +p5. b) 2p2 + 2p3 −5p4 + 2p5. c) 1.1 a): 0.59, 1.1 b): 0.84, 1.2: 0.66.

1.50 a) Vero. b) Vero. c) Falso (possono essere indipendenti). d) Falso e) Falso. f) Vero. g)Vero. h) Falso. i) Vero.

2.25 a) 1−(13

0

)

0.7413−(13

1

)

0.26·0.7412−(13

2

)

0.262 ·0.7411−(13

3

)

0.263 ·0.7410 = 0.45.b) (1 − 0.28)13 = 0.014.

2.26 a)(42

)(

17

)2(67

)2+(43

)(

17

)367 +

(44

)(

17

)4= 0.46. b) 1− 840

2401 = 0.65.

2.27 a) (12)n. b) 1− (1

2)n. c) 1

2 n(n− 1)(12)n. d) 1− (n+ 1)(1

2)n. e)

(2mm

)

(12)

2m.

2.28 a) 49. b) 4n2

(3n−1)(3n−2) , →n→∞49.

2.29 a) E(T ) = 13.07 · 104 = 3254.15. b) E(T ) = 1

2.06 · 104 = 4856. Cambia, cambia. . .

2.30 a) (23)k, (1

3)k. b) 3(2

3)k − 3(1

3)k,

k = 4 k = 10 k = 20

0.56 0.05 9 · 10−4

c) P(T = k) = (23)k−1 − 2 (1

3)k−1, E(T ) = 11

2 .

2.31 a) (1 − p)n. b) λ(1−p)1−(1−p)(1−λ) .

2.32 Xn1 ∼ B(1, p),X1 . . . Xn ∼ B(1, pn).

2.33 a) voto medio= 30 × 14 = 7.5,

(3016

)(

14

)16(34

)14= 0.0006. b) Voto medio= 10,

(3016

)(

13

)16(23

)14= 0.0116.

Page 109: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 2.44 109

2.34 E(e−X) = ep(e−1+p) , eX non ha speranza matematica finita perp ≤ 1 − 1

e, E(eX) =p

1−e(1−p) perp > 1 − 1e.

2.35 a) (52)(

52)(

52)

(156 )

= 0.2. b) 6!2! 2! 2! (

13)

6 = 0.12.

2.36 a){W1 = k,W2 = m} = {X1 = C, . . . , Xk−1 = C,Xk = T ,Xk+1 = C, . . . , Xk+m−1 =C,Xk+m = T }; P(W1 = k,W2 = m) = p2(1 − p)m+k−2 = p(1 − p)k−1p(1 − p)m−1

2.37 a) P(X+ Y = k) = (k − 1)p2(1− p)k−2, k = 2,3, . . .. b)pX|X+Y (k|m) = 1m−1, per

m > k ≥ 1. c)= 1m−1 per ognik = 1, . . . , m− 1. Tutti i possibili valori sono equiprobabili.

2.38 a) 16 perA, 1

18 perB. b)qi(1− qi − q7)n−2, doveqi è la probabilità di ottenerei come

somma del lancio di due dadi,qi = i−136 per i = 2, . . . ,7, qi = 12−i+1

36 per i = 8, . . . ,12. c)

q7 +∑

i 6=2,7,12q2i

qi+q7= 0.465; conviene giocare comeB.

2.39 a) (p2 + (1 − p)2)np(1 − p). b) 12.

2.40 a) 150. a1) 3

8. a2) È più probabile che si tratti di un dado equilibrato.

2.41 a) P(Y ≤ k) = ( kn)m. b) P(Y = k) = 1

nm(km − (k − 1)m), massima perk = n. c)

P(Y ≤ k) = k·...·(k−m+1)n·...·(n−m+1) , P(Y = k) = m

n·...·(n−m+1) (k− 1) · . . . · (k−m+ 1), massima ancoraperk = n.

2.42 a) P(X = k) = 116 perk = 1, . . . ,14, P(X = 15) = 1

8; E(X) = 13516 . b) P(Y = 4) = 1,

E(Y ) = 4, Var(Y ) = 0. c) 34.

2.43 a)( rm)(

bk−m))

(r+bk ), = 1

15 perb = 7, r = 3, k = 2 em = 2. b1) rb+r , = 3

10 perb = 7, r =

3, k = 2. b2)(r−1m )(

bk−m)

(r+b−1k )

, = 136 perb = 7, r = 3, k = 2 em = 2.

2.44 a)p = 516. b2)

n = 3 n = 4

p 1132 = 0.34 93

256 = 0.36

Page 110: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

110 Parte 2: risultati degli esercizi proposti

2.46 a) E(X) = E(X3) = 0. b)

PY |X(r|k) ={

12 ser = k2 + 1 oppurer = k2 − 10 altrimenti;

E(Y |X = k) = k2. c) a = 0.

2.47 a) P(X = k |X + Y = n) =(nk

) 12n che è una legge binomialeB(n, 1

2); la speranzacondizionale vale12. b) Cov(X + Y,X + Z) = Var(X) = λ; X+Y,X+Z = 1

2. c) P(X + Y =2, X + Z = 3) = e−3λ

(λ3

2 + λ4

2 + λ5

12

)

.

2.48 a) Falso. b) Falso. c) Vero. d) No. e) Falso.

2.49 a) k0 ≥ 61. b) Usando un software adatto si trova che la probabilità che una v.a.binomialeB(100, 2

3) assuma valori< 61 (ovvero≤ 60) vale 0.1.

2.50 a)H(pλ;pλ0) = λ log λ

λ0+λ0−λ. b)H(µp;µp0

) = n{

p log pp0

+(1−p) log 1−p1−p0

}

.

2.52 a) P(X = 3) = 5128

√2. b) E(X) = 1

2, Var(X) = 1. c)X+Y è geometrica di parametro12.

2.53 P(SN = 0) = e−λ(1−p), P(SN = 1) = λp(1 − p)e−λ(1−p).

2.51 a) Binomiale negativa di parametrip, α + β. b) E(X) = α1−pp

, Var(X) = α1−pp2 .

3.35 b) e− 274 = 0.001.

3.36 Y è esponenziale di parametroλ. fZ(t) = 3t2e−λt3 pert > 0.

3.37 a)FX(x) = xθ per 0≤ x ≤ 1, = 0 perx ≤ 0 e= 1 perx ≥ 1. b) P(X ≥ 3) = 0,P(X ≤ 1

3) = 3−θ . c)Y è esponenziale di parametroθ . d) E(X) = θθ+1, Var(X) = θ

(θ+1)2(θ+2).

Page 111: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.50 111

3.38 a)F(t) = 1− θα

(θ+t)α . b) Speranza matematica= θα−1 perα > 1, varianza= αθ2

(α−1)2(α−2)perα > 2.

3.39 a) fY (t) = 1

π√

1−t2, −1 ≤ t ≤ 1. b)fY (t) = 1

π(1 − t)1/2(1 + t)−1/2. c) E(Y ) = 0

nel caso a), E(Y ) = −12 nel caso b).

3.40 a) E(X) = 0, Var(X) = 2λ2 . b) αX è di Laplace di parametroλ|α| , |X| è esponenziale

di parametroλ.

3.41 a) P(X∗ ≤ t) = 1 − (1 − t)n, fX∗(t) = n(1 − t)n−1, 0 ≤ t ≤ 1. b)fX∗(t) = ntn−1.d) E(X∗) = n

n+1, E(X∗) = 1n+1. 0 ≤ t ≤ 1

3.42 FY (t) = 0 set ≤ 0,FY (t) = 1 − e−λt se 0≤ t < M, FY (t) = 1 set ≥ M. No.

3.43 a) 0.9772. b) 0.0668. c) 0.4772. d) 0.5763.

3.44 a)8(−2.66) = 0.0038. b) 0.54. c) 0.9.

3.45 a)FX∗(t) = 8(t)n. b) 0.226. c)n ≥ 271. d) 1− 3.14 · 10−8.

3.46 a) 0.0227. b)12 e−2

√2 = 0.03.

3.47 α = 14, λ = 1

4 nel primo caso eα = 4, λ = 4 nel secondo.

3.48 a)fW (t) = c2 t

−3/4e−t , che è unaŴ(14,1). b) 2

Ŵ( 14 )

. c) E(X) = 0, Var(X) = Ŵ( 34 )

Ŵ( 14 )

.

3.49 a) 1− e−1 perα = 1, 1− 2e−1 perα = 2, 1− 52 e−1 perα = 3. b)= 8(1.414) −

8(−1.414) = 0.843 perα = 12; = − 1

Ŵ( 32 )

e−1 +8(1.414)−8(−1.414) = 0.423 perα = 32;

= −(

1Ŵ( 5

2 )+ 1

Ŵ( 32 )

)

e−1 +8(1.414)−8(−1.414)(1) = 0.151 perα = 52.

3.50 a)fY (t) = 22n/2Ŵ( n2 )

tn−1e−t2/2. b) E(√X) =

√2Ŵ( n+1

2 )

Ŵ( n2 ), Var(Y ) = n − 2

(Ŵ( n+1

2 )

Ŵ( n2 )

)2;

Page 112: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

112 Parte 2: risultati degli esercizi proposti

pern = 3 E(Y ) = 2√

2√π

,Var(Y ) = 3 − 8π

; pern = 4 E(Y ) = 3√

24

√π , Var(Y ) = 4 − 9

8 π .

3.51 fZ(t) = e−2λt (2λ2t + 2λ3t2), E(Z) = 54λ .

3.52 a) E[1X

] = λα−1 perα > 1. Var( 1

X) = λ2

(α−1)2(α−2)perα > 2.

b) g(t) = λα

Ŵ(α)t−(1+α)e−λ/t .

3.53 a1)Ŵ(α, λ). a2) 1λqβ . b1)Ŵ(100,100). b2)a = 0.81,b = 1.2.

3.54 a)g è ancora esponenziale di parametroλ. b)g(x) = 12(λ+λ2x)e−λx . c)g è di Pareto

di parametriα − 1 eλ.

3.55 b) 3. c) 6.

3.56 a1)

F(x) ={ 1

2 eλt set ≤ 01 − 1

2e−λt set ≥ 0 .

a2) SeX è uniforme su [0,1], alloraF−1(X) è di Laplace di parametriλ, doveF−1(y) =1λ

log(2y) pery ≤ 12 eF−1(y) = − 1

λlog(2(1 − y)) pery ≥ 1

2.b) SeX è uniforme su [0,1], alloraF−1(X) è di Weibull di parametriβ e λ seF−1(y) =(

− 1λ

log(1 − y))1/β .

3.57 a)µ = −12 σ

2. b)X1X2 è lognormale di parametriµ1 +µ2 eσ 21 +σ 2

2 . c) Lognormaledi parametri 0 eσ 2.

3.58 a)m(t) = λ2

λ2−t2 , t ≤ λ. b) mY−W (t) = λ2

λ2−t2 , Y − W è di Laplace di parametro

λ. c) |Y − W | è esponenziale di parametroλ, E(|Y − W |) = 1λ. d) 0 = m′

X(0) = E(X),2λ2 = m′′

X(0) = Var(X).

3.59 r(t) = αθ+t , decrescente int ; no.

3.60 a)fZ(t) = 2λe−λt (1 − e−λt ). b) E(Z) = 32λ , Var(Z) = 5

4λ2 . c) r(t) = 1 − 12eλt−1

; sì.

d)mZ(t) = 2λλ−t − 2λ

2λ−t .

Page 113: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.71 113

3.61 a = E(X).

3.62 b1) 12 (b+ a). b2)m = 1

2 (b+ a). b3) E[|X− z|] = 12(b−a)

[

(z− a)2 + (b− z)2]

. b4)

z = 12 (b + a). c) E(X) = 1

λ,m = 1

λlog 2, E[|X − z|] = z− 1

λ

(

1 − 2e−λz), z = 1λ

log 2.

3.63 a) SeX è una v.a. di densitàf , E(X) = ψ ′(0), Var(X) = ψ ′′(0).b2) SeY è una v.a. di densitàfγ , E(Y ) = ψ ′(γ ), Var(Y ) = ψ ′′(γ ).b3) ψ ′′(γ ) = Var(X) ≥ 0.b4) fγ ∼ N(σ 2γ, σ 2).b5) fγ ∼ Ŵ(α, λ− γ ).

b6) fγ (x) = λ2−γ 2

2λ e−λ|x|+γ x ,mγ (t) = λ2−γ 2

λ2−(t+γ )2 .

3.64 a) 1− r2

R2 . b1)(

1 − r2

R2

)n. b2)(

1 − r2

nR2

)n → e− r2

R2 .

3.65 a1) P(Y = 20) = 34, P(Y = 50) = 6

25, P(Y = 100) = 1100. a2) E(Y ) = 28. b1)

c = 120π , l’area più probabile resta quella relativa al punteggio 20. b2) E(Y ) = 40.

3.66 1e.

3.67 a) P(|X−Y | > 1λ) = 1

e. b)|X−Y |è esponenziale di parametroλ. c)gX−Y (t) = λ2 e−λ|t |

(di Laplace di parametroλ).

3.68 a) c = 1. b)fX(x) = − logx per 0< x < 1, Y è uniforme su [0,1]; X eY non sonoindipendenti. d) P(Y > 2X) = 1

2.

3.69 a) 13. b) 1

3. c) 13.

3.70 X, Y ∼ Ŵ(1,1).

3.71 a)X è esponenziale di parametroλ, fY (y) = 1(y+1)2

, y > 0 b) Sì. c) Esponenzialedi parametroλ. d)

fX|Y (x|y) = λ2x(y + 1)2e−λx(y+1), E[X |Y = y] =2

λ(y + 1)

Page 114: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

114 Parte 2: risultati degli esercizi proposti

3.72 a)Ŵ(α + β, λ).

b) g(x, y) = λα+β

Ŵ(α)Ŵ(β)xα−1(y − x)β−1e−λy per 0< x < y.

c) gX|X+Y (x|z) = Ŵ(α+β)Ŵ(α)Ŵ(β)

1z( xz)α−1(1 − x

z)β−1.

d) E(X |X + Y = z) = αα+β z. La retta di regressione èx = az+ b dovea = α

α+β , b = 0.

3.73 a) E(Z |X = x) = α+xα+n+β . b) E(X) = nα

α+β .

3.74 a)g(u, v) = λα+β

Ŵ(α)Ŵ(β)uα−1vα+β−1

(1−u)α+1 exp(

−λ v1−u

)

, perx > 0, y > 0.

b) fU (u) = Ŵ(α+β)Ŵ(α)Ŵ(β)

uα−1(1 − u)β−1 cioèU ∼Beta(α, β).

c) fY |U (v|t) = λα+β

Ŵ(α+β)(1−t)α+β vα+β−1 exp

(

− λ1−t v

)

.

d) E[U |U = t ] = 1λ(α + β)(1 − t). La retta di regressione diY rispetto aU è y =

1λ(α + β)(1 − t) (cioè coincide con la speranza condizionale. . . ).

3.75 a)pX(k) = αŴ(α+β)Ŵ(β+k)Ŵ(β)Ŵ(α+β+k+1) . b) E(X) = β

α−1, seα > 1;X non ha speranza matematica

finita seα ≤ 1. c) E(Y |X = k) = α+1α+β+k+1

3.76 a) E(X) = E(Y ) = 2. b) P(Y ≥ X) = 49.

3.77 a)fX(x) = αλxα−1

(λ+xα)2 . b) fY |X(y|x) = (λ+ xα)2ye−y(λ+xα). E[Y |X = x] = 2λ+xα .

3.78 fX(x) = Ŵ( n2+ 12 )

Ŵ( n2 )√πn

1

(1+ x2n)n+1

3.79 a)g(u, v) = 18 (u

2 − v2)e−u. b) gX−Y (v) = 14 e−|v|(1 + |v|).

3.80 a) P(X ≥ Y ) = 2−n. b)

f (t) ={λ4 eλt set < 0λ4 e−λt (1 + 2λt) set ≥ 0 .

3.81 a) E(X) = 0, Var(X) = 1. b) E[(X+Y )4] = 4! = 24. c) SìX+Y +Z ha una densitàcontinua, P(X + Y + Z ≥ 0) = 1

2.

Page 115: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 3.89 115

3.82 a) E(X) = 0, E(X2) = 2, E(X3) = 0. b) E[(X+Y )2] = 4, E[(X+Y )4] = 3·4! = 72.

3.83 a) φX(θ) = sinθθ

. b) φY (θ) = 2(1−cosθ)θ2 . c) φ2Y (θ) = (1−cos2 θ+sin2 θ)

2θ2 = sin2 θθ2 =

φX(θ)2. X1 +X2 ∼ 2Y .

3.84 a)φ(θ) = e−(θ21+θ2

2+θ1θ2), f (x) =1

2√

3πe− 1

3 (x21+x2

2−x1x2) .

b) X21 ∼ Ŵ(1

2,14).

c) U1 ∼ N(0,6), U2 ∼ N(0,2); U1 eU2 ∼ N(0,2) sono indipendenti.d) C non è una matrice definita positiva. . .

3.85 a)f (x) = 4π

√15

e− 115

(

8x21+32x2

2+8x1x2−4x1−2x2+ 12

)

. b1)−18. b2) 15

16, sia perX2 = −12

che perX2 = 14. b3) 0.394.

3.86 a) (X + Y,X + 2Y ) è congiuntamente gaussiana, centrata e di matrice di covarianza

C =(

2 33 5

)

b) −32 t .

3.87 a) Sì. b1) No. b2) Sì. c)g(y, z) = 12π

√108

exp(

− 1216

(

13y2 + 9z2 − 6yz))

. d) No,no.

3.88 a) Var(X2) = 2σ 4. ψX2(t) =√

11−2σ2t

pert < 12σ2 . b1)

O =(

√2

2

√2

2√2

2

√2

2

)

,

Z1 ∼ N(0,3), Z2 ∼ N(0,1). b2) Var(Z21 + Z2

2) = 20,

ψZ21+Z2

2=

1

(1 − 6t)(1 − 2t), per t ≤

1

b3)Y 21 + Y 2

2 = Z21 + Z2

2.

3.89 a)x. b) yn. c) n = 4: 0.733,n = 8: 0.709. Le probabilità non cambiano passando da

X1 aXn.

Page 116: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

116 Parte 2: risultati degli esercizi proposti

4.21 a) ( 1nXn)n converge in probabilità verso la v.a. costantep. b) (Xn)n converge in

probabilità verso la v.a. costanteαλ

.

4.23 a) 0.16.

4.24 a) (1 − 1100)

200 = 0.134. b) 0.3233213; l’approssimazione di Poisson dà 0.3233236,l’approssimazione normale 0.3611695.

4.25 a) Probabilità di superare il test: 3.7 10−4, di prendere un voto inferiore a 5: 0.2. b)0.0166. c)p = 0.493.

4.26 a) Approssimazione normale: 0.51, risultato esatto (vedi Esempio 3.45): 0.55. b)0.527. c) Skewness diX: 2 · 5−1/2 = 0.89, skewness diY : 2 · 25−1/2 = 0.4.

4.27 a) 1−8(−1.167) = 0.878 (con correzione di continuità). b)n ≥ 3 378.

4.28 a) 0.067. b) 0.081.

4.29 a) limn→∞ P(Xn ≤ n+√n) = 8(1) = 0.841, limn→∞ P(Xn ≤ n) = 8(0) = 1

2. b)12.

4.30 a) Vero. b) Vero. c) Vero.

4.31 a) Zn→Pn→∞0. b) 0.88.

4.32 a)Sn→+n→∞N(0,15). b) 0.22.

4.33 a)Sn→+n→∞N(0,2). b) 0.017.

4.34 Yn → Ŵ(12,2)

Page 117: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.17 117

4.35 a) E(logXn) = 0. b)Yn → 1 in probabilità. c)Wn → W , conW di densità

fW (t) =1

√2π t log 2

e−(log t)2/(2(log 2)2) .

4.36 b1)Wn ∼ Ŵ(n,√n). b2)Un →+

n→∞ N(0,1). a)Yn →+n→∞ N(0,1).

4.37 a) 0.0013. b)∼ 10−9. c) Sì, affidabile.

4.38 a) 0.16. b)n ≥ 66358. c)n ≥ 38959.

4.39 a) 1−8(0.816) = 0.21. b) 1−8(0.608) = 0.271.

4.40 a) (Zn)n converge in legge e in probabilità ad una v.a. che prende il valore 0 conprobabilità 1. b)(Yn)n converge in legge e in probabilità ad una v.a. che prende il valore1

λcon

probabilità 1.

4.41 a) (Mn)n converge in legge e in probabilità ad una v.a. che prende il valore 1 conprobabilità 1. b)(Zn)n converge in legge ad una v.a. esponenziale di parametro 1.

4.42 a)(nYn)n converge in legge a una legge esponenziale di parametro 1. b)(nYn)n convergein legge ad una v.a. che prende il valore 0 con probabilità 1.

4.43 Converge in legge alla f.r.F(x) = e−e−x. Se leXi hanno f.r.F(x) = e−e−x

, alloraMn ha f.r. F per ognin.

4.44 a) c = α. b) Converge in legge ad una v.a. avente f.r.G(t) = e−t−α pert > 0.

4.45 Converge ad una v.a di funzione caratteristicaφ(θ) = e−|θ |, cioè di Cauchy.

5.16 P1 è irriducibile ma non regolare,P2 eP3 sono regolari. PerP1 eP3 la distribuzionestazionaria è la probabilità uniforme. PerP2 la distribuzione stazionaria è(1

2,14,

14).

5.17 a)P1 non è irriducibile,P2 è regolare. b) PerP1 si ha P2(Xn = 1) = 0 per ognin, perP2 limn→∞ P2(Xn = 1) = 2

7. c) No.

Page 118: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

118 Parte 2: risultati degli esercizi proposti

5.18 a) 2 è transitorio, gli altri sono ricorrenti. La catena non è irriducibile. b) Ci sono

infinite distribuzioni stazionarie, della forma(2α5 ,0,

3α5 ,

3(1−α)7 ,

4(1−α)7 ), 0 ≤ α ≤ 1.

5.19 a) La catena è regolare. b)(27,

27,

37), P1(Xn = 3) ∼ 3

7.

5.20 a) La catena è regolare. b)( 119,

919,

919). c) 17. d) Ora la catena è irriducibile ma non è

più regolare. La distribuzione stazionaria è( 118,

49,

12).

5.21 a) La catena è regolare. b)(27,

27,

37).

5.22 a) 1 e 2 sono transitori, 3,4,5 ricorrenti. b) 13. c) (0,0,1,0,0), (0,0,0, 1

2,12) e

(0,0, 12,

14,

14), ad esempio.

5.23 a) Irriducibile ma non regolare. La distribuzione stazionaria è uniforme ed è reversibile.b) Ora la catena è regolare. La distribuzione stazionaria è sempre quella uniforme. c) 10.

5.24 a) 0.2. b) 13,

5.25 a)

P =

1 2 3 4 5 6 7

1 0 12 0 1

2 0 0 02 1

2 0 12 0 0 0 0

3 0 13 0 1

3 0 13 0

4 13 0 1

3 0 13 0 0

5 0 0 0 12 0 1

2 06 0 0 1

3 0 13 0 1

37 0 0 0 0 0 1 0

b) La catena è irriducibile ma non regolare.π = (18,

18,

316,

316,

18,

316,

116). c) La catena è

regolare.π = (19,

19,

16,

16,

16,

16,19) d) 4

29. La probabilità più piccola si ha per lo statoi = 1.

Page 119: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

Esercizio 5.31 119

5.26 a)

P =

0 1 2 3 4

0 1 0 0 0 01 1

3 (1 − p) p 23 (1 − p) 0 0

2 0 12 (1 − p) p 1

2 (1 − p) 03 0 0 3

5 (1 − p) p 25 (1 − p)

4 0 0 0 0 1

b) 611 (non dipende dap). c) 60

11(1−p) .

5.27 a) La catena è irriducibile ma non regolare. b) La distribuzione stazionaria vale124 per

gli stati negli angoli, 116 per quelli sui lati che non sono negli angoli,1

12 per quelli in mezzo. c)La catena è regolare. La distribuzione stazionaria vale3

84 per gli stati negli angoli,584 per quellisui lati che non sono negli angoli,884 per quelli in mezzo. d) La catena è irriducibile ma nonregolare. La distribuzione stazionaria vale216128 per gli stati negli angoli, 3

16128 per quelli suilati che non sono negli angoli, 4

16128 per quelli in mezzo.

5.28 a) La distribuzione invariante vale112 per gli stati 1,5,6,7,8,9,10 e 536 per gli altri.

La catenanonè regolare. b) 14.

5.29 a) pi,i+1 = (1 − p)(1 − iN), per 0 ≤ i ≤ N − 1, pi,i = p, pi,i−1 = (1 − p) i

N,

per 1 ≤ i ≤ N , pij = 0 altrimenti. b) Irriducibile sep < 1, regolare se 0< p < 1. c)

πi = 2−N (Ni

)

(come per il modello di Ehrenfest, Esercizio 5.12 e non dipende dap). Perngrande l’urna è vuota con probabilità 2−N .

5.30 b1) qi = (1 − p) iN

, pi = p N−iN

, ri = p + iN(1 − 2p). b2) la catena è irriducibile

e regolare. b3)πi =(Ni

)

pi(1 − p)N−i ; pern grande la proporzione di tempo in cui la l’urna è

stata composta di sole palline bianche (risp. rosse) èπN = pN (risp. π0 = (1−p)N ). c) NN

N ! .

5.31 a1)

P =

0 1 0 013 0 2

3 00 2

3 0 13

0 0 1 0

Page 120: Calcolo delle Probabilità - italy-s3-mhe-prod.s3-website ...italy-s3-mhe-prod.s3-website-eu-west-1.amazonaws.com/OLCS... · Calcolo delle Probabilità Paolo Baldi, Università di

120 Parte 2: risultati degli esercizi proposti

a2) Irriducibile ma non regolare. a3)v0 = 18, v1 = 3

8, v2 = 38, v3 = 1

8. b1)

P =

12

12 0 0

16

12

13 0

0 13

12

16

0 0 12

12

b2) Irriducibile e regolare. b3)v0 = 18, v1 = 3

8, v2 = 38, v3 = 1

8 (la stessa che in a3)).

5.32 b) (13,

13,

13). c) (2

7,27,

37)

5.33 b) p2 1+q1−qp . c) Sep = 3

4 con le condizioni proposte in realtàB ci guadagna. d)3513

5.34 b) La distribuzione stazionaria è l’uniformeπ = (13,

13,

13). La catena è reversibile.

c) 2 è assorbente, 1 e 3 sono transitori. d)π = ( 4α1+8α ,

11+8α ,

4α1+8α ), reversibile per ogniα,

0 ≤ α ≤ 12; π2 è minima perα = 1

2. e) Seα > 0 limn→∞ P1(Xn = 1) = π1 = 13. Seα = 0

limn→∞ P1(Xn = 1) = 0.

5.35 a) pN = p; la legge diXn è data dal vettorea per ognin ≥ 1. c) π = a d) Glistati transitori sono quelli tali cheai = 0. Gli altri sono ricorrenti e formano un classe chiusairriducibile.

5.37 a) Vero, b) falso, c) vero, d) falso, e) falso.