Sandsynlighedsregning 6. forelæsning · 2019-10-03 · 02405 – forelæsning 6 3 DTU Antag, at rosinboller fra Genbrugsbageren har gennemsnitligt 3 friske og 2 r˚adne rosiner pr

Sandsynlighedsregning6. forelæsningBo Friis Nielsen

Matematik og Computer Science

Danmarks Tekniske Universitet

2800 Kgs. Lyngby – Danmark

Email: [email protected]

02405 – forelæsning 6 2DTU

Dagens emner: Afsnit 4.2, 4.3 og 4.4Dagens emner: Afsnit 4.2, 4.3 og 4.4

• Poissonprocessen/eksponentialfordelingen f(x) = λe−λx

⋄ Rate λ Overlevelsesfunktion: G(x) = e−λx

⋄ Gammafordelingen f(x) = λ(λx)r−1

Γ(r)e−λx hvor Γ(r) = (r− 1)!

for r heltallig. For r heltallig P(X ≤ x) = 1−∑r−1

i=0(λx)i

i!e−λx

• Hazard-funktionen (hazard rate)

λ(t) = lim∆t→0

P(T ∈ (t, t+∆t)|T > t)

∆t=

f(t)

G(t)

• Variabelskift, P(X ∈ [x, x+ dx]) = fX(x)dx, Y = g(X)

P(Y ∈ [y, y + dy]) =fX(g

−1(y))∣

∣

∣

dydx

∣

∣

∣

http://www.dtu.dk


Antag, at rosinboller fra Genbrugsbageren har gennemsnitligt

3 friske og 2 radne rosiner pr. bolle.

Spørgsmal 1

Hvad er sandsynligheden for ikke at fa nogen rosiner i en bid, der

tager 20% af en bolle?

1 2 35

2 2 0.368

3 2 0.2514

4 2 15

(

35

)5

5 2 0.0067

6 2 Ved ikke

http://www.dtu.dk


Punktprocesser pa linienPunktprocesser pa linien

• Uheld i et vejkryds

• Radioaktivt henfald

• Opkald til internetudbyder

• Produktionsfejl pa et kabel

http://www.dtu.dk


Fællestræk: Vi kan modellere ...Fællestræk: Vi kan modellere ...

Antal i et tidsinterval

Tid mellem hændelser

Et lille tidsinterval

http://www.dtu.dk


Een grundlæggende model:

Poissonprocessen (side 289)

Een grundlæggende model:

Poissonprocessen (side 289)

• Antal hændelser i et tidsinterval er Poissonfordelt (2. p.289)

• Tiden mellem hændelser er eksponential fordelt (3. p.289)

• Konstant intensitet (sandsynlighed for en hændelse i ∆t er

proportional med ∆t) (1. p.289).

http://www.dtu.dk


Eksponentialfordelingen side 279Eksponentialfordelingen side 279

En eksponentialfordelt (λ) variabel T har tæthed

f(t) = λe−λt

overlevelsesfunktion

G(t) = P(T > t) = e−λt

middelværdi og varians

E(T ) =1

λVar(T ) =

1

λ2

Parameteren λ er intensiteten eller (døds)raten (hazard rate).

Eksponentialfordelingen er uden hukommelse (side 279 nederst).

http://www.dtu.dk

HalveringstidHalveringstid

0 50 100 150 200 250 300

0.0

0.2

0.4

0.6

0.8

1.0

Time [years]

Rem

aini

ng fr

actio

n

1/2

T1 2

http://www.dtu.dk


Antag at en type af radioaktive atomer har halveringstid 1 ar.

Spørgsmal 2

Sandsynligheden for, at et atom af denne type overlever 5 ar, er

1 2 15

2 2 e−5

3 2 132

4 2 1− Φ(

5−11

)

5 2 1− Φ(

5−1√5

)

6 2 Ved ikke

Hvor Φ som sædvanlig betegner fordelingsfunktionen for en

standardiseret normalfordelt variabel.

http://www.dtu.dk


Ventetid til r’te hændelse: GammafordelingenVentetid til r’te hændelse: Gammafordelingen

Ofte vil vi beskrive tiden til den r’te hændelse.

Sammenhæng mellem antal (Nt) og tid (Tr).

P(Nt ≤ r − 1) = P(Tr > t)

For Poisson-processen fas:

P(Tr > t) =r−1∑

i=0

(λt)i

i!e−λt

Fra dette kan vi udlede tætheden for Gammafordelingen

f(t) = − d

dtG(t) =

d

dtP(Tr ≤ t) = λ

(λt)r−1

(r − 1)!e−λt


Opgave 4.2.6Opgave 4.2.6

En Geigertæller opsamler baggrundsstraling med en gennemsnitlig

rate af en registrering pr. minut.

Lad T3 betegne det tidspunkt hvor den tredje partikel registreres

(malt i minutter).

Spm: Bestem P(2 ≤ T3 ≤ 4)

http://www.dtu.dk


Svar: T3 antages Gamma (3,1) fordelt (hvorfor?)

Saledes er

P(T3 > 4) = e−1·4(

1 + 4 +42

2

)

= 0.238

P(T3 ≥ 2) = e−1·2(

1 + 2 +22

2

)

= 0.677

... og dermed

P (2 ≤ T3 ≤ 4) = P(T3 ≥ 2)− P(T3 > 4) = 0.439

http://www.dtu.dk


Gammafordeling med ikke-heltallig parameterGammafordeling med ikke-heltallig parameter

Definer Gammafunktionen (s. 291):

Γ(r) =

∫ ∞

0

tr−1e−t dt

For heltallig parameter r har vi Γ(r) = (r − 1)!

Hvis X har tætheden

f(t) =1

Γ(r)λrtr−1e−λt

sa er X Gammafordelt med formparameter r og skalaparameter λ.

Gammafordelingen bruges ofte til at beskrivelse af levetider, etc. der

ikke kan beskrives ved eksponentialfordelingen.

http://www.dtu.dk


En kontinuert stokastisk variabel T har overlevelsesfunktionen

G(t) = P(T > t).

Spørgsmal 3

Bestem P(a < T ≤ b)

1 2 G(b)−G(a)G(b)

2 2 G(a)−G(b)G(a)

3 2 G′(b)−G′(a)

4 2 G(a)−G(b)

5 2 G(b)−G(a)

6 2 Ved ikke

http://www.dtu.dk


Hazard rate side 296Hazard rate side 296

Under service af en bil overvejer man præventivt at skifte en

komponent (f.eks. en tandrem). Komponenen har allerede alderen

t, næste service er til tiden t+ h, og komponentens levetid har

overlevelsesfunktion G(·).Spm: Hvad er sandsynligheden for, at komponenten svigter inden

næste service?

http://www.dtu.dk


Svar:

0.0 0.5 1.0 1.5

0.0

0.2

0.4

0.6

0.8

1.0

t

G(t

)

t t+h

Det relevante er den be-

tingede sandsynlighed:

P(T ≤ t+ h | T > t)

som bestemmes til

G(t)−G(t+ h)

G(t)

http://www.dtu.dk

Hazard rateHazard rateFor korte tidsrum (

”serviceintervaller“) h har vi

G(t)−G(t+ h)

G(t)=

f(t)

G(t)· h+ o(h)

Vi definerer nu hazard raten λ(t) for sandsynligheden for at

hændelsen indtræffer kort efter t, givet at den ikke er indtruffet før.

λ(t) =f(t)

G(t)

Sandsynligheden for at overleve indtil næste”service“ findes som

P(T > t+ h | T > t) = exp(−∫ t+h

t

λ(s) ds)

Hazardraten bestemmer sandsynligheden for at en hændelse

indtræffer (fejl, død, ankomst) kort efter et givet tidspunkt t, givet

at den ikke er indtruffet før.


Hazard rate for eksponentialfordelingenHazard rate for eksponentialfordelingen

Vi har f(t) = λe−λt. Sa

λ(t) =λe−λt

e−λt= λ

... d.v.s. eksponentialfordelingen er hukommelsesløs.

Eksponentialfordelingen er den eneste fordeling med denne

egenskab (opgave 4.3.1)

http://www.dtu.dk


Overlevelsesfunktionen fra hazard rateOverlevelsesfunktionen fra hazard rate

λ(t) =f(t)

G(t)= −G′(t)

G(t)

D.v.s. G(t) løser

G′(t) = −λ(t) ·G(t) , G(0) = 1

som har løsningen

G(t) = e−∫t

0λ(u)du

• Eksponentialfordelingen som eksempel:

G(t) = e−∫t

0λdu = e−λt

http://www.dtu.dk


Fra tæthed til overlevelsesfunktionFra tæthed til overlevelsesfunktion

G(t) =

∫ ∞

t

f(u)du ⇔ f(t) = −dG

dt(t) , G(0) = 1

Eksponentialfordeling (λ) Gammafordeling (r,λ)

f(t) = λe−λtf(t) = e−λt λ

rtr−1

(r − 1)!

G(t) = e−λtG(t) = e−λt

r−1∑

k=0

(λt)k

k!

http://www.dtu.dk

Forventningsværdien i en overlevelsesfordelingForventningsværdien i en overlevelsesfordeling

Lad T være en ikke-negativ kontinuert stokastisk variabel.

T ’s forventningsværdi er

E(T ) =

∫ ∞

0

t f(t) dt =

∫ ∞

0

G(t) dt

hvor G er overlevelsesfunktionen og ligheden skyldes partiel

integration. (Dette er den kontinuerte version af tail sum formula.)

For en eksponentialfordelt (λ) variabel finder vi

E(T ) =

∫ ∞

0

exp(−λt) dt =1

λ


Opgave R.4.20Opgave R.4.20

Et apparat har en kritisk komponent med konstant fejlrate λ.

Apparatet har en tilsvarende komponent som backup. Nar den

første komponent fejler bliver dens funktion straks overtaget af den

anden, som derefter har konstant fejlrate λ uafhængigt af, hvornar

den første komponent fejlede.

Lad T være levetiden af apparatet bestemt ved det tidspunkt

erstatningskomponenten fejler.

Spm: Bestem tæthedsfunktionen for T .

http://www.dtu.dk

Vi beskriver komponenternes levetid ved stokastiske variable Xi.

Levetiden T af apparatet er da givet ved T = X1 +X2.

DaXi er uafhængige og eksponential-

fordelte (λ) er T Gamma(2,λ) fordelt.

f(t) = λ2te−λt

0 1 2 3 4 5

0.0

0.1

0.2

0.3

tλ

f(t)

λ

Spm: Bestem overlevelsesfunktionen

Svar:

G(t) = e−λt(1 + λt)

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

tλ

G(t)


Spm: Bestem fejlfunktionen

(hazard-rate)

Svar:

λ(t) =λ2te−λt

e−λt(1 + λt)=

λ

1 + 1λt

0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

tλ

λ(t)

λ

Med λ = 1 per time, hvad er da sandsynligheden for, at et apparat,

der har virket i to timer, fejler i det næste minut

P

(

T ≤ 2 +1

60timer | T > 2 timer

)

= λ(2)1

60=

1 · (1 · 2)1 + 1 · 2

1

60=

1

90

http://www.dtu.dk


VariabelskiftVariabelskift

Givet en stokastisk variabel X med tæthed f(x),

og en funktion g : R 7→ R.

Det definerer en ny stokastisk variabel

Y = g(X)

Vi har for eksempel

E(Y ) = E(g(X)) =

∫

g(x)f(x)dx

http://www.dtu.dk


Hvad er fordelingen af Y ?Hvad er fordelingen af Y ?

Bestem for eksempel overlevelsesfunktion

P(Y > y) = E(IY >y) =

∫

{x:g(x)>y}f(x) dx

... men hvordan bestemmer vi tætheden af Y ud fra tætheden af

X?

http://www.dtu.dk


VariabelskiftVariabelskift

Givet X med tæthedsfunktion fX(x), og relationen Y = g(X).

0.0 0.5 1.0 1.5 2.0

0.0

0.5

1.0

1.5

2.0

x

y

y = g(x)

fX(x)

fY(y) Hvis g er voksende:

P(y1 < Y ≤ y2) =

P (g−1(y1) < X ≤ g−1(y2))

Dermed er fordelingen af Y

fastlagt!

http://www.dtu.dk


Bestem tæthedsfunktionen for YBestem tæthedsfunktionen for Y

Y = g(X) med g(x) voksende

Indfør FX(x) =∫ x

−∞ fX(u)du og FY (y) =∫ y

−∞ fY (v)dv.

Tæthedsfunktionen fY (y) kan findes ved at differentiere:

fY (y)h = P(y < Y ≤ y + h) = FY (y + h)− FY (y)

= P(g−1(y) ≤ g−1(Y ) ≤ g−1(y+h)) = FX(g−1(y+h))−FX((g

−1(y))

og dermed

fY (y) =fX(x)

|g′(x)| hvor x = g−1(y)

Opgave 4.4.1, 4.4.2, 4.4.3, 4.4.6 og 4.4.10 er af denne type

http://www.dtu.dk


Variabelskift teknisk: Y = g(X)Variabelskift teknisk: Y = g(X)

For en strengt monoton funktion y = g(x) kan vi bestemme fY (y)

ud fra fX(x) ved

fY (y) =fX(x)∣

∣

∣

dydx

(x)∣

∣

∣

hvor vi erstatter x med y ved brug af den omvendte funktion

x = g−1(y)

http://www.dtu.dk


Antag at X er en eksponential (λ) fordelt stokastisk variabel.

Spørgsmal 4

Tætheden f(y) af Y = cX for c > 0 er

1 2 f(y) = λe−λ(cy)

2 2 f(y) = cλe−cλy

3 2 f(y) = λce−

λ

cy

4 2 f(y) = 1√2πe−

1

2(y−cλ)2

5 2 f(y) = 1√2πe−

1

2(y− c

λ)2

6 2 Ved ikke

http://www.dtu.dk


Modificeret opgave 4.4.3Modificeret opgave 4.4.3

Antag, at X er ligefordelt pa ]− 1; 0[.

Spm: Find tætheden for X2.

Svar: Vi indfører Y = X2, saledes at X = −√Y , og

dydx

(x) = 2x.

fY (y) =fX(x)∣

∣

∣

dydx

∣

∣

∣

=1

|2x| =1

2√y, 0 < y < 1

http://www.dtu.dk

Mange til een funktionMange til een funktion

Lad X være ligefordelt pa [0, 2π]; lad Y = sin(X).

Spm: Find tætheden for Y .

0 1 2 3 4 5 6

−1.

0−

0.5

0.0

0.5

1.0

x

g (x

)

Tætheden af X er 12π.

For hvert skæringspunkt er

bidraget

1

2π

1

| cos x|

med x = sin−1 y. I alt fas

fY (y) =1

π√

1− y2


Mange-til-een funktioner, genereltMange-til-een funktioner, generelt

Hvis funktionen g(x) er strengt monoton i delintervaller gælder:

fY (y) =∑

{x:g(x)=y}

fX(x)∣

∣

∣

dydx

∣

∣

∣

http://www.dtu.dk



Antag at X er ligefordelt pa ]− 1; 1[. Spm: Find tætheden af

Y = X2.

Svar: Ligningen x2 = y har de to løsninger x1 =√y og x2 = −√

y.

Bade for x1 og for x2 finder vi:

fX(x1) = fX(x2) =1

2og

∣

∣

∣

∣

dy

dx(xi)

∣

∣

∣

∣

= 2|xi|

Dermed:

fY (y) = 2fX(xi)∣

∣

∣

dydx

(xi)∣

∣

∣

= 212

|2x| =1

2√y, 0 < y < 1

http://www.dtu.dk



• Antag at X er ligefordelt pa [−1; 2]. Find tætheden af X2.

• For Y i intervallet [0; 1] har vi to løsninger til y = x2, medens vi

har en løsning for Y i intervallet ]1; 2]. Vi far saledes:

fY (y) =

13√y, 0 < y ≤ 1

16√y, 1 < y < 2

http://www.dtu.dk


Nye begreber i dagNye begreber i dag

1. - hazard raten, og dens sammenhæng med

• Overlevelsesfunktionen

• Sandsynlighedstætheden for levetiden

2. Variabelskift

• ... for monotone funktioner

• ... for stykkevist monotone funktioner

http://www.dtu.dk


Afsnit 4.2, 4.3 og 4.4Afsnit 4.2, 4.3 og 4.4

• Poissonprocessen/eksponentialfordelingen f(x) = λe−λx

⋄ Rate λ Overlevelsesfunktion: G(x) = e−λx

⋄ Gammafordelingen f(x) = λ(λx)r−1

Γ(r)e−λx hvor Γ(r) = (r− 1)!

for r heltallig. For r heltallig P(X ≤ x) = 1−∑r−1

i=0(λx)i

i!e−λx

• Hazard-funktionen (hazard rate)

λ(t) = lim∆t→0

P(T ∈ (t, t+∆t)|T > t)

∆t=

f(t)

G(t)

• Variabelskift, P(X ∈ [x, x+ dx]) = fX(x)dx, Y = g(X)

P(Y ∈ [y, y + dy]) =fX(g

−1(y))∣

∣

∣

dydx

∣

∣

∣

http://www.dtu.dk

Documents

Sandsynlighedsregning 6. forelæsning · 2019-10-03 · 02405 – forelæsning 6 3 DTU Antag, at rosinboller fra Genbrugsbageren har gennemsnitligt 3 friske og 2 r˚adne rosiner pr