Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
Sandsynlighedsregning6. forelæsningBo Friis Nielsen
Matematik og Computer Science
Danmarks Tekniske Universitet
2800 Kgs. Lyngby – Danmark
Email: [email protected]
02405 – forelæsning 6 2DTU
Dagens emner: Afsnit 4.2, 4.3 og 4.4Dagens emner: Afsnit 4.2, 4.3 og 4.4
• Poissonprocessen/eksponentialfordelingen f(x) = λe−λx
⋄ Rate λ Overlevelsesfunktion: G(x) = e−λx
⋄ Gammafordelingen f(x) = λ(λx)r−1
Γ(r)e−λx hvor Γ(r) = (r− 1)!
for r heltallig. For r heltallig P(X ≤ x) = 1−∑r−1
i=0(λx)i
i!e−λx
• Hazard-funktionen (hazard rate)
λ(t) = lim∆t→0
P(T ∈ (t, t+∆t)|T > t)
∆t=
f(t)
G(t)
• Variabelskift, P(X ∈ [x, x+ dx]) = fX(x)dx, Y = g(X)
P(Y ∈ [y, y + dy]) =fX(g
−1(y))∣
∣
∣
dydx
∣
∣
∣
02405 – forelæsning 6 3DTU
Antag, at rosinboller fra Genbrugsbageren har gennemsnitligt
3 friske og 2 radne rosiner pr. bolle.
Spørgsmal 1
Hvad er sandsynligheden for ikke at fa nogen rosiner i en bid, der
tager 20% af en bolle?
1 2 35
2 2 0.368
3 2 0.2514
4 2 15
(
35
)5
5 2 0.0067
6 2 Ved ikke
02405 – forelæsning 6 4DTU
Punktprocesser pa linienPunktprocesser pa linien
• Uheld i et vejkryds
• Radioaktivt henfald
• Opkald til internetudbyder
• Produktionsfejl pa et kabel
02405 – forelæsning 6 5DTU
Fællestræk: Vi kan modellere ...Fællestræk: Vi kan modellere ...
Antal i et tidsinterval
Tid mellem hændelser
Et lille tidsinterval
02405 – forelæsning 6 6DTU
Een grundlæggende model:
Poissonprocessen (side 289)
Een grundlæggende model:
Poissonprocessen (side 289)
• Antal hændelser i et tidsinterval er Poissonfordelt (2. p.289)
• Tiden mellem hændelser er eksponential fordelt (3. p.289)
• Konstant intensitet (sandsynlighed for en hændelse i ∆t er
proportional med ∆t) (1. p.289).
02405 – forelæsning 6 7DTU
Eksponentialfordelingen side 279Eksponentialfordelingen side 279
En eksponentialfordelt (λ) variabel T har tæthed
f(t) = λe−λt
overlevelsesfunktion
G(t) = P(T > t) = e−λt
middelværdi og varians
E(T ) =1
λVar(T ) =
1
λ2
Parameteren λ er intensiteten eller (døds)raten (hazard rate).
Eksponentialfordelingen er uden hukommelse (side 279 nederst).
HalveringstidHalveringstid
0 50 100 150 200 250 300
0.0
0.2
0.4
0.6
0.8
1.0
Time [years]
Rem
aini
ng fr
actio
n
1/2
T1 2
02405 – forelæsning 6 9DTU
Antag at en type af radioaktive atomer har halveringstid 1 ar.
Spørgsmal 2
Sandsynligheden for, at et atom af denne type overlever 5 ar, er
1 2 15
2 2 e−5
3 2 132
4 2 1− Φ(
5−11
)
5 2 1− Φ(
5−1√5
)
6 2 Ved ikke
Hvor Φ som sædvanlig betegner fordelingsfunktionen for en
standardiseret normalfordelt variabel.
02405 – forelæsning 6 10DTU
Ventetid til r’te hændelse: GammafordelingenVentetid til r’te hændelse: Gammafordelingen
Ofte vil vi beskrive tiden til den r’te hændelse.
Sammenhæng mellem antal (Nt) og tid (Tr).
P(Nt ≤ r − 1) = P(Tr > t)
For Poisson-processen fas:
P(Tr > t) =r−1∑
i=0
(λt)i
i!e−λt
Fra dette kan vi udlede tætheden for Gammafordelingen
f(t) = − d
dtG(t) =
d
dtP(Tr ≤ t) = λ
(λt)r−1
(r − 1)!e−λt
02405 – forelæsning 6 11DTU
Opgave 4.2.6Opgave 4.2.6
En Geigertæller opsamler baggrundsstraling med en gennemsnitlig
rate af en registrering pr. minut.
Lad T3 betegne det tidspunkt hvor den tredje partikel registreres
(malt i minutter).
Spm: Bestem P(2 ≤ T3 ≤ 4)
02405 – forelæsning 6 12DTU
Svar: T3 antages Gamma (3,1) fordelt (hvorfor?)
Saledes er
P(T3 > 4) = e−1·4(
1 + 4 +42
2
)
= 0.238
P(T3 ≥ 2) = e−1·2(
1 + 2 +22
2
)
= 0.677
... og dermed
P (2 ≤ T3 ≤ 4) = P(T3 ≥ 2)− P(T3 > 4) = 0.439
02405 – forelæsning 6 13DTU
Gammafordeling med ikke-heltallig parameterGammafordeling med ikke-heltallig parameter
Definer Gammafunktionen (s. 291):
Γ(r) =
∫ ∞
0
tr−1e−t dt
For heltallig parameter r har vi Γ(r) = (r − 1)!
Hvis X har tætheden
f(t) =1
Γ(r)λrtr−1e−λt
sa er X Gammafordelt med formparameter r og skalaparameter λ.
Gammafordelingen bruges ofte til at beskrivelse af levetider, etc. der
ikke kan beskrives ved eksponentialfordelingen.
02405 – forelæsning 6 14DTU
En kontinuert stokastisk variabel T har overlevelsesfunktionen
G(t) = P(T > t).
Spørgsmal 3
Bestem P(a < T ≤ b)
1 2 G(b)−G(a)G(b)
2 2 G(a)−G(b)G(a)
3 2 G′(b)−G′(a)
4 2 G(a)−G(b)
5 2 G(b)−G(a)
6 2 Ved ikke
02405 – forelæsning 6 15DTU
Hazard rate side 296Hazard rate side 296
Under service af en bil overvejer man præventivt at skifte en
komponent (f.eks. en tandrem). Komponenen har allerede alderen
t, næste service er til tiden t+ h, og komponentens levetid har
overlevelsesfunktion G(·).Spm: Hvad er sandsynligheden for, at komponenten svigter inden
næste service?
02405 – forelæsning 6 16DTU
Svar:
0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
t
G(t
)
t t+h
Det relevante er den be-
tingede sandsynlighed:
P(T ≤ t+ h | T > t)
som bestemmes til
G(t)−G(t+ h)
G(t)
Hazard rateHazard rateFor korte tidsrum (
”serviceintervaller“) h har vi
G(t)−G(t+ h)
G(t)=
f(t)
G(t)· h+ o(h)
Vi definerer nu hazard raten λ(t) for sandsynligheden for at
hændelsen indtræffer kort efter t, givet at den ikke er indtruffet før.
λ(t) =f(t)
G(t)
Sandsynligheden for at overleve indtil næste”service“ findes som
P(T > t+ h | T > t) = exp(−∫ t+h
t
λ(s) ds)
Hazardraten bestemmer sandsynligheden for at en hændelse
indtræffer (fejl, død, ankomst) kort efter et givet tidspunkt t, givet
at den ikke er indtruffet før.
02405 – forelæsning 6 18DTU
Hazard rate for eksponentialfordelingenHazard rate for eksponentialfordelingen
Vi har f(t) = λe−λt. Sa
λ(t) =λe−λt
e−λt= λ
... d.v.s. eksponentialfordelingen er hukommelsesløs.
Eksponentialfordelingen er den eneste fordeling med denne
egenskab (opgave 4.3.1)
02405 – forelæsning 6 19DTU
Overlevelsesfunktionen fra hazard rateOverlevelsesfunktionen fra hazard rate
λ(t) =f(t)
G(t)= −G′(t)
G(t)
D.v.s. G(t) løser
G′(t) = −λ(t) ·G(t) , G(0) = 1
som har løsningen
G(t) = e−∫t
0λ(u)du
• Eksponentialfordelingen som eksempel:
G(t) = e−∫t
0λdu = e−λt
02405 – forelæsning 6 20DTU
Fra tæthed til overlevelsesfunktionFra tæthed til overlevelsesfunktion
G(t) =
∫ ∞
t
f(u)du ⇔ f(t) = −dG
dt(t) , G(0) = 1
Eksponentialfordeling (λ) Gammafordeling (r,λ)
f(t) = λe−λtf(t) = e−λt λ
rtr−1
(r − 1)!
G(t) = e−λtG(t) = e−λt
r−1∑
k=0
(λt)k
k!
Forventningsværdien i en overlevelsesfordelingForventningsværdien i en overlevelsesfordeling
Lad T være en ikke-negativ kontinuert stokastisk variabel.
T ’s forventningsværdi er
E(T ) =
∫ ∞
0
t f(t) dt =
∫ ∞
0
G(t) dt
hvor G er overlevelsesfunktionen og ligheden skyldes partiel
integration. (Dette er den kontinuerte version af tail sum formula.)
For en eksponentialfordelt (λ) variabel finder vi
E(T ) =
∫ ∞
0
exp(−λt) dt =1
λ
02405 – forelæsning 6 22DTU
Opgave R.4.20Opgave R.4.20
Et apparat har en kritisk komponent med konstant fejlrate λ.
Apparatet har en tilsvarende komponent som backup. Nar den
første komponent fejler bliver dens funktion straks overtaget af den
anden, som derefter har konstant fejlrate λ uafhængigt af, hvornar
den første komponent fejlede.
Lad T være levetiden af apparatet bestemt ved det tidspunkt
erstatningskomponenten fejler.
Spm: Bestem tæthedsfunktionen for T .
Vi beskriver komponenternes levetid ved stokastiske variable Xi.
Levetiden T af apparatet er da givet ved T = X1 +X2.
DaXi er uafhængige og eksponential-
fordelte (λ) er T Gamma(2,λ) fordelt.
f(t) = λ2te−λt
0 1 2 3 4 5
0.0
0.1
0.2
0.3
tλ
f(t)
λ
Spm: Bestem overlevelsesfunktionen
Svar:
G(t) = e−λt(1 + λt)
0 1 2 3 4 5
0.0
0.2
0.4
0.6
0.8
1.0
tλ
G(t)
02405 – forelæsning 6 24DTU
Spm: Bestem fejlfunktionen
(hazard-rate)
Svar:
λ(t) =λ2te−λt
e−λt(1 + λt)=
λ
1 + 1λt
0 1 2 3 4 5
0.0
0.2
0.4
0.6
0.8
1.0
tλ
λ(t)
λ
Med λ = 1 per time, hvad er da sandsynligheden for, at et apparat,
der har virket i to timer, fejler i det næste minut
P
(
T ≤ 2 +1
60timer | T > 2 timer
)
= λ(2)1
60=
1 · (1 · 2)1 + 1 · 2
1
60=
1
90
02405 – forelæsning 6 25DTU
VariabelskiftVariabelskift
Givet en stokastisk variabel X med tæthed f(x),
og en funktion g : R 7→ R.
Det definerer en ny stokastisk variabel
Y = g(X)
Vi har for eksempel
E(Y ) = E(g(X)) =
∫
g(x)f(x)dx
02405 – forelæsning 6 26DTU
Hvad er fordelingen af Y ?Hvad er fordelingen af Y ?
Bestem for eksempel overlevelsesfunktion
P(Y > y) = E(IY >y) =
∫
{x:g(x)>y}f(x) dx
... men hvordan bestemmer vi tætheden af Y ud fra tætheden af
X?
02405 – forelæsning 6 27DTU
VariabelskiftVariabelskift
Givet X med tæthedsfunktion fX(x), og relationen Y = g(X).
0.0 0.5 1.0 1.5 2.0
0.0
0.5
1.0
1.5
2.0
x
y
y = g(x)
fX(x)
fY(y) Hvis g er voksende:
P(y1 < Y ≤ y2) =
P (g−1(y1) < X ≤ g−1(y2))
Dermed er fordelingen af Y
fastlagt!
02405 – forelæsning 6 28DTU
Bestem tæthedsfunktionen for YBestem tæthedsfunktionen for Y
Y = g(X) med g(x) voksende
Indfør FX(x) =∫ x
−∞ fX(u)du og FY (y) =∫ y
−∞ fY (v)dv.
Tæthedsfunktionen fY (y) kan findes ved at differentiere:
fY (y)h = P(y < Y ≤ y + h) = FY (y + h)− FY (y)
= P(g−1(y) ≤ g−1(Y ) ≤ g−1(y+h)) = FX(g−1(y+h))−FX((g
−1(y))
og dermed
fY (y) =fX(x)
|g′(x)| hvor x = g−1(y)
Opgave 4.4.1, 4.4.2, 4.4.3, 4.4.6 og 4.4.10 er af denne type
02405 – forelæsning 6 29DTU
Variabelskift teknisk: Y = g(X)Variabelskift teknisk: Y = g(X)
For en strengt monoton funktion y = g(x) kan vi bestemme fY (y)
ud fra fX(x) ved
fY (y) =fX(x)∣
∣
∣
dydx
(x)∣
∣
∣
hvor vi erstatter x med y ved brug af den omvendte funktion
x = g−1(y)
02405 – forelæsning 6 30DTU
Antag at X er en eksponential (λ) fordelt stokastisk variabel.
Spørgsmal 4
Tætheden f(y) af Y = cX for c > 0 er
1 2 f(y) = λe−λ(cy)
2 2 f(y) = cλe−cλy
3 2 f(y) = λce−
λ
cy
4 2 f(y) = 1√2πe−
1
2(y−cλ)2
5 2 f(y) = 1√2πe−
1
2(y− c
λ)2
6 2 Ved ikke
02405 – forelæsning 6 31DTU
Modificeret opgave 4.4.3Modificeret opgave 4.4.3
Antag, at X er ligefordelt pa ]− 1; 0[.
Spm: Find tætheden for X2.
Svar: Vi indfører Y = X2, saledes at X = −√Y , og
dydx
(x) = 2x.
fY (y) =fX(x)∣
∣
∣
dydx
∣
∣
∣
=1
|2x| =1
2√y, 0 < y < 1
Mange til een funktionMange til een funktion
Lad X være ligefordelt pa [0, 2π]; lad Y = sin(X).
Spm: Find tætheden for Y .
0 1 2 3 4 5 6
−1.
0−
0.5
0.0
0.5
1.0
x
g (x
)
Tætheden af X er 12π.
For hvert skæringspunkt er
bidraget
1
2π
1
| cos x|
med x = sin−1 y. I alt fas
fY (y) =1
π√
1− y2
02405 – forelæsning 6 33DTU
Mange-til-een funktioner, genereltMange-til-een funktioner, generelt
Hvis funktionen g(x) er strengt monoton i delintervaller gælder:
fY (y) =∑
{x:g(x)=y}
fX(x)∣
∣
∣
dydx
∣
∣
∣
02405 – forelæsning 6 34DTU
Opgave 4.4.4Opgave 4.4.4
Antag at X er ligefordelt pa ]− 1; 1[. Spm: Find tætheden af
Y = X2.
Svar: Ligningen x2 = y har de to løsninger x1 =√y og x2 = −√
y.
Bade for x1 og for x2 finder vi:
fX(x1) = fX(x2) =1
2og
∣
∣
∣
∣
dy
dx(xi)
∣
∣
∣
∣
= 2|xi|
Dermed:
fY (y) = 2fX(xi)∣
∣
∣
dydx
(xi)∣
∣
∣
= 212
|2x| =1
2√y, 0 < y < 1
02405 – forelæsning 6 35DTU
Opgave 4.4.5Opgave 4.4.5
• Antag at X er ligefordelt pa [−1; 2]. Find tætheden af X2.
• For Y i intervallet [0; 1] har vi to løsninger til y = x2, medens vi
har en løsning for Y i intervallet ]1; 2]. Vi far saledes:
fY (y) =
13√y, 0 < y ≤ 1
16√y, 1 < y < 2
02405 – forelæsning 6 36DTU
Nye begreber i dagNye begreber i dag
1. - hazard raten, og dens sammenhæng med
• Overlevelsesfunktionen
• Sandsynlighedstætheden for levetiden
2. Variabelskift
• ... for monotone funktioner
• ... for stykkevist monotone funktioner
02405 – forelæsning 6 37DTU
Afsnit 4.2, 4.3 og 4.4Afsnit 4.2, 4.3 og 4.4
• Poissonprocessen/eksponentialfordelingen f(x) = λe−λx
⋄ Rate λ Overlevelsesfunktion: G(x) = e−λx
⋄ Gammafordelingen f(x) = λ(λx)r−1
Γ(r)e−λx hvor Γ(r) = (r− 1)!
for r heltallig. For r heltallig P(X ≤ x) = 1−∑r−1
i=0(λx)i
i!e−λx
• Hazard-funktionen (hazard rate)
λ(t) = lim∆t→0
P(T ∈ (t, t+∆t)|T > t)
∆t=
f(t)
G(t)
• Variabelskift, P(X ∈ [x, x+ dx]) = fX(x)dx, Y = g(X)
P(Y ∈ [y, y + dy]) =fX(g
−1(y))∣
∣
∣
dydx
∣
∣
∣