10
Kapittel 6 Noen kontinuerlige sannsynlighetsfordelinger TMA4245 V2007: Eirik Mo www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007 2 6.1 Kontinuerlig uniform fordeling Kontinuerlig uniform fordeling: Sannsynlighetstettheten til den kontinuerlige uniforme stokastiske variabelen X intervallet [A, B] er f (x ; A, B) = 1 B - A , A x B = 0 ellers. f(x) F(x) μ = E(X )= A + B 2 og σ 2 = Var(X )= (B - A) 2 12 www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007 3 6.2 Normalfordeling Normalfordeling: Sannsynlighetstettheten til en normalfordelt stokastisk variabel, X , med forventning E(X )= μ og varians Var(X )= σ 2 , er gitt ved n(x ; μ, σ)= 1 2 · πσ e - 1 2 (x -μ) 2 σ 2 , for -∞ < x < , der π=3.142 og e 1 = 2.718. www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007 4 Høyde kvinner og menn Frequency 150 160 170 180 190 200 210 0 5 10 15 www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

Institutt for matematiske fag - NTNU - 6.2 Normalfordeling 6.1 ......Kapittel 6 Noen kontinuerlige sannsynlighetsfordelinger TMA4245 V2007: Eirik Mo [email protected] (utarbeidetav Mette

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

  • Kapittel 6Noen kontinuerlige sannsynlighetsfordelinger

    TMA4245 V2007: Eirik Mo

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    2

    6.1 Kontinuerlig uniform fordelingKontinuerlig uniform fordeling: Sannsynlighetstettheten til den

    kontinuerlige uniforme stokastiske variabelen X påintervallet [A, B] er

    f (x ; A, B) =1

    B − A , A ≤ x ≤ B

    = 0 ellers.f(x) F(x)

    µ = E(X) =A + B

    2og σ2 = Var(X) =

    (B − A)212

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    3

    6.2 Normalfordeling

    Normalfordeling: Sannsynlighetstettheten til en normalfordeltstokastisk variabel, X , med forventning E(X ) = µ ogvarians Var(X ) = σ2, er gitt ved

    n(x ;µ, σ) =1√

    2 · πσe−

    12

    (x−µ)2

    σ2 ,

    for −∞ < x < ∞, der π=3.142 og e1 = 2.718.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    4

    Høyde kvinner og menn

    Fre

    quen

    cy

    150 160 170 180 190 200 210

    05

    1015

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • 5

    Høyde kvinner og menn

    hogde, menn

    Den

    sity

    165 170 175 180 185 190 195

    0.00

    0.02

    0.04

    0.06

    0.08

    hogde, kvinnerD

    ensi

    ty

    160 165 170 175 180 185

    0.00

    0.02

    0.04

    0.06

    0.08

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    6

    Normalfordelingen

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    7

    Utvalg fra normalfordeling

    Eksempel fra notat av Dimakos & Løland, Norsk Regnesentral

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    8

    Historisk sett

    — Matematisk form av normalfordlingen vist av deMoivre i 1733.

    — Laplace brukte normalfordelingen til analyse av måleusikkerhet ieksperimenter rundt 1800.

    — C.F. Gauss publikasjon 1809 matematisk behandling avmåleusikkerhet i eksperimenter.

    — Navnet “normalfordeling” kom rundt 1875 (Peirce, Galton, Lexis)

    — "No scientific discovery is named after its original discoverer."

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • Cartoon Guide to Statisticswww.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    10

    Lokasjon og spredning

    −4 −2 0 2 4

    0.0

    0.1

    0.2

    0.3

    0.4

    fx1

    N(0,1)N(−1,1) N(1,1)

    −4 −2 0 2 4

    0.0

    0.2

    0.4

    0.6

    0.8

    fx3

    N(0,0.5)

    N(0,1)

    N(0,2)

    −4 −2 0 2 4 6

    0.0

    0.1

    0.2

    0.3

    0.4

    fx1

    N(−1,1)

    N(1,2)

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    Eksempel fra notat av Dimakos & Løland, Norsk Regnesentral

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    12

    IQ— Poengsummen fra en IQ-test antas ofte å være normalfordelt, og

    flere av IQ-testene har en forventningsverdi på 100 og etstandardavvik på 16.

    140 and over Genius or near genius120-140 Very superior intelligence110-120 Superior intelligence90-110 Normal or average intelligence80-90 Dullness70-80 Borderline deficiencyBelow 70 Definite feeble-mindedness

    — Hva er sannsynligheten for å ha en IQ lavere enn 100?

    — Hva er sannsynligheten for å ha en IQ mellom 80 og 120?

    — For å bli med i Mensa må man oppnå en poengsum høyere enn 98percentilen i fordelingen for testen. Hvor høy poengsum må man hafor å blir medlem av Mensa?

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • 13

    Standard normalfordelingDFF 6.1: Fordelingen til en normalfordelt stokastisk variabel, Z , med

    forventning E(Z ) = 0 og varians Var(Z ) = 1 kalles enstandard normalfordeling.

    −3 −2 −1 0 1 2 3

    0.0

    0.1

    0.2

    0.3

    0.4

    −3 −2 −1 0 1 2 3

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    fZ (z) =1√2 · π

    e−1

    2σ2z2 ,

    for −∞ < z < ∞, der π=3.142 og e1 = 2.718.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    Cartoon Guide to Statistics

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    15

    N(µ, σ) og N(0, 1)— X har fordeling n(x ;µ, σ)— Z = X−µσ har fordeling n(z; 0, 1)

    P(x1 < X < x2) = P(x1 − µ

    σ< Z <

    x2 − µσ

    )

    = F (x2 − µ

    σ)− F (x1 − µ

    σ)

    = Φ(x2 − µ

    σ)− Φ(x1 − µ

    σ)

    −3 −2 −1 0 1 2 3

    0.0

    0.1

    0.2

    0.3

    0.4

    x

    fx

    −3 −2 −1 0 1 2 3

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    x

    Fx

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    16

    Fra halesannsynlighet til verdi

    — X er normalfordelt (µ, σ).

    — Finn x slik at P(X ≤ x) = α.— Gitt α finner vi i tabell for standard normalfordling verdien z som

    oppfyller P(Z ≤ z) = α.— Sammenheng mellom Z og X : Z = X−µ

    σog dermed X = µ + σ · Z .

    — Verdi for X finner vi fra x = µ + σ · z.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • 17

    Chebyshevs teorem ognormalfordelingen

    — Chebyshevs teorem:P(µ− kσ < X < µ + kσ) ≥ 1− 1k2— Nøyaktig for normalfordelingen:

    • k=1: P(µ− σ < X < µ + σ) = 0.683 mot Chebyshev ≥ 0.• k=2: P(µ− 2σ < X < µ + 2σ) = 0.954 mot Chebyshev ≥ 0.75• k=3: P(µ− 3σ < X < µ + 3σ) = 0.997 mot Chebyshev ≥ 0.89

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    18

    6.5 Normalapproksimasjon tilbinomisk fordeling

    TEO 6.2 Hvis X er en binomisk stokastisk variabel medforventning µ = np og varians σ2 = np(1− p), så vilden stokastiske variabelen

    Z =X − µ

    σ=

    X − np√

    np(1− p)

    når n →∞ være tilnærmet standard normalfordelt,n(z; 0, 1).

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    19

    6.5 Normalapproksimasjon tilbinomisk fordeling

    −0.5 0.0 0.5 1.0 1.5 2.0 2.5

    0.0

    0.2

    0.4

    0.6

    0.8

    n= 2 , p= 0.1

    0 1 2 3 4

    0.0

    0.1

    0.2

    0.3

    0.4

    n= 10 , p= 0.1

    0 2 4 6 8 10 12 14

    0.00

    0.05

    0.10

    0.15

    n= 50 , p= 0.1

    0 1 2 3 4

    0.0

    0.1

    0.2

    0.3

    0.4

    0.5

    n= 2 , p= 0.5

    0 2 4 6 8 10

    0.00

    0.05

    0.10

    0.15

    0.20

    0.25

    n= 10 , p= 0.5

    0 10 20 30 40

    0.00

    0.02

    0.04

    0.06

    0.08

    0.10

    n= 50 , p= 0.5

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    20

    Regneeksempel fra Cartoon Guide— Binomisk med n = 25, p = 0.5.

    — Hva er P(X ≤ 14)?

    0 5 10 15 20 25

    0.00

    0.05

    0.10

    0.15

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • 21

    Approksimasjon

    Figur fra Cartoon Guide to Statistics.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    22

    Kontinuitetskorreksjon

    Figur fra Cartoon Guide to Statistics.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    23

    Togforsinkelsen, forts.— La X (minutter) betegne togets forsinkelse på en tilfeldig valgt

    hverdag. Vi antar at X er en stokastisk variabel medsannsynlighetstetthet

    g(x) ={

    4xe−2x for x > 00 for x ≤ 0

    — Har tidligere regnet ut at P(X > 2) = 0.09.

    — La V være antall ganger i løpet av en måned (= 22 hverdager) attoget er mer enn 2 minutter forsinket. Foreslå ensannsynlighetsfordeling for V og sett opp de forutsetninger somligger til grunn for denne.

    — Hva er sannsynligheten for at toget er mer enn 2 minutter forsinketminst 2 ganger i løpet av en måned (= 22 hverdager)?

    — Hva er (tilnærmet) sannsynligheten for at toget er mer enn 2 minutterforsinket mer enn 30 ganger i løpet av 220 hverdager?

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    24

    Eksempel: Trafikk-kontroll, mobilbrukPolitiet vil aksjonere mot ulovlig mobilbruk i bil, og gjennomfører kontrollved Lerkendal-rundkjøringen.

    — Antar at antall bilførere som blir bøtelagt i løpet av t timer erPoisson-fordelt med intensitet λ = 5, dvs. med forventningλ · t = 5 · t.

    1. Antall hendelser i disjunkte tidsintervall er uavhengige.2. Sannsynligheten for at en enkelt hendelse inntreffer innenfor et

    kort tidsintervall av lengde ∆t er tilnærmet λ∆t.3. Sannsynligheten for at mer enn en hendelse skal inntreffe

    innenfor et kort tidsintervall av lengde ∆t er neglisjerbar.

    — Y=antall hendelser i intervallet [0, t], er Poisson-fordelt

    p(y ; λt) =e−λt (λt)y

    y !y = 0, 1, 2, ...

    hvor λ er gjennomsnittlig antall hendelser per enhet (intervall ellerregion).

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • 25

    Trafikk-kontroll (forts.)

    — La X være tid fra kontrollen starter til første bilfører blirbøtelagt.

    — X=tid til første hendelse, er eksponensialfordelt medforventning E(X ) = 1λ .

    — Tid mellom to påfølgende hendelser har samme fordeling somtid til første hendelse.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    26

    Eksponensial fordelingen

    DEF: En kontinuerlig stokastisk variabel X har eneksponentialfordeling med parameter β, hvissannsynlighetstettheten er gitt ved

    f (x ;β) ={ 1

    β e−x/β, x > 0

    0 ellers.

    hvor β > 0.

    TEO 6.3, COR 1: Forventing og varians i ekponentialfordelingen er

    µ = E(X ) = β σ2 = Var(X ) = β2

    Annen parameterisering: λ = 1β brukes også.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    27

    Eksponensial fordelingen, f (x)

    f (x ;β) for β = 1, 2, 3, 4, 5 (eller λ = 1,12,

    13,

    14,15

    )

    0 2 4 6 8 10

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    x

    f(x)

    beta=1

    beta=2

    beta=3

    beta=4beta=5

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    28

    Eksempel: Trafikk-kontroll (forts.)

    1. Hva er forventet tid til første bøtelegging?

    2. Hvor sannsynlig er det at første bot blir skrevet ut før det er gått 20min?

    3. Hva er sannynligheten for at det tar mer enn 3 timer til første botskrives ut?

    4. Dersom ingen er bøtelagt etter 20 min., hva er sannsynligheten for atden første bot ikke blir skrevet ut i løpet av de neste 20 min.?

    5. Hva er sannsynligheten for at det tar mer enn en time før 2 bøter erskrevet ut?

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • 29

    Ingen hukommelse

    — En lyspære har levetid X , som er eksponentialfordelt medparameter β.

    f (x ;β) ={ 1

    β e−x/β, x > 0

    0 ellers.

    — Vi vet at lyspæra har virket i s timer, hva er da sannsynlighetenfor at den virker t timer til?

    Har atP(X > s + t | X > s) = P(X > s + t − s) = 1− F (t), derF (t) = P(X ≤ t) er kumulativ fordeling for X , innsatt t .

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    30

    Eksempel: Trafikk-kontroll, mobilbruk

    Løsning: X er eksponensialfordelt med parameter β = 1/λ = 15 .

    1. E(X ) = β = 1/λ = 1/5 t = 12 min.

    2. P(X ≤ 13

    ) = F (13

    ) = 1− e−1β

    13 = 1− e−5/3 = 1− 0.19 = 0.81

    3. P(X > 3) = 1− P(X ≤ 3) = 1− (1− e−3/β) = e−3·5 =0.0000003

    4. P(X >23| X > 1

    3) = P(X >

    23− 1

    3) = P(X >

    13) = 1− P(X ≤

    13

    ) = 1− 0.81 = 0.19

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    31

    Tid til nte hendelse

    — Trafikk-kontroll:Hva er sannsynligheten for at det tar mer enn en timefør 2 bøter er skrevet ut?

    — Lyspærer: Jeg kjøper en pakke med 10 lyspærer til stekeovnen min.Hvor lang tid holder de?

    — SMS til basestasjon: Hvor lang til går det til basestasjonen harmottatt 100 SMS?

    — Trafikk-kontroll: Foto-boks står montert i tunnel. Den kan ta 36 bilder(?). Hvor langt tid tar det før veivesenet bør skifte film?

    — Promillekontroll: Hvor lenge må politiet stå på post før de har fått 5personer som har blåst rødt?

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    32

    Gamma-fordelingen

    DEF: En kontinuerlig stokastisk variabel X følger engammafordeling med parametere α og β, hvissannsynlighetstettheten er gitt ved

    f (x ;α, β) =

    {

    1βαΓ(α)x

    α−1e−x/β , x > 00 ellers.

    hvor α > 0 og β > 0.

    Parametere: α er formparameter, β er skalaparameter.

    Eksponensial: er Gamma med α = 1.

    Erlang: er Gamma med α heltall.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • 33

    Gamma fordelingen (forts.)

    DEF 6.2: Gammafunksjonen er definert som

    Γ(α) =

    0xα−1e−xdx

    for α > 0.— Γ(1) = 1.— For α positivt naturlig tall:

    Γ(α) = (α− 1) · (α− 2) · · · (α− n) · Γ(α − n).— For α positivt heltall: Γ(α) = (α− 1)!

    TEO 6.3: Forventing og varians i gammafordelingen:

    µ = E(X ) = αβ σ2 = Var(X ) = αβ2

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    34

    Gammafordelingen, f (x)α=1 α=10

    β = 1

    0 2 4 6 8

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    Eksponensial beta= 1

    x

    fx

    0 5 10 15 20 25

    0.00

    0.02

    0.04

    0.06

    0.08

    0.10

    0.12

    f(gamma) alpha= 10 beta= 1

    x

    fx

    β = 4

    0 10 20 30

    0.00

    0.05

    0.10

    0.15

    0.20

    0.25

    f(gamma) alpha= 1 beta= 4

    x

    fx

    0 20 40 60 80 100

    0.00

    00.

    005

    0.01

    00.

    015

    0.02

    00.

    025

    0.03

    0

    f(gamma) alpha= 10 beta= 4

    x

    fx

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    35

    Trafikk-kontroll, mobilbruk (forts.)Hva er sannsynligheten for at det tar mer enn en time før 2 bøter erskrevet ut?

    — La X være antall timar til andre bøtelegging.X er Gammafordelt med α = 2, β = 1

    λ= 15 .

    P(X > 1) = 1− P(X ≤ 1)

    P(X ≤ 1) =∫ 1

    0

    1(

    15

    )2

    Γ(2)

    x1e−5x dx

    = 25∫ 1

    0xe−5xdx = delvis integrasjon. . . = 0.96

    ⇒ P(X > 1) = 1− P(X ≤ 1) = 1− 0.96 = 0.04

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    36

    6.8 Kjikvadrat fordelingen

    (mer fullstendig sammen med statistisk inferens)

    DEF En kontinuerlig stokastisk variabel X er kji-kvadratfordelt parameter ν (kalt frihetgrader), hvissannsynlighetstettheten er gitt ved

    f (x ; ν) =

    {

    12ν/2Γ(ν/2)

    xν/2−1e−x/2, x > 0

    0 ellers.

    hvor ν er et positivt heltall.

    Kji-kvadrat vs. gamma: Kji-kvadrat er gamma med α = ν/2 ogβ = 2.

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

  • 37

    Kjikvadrat fordelingen (forts.)Forventing og varians i kji-kvadrat fordelingen er

    µ = E(X ) = ν σ2 = Var(X ) = 2 · ν

    0 5 10 15 20

    0.00

    0.05

    0.10

    0.15

    0.20

    0.25

    0.30

    Kjikvadrat 1,5,10,20

    0

    0

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007

    38

    6.10 Weibull fordelingen(Ikke pensum, men mye brukt!)

    DEF: En kontinuerlig stokastisk variabel X er Weibull-fordelt,med parametere α og β, med sannsynlighetstetthet gitt ved

    f (x) ={

    αβxβ−1e−αxβ

    , x > 00 ellers.

    der α > 0 og β > 0.

    Eksponensial: spesialtilfelle for β = 1

    0.0 0.5 1.0 1.5 2.0

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    1.2

    x

    fx1

    www.ntnu.no [email protected] (utarbeidet av Mette Langaas), TMA4245 V2007