Slide - Aspiri Kopi

Embed Size (px)

DESCRIPTION

Aspiri

Citation preview

  • 31477791

    Statistik Mads Ulstrup

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Mads Ulstrup

    2013/14 Aspiri A/S 2

    Lidt om mig selv HA BSc @ Aarhus Universitet, 2009 2011 (GPA: 11,2) MSc Finance @ Aarhus Universitet, 2011- 2012 (GPA: 11,9) Associate hos The Boston Consulting Group, 2013 - Underviser hos Aspiri, 2012 KPMG Corporate Finance, 2012 -2013 Ejer og medstifter af HumanKapitalPleje, 2010-2012 Underviser ved Aarhus Universitet, 2009-20 Erfaringer med statistik Underviser i Statistik I+II, HA BSc Underviser i Kvantitativ metode, HA BSc Underviser i konometri, HA BSc Kususafholdelse for HKP I/S og Aspiri A/S (Statistik og kvantitativ metode) Applied Econometric Methods I+II, MSc. Finance Empirical Finance, MSc. Finance

    Statistik

    Lidt om mig selv

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    19.15 19.30 Pause

    Agenda Session 1

    2013/14 Aspiri A/S 3 Statistik

    17.00 17.15 Velkomst og prsentation

    18.15 18.30 Pause

    18.30 19.15 Opgaver i sandsynlighedsregning

    19.30 19.45 Introduktion til fordelingsteori

    19.45 20.45 Opgaver i fordelingsteori

    17.30 18.15 Opgaver i sandsynlighedsregning

    17.15 17.30 Introduktion til sandsynlighedsregning

    20.45 21.00 Pause

    21.00 22.00 Opgaver i fordelingsteori

    Sandsynlighedsregning og fordelingsteori

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    10.30 11.35 Opgaver i hypotesetest og KI

    Agenda Session 2

    2013/14 Aspiri A/S 4 Statistik

    08.00 08.20 Introduktion til hypotesetest og konfidensintervaller (KI)

    09.15 10.20 Opgaver i hypotesetest og KI 10.20 10.30 Pause

    11.35 11.55 Pause

    11.55 12.15 Opgaver i hypotesetest og KI

    09.05 09.15 Pause

    08.20 09.05 Opgaver i hypotesetest og KI

    12.15 12.30 Introduktion til variansanalyse

    12.30 13.00 Opgaver i variansanalyse

    Hypotesetest, konfidensintervaller og variansanalyse

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    10.20 10.30 Pause

    Agenda Session 3

    2013/14 Aspiri A/S 5 Statistik

    08.00 08.15 Introduktion til kontingenstabeller

    09.15 09.30 Introduktion til liner regression

    09.30 10.20 Opgaver i liner regression

    10.30 11.35 Opgaver i liner regression

    11.35 11.55 Pause

    09.05 09.15 Pause

    08.15 09.05 Opgave i kontingenstabeller

    11.55 13.00 Opgaver i liner regression

    Kontingenstabeller og liner regressionsanalyse

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Statistik 2013/14 Aspiri A/S 6

    Session 1 Sandsynlighedsregning og fordelingsteori

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 7

    En sandsynlighed er chancen for en usikker hndelse A vil indtrffe - en sandsynlighed for en hndelse er altid mellem 0 og 1

    Statistik

    Hvad er en sandsynlighed egentlig?

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    8

    Oversigt

    Statistik 2013/14 Aspiri A/S 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 9

    1. Opgaver hvor sandsynligheder for givne hndelser fremgr af opgaveteksten, hvorefter vi skal beregne relaterede sandsynligheder

    2. Opgaver hvor sandsynligheder ikke fremgr. Derfor skal sandsynligheder beregnes via udfaldsrum, som bestemmes ved hjlp af tllesystemer

    Statistik

    To typer af opgaver i "basal sandsynlighedsregning"

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 10

    Tilfldigt eksperiment Et eksperiment med uforudsigelige udfald Eksempel: Vi kaster to terninger

    Udfald (Basic Outcome)

    Muligt udfald af et tilfldigt eksperiment Eksempel: Vi slr to 6'ere

    Udfaldsrum (Sample Space), S

    Udfaldsrummet refererer til alle mulige udfald af et eksperiment Eksempel: S = {2, 3, 4,,12} er udfaldsrummet for kast med to terninger

    Hndelse (Event), E Et event er en vilkrlig delmngde fra udfaldsrummet Eksempel: Hndelse A "summen er et lige udfald"

    A= {2, 4, 6..,12} => vi slr 1/1, 1/3, 3/1, 2/2,6/6 Eksempel: Hndelse B "vi slr 2 ens"

    B = {2, 4 , 6..,12} => vi slr 1/1, 2/2, 3/3,...6/6

    Statistik

    Begreber og typer af sandsynligheder

    Begreber i sandsynlighedsregning

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 11

    Flleshndelsen, A B (Intersection of Events) Mngden af udfald i udfaldsrummet, der tilhrer bde hndelse A og B (A B) Terningen viser 5/5, 6/6 (A: "summen er et lige udfald, B: summen er mindst 10)

    Statistik

    Begreber og typer af sandsynligheder

    B A S

    AB P(A)

    P(AB) = P(A|B)*P(B) = P(B|A)*P(A)

    Betingede hndelser Mngden af udfald i A, der kan finde sted, givet at B allerede har fundet sted "Summen er et lige antal" givet at "vi lige har slet en 4'er => vi slr 2, 4 eller 6

    B A

    S P(A|B) = P(AB)/P(B)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 12

    Foreningshndelsen, A U B (Union of Events) Mngden af udfald i udfaldsrummet, der tilhrer enten hndelse A eller B (A U B) Event A "at terningen giver et lige udfald", A= {2, 4, 6..,12} => 1/1, 1/3, 3/1, 2/2,..,6/6 Event B summen er mindst 10" B = {10, 11,, 12} => 4/6, 6/4, 5/5, 5/6, 6/5,..,6/6

    Statistik

    Begreber og typer af sandsynligheder

    B A

    S

    A S

    P(A)

    P(B)

    P(A)

    ()=1-P(A)

    P(AUB) = P(A) + P(B) - P(AB)

    Komplementrhndelsen Mngden af alle udfald i udfaldsrummet, der ikke hrer til hndelse A Event A "terningen giver et lige udfald" vs. komplementr: "terningen giver et ulige udfald"

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Disjunkte hndelser (Mutually Exclusive) Hndelser der ikke kan ske samtidig Event A: Antal jne er lige", A= {2, 4, 6..,12} - 1/1, 1/3, 3/1, 2/2,6/6 Event B: "Antal jne er ulige", B= {3, 5, 7..,11} - 1/2, 1/4, 1/6,..,6/5

    Sandsynlighedsregning

    2013/14 Aspiri A/S 13

    Gensidigt udtmmende (Collectively Exhaustive) Hndelserne er gensidigt udtmmende sfremt at hndelserne E1, E2,, Ek = S (dkker

    hele udfaldsrummet) Event A "at terningen giver et lige udfald" og Event B "at terningen giver et ulige udfald"

    Statistik

    Begreber og typer af sandsynligheder

    S

    A B

    B A

    S

    P(AB) = 0

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Bayes stning Anvendes nr hndelsen A eller B har mere end n udfaldsmulighed (her kaldet Ei)

    Sandsynlighedsregning

    2013/14 Aspiri A/S 14 Statistik

    Bayes stning til flertrinseksperimenter

    P(Ei)pvirke kander hndelseny Aelingklasseindd en ihndelser k af hndelse thi' Ei

    :hvor

    )(*)(,...,)(*)()(

    ))P(EE|P(A))P(EE|P(A))P(EE|P(A))P(EE|P(A

    P(A)))P(EE|P(A

    A)|P(E

    1

    kk2211

    ii

    iii

    APEAPAPEAPAP K

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    Anshul SharmaE = B1, B2, B3

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 15

    Bivariate sandsynligheder Vi har en delmngde af hndelser, A1, A2, ,AK og/eller B1, B2,, BK. Dette er

    tilfldet, nr vi arbejder med kontingenstabeller eller trdiagrammer. Det kan altid vre en god id at stte sine sandsynligheder ind i tabeller, hvis

    man mangler overskuelighed i en opgave

    Statistik

    Beregning med afst i kontingenstabeller

    Drlig Medium God Total

    Uacceptabel 100 10 2 112

    Under middel 70 30 5 105

    Acceptabel 40 100 8 148

    Over middel 20 110 15 145

    Total 230 250 30 510

    Inds

    ats

    i ek

    sam

    ensp

    erio

    den

    Karakter til statistikeksamen nA1

    nA1B3

    P(A1 B3) = 2 / 510

    P(B3|A4) = P(B3A4)/P(A4) = (15/510)/(145/510)

    n

    P(A1) = 100/510 + 10/510 + 2/510 = 112/510

    B

    A

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 16 Statistik

    Sandsynlighedstabel

    B

    A

    A

    B

    )BP(A

    )BAP( B)AP(

    P(A)B)P(A

    )AP(

    )BP(P(B) 1.0P(S)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 17

    Statistik

    Regneregler i sandsynlighedsregning

    Regneregel Forklaring 0 () 1 Sandsynligheden for hndelsen A (som er en del af udfaldsrummet S) er i intervallet [0; 1]. () = ()

    Sandsynligheden for hndelsen A (som er en del af udfaldsrummet S) er lig med summen af de marginale sandsynligheder for simple udfald indeholdt i hndelsen A (delmngderne af A), , hvor . . , er MECE for hndelsen A. () = ()

    = 1 Udfaldsrummet reprsenterer alle mulige udfald. () = 1 () Eftersom udfaldsrummet udgres af og , s m det ogs glde, at disse to sandsynligheder summer til 1. Enten sker hndelse A ellers sker den ikke. Foreningshndelsen "A eller B" ( ) = () + () ( ) Sandsynligheden for foreningshndelsen mellem to hndelser (enten A eller B) er lig med de individuelle sandsynligheder minus simultansandsynligheden (additionsreglen). Betinget sandsynlighed "A givet B" (|) = ( )

    (), (|) = ( )

    ()

    Den betingede sandsynlighed for hndelse A indtrffer, givet at hndelse B er indtruffet, er lig med simultansandsynligheden divideret med sandsynligheden for at B indtrffer. Flleshndelsen "A og B" ( ) = (|) () ( ) = (|) () (1 2) = (2|1) (1)

    Den simultane sandsynlighed (flleshndelsen) findes ved den betingede sandsynlighed for hndelsen A indtrffer, givet B er indtruffet, multipliceret med den marginale sandsynlighed for at hndelse B indtrffer (multiplikationsreglen). Simultane sandsynligheder anvendes ofte i trdiagramme for klasseinddelinger. Ligeledes er det disse sandsynligheder, som kan observeres i kontingenstabeller. Marginalsandsynlighed () = ( 1) + ( 2) + + ( ) Sandsynligheden for hndelsen A er en liner funktion af flleshndelserne A og disjunkte og kollektivt udtmmende (Mutually Exclusive, Collectively Exhaustive) hndelser af B (delmngde af ). Dette anvendes i kontingenstabeller. Formlen for P(A) betegnes 'loven om den totale sandsynlighed' Bayes stning ( |) = (|)()() () = (|1) (1) + (|) ()

    Bayes stning udtrykker sandsynligheden for at hndelsen indtrffer (i'te hndelse blandt MECE hndelser i klasseinddeling), nr det vides, at hndelsen A, som kan pvirke () er indtruffet. Anvendes nr der angives delmngder af hndelsen . Vi arbejder med en a priori forventet sandsynlighed og en a posteriori beregnet sandsynlighed. Formlen () betegnes 'loven om den totale sandsynlighed" Uafhngighed ( ) = () () (|) = (), (|) = ()

    To hndelser er uafhngige, hvis deres marginale sandsynligheder multipliceret sammen er lig med simultansandsynligheden. Dette er kvivalent med at sige, at deres betingede sandsynlighed er lig med deres marginale sandsynlighed.

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 18

    1. Hvis man antager at A og B er uafhngige, hvad bliver s sandsynligheden for at en tilfldig person er fdt p Amager og ogs bor der nu? 2. Hvad er sandsynligheden for at en tilfldig person, der bor p Amager, ogs er fdt der? 3. Beregn sandsynligheden for at en tilfldig person enten er fdt p Amager eller bor der nu

    Statistik

    Opgaveregning

    Opgave 1

    Opgave 2 1. Beregn sandsynligheden for at Frederik kan lse en tilfldig opgave 2. Efter eksamen har Frederik fet at vide at han har svaret rigtigt (p blandt andre) opgave 3. Beregn sandsynligheden for at denne opgave er en opgave i diskrete fordelinger

    Opgave 3 1. Find sandsynligheden for at en tilfldig kunde bde eftersprger en tilbudsvare og nsker at betale kontant 2. Hvad er sandsynligheden for at en tilfldig kunde hverken eftersprger en tilbudsvare eller nsker at betale kontant 3. Hvad er sandsynligheden for at en kunde, der betaler kontant, eftersprger en tilbudsvare? 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 19

    1. Opgaver hvor sandsynligheder for givne hndelser fremgr af opgaveteksten, hvorefter vi skal beregne relaterede sandsynligheder

    2. Opgaver hvor sandsynligheder ikke fremgr. Derfor skal sandsynligheder beregnes via udfaldsrum, som bestemmes ved hjlp af tllesystemer

    Statistik

    To typer af opgaver i "basal sandsynlighedsregning"

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaSticky NoteDette er mere kompleks, da man ikke fr nogen sandsynlighed givet.

    anshulsharmaHighlight

  • 31477791

    Det at tlle

    Statistik 2013/14 Aspiri A/S 20

    Tlleprincippet multiplikationsprincippet:

    Eksempler Bilnummerplader Komit Tipskupon Menusammenstning (forret, hovedret, dessert)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaHighlight

    anshulsharmaSticky NoteNr der kommer opgaver om dette. S skal man sige, at det er udfra tlleprincipet.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 21

    Vurdering af sandsynlighed for hndelse A: Step 1: Bestem det totale antal udfald i udfaldsrummet S Step 2: Bestem antal udfald indeholdt i hndelsen A

    Tlleren og nvneren bestemmes ud fra tlleprincipper, som varierer afhngigt af eksperimentets underliggende forudstninger. De 4 principper er udledt p baggrund af det fundamentale tlleprincip (multiplikationsprincippet): Ordnet stikprve versus ikke ordnet stikprve

    Ordnet stikprve: Elementernes rkkeflge har en betydning for udfaldsrummet Ikke-ordnet stikprve: Elementernes rkkeflge har ikke en betydning for udfaldsrummet (forskellige rkkeflger reprsenterer ikke forskellige muligheder)

    Med tilbagelgning versus uden tilbagelgning Med tilbagelgning: Elementerne udtages n af gangen og lgges herefter tilbage Uden tilbagelgning: Elementerne udtages og kan ikke indg flere gange i eksperimentet

    Statistik

    Fremgangsmde nr sandsynligheder ikke er opgivet

    ,() = =

    Den fundamentale formel til beregning af sandsynligheder (klassisk sandsynlighed) med afst i udfaldsrum:

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaSticky NoteKeyformel

    anshulsharmaSticky NoteOrdnet: Lotto(Joker); Skal vre ordnet Ordnet: Rkkeflgen er vigtig Ikke ordnet: Rkkeflgen er ikke vigtig

    Uden tilbagelgning: Obsevartion kan kun vre med en gang. Med tilbagelgning: Obsevartionen kan vre med igen og igen.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 22

    Statistik

    Multiplikationsreglen og 4 forskellige tlleprincipper Tlleprincipper

    Med tilbagelgning Elementerne udtages t af gangen og lgges herefter tilbage - elementer kan indg flere gange i eksperimentet Uden tilbagelgning Elementerne udtages p n gang - elementer kan ikke indg flere gange i eksperimentet Ikke ordnet stikprve Ved de ikke-ordnede stikprver vil forskellige rkkeflger ikke vre forskellige muligheder - alts har elementernes rkkeflge en betydning

    Vi laver trkninger blandt n objekter. Hver gang et objekt trkkes, lgges det tilbage igen. Rkkeflge har ikke betydning. Det fundamentale tlleprincip giver: Mulige udfald 1 +

    = 1 +

    1

    Vi laver trkninger blandt n objekter. Hver gang et objekt trkkes, s lgges det ikke tilbage igen. Rkkeflgen har ingen betydning. Det fundamentale tlleprincip giver: Mulige udfald !

    ! ( )! = Ordnet stikprve Ved de ordnede stikprver vil forskellige rkkeflge betyde at det er forskellige muligheder - alts har elementernes rkkeflge en betydning

    Vi laver trkninger blandt n objekter. For hver trkning er der hele tiden mulige objekter, der kan trkkes. Det fundamentale tlleprincip giver: Mulige udfald , . . , =

    Vi laver trkninger blandt n objekter. Eftersom et objekt ikke kan vlges to gange (uden tilbagelgning), s vil der i frste trkning vre mulige objekter, 1 mulige objekter i nste trkning osv. Det fundamentale tlleprincip giver: Mulige udfald ( 1), . . , ( 1) = ()

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaSticky NoteKan laves excelfil.

    anshulsharmaSticky NoteFejl: Elementernes rkkeflge ikke en betydning.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 23

    Statistik

    Tlleprincipper: Eksempel

    Med tilbagelgning Uden tilbagelgning Ikke ordnet stikprve Tlleprincip:

    1 +

    = 1 + 1

    3 1 + 33 1 = 52 = 5!2! (5 2)!= 10 (1): Sort, hvid, rd, (2): Sort, Sort, hvid (3): Sort, sort, rd, (4) Sort, sort, sort, (5): Sort, rd, rd, (6): Sort, hvid, hvid, (7): Rd, rd, rd, (8): Rd, rd, hvid, (9): Hvid, hvid, rd, (10): Hvid, hvid, hvid

    Tlleprincip: !

    ! ( )! 3!3! (3 3)! = 1

    (1): Sort, hvid, rd Ordnet stikprve Tlleprincip:

    , . . , = 3 3 3 = 33 = 27 (1): Sort, hvid, rd, (2): Sort, rd, hvid, (3): Sort, sort, rd, (4): Sort, sort, hvid (5): Sort, rd, sort, (6): Sort, hvid, sort, (7): Sort, rd, rd, (8): Sort, hvid, hvid (9): Sort, sort, sort,, (27): Hvid, hvid, hvid

    Tlleprincip: ( 1), . . , ( 1) = () 3 2 1 = 6 (1): Sort, hvid, rd, (2): Sort, rd, hvid (3): Hvid, sort, rd, (4): Hvid: rd, sort (5): Rd, hvid, sort, (6): Rd, sort, hvid

    Eksempel: Vi trkker fra en stor bowle med lige mange hvide, rde og sorte kugler. Hver gang vi har trukket n kugle smides denne enten tilbage i bowlen eller ej. Bestem udfaldsrummet, dvs. antal mder at kombinere de 3 kugler (n) i alle 3 trkninger (k):

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaHighlight

    anshulsharmaHighlight

    anshulsharmaHighlight

    anshulsharmaHighlight

    anshulsharmaSticky NoteVigtig til eksamen. Flest studerende har fejl i denne. Der er samtidig en excelark.

  • 31477791

    Sandsynlighedsregning

    2013/14 Aspiri A/S 24

    1. Beregn antal mder klasserdet kan sammensttes p 2. Beregn sandsynligheden for at klasserdet bestr af lige mange drenge og piger

    Statistik

    Opgaveregning

    Opgave 4

    Opgave 5 1. Hvor mange forskellige kombinationer af pakker kan Peters mor vlge? 2. Desvrre kommer Peters mor til at stte ild til pakkerne, s de gr helt i stykker. Hvad er sandsynligheden for at Peter ikke fr en pakke dette r? 3. Hvad er sandsynligheden for at en tilfldig pakke er "bld"? 4. P den ene "blde" pakke er til/fra-skiltet faldet af. Hvad er sandsynligheden for at pakken er til Peter?

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Statistik 2013/14 Aspiri A/S 25

    Dataskalering og fordelingsteori

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Identifikation af datavariable

    Statistik 2013/14 Aspiri A/S 26

    Data

    Katagoriske

    Numeriske

    Diskrete heltallige vrdier

    (1, 2 , 3,Z)

    Kontinuerte Decimaltal

    (1,2; 8,5,Z) Eksempler: Gift/ ikke gift Stemmeret ja/nej jenfarve (definerede

    kategorier/grupper) Typisk fra en tlleproces: Antal brn Defekte pr. time (talte enheder)

    Typisk fra en mleproces: Vgt Spnding (volt) (mlte egenskaber)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaHighlight

    anshulsharmaHighlight

  • 31477791

    Identifikation af mleniveauer

    2013/14 Aspiri A/S 27

    Kvalitative datavariable Forskellen p to observationer kan ikke mles Parallel (om end ikke direkte) til kategoriske datavariable Nominal data: Kategorier som ikke kan rangordnes

    Vi er ikke i stand til at sige, hvilken vrdi der er strst og hvilken vrdi der er mindst. Vi kan kun tale om forskel eller lighed mellem to respondenter i forhold til den pgldende variabel. Eksempel: Kn: Dreng/pige.

    Ordinal data: Kategorier som kan rangordnes. Selvom kategorier kan rangordnes, kender vi ikke afstanden fra et punkt p

    skalaen til et andet => vi kan identificere hvorvidt noget er bedre end noget andet, men ikke hvor meget bedre. Eksempel: Meget tilfreds, tilfreds, ikke tilfreds; Kvalitet: God, Medium, Drlig

    Kvantitative datavariable Forskellen mellem to observationer kan mles Parallel (om end ikke direkte) til numeriske datavariable Interval data: Numerisk skala (tal og ikke kategorier).

    Numerisk lige afstand mellem vrdierne p skalaen: afstanden mellem to scores er lig med afstanden mellem to andre scores (afstanden fra 2 til 4 er den samme som afstanden fra 4 til 6). Eksempel: Tjstrrelser.

    Ratio data: Flere ligheder med intervalskaleret data, men har et naturligt nulpunkt. Eksempel: Hjde, Vgt etc.

    Statistik 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaHighlight

    anshulsharmaHighlight

    anshulsharmaHighlight

    anshulsharmaHighlight

  • 31477791

    2013/14 Aspiri A/S 28 Statistik

    Mleniveauer - Eksempel Sammenhng med forskellige mleskalaer

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Fordelingsteori

    2013/14 Aspiri A/S 29

    Statistik

    Fordeling af den numerisk stokastiske variabel, X

    Stokastisk variabel Vi er interesseret i fordelingen af en given stokastisk variabel, X, som

    reprsenterer en mulig numerisk vrdi af et tilfldigt eksperiment Notation: Alle stokastiske variable (X, Y, Z) har en vrdimngde, hvori

    vrdierne angives med tilhrende sm bogstavler (x, y, z) Diskret fordelt (heltal begrnset udfaldsrum)

    Binomialfordeling, Poisson fordeling, Hypergeometrisk fordeling Kontinuert fordelt (decimaler fra minus uendelig til plus uendelig):

    Rektangulr (uniform) fordeling, eksponentialfordeling, normalfordeling

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Fordelingsteori

    2013/14 Aspiri A/S 30

    1. Diskrete fordelinger

    2. Kontinuerte fordelinger

    Statistik

    Typer af fordelinger

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    31

    Oversigt

    Statistik 2013/14 Aspiri A/S 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Diskrete fordelinger

    2013/14 Aspiri A/S 32

    Forklaring "En stokastisk variabel, X, er en funktion,

    der beskriver resultatet af udfrelsen af et eksperiment, og som har tilknyttet en sandsynlighedsfordeling"

    Opdeles i diskrete (heltallige) og kontinuerte stokastiske variable

    Diskret stokastisk variabel Antager kun heltallige vrdier Vi arbejder med punktsandsynligheder P(X=x): sandsynligheden for at en

    stokastisk variabel, X, antager vrdien x Sandsynlighedsfordeling: mler

    sandsynligheden for hvert enkelt udfald x

    Statistik

    Stokastisk variabel Diskret tthedsfunktion

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Diskrete fordelinger

    2013/14 Aspiri A/S 33

    Tthedsfunktionen, f(x) Angiver sandsynligheden for at den diskrete stokastiske variabel, X, antager vrdien x0, f(x0)=P(X=x). Sandsynlighed altid strre eller lig med 0.

    Fordelingsfunktionen, F(x) Angiver sandsynligheden for at den diskrete stokastiske variabel, X, antager vrdier der er mindre eller lig med x0, eller F(x0)=P(X x0). Dette er den kumulative fordeling. Sandsynlighed altid strre eller lig med 0.

    Statistik

    Tthed og fordeling Grafisk ilustration

    0.000.100.200.300.400.500.600.700.800.901.00

    0 1 2 3 4

    Sand

    synl

    ighe

    d

    f(x) F(x) Forventet vrdi og varians

    = () = ( = )

    2 = ( )2 = ( )2( = )

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaSticky NoteSandsynligheden for 1,2,3,4

    anshulsharmaSticky NoteStregen som man ser. Det er fordelinger 1 + 1. Alts 0 + 1, 0 + 1 + 2 osv.

  • 31477791

    Diskrete fordelinger

    2013/14 Aspiri A/S 34

    1. Binomialfordelingen

    2. Poisson fordelingen

    3. Hypergeometrisk fordeling (ikke pensum)

    Statistik

    To diskrete fordelinger i jeres pensum

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Diskrete fordelinger

    2013/14 Aspiri A/S 35

    Hvert forsg resulterer i t af 2 gensidigt udelukkende udfald (A eller komplementrhndelsen) Mntkast (Plat/krone), Antal defekter i stikprve (Defekt/Ikke defekt) osv.

    P(A) er konstant fra forsg til forsg De enkelte forsg er uafhngige, hvorfor udfaldet af en observation ikke pvirker udfaldet af den nste observation Der gennemfres n forsg

    Statistik

    Fordelingens forudstninger Beregning af punktsandsynlighed Binomialfordelingen ( = ) = !

    ! ( )!(1 ) Stokastisk variabel X: antal gange en binr hndelse indtrffer Punktsandsynligheden indikerer sandsynligheden for x succes'er (f.eks. antal gange vi slr plat ud af 5 mntkast) i n mulige forsg (de 5 mntkast), p angiver sandsynligheden for succes.

    Forventet vrdi og varians

    = () = 2 = ( )2 = (1 )

    Approksimationer (vigtigt)

    ~(; )

    Til standardnormalfordelingen (kontinuert), hvis np(1-p) > 5 Vigtig egenskab, da standard- normalfordelingen er mere bekvemt at arbejde med, f.eks. nr vi foretager hypotesetests (snakker vi om senere p kurset)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaSticky NoteNvn altid forudstningerne

    anshulsharmaHighlight

    anshulsharmaHighlight

    anshulsharmaHighlight

  • 31477791

    Diskrete fordelinger

    2013/14 Aspiri A/S 36

    Anvendes til at tlle antal gange en hndelse indtrffer i et givent kontinuert tidsinterval. Det kontinuerte interval deles op i et stort antal ens (tids)delintervaller Antal hndelser i et kontinuert delinterval (f.eks. et minut) er uafhngigt af antal hndelser i andre delintervaller Der sket hjest n hndelse i hvert delinterval Sandsynligheden for at en hndelse indtrffer i et delinterval er negligerbar,

    konstant over hele forlbet samt identisk p tvrt af delintervaller Intensiteten, dvs. det forventede antal hndelser pr. interval er

    Statistik

    Fordelingens forudstninger Beregning af punktsandsynlighed Poissonfordelingen Stokastisk variabel X: # gange en hndelse indtrffer i et givent interval Punktsandsynligheden indikerer sandsynligheden for x hndelser inden for et givet tidsinterval (f.eks. antal kunder i en k pr. time). Det forventede antal hndelser pr. tidsinterval er

    ( = ) = !

    Forventet vrdi og varians

    = () = 2 = ( )2 =

    ~(; )

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaSticky NoteSkriv ALTID forudstningerne

    anshulsharmaSticky NoteLamda betyder forventet vrdi

  • 31477791

    Fordelingsteori

    2013/14 Aspiri A/S 37

    1. Diskrete fordelinger

    2. Kontinuerte fordelinger

    Statistik

    Typer af fordelinger

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaSticky NoteKommatal

    anshulsharmaSticky NoteIkke kommatal

  • 31477791

    Kontinuerte fordelinger

    2013/14 Aspiri A/S 38

    Forklaring "En stokastisk variabel er en funktion,

    der beskriver resultatet af en enkelt udfrelse af et eksperiment, og som har tilknyttet en sandsynlighedsfordeling"

    Opdeles i diskrete (heltallige) og kontinuerte stokastiske variable

    Kontinuert stokastisk variabel Punktsandsynlighed = 0 Arbejder med arealsandsynlighed

    F(x) = P(X x) Vi ser p sandsynlighedsttheden for X

    (i stedet for punktsandsynligheder). Sandsynlighedsttheden benvnes f(x)

    Antager vrdier i et interval

    Statistik

    Stokastisk variabel Fordelingsfunktion

    x

    f(x) Arealet under tthedsfunktionen summer til 1

    x

    f(x)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

    anshulsharmaSticky NoteFordi det er kommatal

  • 31477791

    Kontinuerte fordelinger

    2013/14 Aspiri A/S 39

    Tthedsfunktionen, f(x) Punktsandsynligheden=0 Areal under tthedsfunktion over alle vrdier af x er 1 og tthedsfunktionen kan ikke antage negative vrdier Sandsynligheden for at den stokastiske variabel X ligger i et interval P(x1 X x2) er arealet under tthedsfunktionen mellem de to vrdier (x1 og x2)

    Fordelingsfunktionen, F(x) Arealet under tthedsfunktionen (kumulativ over tthedsfunktionen) Angiver sandsynligheden for at den kontinuerte stokastiske variabel, X, antager vrdier der er mindre eller lig med x0, eller F(x0)=P(X x0) Vi er altid i stand til at finde arealet under fordelingsfunktionen. Dette sker ved simpel integralregning Sandsynligheden for at den stokastiske variabel X ligger mellem to mulige vrdier x1 og x2 er: P(x1

  • 31477791

    Kontinuerte fordelinger

    2013/14 Aspiri A/S 40

    1. Rektangulr (uniform) fordeling 2. Eksponentialfordeling 3. Normalfordelingen

    Statistik

    Tre kontinuerte fordelinger i jeres pensum

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Kontinuerte fordelinger

    2013/14 Aspiri A/S 41

    Identiske sandsynligheder for alle mulige udfald af den stokastiske variabel, X

    Statistik

    Beskrivelse Rektangulre (uniforme) fordeling Forventet vrdi og varians

    x

    f(x)

    xmin xmax = () = + 2 2 = ( )2 = ( )212

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Kontinuerte fordelinger

    2013/14 Aspiri A/S 42

    Anvendes til beskrivelse af tidsinterval (t) mellem 2 successive hndelser Nrt beslgtet til poissonfordelingen, dog er exponentialfordelingen kontinuert (punktsandsynlighed = 0) Forudstningerne er ligesom poissonfordelingen Intensiteten, dvs. det forventede antal hndelser pr. tidsenhed er Sandsynligheden for at en ankomst er mindre eller lig med en specificeret tid er givet ved:

    Statistik

    Beskrivelse Eksponentialfordelingen

    Forventet vrdi og varians

    () = 1

    , () = 12

    ~ ()

    = = 1

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    ~ ( ,2) =

    ~ (0,1)

    Kontinuerte fordelinger

    2013/14 Aspiri A/S 43

    Klokkeformet, symmetrisk fordeling Placering styres af gennemsnittet Spredningen styres af standardafvigelsen Fordelingen er defineret i intervallet [-;+ ] Den hellige gral inden for statistik Fordelingen approksimerer en bred vifte af stokastiske variable For at gre forskellige stokastiske variable X, der flger en normalfordeling, sammenlignelige p tvrs af hinanden, standardiserer/transformerer vi X (til Z), s middelvrdien er 0 og variansen er 1:

    Statistik

    Stokastiske variable, X og Z x

    f(x) Normalfordelingen

    ~ (,2)

    f(z)

    z 0 1 Trkker gennemsnit fra og dividerer med standardafvigelsen

    Beskrivelse af fordeling

    +

    styrer fordelingens placering styrer fordelingens spredning (bredde)

    P( < X < +) = F(+ ) - F()

    P(X < ) = F() = P(Z

  • 31477791

    Kontinuerte fordelinger

    2013/14 Aspiri A/S 44

    Vi nsker som udgangspunkt altid at arbejde med den standardiserede normalfordeling Beregning af sandsynligheder Hvis vi arbejder med normalfordelingen, s er sandsynligheden for at X ligger i intervallet [x0 < X < x1] givet ved: Hvis vi arbejder med binomialfordelingen, og vi er i stand til at approksimere til normalfordelingen fordi np(1-p)>5, s er sandsynligheden givet ved: Sandsynlighederne for den standardiserede normalfordeling kan sls op i Appendix Tabel 1 (viser vrdier af fordelingsfunktionen)

    Statistik

    Standardiserede normalfordeling ~ (0,1)

    (0 < < 1) = 0 < < 1 = 1 0

    (0 < < 1) = 0 (1 ) < < 1 (1 ) = 1 (1 ) 0 (1 )

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Kontrol for normalitet

    2013/14 Aspiri A/S 45

    Ikke alle kontinuerte stokastiske variable er normalfordelte. Det er essentielt at kunne vurdere, hvorvidt en stokastisk variabel kan karaktiseriseres som normalfordelt. Normalfraktildiagram Betragt plottet af observerede vrdier vs. kumulative sandsynligheder (kumulative normalfordelings sandsynligheder p den lodrette akse og observerede datavrdier p den vandrette akse). Observationerne skal vre nogenlunde ligeligt fordelt omkring linjen for at man kan antage, at den stokastiske variabel er normalfordelt:

    Statistik

    Hvorvidt den stokastiske variabel, X, er normalfordelt

    0

    100

    Data

    Procent Tilnrmelsesvis liner --> vi kan godt antage normalitet

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Fordelingsteori

    2013/14 Aspiri A/S 46

    1. Find sandsynligheden for at mnten viser krone prcis 5 gange

    Statistik

    Opgaveregning

    Opgave 6

    Opgave 7 1. Angiv en model der kan benyttes til at beskrive antal afgifter pr. dag og beregn det gennemsnitlige antal afgifter vagten udskriver pr. dag 2. Hvis vagten fortstter med samme gennemsnit, hvad er s sandsynligheden for at vagten udskriver 25 afgifter nste dag? 3. Hvad er sandsynligheden for at vagten udskriver over 35 afgifter nste dag?

    Opgave 8 1. Angiv sandsynlighedsmodellen for X. 2. Find E[X] og Var[X]. 3. Den statistiske kvalitetskontrol gr ud p, at maskinen skal justeres, dersom mindst n komponent i en stikprve p 10 komponenter er defekt. Beregn sandsynligheden for, at maskinen skal justeres, svel under forudstning af at maskinen er korrekt justeret som under forudstning af at maskinen ikke er korrekt justeret.

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Fordelingsteori

    2013/14 Aspiri A/S 47 Statistik

    Opgaveregning

    Opgave 9 1. Angiv 5-punktsopsummeringen og hvornr en observations betragtes som en outlier 2. Forklar hvordan typetallet er defineret 3. Udtryk hvad den empiriske regel angiver for denne stikprve 4. Hvilken fordeling kan gennemsnittet antages at flge? 5. Benyt de estimerede parametre og beregn sandsynligheden for at gennemsnittet overstiger 475g

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Statistik 2013/14 Aspiri A/S 48

    Session 2 Hypotesetest, KI og variansanalyse

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    49

    Oversigt

    Statistik 2013/14 Aspiri A/S 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    2013/14 Aspiri A/S 50 Statistik

    Nu udtager vi en stikprve fra populationen!

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Stikprvefordelinger

    2013/14 Aspiri A/S 51

    1. Stikprvegennemsnit

    2. Stikprveandele

    3. Stikprvevarians

    Statistik

    3 relevante stikprvefordelinger/estimatorer i jeres pensum

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Stikprve og population

    2013/14 Aspiri A/S 52

    Mngden af alle enheder/individer af interesse Vi nsker at drage inferens om populationen p baggrund af vores resultater fra stikprven En parameter er et karakteristika, der beskriver populationen, f.eks. middelvrdi Vi nsker ofte at estimere (og teste hypoteser omkring) populationsparametrene p baggrund af vores stikprveestimater Populationen beskrives ved stokastiske variable X1, X2,,XN (N er total populationsstrrelse)

    Statistik

    Definitioner og fordelinger Populationen Stikprven Delmngde af populationen, som anvendes til at drage inferens omkring populationen Et stikprveestimat (punktestimat) er vores bedste bud p parameteren p baggrund af den valgte stikprvestimator (stikprvefordeling), f.eks. stikprvegennemsnittet Stikprven beskrives ved stokastiske variable X1, X2,,Xn (n er total stikprvestrrelse) For en bestemt stikprve vil vi betegne de samme variable med smt x, alts: x1, x2,,xn - ligeledes vil punktestimatet ogs vre med smt, alts

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Stikprveestimatorer

    2013/14 Aspiri A/S 53 Statistik

    Definitioner og egenskaber Populationsparameter Stikprveestimator Standardfejl Estimator egenskaber

    = () = 1

    =1 For normalfordelte stokastiske variable, 1,2,

    Stikprvegennemsnittet:

    = 1

    =1 , = 1=1 , For normalfordelte stokastiske variable, 1,2, , eller en tilfldig stikprve fra populationen, 1,2,

    =

    Korrektion hvis ikke er lille i forhold til

    Central/unbiased Den forventede vrdi af estimatoren er lig med populationsparameteren, som den skal estimere () = vi rammer i gennemsnit rigtigt Efficiens Estimatoren med den laveste varians er mest efficient. er den mest efficiente estimator for middelvrdiparameteren

    = 1

    =1 For Bernoulli-fordelte stokastiske variable, 1,2,

    Stikprveandelen:

    = 1

    =1 , = 1=1 For Bernoulli-fordelte stokastiske variable, 1,2, , eller en tilfldig stikprve fra populationen, 1,2,

    = (1 ) Central/unbiased Den forventede vrdi af estimatoren er lig med populationsparameteren, som den skal estimere () = Efficiens Estimatoren med den laveste varians er mest efficient.

    2 = 1( )2=1

    For normalfordelte stokastiske variable, 1,2, Den empiriske stikprvevarians:

    2 = 1 1( )2

    =1 For tilfldig stikprve fra populationen, 1,2, . Variansen er forskellig for forskellige stikprver fra populationen

    2 = 24 1

    Central/unbiased Den forventede vrdi af estimatoren er lig med populationsparameteren, som den skal estimere (2) = 2 Efficiens Estimatoren med den laveste varians er mest efficient.

    Vi arbejder typisk med n af flgende 3 stikprveestimatorer:

    * Sidste egenskab for en estimator (udover centralitet og efficiens) er, at den er konsistent, hvilket betyder, at den rammer mere prcist (er tttere p den sande parameter, som den nsker at estimere) jo strre en stikprve, den er baseret p. Ikke alle centrale estimatorer er konsistente 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Stikprveestimatorer

    2013/14 Aspiri A/S 54 Statistik

    Fordeling af stikprveestimatorer

    Stikprvefunktion/estimator Fordeling Matematisk standardisering Stikprvegennemsnit Sfremt populationens stokastiske variable, , er normalfordelte med gennemsnit og standardafvigelse , er fordelingen af stik-prvegennemsnittet ogs normalfordelt (uanset stikprvestrrelse).

    Hvis ~ ,2, da er = ( )

    / ~ (0,1) (kendt varians) = ( )

    / ~ 1 (ukendt varians) Stikprveandelen Sfremt populationens stokastiske variabel, , er binomialfordelt med gennemsnit og standardafvigelse (1 ) kan fordelin-gen af stikprveandelen approksimeres med normalfordelingen, nr (1 ) > 5

    Hvis ~(,2), da er = ( )

    (1 )

    ~ (0,1) Stikprvevarians

    Sfremt populationen er normalfordelt, er fordelingen af en transformation af stikpr-vevariansen (se til hjre) chi-square fordelt med n-1 frihedsgrader 2 = ( 1)2

    2 ~ 12 Den centrale grnsevrdistning (CLT) x "Uanset fordeling af er approksimativt normalfordelt nr stikprven er tilstrkkelig stor" (n > 25 for de fleste fordelinger) x "Nr stikprven vokser (eller n er tilstrkkelig stor), vil fordelingen af den standardiserede variabel:

    = () () g mod standardnormalfordelingen (0,1)"

    x CLT kan bruges til bde diskrete og kontinuerte variable og er ofte set anvendt i empiriske analyser

    Fordelingen af stikprveestimatorerne er essentiel, nr vi nsker at teste hypoteser og opstille konfidensintervaller for populationsparameteren Nedenfor fremgr fordelingen af de 3 stikprvefunktioner:

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Stikprvefordelinger

    2013/14 Aspiri A/S 55

    1. Konfidensintervaller

    2. Hypotesetest

    Statistik

    Hypotesetest og konfidensintervaller for n og to populationer

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Konfidensintervaller

    2013/14 Aspiri A/S 56 Statistik

    Steps for intervalestimatorer I stedet for et punktestimat af populationsparameteren er det ofte nyttigt at konstruere et konfidensinterval, som populationsparameteren med stor sandsynligheden ligger i: Vi siger her, at "Ved mange trk af tilfldigt udtrukne stikprver fra populationen og

    konstruktion af tilhrende konfidensintervaller, vil (1-)% af intervallerne indeholde den sande vrdi af populationsparameteren eller blot Den sande populationsparameter er indeholdt i intervallet med 95% sikkerhed Vi skal igennem flgende steps ved opstilling af konfidensintervaller: 1. Bestem en estimator for populationsparameteren af interesse Argumenter for jeres valg ud fra centralitet og evt. efficiens af estimator 2. Diskuter forudstninger og find fordeling af estimatoren FU1: Hver enhed i populationen har samme sandsynlighed for at blive udvalgt (Simpel Tilfldig Udvlgelse eller STU) FU2: Stikprveenheder udvlges uafhngigt af hinanden (Uafhngighed). FU3: Normalitetsantagelsen for estimatoren 3. Bestem fejlmargin, ME(), og st grnserne for populationsparameteren 4. Opskriv intervallet for populationsparameteren og drag konklusion

    () < < + () = 1 ()

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Signifikansniveau

    2013/14 Aspiri A/S 57

    Nr vi skal opstille konfidensintervaller eller efterprver hypoteser, bestemmer vi signifikansniveauet, Uafhngigt af hvilken fordeling vores estimator flger, er fortolkningen af altid den samme i fordelingsmssig sammenhng Ved konfidensintervaller:

    Bestemmer vores fejlmargin, som afgr vidden af et konfidensinterval ("Hvor stor sikkerhed vi nsker at udtale os med"), f.eks. =0,05 den sande populationsparameter ligger i intervallet med 95% sikkerhed

    Ved hypotesetests: Bestemmer vores sandsynligheden for type I fejl (forkaste H0 givet H0 er sand), alts at drage den forkerte konklusion ved forkastelse af en sand H0-hypotese

    Statistik

    Hvad er egentlig for en strrelse?

    Z

    Forklaring

    1.96 -1.96 0.95

    0

    Eksempel: /2=0.025 i standardnormalfordeling

    P(Z>1.96) = 0.025 massen i halerne

    /2 < < /2 = 1

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Konfidensintervaller

    2013/14 Aspiri A/S 58 Statistik

    Valg af konfidensinterval - n populationsparameter

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Konfidensintervaller

    2013/14 Aspiri A/S 59 Statistik

    Valg af konfidensinterval - 2 populationsparametre

    * Omrde er pensum, men ikke en del af Mamdouh Medhat slides

    *

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Stikprvefordelinger

    2013/14 Aspiri A/S 60

    1. Konfidensintervaller

    2. Hypotesetest

    Statistik

    Specielt 2 interessante elementer

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest

    2013/14 Aspiri A/S 61

    Vi nsker at teste hypoteser omkring en populationsparameter, , eller forskelsparameter 1- 2, p baggrund af vores stikprve En nulhypotese om en populations-parameter er et udsagn, der i udgangspunktet er sandt, med mindre vi kan finde overbevisende evidens for det modsatte (forkaste nulhypotesen) Vi arbejder med to hypoteser:

    H0: Angiver udgangspunktet for populationsparameteren ("status quo") H1: Angiver alternativhypotesen (den hypotese vi vil pvise ved test). Hvis vi vlger H1, s siger vi "at vi forkaster H0"

    Vi har bde med nsidet og tosidede hypoteser. Hvilke type vi vlger, afhnger af den givne opgave, vi bliver stillet Der er to mulige konklusioner: 1) Vi har ikke evidens til at forkaste H0 2) Vi forkaster H0 (tror ikke p H0)

    Statistik

    Generel forklaring Forml Fejltyper ved hypotesetest

    Tosidet hypotese: 0: = 0 1: 0 nsidet hypotese: 0: 0 1: > 0 nsidet hypotese: 0: 0 1: < 0

    Selvom vi drager konklusioner p baggrund af datamaterialet, er det ikke sikkert, at vores konklusion er korrekt: Type I-fejl: Vi forkaster H0, selvom den er sand (sandsynligheden er angivet ved vores valg af signifikansniveau, ) Type II-fejl: Vi forkaster ikke H0, selvom er falsk (sandsynligheden kalder vi , som er en modarbejdende funktion til )

    Altid en afvejning mellem sandsynligheden for de to typer af fejl. Hvis vi nsker lavere , fr vi automatisk hjere . Derfor finder man ofte et passende kompromis (typisk ved =0.05)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest

    2013/14 Aspiri A/S 62

    Vi forkaster H0, hvis: 1. Teststrrelsen, T, er mere ekstrem end den kritiske grnse, K 2. P-vrdien er lavere end det valgte signifikansniveau Teststrrelse:

    Mler hvor godt vores stikprveestimat, dvs. vores bedste bud p populationsparameteren, passer med H0 P-vrdi:

    Udtrykker sandsynligheden for at observere noget mere ekstremt end teststrrelsen, givet at H0 er sand Vi forkaster, hvis teststrrelsen er s ekstrem, at der er mindre end sandsynlighed for at observere teststrrelsen i den relevante fordeling under H0 (dvs. givet at vi har en given fordeling med parametervrdien 0)

    Sandsynligheden for at en tilfldig observation trukket fra den relevante fordeling overstiger vores teststrrelse Sandsynligheden for at teststrrelsen observeres i en relevant fordeling

    Forkast hvis sandsynligheden for at observere teststrrelsen er lavere end , givet H0 er sand

    Statistik

    Hvordan konkluderer vi p resultaterne

    Z

    Konklusioner

    K2: 1.96 K1: -1.96 0.95

    0

    Eksempel: /2=0.025 i standardnormalfordeling

    Forkast H0 Forkast H0 Fasthold H0 T > K T < -K -K < T < K

    /2=0.025

    P(Z < T | H0) < /2 P(Z > T | H0) < /2

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest

    2013/14 Aspiri A/S 63 Statistik

    Steps for lsning af opgaver i hypotesetests Vi skal igennem flgende steps ved hypotesetests: Intuition bag hypotesetestet:

    Brug en stikprve fra populationen til at sandsynliggre om nulhypotesen eller alternativhypotesen, er sand/falsk. Sammenhold en teststatistik med en kritisk grnse for at sandsynliggre, om nulhypotesen kan forkastes. Med mindre andet er angivet i opgaven anvendes signifikansniveau p 5%

    1. Definr stokastisk variabel , opstil hypoteser for populationsparameteren og bestem estimatoren for populationsparameteren (Argumentr ud fra centralitet og efficiens) 2. Diskuter forudstninger og bestem signifikansniveau x FU1: Hver enhed i populationen har samme sandsynlighed for at blive udvalgt (Simpel Tilfldig Udvlgelse) x FU2: Stikprveenheder/observationer er uafhngige (Uafhngighed) x FU3: Normalitetsantagelsen for estimatoren (Normalitet) x FU4: Varianshomogenitet, hvis hypotesetest p forskelsparameteren 1 2 3. Bestem en teststrrelse og beregn testvrdien 4. Fastlg kritisk grnse(r), beregn p-vrdi og drag konklusion

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest

    2013/14 Aspiri A/S 64 Statistik

    En population: Hypotesetest for n middelvrdi eller varians

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest

    2013/14 Aspiri A/S 65 Statistik

    En population: Hypotesetest for n andel

    * Omrde er pensum, men ikke en del af Mamdouh Medhat slides

    *

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest

    2013/14 Aspiri A/S 66 Statistik

    To populationer: Hypotesetest for to middelvrdier og varianser

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest

    2013/14 Aspiri A/S 67 Statistik

    Relevante fordelingsfunktioner

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest og KI

    2013/14 Aspiri A/S 68

    1. Kan det afvises at laboratoriets pstand er korrekt? 2. Bestem et 95% konfidensinterval for sandsynligheden for, at en rotte vil d efter ind-tagelsen af giften. 3. Bestem et tilsvarende konfidensinterval, hvis 16 ud af 22 rotter dr. 4. Kommentr resultaterne i de 2 ovenstende opgaver

    Statistik

    Opgaveregning

    Opgave 10

    Opgave 11 1. Angiv et estimat for p 2. Angiv et interval som med 95% sikkerhed vil indeholde p 3. Antag, at man p forhnd havde opstillet et krav, at punktestimatet for p ikke mtte afvige mere end 0,6%-point fra p med sandsynlighed 0,95. Er ovenstende talmateriale tilstrkkeligt til at opfylde dette krav? Hvis ikke, hvor mange bilag skulle da have vre undersgt for at opfylde kravet? 4. Virksomheden for hvem revisionen foretages, pstr at de kun har 1% fejlbehftede bilag. Er revisoren i stand til at afvise denne pstand? 5. Hvilken to typer af fejl kan man beg i hypotesetests?

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest og KI

    2013/14 Aspiri A/S 69

    1. Benyt disse mleresultater til at afgre, om fordelingen kan antages at have middel-vrdien = 500 g, idet det antages at variansen er ukendt. 2. Opstil et 95% konfidensinterval for standardafvigelsen af den pfyldte vgt. 3. Lovgivningen krver ogs, at der hjest er 2,5% af fyldningerne, som vejer mindre end 485 gram. Kan fabrikanten overholde dette krav?

    Statistik

    Opgaveregning

    Opgave 12

    Opgave 13 1. Figur 1 viser normalfraktildiagrammerne for udgifterne til benzin- og dieseldrevne lastvogne (hhv. plusser og stjerner). Opstil med udgangspunkt i denne figur en model for data i tabel 1. 2. Tabellen viser gennemsnittet, , og den empiriske varians, s2, for hvert af de 2 motor-typer. Undersg om der er grundlag for at hvde at brndstofudgifterne til henholdsvis benzindrevne og dieseldrevne lastvogne adskiller sig fra hinanden. Fr testet udfres, gennemfr test for varianshomogenitet. 3. Beregn et skn over de forventede udgifter til brndstof pr. krt lngdeenhed for en tilfldig lastvogn, og angiv et 95% konfidensinterval for de forventede udgifter til brndstof pr. krt lngdeenhed. 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Hypotesetest og KI

    2013/14 Aspiri A/S 70

    1. Estimr den forventede begyndelsesln for kvinder og opstil et 95% konfidensinterval for den forventede begyndelsesln. 2. Kan den forventede begyndelsesln antages af vre den samme for mnd og kvin-der? 3. Opstil et 95% konfidensinterval for forskellen mellem mnds og kvinders begyndelsesln

    Statistik

    Opgaveregning

    Opgave 14

    Opgave 15 1. Figur 1 viser normalfraktildiagrammerne for de 2 apparater. Opstil med udgangspunkt i denne figur en model for data 2. Undersg om man p baggrund af de 2 gange 9 mlinger kan afvise, at maskinerne mler ens

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    71

    Oversigt

    Statistik 2013/14 Aspiri A/S 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyser

    2013/14 Aspiri A/S 72 Statistik

    Hvad nu hvis 1. Vi nsker at teste for forskelle mellem

    mere end to normalfordelte populationer for n faktor 2. Vi nsker at teste for forskelle mellem mere end to normalfordelte populationer for to forskellige faktorer

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyse

    2013/14 Aspiri A/S 73 Statistik

    Indledning Anvendelse Vi anvender variansanalysen, hvis vi nsker at teste forskellene mellem K forskellige populationsgrupper (mere end n og to populationer) Navnet variansanalyse kommer af, at vi opbygger vores test p baggrund af variabiliteten inden for de enkelte grupper med variabiliteten mellem grupper n-sidet variansanalyse

    K populationer/grupper er kategoriseret mht. en faktor To-sidet variansanalyse

    K grupper og H blokke er kategoriseret mht. to faktorer. Derved skal vi ogs have interaktionseffekten med, hvorfor der i realiteten bliver 3 tests

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyse

    2013/14 Aspiri A/S 74 Statistik

    n-sidet variansanalyse: Analysens komponenter

    Variabilitet Kommentar Variabiliteten indenfor enkelte grupper

    = 2, = 1, ,=1

    x Variabiliteten indenfor grupperne = 1, , bestemmes ved kvadratsummerne, som er et ml for spredningen indenfor de enkelte grupper x Gennemsnittet for gruppe bestemmes ved: = 1 =1

    Variabilitet indenfor grupper

    = =1 = 2

    =1

    =1 =

    x SSW: Den totale variabilitet for alle grupperne mler den summerede kvadratiske afstand fra gennemsnittet for alle observationerne i grupperne = 1, , x MSW: Middelkvadratsummen indenfor grupperne

    Variabilitet mellem grupper

    = 2=1

    = 1

    x Variabiliteten mellem grupperne = 1, , viser den totale kvadratiske afstand fra hver gruppes gennemsnit til det overordnede gennemsnit for alle observationer, hvor hver gruppe vgtes med sin gruppestrrelse x Det overordnede gennemsnit bestemmes ved:

    = 1 = 1 =1=1=1

    x MSG: Middelkvadratsummen mellem grupperne Total variabilitet

    = 2=1

    =1 x Den totale variabilitet er en funktion af den totale variabilitet indenfor grupper og variabilitet mellem grupper x Vi har at = +

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyse

    2013/14 Aspiri A/S 75 Statistik

    n-sidet variansanalyse Analysen n-sidet variansanalyse er bygget op omkring nedenstende ANOVA-tabel: Hypotese Forudstninger

    H0: 1 = 2 =, , = K H1: Mindst 2 middelvrdier er forskellige x Normalitet for populationsgrupperne = 1, , - Undersges ved normalfraktildiagrammer for hver gruppe x Varianshomogenitet mellem populationsgrupperne - Undersges ved Levene's test for varianshomogenitet x Uafhngighed mellem (og indenfor) stikprverne

    Variation f.g. Sums of Squares Mean Squares F-Statistic

    Mellem grupper k-1 SSG MSG=SSG/(K-1) F=MSG/MSW

    Indenfor grupper n-k SSW MSW=SSW/(n-K)

    Total n-1 SST=SSG+SSW

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyse

    2013/14 Aspiri A/S 76 Statistik

    n-sidet variansanalyse Test-statistik Kritisk grnse og p-vrdi

    Under nulhypotesen er MSW og MSG begge centrale estimatorer for 2, de er uafhngige og begge 2-fordelte. Vores test-statistik ser dermed ud som flger: F = (K 1)2 MSG/(K 1)(n K)

    2 MSW/(n K) = MSGMSW = SSG/(K 1)SSW/(n K) ~ FK1;nK K = FK1;nK; p = PFK1;nK > F H0)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyser

    2013/14 Aspiri A/S 77 Statistik

    Hvad nu hvis 1. Vi nsker at teste for forskelle mellem mere end to normalfordelte populationer for n faktor 2. Vi nsker at teste for forskelle mellem

    mere end to normalfordelte populationer for to forskellige faktorer

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyse

    2013/14 Aspiri A/S 78 Statistik

    To-sidet variansanalyse: Analysens komponenter

    Variabilitet Gennemsnit Variabilitet mellem grupper

    = 2, =1 = 1

    afspejler antallet af grupper, m afspejler antal observationer pr. celle Gruppegennemsnit

    = =1=1 Blokgennemsnit

    = =1=1 Cellegennemsnit

    = =1 Totalt gennemsnit

    = =1=1=1

    Variabilitet mellem blokke

    = 2, =1 = 1

    afspejler antallet af grupper, m afspejler antal observationer pr. celle Interaktionseffekt

    = + =1

    =1 , = ( 1)( 1) og afspejler antallet af blokke og grupper, m afspejler antal observationer pr. celle Fejl

    = 2

    Total variabilitet

    = 2

    = + + +

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyse

    2013/14 Aspiri A/S 79 Statistik

    To-sidet variansanalyse Analysen To-sidet variansanalyse er bygget op omkring nedenstende ANOVA-tabel: Hypoteser

    Variation f.g. Sums of Squares Mean Squares F-Statistic Mellem grupper K-1 SSG MSG=SSG/(K-1) F=MSG/MSE

    Mellem blokke H-1 SSB MSB=SSB/(H-1) F=MSB/MSE

    Interaktion (K-1)(H-1) SSI MSI=SSI/(K-1)(H-1) F=MSI/MSE Fejl KH(m-1) SSE MSE=SSE/KH(m-1)

    Total SST

    = + + + 0 : = 0 0 : = 0 0: = 0

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyse

    2013/14 Aspiri A/S 80 Statistik

    To-sidet variansanalyse Forudstninger Test-statistikker Kritisk grnser og p-vrdier

    x Normalitet x Varianshomogenitet x Uafhngighed =

    = /( 1)/( 1) ~ 1;(1)

    =

    = /( 1)/( 1) ~ 1;(1)

    =

    = /( 1)( 1)/( 1) ~ (1)(1);(1)

    = 1;(1); , = 1;(1); , = (1)(1);(1); = (1;(1) > ), = (1;(1) > ), = ((1)(1);(1) > )

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Variansanalyse

    2013/14 Aspiri A/S 81

    1. Opstil en model til beskrivelse af data og prcisr modellens forudstninger. 2. Test om man kan antage varianshomogenitet. 3. Er der signifikant forskel p alkoholindholdet i blodet for de 3 forskellige persongrupper? 4. Er der signifikant forskel p alkoholindholdet i blodet for de personer der drak fastende, og de personer der drak i forbindelse med en let frokost?

    Statistik

    Opgaveregning

    Opgave 21

    Opgave 22 1. Opstil en model til beskrivelse af observationerne, prcisr og kontrollr modellens forudstninger. 2. Test en hypotese om at salget er uafhngigt af placeringen. 3. Opstil et 95%-konfidensinterval for det forventede salg ved middel-placering.

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Statistik 2013/14 Aspiri A/S 82

    Session 3 Kontingenstabeller og Liner Regression

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    83

    Oversigt

    Statistik 2013/14 Aspiri A/S 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Ikke-parametrisk test

    2013/14 Aspiri A/S 84 Statistik

    Hvad nu hvis 1.Vores antagelser om normalitet ikke kan antages opfyldt for vores kontinuerte variabel(le) 2.Vi arbejder med en kvalitativ, nominal, ordinal, kategoriserende datavariabel med 2+ mulige udfald (kategorier) 3. Vi kender eller kan antage at kende fordelingen under nulhypotesen 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Ikke-parametrisk test

    2013/14 Aspiri A/S 85 Statistik

    Goodness-of-fit test og kontingenstabeller Anvendelse Anvendes nr vi arbejder med kvalitativ (nominal, ordinal, kategorisk) variabel, nr forudstningerne for normalitet ikke er opfyldt for kvantitative datavariable, eller nr vi ikke kender fordelingen af vores datavariabel Eftersom vi implicit antager, at vores datavariabel ikke stammer fra en bestemt fordeling, kan vi ikke anvende parametre som og , da disse hrer til en bestemt fordeling. I stedet kategoriserer vi vores data efter K kategorier. Vi kan herved: n-faktor analyse

    (1) Teste for givne vrdier for kategorisandsynligheder under nulhypotesen - dvs. vi kender kategorisandsynlighederne de postulerede under nulhypotesen (2) Teste om data passer p en given fordeling (Normal, Poisson osv.) - dvs. vi kender ikke kategorisandsynlighederne under nulhypotesen, hvorfor disse skal estimeres og holdes op mod forventningen under den postulerede fordeling

    To-faktor analyse (3) Teste om to faktorer er uafhngige af hinanden - dvs. at der ikke er sammenhng mellem den mde, hvorp de to faktorer

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Ikke-parametrisk test

    2013/14 Aspiri A/S 86 Statistik

    (1) n-faktor analyse med kendte kategorisandsynligheder Notationer Observationer kategoriseres i K kategorier bestemt af n enkelt faktor Oi,,OK angiver antallet af observationer i hver af de K kategorier, hvor Oi =n Pi angiver sandsynligheden for, at en given observation ligger i kategorier i, hvor Pi =1 Ei = nPi angiver det forventede antal observationer i kategori i Hypotese Forudstning Forventede vrdi i hver kategori omtrent strre end 5, dvs. Ei = nPi > 5 for alle i Test-statistik Kritisk grnse og p-vrdi

    H0: P1, , PK er korrekt specificeret for vores data (eks. H0: P1 = P2 = P3 = P4 = 0.25) H1: P1, , PK er ikke korrekt specificeret for vores data

    2 = ( )2

    =1 ~12 Kritisk grnse = K1;2 p = P(K12 > 2 H0)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Ikke-parametrisk test

    2013/14 Aspiri A/S 87 Statistik

    (2) n-faktor analyse med ukendte kategorisandsynligheder Notationer

    Hypotese Forudstning Test-statistik Kritisk grnse og p-vrdi

    H0: Den postulerede fordeling er korrekt specificeret for data H1: Den postulerede fordeling er ikke korrekt specificeret for data

    Oi, , OK angiver antallet af observationer i hver af de K kategorier, hvor Oi = n Pi angiver den estimerede sandsynlighed for, at en observation ligger i kategori i, hvor Pi=1. Disse sandsynligheder estimeres p baggrund af formlen for punktsandsynlighed i den postulerede fordeling (f.eks. i Poissonfordelingen) Ei = nPi angiver det forventede antal observationer i kategori

    Kritisk grnse = Km1;2 p = P(Km12 > 2 H0) 2 = ( )2

    =1 ~12 , angiver antal parametre i den postulerede fordeling Forventede vrdi i hver kategori omtrent strre end 5, dvs. Ei = nPi > 5 for alle i

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Ikke-parametrisk test

    2013/14 Aspiri A/S 88 Statistik

    (3) To-faktor analyse med kendte kategorisandsynligheder Notationer Kontingenstabeller med faktor A (rkker) og faktor B (kolonner). Kategorier angives af kombinationerne. Der er alts tale om krydskategorier A x B Faktor A har i = 1,,r kategorier, mens faktor B har j = 1,,c kategorier Oij angiver antallet af observationer i hver krydskategori ij, hvor Oij =n Det forventede antal observationer i celle (i,j) under nulhypotesen der angiver uafhngighed mellem de 2 faktorer (se hypoteser p nste slide) er givet ved: rxc-kontingenstabel

    Faktor A/B 1 2 . Total 1 11 12 . 1 1 2 21 22 . 2 2 . . . . . . 1 2 . Total 1 2 . n

    Eij = RiCjn , hvor Ri angiver rkkesummer (i = 1, r), Cj angiver kolonnesummer ( j = 1, , c

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Ikke-parametrisk test

    2013/14 Aspiri A/S 89 Statistik

    (3) To-faktor analyse med kendte kategorisandsynligheder Hypotese Forudstning Approksimation til chi-square er rimelig, hvis min. 80% af forventede vrdier overstiger 5:

    Test-statistik Testet er baseret p en sammenligning af det faktisk observerede i hver celle og det vi ville forvente under forudstning af afhngighed mellem de 2 faktorer Kritisk grnse og p-vrdi

    H0: Uafhngighed mellem de to faktorer H1: Ikke uafhngighed mellem de to faktorer Eij = mindst 80% af RiCjn > 5, for i = 1, r og j = 1, , c

    2 = 2

    =1

    =1 ~(1)(1)2 Kritisk grnse = (r1)(c1);2 p = P(r1)(c1)2 > 2 H0)

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    Ikke-parametrisk test

    2013/14 Aspiri A/S 90

    1. Kan man p baggrund af undersgelsen afvise en pstand om, at forskelligheden i aldersfordelingen p tvrs af landsdele kan skyldes tilfldigheder? 2. Nu er vi kun interesseret i aldersfordelingen. Kan man med afst i nedenstende tabel konkludere, at der er ns sandsynlighed for at ligge i hvad af de 3 kategorier?

    Statistik

    Opgaveregning

    Opgave 20

    2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.Dette forbud glder bde tekst og illustrationer. Dette dokument har kun Anshul Sharma ([email protected]) ret til at bruge.

  • 31477791

    91

    Oversigt

    Statistik 2013/14 Aspiri A/S 2013 - Enhver form for mangfoldiggrelse af hele eller dele af indholdet i dette materiale er, i henhold til dansk lov om ophavsret, ikke tilladt uden tilladelse fra Aspiri A/S.

    Dette forbud glder bde tekst og illustrationer. Dette dokum