19
Antal tryksager Antal familier Frekvens Kum. Frekvens 8 24 1 2% 12% 9 30 15% 27% 10 42 21% 48% 11 40 20% 68% 12 36 18% 86% 13 28 14% 100% 200 100% Middelværdien beregnes ved: 8*12%+9*15%+10*21%+11*20%+12*18%+13*14%= 10.59 Familierne får altså i gennemsnit 10,59 reklamer Spredning: Hvor spredt ligger observationerne i forhold til middelværdien? Vi udregner kvadraterne på forskellen mellem middelværdi og obser (8-10.59)^2, (9-10,59)^2,..... Ugrupperede observationer Middelværdi, varians og spredning

Ugrupperede observationer Middelværdi, varians og spredning

Embed Size (px)

DESCRIPTION

Ugrupperede observationer Middelværdi, varians og spredning. Varians. Nu er der jo ikke lige mange observationer i hvert interval, derfor må vi vægte disse forskelle: 12%*(8-10,59) 2 +15%*(9-10,59) 2 +21%*(10-10.59) 2 +20%*(11-10,59) 2 +18%*(12-10,59) 2 +14%*(13-10,59) 2 =2,46 - PowerPoint PPT Presentation

Citation preview

Page 1: Ugrupperede observationer Middelværdi, varians og spredning

Ugrupperede observationerSpredning og varians

Antal tryksager Antal familier Frekvens Kum. Frekvens8 24 12% 12%9 30 15% 27%10 42 21% 48%11 40 20% 68%12 36 18% 86%13 28 14% 100%

200 100%

Middelværdien beregnes ved:8*12%+9*15%+10*21%+11*20%+12*18%+13*14%= 10.59

Familierne får altså i gennemsnit 10,59 reklamer

Spredning:Hvor spredt ligger observationerne i forhold til middelværdien?Vi udregner kvadraterne på forskellen mellem middelværdi og observationer:(8-10.59)^2, (9-10,59)^2,.....Nu er der jo ikke lige mange i hvert interval, så vi må

Ugrupperede observationer

Middelværdi, varians og spredning

Page 2: Ugrupperede observationer Middelværdi, varians og spredning

Nu er der jo ikke lige mange observationer i hvert interval, derfor må vi vægte disse forskelle:

12%*(8-10,59)2+15%*(9-10,59)2+21%*(10-10.59)2+20%*(11-10,59)2+18%*(12-10,59)2+14%*(13-10,59)2=2,46

Dette tal kaldes observationssættets varians: Var(X)=2,46

Hvad fortæller Var(X) ?

Hvorfor tager vi kvadratet på forskellen mellem middelværdi og observation?

Varians

Page 3: Ugrupperede observationer Middelværdi, varians og spredning

Spredning

Vi tager nu kvadratroden af variansen:

( ) 2,46 1,57X

Og får spredningen, betegnet med det græske bogstav sigma

Spredningen kaldes også standardafvigelsen

Page 4: Ugrupperede observationer Middelværdi, varians og spredning

Forskellige observationssæt5 3 1,50% 1,50%

6 4 2,00% 3,50%

7 7 3,50% 7,00%

8 10 5,00% 12,00%

9 30 15,00% 27,00%

10 42 21,00% 48,00%

11 40 20,00% 68,00%

12 36 18,00% 86,00%

13 20 10,00% 96,00%

14 6 3,00% 99,00%

15 2 1,00% 100,00%

  200 1  

Her har jeg lavet et mere spredt sæt, lad os se på forskelle i middelværdi, varians og spredning

Page 5: Ugrupperede observationer Middelværdi, varians og spredning

Først stolpediagrammer

Første observationssæt

0%

5%

10%

15%

20%

25%

8 9 10 11 12 13

antal tryksager

Fre

kven

s

Serie1

Andet observationssæt

0,00%

5,00%

10,00%

15,00%

20,00%

25,00%

5 6 7 8 9 10 11 12 13 14 15

antal tryksageran

tal

fam

ilie

r

Serie1

Middelværdi: 10,59 Middelværdi:10,52

Beregn varians og spredning for andet observationssæt!

Page 6: Ugrupperede observationer Middelværdi, varians og spredning

Varians og spredning5 3 1,50%

6 4 2,00%

7 7 3,50%

8 10 5,00%

9 30 15,00%

10 42 21,00%

11 40 20,00%

12 36 18,00%

13 20 10,00%

14 6 3,00%

15 2 1,00%

Var(X)=1,5%*(5-10,52)2+……..

(resultat 3,6396)

( ) 3,6396 1,91x

Sammenlignet med første observationssæt får vi altså en større varians og en større spredning som forventet!

Page 7: Ugrupperede observationer Middelværdi, varians og spredning

Udregning af varians3.Observation

ssæt x   f 

9 50 25%

10 100 50%

11 50 25%

Summen af frekvenserne er 100%=1

Middelværdien E(X)=μ=9*25%+10*50%+11*25%

Var(X)= 25% * (9-μ)2 + 50% *(10-μ)2 + 25% * (11-μ)2

Hvis vi ganger parenteserne ud fås:

25%*(92+μ2-2*9*μ) + 50%*(102+μ2-2*10*μ) + 25%*(112+μ2-2*11*μ) =

μ2 *(25%+50%+25%) -2μ*(9*25% + 10*50% + 11*25%)+ 25%*92+50%*102+25%*112

Altså er

Var(X)=μ2-2μ* μ +25%*92+50%*102+25%*112

Sidste 3 led (grønne) er middelværdien af X2 derved får vi:

Var(X)= - μ2 + E(X2) = E(X2) – E(X)2 og spredningen σ(X)= ( )Var X

Page 8: Ugrupperede observationer Middelværdi, varians og spredning

Varians og spredning

Var(X)= E(X2)-E(X)2

σ(X)= ( )Var X

Page 9: Ugrupperede observationer Middelværdi, varians og spredning

I regneark:

Antal (x) Frekvens (f) x*f x^2 x^2*f

8 0,12 0,96 64 7,68

9 0,15 1,35 81 12,15

10 0,21 2,1 100 21

11 0,2 2,2 121 24,2

12 0,18 2,16 144 25,92

13 0,14 1,82 169 23,66

E(X)=   10,59    

E(X)^2   112,1481    

E(X^2)=       114,61

         

Var(X)=E(X^2) - E(X)^2=   2,4619 σ(X)=  1,57

Page 10: Ugrupperede observationer Middelværdi, varians og spredning

Grupperede observationerHvis talmaterialet er grupperet:

obs.interval Int. Midtp m Frekvens f m*f m^2 m^2*f

]10;12] 11 0,1 1,1 121 12,1

]12;14] 13 0,175 2,275 169 29,575

]14;16] 15 0,375 5,625 225 84,375

]16;18] 17 0,2 3,4 289 57,8

]18;20] 19 0,15 2,85 361 54,15

μ=E(X)=     15,25    

E(X^2)=         238

           

Var(X)= E(X^2)-E(X)^2=   5,4375      

Page 11: Ugrupperede observationer Middelværdi, varians og spredning

Covarians

Hvis vi ønsker at sammenligne to observationssæt X og Y, kan vi bestemme deres Covarians ved:

Cov(X,Y)= E(X*Y)- E(X)*E(Y)

Altså som middelværdien af produktet af observationerne minus produktet af de to

middelværdier

Page 12: Ugrupperede observationer Middelværdi, varians og spredning

Model v.hj.a. regression i regneark

Page 13: Ugrupperede observationer Middelværdi, varians og spredning

Regression i regneark1. Marker de to observationssæt

2. Vælg ”Diagram”

3. Vælg XY-punkt

4. Tegn grafen

5. Højreklik på et af punkterne på grafen

6. Vælg ”Tilføj tendenslinje”

7. Klik på fanebladet ”Indstillinger”

Page 14: Ugrupperede observationer Middelværdi, varians og spredning

Sæt hak i Vis ligning i diagram og i Vis R kvadreret

Page 15: Ugrupperede observationer Middelværdi, varians og spredning

Bestemmelse af regressionslinje

Vi kan ud fra to observationssæt også bestemme regressionslinjen y=ax+b ved hjælp af formler:

Vi bestemmer a ved:

Og derefter bestemme linjens ligning ved:

Herved bestemmes b altså som E(Y)-a*E(X)

( , )

( )

Cov X Ya

Var X

( ) ( ( ))y E y a x E X

Page 16: Ugrupperede observationer Middelværdi, varians og spredning

Korrelationskoefficienten

Korrelationskoefficienten er et mål for hvor god sammenhæng der er mellem X og Y.

Denne bestemmes ved:

( , )( , )

( )* ( )

Cov X Yr X Y

S X S Y

Regnearket beregner R2, som skal ligge tæt på 1, her skal r ligge tæt på -1 eller 1, for at vi vil finde en god sammenhæng.

Page 17: Ugrupperede observationer Middelværdi, varians og spredning

Hvad kan regnearket beregne?

Page 18: Ugrupperede observationer Middelværdi, varians og spredning
Page 19: Ugrupperede observationer Middelværdi, varians og spredning