Kuvioita, taulukoita ja tunnuslukujamyy.haaga-helia.fi/~taaak/k/kuvailu2.pdf · Kuviossa...

Preview:

Citation preview

Aki Taanila 2.2.2011

Kuvioita, taulukoita ja tunnuslukuja

1

Pylväs

Piirakka

Viiva

Hajonta

Tilastokuviot

2

Kuviossa huomioitavia asioita 1

Kuviolla tulee olla tarkoitus ja tehtävä (minkä tiedon haluat välittää katsojalle?)

Kuviolla tulee olla kohderyhmä (kenelle kuvio on tarkoitettu?)

Kokeile eri vaihtoehtoja ja valitse tarkoitukseen ja kohderyhmälle parhaiten sopiva esitystapa

Kuvion tulee olla selkeä ja helposti ymmärrettävä

Johdata katsojan huomio esitettävään asiaan, eikä kuvion tehosteisiin

3

Kuviossa huomioitavia asioita 2

Esitä tiedot peittelemättä ja rehellisesti

Otsikoi akselit ja esitä käytetyt yksiköt selkeästi

Ilmoita tiedon lähde, jos tieto on peräisin ulkopuolisesta lähteestä

Lisää tarvittaessa kuvioon huomautuksia korostaaksesi epätavallisten tai poikkeavien arvojen syitä

Yhdistä kuvio luontevasti sitä edeltävään sanalliseen selitykseen, jossa kerrot mihin asioihin katsojan pitää kuviossa kiinnittää huomioita

4

5

Pylväskuvio

Pylväillä voidaan kuvata mm. lukumääriä, prosenttiosuuksia, rahamääriä ja keskiarvoja

Suosi vaakapylväitä, kun esität eri pylväissä kategorisen muuttujan eri luokkia

Suosi pystypylväitä, kun esität eri pylväissä määrällisen muuttujan eri luokkia

0

1

2

3

4

5

6

2001 2002 2003

milj

oo

naa

e

uro

a

Turku Tampere Helsinki

6

Pylväskuvion rakenne

7

Lukumääriä pylväskuviona

Työntekijöiden koulutus (n=81)

27

30

22

2

0 10 20 30 40

Peruskoulu

Toinen aste

Korkeakoulu

Ylempi korkeakoulu

Henkilöä

8

Keskiarvoja pylväskuviona

2,11

3,06

3,20

3,22

4,06

1,00 1,50 2,00 2,50 3,00 3,50 4,00 4,50 5,00

Palkkaan

Johtoon

Työtehtäviin

Työympäristöön

Työtovereihin

Keskiarvo (1=Erittäin tyytymätön, 5=Erittäin tyytyväinen)

Tyytyväisyys työn eri osa-alueisiin (n=81-82)

Histogrammi (ryhmitelty määrällinen muuttuja)

9

0

5

10

15

20

25

30

0-1600 1601-2100 2101-2600 2601-3100 3101-3600 3601-

Työ

nte

kijö

itä

Palkka euroa

Työntekijöiden palkkajakauma (n=82)

10

100 % pinottu pylväskuvio

0 % 20 % 40 % 60 % 80 % 100 %

Työtovereihin

Työympäristöön

Työtehtäviin

Johtoon

Palkkaan

Prosenttia vastaajista

Erittäin tyytymätön Tyytymätön Neutraali Tyytyväinen Erittäin tyytyväinen

Tyytyväisyys työn eri osa-alueisiin (n= 81-82)

11

Viivakuvio

Viivakuvio sopii aikasarjan esittämiseen

Aikasarjoja esitettäessä viivakuvion vaaka-akselilla on aika

Arvoakseli voidaan aloittaa muualtakin kuin nollakohdasta, jos halutaan kuvata vaihtelua itsessään

Arvoakselia ei saa katkaista, jos halutaan tarkastella vaihtelun osuutta kokonaismäärästä

12

Viivakuvion rakenne

0

1

2

3

4

5

6

2001 2002 2003

Vuosi

Miljo

on

aa

eu

roa

Turku Tampere Helsinki

13

Viivakuvio (kaksi arvoakselia)

Kotimaanliikenteen henkilökilometrit henkilöautolla ja joukkoliikenteessä vuosina 1980-2009 (Lähde: Tilastokeskus)

12

12,5

13

13,5

14

30

35

40

45

50

55

60

65

70

1980 1985 1990 1995 2000 2005

jou

kko

liike

nn

e m

rd k

m

he

nki

löau

to m

rd k

m

Vuosi

Henkilöauto

Joukkoliikenne

14

Hajontakuvio

20,0

25,0

30,0

35,0

40,0

45,050,0

55,0

60,0

65,0

70,0

60,0 70,0 80,0 90,0 100,0 110,0 120,0 130,0

Markkinointikustannukset (10 000 euroa)

Lii

ke

va

ihto

(m

ilj.

eu

roa

)

Hajontakuvio on havainnollinen väline kahden määrällisen muuttujan välisen riippuvuuden tarkasteluun

15

Piirakkakuvio

Kuvaa kokonaisuuden jakaantumista osiin; muuhun tarkoitukseen piirakkaa ei tule käyttää

Kaikkien kokonaisuuden osien oltava mukana

Piirakka ei ole suositeltavaa, jos siivuja on enemmän kuin 6

16

Piirakkakuvio esim.

Turku 7 %

Tampere 19 %

Helsinki 74 %

Myynnin suhteellinen osuus eri toimipisteissä

Taulukointi

Yhteenvetotaulukko

Luokittelu

Ristiintaulukointi

17

18

Yhteenvetotaulukko

Koulutus Lukumäärä % Summa % Peruskoulu 27 33,3 33,3 Toinen aste 30 37,0 70,4 Korkeakoulu 22 27,2 97,5 Ylempi korkeakoulu 2 2,5 100,0 Yhteensä 81 100,0

19

Ryhmittely

Yleensä määrälliset muuttujat täytyy ryhmitellä ennen taulukointia

Tällaisia muuttujia ovat esim. palkka, liikevaihto, polttoaineen kulutus, henkilön paino,...

20

Ryhmiteltävä aineisto

Ohessa otos desibeli- mittauksia asuntoalueella sijaitsevassa risteyksessä

Jos havainnot halutaan taulukoida, niin tarvitaan ryhmittelyä

52,0 64,7 60,3 55,9 56,2

56,4 68,2 62,1 58,9 59,4

59,8 54,5 64,9 60,6 61,0

61,7 56,8 69,4 62,7 63,6

64,0 60,2 55,8 66,2 67,0

67,9 62,0 57,6 55,9 56,4

54,4 64,8 60,5 59,4 59,5

56,7 68,9 62,6 60,8 61,4

60,0 55,7 65,7 63,1 63,8

61,8 57,2 77,1 66,8 67,1

21

Ryhmittelyn suorittaminen

Etsi pienin ja suurin (52,0 ja 77,1)

Päätä ryhmien lukumäärä (6)

Laske ryhmäväli siten, että ryhmät peittävät hieman enemmän kuin pienimmän ja suurimman välisen matkan (5)

Valitse ensimmäisen ryhmän alaraja (50)

22

Ryhmitelty yhteenvetotaulukko

Desibeliä Lukumäärä % Summa %

50,0-54,9 3 6 6

55,0-59,9 16 32 38

60,0-64,9 21 42 80

65,0-69,9 9 18 98

70,0-74,9 0 0 98

75,0-79,9 1 2 100

50 100

23

Huomioita ryhmittelystä

Esitä ryhmien rajat havaintojen tarkkuudella

Esitä ryhmien rajat siten, ettei ole epäselvää mihin ryhmäänn mikin arvo kuuluu

Tasaväliset ryhmät, jos mahdollista (esim. palkkoja ei useinkaan voi ryhmitellä tasavälisesti)

Vältä avoimia ryhmiä (iän kohdalla joudutaan käyttämään usein avointa ryhmää esim. 65+)

Enemmän ryhmiä → Tarkempaa tietoa

Vähemmän ryhmiä → Helppolukuisempi taulukko

24

Ristiintaulukointi

Soveltuu riippuvuuksien tarkasteluun ja ryhmien vertailuun

Ryhmäkohtaisia lukumääriä ja/tai prosentteja

Prosenttien vertailu helpompaa kuin lukumäärien vertailu

Sukupuoli

Tyytyväisyys johtoon Mies n=63 Nainen n=19 Yhteensä n=82

Tyytymätön 34,9 % 5,3 % 28,0 %

Neutraali 36,5 % 36,8 % 36,6 %

Tyytyväinen 28,6 % 57,9 % 35,4 %

Yhteensä 100,0 % 100,0 % 100,0 %

Tunnuslukuja

Moodi Keskiarvo ja keskihajonta Mediaani Neljännekset ja muut prosenttipisteet Geometrinen keskiarvo Korrelaatiokerroin

25

26

Miksi tunnuslukuja lasketaan?

Tunnuslukuja lasketaan, jotta muodostuisi todellista vastaava mielikuva tarkasteltavasta asiasta.

x

Reaalimaailma

27

... pääjohtajan mielestä keskipalkka

on yli 5900 € (keskiarvo)

... ulkopuolisen mielestä keskipalkka

on 2500 € (mediaani)

... työntekijöiden mielestä

keskipalkka on 1500 € (moodi)

Keskipalkka?

35000

5500

4500

2500

1500

28

Muuttujan mitta-asteikko ja tunnusluvut

Kategorisille muuttujille moodi

Asteikolla mitatuille muuttujille keskiarvo, keskihajonta (vähintään 5-portainen asteikko, joka voidaan olettaa tasaväliseksi)

Asteikolla mitatuille sopii joissain tapauksissa moodi

Määrällisille muuttujille keskiarvo ja keskihajonta

Määrällisille muuttujille viiden luvun yhteenveto: pienin, alaneljännes, mediaani, yläneljännes, suurin

Määrällisille muuttujille voidaan lisäksi laskea muita prosenttipisteitä

29

Moodi

Moodi eli tyyppiarvo on useimmin esiintyvä havaintoarvo

Sopii kategorisille muuttujille

Esim. Lehden tyypillinen lukija on akateemisesti koulutettu 35-45-vuotias mies

30

Keskiarvo

Keskiarvo: havaintojen summa jaettuna havaintojen lukumäärällä

Keskiarvon kohdalta keinulauta saadaan tasapainoon

Keskiarvo on herkkä erityisen suurille ja pienille arvoille

Keskiarvon yhteydessä käytetään keskihajontaa vaihtelun mittaamiseen

31

Keskihajonta

Keskiarvon yhteydessä vaihtelun mittarina käytetään keskihajontaa

Keskihajonta on havaintojen keskimääräinen poikkeama keskiarvosta

32

Keskihajonnan laskeminen

Lasketaan yksittäisen havainnon poikkeama keskiarvosta ja korotetaan poikkeama toiseen potenssiin

Lasketaan kaikkiin havaintoihin liittyvien poikkeamien toisten potenssien summa

Jaetaan otoskoolla, jolloin saadaan poikkeamien toisten potenssien keskiarvo (kutsutaan varianssiksi). Kumotaan lopuksi toinen potenssi neliöjuurella

2)( xxi

2)( xxi

n

xxi 2)(

33

Perusjoukon keskihajonta

Kun arvioidaan otoksen avulla perusjoukon keskihajontaa, tehdään vielä tekninen korjaus korvaamalla luku n luvulla n-1

Voidaan osoittaa, että näin saadaan parempi arvio

34

Volatiliteetti

Keskihajontaa käytetään yleisesti arvopaperin

kokonaisriskin mittarina

Tässä yhteydessä keskihajontaa kutsutaan

volatiliteetiksi

Prosentuaalisista päivätuotoista laskettu volatiliteetti muunnetaan vuositasolle kertomalla se kaupantekopäivien (250) neliöjuurella

Volatiliteetteja

Osake Volatiliteetti 12 kk (21.11.2007)

SanomaWSOY 20 %

UPM-Kymmene 24 %

Nokia 28 %

Tietoenator 36 %

Perlos 45 %

Biotie Therapies 77 %

35

36

Jos havainnot laitetaan suuruusjärjestykseen, niin mediaani on keskimmäinen havainto tai kahden keskimmäisen keskiarvo

Puolet havainnoista mediaania pienempiä, puolet mediaania suurempia

Mediaani ei ole herkkä erityisen suurille tai pienille arvoille

Mediaani

mediaani

37

Neljännekset eli kvartiilit

Jos havainnot laitetaan järjestykseen, niin alaneljänneksen (alakvartiili) alapuolelle jää 25% ja yläneljänneksen (yläkvartiili) alapuolelle jää 75% havainnoista

alaneljännes

50%

25% 25%

yläneljännes

38

Prosenttipisteet eli Fraktiilit

alaneljännes on 25% prosenttipiste

Mediaani on 50% prosenttipiste

yläneljännes on 75% prosenttipiste

Vastaavalla tavalla voidaan muodostaa muitakin prosenttipisteitä (esim. 5%, 95%)

Prosenttipisteet sopivat havainnollisuutensa vuoksi hyvin jakauman kuvailuun (esim. asuntojen neliömetrihinnat, työntekijäryhmän palkat, osakkeen päivätuotot jne.)

39

Prosenttipisteitä

Kerrostaloyksiöiden neliöhintojen (euroa) prosenttipisteitä vuonna 2007

Prosenttipiste Helsinki (N=250)

Tampere (N=250)

Pienin 2136 1176

10% 2655 1552

25% 3108 1804

Mediaani 3785 2255

75% 4544 2684

90% 5137 3000

Suurin 7515 4763

40

Geometrinen keskiarvo

Peräkkäisiä muutoksia kuvaaville prosenttiluvuille käytetään geometrista keskiarvoa

Geometrinen keskiarvo kuvaa keskimääräistä muutosvauhtia

Geometrinen keskiarvo on n:s juuri muutoskertoimien tulosta

41

Geometrinen keskiarvo esim.

Jos peräkkäiset hinnan muutokset ovat 1,5%; 2,3%; -1,2% ja 10,0%, niin muutoskertoimet ovat 1,015; 1,023; 0,988 ja 1,100

Geometrinen keskiarvo:

Tämä keskiarvo kuvailee keskimääräistä hinnan muutosta

Neljä peräkkäistä 3,07% suuruista hinnan muutosta johtaa samaan lopputulokseen kuin alkuperäiset hinnanmuutokset

0307,1100,1988,0023,1015,14

42

Pearsonin korrelaatiokerroin

Pearsonin korrelaatiokerroin mittaa lineaarista eli suoraviivaista riippuvuutta.

43

Korrelaatiokertoimen arvot

-1.0 +1.0 0 -.5 +.5

Täydellinen negatiivinen korrelaatio Ei korrelaatiota

Täydellinen positiivinen korrelaatio

Pearsonin korrelaatiokertoimia

44

45

Korrelaatiokertoimen arvon karkea tulkinta

|r| < 0,3 muuttujien välillä ei ole juurikaan lineaarista riippuvuutta

0,3 < |r| < 0,7 muuttujien välillä on jonkin verran lineaarista riippuvuutta

|r| > 0,7 muuttujien välillä on selvä lineaarinen riippuvuus.

46

Muita tunnuslukuja

vaihteluväli (väli suurimmasta pienimpään)

varianssi (keskihajonnan toinen potenssi)

variaatiokerroin (keskihajonta/keskiarvo) mittaa suhteellista vaihtelua; variaatiokertoimen avulla voidaan vertailla eri asteikoilla mitattujen muuttujien vaihtelua

Tiekartta

47

Tarkoitus

Muuttujan mitta-asteikko

Kategorinen Määrällinen

Yhteenveto muuttujan

arvoista

Yhteenvetotaulukko

Pylväskuvio

Piirakkakuvio

Moodi

Ryhmitelty yhteenvetotaulukko

Histogrammi

Keskiarvo*, keskihajonta*

5 luvun yhteenveto

Ryhmien vertailu Ristiintaulukointi Keskiarvojen ja keskihajontojen

vertailu*

Muiden tunnuslukujen vertailu

Kahden muuttujan

välinen riippuvuus

Ristiintaulukointi

Pylväskuvio

100 % pinotut pylväät

Hajontakuvio

Aikasarjakuvio

Korrelaatiokerroin*

Mielipideasteikoille sopii kategoristen muuttujien menetelmät. Jos mielipideasteikko on vähintään 5-portainen ja voidaan olettaa tasaväliseksi, niin tähdellä* merkityt määrällisten muuttujien menetelmät ovat harkinnanarvoisia.

Recommended