18
NJIG ATI BORIS KOžUH KNJIGA O STATISTIKI Oddelek za pedagogiko in andragogiko Ljubljana 2013

Knjiga o statistiki

Embed Size (px)

DESCRIPTION

Univerzitetni učbenik Knjiga o statistiki je namenjen študentom pedagogike in študentom pedagoških smeri študija, s pridom pa jo bodo lahko uporabljali tudi študentje drugih sorodnih družbenih ved. Avtor v knjigi predstavlja in obravnava osnovne statistične metode, ki se uporabljajo pri raziskovanju vzgojnih pojavov. Pri vsaki najprej pojasni teoretične osnove, nato pa uporabo te metode v pedagoškem raziskovanju. Učbenik je napisan v preprostem jeziku. Opremljen je s številnimi primeri uporabe in izvedbami opisanih statističnih metod. Predstavljeni so načini in pogoji praktične uporabe metod ter možni zapleti pri obdelavi podatkov. Zaradi izbora metod in načina njihovega obravnavanja je knjiga lahko elementarni učbenik za študente na prvi stopnji študija, nadaljevalni učbenik za študente na drugi stopnji, ali pa uvodni priročnik za študente na doktorskem študiju. Knjiga o statistiki je lahko uporabna tudi kot praktični priročnik za raziskovalno delo na pedagoškem področju.

Citation preview

Page 1: Knjiga o statistiki

KNJIGASTATIBoris Kožuh

KNJiGA o sTATisTiKiOddelek za pedagogiko in andragogikoLjubljana 2013

Bori

s Ko

žuh:

KNJ

iGA

o sT

ATis

TiKi

9 789612 375997

ISBN 978-961-237-599-7

Univerzitetni učbenik Knjiga o statistiki je namenjen študen-tom pedagogike in študentom pedagoških smeri študija, s pridom pa jo bodo lahko upora-bljali tudi študentje drugih so-rodnih družbenih ved. Avtor v knjigi predstavlja in obravnava osnovne statistične metode, ki se uporabljajo pri raziskovanju vzgojnih pojavov. Pri vsaki naj-prej pojasni teoretične osnove, nato pa uporabo te metode v pedagoškem raziskovanju.

Učbenik je napisan v pre-prostem jeziku. Opremljen je s številnimi primeri uporabe in izvedbami opisanih statističnih metod. Predstavljeni so načini in pogoji praktične uporabe metod ter možni zapleti pri obdelavi podatkov. Zaradi izbo-ra metod in načina njihovega obravnavanja je knjiga lahko elementarni učbenik za štu-dente na prvi stopnji študija, nadaljevalni učbenik za štu-dente na drugi stopnji, ali pa uvodni priročnik za študente na doktorskem študiju. Knjiga o statistiki je lahko uporabna tudi kot praktični priročnik za raziskovalno delo na pedago-škem področju.

tujih. Sodeluje s profesorji na številnih univerzah po svetu (UCLA v Los Angelesu, South Bank University v Londonu, Karlova univerza v Pragi, Anti-och University v Los Angelesu, University of North Dakota, več univerz na Poljskem ter v nekdanjih jugoslovanskih re-publikah itd.). V domačih in mednarodnih revijah objavlja študije s področja pedagoške metodologije. Objavil je 12 knjig v Sloveniji in več kot 25 v tujini, kot urednik pa je so-deloval pri številnih zbornikih, izdanih na različnih univerzah po svetu. Deset let vodi medna-rodno združenje ICIA, kjer v so-delovanju z univerzami iz ZDA, Kanade, Anglije, Argentine, Av-stralije in številnimi univerzami iz Evrope organizira mednaro-dne znanstvene on-line konfe-rence.

Boris Kožuh je rojen leta 1945 v Italiji. Leta 1973 je diplomi-ral na Oddelku za pedagogiko Filozofske fakultete v Ljubljani. Po študiju se je zaposlil kot asi-stent za pedagoško statistiko pri profesorju dr. Janezu Sagadinu. Doktoriral je leta 1986, ob kon-cu devetdesetih let pa je bil tudi gostujoči profesor na Univerzi v Opolu na Poljskem. Leta 2000 je bil izvoljen za rednega profe-sorja za pedagoško metodologi-jo, leta 2008 pa je dobil naziv zaslužni profesor Univerze v Ljubljani.

Aktivno obvlada ruščino, češčino, poljščino in hrvaščino ter pasivno vse ostale slovanske jezike. Deset let je bil glavni in odgovorni urednik osrednje slovenske pedagoške znanstve-ne revije Sodobna pedagogika. Predaval je na vseh treh sloven-skih univerzah in na številnih

Page 2: Knjiga o statistiki
Page 3: Knjiga o statistiki

Boris Kožuh

Ljubljana 2013

KNJIGA O STATISTIKI

Page 4: Knjiga o statistiki

KNJIGA O STATISTIKI

Avtor: Boris Kožuh

Recenzenta: Jasna Mažgon, Mara Cotič

Lektor: Rok Janežič

Tehnično urejanje in prelom: Jure Preglau

© Univerza v Ljubljani, Filozofska fakulteta, 2013.

Vse pravice pridržane.

Založila: Znanstvena založba Filozofske fakultete Univerze v Ljubljani

Izdal: Oddelek za pedagogiko

Za založbo: Andrej Černe, dekan Filozofske fakultete

Vodja Uredništva visokošolskih in drugih učbenikov: Jaka Repič

Oblikovna zasnova: Jana Kuhar

Naslovnica: VBG d. o. o.

Tisk: Birografika Bori, d. o. o.

Ljubljana, 2013

Prva izdaja

Naklada: 400 izvodov

Cena: 23,90 EUR

CIP - Kataložni zapis o publikacijiNarodna in univerzitetna knjižnica, Ljubljana

311.1(075.8)

KOŽUH, Boris Knjiga o statistiki / Boris Kožuh. - 1. izd. - Ljubljana : Znanstvena založba Filozofske fakultete, 2013

ISBN 978-961-237-599-7

268607232

Page 5: Knjiga o statistiki

3Kazalo

Kazalo

1 Osnovni pojmi .................................................................................................................................. 9

1.1 Proučevanje množičnih pojavov ......................................................................................... 9

1.2 Statistična množica in enote ................................................................................................. 9

1.3 Spremenljivke ..........................................................................................................................11

1.3.1 Številske in opisne spremenljivke..........................................................................12

1.3.2 Merske lestvice .............................................................................................................13

1.3.3 Uporaba statističnih metod .....................................................................................17

1.3.4 Zvezne in nezvezne spremenljivke .......................................................................17

1.3.5 Neodvisne in odvisne spremenljivke ...................................................................18

1.4 Statistični parametri ...............................................................................................................19

2 Urejevanje podatkov .................................................................................................................21

2.1 Urejevanje podatkov za številske spremenljivke .........................................................21

2.1.1 Ranžirna vrsta ...............................................................................................................21

2.1.2 Frekvenčna porazdelitev ..........................................................................................23

2.2 Urejevanje podatkov za opisne spremenljivke ...........................................................25

2.3 Priprava podatkov za računalniško obdelavo ...............................................................30

2.3.1 Zbiranje podatkov .......................................................................................................30

2.3.2 Seznam spremenljivk .................................................................................................32

2.3.3 Zapisovanje vrednosti ..............................................................................................32

3 Rangi ....................................................................................................................................................38

3.1 Absolutni rangi.........................................................................................................................38

3.2 Relativni rangi ...........................................................................................................................39

3.3 Značilni kvantilni rangi in kvantili .....................................................................................40

3.3.1 Delitev na pol ................................................................................................................40

3.3.2 Delitev na četrtine .......................................................................................................40

3.3.3 Delitev na desetine .....................................................................................................41

3.3.4 Delitev na stotine ........................................................................................................41

Page 6: Knjiga o statistiki

4 Knjiga o statistiki

4 Srednje vrednosti .........................................................................................................................43

4.1 Primerjanje množic .................................................................................................................43

4.2 Srednje vrednosti ....................................................................................................................44

4.3 Izračunavanje aritmetične sredine ....................................................................................46

4.3.1 Računanje iz individualnih podatkov ...................................................................46

4.3.2 Računanje iz frekvenčne porazdelitve .................................................................46

4.4 Tehtana aritmetična sredina ................................................................................................48

4.5 Tehtan strukturni odstotek ..................................................................................................50

5 Razpršenost .....................................................................................................................................51

5.1 Pojem razpršenosti .................................................................................................................51

5.2 Viri razpršenosti .......................................................................................................................52

5.3 Merjenje razpršenosti ............................................................................................................53

5.3.1 Razpršenost podatkov za nominalne spremenljivke .....................................53

5.3.2 Razpršenost podatkov za ordinalne spremenljivke ........................................54

5.3.3 Razpršenost podatkov za intervalne spremenljivke .......................................55

5.4 Mere razpršenosti ...................................................................................................................55

5.4.1 Variacijski razmik ..........................................................................................................56

5.4.2 Decilni razmik ..............................................................................................................57

5.4.3 Kvartilni razmik .............................................................................................................57

5.4.4 Kvartilni odklon ............................................................................................................58

5.4.5 Povprečni absolutni odklon .....................................................................................59

5.4.6 Varianca in standardni odklon ................................................................................60

5.5 Izračunavanje variance .........................................................................................................62

5.5.1 Računanje iz individualnih podatkov ...................................................................62

5.5.2 Računanje iz frekvenčne porazdelitve .................................................................64

5.6 Relativna mera razpršenosti ................................................................................................65

5.7 Relativni odklon ......................................................................................................................67

5.8 Analiza razpršenosti ...............................................................................................................69

5.8.1 Kako izračunamo pojasnjeno in nepojasnjeno varianco ..............................75

Page 7: Knjiga o statistiki

5Kazalo

6 Normalna porazdelitev .............................................................................................................77

6.1 Pojem in značilnosti ...............................................................................................................77

6.2 Uporaba zakonitosti normalne porazdelitve ................................................................79

6.2.1 Odstotek enot pod izbrano vrednostjo spremenljivke ..................................80

6.2.2 Odstotek enot nad izbrano vrednostjo spremenljivke ..................................80

6.2.3 Odstotek vrednosti v izbranem razmiku .............................................................81

6.2.4 Vrednost, pod katero je določeni odstotek enot .............................................83

6.2.5 Meji, med katerima je dani odstotek enot .........................................................85

6.2.6 Upoštevanje narave zveznih spremenljivk.........................................................86

7 Povezanost med pojavi ............................................................................................................87

7.1 Pojem korelacije ......................................................................................................................87

7.1.1 Korelacijski grafikon ...................................................................................................89

7.1.2 Pozitivna in negativna korelacija ...........................................................................91

7.1.3 Linearna in nelinearna korelacija ...........................................................................92

7.1.4 Korelacija in vzročno-posledične zveze ..............................................................94

7.2 Indeks korelacije ......................................................................................................................96

7.3 Korelacijski koeficienti ...........................................................................................................97

7.3.1 Pearsonov korelacijski koeficient ...........................................................................98

7.3.2 Korelacija ranga ......................................................................................................... 102

7.3.3 Biserialni korelacijski koeficient........................................................................... 105

7.3.4 Točkovni biserialni korelacijski koeficient ........................................................ 109

7.3.5 Tetrakorični korelacijski koeficient ..................................................................... 111

7.3.6 Korelacijsko razmerje .............................................................................................. 112

7.4 Regresija .................................................................................................................................. 116

7.5 Parcialna korelacija .............................................................................................................. 117

7.5.1 Izločanje vpliva ene spremenljivke .................................................................... 119

7.5.2 Izločanje vpliva več spremenljivk ....................................................................... 120

8 Raziskovanje na vzorcih ........................................................................................................ 122

8.1 Osnovne množice in vzorci ............................................................................................... 122

8.1.1 Zakaj vzorčimo .......................................................................................................... 122

8.1.2 Posploševanje na osnovno množico ................................................................. 123

Page 8: Knjiga o statistiki

6 Knjiga o statistiki

8.1.3 reprezentativnost ..................................................................................................... 124

8.1.4 Izbiranje vzorcev ....................................................................................................... 126

8.1.5 Večstopenjsko vzorčenje ....................................................................................... 132

8.1.6 Izbiranje enot s ponavljanjem ............................................................................. 134

8.1.7 Stratificirano vzorčenje ........................................................................................... 134

8.1.8 Mali in veliki vzorci ................................................................................................... 135

8.1.9 Neodvisni in odvisni vzorci ................................................................................... 136

8.1.10 Enostavni slučajnostni vzorci ............................................................................. 137

8.1.11 Posploševanje na hipotetično osnovno množico ...................................... 137

8.1.12 Oznake za parametre ............................................................................................ 138

8.2 Ocenjevanje parametrov z velikimi vzorci .................................................................. 139

8.2.1 Množica vzorcev in množica vseh vzorcev ...................................................... 141

8.2.2 Porazdelitev vzorčnih parametrov ..................................................................... 143

8.2.3 Ocenjevanje aritmetične sredine z enostavnimi slučajnostnimi vzorci 144

8.2.4 Ocenjevanje strukturnega odstotka z enostavnimi slučajnostnimi vzorci ............................................................................................... 155

8.2.5 Ocenjevanje standardnega odklona z enostavnimi slučajnostnimi vzorci ............................................................................................... 157

8.2.6 Ocenjevanje Pearsonovega korelacijskega koeficienta z enostavnimi slučajnostnimi vzorci .............................................................................................. 158

8.3 Preizkušanje hipotez z velikimi vzorci .......................................................................... 161

8.3.1 Preizkušanje ničelne hipoteze o razliki med aritmetičnimi sredinami z enostavnimi slučajnostnimi vzorci .............................................. 162

8.3.2 Preizkušanje ničelne hipoteze o razliki med strukturnimi odstotki z enostavnimi slučajnostnimi vzorci ................................................................... 174

8.3.3 Preizkušanje hipotez o razliki med standardnimi odkloni z enostavnimi slučajnostnimi vzorci ................................................................... 178

8.3.4 Preizkušanje ničelne hipoteze o razliki med Pearsonovimi korelacijskimi koeficienti z enostavnimi slučajnostnimi vzorci ................. 180

8.4 χ2-preizkus ............................................................................................................................... 183

8.4.1 Preizkušanje hipoteze enake verjetnosti .......................................................... 184

8.4.2 Preizkušanje hipoteze neodvisnosti ................................................................... 191

8.4.3 Pogoj za uporabo χ2-preizkusa .............................................................................. 198

Page 9: Knjiga o statistiki

7Kazalo

8.5 Koeficienti kontingence ..................................................................................................... 200

8.5.1 Pearsonov kontingenčni koeficient ..................................................................... 201

8.5.2 Cramérjev koeficient ................................................................................................. 204

8.5.3 Koeficient ф .................................................................................................................. 204

8.6 Napake pri ocenjevanju parametrov in preizkušanju hipotez ............................. 205

8.6.1 Ocenjevanje parametrov ......................................................................................... 205

8.6.2 Preizkusi ničelnih hipotez ....................................................................................... 206

8.7 Mali vzorci ............................................................................................................................... 207

8.7.1 Studentova ali t-porazdelitev ................................................................................ 207

8.7.2 Množica vzorcev in množica vseh vzorcev ....................................................... 208

8.7.3 Porazdelitev vzorčnih parametrov ....................................................................... 209

8.7.4 Reprezentativnost in velikost vzorca ................................................................. 211

8.7.5 Ocenjevanje aritmetične sredine z malimi vzorci .......................................... 212

8.7.6 Preizkušanje ničelnih hipotez ................................................................................ 218

Literatura ............................................................................................................................................... 227

Priloge .................................................................................................................................................... 229

Page 10: Knjiga o statistiki
Page 11: Knjiga o statistiki

9Osnovni pojmi

1 Osnovni pojmi

1.1 Proučevanje množičnih pojavov

Vzgojni pojavi, ki jih proučujemo, so lahko množični ali enkratni. Množični pojavi so tisti, ki se pojavljajo večkrat, enkratni pa tisti, ki nastopajo samo enkrat. Gimnazija Vič je enkratni pojav, gimnazija nasploh pa množični po-jav (saj jih je v Sloveniji več kot 20). Dijak M. Z. iz kraja A je enkratni pojav, dijak gimnazije pa je množični pojav.

Statistične metode uporabljamo pri proučevanju množičnih pojavov, pri proučevanju enkratnih pa ne. S temi metodami proučujemo kvantitativne in kvalitativne značilnosti ter zakonitosti vzgojnih (pedagoških) pojavov. Definicija množičnih pojavov je sicer preprosta, a nam pri presoji, ali upo-rabiti statistične metode ali ne, ne pomaga veliko. Kadar proučujemo npr. »množico« treh ali štirih ravnateljev, ne bomo uporabili statističnih metod (pa čeprav gre po definiciji za množični pojav). Velja pravilo, da bomo stati-stične metode uporabili pri proučevanju nekoliko »bolj množičnih« pojavov ali, natančneje, za množice vsaj velikosti vzgojne skupine (šolskega oddelka, učne skupine, krožka in podobno). Šele takrat bo uporaba statističnih me-tod smiselna. Vendarle pa ostre meje ni (saj tudi velikost skupin v vzgojno-iz-obraževalnem delu nima enotne spodnje meje). To pravilo dodatno ilustrira odgovor na pogosto zastavljeno vprašanje: Pri kateri velikosti skupine lahko uporabimo statistične metode? Odgovor na takšno vprašanje bi seveda bil: Že pri dveh enotah. A kot smo že povedali, uporaba statističnih metod pri tako majhnih skupinah ni smiselna in smotrna.

1.2 Statistična množica in enote

Množice na pedagoškem področju lahko sestavljajo najrazličnejše eno-te: dijaki, učitelji, gojenci, učenci in ravnatelji, a tudi vrtci, šole, dijaški domovi, knjige, delovni zvezki, učbeniki, učni načrti, šolsko pohištvo, učila, strokovne revije, šolske stavbe, učne ure, ekskurzije, ocene, izdelki učencev, vprašanja, računalniki itd. V empiričnih raziskavah vedno prou-čujemo konkretno skupino. Da bi jo lahko preučili, jo moramo natanč-no opredeliti. Tako opredeljeno skupino imenujemo statistična množica. Opredeliti množico pomeni postaviti pogoje, ki določajo, kdo vanjo sodi

Page 12: Knjiga o statistiki

10 Knjiga o statistiki

in kdo ne. Te pogoje imenujemo opredeljujoči pogoji. Opredeljujoči pogo-ji so na splošno trije:• s stvarnim opredeljujočim pogojem določimo, kdo (ali kaj) so enote te

množice,• s časovnim opredeljujočim pogojem določimo čas, v katerem bomo za-

jeli množico,• s krajevnim opredeljujočim pogojem določimo geografske razsežnosti

množice.

Tiste enote, ki ustrezajo opredeljujočim pogojem, sodijo v tako opre-deljeno statistično množico. S tem so natančno določene enote statistične množice in tudi celotna statistična množica. Če kateri od teh pogojev manj-ka, statistična množica ni dovolj natančno določena in tako ne vemo, katere enote jo sestavljajo. V tabeli je nekaj primerov ustrezno opredeljenih stati-stičnih množic:

Tabela 1. Statistične množice

Učenci osnovnih šol v Mariboru na dan 4. marca 2012

Tehniške gimnazije v Sloveniji v šolskem letu 2010/2011

Učitelji razrednega pouka na osnovnih šolah v Kopru v šolskem letu 2011/2012

Šole za voznike motornih vozil v Ljubljani na dan 1. junija 2012

Ravnatelji osnovnih šol v Celju na dan 5. septembra 2011

Zaplete pri zbiranju podatkov o enotah množice prinaša časovni pogoj, kadar je določen v dolgem razmiku (semester, šolsko leto, polletje in po-dobno). Če se časovni pogoj nanaša na celo šolsko leto, moramo zajeti vse enote, ki se pojavijo v tistem šolskem letu (torej moramo čakati do konca šolskega leta). V tretjem primeru iz tabele bi bili to vsi učitelji – torej tudi tisti, ki so se zaposlili med šolskim letom. Za praktično izvedbo raziskave je to velika ovira (še zlasti za zbiranje podatkov). Običajno opredeljujemo množice v celih šolskih letih le, kadar v raziskavi uporabljamo podatke iz že obstoječe dokumentacije: npr. iz dokumentacije zavoda za šolstvo, urada za statistiko, ministrstev in podobno. Takrat lahko kot časovni opre-deljujoči pogoj določimo celo šolsko leto. Če pa podatke zbiramo sami, množice najpogosteje opredeljujemo trenutno – z določenim datumom. Res je, da tudi dan (datum) ni povsem dosledno trenutna opredelitev; tudi dan je interval 24 ur.

Page 13: Knjiga o statistiki

11Osnovni pojmi

Nekatere pojave moramo opredeliti intervalno: število opravljenih uč-nih ur (npr. v enem tednu, mesecu ali šolskem letu), število seminarjev, ki so se jih učitelji udeležili (npr. v zadnjih treh letih) itd. Takšnih množic nikakor ne moremo opredeliti trenutno; številne pa lahko opredelimo trenutno ali intervalno. Razprave o časovnem pogoju ne bomo širili na filozofska vpraša-nja trenutnega opredeljevanja statističnih množic. Bistveno je, da je časovni opredeljujoči pogoj jasno in nedvoumno določen.

Statistično množico v raziskovalnem poročilu običajno imenujemo raziskovalna množica ali na kratko množica. Bistveno drugače pa statistič-ne množice imenujemo v vzorčnih raziskavah, kjer iz množice izberemo le manjši del. Takrat celotno statistično množico imenujemo osnovna množi-ca, manjši izbrani del pa vzorec (ali redkeje vzorčna množica).

1.3 Spremenljivke

Enote statistične množice imajo nešteto lastnosti. Vsaka lastnost enot množi-ce je spremenljivka. Naštejmo nekaj enot in njihovih pomembnejših lastnosti.

Tabela 2. Statistične enote in spremenljivke

enota lastnosti ali spremenljivke

šola leto ustanovitve, stopnja šole (osnovna, srednja itd.), skupno število učencev, število oddelkov, število zaposlenih, število učiteljev itd.

učitelj stopnja izobrazbe, strokovni naziv, smer dokončanega študija, kateri predmet uči, šola, na kateri je zaposlen itd.

dijak spol, starost, ocene, prizadevnost, interesi, ali je član športnega kluba, narodnost, najljubši šolski predmet, telesna teža itd.

priročnik naslov priročnika, ime avtorja, leto izdaje, kraj izdaje, število strani, format, število ilustracij, cena, številka ISBN, ime založbe itd.

šola za voznike motornih vozil

število vozil, katere programe izvaja, število zaposlenih, število inštruktorjev vožnje itd.

Enote množice proučujemo tako, da zbiramo podatke o njihovih lastno-stih – spremenljivkah. Spremenljivke so osrednji pojem statistike. Uporabiti statistične metode pravzaprav pomeni obdelati podatke za spremenljivke. V vsaki raziskavi pedagoške pojave proučujemo z drugačnim namenom. Zato bomo vsakokrat proučevali druge spremenljivke, celo takrat, ko raziskujemo podobne ali iste množice.

Page 14: Knjiga o statistiki

12 Knjiga o statistiki

1.3.1 Številske in opisne spremenljivke

Da bi bolje razumeli pojem in vlogo spremenljivk v pedagoškem raziskova-nju, bomo spremenljivke delili po nekaj kriterijih. Ena preprostejših je deli-tev spremenljivk po tem, kako so izražene njihove vrednosti. Lahko jih izra-žamo s številkami ali z besedami. Spremenljivke, ki jim vrednosti izražamo s številkami, imenujemo številske ali numerične.

Tabela 3. Številske spremenljivke

spremenljivka vrednosti

štipendija 104, 151, 90 itd.

število študentov v letniku 45, 52, 39, 28, 90 itd.

starost v letih 14, 15, 17, 22 itd.

število oddelkov v vrtcu 4, 5, 8, 6 itd.

Spremenljivke, ki jim vrednosti izražamo z besedami (opisi), imenujemo opisne ali atributivne.

Tabela 4. Opisne spremenljivke

spremenljivka vrednosti

katere tuje jezike obvlada študentka

angleški, francoski, nemški itd.

stopnja študija prva stopnja, druga stopnja, tretja stopnja

narodnost Italijanka, Madžarka, Slovenka, Hrvatica, Kitajka, Nemka, Španka itd.

opravljene vaje iz statistike vse, nekatere, nobena

zadovoljnost s potekom izpita

zelo, srednje, malo

Vendar ta delitev povzroča tudi majhno dilemo. Vrednosti nekaterih spremenljivk so namreč izražene hkrati številčno in besedno. Pomislimo na šolske ocene, ki so skoraj vedno zapisane s številko in besedo. Ali so šolske ocene številske ali opisne spremenljivke? Da bi na to vprašanje odgovorili, moramo razmisliti, kakšna je narava te spremenljivke. Bolj pomembna je narava kot pa oblika spremenljivke, torej na kakšen način so vrednosti izra-žene. Takšen razmislek hitro pokaže, da je pri šolski oceni bistvena beseda

Page 15: Knjiga o statistiki

13Osnovni pojmi

in ne številka. Zakaj? Odlična ocena je namreč povsod najboljša in je med ocenami na najvišjem mestu. Ta ocena je lahko zapisana z različnimi števil-kami (v osnovnih in srednjih šolah pri nas s številko 5, na Češkem s številko 1, na Poljskem s številko 6, na univerzah pri nas s številko 10, na italijanskih univerzah s številko 30, na univerzah na Poljskem s številko 5 itd.). Besedni izrazi so enoznačni, številke pa lahko določamo poljubno. Po svojem bistvu je torej šolska ocena opisna in ne številska spremenljivka.

1.3.2 Merske lestvice

Veliko pomembnejša je delitev glede na vrsto in količino informacije, ki jo vse-bujejo vrednosti spremenljivke (rezultati merjenja, podatki). Delitev po tem kriteriju ima štiri stopnje (štiri vrste spremenljivk ali štiri merske lestvice):A. nominalne spremenljivke,B. ordinalne spremenljivke,C. intervalne spremenljivke, D. razmernostne spremenljivke.

Nominalne spremenljivke ne vsebujejo veliko informacije. Lahko ugo-tovimo le, ali se enote razlikujejo ali ne. Značilna nominalna spremenljivka je spol. Po tej spremenljivki lahko ugotovimo, ali sta dva učenca različnega ali enakega spola. Pri nominalnih spremenljivkah namesto izraza vrednosti raje uporabljamo izraz kategorije. Nekatere nominalne spremenljivke imajo le dve kategoriji, nekatere pa več:

Tabela 5. Nominalne spremenljivke z dvema kategorijama

spremenljivka kategorije

spol moški, ženski

ali učenec poje v šolskem zboru da, ne

ali ima učenka svoj računalnik doma ima, nima

ali se pri pisnem izpitu iz statistike lahko uporablja literatura

uporaba je dovoljena, uporaba ni dovoljena

Page 16: Knjiga o statistiki

14 Knjiga o statistiki

Tabela 6. Nominalne spremenljivke z več kategorijami

spremenljivka kategorije

narodnost Kitajec, Francoz, Slovenec itd.

smer študija na filozofski fakulteti geografija, filozofija, pedagogika, psihologija, zgodovina, umetnostna zgodovina, etnologija, knjižničarstvo itd.

kakšno študijsko literaturo uporabljajo študenti

monografije, zbornike, univerzitetne učbenike, znanstvene revije, strokovne revije itd.

Kategorij nominalne spremenljivke se ne da razvrstiti po velikosti od manjših do večjih, ker te lastnosti nominalne spremenljivke nimajo. Poeno-stavljeno bi lahko rekli, da so vse kategorije na isti ravni. Nominalne spre-menljivke so čiste opisne spremenljivke in nimajo kvantitativne osnove. Pri presojanju, ali je določena spremenljivka nominalna ali »kaj več«, moramo biti pazljivi – presoditi moramo na podlagi bistva spremenljivke in ne na podlagi tega, kako so poimenovane njene kategorije. Pokažimo to s prime-rom. V anketi so dijaki odgovarjali na vprašanje, ali jim je bila filmska pred-stava všeč. Možna sta bila le dva odgovora: DA in NE. Kljub tako postavlje-nima kategorijama ta spremenljivka ni nominalna. Zadovoljnost se namreč stopnjuje; ni tako, da so eni popolnoma zadovoljni, drugi pa sploh ne. V resnici gre za nižjo in višjo stopnjo zadovoljnosti. Podobno je tudi z drugi-mi takšnimi spremenljivkami (priljubljenost, prizadevnost itd.). Nominalno spremenljivko bi dobili, če bi dijake vprašali, ali so bili na filmski predstavi. V tem primeru bi imeli odgovori DA in NE povsem drugačen pomen kot pri vprašanju o zadovoljnosti. Nenatančna imena spremenljivk ali njihovih kategorij so lahko včasih zavajajoča.

Ordinalne spremenljivke vsebujejo že več informacije. Vsebujejo ta-kšno informacijo, s pomočjo katere lahko ugotovimo, ali so enote enake ali različne, pa tudi nekaj več: katera enota je na lestvici višje in katera nižje. Vrednosti teh spremenljivk se stopnjujejo in jih lahko razvrstimo od naj-manjše do največje (in s tem tudi enote). Namesto izraza vrednosti pri or-dinalnih spremenljivkah raje uporabljamo izraz stopnje (redkeje kategori-je). Kategorije nominalnih spremenljivk so vse na isti ravni, pri ordinalnih spremenljivkah pa se kategorije stopnjujejo – ker izražajo količino. Te spre-menljivke imajo kvantitativno osnovo. Značilna ordinalna spremenljivka je stopnja izobrazbe. Ordinalne spremenljivke najpogosteje dobimo pri opazo-vanju, anketiranju, uporabi lestvic stališč in ocenjevalnih lestvic itd. Pogosto

Page 17: Knjiga o statistiki

15Osnovni pojmi

že oblika anketnega vprašanja nakazuje, da gre za ordinalno spremenljivko: npr. koliko ste prispevali ... ali koliko se učite ... itd. Tudi kategorije ordi-nalne spremenljivke nakazujejo kvantitativno osnovo: veliko, srednje, malo; pogosto, včasih, redko itd. Zato kategorije ordinalne spremenljivke raje ime-nujemo stopnje.

V zvezi s stopnjevanjem pri ordinalnih spremenljivkah se je treba zave-dati, da vemo, katere stopnje so višje in katere nižje, ne vemo pa, kakšne so razlike med posameznimi stopnjami. Zato tudi ne moremo reči, da so inter-vali med posameznimi stopnjami povsod enaki. Še več – izkušnje kažejo, da ti intervali še zdaleč niso enaki. Ordinalno lestvico si lahko predstavljamo kot stopnišče z neenakimi stopnicami. Tudi če bi bili pri določeni ordinalni spremenljivki intervali med stopnjami enaki, bi nam to dejstvo ostalo skrito.

Stopnje ordinalnih spremenljivk so običajno izražene z besedami, pogo-sto pa tudi s številkami (npr. šolske ocene in šolski uspeh). Številke ustvar-jajo videz, kot da gre za enake intervale. Čeprav se na prvi pogled zdi, da je razlika med zadostno in dobro oceno enaka razliki med dobro in prav dobro oceno, pa to seveda ni res. Nemogoče je natančno določiti, kakšna je razlika med oceno 2 in 3 ali 3 in 4. Zato tudi ni možno trditi, da so te razlike enake (enaki intervali). Tudi rangi, kot npr. vrstni red prihoda v cilj pri krosu, za-krivajo dejanske razlike v dosežkih med učenci. Zdi se, kakor da so dosežki učencev enakomerno nanizani od prvega do zadnjega; kakor da so razlike med njimi enake (saj so med vsemi rangi enake razlike: med 7. in 8. je enaka razlika kot med 14. in 15.). V resnici so med posameznimi ocenami in tudi med posameznimi rangi razlike neenake (v tisti lastnosti, ki jo s temi ocena-mi ali rangi izražamo).

Kako pa je s spremenljivko dosežek na testu znanja. Ali so tu intervali enaki ali ne? Zdi se, da je interval med npr. 14 in 15 točk enak intervalu med 8 in 9 točk. Vsakokrat gre le za eno točko in na videz je »točka tu enaka točki tam«. A čeprav se zdijo intervali enaki, so v resnici različni, saj je naraščanje težavnosti od naloge do naloge v testu neenakomerno. Izenačenost inter-valov pri dosežkih na testu znanja pa je vendarle v splošnem večja kot pri številnih drugih ordinalnih spremenljivkah. Tega ne moremo neposredno pokazati, to lahko pokažejo le izkušnje.

Izenačenost ali enakost intervalov med posameznimi stopnjami določe-ne merske lestvice bi bila zelo dobrodošla lastnost. Pozneje bomo videli, da so takšne spremenljivke v obravnavani klasifikaciji intervalne in razmerno-stne. Nekatere spremenljivke, ki so vmes med ordinalnimi in intervalnimi, pogosto obravnavamo kot intervalne (npr. dosežke na testih znanja v točkah,

Page 18: Knjiga o statistiki

KNJIGASTATIBoris Kožuh

KNJiGA o sTATisTiKiOddelek za pedagogiko in andragogikoLjubljana 2013

Bori

s Ko

žuh:

KNJ

iGA

o sT

ATis

TiKi

9 789612 375997

ISBN 978-961-237-599-7

Univerzitetni učbenik Knjiga o statistiki je namenjen študen-tom pedagogike in študentom pedagoških smeri študija, s pridom pa jo bodo lahko upora-bljali tudi študentje drugih so-rodnih družbenih ved. Avtor v knjigi predstavlja in obravnava osnovne statistične metode, ki se uporabljajo pri raziskovanju vzgojnih pojavov. Pri vsaki naj-prej pojasni teoretične osnove, nato pa uporabo te metode v pedagoškem raziskovanju.

Učbenik je napisan v pre-prostem jeziku. Opremljen je s številnimi primeri uporabe in izvedbami opisanih statističnih metod. Predstavljeni so načini in pogoji praktične uporabe metod ter možni zapleti pri obdelavi podatkov. Zaradi izbo-ra metod in načina njihovega obravnavanja je knjiga lahko elementarni učbenik za štu-dente na prvi stopnji študija, nadaljevalni učbenik za štu-dente na drugi stopnji, ali pa uvodni priročnik za študente na doktorskem študiju. Knjiga o statistiki je lahko uporabna tudi kot praktični priročnik za raziskovalno delo na pedago-škem področju.

tujih. Sodeluje s profesorji na številnih univerzah po svetu (UCLA v Los Angelesu, South Bank University v Londonu, Karlova univerza v Pragi, Anti-och University v Los Angelesu, University of North Dakota, več univerz na Poljskem ter v nekdanjih jugoslovanskih re-publikah itd.). V domačih in mednarodnih revijah objavlja študije s področja pedagoške metodologije. Objavil je 12 knjig v Sloveniji in več kot 25 v tujini, kot urednik pa je so-deloval pri številnih zbornikih, izdanih na različnih univerzah po svetu. Deset let vodi medna-rodno združenje ICIA, kjer v so-delovanju z univerzami iz ZDA, Kanade, Anglije, Argentine, Av-stralije in številnimi univerzami iz Evrope organizira mednaro-dne znanstvene on-line konfe-rence.

Boris Kožuh je rojen leta 1945 v Italiji. Leta 1973 je diplomi-ral na Oddelku za pedagogiko Filozofske fakultete v Ljubljani. Po študiju se je zaposlil kot asi-stent za pedagoško statistiko pri profesorju dr. Janezu Sagadinu. Doktoriral je leta 1986, ob kon-cu devetdesetih let pa je bil tudi gostujoči profesor na Univerzi v Opolu na Poljskem. Leta 2000 je bil izvoljen za rednega profe-sorja za pedagoško metodologi-jo, leta 2008 pa je dobil naziv zaslužni profesor Univerze v Ljubljani.

Aktivno obvlada ruščino, češčino, poljščino in hrvaščino ter pasivno vse ostale slovanske jezike. Deset let je bil glavni in odgovorni urednik osrednje slovenske pedagoške znanstve-ne revije Sodobna pedagogika. Predaval je na vseh treh sloven-skih univerzah in na številnih