View
204
Download
13
Category
Preview:
Citation preview
1
Pedagoško raziskovanje
Predavatelj:doc. Boštjan Šimunič
Študijski program: Pedagoško-andragoško izobraževanje
Osnovni podatki predmeta
• 6 KT (20 kontaktnih ur)• 10 ur predavanj• 5 ur seminarjev• 5 ur laboratorijskih vaj
• Urnik• Petek 30.3. in 6.4. med 16:00 in 20:00 uro• Sobota 31.3 in 7.4. med 09:00 in 13:00 uro
Osnovni podatki izvajalca
• Nosilec in izvajalec predmeta• doc. dr. Boštjan Šimunič
• email: bostjan.simunic@zrs.upr.si• GSM: 031832016
2
Študijska literatura • Osnovna
• Izročki in zapiski;• Thomas J.R., Nelson J.K., Silverman S.J.,
(2005). Research Methods in Physical Activity (5th edition);
• Berg K., Latin R.W., (2008). Essentials of Research methods in Health, Physical Education, Exercise Science and Recreation (3rd edition);
• Dopolnilna• William J.V. (2005). Statistics in
Kinesiology (3rd edition).
Vaše študijske obveznosti
• Predavanja• Prisotnost zaželena.
• Seminar• Izdelava seminarja
• Laboratorijske vaje
• Izpit (pisni)
Cilji predmeta
• Študent/ka spozna osnovne vrste, metode in tehnike kvantitativnega pedagoškega raziskovanja uporabne v praksi in/ali raziskovanju pedagoškega področja.
• Zna izbrati in uporabiti enostavne metode in tehnike zbiranja in obdelave kvantitativnih podatkov glede na ustrezen problem raziskovanja.
• Se usposablja za enostavnejše samostojno kvantitativno raziskovalno delo za raziskovalne in/ali praktične namene.
• Zna sodelovati z drugimi v raziskovalnih projektih.• Zna napisati poročilo o raziskavi.• Razvije pozitivno vrednotenje raziskovalnega dela.
3
Pridobljene kompetence
• Splošne• profesionalni razvoj, to je usposobljenost za premišljeno
analiziranje dobre in šibke plati svojega pedagoškega dela, • usposobljenost za tvorno sodelovanje v raziskovalno razvojnih
projektih, namenjenih izboljšanju kakovosti vzgojno izobraževalnega dela.
• Predmetno-specifične• Usposobljenost za preprostejše empirično kvantitativno
raziskovanje v vzgoji in izobraževanju.• Fleksibilna uporaba znanja v praksi, ki se pokaže pri izdelavi
raziskovalnega poročila.• Informacijska pismenost in uporaba informacijsko-
komunikacijske tehnologije v vzgoji in izobraževanju pri obdelavi podatkov, saj študenti znajo preprosteje obdelati podatke z uporabo statističnega računalniškega paketa SPSS.
• Interdisciplinarno povezovanje vsebin, ki se kaže pri raziskovanju problema, ki je lahko iz različnih disciplin.
Učna snov
• Vsebina predavanj• Osnovni pojmi raziskovanja• Hipoteze in postopek testiranja hipotez• Osnovni parametrični statistični testi• Osnovni neparametrični statistični testi• Multivariatni statistični testi• Osnovi tipi raziskav• Osnovni dizajni raziskav• Kontrola kakovosti raziskovanja• Razvoj raziskovalnega problema• Pisanje raziskovalnega poročila
Predavanje 1:OSNOVNI POJMI RAZISKOVANJA
Izvedeli boste:1. Kaj je raziskovanje?2. Katere so značilnosti raziskovanja/raziskovalca?3. Kaj je namen raziskovanja?4. Kaj je temeljno in kaj je aplikativno raziskovanje?5. Kateri so štirje osnovni tipi raziskovanj?6. Kaj je primarno in kaj sekundarno raziskovanje?7. Kaj je teoretično in kaj empirično raziskovanje?8. Kje se izvaja raziskava?
4
Definicija raziskovanja
• Raziskovanje• Sistematično zbiranje podatkov o nekem pojavu,
ki na koncu pripeljejo do pomembnih in odmevnih zaključkov, oziroma celo do nove teorije.
• Any honest attempt to study a problem systematically or to add to man’s knowledge of a problem may be regarded as research (Theodorson, 1969).
• Research is to see what everybody else has seen, and to think what nobody else has thought (Szent-Gyorgyi).
• Research is a systematic process of discovery and advancement of human knowledge.
Pet značilnosti raziskovanja
1. Sistematičnost• Identifikacija spremenljivk, raziskovalni dizajn, zbiranje
podatkov, testiranje hipotez. 2. Logičnost
• Možnost evalvacije uporabljenih metod za preverjanje zaključkov.
3. Empiričnost• Zbiranje podatkov, ki bodo služili za postavljanje
zaključkov.4. Reduktivnost
• Postavljanje splošnih zaključkov na osnovi vzorca, podatka/ov.
5. Ponovljivost• Raziskovalni postopek mora biti zabeležen, kar dovoli
drugim preverjanje oziroma nadgradnjo.
Kdo je znanstvenik?• Znanstvenik ni le človek v beli halji, ki cepi atome, računa
dolge enačbe, dela z drago laboratorijsko opremo, …, je lahko tudi učitelj športne vzgoje, vzgojitelj v vrtcu, trener v fitnesu, delavec v turistično-rekreacijskem centru, zaposlen v gradbenem podjetju, …
5
Kdo je znanstvenik?
• Odprtih misli in razgledan• Mora imeti vedno odprte misli, za vsa možna vprašanja,
odgovore, interpretacije. Ne sme omejevati možne rešitve.• Poglobljeno poznavanje problematike
• Poznati mora še nerešena vprašanja določenega področja. Kaj lahko omejuje raziskovanje na področju? Poznati mora metodologijo področja.
• Intelektualna radovednost• Mora redno brati/študirati nova znanja področja. Vedno morajo
imeti željo po vedeti več. Več kot je znanega, več vprašanj je.• Vztrajnost
• Se zahteva, ker je raziskovanje lahko večletno. Torej veliko branja, komuniciranja, pilotnih študij, eksperimentov, longitudinalne študije, razvoja tehnologij, diseminacija, …
• Poštenost• Znanstvenik ima možnost, da je nepošten. Zato ne sme prirejati
podatkov, vplivati na rezultat, biti neetičen, goljufati pri navajanju avtorjev, …
Ali ste že vsaj malo znanstveniki?
Temeljno in aplikativno raziskovanje• Temeljno
• Se ga lotimo brez neposredne aplikacije – uporabne vrednosti na koncu. Le da vidimo, kaj se zgodi. Raziskovanje ni vezano na določen problem, ampak le da bolje usvojimo določene koncepte.
• Je nova učna metoda uspešna
• Aplikativno• Je usmerjeno iskanju odgovora na določeno vprašanje
oziroma reševanju določenega cilja.• Kaj mora imeti računalniški program, da bo učinkovit
pripomoček učenja.
• Raziskovanje ni nikoli le temeljno oziroma nikoli le aplikativno.
6
Tipi raziskovanj• Raziskovalni
• Raziskovanje brez vsakršnega predhodnega znanja. Tipično temeljno raziskovanje. Iskanje prvih idej o določenem pojavu, iskanju pravih raziskovalnih metod, …
• S čim bom meril nek pojav?
• Deskriptivni (ali statistično)• Raziskovanje, ki pojasni: KDO, KAJ, KJE, KDAJ in KAKO se
je zgodilo. Ne pojasnjuje vzrokov.• Ali so razlike med dvema skupinama? Ali povezanost med
dvema spremenljivkama?• Kdo bo hitrejši?
• Razložljivostni• Pojasnjuje ZAKAJ in KAKO se zgodi določeni pojav. Postavlja
kavzalno razmerje med spremenljivkami.• Kaj je prej kura ali jajce?
• Prediktivni• Poskuša napovedovati pojave na osnovi nekaterih znanj.
Primarno in sekundarno raziskovanje
• Primarno• Je raziskovanje, ki vključuje merjenje podatkov
(vprašalnik, tehtnica, senzor sile, …).
• Sekundarno• Je raziskovanje, ki pregleduje in analizira podatke
izmerjene s strani drugih. Research the projects.
• Ni le primarnega raziskovanja. S sekundarnim raziskovanjem vedno poskušamo obrazložiti naše izmerjene rezultate.
Teoretično in empirično raziskovanje
• Teoretično• Uporablja zaključke raziskav drugih za razvoj
novih idej, ki temeljijo na obstoječem znanju.• Razlaga nasilja med športnimi navijači na osnovi
prebiranja že objavljenih del.
• Empirično• Nove ideje temeljijo na lastnem zbiranju
podatkov. Se ga spodbuja, če je le možno. Seveda ob tem se pojavi vprašanje o časovni in finančni kompleksnosti.• Razlaga nasilja med športnimi navijači na osnovi
merskega instrumenta (vprašalnik, intervju, opazovanje, zgodovinsko raziskovanje…)
7
Prostor raziskovanja
• Laboratorijsko okolje• Bolj “sterilno” okolje, kjer imamo boljšo kontrolo nad
eksperimentom. Vendar je težko posplošiti ugotovitve iz laboratorija v realno okolje delovanja preiskovanca.
• Terensko okolje• Je realnejše – bolj podobno pravemu okolju
preiskovanca. Vendar težko kontroliramo vse faktorje, ki lahko vplivajo na rezultat merjenja.
• Posebno okolje je situacijsko okolje. To je dejansko okolje preiskovančevega delovanja. Vendar je težko v njega nemoteče posegati.
Ponovitev
• Trenutek iznajdbe je zelo prijeten in obdarjajoč. Pa naj bo to nova tehnologija, nova teorija ali nova ideja.
• Raziskovanje si predstavljajte bolj kot metodo za reševanje problemov kot “črno gmoto”, polno nepraktičnih ljudi, nerazumljivih besed, …
• Zato naj bi vsak UNI, MAG, DR znal raziskovati, brati raziskovalna poročila in jih v praksi plemeniti.
Predavanje 2:PONOVITEV OSNOVNIH STATISTIČNIH METODIzvedeli boste:1. Kaj je spremenljivka in kateri so tipi spremenljivk?2. Katere merske skale poznamo?3. Kateri so pogoji za uporabo parametričnih in
neparametričnih statističnih metod?4. Kateri so načini vzorčenja?5. Katere so mere srednje tendence?6. Katere so mere variabilnosti?7. Kakšne prednosti nosi normalna porazdelitev?8. Kako lahko primerjamo med sabo rezultate različnih
spremenljivk?
8
Spremenljivka
• Spremenljivka• Značilnost, ki lahko zavzame več kot eno
vrednost. Vrednost se lahko razlikuje med osebami kot znotraj iste osebe.• Starost, Telesna teža, Telesna višina, odstotek
maščobe, moč mišic rok/nog/trupa, …
• Konstanta• Značilnost, ki lahko zavzame le eno vrednost.
Izmerimo le enkrat.• Dolžina teka, število igralcev v moštvu, anatomske
vrednosti,
Tipi spremenljivk
• Opisne (atributivne, kvalitativne)• Vrednosti se izražajo z opisi (besede, znaki,
števila).• Spol, tip uniforme vojaka, barva uniforme vojaka,
proizvajalec čevlja/copata, …
• Številske (kvantitativne)• Vrednosti se izražajo s števili, s katerimi lahko
računamo.• Diskretne
• Lahko zavzame le določene vrednosti. Pogosto so to frekvence.• Število otrok v družini, Število utripov srca na minuto, …
• Zvezne• Če med poljubnima dvema vrednostma obstaja še ena.
• Starost, telesna višina, poraba kisika, sila upogiba, …
Odvisnost spremenljivk
• Neodvisna spremenljivka• Zavzame svoje vrednosti popolnoma neodvisno od
druge. Ne kovariira za ostalimi.• Boljše ravnotežje gimnastičarja je neodvisno od njegovega
VO2max – maksimalne aerobne moči, …
• Odvisna spremenljivka• Medsebojna odvisnost z eno ali več drugih spremenljivk.
• Telesna teža je odvisna od telesne višine, VO2max je odvisen od telesne teže, kognitivne sposobnosti so odvisne od gibalnih/športnih navad in učnih navad, …
∑=
=
=n
iii XfY
XfY
1
)(
);(
9
Merske skale• Nominalna (imenska)
• So najbolj osnovne – kvalitativne – spremenljivke, saj vzorec le grupirajo v skupine in ne podajajo razlik med njimi.
• Število obutev v fitnesu: “nike”, “adidas”, “reebok”, …• Delitev vzorca po spolu, delovnem mestu, …
• Absolutna (je posebna oblika razmernostne)• In tudi nadgradnja nominalne. Z njo opazujemo frekvence
nominalne spremenljivke. Lahko računamo povprečno vrednost.• Število kamperjev ob sobotah, število „nike“ čevljev…
• Ordinalna (urejenostna)• Deli podatke po vrstnem redu, kar jih kvantitativno lahko
primerjamo. Vendar ne vemo kolikšne so bile razlike med njimi.• Vrstni red: na koncu teka, učni uspeh v šoli, Likertova skala-5 …
• Intervalna (razmična)• Spremenljivke so urejene z znano razliko med njima. Lahko jih
odštevamo ne pa delimo. Nima absolutne ničle. Le arbitrarno.• Temperatura s celzijevo skalo, leto rojstva, …
• Razmernostna (ang. “ratio”)• Razmerje poljubnih dveh spremenljivk je urejeno. Vsebuje tudi
absolutno ničlo. Ima ničlo, ki ni določena arbitrarno.• Sila, razdalja, masa, temperatura v kelvinovi skali
Parametrična in neparametrična statistika• Parametrična
• Vrsta statističnih postopkov, če so spremenljivke intervalne ali razmernostne in če so porazdeljene normalno.
• Telesna višina in teža, čas teka na 100 metrov, dolžina skoka v daljino, …
• Neparametrična• V ostalih primerih.
• Število moških in žensk, število poškodb na delovnem mestu, …
• Parametrična statistika ima večjo moč – prej ovrže H0. Če pa kriteriji za njeno rabo niso izpolnjeni je potrebno uporabiti neparametrično.
Vzorčenje
• Populacija• Stvarna ali hipotetična množica opazovanih
preiskovancev/objektov. Z “N” označimo enote populacije. Populacijo opredelimo z:
• Stvarno opredelitvijo – kaj v njej proučujemo?• Krajevno opredelitvijo – kje?• Časovno opredelitvijo – kdaj?
• Vzorec• Reprezentativni del populacije. Z “n” označimo enote
vzorca (n ≤ N). Imamo lahko veliko število vzorcev na dani populaciji in za to tudi veliko možnosti načinov izbire vzorca:
• Če izbrane enote vračamo v populacijo:
• Če izbrane enote ne vračamo v populacijo:
nNNNN =⋅⋅⋅= ... vzorcevŠtevilo
)()...2()1( vzorcevŠtevilo nNNNN −⋅−⋅−⋅=
10
Načini slučajnega vzorčenja
• Brez omejitev (le če je pupulacija homogena)• Enostavno slučajno vzorčenje - popolnoma naključno
izbiramo enote vzorca (random generator števil, žrebanje).• 100 nogometašev 1. SNL.
• Sistematično slučajno vzorčenje – izberemo korak k=round(N/n) in izberemo vsakega k-tega.
• Vsak k-ti v telefonskem imeniku.
• Z omejitvami• Stratificirano vzorčenje – najprej razdelimo v razrede in
potem znotraj njih vzorčenje brez omejitev.• Razdelimo v starostne kategorije, potem dalje.
• Večstopenjsko vzorčenje – kadar niso znani vsi elementi populacije, a vemo kje se le-ti nahajajo. V 1. stopnji izberemo slučajno kraj in potem vzorčenje brez omejitev.
• Najprej izberemo šole, potem starostne kategorije, potem dalje
Ostale oblike vzorčenja
• Priložnostno vzorčenje (je zelo pogosto)• Kadar ni praktično (ali celo mogoče) izbrati
slučajni vzorec, ga izbiramo glede na prijavo oziroma intervju preiskovancev. Izbira preiskovancev za dolgotrajne in kompleksne študije.• Izvedba intervencije za povečanje gibanja.
Prikazovanje podatkov
• Mere centralne tendence• Podaja povprečno vrednost, ki najbolj
aproksimira značilnost določene spremenljivke.• Moški so v povprečju visoki 181.3 cm.• 50% učenk ima oceno pri matematiki višjo od 3.8.
• Mere variabilnosti• Podaja razpršenost vrednosti spremenljivke.
• Nove žarnice bodo delovale 5 let ± 1 leto.
• Grafični prikaz• Za vizualizacijo podatkov, za interpretacijo
porazdelitve in napovedovanje določenih verjetnosti.
11
Mere centralne tendence
• Povprečje• Aritmetična sredina spremenljivke. Uporabljali bomo “µ”
za povprečje populacije in “M” za povprečje vzorca.• Povprečje SDM (120, 130, 140, 210) = 150cm
• Mediana• Srednja točka porazdelitve, kjer 50% vrednosti leži levo in
50% desno od nje. Najprej je potrebno razdelit vrednosti po velikosti. Le če imamo atipične vrednosti.
• Mediana SDM (120, 130, 140) = 130cm• Mediana SDM (120, 130, 140, 150) = 135cm• Mediana SDM (120, 130, 140, 210) = 135cm
• Modus• Je najpogostejša vrednost spremenljivke. Redko se ga
uporablja.• Modus SDM (120, 120, 120, 130, 140) = 120cm
Mere variabilnosti
• Range (razpon)• Razdalja med največjo in najmanjšo vrednostjo. Slaba
mera, ker temelji le na ekstremnih vrednostih. Bolje prikazati kar surove največje in najmanjše vrednosti.
• Razpon SDM (120, 130, 140, 180) = 180 - 120 = 60cm• Razpon SDM (120, 130, 140, 180) = [120, 180] cm
• Standardni odklon – SD (deviacija)• Srednja algebraična razlika posameznega rezultata od
povprečja. Primerjava SD dveh vzorcev, le če isto povprečje.
• SD SDM (120, 130, 140, 210) = 40.8 cm
∑ ∑
∑
−⋅⋅=
−=
22
22
)()(1
XXNN
SD
MN
XSD
Mere variabilnosti
• Koeficient variance - CV• Za razliko od SD se lahko uporabi za primerjavo
dveh skupin z različnim povprečjem oziroma različno porazdelitvijo. CV je SD kot odstotek povprečja.
• M(SDM) = 150cm, SD(SDM) = 40.8cm, CV(SDM) = 27.2%
• T60M (10.1, 10, 12, 9.3): M(T60M) = 10.4, SD(T60M) = 1.2, CV(T60M) = 11.2%
⋅=M
SDCV %100
12
Normalna porazdelitev spremenljivke
• Večina spremenljivk v kineziologiji je normalno porazdeljenih, če je le dovolj velik vzorec.
• Normalna krivulja predstavlja model obnašanja spremenljivke in če zadovoljuje – omogoča uporabo parametričnih statističnih metod.
• Normalno porazdelitev se preveri vizuelno ali kvantitativno:
Praktična raba standardizirane normalne krivulje• Standardizacija
• Površina pod krivuljo je 1 ali 100%.• Povprečje = mediana = modus = 0.
Nekaj primerov rabe …
Izmerili smo SDM 1000 deklic. M = 125 cm in SD = 5 cm.
cm
cm
cmcm
9.1371.112)0.5(58.2125%99
8.1342.115)0.5(96.1125%95
130120)0.5(0.1125%68
−=⋅±=−=⋅±=−=⋅±=
VPR: Koliko deklic skoči znotraj [120, 130] cm?
ODG: 1000·(0.68) = 680
13
Nekaj primerov rabe …
Izmerili smo SDM 1000 deklic. M = 125 cm in SD = 5 cm.
cm
cm
cmcm
9.1371.112)0.5(58.2125%99
8.1342.115)0.5(96.1125%95
130120)0.5(0.1125%68
−=⋅±=−=⋅±=−=⋅±=
VPR: Koliko deklic skoči izven [120, 130] cm?
ODG: 1000 ·(0.32) = 320
Nekaj primerov rabe …
Izmerili smo SDM 1000 deklic. M = 125 cm in SD = 5 cm.
cm
cm
cmcm
9.1371.112)0.5(58.2125%99
8.1342.115)0.5(96.1125%95
130120)0.5(0.1125%68
−=⋅±=−=⋅±=−=⋅±=
VPR: Koliko deklic skoči več od 130cm?
ODG: 1000 ·(0.16) = 160
Nekaj primerov rabe …
Izmerili smo SDM 1000 deklic. M = 125 cm in SD = 5 cm.
cm
cm
cmcm
9.1371.112)0.5(58.2125%99
8.1342.115)0.5(96.1125%95
130120)0.5(0.1125%68
−=⋅±=−=⋅±=−=⋅±=
VPR: Koliko deklic skoči manj od 120cm?
ODG: 1000 ·(0.16) = 160
14
Nekaj primerov rabe …
Izmerili smo SDM 1000 deklic. M = 125 cm in SD = 5 cm.
cm
cm
cmcm
9.1371.112)0.5(58.2125%99
8.1342.115)0.5(96.1125%95
130120)0.5(0.1125%68
−=⋅±=−=⋅±=−=⋅±=
VPR: Koliko deklic skoči izven [115.2, 134.8] cm?
ODG: 1000·(0.05) = 50
Nekaj primerov rabe …
Izmerili smo SDM 1000 deklic. M = 125 cm in SD = 5 cm.
cm
cm
cmcm
9.1371.112)0.5(58.2125%99
8.1342.115)0.5(96.1125%95
130120)0.5(0.1125%68
−=⋅±=−=⋅±=−=⋅±=
VPR: Koliko deklic skoči izven [112.1, 137.9] cm?
ODG: 1000·(0.01) = 10
Nekaj primerov rabe …
Izmerili smo SDM 1000 deklic. M = 125 cm in SD = 5 cm.
cm
cm
cmcm
9.1371.112)0.5(58.2125%99
8.1342.115)0.5(96.1125%95
130120)0.5(0.1125%68
−=⋅±=−=⋅±=−=⋅±=
VPR: Koliko deklic skoči manj od 130cm?
ODG: 1000·(0.84) = 840
15
Nekaj primerov rabe …
Izmerili smo SDM 1000 deklic. M = 125 cm in SD = 5 cm.
cm
cm
cmcm
9.1371.112)0.5(58.2125%99
8.1342.115)0.5(96.1125%95
130120)0.5(0.1125%68
−=⋅±=−=⋅±=−=⋅±=
VPR: Koliko deklic skoči manj od 112.1cm?
ODG: 1000·(0.005) = 5
Vrednotenje rezultatov
• Možni problemi:Kako vrednotiti rezultate skoka v daljino 1.
razreda devetletke? Kako vrednotiti rezultate teka na 80m? Kako vrednotiti poškodbe v nogometnem klubu? Kaj je boljše 5m skoka v daljino ali 8.1s v teku na 60m?
• Rešitve:• Percentili• Z-vrednost• T-vrednost
Percentili – standardna vrednost
• Je točka v procentnem sistemu [0, 1], ki razdvoji populacijo, ki ne dosega ali ravno dosega določen rezultat, od drugih.
• Primer: Če nekdo v SDM doseže 33. percentil, to pomeni, da 33% populacije dosega slabši rezultat od njega. In kar 67% boljšega.
• V rezultatu merjenja imamo vedno prišteto napako, zato včasih težko podamo rezultat v percentilih … raje v decilih/kvartilih.
• Percentile računamo enostavno:• SDM(160,158,130,112,112,112,100,99); P(100cm) = 2/8·100% = 25%,
SDM(112cm) = 3/8·100% ali 5/8·100% = 37.5% ali 62.5% = 62.5%• P(?) = 75%?...0.75·8 = 6…vrstni red rezultata…pogledamo v tabelo…130cm
16
Z-vrednost
• Je ocena surove vrednosti doseženega rezultata in je izražena z večkratniki SD.
• Z = -1…rezultat za -1SD odstopa od povprečja• Z = 3…rezultat za +3SD odstopa od povprečja• Z = 0…rezultat je isti kot povprečna vrednost
SD
MXZ
−=
Preračunavanje Z-vrednosti
Pod pogojem, da je porazdelitev spremenljivke normalna, lahko Z-vrednosti preračunavamo iz tabel.
• Poznamo Z-vrednost … koliko % vzorca je med M in Z?• Kolikšna je Z-vrednost, ki zajema določen % vzorca?• Poznamo Z-vrednost … kolikšen je njegov percentil?
T-vrednost• Podobno kot percentili, vendar izračunan iz Z-
vrednosti. Nekaterim je težko razumeti, da je 0 povprečje. Zato so sporazumno uvedli T-vrednost, ki ima domeno [0, 100], M = 50, SD = 10.
• Uporablja se za vrednotenje fitness testov (ŠVK).
5010 +⋅= ZT
17
Ponovitev
• Poznamo več tipov spremenljivk, ki imajo ob merjenju različne merske skale.
• Pomembno je slučajno izbrati vzorec, če je le možno.
• V statistiki je pomembno poiskati dobro mero za opis spremenljivke.
• Normalna porazdelitev spremenljivke nam nudi vrsto ugodnosti pri preračunavanju.
• Poznamo več metod direktne primerjave različnih spremenljivk.
• Če porazdelitev ni normalna se izvedejo transformacije ali izberejo neparametrične metode – o tem malo kasneje.
Predavanje 3:TESTIRANJE HIPOTEZ
Izvedeli boste:1. Kaj so osnovni pojmi testiranja hipotez?2. Tipi napak pri testiranju hipotez.3. Postopek testiranja hipotez.4. Interpretacija rezultatov.5. Testiranje povezanosti spremenljivk:
a) Povezanost,b) Linearna regresija – napovedovanje,c) Večkratna linearna regresija,d) Parcialna korelacija.
6. Testiranje povprečnih vrednosti:a) T-TEST
I. Neodvisni vzorci,II. Odvisni vzorci,
b) Analiza variance:I. 1-way, 2-way ANOVA, M-way ANOVA, RM ANOVA.
c) Analiza kovariance.
18
Vrste hipotez
• Raziskovalna ali znanstvena• Je raziskovalčeva domneva o rezultatu testa.• Do domneve pridemo na osnovi študija literature,
prejšnjih raziskovalnih izkušenj, …• Dečki in deklice imajo enako energijsko bilanco.
• Statistična• Le orodje za dokazovanje raziskovalne hipoteze.• Mnogokrat pride do zamenjave med raziskovalno in
statistično. Pravi raziskovalec mora to ločit.• Postopek testiranja sorazmerno enostaven, čeprav
veliko statističnih testov.• Dečki in deklice pojedo enako kalorično vrednost hrane in
pijače.• Dečki in deklice so gibalno/športno enako aktivni.
Raziskovalnahipoteza
Statističnahipoteza
Zbiranjepodatkov
Statističnizaključek
Raziskovalnizaključek
Statističnahipoteza
Zbiranjepodatkov
Statističnizaključek
Statističnahipoteza
Zbiranjepodatkov
Statističnizaključek
Ničelna in alternativna hipotezaSta obe statistični hipotezi. Sta plod raziskovalne
hipoteze.• Ničelna hipoteza (H0)
• Dogovorno je to stavek, ki pravi, da ni razlik oz. povezave med spremenljivkami.
• Drži, da je H0 TRUE dokler tega ne ovržemo.• H0: µ1 = µ2 ali µ1 – µ2 = 0 ali …• H0: Med spoloma ni razlik v količini gibanja
• Alternativna hipoteza (HA)• Logična posledica, če je H0 FALSE.• Torej če uspemo H0 ovreči, potem drži HA. Ne vemo pa
ničesar o sami razliki/povezanosti med spremenljivkami.• HA: µ1 – µ2 ≠ 0 ali µ1 ≠ µ2 ali …• HA: Dečki in deklice nimajo enako količino gibanja.
19
Napaka vzorčenja
• Vzorčenje lahko vpliva na rezultat testiranja hipotez.
• Je vedno prisotna, čeprav zelo posredna.• Raziskovalec se mora odločit, kdaj je
napaka prevelika in tako odločilno vpliva na rezultat testiranja hipotez.• Če je verjetnost, da napaka vzorčenja vpliva
na rezultat majhna, potem mora še nekaj drugega vplivati na razlike med spremenljivkami.• Na primer neodvisna spremenljivka.
• Temu rečemo “prava razlika ali povezanost” med spremenljivkama.
Izračun statistične cenilke
• Glede na vrsto testa (povezanost, razlika) izračunamo ustrezno cenilko in jo primerjamo z normalno porazdelitvijo:• Verjetnost, da je vrednost večja od ±1.96·(SD) je 0.05 in
da je večja od ±2.58·(SD) je 0.01. Te meje so kar stopnja zaupanja – alpha.
• Preden nadaljujemo, še o napakah testiranja hipotez
Napaka tipa I in tipa II• Napaka tipa I - alpha
• Verjetnost, da ovržemo H0, če je v resnici TRUE.• To pomeni, da smo sprejeli HA misleč, da so razlike/povezanost
“prave”, vendar so bile zaradi napake vzorčenja.• Torej verjetnost napake tipa I zmanjšamo z manjšo alpho.• Alpha je tipično 0.05 ali 0.01 ali celo 0.001.
• VZROKI: merska napaka, nenaključni vzorec, previsoka alpha, vpliv merilca, neupravičena raba eno-smernega testa
• Napaka tipa II – beta• Verjetnost, da sprejmemo H0, če je v resnici FALSE.• To pomeni, da smo mislili, da so razlike/povezanosti zaradi napake
vzorčenja ampak so bile “prave”.• Torej, z zmanjševanjem alphe zmanjšamo verjetnost napake tipa I
ampak povečamo verjetnost napake tipa II.• Testiranje novega zdravila: Bolj pomembno je, da smo konzervativni pri
odločitvi. Zato zmanjšamo alpho in s tem povečamo beto.• Testiranje novih obuval: Ni potrebe po konzervativnosti, zato raje
povečamo alpho in s tem zmanjšamo beto..• VZROKI: merska napaka, premajhen N, prenizka alpha, nepravilno
izvedena intervencija
• Tipično je beta:alpha = 4:1
20
Napaka tipa I in tipa II
H0 TRUE H0 FALSE
Zavržemo H0 Alpha – Tip I OK
Sprejmemo H0 OK Beta – Tip II
• Posledice napake tipa I:• Nepotrebne skrbi za zdravje ali stroški zdravljenja.• Program vadbe se izvaja, a ni učinkovit.• Na delovno mesto smo inštalirali pripomoček, ki ne bo koristil.
• Posledice napake tipa II:• Smo bolni in nismo zdravljeni !!!• Nismo se odločili za program treninga, ki bi bil učinkovit.
Postopek testiranja hipotez1. Postavi H0 in HA (primer za testiranje povprečnih vrednosti).
• H0: µ1 = µ2; HA: µ1 ≠ µ2
2. Izberi stopnjo zaupanja (alpha).• 0.05; 0.01; 0.001
3. Izberi primerno statistično metodo.• T-test za odvisne ali neodvisne vzorce; ANOVA; Pearson r; …
4. Izračunaj vrednost statistične cenilke.5. Definiraj kritična območja na grafu normalne porazdelitve
6. Odčitaj iz grafa normalne porazdelitve, če je statistična cenilka v kritičnem območju.
7. Sprejmi ali ovrzi H0.8. Postavi statistični zaključek testa.
Primer postopka testiranja hipotez (2-smerno)1. Postavi H0 in HA: H0: µkoš = µodb; HA: µkoš ≠ µodb2. Izberi stopnjo zaupanja (alpha): 0.053. Izberi primerno statistično metodo: T-test za neodvisne
vzorce4. Izračunaj vrednost statistične cenilke: t = 2.505. Definiraj kritična območja na grafu normalne porazdelitve:
tk <> [-1.96, 1.96]
6. Odčitaj iz grafa normalne porazdelitve, če je statistična cenilka v kritičnem območju: t = 2.50 > tk
7. Sprejmi ali ovrzi H0: Ovrzi H08. Postavi statistični zaključek testa: Razlika v navpičnem skoku
med košarkarji in odbojkarji (5cm) je statistično značilna (p = 0.037).
21
Dvo-smerni in eno-smerni test
• Dvo-smerni statistični test• Kadar raziskovalec ne more logično predpostaviti o
rezultatu testa, takrat vedno uporabi dvo-smerni test.• H0: Košarkarji skočijo enako visoko kot odbojkarji;• H0: Pet let stari dečki so enako visoki kot deklice;• H0: Povprečna starost profesorjev športne vzgoje je enaka
kot pisarniških delavcev v javni upravi.
• Eno-smerni statistični test• Kadar raziskovalec lahko logično predpostavi izid
raziskave, lahko uporabi eno-smerni test.• H0: Nogometaši tečejo enako hitro kot košarkarji.• H0: Gibalna aktivnost obeh spolov je enaka.
• Skratka: H0 pri uporabi eno-smernega testa zavržemo bistveno prej.
Primer postopka testiranja hipotez (1-smerno)1. Postavi H0 in HA: H0: µpred ≤ µpotem; HA: µpred > µpotem2. Izberi stopnjo zaupanja (alpha): 0.053. Izberi primerno statistično metodo: T-test za odvisne vzorce4. Izračunaj vrednost statistične cenilke: t =1.855. Definiraj kritična območja na grafu normalne porazdelitve:
tk <> [1.65, ∞]
6. Odčitaj iz grafa normalne porazdelitve, če je statistična cenilka v kritičnem območju: t = 1.85 > tk
7. Sprejmi ali ovrzi H0: Ovrzi H08. Postavi statistični zaključek testa: 20% zmanjšanje kajenja je
statistično značilnih pri p = 0.032.
Interpretacija statističnega testa
• “…obstaja statistična razlika med dvema skupinama (p = 0.043).”• Vedno moramo podati stopnjo tveganja (p), pri
kateri smo sprejeli hipotezo (p ≤ 0.05). Ni nujno, da je vedno pri ≤0.05, lahko je pri ≤0.10, ≤0.01, …
• Ne smemo uporabljati pridevnikov: “…je zelo značilna…” ali “…je skoraj značilna…”
• “…ne obstaja statistična razlika med dvema skupinama (p = 0.353).”• Tudi v tem primeru, ko ne uspemo pokazati
razlik/povezav, je potrebno podati stopnjo tveganja.• Morda za vas razlike niso pomembne, za nekoga
drugega (tipično industrijo) pa bodo.
22
Z uporabo računalnikov je nekoliko drugače
• Zgornji primer za primerjava povprečnih vrednosti dveh spremenljivk.
• Računalniški programi nam podajo rezultat statističnega testiranja hipoteze nekoliko drugače, ampak z vsemi bistvenimi elementi.
Znanstvena vs. Praktična statistična razlika• Znanstvena
• Pri dovolj velikem vzorcu je lahko že majhna razlika značilna.
• 6 mesečni program vadbe je statistično značilno znižal nivo holesterola za 2%.
• Praktična• Ne se vedno zanašat na uporabno vrednost statističnega
testa. Vedno poglej še absolutne ali relativne razlike oziroma povezave.
• Zelo pomembno je, da se raziskovalec drži šolskih pravil testiranja in interpretacije. Statistika nam je le toliko v pomoč, kot si to želimo. Držati se je potrebno pravil njene rabe in interpretacije rezultatov.
Velikost efekta (ES)
• Je standardizirana vrednost, ki ponazarja razliko povprečij obeh skupin, deljenega s standardno deviacijo.
><<
<
−−=
velik
srednjiES
majhen
ES
SDali
SDES
AVERAGECONTROL
...8.0
...8.02.0
...2.0
)()(
)(
21
)(
21 µµµµ
23
Testiranje povezanosti
• Korelacija• Je statistika, ki ovrednoti povezanost med
dvema spremenljivkama.
Korelacija• Je statistika, ki ovrednoti povezanost
med dvema spremenljivkama. Lahko je pozitivna ali negativna:
• Pozitivna• Dve spremenljivki sta pozitivno
povezani. Če se povečuje ena, se tudi druga.
• Moč mišic otrok je povezana z njihovo starostjo.
• Negativna• Dve spremenljivki sta negativno
povezani. Če se povečuje ena, se druga zmanjšuje.
• Moč mišic starostnikov je povezana z njihovo starostjo.
Korelacija
• Regresijska linija (če linearna -> premica)• linearna, eksponentna, logaritmična, dvojna-
eksponentna, polinomska, …• Predstavlja model odnosa med dvema
spremenljivkama. Se jo izračuna po metodi vsote najmanjših kvadratov napak.
24
Nekaj primerov korelacije
Korelacija
• Zahteve za statistično analizo• Absolutna, intervalna ali razmernostna merska
skala.• Pričakovati moramo linearni odnos med
spremenljivkama.• Obe spremenljivki morata biti linearno
povezani.• Obe spremenljivki morata imeti podobno
varianco (CV).
PEARSONOVA korelacija (r)
<≤
<≤−
−⋅−
⋅−=
∑ ∑ ∑ ∑∑ ∑ ∑
pozitivnar
korelacijeni
negativnar
r
YYNXXN
YXXYNr
...01
_...0
...01
))(())((
)()(2222
• Tipično nas zanimajo tri stvari• Kako močna je povezanost (r).
• r≤.25…nizka; .25<r≤.5…srednja; .5<r≤.75…dobra; .75<r≤ 1…visoka.
• Smer korelacije (pozitivna, negativna).• Ali je statistično pomembna (r > rK ?).
25
Primer postopka testiranja hipoteze1. Postavi H0 in HA: H0: r = 0; HA: r ≠ 0;2. Izberi stopnjo zaupanja (alpha): 0.053. Izberi primerno statistično metodo: Pearsonov korelacijskih
koeficient4. Izračunaj vrednost statistične cenilke: r = 0.9695. Definiraj kritična območja na grafu normalne porazdelitve:
rk <> [-0.878, 0.878]
6. Izračunaj, če cenilka (Pearsonov r) izven kritičnega območja: r = 0.969 > rk
7. Sprejmi ali ovrzi H0: Ovrzi H08. Postavi statistični zaključek testa: Obstaja statistično značilna
povezava med dvema spremenljivkama (p = 0.012).
Število prostostnih stopenj (df)
• Je največje število neodvisnih vrednosti spremenljivke (ang. Degrees of freedom), ki se lahko spreminjajo in pri tem:• Je sistem enolično določen• Vsak parameter lahko spremenimo, ne da bi
pri tem spremenili drug parameter• Primer: Srednje vrednosti treh (n) števil: Največ dve
lahko spreminjamo tako, da povprečje ostane enako (n-1).
Primer statističnega testa povezanosti• H0: Število zgibov in sklec ni povezanih
• (df) = N-2 = 5-2 = 3; p = 0.05; -> pogledamo v tabele
26
Tabela aliračunalnik
Determinacijski koeficient korelacije (r2) – Vennov diagram• Koliko imata obe spremenljivki skupnega !!
• V koliko odstotkih z variiranjem ene spremenljivke razložimo variiranje druge.
• Skupna varianca = 100·(r2)• Specifična varianca = 100·(1 – r2)
• Skupna varianca = 100·0.9692 = 94%• Specifična varianca = 100·(1 – 0.9692) = 6%• Izvor specifične variance: zgibi (moč stiska, moč upogibalk
komolca); sklece (moč iztegovalk komolca).
Odnos: vzrok-posledica
• Korelacijski koeficient ne podaja tega odnosa.
• Zato se ga velikokrat uporablja v preliminarnih raziskavah.
• V 2. fazi se potem izvede detajlnejša raziskava, ki določi vzrok in posledico.
27
Korelacijska matrika
• Je postopek prikazovanja množice korelacij.• Vsako spremenljivko z vsako.
• Pozor: še vedno so to le korelacije med dvema spremenljivkama!
• Ima zgornjo trikotniško obliko.
Ostale rabe korelacijskega koeficienta
• Študije ponovljivosti (kasneje o tem)• Med dvema meritvama znotraj istega dneva,
med različnima dnevoma, …
• Študije objektivnosti (kasneje o tem)• Med dvema merilcema, med dvema istima
merilnikoma, …
• Študije veljavnosti (kasneje o tem)• Med dvema različnima merilnikoma: tipično en
uveljavljen in drugi nov.
• Regresijsko modeliranja (v nadaljevanju)• Kako vplivanje na eno spremenljivko vpliva na
drugo.
Enostavna linearna regresija
• Regresija ~ napovedovanje• Enostavna ~ iz ene spremenljivke napovemo
drugo.• Linearna ~ s pomočjo regresijske premice• Za osnovo se uporabi korelacijski koeficient.
XY
Y
X
MbMa
SD
SDrb
Y
aXbY
⋅−=−
⋅=
+⋅=
preseciscey...
premiceresijskenaklon reg...
vrednostnapovedana'...
'
28
Poja
vnost
padce
v /
1000 p
reb.
Kako vemo, da je linearen odnos?
• Če odnos ni linearen lahko naredimo napako, ko izračunamo r in premico.
• Kako vemo?• Grafični pregled• Analitično (SPSS: Analyse -> Compare means –> Means):
• Eta-vrednost: Če eta-koeficient > Pearsonov r -> ni linearen odnos• ANOVA: Če podano značilno odstopanje od linearnosti
Bruto dohodek na prebivalca / EURStarost / Leta
Sm
rtnost
/ 1
000 p
rebiv
alc
ev
Primer: Enostavne linearne regresije
lbaXbY 184104252.3' =+⋅=+⋅=
Standardna napaka izračuna regresijske linije• “Standard error of estimate” (SEE)
• Je povprečna napaka regresijske linije• Podatki nikoli ali zelo redko ležijo na isti liniji. Vedno
nekoliko odstopajo. Razliki med vrednostjo, ki jo nam poda enačba linije in možnim odstopanjem od te vrednosti rečemo napaka izračuna (residual).
• Standardna pomeni, da je izražena v enotah SD.
• Naš prejšnji primer:
[ ][ ][ ]lblblb
lblblb
lblblb
lbrSDSEE
rSDSEE
Y
Y
215,1531258.2184%99
5.207,5.1601296.1184%95
196,172121184%68
1260.02080.01201
1
22
2
=⋅±==⋅±=
=⋅±==⋅=−⋅=−⋅=
−⋅=
29
95% intervali zaupanja
• 95% interval zaupanja regresijske linije (95% CI of the population mean)• Z verjetnostjo 95% je prava regresijska linija
znotraj teh intervalov (se tangencialno dotikajo).
• 95% interval zaupanja napovedi (95% CI of the predicted values)• Z verjetnostjo 95% so vsi
podatki znotraj tega intervala.
• Se poročata!
Previdnost pri korelaciji in regresiji• Če ima predikcijska spremenljivka (X) majhen
razpon, potem je težko napovedovati.• Otežena uporaba v zelo homogenih skupinah.
• Razpon vrednosti spremenljivke naj bo po celotnem območju – z enako gostoto.
• “Outlier” lahko zelo popravijo r, kar je nerealno.• Poleg povprečja in SD se spodbuja tudi podajanje celega
razpona spremenljivk, predvsem v študijah, ki računajo povezanost.
• Imej dovolj velik N• Korelacija pri N = 2 bo vedno r = 1!
• Cilj naj bo visok r in nizek SEE. Torej, vedno preverjaj tudi SEE.
• Visok SEE (npr. 40mg/100ml) ob povprečju 215mg/100ml nebi zanesljivo podal predikcijo. Pri nekaterih (1%) bi bilo odstopanje celo 2.58·40mg/100ml, kar je preveliko.
• Je način predikcije ene spremenljivke na osnovi večih drugih.• Tipično je taka predikcija bolj natančna, kot na osnovi ene.
• Enačba predikcije:
• Primer: Faktorji, ki vplivajo na pojavnost kroničnih bolezni srca in ožilja:
Večkratna linearna regresijska analiza (R)
4321
4
3
2
1
332211
5.01.002.0135'
trebuhaObseg...
stresaOcena ...
dan gibanja naKolicina ...
dan cigaret na #...
boleznisrcne Kronicne'...
...'
XXXXY
X
X
X
X
Y
XbXbXbaY
⋅+⋅+⋅−⋅+=
+⋅+⋅+⋅+=
30
Vennov diagram večkratne linearne regresije
Primer 1 Primer 2
Posamezni prispevki k R
• Z večanjem števila prediktorjev se veča R in z njim količina pojasnjene variance.• Vendar, do kje lahko povečujemo število
prediktorjev?
Koliko je lahko prediktorjev?
• Danes računalnik sam dodaja prediktorje toliko časa, dokler ne prispevajo več pomembnih deležev k R.
• Smiselno je dodajati le prediktorje, ki merijo nekaj unikatnega in tako lahko najbolj prispevajo k pojasnjeni varianci.
• Primer:
• Velja dogovor da mora biti na vsak dodan prediktor cca 10 merjencev.
• Torej za 3 prediktorje naj bo 30 merjencev.
31
Interpretacija večkratne linearne regresije
• Predikcija je dobra le za podobno populacijo, kot je bila pri postavitvi modela.
• Vsaj 100 predikcijskih enačb obstaja za izračun telesne maščobne mase na osnovi kožnih gub.
• Bile so narejene na različnih populacijah (otroci/odrasli/starostniki, moški/ženske, različne rase, različne točke merjenja kožne gube, …).
• Dober regresijski model oziroma natančno predikcijo bomo dobili le v primeru, da bomo natančno izmerili predikcijske spremenljivke:
• Potrebno izločiti očitne osamelce.• Morajo biti normalno porazdeljene• Vsi residuali spremenljivke moraj imeti enako končno varianco
(ang. “homoscedasticity”). (1 < Durbin-Watson test < 3)• Ne smejo biti multikolinearne…jih primerjamo le z odvisno
spremenljivko in ne med sabo. Ne dodajo nič k skupnemu modelu. (VIF < 10 (oz. 2))
• Ne smejo biti singularne…to pomeni, da je ena spremenljivka izračunana direktno iz druge (r = 1).
Parcialna korelacija
• Kadar želimo popraviti korelacijo dveh spremenljivk na račun izločitve variance tretje spremenljivke.• r12,3 …korelacija med X1 in X2, kjer je vpliv X3
izločen – fiksiran na konstanto.• Lahko tudi fiksiramo več spremenljivk … r12,345
• Rezultat je bolj “čista” korelacija.• Recimo, da želimo preveriti povezanost med časom
maratona in VO2max. Izračunamo Pearson r.• Vendar vemo, da ima tudo %FM nekaj pri tem.
Maratonci z manj %FM imajo višji VO2max in tudi tečejo maraton hitreje.
• Če Pearson r12 = 0.60 -> r12,3 = 0.50• Ponavadi se s tem posegom r zmanjša.
Primer parcialne koleracije
• Vemo, da pri otrocih raste znanje pri matematiki. Ampak tudi njihova stopala rastejo. Zato bi dobili pozitivno korelacijo med dolžino stopala in znanjem matematike. V zaključku: daljšo kot imaš stopalo, več znaš matematike.
• Potrebno odstraniti efekt starosti !
• X1…znanje matematike• X2…velikost noge• X3…starost• r12 = 0.80; r13 = 0.90; r23 = 0.88
039.011 2
232
13
2313123,12 =
−⋅−⋅−=
rr
rrrr
32
Logistična regresija (logit)
• Je metoda napovedovanja binarnega izzida na osnovi večih prediktorjev, ki so lahko tudi nominalni.
• Predikcija zmage na volitvah, na osnovi: spola ljudi, nacionalnosti, porabljenega denarja za kampanjo, ...
• Predikcija obolevnosti z rakom, na osnovi: izobrazbe, spola, starosti, delovnega mesta, ...
• Predikcija nakupa nekega izdelka, na osnovi ...
• Se veliko uporablja v medicini (epidemiologiji) in socialnih – političnih znanostih.
Logistična regresija (logit)
• Izhod logistične funkcije je vedno na [0, 1]
• Kjer je vhod (z), definirana kot linearna kombinacija regresijskih koeficientov in vhodnih spremenljivk:
• Na vsakih 10 zapisov lahko en prediktor več.
Primer logistične regresije•
33
Testiranje povprečnih vrednosti
• Inferenčna statistika• Ko želimo napovedati povprečje celotne populacije iz
povprečja vzorca.
• T-test• William Sealy Gossett (1876-1937), ki je delal pod
psevdonimom “Student”, je avtor Studentovega t-testa. Uporaba:
• Če vemo povprečje populacije in je povprečje vzorca dovolj daleč stran – ni v intervalu zaupanja 5% - lahko sklepamo dvoje: (i) vzorec ni bil naključno izbran; (ii) vzorec je bil naključno izbran a na njega deluje efekt, ki ne deluje na populacijo.
• Če primerjamo povprečja dveh vzorcev in se razlikujeta, lahko sklepamo dvoje: (i) vzorca nista bila naključno izbrana iz populacije; (ii) vzorca sta bila naključno izbrana, a je na vsaj enega deloval nek efekt in povzročil razlike v povprečjih.
Razlika med Z-testom in t-testom
• Če poznamo µ (povprečje celotne populacije) in σ(standardna deviacija celotne populacije): izračunamo pravo standardno napako povprečja celotne populacije (σM):
• Če ne poznamo σ: izračunamo predvideno standardno napako povprečja vzorca populacije (SE):
• Potem izračunamo verjetnost, da je vzorec reprezentativen populaciji, na osnovi cenilk iz:
• Z-test
• T-test
NM
σσ =
N
SDSEM =
M
M
SE
Xt
XZ
µσ
µ
−=
−=
T-test enega vzorca• Primerjava vzorca na populacijo• Je enostavno razmerje med dejansko razliko
povprečij vzorca in populacije s pričakovano razliko povprečij vzorca in populacije.• Pričakovana razlika: tisto, ki jo lahko pričakujemo, da
nastane le kot slučajno. Imenujemo jo standardna napaka povprečij.
• Interpretacija t-vrednosti• Število prostostnih stopenj: df = N – 1• Ob izračunanem df in izbranem eno- ali dvo- smernem
testu, preverimo v tabeli t-porazdelitve:• Če t ≥ tmejna -> zavržemo H0 in sprejmemo H1.• Če t < tmejna -> sprejmeno H0.
N
SDX
SE
Xt
M
µµ −=−=
34
Tabela Z- in t- porazdelitve
Predpostavke t-testa• Predpostavke:
• Populacija iz katere vzamemo vzorec mora biti normalno porazdeljena.
• Vzorec je naključno izbran iz populacije;• Če primerjamo dva vzorca … morata biti oba naključno
izbrana in imeti enako varianco (homogenost variance).• Podatki morajo biti parametrični (intervalni ali razmernostni).
• Če jih ne dosežemo:• T-test je zelo robusten test, kar pomeni, da ne rabijo biti
nujno uresničene vse predpostavke.• Uporabimo konzervativnejše meje p=0.01 raje kot p=0.05.• Uporabimo transformacijo podatkov v normalne in
homogene.• Uporabimo druge teste – neparametrične teste.
Primer• Študenti niso dovolj usposobljeni za igro odbojke po 5-tedenskem praktikumu,
kjer igrajo le odbojko.• Naključno izberemo študente v vzorec (npr. po abecedi)• Izberemo standardiziran odbojkarski test servisa (1…min, 50…maks). Ugotovimo,
da je povprečje na 1000 študentih 31 točk in standardna deviacija je 7.5 točk.• Populacija: nadaljuje obstoječe usposabljanje.• Vzorec (N=30): vsako uro 20 minut vadbe servisa.• H0: Število točk standardiziranega testa servisa se ne bo značilno razlikovalo pri
študentih, ki bodo imeli specifični trening servisa.• Izmerimo in izračunamo…
92.237.1
3135
37.130
5.7
tock8.3
tock35
tock7.5
tock31
=−=−=
===
==
==
M
M
XZ
N
SD
X
σµ
σσ
σµ
63.252.1
3135
52.130
3.8
tock8.3
tock35
neznan
tock31
=−=−=
===
==
==
M
M
SE
Xt
N
SDSE
SD
X
µ
σµ
Pogledamo v tabelo: Z > 2.58Zavržemo H0, sprejmemo H1,pri p < 0.01
Pogledamo v tabelo: df = 30 – 1 = 29; t > 2.045H0 zavržemo, H1 sprejmemopri p < 0.05
35
T-test dveh neodvisnih vzorcev(N1 = N2 = N)
• Neodvisni vzorec• V vsakem vzorcu so drugi subjekti in niso nikakor povezani
(korelalirani) s subjekti v drugem vzorcu.• Strogo kontrolirani pogoji
• Razlika med dvema vzorcema mora biti le v enem faktorju.• Običajno jih označimo kot kontrolna skupina in eksperimentalna
skupina.
• Pre-test med povprečjema obeh vzorcev ni značilen, pomeni, da sta oba vzorca pravilno – naključno izbrana.
• Post-test med povprečjema obeh vzorcev je značilen, pomeni, da je efekt značilno vplival na povprečje vzorcev.
Vzorec Število Pre-test Faktor Post-test
Kontrolna N Da Ne Da
Eksperimentalna N Da Da Da
Standardna napaka razlike
• IZREK: Če sta oba vzorca naključna, porazdeljena normalno, bo tudi razlika posameznih vrednosti porazdeljena normalno.
• Standardna napaka razlike (SED)• Je količina razlike povprečij dveh vzorcev, ki jo
lahko še pričakujemo kot posledico naključja.
22
21 )()( MMD SESESE +=
T-vrednost dveh neodvisnih vzorcev• Je razlika povprečij dveh vzorcev, deljena s
standardno napako razlike.
• Če t-vrednost preseže mejno vrednost pri izbranem p in df, potem ovržemo H0 in sprejmemo H1.• T-test ne poda vzroka razlike, za kar je potreben skrbno
zasnovan in kontroliran poskus:• Če je kontrolna skupina prepuščena le naključnim vplivom in
eksperimentalna skupina naključnim vplivom + enemu izbranemu faktorju, potem lahko zaključimo, da izbrani faktor vpliva na povprečje eksperimentalne skupine, tako da njeno povprečje ni več reprezentativno povprečje populacije.
DSE
XXt 21 −=
36
Interpretacija t-vrednosti
• Tabele ali računalnik• Izračun prostostnih stopenj:
• Če N1 = N2 -> df = 2N1 - 2
• Potem pogledamo v tabelo za izračunano t-vrednost in za izračunan df ter vidimo, če t-vrednost preseže mejno t-vrednost za izbran p.
• Računalnik nam sam izpiše stopnjo značilnosti razlik – p.
)1()1( 21 −+−= NNdf
Primer• Ali ima 10-minutno predavanje o metu na koš vpliv na učinkovitost prostega
meta na koš?• Naključno izberemo 100 študentov in jih tudi naključno razdelimo v 2 skupini po
50 (npr. soda in liha zaporedna števila).• Kontrolna skupina je poslušala 10-minutno predavanje o obrambni igri, se ogrela
v 5 minutah in izvedla 20 prostih metov.• Eksperimentalna skupina je poslušala 10-minutno predavanje o tehnikah metanja
žoge na koš, se ogrela v 5 minutah in izvedla 20 prostih metov.• H0: Število doseženih točk iz prostih metov se ne razlikuje med skupinama.• Izmerimo in izračunamo…
38.050
7.2
tocke7.2
tock5.9
50
11
1
1
1
===
==
=
N
SDSE
SD
X
N
M
Pogledamo v tabelo: df = (50-1)+(50-1) = 98 (ne obstaja v tabeli, zato prvo nižjo vrednost df = 60); |t| < 1.671 pri p = 0.10, zato sprejmemo H0.
45.050
2.3
tocke2.3
tock3.10
50
22
2
2
2
===
==
=
N
SDSE
SD
X
N
M
36.159.0
3.105.9
59.045.038.0)()(
21
2222
21
−=−=−=
=+=+=
D
MMD
SE
XXt
SESESE
T-test dveh neodvisnih vzorcev(N1 ≠ N2)
• Ponavadi nimamo enakih N vzorcev• Liho število preiskovancev.• Pride do izpada (bolezen, poškodba, nezainteresiranost,
motivacija) (ang. mortality).• Moramo podatek kakšnega izločiti zaradi prevelikih
odstopanj.• Napaka merilnega instrumenta.
• Potrebni popravki formul• Prostostne stopnje ni potrebno.• Standardno napako razlike je potrebno
+⋅
−+⋅−+⋅−=
2
11
2
)()1()()1(
121
222
211
NNNN
SDNSDNSED
37
Primer• Ali obstajajo razlike mod spoloma v gibljivosti zadnjih stegenskih in spodnjih
hrbtnih mišic?• Izberemo sit & reach test in naredimo test na 10 moških preiskovancih in 8
ženskih preiskovankah.• H0: Med spoloma ne obstajajo razlike v gibljivosti zadnjih stegenskih in spodnjih
hrbtnih mišic.• Izmerimo in izračunamo…
cmSD
cmX
N
5.2
5.22
10
1
1
1
==
=
Pogledamo v tabelo: df = (10-1)+(8-1) = 16; |t| > 2.120 pri p = 0.05, zato ovržemo H0 in sprejmemo H1.
cmSD
cmX
N
0.3
6.25
8
2
2
2
==
=
40.229.1
6.255.22
29.18
1
10
1
2810
0.3)18(5.2)110(
21
22
−=−=−=
=
+⋅
−+⋅−+⋅−=
D
D
SE
XXt
SE
T-test odvisnih vzorcev (N1 = N2)
• Odvisna vzorca• Sta vzorca med katerima obstaja povezava. To pomeni, da
isti vzorec testiramo dva-krat.• Rezultat v drugem poskusu je delno odvisen od rezultata v
prvem poskusu.• Ang. repeated measures design ali within comparison
• Pričakovana razlika med dvema vzorcema (poskusoma) je manjša kot pri neodvisnih vzorcih• Logično je, da se isti vzorec manj razlikuje med dvema
meritvama, kot dva različna vzorca med dvema meritvama.• Ob uporabi t-testa za neodvisne vzorce, lahko pridemo do
napačnih zaključkov: da ni pomembnih razlik med dvema meritvama, čeprav le-te so.
Uporaba t-testa odvisnih vzorcev
• Kadar imamo težavo dobiti dovoljšnje število preiskovancev.
• Kadar pričakujemo majhne razlike zaradi pravega efekta.• Isti vzorec merjen dva-krat (pre-post primerjava).• Primerjava tako imenovanih “testnih dvojčkov”.
• Preiskovance razdelimo v kontrolno in eksperimentalno skupino šele po pre-test meritvi.
• ABBA tehnika deljenja preiskovancev: najboljši rezultat v kontrolno skupino, drugi najboljši v eksperimentalno, četrti v kontrolno, tretji v eksperimentalno, …
• Podobne preiskovance razdelimo v kontrolno in eksperimentalno skupino tako, da v pre-testu med skupinama ni pomembnih razlik.
• Potem dovolimo delovanje efekta na eksperimentalno skupino in testiramo razlike povprečij med skupinama v post-testu.
• Prostostne stopnje = Nparov - 1
38
Povezani vzorci
• Povezava med rezultati vzorca pred in po intervenciji je ponavadi pozitivna (r > 0).
• Tisti, ki teče hitreje na začetku bo tudi na koncu.• Tisti, ki je bolj motiviran na začetku, bo tudi na koncu
motivacijskega predavanja.
• Tako lahko spregledamo pomembne razlike, če jih gledamo kot neodvisne vzorce.
• Popravimo formulo za izračun standardne napake razlike
• Ta formula je splošnejša, od tiste, ki jo poznamo pri neodvisnih vzorcih, vendar tam ponavadi kar predpostavimo r = 0.
)()(2)()( 212
22
1 MMMMD SESErSESESE ⋅⋅−+=
Primer• Ali 3-tedenski trening moči nog izboljša višino navpičnega skoka?• N = 30 študentov; Repeated measures design: Nparov = 30; r = 0.60; df =
Nparov – 1 = 29.• Opravimo pre-test meritev in po tri-tedenskem treningu moči nog še post-test
meritev.• H0: Tri-tedenski trening moči ne vpliva na višino navpičnega skoka.• Izmerimo in izračunamo…
9.0
15
: testpre
1
1
==
MSE
cmX
Pogledamo v tabelo: df = 29; |t| < 1.697 pri p = 0.10; zato sprejmemo H0
5.1
5.17
:post test
2
2
==
MSE
cmX
43.175.1
5.1715
75.1)()(
21
22
21
−=−=−=
=+=
D
MMD
SE
XXt
SESESE
Ne izvedemo korekcije povezanih vzorcev Izvedemo korekcijo povezanih vzorcev
08.220.1
5.1715
20.12)()(
21
212
22
1
−=−=−=
=⋅⋅⋅−+=
D
MMMMD
SE
XXt
SESErSESESE
Pogledamo v tabelo: df = 29; |t| > 2.045 pri p = 0.05; zato ovržemo H0 in sprejmemo H1.
Velikost efekta - moč razlike(ang. Effect size)• Ne smemo biti zadovoljni, če dokažemo
statistično značilnost razlik med skupinama pri izbranem p.• Lahko so razlike kljub temu zelo majhne … lahko celo
zanemarljive.• Ob dovolj velikem N in dovolj majhni SD, lahko
dokažemo obstoj statističnih razlik v prav vsaki spremenljivki.
• Zato je potrebno omeniti tudi praktično značilnost razlik.• Poznamo več metod za dodatni opis praktične
pomembnosti (velikost efekta) razlik.• ω2-vrednost• ES … effect size• % sprememb
• Uporaba predvsem za detajlnejši opis statističnih analiz.• V primerih, ko je meja pomembnosti za malo zgrešena, na
primer pri p = 0.06
39
ω2-vrednost
• ω2-vrednost določa praktično pomembnost (uporabnost) razlik med dvema vzorcema.• Je izražena v % celotne variance (razlike med
povprečjema vzorcev), ki ja lahko izrazi neodvisna spremenljivka – pravi faktor.
1
1
212
22
−++−=
NNt
tω
Primer• Ali obstajajo razlike mod spoloma v gibljivosti zadnjih stegenskih in spodnjih
hrbtnih mišic?• Izberemo sit & reach test in naredimo test na 10 moških preiskovancih in 8
ženskih preiskovank.• H0: Med spoloma ne obstajajo razlike v gibljivosti zadnjih stegenskih in spodnjih
hrbtnih mišic.• Izmerimo in izračunamo…
cmSD
cmX
N
5.2
5.22
10
1
1
1
==
=
Pogledamo v tabelo: df = (10-1)+(8-1) = 16; |t| > 2.120 pri p = 0.05, zato ovržemo H0 in sprejmemo H1.
cmSD
cmX
N
0.3
6.25
8
2
2
2
==
=
40.229.1
6.255.22
29.18
1
10
1
2810
0.3)18(5.2)110(
21
22
−=−=−=
=
+⋅
−+⋅−+⋅−=
D
D
SE
XXt
SE
21.01810)4.2(
1)4.2(2
22 =
−++−−−=ω
21% razlike (med spoloma) v gibljivosti zadnjih stegenskih in spodnjih hrbtnih mišic je pojasnjenih zaradi spola samega. 79% pojasnjenosti je potrebno iskati drugje (zgodovina vadbe, ...)
Interpretacija ω2-vrednosti
• 100%·ω2-vrednost pove, kolikšen del razlike je pojasnjene z neodvisno spremenljivko – pravim faktorjem.
• Koliko je dovolj za ω2-vrednost?• Ni statistične metode, ki bi to definirala.• Vsak raziskovalec se mora sam odločiti.
• Očitno na gibljivost v kolku ne vplivajo le gibljivost (razteznost) mišic, temveč tudi oblika sklepov, tetive, …
40
Velikost efekta (ES-vrednost) (ang. effect size)• Je druga metoda za določanje praktične
pomembnosti razlik med vzorcema.
• V imenovalcu je SD kontrolne skupine. Ker ni bila kontaminirana z vplivom pravega efekta. Če je nismo imeli, potem pa skupna SD eksperimentalne skupine.
.
21
kontrSD
XXES
−=
Primer• Ali obstajajo razlike mod spoloma v gibljivosti zadnjih stegenskih in spodnjih
hrbtnih mišic?• Izberemo sit & reach test in naredimo test na 10 moških preiskovancih in 8
ženskih preiskovank.• H0: Med spoloma ne obstajajo razlike v gibljivosti zadnjih stegenskih in spodnjih
hrbtnih mišic.• Izmerimo in izračunamo…
cmSD
cmX
N
5.2
5.22
10
1
1
1
==
=
Pogledamo v tabelo: df = (10-1)+(8-1) = 16; |t| > 2.120 pri p = 0,05, zato ovržemo H0 in sprejmemo H1.
cmSD
cmX
N
0.3
6.25
8
2
2
2
==
=
40.229.1
6.255.22
29.18
1
10
1
2810
0.3)18(5.2)110(
21
22
−=−=−=
=
+⋅
−+⋅−+⋅−=
D
D
SE
XXt
SE
21.01810)4.2(
1)4.2(2
22 =
−++−−−=ω
21% razlike (med spoloma) v gibljivosti zadnjih stegenskih in spodnjih hrbtnih mišic je pojasnjenih zaradi spola samega. 79% pojasnjenosti je potrebno iskati drugje.
88.05.3
6.255.22 −=−=ES
Interpretacija ES
• Tudi za ES-vrednost ni statistične metode, ki bi povedala koliko je dovolj za praktično uporabnost.• Vsak raziskovalec, naj bi sam določil. Primer:
• ES ≤ 0.2 … male razlike• 0.2 < ES ≤ 0.8 … srednje razlike• ES ≥ 0.8 … velike razlike
41
% sprememb
• Tipično uporaba pri odvisnih vzorcih –zaporednih meritvah (repeated measures).• X1 povprečje pre-testa.• X2 povprečje post-testa.
1
12%100sprememb %X
XX −⋅=
Primer• Ali 3-tedenski trening moči nog izboljša višino navpičnega skoka?• N = 30 študentov; Repeated measures design: Nparov = 30; r = 0,60; df =
Nparov – 1 = 29.• Opravimo pre-test meritev in po tri-tedenskem treningu moči nog še post-test
meritev.• H0: Tri-tedenski trening moči ne vpliva na višino navpičnega skoka.• Izmerimo in izračunamo…
9.0
15
:_
1
1
==
MSE
cmX
testpre
Pogledamo v tabelo: df = 29; |t| < 1.697 pri p = 0,10; zato sprejmemo H0
5.1
5.17
:_
2
2
==
MSE
cmX
testpost
43.175.1
5.1715
75.1)()(
21
22
21
−=−=−=
=+=
D
MMD
SE
XXt
SESESE
Ne izvedemo korekcije povezanih vzorcev Izvedemo korekcijo povezanih vzorcev
08.220.1
5.1715
20.12)()(
21
212
22
1
−=−=−=
=⋅⋅⋅−+=
D
MMMMD
SE
XXt
SESErSESESE
Pogledamo v tabelo: df = 29; |t| > 2.045 pri p = 0,05; zato ovržemo H0 in sprejmemo H1.
%67.1615
155.17%100%100%
1
12 =−⋅=−⋅=X
XXsprememb
Analiza variance – ANOVA (ang. Analysis of variance)• Je parametrična statistična metoda za primerjavo
povprečij treh ali več vzorcev/skupin podatkov.• F-vrednost je razmerje variabilnosti med skupinami (ang. between
group) z variabilnostjo znotraj skupin (ang. within group).
• Če je variabilnost med skupinami večje od variabilnosti znotraj skupin, kot to lahko pričakujemo zgolj zaradi naključja, potem je vsaj eden od vzorcev različen od ostalih.
• H0: µ1 = µ2 = µ3 = … = µM
• Če je F-vrednost > Fmejna potem je vsaj eno povprečje različno od ostalih.
• Poznamo več tipov analiz variance:• 1-way ANOVA, 2-way ANOVA, M-way ANOVA, Repeated measures
ANOVA, ANCOVA, MANOVA
variancegroup within oferror
variancegroup between oftreatment =F
42
1-way ANOVA
• Primerja povprečja odvisne spremeljivke dveh ali več vzorcev ob delovanju ene neodvisne spremenljivke (faktorja).
• Primerjava višine navpičnega skoka športnikov dveh (ali več) športov.
• Ne moremo večkratno uporabiti t-test, ker isto povprečje primerjamo večkrat in se napaka sešteva.
• Računanje je kompleksno• Veliko število korakov.• Obstaja ogromno računalniških programov, zato
si raje poglejmo tipični primer…
Primer
( ) ( ) ( )
( )
W
B
W
WW
B
BB
TTGROUPTWGROUPB
WBT
GROUPW
T
TB
MS
MSF
df
SSMS
df
SSMS
NdfNNdfNdf
SSSSSS
XXSS
n
X
n
X
n
XSS
=
==
−=−=−=+=
−=
−++=
∑∑
∑∑∑
;
1 ; ;1
...
2
2
5
2
5
1
2
1
Fiziološki odziv ob uporabi vojaške uniforme:
X1…VO+jopičX2…VO+jopič+čelada+RKBOX3…VO+čeladaX4…VO+jopič+čeladaX5…vojaška oprema (VO)
1-way ANOVA ouptut:
Interpretacija F-vrednosti
• Tabela ali računalnik• Iz tabele razberemo, pri katerem
p lahko sprejmemo/ovržemo H0.• Računalnik pa nam kar takoj poda
p-vrednost in se potem odločimo ali jo sprejmemo ali ne.
• Prejšnji primer: F = 8.03; ovržemo H0 pri p < 0.01
43
“Post-hoc” testi• Scheffe: cenilka FSCHEFFE
• Lahko primerja vse možne kombinacije.• Najbolj konzervativen test.
• Ga uporabimo, ko želimo primerjati ali štiri vrste vadbe značilno odstopajo od kontrolne skupine.
• Narišemo tabelo razlik FSCHEFFE med skupinama:
Group 1 Group 2 Group 3 Group 4 Group 5
Group 1 0.00 2.57* 0.29 1.00 0.86
Group 2 0.00 2.86** 1.57 3.43**
Group 3 0.00 1.29 0.57
Group 4 0.00 1.86
Group 5 0.00* P<0.05** P<0.01
Group 5 Group 3 Group 1 Group 4 Group 2
4.43 5.00 5.29 6.29 7.86
“Post-hoc” testi• Tukey: cenilka HSD
• Lahko primerja le paroma (ang. pairwise).• Manj konzervcativen test ... Prej sprejme razlike kot
značilne.• HSD cenilka pove minimalno razliko med povprečnima
vrednostima, da ju lahko smatramo kot statistično značilne.
• V prejšnjem primeru:• Po HSD je group 2 različna od group1 pri p < 0.01• Po SCHEFFE je group 2 različna od group1 pri p < 0.05
Group 1 Group 2 Group 3 Group 4 Group 5
Group 1 0.00 2.57** 0.29 1.00 0.86
Group 2 0.00 2.86** 1.57 3.43**
Group 3 0.00 1.29 0.57
Group 4 0.00 1.86
Group 5 0.00* P<0.05** P<0.01
Kdaj izvesti post-hoc test?
** ***
* različen od Group 2 pri p < 0.05** različen od Group 2 pri p < 0.01
• Najprej F-test (ANOVA), da vidimo, če so razlike med povprečji skupin.• Če F-test ni značilen, ne delamo post-hoc testov.• Če F-test značilen nas morajo zanimati post-hoc testi.
• Če nas zanimajo kombinacije med množicami skupin, izberemo Scheffe post-hoc test.
• Če nas zanimajo razlike med posameznimi pari, izberemo Tukey post-hoc test.
44
Velikost efekta – moč razlike(ang. Effect size)• Ne smemo biti zadovoljni, če dokažemo
statistično značilnost razlik med skupinami pri izbranem p.• Lahko so razlike kljub temu zelo majhne … lahko celo
zanemarljive.• Ob dovolj velikem N in dovolj majhnem MSW, lahko
dokažemo obstoj statističnih razlik v prav vsaki spremenljivki, pa če so razlike še tako majhne.
• Zato je potrebno omeniti tudi praktično značilnost razlik.• Zato izračunamo effect size, ki nam poda praktičnost
razlik, in sicer neodvisno od velikosti vzorca.• Poznamo več metod za dodatni opis praktične
pomembnosti razlik.• R2-vrednost• ω2-vrednost
R2-vrednost moči razlike/efekta
• R2 je razmerje med varianco zaradi efekta samega in celokupno varianco (včasih imenovana tudi eta-squared).
• Je najenostavnejši test, ki grobo oceni praktično vrednost razlike.
• Zavzame vrednosti med 0 in 1, oziroma med 0 in 100%.• Primer vojaškega jopiča:
• To pomeni, da je 52% variance napora odvisno od dodatne vojaške opreme. Ostalih 48% pojasnjenosti, pa je potrebno iskati drugje.
T
B
SS
SSR =2
52.017.98
74.502 ===T
B
SS
SSR
ω2-vrednost moči razlike/efekta
• ω2 je bolj natančna mera velikosti efekta, predvsem ker upošteva tudi nepojasnjeno varianco in je bolj konzervativna mera od R2. Ponavadi poda manjšo vrednost od R2.
• Zavzame vrednosti med 0 in 1, oziroma med 0 in 100%.• Vrednosti pod 0.01 so majhni, okrog 0.06 srednji, nad 0.15
pa veliki efekti.• Primer vojaškega jopiča:
• To pomeni, da je 45% variance napora odvisno od dodatne vojaške opreme. Ostalih 55% pojasnjenosti, pa je potrebno iskati drugje.
WT
WB
MSSS
MSkSS
+⋅−−= )1(2ω
45.058.117.98
)58.1()15(74.50)1(2 =+
⋅−−=+
⋅−−=WT
WB
MSSS
MSkSSω
45
Pomen izračuna velikosti efekta
• Danes je to sorazmerno nova metoda poročanja rezultatov, a pomembna, ker:• Lahko značilno potrdimo majhne razlike, ob
dovolj velikem N in/ali majhni SD.• Lahko značilno ne potrdimo velike razlike, ob
majhnem N in/ali veliki SD.
• Zato je potrebno redno preverjati velikost efekta in ga poročati ob desiminaciji rezultatov.
2-way ANOVA• Primerja povprečja odvisne spremeljivke dveh
ali več vzorcev ob delovanju dveh neodvisnih spremenljivk (faktorjev).• Ponavadi testiramo efekt vsaj dveh neodvisnih
spremenljivk (faktorjev) na odvisno spremenljivko.• Primerjava višine navpičnega skoka športnikov dveh (ali
več) športov in starosti.• Primerjava dveh tipov vadbe in dveh intervalov trajanja
vadbe na hitrost plavanja.
• Vedno lahko testiramo efekt vsake neodvisne spremenljivke posebej z 1-way ANOVA, ne moremo testirati skupni/mešani efekt (ang. interaction).
• Torej: 2-way ANOVA analizira vpliv dveh posameznih neodvisnih spremenljivk na odvisno in hkrati še interakcijo dveh neodvisnih spremenljivk na odvisno.
Interakcija neodvisnih spremenljivk• Skupni ali mešani ali integrirani efekt
• Naše odločitve se nikoli ne nanašajo na le en faktor.
• Vedno so odločitve sprejete glede na vsak posamezen faktor, kot tudi kombinacijo dveh ali večih.• Hitrost in vzdržljivost ter kombinacija obeh pri izbiri
obrambnega igralca.• Starost in število poškodb ter kombinacija obeh pri
izbiri reprezentanta.
• Vedno se izrazi kot nekakšna anomalija … določena kombinacija neodvisnih faktorjev znatno drugače vpliva na odvisno spremenljivko.
46
Primer• Želimo primerjati efekt intenzivnosti in trajanja vadbe na
izboljšanje časa plavanja na 400 metrov.• Plavalce razdelimo v 4 skupine, 2 različni intenzivnosti (70% in
80%) in 2 različna intervala trajanja (20 min in 30 min).• Uporabimo 2-way ANOVA, ker iščemo efekt vsake posamezne
neodvisne spremenljivke in interakcije obeh na hitrost plavanja.• Ker ima vsaka spremenljivka 2 nivoja, rečemo tudi 2x2 ANOVA
dizajn.• H01: 20 min = 30 min; H11: 20 min ≠ 30 min• H02: 70% = 80%; H12: 70% ≠ 80%• H03: 20 min = 30 min = 70% = 80%; H13: vsaj 2 povprečji sta si
različni.
Intenzivnost
Tra
jan
je
70% 80% Po
vp
rečje
20min 7 10 8.5
30min 9 17 13
8 13.5
Povprečje
Primer• H01: ovržemo; H11: sprejmemo pri p < 0.01 oziroma p = 0.001• H02: ovržemo; H12: sprejmemo pri p < 0.01 oziroma p = 0.001• H03: ovržemo; H13: sprejmemo pri p < 0.05 oziroma p = 0.030
• Post-hoc test nam potrdi značilno odstopanje “30 min @ 80%” od ostalih skupin/kombinacij.
• To je tudi razlog, da je interakcija bila značilna. Podobno se vidi tudi iz grafa – črte niso paralelne.
20 min @ 70% 20 min @ 80% 30 min @ 70% 30 min @ 80%
7 sek 9 sek 10 sek 17 sek
M-way ANOVA• Ko študiramo efekt M neodvisnih
spremenljivk na eno odvisno spremenljivko.• 2x3x2 (3-way) ANOVA primer: Kako vpliva
športna podlaga na biomehaniko gibanja?3 neodvisne spremenljivke:• Športni podlagi (tartan-standard, MONDO tartan).• Različna obutev (bos, športni copat, rekreativni copat).• Temperatura (nad 25OC, pod 25OC).Odvisna spremenljivka:• Reaktivna sila podlage
• Tovrstne študije zahtevajo veliko število preiskovancev (npr. 12 skupin), interpretacija rezultatov je kompleksna, zato se redko raziskovalno uporablja.
47
RM ANOVA zaporednih meritev ali (ang. repeated measures)
• Kadar imamo odvisne vzorce:• Iste preiskovance in testirane v različnih
trenutkih.
• Kadar testiramo spremenljivko v različnih populacijah:
• Fitness testi v različnih razvojnih obdobjih otroka.• Nivo holesterola v različnih obdobjih staranja.
• Še vedno jo lahko kombiniramo v 1-way, 2-way, M-way ANOVA dizajnu.
• Pri zaporednih meritvah se je potrebno izogniti zaporednim napakam…
Zaporedne napake
• Ko na preiskovanca delujejo efekti v določenem zaporedju, da le-ta kvari končni rezultat.• Efekt pretoka (ang. carryover effect): Večkratni efekti kvarijo
naslednje.• Hipoksični testi – glavobol – slabši dosežek.
• Efekt treninga (ang. training effect): Preiskovanci postanejo boljši pri izvajanju meritve zaradi učenja samega.
• Kompleksni gibalni testi postanejo lažji – boljši dosežek.• Efekti utrujenosti (ang. fatigue effect): Izvajanje naloge je odvisno
od utrujenosti.• Intenzivnejši ali dolgotrajnejši testi povzročijo utrujenost – slabši
dosežek.• Efekt občutenja (ang. sensation effect): Preiskovanci počasi
spoznajo učinek efekta.• VO2max test v hipoksiji – nenadna utrujenost – slabši/boljši dosežek.
• Kako se jim izognemo:• Naloge za preiskovanca v naključnem redu, zagotovimo določene
sistemske aktivnosti (ogrevanje na začetku, počitek med testi), animiramo otroke, zagotovimo udoben položaj med testom, …
Prednosti RM ANOVA
• Lahko opazujemo in kontroliramo individualne razlike med preiskovanci.
• Lahko se zadovoljimo z manjšim številom preiskovancev.• V ne RM ANOVA je variacija med preiskovanci dvignila
napako merjenja (razen če je nismo kompenzirali z večjim N). To potem zniža F in zmanjša moč raziskave.
• V RM ANOVA pa variacija med preiskovanci ne gre v napako merjenja, zato lahko imamo manjši N.
• Nam omogoča študijo odvisne spremenljivke skozi čas:• Kar je še posebej pomembno pri analizi učenja,
utrujenosti, pozabljanja, dosežka, staranja, razvoja, …
48
Sferičnost – Є (ang. sphericity)
• Je predpostavka, da imajo vse kombinacije ponovljivih meritev enako povezanost in velja homogenost variance.• Le če vsaj 3 zaporedne meritve.• Če temu ni res, se lahko poveča napaka 1. reda
(alpha).• Postanejo boljše multivariatne metode, kar pa
ponavadi ne želimo, saj RM še vedno nudi:• Večjo moč raziskave ob doseženi sferičnosti.• Edino možnost, če imamo majhno število preiskovancev.
• Zato raje uporaba korekcijskih metod:• Greenhouse-Geisser korekcija• Huynh-Feldt popravek korekcija
Korekcija sferičnosti RM ANOVA
• Greenhouse-Geisser korekcija• Ob izračunani F-vrednosti korigiramo število prostostnih
stopenj in pogledamo pri katerem p lahko sprejmemo/ovržemo H0.
• Uporabimo, le če je kršitev sferičnosti znatna. Drugače lahko pripelje do napake 2. reda.
• Huynh-Feldt korekcija• Podobno kot GG, le da korigiramo število prostostnih
stopenj le za toliko, kot je kršena sferičnost.
• Velja pravilo:• Če F značilen po GG korekciji, ovrzi H0.• Če F ni značilen po GG korekciji, preveri F brez korekcij.
• Če F ni značilen brez korekcij, sprejmi H0.• Če F značilen brez korekcij, uporabi HF korekcijo za
končno odločitev.
Izračun RM ANOVA
• Kompleksen izračun, zato ga ne bomo obravnavali tu.• Izračunamo F-vrednost.• Korigiramo, če potrebno.• Pogledamo v tabelo za F-vrednost in pri
izbranih prostostnih stopnjah variance:
• Če F > Fmejni, potem zavržemo H0.
)1()1(
1
−⋅−=−==Nkdf
kdfdf
e
bc
49
“Post-hoc” testi• Če delamo časovno zasnovano RM ANOVA bi bilo
dobro vedeti kdaj je določen efekt značilen (različen od začetne vrednosti – prve meritve).
• Kdaj nastopi značilna mišična atrofija ob vesoljskem letu ali ležanju v postelji.
• Po kako dolgem naporu kolesar izgubi ravnotežje.
• Tukey: cenilka HSD• Lahko primerja paroma (ang. pairwise).• Jo uporabimo, ko je F-vrednost značilna.• Takrat uporabimo post-hoc test, da vidimo če se povprečja
posameznih zaporednih meritev značilno razlikujejo.
• Lahko tudi drugi testi: Bonferroni, Sidak, …
Analiza kovariance - ANCOVA
• Je posebna oblika ANOVA-e, ko upošteva morebitne razlike med povprečji skupin na začetni meritvi (pre-test).• Je zelo pogosta raziskovalna težava.
• Vpliv 20 dnevnega treninga na vrhunske šprinterje ali rekreativce je zagotovo večji na rekreativce. ANCOVA to poskuša popraviti.
• Ko želimo aplicirati in preverjati nek efekt je popolnoma naključni izbor vzorca težek. Zato se raje odločimo, da na eno skupino deluje efekt (razred, klub, okoliš – eksperimentalna skupina), medtem ko na drugo ne (kontrolna skupina).
• Včasih so bila povprečja enaka na začetku, vendar ko so preiskovanci izpadli iz raziskave, temu ni bilo več tako.
• Uporabljamo jo tudi za izločitev vpliva zunanje spremenljivke na odvisno spremenljivko
• Ko želimo testirati efekt določenega tipa vadbe na moške in ženske je potrebno upoštevati osnovne fiziološke in biološke razlike med spoloma. Tako je potrebno eliminirati vpliv večje maščobne mase in manjše mišične mase pri ženskah.
Uporaba ANCOVA-e
• Najprej se jo na začetku poskušamo znebiti.• Naključno izberemo vzorec in ga razdelimo v skupine ter če
je dovolj velik lahko predpostavimo, da so povprečja skupin enaka. To lahko preverimo z ANOVO začetnih razlik.
• Razdelimo vzorec v skupine glede na začetne vrednosti, kot smo že opisali.
• Vendar ANCOVA-i se ne moremo vedno izogniti.• Ko so učenci že razdeljeni v razrede, športniki po športnih,
starost preiskovancev, stopnja treniranosti, …• Preverimo razlike v pre-test meritvah z ANOVA-o.• Če so razlike, uporabimo ANCOVA-o.
• Princip ANCOVA-e• Izločuje učinek kovariate – spremenljivke, ki poleg pravega
efekta vpliva na skupine in nam s tem zamegli končni rezultat. Lahko tudi izloči učinek več kovariat.
• ANCOVA uporablja regresijsko analizo za izločitev vpliva kovariate.
50
Predpostavke ANCOVA-e
• Učinek kovariate mora biti neodvisen od učinka efekta (z drugimi besedami: kovariate morajo imeti enak efekt na vse skupine).• Če bi naredili ANOVA-o in vzeli skupine kot neodvisno
spremenljivko in kovariato kot odvisno, ne smemo ugotoviti razlike med skupinami.
• Homogenost regresijskih naklonov.• Pogledamo regresijsko premico med kovariato in
odvisno spremenljivko celotnega vzorca in če lahko predpostavimo, da je ta naklon isti kot naklon posameznih premic znotraj vsake skupine, potem je to homogenost regresijskih naklonov.
Primer• Ali je učinek viagre na libido značilen in pri kateri dozi?• Vzorec razdelimo na tri skupine: placebo, mala doza viagre, velika doza viagre.• Dodamo možne kovariate: npr. partnerjev libido.
Obstaja značilen efekt viagre na preiskovančev libido, po kontroliranjuefekta partnerjevega libida.
Primer• Kaj pa homogenost regresijskih naklonov?
51
Ponovitev
• Obstaja točno določen postopek formuliranja hipotez, upoštevanja dodatnih dejstev in interpretacije rezultatov.
• Spoznali smo osnovne in nadaljevalne postopke testiranja povezanosti dveh ali več spremenljivk.
• Spoznali smo osnovne in nadaljevalne postopke testiranja razlik povprečne vrednosti dveh ali več skupin.
Predavanje 4:NEPARAMETRIČNI TESTI
Izvedeli boste:1. Osnovne predpostavke parametričnih testov.2. Kako testiramo predpostavke parametričnih testov:
a. Test normalnosti.b. Test homogenosti.c. Test velikosti vzorca.
3. Kdaj in kako se uporablja one-way χ2.4. Kdaj in kako se uporablja two-way χ2.5. Kdaj in kako se uporablja Spearmanov ρ.6. Kdaj in kako se uporablja Mann-Whitney U test.7. Kdaj in kako se uporablja Kruskal-Wallis ANOVA.8. Kdaj in kako se uporablja Friedman’s two-way ANOVA.
Predpostavke parametričnih testov
• Absolutni, intervalni ali razmernostni podatki.
• Normalna porazdelitev podatkov.• Homogenost variance.• Dovolj velik vzorec.
• Je pa res tudi to, da neparametrični testi:• Imajo manjšo moč raziskave kot parametrični.
• Moča raziskave je verjetnost, da ovržemo H0 (če je H0 FALSE).
• Ni na voljo toliko programske opreme kot za parametrične teste.
52
Test normalnosti porazdelitve
• Testiramo, če lahko podatke modeliramo z normalno porazdelitvijo.• Deskriptivno ugotavljamo, ali so podatki porazdeljeni
normalno, brez preračunavanja.• Histogram z modelirano normalno krivuljo.
• Analitično testiramo hipotezo, da so podatki porazdeljeni normalno.
• Shapiro-Wilk test• Kolmogorov-Smirnov test
• Posredno testiranje normalnosti, kjer nas zanima, če podatki prihajajo iz normalne porazdelitve z znanim (σ, µ) in jih primerjamo z našimi podatki.
2
2
2
)(
22
1)( σ
µ
σπ⋅−−
⋅⋅⋅
=x
exf
Deskriptivno preverjanje normalnosti porazdelitve
• Histogram: grafični prikaz frekvenčne porazdelitve podatkov.
Deskriptivno preverjanje normalnosti porazdelitve• Težava nastopi, ko imamo majhen N.
Ni normalnoporazdeljena
Normalnoporazdeljena
53
Metode testiranja normalnosti porazdelitve• Poznamo več testov…
• D’Agostinov K2 test• Anderson-Darling test• Kolmogorov-Smirnov test• Shapiro-Wilk test
• Ali so zanesljivi?• Pri majhnem N nam večinoma porazdelitev označijo kot
normalno.• Pri velikem N nam že majhne deviacije od normalne
porazdelitve označijo za nenormalno.
• Ker so ti testi tako odločilni (parametrične ali neparametrične analize) jim ne gre slepo verjeti!
Sploščenost normalne porazdelitve
• Je mera sploščenosti normalne porazdelitve (ang. kurtosis).• Večja vrednost pomeni večjo variabilnost podatkov.
• Normalna porazdelitev ima sploščenost 0 (oziroma 3).
Primeri iz kineziologije
Sploščenost = 0.05 Sploščenost = 1.8 Sploščenost = -0.8
Kdaj je sploščenost prevelika, da je porazdelitev še normalna?Nekateri testi normalnosti, ki jih bomo spoznali kasneje, že imajo integriran tudi testsploščenosti. Oziroma sploščenost upoštevajo pri končnem izračunu. Vedno pa se lahko dodatno vizuelno prepričamo v pretirano sploščenost podatkov. Ostali testi somanj uporabni, a velja pravilo, da naj bo asimetričnost manjša od 2x standardnenapake sploščenosti:
NSEK
2422tsploscenos ⋅=⋅<
54
Asimetričnost normalne porazdelitve
• Je mera nagnjenosti/asimetričnosti normalne porazdelitve (ang. skewness).• Pozitivna vrednost pomeni nagnjenost v levo,
negativna vrednost nagnjenost v desno.• Normalna porazdelitev ima asimetričnost 0.
Primeri iz kineziologije
Asimetričnost = 0.95 Asimetričnost = -0.60
Kdaj je asimetričnost prevelika, da je porazdelitev še normalna?Nekateri testi normalnosti, ki jih bomo spoznali kasneje, že imajo integriran tudi testasimetričnosti. Oziroma asimetričnost upoštevajo pri končnem izračunu. Vedno pa selahko dodatno vizuelno prepričamo v pretirano asimetričnost podatkov. Ostali testiso manj uporabni, a velja pravilo, da naj bo asimetričnost manjša od 2x standardnenapake asimetričnosti:
NSES
622ostasimetricn ⋅=⋅<
Kateri test normalnosti uporabiti?
• Nekdaj je bil K-S test zlato pravilo. Danes nič več – se je izkazal za preveč nezanesljivega.
• Danes prisegajo na D’Agostinov test in Shapiro-Wilk-ov test.• Shapiro-Wilk-ov test ni zanesljiv, če imamo
med podatki spremenljivke veliko istih števil.
• NASVET: Vedno izvajaj test normalnosti (Shapiro-Wilk ali D’Agostinov) in potem preveri še vizuelno s histogramom.• Naj ti služi ta informacija za dodaten opis
spremenljivke.
55
Primer• Merjenje telesne
maščobe SLO deklic, starih 9 oziroma 10 let.• Obe porazdelitvi nista
normalni po Shapiro-Wilk-ov testu. Vendar lahko kljub temu privzamemo, da sta normalno porazdeljeni.
• V letu 2008 opazimo premik porazdelitve desno.
• V letu 2008 je več predebelih otrok. Meja je 28% telesnih maščob.
• V letu 2007: 15% predebelih.
• V letu 2008: 25% predebelih.
Primer• Merjenje dolžine
skoka v daljavo z mesta SLO otrok, na začetku (zgoraj) in na koncu šolskega leta (spodaj).• Obe porazdelitvi sta
normalni po Shapiro-Wilk-ov testu.
• Na koncu šolskega leta je histogram premaknjen desno.
• Na koncu šolskega leta je histogram bolj ozek –bolj uniformen.
Koliko razredov na histogramu?
• Število razredov (NR, ang. classes) lahko bistveno spremeni vizuelni pregled histograma.• Najbolj na to vpliva razpon podatkov – še posebej osamelci.
• Veljajo naj naslednja pravila:
• Sturgis-ovo pravilo:
• Rice-ovo pravilo:
N Nr
< 50 5 – 7
50 – 100 6 – 10
100 – 250 7 – 12
> 250 10 – 20
3
10
2
log3,31
NN
NN
R
R
⋅=
⋅+=
56
Transformacije podatkov za normalno porazdelitev• Je matematični postopek modifikacije podatkov z
namenom uporabe parametričnih statističnih metod.
• Zakaj bi to sploh delali?• Najprej se moramo prepričati, da podatki niso normalni
zaradi določenega tehtnega razloga.• Neparametrični postopki imajo manjšo statistično moč.• Ni toliko znanja niti računskih postopkov oziroma
računalniških programov za neparametrične postopke.• Uporabimo, kar najmanjšo transformacijo, če možno.
• Možne transformacije:• Ko smo se odločili, da podatki niso normalni…
• Transformacija z uporabo kvadratnega korena• Logaritemska transformacija• Transformacija z uporabo inverzne vrednosti• Cox-Box transformacija
Transformacija z uporabo kvadratnega korena (+ asimetričnost)
• Korenimo vsako vrednost.• Prej premaknemo podatke v pozitivno smer.
• Prištejemo konstanto, da je minimum > 1.
• Primer:
bXXT +=
razširi majhne,skrči velike številke
Transformiranje ali ne?
• Najprej vedno preveri, zakaj so podatki nenormalno porazdeljeni.
• Odloči se za statistične metode. Na osnovi njenih lastnosti se odloči za transformacijo.
• Odloči se za najprimernejšo transformacijsko metodo in se zavedaj posledic.• ni več intervalnih podatkov in upoštevaj to pri interpretaciji
rezultatov, …
• Pred transformacijo zasidraj podatke na vrednost 1.• Upoštevaj specifičnost podatkov – glej prvo točko.
• Ni metode za izbiro najboljše transformacije.• Števne spremenljivke (absolutne) naj bodo vedno transformirane z
kvadratnim korenom.• Merske spremenljivke naj bodo transformirane z log (2 ali 10).• Deleži populacije se transformirajo z arcsin(√X).
57
Poročanje po transformaciji
• Izvedemo primerno transformacijo.• Izvedemo ustrezno statistiko.• Poročamo vrednosti v prvobitnih enotah, ki
jih dobimo z reverzno transformacijo.• Povprečno vrednost, SD, 95% interval zaupanja, …
XXX
XXX
XXX
TXT
TT
TT
XT
XX
XX
TXX
XX
TX
X
→ →
→ →
→ →
==
==
==
10log
11
10
2
Testiranje homogenosti (ang. Homoscedasticity and heteroscedasticity)
• Ena izmed predpostavk parametričnih testov je tudi homogenost podatkov.• To pomeni, da je varianca (SD2) podatkov v vseh skupinah
podobna.• Variance ene skupine ne sme biti 2-krat večja od variance
druge.• Če temu ni tako, potem se pojavi verjetnost napake reda 1.
• Primerjamo količino gibanja otrok, starih od 5 do 8 let. Slika prikazuje rezultate: pri starosti 7 let količina gibanja odstopa od trenda.
• Če SD7 = SD5,6,8, homogeno inso dejansko razlike.
• Če SD7 ≠ SD5,6,8, ni homogenoin je potrebno biti previden.
• Homogenost lahko testiramo• χ2 test.• Bartlettov test.• Levenov test.
Bartlettov test homogenosti
• Predpostavke:• Podatki morajo biti normalno porazdeljeni.• Podatki so kvantitativni.
• Testiramo H0: Variance spremenljivke v vseh skupinah so enake.
• T-vrednost• (Bartlettova cenilka)
• kjer je… ∑
∑
∑
=
=
=
−⋅−=
−⋅
−⋅
−⋅+
⋅−−⋅−=
≠===
k
i
iip
k
i i
k
iiip
ji
k
kN
SNS
kNNk
SNSkNT
H
H
1
22
1
1
22
1
210
)1(
11
1)1(3
11
ln)1(ln)(
:
...:
σσσσσ
58
Levenov test homogenosti• Predpostavke:
• Je bistveno manj občutljiv na nenormalnost porazdelitve.• Če so podatki normalni ima Bartlettov večjo statistično moč.• Podatki so kvantitativni.
• Testiramo H0: Variance spremenljivke v vseh skupinah so enake.
• df1 = k – 1.• df2 = N – k.• Testiramo W > F(alpha, df1, df2)
• W-vrednost• (Levenova cenilka)
• kjer je… ∑∑∑
∑∑
∑
== =
= =
=
==−=
−⋅−
−⋅−=
≠===
ii
i
N
jij
ii
k
i
N
jijiijij
k
i
N
jiij
k
iii
ji
k
ZN
ZZN
ZYYZ
ZZk
ZZNkNW
H
H
11 1
1 1
2
1
1
210
1,...
1,...
)()1(
)()(
:
...:
σσσσσ
Testiranje velikosti vzorca
• Ena izmed predpostavk parametričnih testov je tudi dovolj velik vzorec.
• Velikost vzorca se nastavi že na začetku raziskave – Določanje velikosti vzorca.• Znanstveno neprimerno je kasnejše
povečevanje vzorca, čeprav je to še kar pogosto.• Izpad preiskovancev je najpogostejši vzrok.
• Ponavljanje meritev pogosto zelo poveča stroške raziskave.• Finančne• Časovne• Prostorske
Določanje velikosti vzorca
• Z velikostjo vzorca (N) lahko zelo manipuliramo rezultat raziskave.
• Večji N poveča moč raziskave – poveča verjetnost pravilne odločitve glede H0.
• Hkrati pa z brezglavim povečevanjem N lahko vedno dokažemo razlike med skupinama, čeprav je efekt razlike lahko zelo majhen.
• Lahko pa to znatno podraži raziskavo.• Zato je potrebno najti optimalen N, da pridemo do
odmevnih in spodobnih zaključkov.
• Praviloma ta izračun ali oceno vedno opravimo.• Danes revije že zahtevajo izračun velikost vzorca.
variancegroup within oferror
variancegroup between oftreatment ali =Ft
59
Hitra ocena N pri primerjalnih študijah
• Ko primerjamo povprečja dveh skupin.
• SD…ocenjena SD podobnih študij.• t…t-vrednost, ki je potrebna za p < 0.05.• D…Razlika povprečij.
⋅⋅=2
222
D
tSDceilN
Primer izračuna potrebnega N
• Torej, če vemo katero moč raziskave želimo, znamo oceniti povprečja in SD, izberemo ustrezno alpho,…
• ∆ = 5; SD = 6• Hočemo P = 0.70, pri alpha = 0.05
• Zα = 1.96; β = 1 – P = 0.3; Zβ = 0.84 (v tabeli)
• Vzamemo prvo večje število … N = 23.
( ) ( )6.22
5
84.096.16222
22
2
22
=+⋅⋅=∆
+⋅⋅= βα ZZSD
N
…Še grafično
60
Neparametrični testi
• Se uporabljajo kadar:• Podatki niso porazdeljeni normalno.• Podatki niso homogeni.• Premajhen N.• Podatki so nominalni in ordinalni.
Vrste neparametričnih testovVrsta testa Parametrični test Neparametrični test
Opisna statistikaPovprečje, standardna deviacija
Mediana, interkvantilna razdalja
Primerjaj eno spremenljivko na hipotetično vrednost
T-test enega vzorca Wilcoxon test, χ2 test
Primerjaj dve neodvisni spremenljivki
T-test neodvisnih vzorcev Mann-Whitney test
Primerjaj dve odvisni spremenljivki
T-test odvisnih vzorcev Wilcoxon test
Primerjaj >2 neodvisne spremenljivke
1-way ANOVA Kruskal-Wallis test
Primerjaj >2 odvisne spremenljivke
Repeated mesures ANOVA
Friedman test
Primerjaj povezanost dveh spremenljivk
Pearsonova korelacija Spearmanova korelacija
Napovej odvisno spremenljivko na osnovi (več) neodvisnih spremenljivk
Linearna regresija in večkratna linearna regresija
Neparametrična regresija (logit)
χ2 test
• Se uporablja za testiranje frekvenc porazdelitve opazovanih dogodkov proti pričakovanim.
• Testiranje število dečkov in deklic na igrišču.• Število glasov vsakega kandidata.• Frekvenca ocen pri Športni vzgoji.• Frekvenca blagovnih znamk športnih copat med rekreativci.
0
100
200
300
400
500
Adidas Reebok Nike Asics Puma
Blagovne znamke športnih copat
Fre
kve
nca
Opazovano Pričakovano
1 ;)( 2
2 −=
−=∑ kdfE
EOχ
61
Primer χ2 testa (enojna klasifikacija)
• Učitelji se dogovorijo o kriterijih ocenjevanja Športne vzgoje (10%...”5”; 30%...”4”; 35%...”3”; 20%...”2”; 5%...”1”)
• En učitelj tej direktivi ni sledil, ali značilno odstopa od dogovorjenega?
• H0: Porazdelitev ocen se med pričakovanim in opazovanim ne razlikuje.
Ocene “5” “4” “3” “2” “1” Skupaj
Opazovano 30 57 32 15 7 141
Pričakovano 14 42 49 28 8 141
O-E 16 15 -17 -13 -1
(O-E)2 256 225 289 169 1
(O-E)2/E 18.29 5.36 5.90 6.04 0.13 χ2 = 35.7
Tabela χ2-vrednosti
Primer χ2 testa (večkratna klasifikacija)
• 2x3 klasifikacija pomeni, da razdelimo dogodke v 2 kategoriji (prvo v 2 razreda in drugo v tri razrede).• Kateri način učenja plavanja je boljši? “Delna” ali
“kompletna” metoda? Ndelno = 55; Nkompletno = 52• H0: Ni značilnih razlik v plavalnem znanju med obema
načinoma poučevanja plavanja.
Doseženo znanje
Tip učenja Dobro Srednje Slabo
Delno 15 27 13
Kompletno 21 19 12
62
Primer χ2 testa (večkratna klasifikacija)Doseženo znanje
Tip učenja Dobro Srednje Slabo Skupaj
Delno 15 27 13 55
Kompletno 21 19 12 52
Skupaj 36 46 25 107
% Skupaj 33.64 42.99 23.36
• Izračunamo % od skupnega.
• Izračunamo koliko plavalcev bi padlo v vsak razred, če bi bili poučevani enako (pričakovano).
• Vnesemo v kontingenčno tabelo.
• Pogledamo v tabelo za χ2 = 2.35 indf = (R-1)·(C-1)=(2-1)·(3-1) = 2
Delno KompletnoDobro 0.3364·55 = 18.50 0.3364·52 = 17.49Srednje 0.4299·55 = 23.64 0.4299·52 = 22.35Slabo 0.2336·55 = 12.85 0.2336·52 = 12.15
Opazovano Pričakovano O–E (O–E)2 (O–E)2 /E
15 18.50 -3.50 12.25 0.662
21 17.49 3.51 12.32 0.702
27 23.64 3.36 11.29 0.478
19 22.35 -3.35 11.22 0.502
13 12.85 0.15 0.02 0.002
12 12.15 -0.15 0.02 0.002
χ2 = 2.35
Spearmanov koeficient povezanosti (rho)
• Za testiranje povezanosti med dvema ordinalnima spremenljivkama.
• Povezanost med uspehom pri predmetu in nacionalnim preverjanjem znanja. (Če sta bila dva izenačana v vrstnem redu – potem smo vzeli povprečje za oba.)
2 ;)1(
61
2
2
−=−⋅
⋅−= ∑
parovNdfNN
dρ
Preiskovanec Uspeh pri predmetu
Nacionalni test
d d2
1 8 10 -2 4
2 16 17 -1 1
3 7 4 3 9
4 24 25 -1 1
… … … … …
24 20 22 -2 4
N = 25 11 14 -3 9
∑d2 = 362
23
0.86
)125(25
36261 2
==
−⋅⋅−=
df
ρ
ρ
V tabeli:Ρmejni(p = 0.01) = 0.54H0 ovržemo pri p = 0.01
Tabela ρ-vrednosti
63
Ponovitev
• Naučili smo se opazovati podatke.• Znamo se odločiti o normalnosti,
homogenosti podatkov in dovoljšnji velikosti vzorca.
• Znamo se odločiti o rabi parametričnih in neparametričnih testov
• Spoznali smo nekatere neparametrične teste.
Predavanje 5:OSNOVNI KONCEPTI MERJENJA
Izvedeli boste:1. Eksperimentalna veljavnost in njena kontrola
a. Notranjab. Zunanja
2. Kontrola nevarnosti notranje veljavnosti3. Kontrola nevarnosti zunanje veljavnosti
Eksperimentalna veljavnost in njena kontrola
• Načrtovanje raziskave je kompleksna naloga raziskovalca, kjer mora biti pozoren na različne faktorje, ki:• So specifični in lahko kontaminirajo raziskavo • So generični prav vsaki raziskavi• Se lahko kontrolirajo• Se ne morejo kontrolirati• Lahko vplivajo na posplošitev rezultatov
• S ciljem po visokem zaupanju v dobljene rezultate.
64
Notranja veljavnost (ang. internal validity)• Je stopnja do katere lahko kontroliramo raziskavo
pri katerih neodvisna spremenljivka povzroči efekt na odvisni spremenljivki.• Bolj kot kontroliramo eksperiment, večja je notranja
veljavnost.• Ne obstaja kvantitativna mera notranje veljavnosti.
• Če merimo efekt hipoksije na aerobne sposobnosti je potrebno zagotoviti, da vsi preiskovanci bivajo v enakem okolju.
• Zagotoviti moramo, da čimmanj ko-faktorjev vpliva na spremembo odvisne spremenljivke, razen neodvisne spremenljivke.
• Ti ko-faktorji so lahko:• Razvoj, zgodovina, test, natančnost instrumenta, statistična
regresija, razlike v vzorcu, smrtnost in ostali (placebo efekt, Hawthornov efekt, Halo efekt).
Razvojni faktor notranje veljavnosti (ang. maturation)• Zaradi spontanega spreminjanja vzorca skozi čas –
razvoj, maturacija• Vsakršno spreminjanje kot funkcija zgolj časa je lahko
moteči faktor k notranji veljavnosti.• Preiskovanci postanejo višji, težji, z več maščobe, z manj ali
več mišične mase, anksioznejši, pametnejši, spreminjajo diete..• Poškodbe se lahko zacelijo same.
• Zelo pomembno, kadar raziskujemo otroke ali starostnike ali kadar raziskave trajajo več mesecev oziroma let.
• Kontroliramo z uporabo kontrolne skupine – potem poznamo efekt razvoja.
• Otroci obiskujejo dodatne športne vsebine in se gibajo v 3. razredu isto kot v 2. razredu.Kontrolna skupina pa v 3. razredu giba 12% manj.Vpliv dodatnih športnih vsebin je torej 12% in ne 0%.
Zgodovina kot faktor notranje veljavnosti• So vsi dogodki, ki se lahko pripetijo vzorcu in
spreminjajo odvisno spremenljivko, a so zunaj raziskave.
• V raziskavi težavnosti temeljnih nalog različnih poklicev SV, kjer v določenih enotah velja strožji red kot v drugih. Zdaj lahko stres bistveno bolj vpliva na težavnost temeljnih nalog kot fizična težavnost sama.
• Zelo pomembno, kadar raziskujemo otroke ali starostnike ali kadar trajajo več mesecev oziroma let.
• Jih ne moremo kontrolirati, lahko pa njihovo verjetnost pojavitve ocenimo.• Ena od rešitev je dovolj velik naključen vzorec.• In še dodatno naključno deljenje vzorca v skupine (če je
taka zasnova raziskave)
65
Testi kot faktor notranje veljavnosti (ang. learning effect)• Test predstavlja preiskovancu izkušnjo, ki lahko
vpliva na naslednje teste.• Le na testih, ki se izvajajo večkrat – RM ANOVA
• Test kognitivnih sposobnosti na računalniku.• Test agilnosti, koordinacije.• Test mišične aktivacije (MVC + električna stimulacija).
• Efekt je velik predvsem pri novih testih oziroma testih, ki jih izvajamo prvič.
• Ne moremo kontrolirati, lahko pa omejimo.• Ponovimo pre-test večkrat in gledamo, kdaj se dosežen
rezultat ustali. Potem začnemo manipulirati neodvisno spremenljivko.
• Preiskovancem bodisi ne povemo bodisi povemo doseženi rezultat, ker se bodo drugače motivirali drugače.
Natančnost instrumenta kot faktor notranje veljavnosti• Natančnost instrumenta mora predhodno biti
določena na osnovi ponovljivosti, veljavnosti oziroma kalibriran.• V vseh vrstah raziskav
• Merjenje telesne višine• Merjenje VO2max• Nastavitev ročice pri MVC
• Če zgornjim zahtevam ni zadovoljeno, se največkrat pokažejo nepričakovana odstopanja pri RM ANOVA ali med skupinami.
• Lahko kontroliramo.• Držimo se navodil merjenja in poskrbimo že na začetku,
da do tega ne pride.• Sistematično napako lahko izmerimo ali ocenimo in potem
popravimo podatke. Ne priporočamo.• Izvedemo pilotno študijo (kontrolno skupino), da na njej
testiramo delovanje instrumenta.
Statistična regresija kot faktor notranje veljavnosti• Takrat ko imamo določene periode
dobrega dosežka (forma) in določene periode slabšega dosežka.
• Predvsem v raziskavah, ki trajajo dlje časa.
• Število točk na tekmo v igrah z žogo• Tek na srednje in dolge proge• Maksimalna eksplozivna moč, če nismo poskrbeli za
ogrevanje
• Lahko kontroliramo.• Dovolj velik vzorec.• Poskrbimo za standardizirano ogrevanje pred
testom.• Izberemo točno določeno obdobje
66
Razlike v vzorcu kot faktor notranje veljavnosti (ang. selection bias)
• Kadar razlike v vzorcu na začetku vplivajo na rezultate tudi na koncu.• Kadar nismo naključno izbrali vzorec oziroma
vzorca nismo naključno razdelili v skupine.• Ko si preiskovanci sami izberejo kontrolno ali
eksperimentalno skupino – problem motivacije.• Vpliv vadbe na moške: večji učinek na manj trenirane
kot na bolj trenirane.
• Lahko kontroliramo.• Poskrbimo za naključno razdelitev vzorca. • Uporabimo statistično metodo ANCOVA-o.
Smrtnost kot faktor notranje veljavnosti (ang. experimental mortality)
• Nepričakovano zmanjšanje števila vzorca tekom raziskave.• Predvsem pri dalj časa trajajočih raziskavah ali za
preiskovance zahtevnejših raziskavah.• Razvoj gibalnih sposobnosti otrok.• Razvoj mišične atrofije v odvisnosti od števila dni gibalne
neaktivnosti.• Stres-strain odnos med vadbo v vročini.
• Lahko na začetku ni razlik vzorca, a po testu so razlike očitne, saj “preživijo” le specifični. Dobimo faktor razlike v vzorcu.
• Lahko kontroliramo.• Poskrbimo za dovolj velik vzorec – dodatno število
preiskovancev.• Včasih lahko dodatno rekrutiramo, če potrebno.
Placebo efekt kot faktor notranje veljavnosti• Efekt zaradi vedenja oziroma pričakovanja efekta
neodvisne spremenljivke.• Predvsem v medicinskih, farmacevtskih raziskavah.
• Učinek zdravila.• Učinek terapije.
• Včasih je problem placebo efekta tako v vzorcu kot v merilcu.
• Lahko kontroliramo.• Poskrbimo za “slepo študijo”, da preiskovanci ne vedo
vpliva neodvisne spremenljivke.• Poskrbimo za “dvojno slepo študijo”, da preiskovanci in
merilci ne vedo vpliva neodvisne spremenljivke.• Da merilec ne spodbuja bolj preiskovance v eksperimentalni
skupini, kot tiste v kontrolni.• Potrebno uvesti dodatno skupino: eksperimentalna,
kontrolna + placebo skupina.
67
Hawthornov efekt kot faktor notranje veljavnosti• Efekt zaradi zgolj prisotnosti raziskovalnega
osebja.• Ker preiskovanci vedo da so predmet raziskave, se
izkažejo bolje kot sicer.• Prehranjevalne navade• Koordinacija gibanja oziroma telesne drže.• Igralne navade otrok
• Lahko je pozitiven (motivacija), lahko pa tudi negativen (trema).
• Lahko kontroliramo.• Poskrbimo, da preiskovanci ne vedo, da se predmet
opazovanja.• Merimo koordinacijo gibanja, telesno držo, ravnotežje brez
štartnih povelji.• Čim manj opazno opazujemo preiskovance – otroke
(enosmerno steklo, nevidna kamera, …)
Halo efekt kot faktor notranje veljavnosti• Ko merilec nehote zapeljuje rezultat
preiskovanca.• Predvsem intervjuji, kognitivni testi, testi koordinacije,
nevarni testi.• Napeljevanje k odgovoru in naštevanje možnih odgovorov• Opisovanje možne taktike premagovanja ovir, plezanja• Namigovanje, spodbujanje, opogumljanje
• Merilec lahko nekoga opogumlja, ker ve da zmore veliko in drugega ne, ker ve da ne zmore veliko.
• Ima večji efekt na subjektivne meritve kot na objektivne.• Lahko kontroliramo.
• Poskrbimo za veliko mero objektivnosti in nepristranskosti merilca. Izobraziti merilce.
• Uvedemo zunanje merilce, nepoznane preiskovancem, kar je večkrat nemogoče.
• Poskrbimo za “dvojno slepo študijo”.
Zunanja veljavnost (ang. external validity)• Je stopnja pri kateri lahko rezultate raziskave na
preiskovancih posplošimo na ostalo populacijo.• Bolj kot lahko posplošimo naše rezultate, večja je zunanja
veljavnost.• Bolj kot je vzorec podoben populaciji, bolj to velja.
• Ali nastopi mišična atrofija med “bed restom” podobno kot v vesolju?
• Ali ena ure dnevne GŠA vpliva enako na otroke kot na mladostnike?
• Ni statistične metode za ugotavljanje zunanje veljavnosti, ampak je njena presoja dana raziskovalcu.
• Obstaja več faktorjev, ki vplivajo na zunanjo veljavnost:• Reaktivni efekt pre-testa, interakcija med preiskovanci in
pravim efektom, umetno raziskovalno okolje, interferenca večkratnih testov.
68
Reaktivni efekt pre-testa kot faktor zunanje veljavnosti
• Že prej smo povedali, da pre-test lahko bistveno vpliva na rezultat post-testa. Vendar kako to vpliva tudi na zunanjo veljavnost in ne le na notranjo?• Ta vpliv se zgodi le ob predhodnem pre-testu.• Preiskovanec se lahko užali, je razočaran je zelo
motiviran po rezultatu ne pre-testu.• Ko poskušamo ugotovitve generalizirat, moramo
upoštevati tudi izvedbo pre-testa. Kajti le tako lahko simuliramo pre-test efekt na post-test.• Nekdo bo dober na post-testu, le če bo predhodno
opravil pre-test. Bo bolj motiviran.
Interakcija med preiskovancem in pravim efektom kot faktor zunanje veljavnosti
• Lahko se zgodi, da so določeni preiskovanci bolj dovzetni za delovanje pravega faktorja (ang. responders)• Ne moremo posplošiti rezultate iz preiskovancev
na populacijo.• Popolni nešportniki bodo bolj odreagirali na vadbo moči
kot ostali (rekreativci in športniki)• Gimnastičarji bodo manj odreagirali na vadbo
ravnotežja kot ostali.• Navade GŠA bodo manjše pri anketirancih v
telefonskem imeniku.• Zdravilo za zniževanje holesterola bo bolj učinkovito pri
ljudeh s povišanim holesterolom.• Mišična atrofija preiskovancev v študiji bed rest bo
drugačna od vesoljskih popotnikov.
Umetno raziskovalno okolje kot faktor zunanje veljavnosti
• Preiskovanec drugače odreagira na pravi efekt v raziskovalnem okolju kot bi drugače.• Take rezultate težko posplošimo, saj veljajo le za tiste, ki
izvajajo pravi efekt v podobnem okolju polnem gledalcev.• Analiza gibanja z vsem montiranimi markerji, senzorji.• Analiza gibanja na tekoči preprogi.• Večja motivacija pri maksimalnem testu vzdržljivosti.• Trema pri testu koordinacije.
• Uporabimo tehnike zmanjševanja stresa.• Uporabimo “tih” laboratorij ali pa stres tudi merimo (SF,
kortizol).• Simuliramo laboratorij v naravi.
69
Interferenca večkratnih efektov kot faktor zunanje veljavnosti
• Kadar želimo preiskovati efekt več kot enega pravega faktorja na odvisno spremenljivko.• Takrat lahko pride do interakcije med faktorji. Učinek
enega faktorja lahko inhibira učinek drugega.• Potenciacija, utrujenost.• Testiranje moči, vzdržljivosti in ravnotežja v pravilnem
vrstnem redu.
• Uredimo vrstni red testov.• Uporabimo logično zaporedje, če gre.• Če ne naključno pomešamo teste, da se interferenca
odšteva. “Latin square design”.
Faktorji notranje in zunanje veljavnosti
Notranja veljavnost Zunanja veljavnost
Razvoj Reaktivni efekt pre-testa
Zgodovina Interakcija med preiskovanci in pravim efektom
Testi Umetno raziskovalno okolje
Natančnost instrumentov Interferenca večkratnih testov
Statistična regresija
Smrtnost
Razlike v vzorcu
Placebo efekt
Hawthornov efekt
Halo efekt
Kontrola nevarnosti notranje veljavnosti
• Vse raziskave imajo svoje dobre in slabe plati, katerih se mora raziskovalec kritično zavedati.• Pri pripravi na raziskavo, mora slabosti
poskušati omejiti ali celo odpraviti.• Tudi bralci raziskav morajo biti pozorni na njih
in tako oceniti kakovost raziskave.
• Za kontrolo nevarnosti obstaja več metod…
70
Uravnotežene skupine
• Naključna izbira vzorca in naključna porazdelitev v skupine.• Le tako lahko predpostavimo, da so na začetku razlike med
skupinami zgolj naključne narave in vsaka nadaljnja sprememba bo zaradi delovanja pravega faktorja.
• S tem lahko predpostavimo, da je zgodovina preiskovancev enaka, so enako dovzetni za efekt in zunanje vplive, ni razlik med skupinami, je statistična regresija enako verjetna za vsako skupino.
• Nekatere zunanje vplive je sicer potrebno blokirati.
• Je najlažja in najučinkovitejša metoda za eliminacijo ali omejitev faktorjev notranje veljavnosti.
Uporaba kontrolne skupine
• Ko testiramo učinek nekega efekta.• Najlažje in najpravilnejše je, da naključno
razdelimo preiskovance v dve skupini.• Tako so obe skupini enako izpostavljeni
faktorjem notranje veljavnosti, le da kontrolna skupina ni izpostavljena pravemu faktorju.• Placebo skupina je posebna oblika kontrolne
skupine, a ni kontrolna.• “slepa študija” in “dvojna slepa študija” in
uporabljati kontrolno skupino.• Njihova raba ni nujna, je pa primerna za
kontrolo notranje veljavnosti.
Ostale metode kontrole
• Prvi dve metodi sta lahko zelo učinkoviti in skozi njih lahko zelo uspešno kontroliramo faktorje notranje veljavnosti.
• Ostale metode so:• Kontrola natančnosti instrumentov.• Smrtnost težko preprečimo. Ni etično
prepričevati, prositi preiskovanca, lahko pa ga motiviramo z denarjem.
• Efekt testa je lahko izničen s kontrolno skupino ali pa enostavno ne izvedemo pre-testa.
71
Metode kontrole notranje veljavnosti
Notranja veljavnost Metoda kontrole
Razvoj Uravnotežene skupine, kontrolna skupina
Zgodovina Uravnotežene skupine, kontrolna skupina
Testi Uravnotežene skupine, kontrolna skupina, brez pre-testa
Natančnost instrumentov Raziskovalec testira instrumente
Statistična regresija Uravnotežene skupine
Razlike v vzorcu Uravnotežene skupine
Smrtnost Raziskovalec upa, da do tega ne pride, več jih rekrutira
Placebo efekt Kontrolna skupina, “slepa študija”, “dvojna slepa študija”
Hawthornov efekt Kontrolna skupina, “slepa študija”, “dvojna slepa študija”
Halo efekt “slepa študija”, “dvojna slepa študija”
Kontrola nevarnosti zunanje veljavnosti
• Ko želimo rezultate naše raziskave posplošiti na želeno populacijo, moramo:• Izbrati primeren vzorec, da bomo lahko izvedli posplošitev.
• Če želimo izdelati predikcijo maščob za starejše ženske, moramo v raziskavo vključiti dovolj velik vzorec starejših žensk.
• Vključimo več skupin vzorca za izključitev vpliva pre-test faktorja.
• Idealno: ena skupina le pre-test, druga skupina le post-test in tretja skupina pre-test in post-test.
• Ali pa le uvedemo kontrolno skupino.• Da izključimo interakcijo med preiskovanci in efektom
moramo dobro poznati značilnosti preiskovancev oziroma poznati, če naj bi pravi efekt deloval le nanje.
• Skoraj nemogoče je kontrolirati umetno laboratorijsko okolje. Kreativnost raziskovalcev zaželena.
• Interferenco večkratnih efektov kontroliramo z dobrim vrstnim redom testov, naključnim vrstnim redom, ali več skupin z po enim pravim efektom.
Metode kontrole zunanje veljavnostiZunanja veljavnost Metoda kontrole
Reaktivni efekt pre-testa Reprezentativen vzorec, kontrolna skupina ali več skupin
Interakcija med preiskovanci in pravim efektom
Reprezentativen vzorec, ocena raziskovalca
Umetno raziskovalno okolje Reprezentativen vzorec, kreativnost raziskovalca
Interferenca večkratnih testov Reprezentativen vzorec, več naključnih skupin, pravilen vrsti red, naključni vrstni red
72
Notranja ali zunanja veljavnost?
• Včasih je manj poudarka na zunanji veljavnosti.• V teh primerih pridobivamo nova znanja in nas aplikacija
zanima sekundarno.• Nas ne zanimajo učinki zdravila na zdrave ljudi.• Nas ne zanimajo programi hujšanja za suhe ljudi.
• Ker sta velikokrat recipročni, je večjo skrb potrebno dati notranji veljavnosti.• Če želimo dobro notranjo veljavnost je raziskavo potrebno
izvesti v dobro kontroliranem “sterilnem” okolju, kar pa ni dobro izhodišče za posploševanje.
• Temeljno (ang. basic) raziskovanje.• Če pa želimo velik impakt raziskave pa je potrebno
povečevati zunanjo veljavnost.• Aplikativno (ang. applied) raziskovanje.
• Moramo imeti zadovoljivo stopnjo obeh in ne visoko stopnjo obeh!
• To pomeni dobro planiranje raziskave v obeh primerih!
Ponovitev
• Spoznali smo osnovne vrste veljavnosti.• Spoznali smo računanje ponovljivosti
meritev.• Znamo test opredeliti s stališča
veljavnosti in ponovljivosti ter merske napake.
• Znamo zasnovati raziskavo s kontrolo notranje in zunanje veljavnosti.
• Vemo kdaj je potrebno poudarjati notranjo in kdaj zunanjo veljavnost.
Predavanje 6:TIPI RAZISKAV
Izvedeli boste:1. Neeksperimentalne (deskriptivne) raziskave
a. Zgodovinskeb. Filozofskec. Meta-analized. Anketiranje (vprašalnik, intervju, normativna anketa)e. Epidemiološkef. Druge deskriptivne metode
2. Eksperimentalnea. Pred-eksperimentalneb. Prave-eksperimentalnec. Kvazi-eksperimentalne
73
Zgodovinske raziskave v kineziologiji (več v Thomas & Nelson (2005). Research
methods in physical activity)• Po svoji osnovi so lahko kvalitativne in
kvantitativne.• Kvalitativne: Vpliv žensk na sestavo olimpijskih športov.• Kvantitativne: Ali se mišični volumen spremeni med mišičnim
krčenjem.
Kateri športi so le za ženske?
Kateri športi so le za moške?
Kdaj so se športi dodajali?
Kaj še vpliva na izbiro športov?
Kakšne so smernice?
Hill AV. J Physiol 107:518-526, 1948
Kaj je zgodovinsko raziskovanje v kineziologiji
• Je sistematično raziskovanje in razlaganje razlik, ali zakaj jih ni, skozi čas na področju kineziologije.
• Kraj raziskovanja: arhivi, knjižnice, zgodovinska združenja, …
• Obdelujejo podatke kot ostali znanstveniki.
• Preverjajo veljavnost z namenom po čim večji moči posploševanja.
• Danes imajo tudi oni veliko potrebo po interdisciplinarnem pristopu raziskovanja.
Potek zgodovinske raziskave
• Izbira teme• Meja je le domišljija raziskovalca ali študenta.
• Olimpizem ali mišična fiziologija ali začetek organizirane športne vadbe ali …
• Izdelava paradigme• Predpostavke, dokazi, predstava, definicije, teorija in
podatki ter znanstvena vprašanja, ki vodijo raziskovalca.• Sekundarni viri – največkrat začetna točka
• Knjige, članki, filmi, slike, monografije, antologije, ...• Cilj je izvedeti čim več, spoznati različne vidike obravnave
paradigme, spoznati primarne vire, mreženje raziskovalcev.• Primarni viri
• Dejanski dokazi, dokumenti, obrazci, zapisniki, …• Znanstvena vprašanja
• Objektivnost: (i) kaj delamo?;(ii) kaj verjamemo?; (iii) kakšen pristop?
74
Filozofske raziskave v kineziologiji(več v Thomas & Nelson (2005). Research
methods in physical activity)
Being a philosopher, I have a problem to every solution (Zend R.)
• Celosten pristop raziskovanja, ki povezuje ugotovitve posameznih področij s ciljem po celostni interpretaciji
• Ko biokemiki, fiziologi, biomehaniki, sociologi in zgodovinarji razložijo pomen gibalne/športne aktivnosti na kakovost življenja…
• …filozofi definirajo kakovost življenja• Skozi prizmo etike.• Skozi prizmo povezav med posameznimi
ugotovitvami in faktorji kvalitetnega življenja.
Zakaj filozofski pristop
• Enostavno zato, ker dopolnjuje vse ostale.• Ker dopušča širše razmišljanje in širšo
interpretacijo.• FIZIOLOG: Dečki se gibajo za 10% več od deklic (P < 0.05).• FILOZOF: Razmejitev pojmov gibanje – šport, odnos otrok
starši, vrste igrač se med spoloma razlikujejo, manj mišične mase pri deklicah, boljša gibljivost pri deklicah lahko vpliva na višjo frekvenco gibov pri dečkih in s tem več gibanja, …
• Postmodernistične smeri filozofije• Metafizika: Analiza narave stvari.• Aksiologija: Analiza vrednot stvari.• Epistemologija: analiza vedenja in razumevanja vedenja.• Poezija: Razgradnja trditev.
Sinteza raziskav (Meta-analiza) v kineziologiji (več v Thomas & Nelson
(2005). Research methods in physical activity)
• Je analiza literature (ang. research the projects; review articles).
• Temelji na analizi predhodnih eksperimentalnih ali neeksperimentalnih podatkov (lat. ex post facto).• Za iskanje odgovorov na sedanje probleme.
• Danes imamo veliko obolenj srčno-žilnega sistema. Raziskovalec bo poiskal po zbranih podatkih zdravstvenih kartotek o možnih faktorjih za obolenja.
• Ni potrebno zbirati novih podatkov.
75
Namen Meta-analize• Pregledni članek (ang. review article)
• Analiza obstoječih objav področja vzeta pod skupni imenovalec, z namenom po iskanju še neodgovorjenih ali novih vprašanj.
• Izračun velikosti efekta (ang. effect size)• Če opazujemo le eno spremenljivko skozi več raziskav,
lahko izračunamo velikost efekta, ki je tudi lahko porazdeljena normalno.
• Lahko uporabljamo vse nam znane statistične metode.
• Kot opis problema v projektih, diplomah, magisterijih, doktoratih, …
• Pregled uporabljenih metod na področju.• Iskanje razlik med ugotovitvami pri uporabi drugačnih
vzorcev, merilnih postopkov in instrumentov.
Faktorji Meta-analize
• Kako je bila izvedena poizvedba?• Katere revije, splet ali hardcopy, ali tudi dizertacije,
…
• Katere raziskave smo potem vključili ali izključili iz obdelave in zakaj?
• Na osnovi vzorca, velikosti vzorca, kontrolne skupine, merilne metode, uporabe statistike, …
• Kako je raziskovalec povzel vse raziskave in jih povezal v zaključek?
• Ali frekvence, ki potrjujejo ali ovržejo hipotezo?• Ali utežena vsota (glede na velikost vzorca)
povprečnih vrednosti rezultatov?• Ali glede na “impact factor” revije.
Uporaba Meta-analize
• Za njo se odločimo, ko hočemo nasloviti pomemben problem.
• Jo uporabimo, da zmanjšamo število posameznih študij v eno preglednejšo.
• Za razliko od eksperimentalnega pristopa• Meta-analiza poroča o metodologiji izbora literature.• Rezultati posameznih študij so kvantificirani z “Velikostjo
efekta”, kar omogoča rabo statistike.• Sedem stopenj Meta-analize:
1. Identifikacija problema2. Ciljno iskanje literature3. Pregled izbrane literature, če ustreza pogojem vključitve4. Študiranje izbrane literature5. Računanje velikosti efekta6. Uporaba primerne statistične metode7. Poročanje o svojih ugotovitvah
76
Velikost efekta v Meta-analizah
• Izračunamo velikost efekta za vsako študijo.
• Preverimo, če je velikost efekta porazdeljena normalno.
• Izberemo ustrezno statistično metodo.• Primer
• Recimo, da želimo preveriti efekt intervencij za dvig GŠA med otroci (N = 15) in mladostniki (N = 12).
• Izračunamo povprečje in SD za otroke in mladostnike.• Izračunamo ES za vsako od 27 študij.• Preverimo normalnost in homogenost ES.• Če da, izberemo t-test za neodvisne vzorce.• Če značilno, potem so imele intervencije večji učinek na
eno izmed skupin.
Primeri Meta-analiz• Spol kot faktor v gibalnih
sposobnostih otrok.• Pri skoku v daljino, testu
agilnost (ang. shuttle run) in moči stiska pesti opazimo tip krivulje, ki je drugačen kot pri dolžini meta žogice.
Predstavitev velikosti efekta• Ponavadi kar grafično
• Z grafičnim prikazom pregledneje prikažemo očitne in manj očitne trende.
• Uporabimo interval zaupanja – glej prejšnje slike “gibalnih sposobnosti”.
• Ali pa...
77
Deskriptivno raziskovanje na osnovi anketiranja (ang. survey) v kineziologiji
Most surveys represent the average opinion of people who don’t know
• Temelji na zajemanju mnenja anketirancev o sedanjih dogodkih.
• Je najpogostejša kvalitativna metoda raziskovanja.
• Poznamo tri najpogostejše oblike anketiranja:1. Vprašalnik (ang. questionnaire)2. Metoda Delphi (ang. Delphi method)3. Osebni intervju (ang. personal interview)4. Normativna anketa (ang. normative survey)
Vprašalnik
• Tip anketiranja, ki temelji na odgovarjanju vprašanja zastavljenih na papirju ali zaslonu. • Ne opazujemo preiskovance!
• Dejstvo je, da nekatere podatke lahko zajamemo le na ta način, zato je to pogosto uporabljena metoda.
• Poznamo osem korakov zbiranja podatkov preko vprašalnika.
Vprašalnik – Definiranje ciljev
• Pomembno, da o tem razmišljamo že pred sestavljanjem vprašalnika.• Če prepozno, imajo podatki lahko le majhno
vrednost.• Pomembno, da razumemo področje in
pametno zastavimo vprašanja.• Pomembno, da vemo s kakšnimi metodami
želimo analizirati podatke.• Pomembno, da omogočajo primerjave med
skupinami.• Pomembno, da definiramo spremenljivke, ki jih
želimo analizirati. Drugače lahko kakšno ne zajamemo in onemogočimo analizo.
78
Vprašalnik – definiranje vzorca
• Določiti moramo kdo naj bo v vzorcu.• Če hočemo določeno informacijo pridobiti, moramo
anketirati tisti vzorec, ki to informacijo ima.• Vzorec ne sme biti preveč nehomogen, ker imamo lahko
veliko nesmiselnih odgovorov ali sploh neodgovorjenih vprašanj.
• Anketiranje zaposlenih na univerzi: strokovnih delavcev, asistentov, profesorjev, gostujočih profesorjev. Moramo zabeležiti tudi njihovo mesto dela.
• Vzorec izberemo naključno, vendar proporcionalno na tematiko.
• Če 80% dečkov, potem naj bo tudi v vzorcu 80% dečkov.• Če 45% brucov, 30% 2. letnikov, 25% 3. letnikov, potem naj
bo tudi vzorec tako proporcionalno, a naključno izbran.
• Vzorec določiti tudi glede na izbrane spremenljivke.
Vprašalnik – definiranje vzorca
• Potrebno navesti tudi napako vzorčenja
• Tako računamo, ko primerjamo en možen odgovor na druge možne odgovore.
• Če ne poznamo “p”, potem privzamemo, da je p = 0.5.
• Interval zaupanja• 68% interval zaupanja je ±·1SE in 95% interval zaupanja
je 1.96·SE:• Recimo, da profesorji športne vzgoje uporabljajo ohlajanje na
koncu ure. Predpostavimo, da to drži le v 20% in anketiramo 100 profesorjev. Standardna napaka vzorčenja je 7.8%. 95% interval zaupanja je ± 1.96·SE...[4.4%, 35.6%]. Če vzorec 200, potem pa [9.9%, 31.1%].
N
pp
NSE
)1(96.1
varianca96.1
−⋅⋅=⋅=
Vprašalnik – definiranje vzorca
• Izračun velikosti vzorca
• Zaželen SE je 3%• Če gremo na 95% gotovost, potem uporabimo faktor 1.96.
• Če želimo 99% gotovost, potem faktor 2.56.
2
2 )1(96.1
SE
ppN
−⋅⋅=
N SE
5 ±41%
20 ±22%
50 ±14%
100 ±10%
250 ±6.2%
500 ±4.4%
1000 ±3.1%
2000 ±2.2%
5000 ±1.4%
0%
10%
20%
30%
40%
50%
0 1000 2000 3000 4000 5000
Velikost vzorca / N
± S
E
0
5000
10000
15000
20000
25000
30000
Str
oše
k /
EU
R
SE Stroški
79
Vprašalnik – definiranje vzorca
• Izračun velikosti vzorca “končne” populacije
• Zaželen SE je 3%!!!• Če gremo na 95% gotovost, potem uporabimo faktor 1.96.
• Če želimo 99% gotovost, potem faktor 2.56.
)1(96.1)1(
)1(96.122
2
ppSEN
ppNn
−⋅⋅+⋅−−⋅⋅⋅=
Še grafično...izračun N pri končni populaciji
Vprašalnik – Dizajniranje vprašalnika
• Vedno zelo težavna naloga.• Začnemo s tabelo spremenljivk.• Nadaljujemo s tabelo povezav med njimi.• Preverimo, če nam bodo vprašanja dala prave
odgovore.• Prosimo prijatelje, da pokomentirajo vprašanja.
• Izberemo pravilen format vprašanj.• S tem dobimo spremenljivke v želenem formatu
oziroma merski skali.• Tu se izbira statistika, ki jo želimo uporabiti.• Nekaj primerov različnih formatov vprašanj
sledi…
80
Vprašalnik – Format vprašanj
• Vprašanja odprtega tipa.• Je tip vprašanja, ki omogoča preiskovancu izraziti svoje
občutke, voljo, ideje, …• Kako ti je všeč tvoja služba?• Opiši vse temeljne naloge tvojega dela.
• So najlažja za sestavit, vendar jih preiskovanci ne marajo preveč
• Zahtevajo več časa za odgovor, preiskovanci se lahko počutijo “pod mikroskopom”.
• Imamo manjšo kontrolo nad odgovori.• Preiskovanci lahko odtavajo od biti vprašanja.
• Jih težje grupiramo v kategorije za interpretacijo.• Vendar, nam lahko nudijo najbolj celovite odgovore, ki ji
lahko obdelamo zgolj z opisnimi metodami (frekvence, splošni vtisi, …).
• Zato jih največkrat uporabljamo pilotno, da na osnovi njih izdelamo vprašanja zaprtega tipa.
Vprašalnik – Format vprašanj
• Vprašanja zaprtega tipa.• Je tip vprašanja, ki zahtevajo od preiskovanca
specifičen odgovor in najpogostejši so:• Rangirani – zahtevajo vrsti red (po pogostosti,
velikosti, pomembnosti, …). Lahko jih analiziramo s kvantitativnimi metodami. Primer: razvrsti po težavnosti delavne naloge tvojega delovnega mesta.
• Skalirani – zahtevo stopnjo strinjanja z določeno trditvijo (se zelo ne strinjam, se ne strinjam, …, se možno strinjam) ali relativno frekvenco (nikoli, redko, včasih, …, pogosto, zelo pogosto). Uporabljamo Likertovo lestvico s 3 do 9 stopnjami. Razlike med stopnjami so lahko ekvidistančne.
• Kategorični – zahtevajo le odgovore tipa 1/0. Taka vprašanja se hitro rešijo, vendar s tem izgubimo na občutljivosti, saj neodločeni težko odgovarjajo.
Likertova skala
81
Vprašalnik – strukturiranje vprašanj• Včasih gnezdenje vprašanja ali podvprašanja ob
določenem odgovoru.• Ali so na vašem delovnem mestu prisotne vibracije? ______ (da/ne)
• Če da, koliko povprečno ur dnevno ste jim izpostavljeni? ______
• Pravila sestavljanja vprašalnika.• Izogibajte se besed brez pravega pomena.
• “ponavadi”, “pogosto”, “splošno”, …• Uporabljajte kratka vprašanja.• Ne uporabljajte dvo-delnih vprašanj, ki omogočajo deljena mnenja
o prvem in druge delu.• Čeprav bi vsak moral znati plavati, se na UP PEF ne bo preverjalo
znanje plavanja. ______ (se zelo ne strinjam / se ne strinjam / neodločeno / se strinjam / se možno strinjam)
• Izogibajte se negiranju v vprašanjih.• ŠV na razrednem pouku naj ne bi poučeval profesor ŠV. _____ (…)
• Izogibajte se uporabi tehničnih in strokovnih besed.• Ne vplivajte na odgovor preiskovanca.
• Ker profesorji delamo težko, bi morali imeti višje plače. ______ (…)
Vprašalnik – Izgled in dizajn vprašalnika • Najprej nam mora biti jasno, da ljudje ne maramo
vprašalnikov.• Zato jih moramo pritegniti z izgledom, odnosom, dizajnom,
…• Od tega je zelo odvisen odstotek vrnitve vprašalnika (ang.
return rate)• Kako doseči bolj dopadljiv vprašalnik za višjo
frekvenco vrnitve izpolnjenih vprašalnikov?• Lahko že malenkosti: barvni papir, črtkane črte, ki vodijo od
vprašanja do odgovora, …• Naslov in kontakt raziskovalca.• Kratka in razumljiva navodila z jasnimi primeri.• Prvih nekaj vprašanj naj bo lahkih, težka vprašanja naj
bodo olajšanja, paziti na utrujenost preiskovanca.• Vprašalnik naj bo dovolj kratek in dovolj dolg za vsa
potrebna vprašanja.
Primer največkrat uporabljenega vprašalnika v kineziologiji
82
Vprašalnik – Pilotna študija
• Pilotna študija je sicer priporočljiva za vsak tip raziskave, vendar je zelo nujna za anketiranje!• Prvič lahko v krogu prijateljev.
• Jasnost navodil.• Dolžina vprašanja in vprašalnika.• Dvoumnost vprašanj.
• Drugič že pošljemo manjšemu vzorcu in analiziramo vsak odgovor in smo pozorni na:
• Enaki odgovori. Možnost neobčutljivosti vprašanja.• Nepričakovane odgovore. Možnost nejasnosti vprašanja.• Neodgovorjena vprašanja. Možnost nejasnosti, žalitve.
• Izvedemo že statistiko na podatkih pilotne študije, da vidimo kaj se bo dalo.
• Če veliko sprememb po pilotni študiji, potem je dobro, da izvedemo še eno pilotno študijo.
Vprašalnik – Spremna stran vprašalnika (ang. cover letter)• Spremna stran je zelo pomembna, ker:
• Od nje je odvisna frekvenca vrnjenih vprašalnikov.• Naj se osebno naslovi preiskovanca ali preiskovano
institucijo (ne z “dragi preiskovanec”)• Naj se pove namen raziskave.• Naj se pove o varovanju osebnih podatkov.• Naj se pove financerje raziskave oziroma poišče in
navede podporo vodstva podjetja, če anketiramo zaposlene.
• Lahko z anketo pošljete tudi nek simbolični denar (npr. 1 EUR), kot simbol spoštovanja.
• Navedite pomembne datume (do kdaj vrniti – običajno en do dva tedna, kdaj povratne informacije, če sploh).
• Jo lektorirati.• Jo podpisati, ožigosati, navesti kontakte.
Vprašalnik – Pošiljanje vprašalnika
• Je en glavnih stroškovnih nosilcev.• Potrebno najti pravi timing.
• Ne med počitnicami, direktno pred njimi ali po njih. Izogibajmo se navalom dela.
• Priskrbeti pogoje za brezplačno oddajo izpolnjene ankete.
• Priložiti prazno kuverto z naslovom in znamko.
• Navesti rok vrnitve izpolnjene ankete.• Danes vse več po faksu, emailu ali direktno
na spletni strani.• Frekvenca vračanja primerljiva.• Ampak s tem omejimo naš vzorec na imetnike
spletnega dostopa, emaila, faksa.
83
Vprašalnik – Ponoven poziv
• Ne smemo pričakovati 100% frekvenco vračanja!• V realnosti nekje okrog 50%.
• Dokazano so ponovni pozivi učinkoviti.• 10 dni po poteku roka poslati vljuden opomin.
• Navedemo pomembnost njihovih odgovorov.• 20 dni po poteku roka še 1-krat anketo z kuverto in
znamko.• Za tiste, ki so izgubili anketo iz prvega pošiljanja.
• Biti moramo vljudni in taktični in krivdo za njihovo neodzivnost pripisati nam.
• Velja pa še:• Frekvenca vračanja pod 20% priča o neveljavni študiji.• Priporočajo do dodatno analiziramo vzorec, ki ni oddal, če
jih je vsaj 20%.• Naključno izberemo 5% njih in jih kontaktiramo ter prosimo,
da izpolnijo vprašalnik. Če so rezultati primerljivi, potem lahko predpostavimo, da je vzorec, ki smo ga dobili naključen.
Vprašalnik – Analiza podatkov in priprava poročila• Velikokrat se srečamo s takšnim prikazom:
• Ta nas ne sme zadovoljiti.• Uporabiti moramo statistične metode, kot za
eksperimentalne podatke.• Neparametrične!!! (raje kot parametrične)
Moje delovno mesto je zelo nevarno za zdravje.
0
5
10
15
20
25
30
35
40
Se zelo nestrinjam
Se nestrinjam
Neodločeno Se strinjam Se zelostrinjam
Fre
kven
ca
Metoda Delphi anketiranja
• Tip anketiranja, ki temelji na odgovarjanju vprašanja zastavljenih na papirju ali zaslonu.• Vendar, vprašalnike pošiljamo toliko časa, da
sprejmemo nek dogovor, cilj, konsenz, …• Zato ga tipično pošiljamo le strokovnjakom področja.
• Vsaka iteracija anketiranja se imenuje krog.• Prvi krog ponavadi vsebuje vprašanja odprtega tipa.• V nadaljnjih krogih so vprašanja vse bolj ciljno
naravnana (zaprtega tipa).• Preiskovanci (v nadaljnjih krogih) vedno dobijo povzetek
prejšnjega kroga.• Ključno je zagotoviti anonimnost.• Tipična raba za:
• Pisanje novih zakonov, pravil, usmeritev, kurikulov, programov dela, …
84
Osebni intervju
• Tip anketiranja, ki temelji na odgovarjanju vprašanja zastavljenih osebno preko telefona ali srečanja.• Zaradi boljše veljavnosti odgovorov.• Zaradi večje frekvence vračanja.• Zato tipično manjši vzorci.
• Veljajo podobna pravila kot za vprašalnike.
• Potrebno trenirati izpraševalca.• Dokazano se veljavnost poveča, če je
izpraševalec predhodno treniran.
Osebni intervju – treniranje izpraševalca• Zakaj in kako?
• Dokazano se veljavnost poveča, le če je predhodno treniran.
• Veljavnost pada če ni treniran predhodno, ker se izpraševalec sam uči in podatki izgubijo na primerljivosti.
• Na začetku mora ustrezno predstaviti vsebino spremnega pisma.
• Mora enako voditi vse preiskovance skozi intervju.
• Mora hitro in pravilno kodirati odgovore.• Ne sme sugerirati odgovorov.• Mora se držati vsebinskih okvirov vprašalnika.
Osebni intervju – vrsta vprašanj
• Podobno kot v vprašalniku.• Kvalitativna in kvantitativna.
• Štiri vrste vprašanj pri intervjujih:• Hipotetična
• Predpostavimo, da vodite športno vzgojo. Na kakšno vadbo bi dali poudarek v današnjem času?
• Tipa “hudičev advokat”• Ljudje so mnenja, da je z današnjo generacijo otrok znatno
upadla njihova kvaliteta življenja. Kaj vi menite od tem?• Iz pozicije ideala
• Koliko, po vašem mnenju, naj bi bilo idealno število ur športne vzgoje v osnovni šoli?
• Interpretivna• Bil rekli, da je gibalno stanje otrok danes slabše kot je bilo
vaše?
85
Osebni intervju – prednosti pred vprašalnikom• Intervju omogoča obrazložitev vprašanja, če
potrebno.• Vprašanja intervjuja se lahko bolj prilagodi
anketirancu.• Imamo možnost opazovanja anketiranca, kar nam
nudi dodatno informacijo o njemu ali o naših vprašanjih.
• Intervju ima višjo frekvenco vračanja.• Nekateri anketiranci imajo rajši osebni stik
intervjuja.• Lahko manipuliramo z utrujenostjo anketiranca.• V določenih primerih je uporaben tudi na otrocih.
• Se postavimo v vlogo prijatelja in ne avtoritativne osebe.• Se moramo vživeti v igro velikega zanimanja.• Nikoli jih ne umikamo iz razreda med intervjujem.• Uporabljamo nestrukturirane vprašalnike in jih spretno
vodimo.
Telefonski intervju• Bolj in bolj popularen.
• Stroški so za polovico manjši kot pri osebnih intervjujih.• Krajši čas intervjuja.• Lahko si pomagamo z računalniki in podporno informacijsko
opremo za kontrolo kakovosti dela.• Dostop do ljudi je lahko hitrejši in cenejši.• V vzorec lahko vzamemo preiskovance iz velikega
geografskega področja – boljša veljavnost.• Preiskovanci so iskrenejši po telefonu.• Vnos podatkov in analiza je lahko avtomatska in takojšnja.
• Ima tudi slabosti.• Vzorec ni najbolj primerno izbran, še posebej to velja za
področja kineziologije in športa.• Uporabljajo generiranje naključnih telefonskih številk.• Klicanje popoldne – tipično po 17 uri.
• Tempo življenja ne dopušča časa anketirancu.• Predklicno sporočilo je v tem primeru učinkovito.
• Neprimerna metoda za anketiranje ljudi brez telefona.
Normativna anketa (ang. Normative survey)• Je metoda zbiranja podatkov o
sposobnostih, spretnostih, zmogljivostih, prepričanjih, odnosu, … z uporabo ali standardiziranih vprašalnikov ali testov.
• Gibalne sposobnosti otrok, nivo fizične priprave različnih populacij, psiho-fizične sposobnosti delavcev, SPPB, športno-vzgojni karton, …
• Tovrstni vprašalniki in testi za posamezna področja že obstajajo in so standardizirani.
• Vprašanja in odgovori so standardizirani.
• Lahko skonstruiramo nove in potem v prečnem raziskovanju poiščemo normativne podatke različnih populacij.
• Težava nastopi, ko različni merilci izvajajo meritev – zbirajo podatke. S tem se poveča standardna napaka merjenja normativnih anket.
• Normativni podatki se lahko spreminjajo iz generacije v generacijo (npr. ITM, FM, ...)
86
Opazovanje (ang. Observational study)• Je najbolj zapostavljena metoda raziskovanja.• Temelji na opazovanju preiskovancev.
• S tem ne posegamo v njihov proces.• Dobimo najbolj veljavne podatke – brez subjektivnih vplivov
preiskovancev.• Uporabljamo različne tehnike:
• Vizuelno, video-, foto-, audio-dokumentacija.• Predhodno pripravimo spisek dogodkov, ki jih bomo opazovali.
• Prednosti• Lahko dogodek direktno opazimo in označimo, ni potrebno
uporabljati spomina.• Imamo naravno okolje dogodkov.• Raziskovalec lažje oceni pravi dogodek od nepravega.• Primerno za analizo gibanja otrok oziroma drugih občutljivih
dogodkov ali preiskovancev.• Slabosti
• Včasih težko prepoznamo dogodek.• Težko dovolj hitro in natančno beležimo dogodke.• Efekt različnih opazovalcev
Analiza vsebine (ang. Content analysis)
• Temelji na analizi vsebine dokumentov (slik, video, tekstov, reklam, spleta (blog), …).• Izberemo dokumente, ki jih bomo analizirali.• Identificiramo predmete opazovanja in jim dodelimo kode.• Umestimo članke, tekste, stavke, grafe, … med posamezne
predmete opazovanja.• Analiziramo rezultate – frekvence.
• Prednosti (isto kot pri opazovanju)• Lahko dogodek direktno opazimo in označimo, ni potrebno
uporabljati spomina.• Imamo naravno okolje dogodkov.• Raziskovalec lažje oceni pravi dogodek od nepravega.• Primerno za analizo občutljivih dogodkov ali preiskovancev.
• Slabosti• Včasih so že mediji neuravnoteženi (MOK, Demokracija).• Ne gre verjeti le enemu “časopisu”. Vedno preveriti več njih.
Epidemiološke raziskovalne metode(več o tem na predmetu Epidemiologija in ergoepidemiologija)• V letih od 1940 do 1960 so se začela raziskovanja
tega področja.• S ciljem poiskati povezavo med gibanjem in zdravjem
človeka.• S ciljem identificirati faktorje rizika za zdravje, predvsem
srčno-žilnega sistema in umrljivosti na sploh.
• Danes poznamo že mnogo vplivov gibanja na človeka.• Na srce in ožilje, presnovo, kostno maso, mišični volumen in
tonus, delovanje možganov, rakasta obolenja, mentalno zdravje, … na kvaliteto življenja!
• Cilj področja danes pa je, kako populacijo prepričat k več gibanja in s tem k boljšemu zdravju.
87
Epidemiologija – neekseperimentalne vs. eksperiementalne metode
• V neeksperimentalnem pristopu raziskovalec opazuje navade ljudi (gibalne, alkohol, kajenje, prehrana, stres) in jih povezuje z njihovim zdravstvenim stanjem.• Navade (razvade) ljudi … neodvisna spremenljivka.• Zdravstveno stanje … odvisna spremenljivka.• Je edini možen način za pridobivanje podatkov.
• V eksperimentalnem pristopu bi želeli isto, vendar tak pristop razumljivo ni etičen.• Pomagamo si lahko s poskusi na živalih – zopet ni najbolj
etično.• Pomagamo si lahko s simuliranimi okolji (brez gravitacije,
specifična lokalna okolja – onesnaženost, bolezenska in poškodbena stanja).
Kaj je epidemiologija?
• Je znanost, ki išče frekvence (prevalenco, incidenco, smrtnost) in vzorce (oseba, prostor, čas) determinant (sprememb) zdravja, in z zdravjem povezanih stanj, različnih populacij ter aplikacija teh znanj za regulacijo (prenos v prakso)zdravstvenih težav.
Epidemiologija – Frekvence in vzorci• Porazdelitev bolezenskih stanj merimo s frekvenco in
vzorci v populaciji.• Frekvenca (Kako pogosto se to bolezenski stanje
pojavi?) merimo z:• Prevalenco
• % ljudi, ki imajo neko bolezen v določenem trenutku.• Incidenco
• % novih ljudi, ki imajo neko bolezen v določenem trenutku.• Smrtnost
• % ljudi, ki je umrlo zaradi določene bolezni v določenem trenutku.• Vzorec (se nanaša na vzorec pojavnosti bolezni) in ga
merimo z:• Osebo
• Socio-ekonomski in demografični podatki (starost, spol, ekonomski status, število otrok, …).
• Prostorom• Geografski in klimatski podatki, delovno okolje – poklici, …
• Časom• Letni čas, dnevni čas, …
88
Epidemiologija – Determinante zdravja• Je vsak faktor, ki prinese spremembo
stanja zdravja.• Determinante bolezni ponavadi označimo z
rizičnimi faktorji, ker povečajo rizik nastopa bolezni.
• Rizični faktorji za bolezni srca so: debelost, visok pritisk, visok HDL in nizek LDL holesterol, nizka količina in intenzivnost gibanja, …
• Te determinante lahko merimo in spremljamo in s tem predvidevamo posledice.
Epidemiologija – Aplikacija znanj• To je nedvomno največji cilj epidemioloških
raziskav.• Kar epidemiolog ugotovi, to mora delavec v
zdravstvu aplicirati s ciljem po boljšem življenjskem okolju.
• Drugo ime za aplikacijo znanj je tudi diseminacija in translacija znanj.• Od dviga motivacije ljudi do vplivanje na
programe za varovanje zdravja.• Vplivanje na strateško ravnanje z resursi (tudi
finančnimi), z namenom zgodnjega boja proti posledicam rizičnih faktorjev.
Osnovne definicije gibalne/športne aktivnosti (GŠA)• Gibanje
• je vsakršni premik telesa ali dela telesa, ki je izzvan s krčenjem skeletnih mišic in poveča bazalno energijsko porabo.
• Šport • je nadpražno gibanje, s ciljem po napredovanju ali vzdrževanju
psiho-fizične priprave, s tekmovalnostjo in v okviru pravil.• Vadba
• planirano, strukturirano in ponavljano gibanje telesa s ciljem po napredovanju ali vzdrževanju psiho-fizične priprave.
• Fizična priprava• je multikomponentni koncept atributov (gibalnih sposobnosti), ki
jih ljudje imamo in nam omogočajo izvajanje gibalnih spretnosti.• Frekvenca gibanja
• število ponovitev na teden ali leto.• Trajanje gibanja
• število minut, ki jih preživimo v določeni gibalni aktivnosti.• Intenzivnost gibanja
• težavnost gibanja, merimo v MET (nizka, srednja in visoka).
89
Metode spremljanja gibalne/športne aktivnosti• Vprašalniki
• Dolgoročni (priporočljivi v epidemioloških študijah).• Dobra natančnost za visoko-intenzivno GŠA.
• Kratkoročni (ang. short recall).• Tipično le za zadnji teden – ampak bolj detajlno z 5-15
vprašanji in s tem bolj natančno.
• Kvantitativna zgodovina• Zelo detajlno, tudi na delovnem mestu, domačinstvu,
transport, …• Vprašanje točnega navajanja podatkov.
• Kvantitativni instrumenti• Pedometri• Merilniki pospeška• Merilniki srčne frekvence• Dvojno označen urin• GPS
Pedometri
Kang et al. (2009). Res Quart Exerc Sport 80(3)
90
GPS
Cooper et al. (2010). Int J Behavior Nutr Phys Act
Šimunič et al. (2010). Zdravstveno varstvo (in press).
Merilnik pospeška
0
2000
4000
6000
8000
07:12:00 09:36:00 12:00:00 14:24:00 16:48:00 19:12:00 21:36:00
Čas
cou
nts
/m
inu
te
Četrtek T
0
2000
4000
6000
8000
07:12:00 09:36:00 12:00:00 14:24:00 16:48:00 19:12:00 21:36:00
Čas
cou
nts
/m
inu
te
Petek
0
2000
4000
6000
8000
07:12:00 09:36:00 12:00:00 14:24:00 16:48:00 19:12:00 21:36:00
Čas
cou
nts
/m
inu
te
Nedelja T
Povprečje: 518 cpmNeaktivnost: 80 %Lahka: 17 %Srednja +: 3 %
Povprečje: 223 cpmNeaktivnost: 91 %Lahka: 8 %Srednja +: 1 %
Povprečje: 413 cpmNeaktivnost: 83 %Lahka: 15 %Srednja +: 2 %
91
Epidemiološki dizajni deskriptivnih raziskav• Prečni raziskovalni dizajn (ang. cross sectional
design).• Merijo stanje v le eni časovni točki. Zato jih je enostavno za
izvest.• Razlike med skupinami (športniki veterani, rekreativci,
sedentarni).• Primerjamo individualne podatke posameznikov in ne
skupine.• Po potrebi podatke korigiramo z ANCOVO, če kovariatni faktorji
prisotni (npr. telesne maščobe).• Ali v raziskavo vključimo le tiste s tarčno telesno maščobo.
• Slabosti prečnega dizajna• Ker merimo v isti točki, ne vemo kateri faktor je vplival na
rezultat. Ni vedno isto zaporedje aktivnosti pred meritvijo.• Včasih ne ugotovimo longitudinalnih efektov.
• Lahko, da ne ugotovimo povezave med vnosom maščob in holesterolom v krvi. A v longitudinalni študiji to zagotovo ugotovimo.
Epidemiološki dizajni deskriptivnih raziskav• Ekološki raziskovalni dizajn (ang. ecologic design).
• So zelo poceni, saj uporabljajo podatke iz nacionalnih baz podatkov.
• Popis prebivalstva, poraba hrane, baz zaposljivosti, statistični zdravstveni podatki – WHO, …
• Torej idealno za ergonomske analize• Vozniki avtobusov imajo 2-krat večjo incidenco srčno-žilnih
obolenj kot kondukterji.• Smrtnost je največja pri tistih moških, ki imajo fizično lahko
delovno okolje in narašča z njihovo starostjo.• Slabosti
• Testiramo na nivoju celotne populacije, kar pomeni, da ne moremo povezati podatke na posameznika.
• Ne moremo kontrolirati efekt še ostalih kovariat.• Ne moremo kontrolirati za parcialno korelacijo.
• Ugotovili so, da veliko vnesenih maščob vpliva na pojavnost raka na dojki.Temu je res le v primeru, da ima ženska nizko razmerje 2-hydroxyestrone/16a-hydoxyestrone in hkrati malo GŠA ter visok indeks telesne mase.
Model kroničnih obolenj
• Naravna zgodovina obolenja
• Kronične bolezni se razvijajo več (tudi do 40) let, da jih lahko diagnosticiramo.• Epidemiolog želi dovolj zgodaj preusmeriti naravno pot
razvoja bolezni, ki je taka:• Indukcijska faza – obdobje od točke, ko je rizični faktor začel
spreminjati zdravje do diagnoze bolezni.• Pojav – obdobje po diagnozi.• Primarna preventiva – preventiva prvega znaka bolezni.• Sekundarna preventiva – preventiva pojava bolezni.• in Nastop bolezni, ki je nekje med prvimi znaki in diagnozo.
92
Epidemiološki dizajni eksperimentalnih raziskav• Kohortne raziskave (ang. cohort studies)
• Najprej izberemo vzorec zdravih ljudi in jih razdelimo v skupine, glede na ogroženost – izpostavljenost nekemu faktorju.
• Naredimo inicialne meritve in jih potem redno spremljamo dalj časa (2 do 20 let).
• Opazujemo redke dogodke, ki nas zanimajo (rakava obolenja, smrtnost, …).
• Primerjava med skupinami je lahko absolutna (razlika) ali relativna (količnik skupine s kontrolno skupino). Slednji količnik je relativni rizik (<1 zmanjšuje rizik-ugoden efekt, 1 ni rizika, >1 povečan rizik)
Epidemiološki dizajni eksperimentalnih raziskav• Kohortne raziskave (ang. cohort studies)
• Prednosti• Točno vemo, da je bila izpostavljenost faktorju pred nastopom
dogodka, kar popolnoma sledi naravnemu toku bolezni.• Primerne za redke dogodke – bolezni.• Primerne za opazovanje več dogodkov.
• Ne le srčnega infarkta, temveč tudi Parkinsonove bolezni, srčne kapi, smrtnosti, samomora, …
• Slabosti• Potrebno slediti ogromno število ljudi.• Veliko število izrednih izstopov (pred dogodkom) lahko
povzroči nenaključen vzorec.• Nekateri dogodki so tako redki, da jih niti z velikim vzorcem in
veliko število let ne zaznamo.• 17000 moških, 6 let, da so zaznali 572 srčnih infarktov.
Pri moških 42.2 srčnih kapi / 10000 moških v letu.Pri ženskah le 9.8 srčnih infarktov / 10000 žensk v letu.
Epidemiološki dizajni eksperimentalnih raziskav• Študija vzrokov bolezni (ang. case-control studies)
• Primerja dve skupini preiskovancev: skupino primerov (ang. case group) z določeno preiskovano boleznijo, in kontrolno skupino (ang. control group), enakovredno (po spolu, starosti, etničnosti, otrocih, …), brez te bolezni.
• Študija vpliva nizke GŠA na incidenco raka dojk pri ženskah < 40 leti: 545 obolelih + 545 neobolelih žensk iz istega geografskega področja, v času med 1983–89. Torej primerljivi skupini.
• Obe skupini analiziramo: tipično z vprašalniki in intervjuji o času pred pojavom bolezni.
• Izračunamo mero vpliva nekega dejavnika na nastanek bolezni rizik bolezni (ang. odds ratio).
Količina GŠA N bolezen/ni bolezni UV rizik bolezni MV rizik bolezni
0 ur/teden 195/154 1.0 1.0
0.1 – 0.7 ur/teden 103/90 0.92 (0.65 – 1.32) 0.95 (0.64 – 1.41)
0.8 – 1.6 ur/teden 84/102 0.66 (0.46 – 0.95) 0.65 (0.45 – 0.96)
1.7 – 3.7 ur/teden 103/100 0.82 (0.58 – 1.17) 0.80 (0.54 – 1.17)
> 3.8 ur/teden 61/99 0.50 (0.34 – 0.73) 0.42 (0.27 – 0.64)
93
Epidemiološki dizajni eksperimentalnih raziskav• Študija vzrokov bolezni (ang. case-control
studies)• Prednosti
• Ponavadi so to prve študije, ki veljavno povežejo določeni faktor z določeno boleznijo in so znatno cenejše od ostalih kohortnih študij.
• So primerne za študije redkih bolezni, ker ne potrebujemo velikega N za dovolj veliko incidenco bolezni ali dolgega longitudinalnega spremljanja.
• Lahko analiziramo več dejavnikov določene bolezni hkrati –multivarianta analiza.
• Omogoča celovitejšo spremljanje nastanka bolezni.
• Slabosti• Ponavadi je težko sestaviti primerljivo kontrolno skupino.
• Kontrolna skupina ni več reprezentativna populaciji temveč skupini primerov bolezni. Lahko izberemo nenaključno skupino in to vpliva na končni rezultat.
• Preiskovanci z boleznijo doživljajo svojo zgodovino drugače kot če bi bili zdravi – vpliv na poročanje o svoji zgodovini.
Epidemiološki dizajni eksperimentalnih raziskavNevarnosti veljavnosti v epidemioloških študijah:• Sistematično odstopanje od prave vrednosti (ang. bias).
• Poznamo več razlogov za tovrstno odstopanje:• Percepcija merilca, merjenca, motivacija, natančnost
instrumenta, naključnost vzorca, sugeriranje vprašalnika, intervjuja, nenatančnost navodil (Kaj je GŠA?)…
• Dodatni faktor, ki zamegli pravi odnos med faktorjem in rezultatom (ang. confunding factor)• Je faktor, ki tudi vpliva na končni rezultat, podobno kot pravi
faktor.• Kajenje poleg GŠA lahko vpliva na neko bolezen. To rešimo
tako, da:• Uporabimo multivariante statistične metode in gledamo razlike
med univariantno izračunanim rizikom bolezni (ang. unadjusted) in multivariantno korigiranim (ang. adjusted). Če veliko razlika – potem je velik vpliv tega faktorja.
• Lahko pa tudi stratificiramo vzorec (kadilci in nekadilci posebej).
Epidemiološki dizajni eksperimentalnih raziskav• Naključne raziskave (ang. randomized trials)
so namenjene testiranju vpliva nekega pravega faktorja na določeno zdravstveno stanje.• Ponavadi z uporabo eksperimentalne in kontrolne skupine.
• Klinične študije (ang. clinical trials): gledamo na spremembo zdravja posameznika.• Kontrolni skupini ne smemo odvzeti zdravljenja!
• Zato na področju raziskav vpliva GŠA na zdravje iščemo tako kontrolno skupino, ki ima tako vrsto GŠA, ki biološko ne vpliva na zdravje ljudi kot GŠA v eksperimentalni skupini.
• Primer je študije dodatne organizirane vadbe na zdravje, kjer eksperimentalna skupina izvaja vodeno organizirano vadbo (tek, kolesarjenje, telovadba, igre z žogo, gimnastika, pilates, …), medtem ko kontrolna le tisto GŠA, ki jo izvajajo tekom življenjskega sloga oziroma življenjskih navad (sprehod, pospravljanje, vrtnarjenje, …).
94
Epidemiološki dizajni eksperimentalnih raziskav• Naključne raziskave (ang. randomized trials) so
namenjene testiranju vpliva nekega pravega faktorja na določeno zdravstveno stanje.• Ponavadi z uporabo eksperimentalne in kontrolne skupine.
• Študije skupnosti (ang. community trials): s ciljem po spremembi življenjskega sloga v določeni skupnosti.• Zakaj skupnost?: (1) s ciljanjem na celotno skupnost lahko
dobimo več primerov bolezni, (2) v skupnosti lažje izvedemo spremembo življenjskih navad, (3) socialni faktor je močen pri življenjskem slogu, (4) intervencije se izvajajo v njihovem življenjskem okolju in (5) so logistično lažje izvedljive.
• Ciljamo jih lahko z več intervencijami (park, mediji, oznake na zdravi hrani, športni dogodki, …).
• Potrebno izvesti enako raziskavo na več eksperimentalnih in več kontrolnih skupnostih.
• V najenostavnejših primerih le v eni eksperimentalni in eni kontrolni skupnosti.
• V tem primeru ne vemo zakaj je prišlo do razlik! Le predpostavljamo!
Eksperimentalne inkvazi-eksperimentalne raziskave
• Eksperimentalni pristop poskuša dokazati odnos med vzrokom in posledico (ang. cause-and-effect)!
• Je najbolj robusten način!
Trije kriteriji za določanje odnosa med vzrokom in posledico
• Doseči moramo tri kriterije odnosa med vzrokom in posledico:1. Vzrok mora nastati pred časom posledice.
• Vpliv pijače z ogljikovimi hidrati (OH) mora biti pred začetkom kolesarjenja.
2. Obstajati mora povezava (korelacija) med njima.• Vemo že, da le povezava ni dovolj za določitev odnosa
med vzrokom in posledico.• Obstajati mora povezava med količino vnosa OH in
časom testa.
3. Povezava med njima ne more biti pojasnjena še z neko drugo spremenljivko.• Preveriti moramo, če slučajno na čas testa vpliva tudi
starost, spol, vnos kofeina, anabolnih steroidov, …
95
Kaj določa odnos med vzrokom in posledico?• Ni statistika!• Samo z aplikacijo logičnega razmišljanja v dobro
dizajnirane eksperimente.• Določimo, da obstaja le ena možna razlaga za spremembe
v odvisni spremenljivki in to je manipulacija neodvisne spremenljivke.
• To pa lahko dosežemo z:• Dobro preštudiranim teoretičnim ozadjem.• Uporabo pravih preiskovancev.• Uporabo pravega eksperimentalnega dizajna.• Pravilno uporabo kontrole eksperimenta (pravega
faktorja).• Pravilno izbiro odvisne spremenljivke in postopkov
merjenja.• Pravilno izbiro statistične metode.• Pravilno interpretacijo rezultatov.
Tipi eksperimentalnih dizajnov
• Pravi eksperimentalni dizajn je eno najmočnejših raziskovalnih orodij.• Njihov namen je povečati variabilnost med skupinami in
zmanjšati variabilnost znotraj skupin (error). To je kar povečanje razmerja F.
• Ko dizajniramo raziskavo največkrat želimo pokazati vpliv pravega faktorja (neodvisne spremenljivke) na odvisno spremenljivko. Kar pomeni dovolj velik F, da te razlike lahko statistično potrdimo.
• Največkrat določajo pravo vrednost raziskave.• Poznamo tri tipe:
• Pred-eksperimentalni dizajn.• Pravi eksperimentalni dizajn.• Kvazi eksperimentalni dizajn.
Pred-eksperimentalni dizajn
Nimajo naključne razdelitve preiskovancev v skupine in le malo kontrolirajo veljavnost. Niso uporabni za resne študije!
• Študija z eno meritvijo.• Eksperimentalna skupina (ES) dobi pravi efekt (T), čemur
sledi meritev (O).• Ni kontrolne skupine (KS).• Vse kar lahko rečemo, da je ES v nekem času imela odvisno
spremenljivko (OS) določene vrednosti.• O ne moremo povezati s T.
• Vpliv vrhunskega športa na zdravje, gibalne sposobnosti, telesne značilnosti. Brez kontrolne skupine.
T O
96
Pred-eksperimentalni dizajn
• Ena skupina s pred- in post- meritvijo.• ES dobi pred-meritev (O1), potem T, čemur sledi post-
meritev (O2).• Ni KS.• Ugotovimo lahko spremembo (O2 – O1). Vendar je ne
moremo pripisati T.• Bed rest z 10 preiskovanci v ES. Spremembe se lahko zgodijo
tudi zaradi zgodovine vadbe ali življenjskega sloga preiskovancev. Recimo, da je nekdo veliko treniral in potem šel v bed rest. Ali ne bi bilo isto tudi, če bi samo nehal trenirati.
• Podobno pri otrocih, ko imamo razvojni efekt poleg apliciranega T.
• Uporabimo t-test/ANOVA za odvisne vzorce za testiranje razlik.
O1 T O2
Pred-eksperimentalni dizajn
• Primerjava s statično skupino.• Nimamo naključne razdelitve• ES dobi T in opravimo le po-meritev (O1).• KS ne dobi T in opravimo le meritev (O2).• Ne vemo, če sta bili skupini enaki na začetku, kar
onemogoči interpretacijo razlik med O1 in O2. Lahko so bile razlike prisotne že na začetku in ne zaradi T.
• Vpliv vrhunskega športa na zdravje, gibalne sposobnosti, telesne značilnosti. Z kontrolno skupino.
• Uporabimo t-test/ANOVA za neodvisne vzorce
T O1
O2
Povzetek pred-eksperimentalnih pristopov
• Ni naključne delitve v skupine.• Ni oziroma malo kontrole veljavnosti.• Niso veljavne metode za dokazovanje
pravega efekta.• Ne bodo objavljene v dobrih revijah!
Rejection letter:“Dear researcher, thank you for submitting your paper to our research journal. To save time, we are enclosing two rejection letters – one for this paper and one for
next one you send.”
97
Pred-eksperimentalni dizajn –Nevarnosti veljavnosti
Faktorji veljavnosti Študija z eno meritvijo
Ena skupina s pred-in post- testom
Primerjava z statično skupino
Notranja
Zgodovina – – +
Razvoj – – ?
Testiranje + – +
Instrument –
Statistična regresija ? +
Razlike v vzorcu – + –
Smrtnost – –
Izbira x razvoj – –
Placebo efekt ? ? ?
Zunanja
Reaktivni efekt pre-testa + – +
Preiskovanci x pravi faktor – – –
Umetno raziskovalno okolje ?
Interferenca večkratnih testov – – –
Pravi-eksperimentalni dizajn
Imajo naključne razdelitve preiskovancev v skupine in zato lahko rečemo, da so bile enake pred študijo. • S tem lahko kontroliramo:
• Enakost na začetku študije.• Enak vpliv razvoja na obe skupini.• Večina vplivov na veljavnost (testiranja, statistično regresijo,
razlike v vzorcu zaradi selekcije, interakcije med selekcijo in razvojem).
• Vendar, da je temu res tako mora poskrbeti raziskovalec.
• Vrste pravih eksperimentalnih dizajnov:• Dizajn naključnih skupin.• Pre-test in post-test dizajn naključnih skupin.• Solomon dizajn štirih skupin.
Pravi-eksperimentalni dizajn
• Dizajn naključnih skupin.• Je isto kot pred-eksperimentalni dizajn „Primerjava s
statično skupino“, le da imamo na začetku naključno razdelitev vzorca v eksperimentalno in kontrolno skupino.
• Če uspemo kontrolirati še ostale nevarnosti veljavnosti, je ta dizajn nadvse primeren za kvalitetno interpretacijo rezultatov.
• Uporabimo statistični t-test neodvisnih vzorcev za potrditev razlike med O1 in O2 (levo). Lahko poljubno primerjamo več faktorjev (desno), potem ANOVA.
• Vpliv intervencije na psiho-fizične sposobnosti preiskovancev.
R T O1
R O2
R T1 O1
R T2 O2
R O3
98
Pravi-eksperimentalni dizajn
• Dizajn naključnih skupin.• Razširitev na več faktorski dizajn.
• Primer 3x2 ANOVA: 3 intenzivnosti vadbe (A1, A2, A3) obeh spolov (B1 in B2). B ne more biti naključno izbran, A pa lahko.
R A1 O1 = R B1A1 O1
B1 R A2 O2 = R B1A2 O2
R A3 O3 = R B1A3 O3
R A1 O4 = R B2A1 O4
B2 R A2 O5 = R B2A2 O5R A3 O6 = R B2A3 O6
Pravi-eksperimentalni dizajn• Pre-test in post-test dizajn naključnih skupin.
• Še vedno so skupine naključno tvorjene, le da imamo poleg post-testov še pre-teste. Pre-test lahko služi za kontrolo naključne porazdelitve skupin.
• Cilj takega dizajna je vrednotenje sprememb po faktorju v eksperimentalni skupini in sprememb v kontrolni skupini.
• Nevarnost je v kršenju veljavnosti zaradi efekta testiranja, katerega ne moremo izmeriti.
• Uporabimo lahko več vrst statističnih testov:• RM MANOVA (efekt T je prvi faktor in pre/post test drugi faktor).• RM ANOVA z 1 faktorjem ponavljanja in 1 fiksnim faktorjem.• ANCOVA, kjer post-teste (O2, O4) korigiramo na pre-teste (O1, O3).• ANOVA ali t-test neodvisnih vzorcev za razliki (O2-O1) in (O4-O3).
R O1 T O2
R O3 O4
Pravi-eksperimentalni dizajn• Pre-test in post-test dizajn naključnih skupin.
• Kako izbrati pravi statistični test?• Analiza razlik v ES in KS je zelo privlačna, ker je enostavna,
vendar ne upošteva morebitnih razlik med ES in KS v začetku.• Razlaga tega je zelo obširna in presega naš čas in zahtevnost,
zato več o tem drugje (Thomas et al. 2005; Schmidt & Lee, 1999).
• Možne razširitve dizajna.• Več ponovitev meritev, kar je pogosto v fiziologiji GŠA,
študijah učenja, … (tudi do 30). Pri tem se lahko pojavi problem preveč-kratnih meritev, kar lahko rešimo, da jih združujemo (povprečimo) v bloke in tako zmanjšujemo ponovitve.
• Primer: učenje v treh metodah, v dveh jezikih in v 30 ponovitvah. 3(učenje)x2(jezik)x30(ponovitve) RM ANOVA.
• Zavedati se moramo možnemu kršenju veljavnosti z testiranjem samim in nad tem nimamo kontrole.
99
Pravi-eksperimentalni dizajn
• Solomonov dizajn štirih skupin.• Edini pravi dizajn, ki kontrolira efekt testiranja na
veljavnost.• Je kombinacija dizajnov naključnih skupin in pre-test post-
test naključnih skupin.• Testiranja efekta: Če O2>O4 in O5>O6.• Testiranje velikosti razlik: (O2-O1) > (O4-O3).• Testiranje efekta testiranja O1 ali O3: O2>O5.• Testiranje interakcije pre-testa s T: O2>O5.
R O1 T O2
R O3 O4
R T O5
R O6
2x2 ANOVA statistični test:
Ni T T
Pre-test O4 O2
Post-test O6 O5
Povzetek pravih-eksperimentalnih pristopov• Imamo naključne delitve v skupine.• Težko je kontrolirati le efekt testiranja.• So veljavne metode za dokazovanje pravega
efekta.• Bodo objavljene v dobrih revijah!• Z dobrim raziskovalnim dizajnom je običajno
potrebno biti zelo previden pri dodatnih zahtevah statističnih testov.• MANOVA• RM ANOVA, RM MANOVA• ANCOVA
Pravi-eksperimentalni dizajn –Nevarnosti veljavnosti
Faktorji veljavnosti Dizajn naključnih
skupin
Pre- in post- test dizajn naključnih
skupin
Solomonov dizajn štirih
skupin
Notranja
Zgodovina + + +
Razvoj + + +
Testiranje + + +
Instrument
Statistična regresija + + +
Razlike v vzorcu + + +
Smrtnost + + +
Izbira x razvoj + + +
Placebo efekt ? ? ?
Zunanja
Reaktivni efekt pre-testa + – +
Preiskovanci x pravi faktor ? ? ?
Umetno raziskovalno okolje ? ? ?
Interferenca večkratnih testov
100
Kvazi-eksperimentalni dizajn
Tip dizajna, ki ne spada v prejšnji dve kategoriji, kjer poskuša raziskovalec zadovoljit čim več kontrolam veljavnosti. • Naključnost porazdelitve ne moremo vedno zadovoljiti.
• Delitev otrok v naključne skupine, če so že razdeljeni v razrede.
• Testiranje vadbe starostnikov, kjer vsak živi na svojem koncu mesta, ne more do fitnesa, ki izvajajo en tip vadbe, zato obiskuje tisti tip vadbe, ki mu je bolj pri roki.
• Vrste kvazi-eksperimentalnih dizajnov:• Obraten dizajn.• Dizajn neenake kontrolne skupine.• Ex Post Facto dizajn.• Dizajn vklopljene podvojitve.• Časovne vrste.
Kvazi-eksperimentalni dizajn
• Obraten dizajn.• Se ga uporablja v šolah in ostalih okoljih, kjer ne smemo
motiti naravne porazdelitve.• Testiramo efekt faktorjev T1 (O3>O2) in T2 (O5>O4), včasih
lahko le T1, potem konec dizajna pri O3.• Testiramo efekt brez faktorja: (O2>O1), (O4>O3), (O6>O5).
O1 O2 O3 O4 O5 O6
Čas
Od
vis
na
sp
rem
en
ljiv
ka
T1 T2 A
BC
O1 O2 T1 O3 O4 T2 O5 O6
O1 O2 O3 O4 O5 O6
Čas
Od
vis
na
sp
rem
en
ljiv
ka
T1 T2
D
E
F
Kvazi-eksperimentalni dizajn• Dizajn neenake kontrolne skupine.
• Uporabljamo v naravnem okolju, ko kontrolne skupine ne moremo naključno določiti.
• Kot pre-test in post-test dizajn brez naključnih porazdelitev v skupine (R).
• Najprej testiramo O1 in O3 in preverimo enakost skupin.• Če ni značilnih razlik, še ne pomeni, da skupini nista različni v
kakšnih drugi neizmerjeni značilnosti, ki pa še vedno lahko vpliva na rezultat.
• Če so razlike značilne, potem z ANCOVO korigiramo O2 in O4 za začetne razlike.
• Testiramo z (M)ANOVO, z RM faktorjem pre-test/post-test in fiksnim faktorjem ES/KS in seveda interakcijo.
O1 T O2
O3 O4
101
Kvazi-eksperimentalni dizajn• Ex Post Facto dizajn.
• Uporabljamo v naravnem okolju, ko je faktor že deloval in zdaj nas zanimajo razlike.
• Razlike v mišični arhitekturi med body-builderji, vrhunskimi športniki in kontrolno skupino.
• Ne spreminjamo neodvisne spremenljivke, temveč le opazujemo odvisne(o).
• Razlike lahko potrdimo, vendar ne vemo, če so le-te le rezultat delovanja določenega faktorja.
• Pridobimo pa veliko novih informacij o takih vzorcih, ki jih lahko kasneje bolj kontroliramo in raziščemo.
• Poimenujejo ga tudi vzročno-primerjalni dizajn.
Kvazi-eksperimentalni dizajn• Dizajn vklopljene podvojitve.
• Lahko je pravi- ali kvazi-eksperimentalni dizajn:• Če jih v skupine razdelimo naključno je pravi-.• Če so skupine razdeljene tematsko (teniški igralci, atleti,
nogometaši, …) je kvazi-.• Redko se uporablja, a največkrat v športnih moštvih, kjer lahko
primerjamo več moštev ali tvorimo skupine znotraj moštva in jih testiramo ter apliciramo pravi faktor.
• Število skupin mora biti >2 in število ponovitev za 1 več kot število skupin.
• Pravi faktor je več krat apliciran in lahkoopazujemo dolgoročniefekt.
• Statistična obdelavaobsega RM ANOVA,RM MANOVA, …
# skupin Ponovitve
1 2 3 4 5
1 O1T O2 O3 O4 O5
2 O6 O7T O8 O9 O10
3 O11 O12 O13T O14 O15
4 O16 O17 O18 O19T O20
Kvazi-eksperimentalni dizajn• Časovne vrste.
• Imamo le eno skupino in poskušamo pokazati, da je efekt pravega faktorja drugačen kot takrat, ko ga ni.
• Testiramo trenutek med naklonom O1…O4 in O5…O6.• RM ANOVA ni najbolj primerna za statistično analizo, bolj so
uporabne tehnike regresije, kjer testiramo naklon in presečišča.• Kontroliramo efekt testiranja, naključne porazdelitve (le ena
skupina), razvoj, … le smrtnosti ne.
O1 O2 O3 O4 O5 O6 O7 O8
Čas
Od
vis
na s
pre
men
ljiv
ka T A
BC
O1 O2 O3 O4 T O5 O6 O7 O8
O1 O2 O3 O4 O5 O6 O7 O8
Čas
Od
vis
na s
pre
men
ljiv
ka T
DEF
G
102
Kvazi-eksperimentalni dizajn
• Dizajn z le enim preiskovancem.• Ne izvajamo statistike, le opazujemo spremembe na grafu.
• Proučevanje vrhunskega športnika, psihološki tretma določene osebe, človek s posebnimi potrebami, …
• Lahko spremljamo več preiskovancev, ob poljubnih dnevih s poljubno dolgimi periodami efekta.
• Tipično izvajamo merjenja večkrat.• Izmerimo najprej inicialno stanje (ang. baseline) in potem večkrat
apliciramo efekt in redno opravljamo meritve.
• Zanima nas absolutna vrednost odvisne spremenljivke in predvsem njena variabilnost.
0
10
20
30
40
50
60
70
80
90
0 10 20 30 40
Čas / dnevi
Pra
vil
na i
zved
ba v
aje
/ %
T T
Povzetek kvazi-eksperimentalnih pristopov• Imajo manjšo kontrolo nad notranjo
veljavnostjo.• Vendar, se jih uporablja, ko ne moremo
uporabiti pravih-eksperimentalnih dizajnov.
• Najbolj pa so uporabni, ko pravi-eksperimentalni dizajni preveč rušijo zunanjo veljavnost.• Omogočajo situacijska testiranja (odvisna
spremenljivka, okolje in merski instrument).• Omogočajo specifični izbor preiskovancev
(Športnikov, invalidov, …).
Kvazi-eksperimentalni dizajn –Nevarnosti veljavnosti
Faktorji veljavnosti Časovne vrste
Dizajn neenake kon.
skupine
Obraten dizajn
Ex post facto
vklopljene podvojitve
Notranja
Zgodovina – – – ? ?
Razvoj + + + ? +
Testiranje + + + +
Instrument
Statistična regresija + – + +
Razlike v vzorcu + + + – ?
Smrtnost + + + ?
Izbira x razvoj + – + –
Placebo efekt ? ? ? ? ?
Zunanja
Reaktivni efekt pre-testa – – ? – ?
Preiskovanci x pravi faktor ? ? ? ? ?
Umetno raziskovalno okolje ? ? ? ? +
Interferenca večkratnih testov ? +
103
Ponovitev
• Spoznali smo principe, prednosti in slabosti neeksperimentalnih in eksperimentalnih raziskovanj.
• Spoznali smo vrste raziskovanj.• Znamo oceniti vrsto raziskovalnega
dizajna s stališča veljavnosti.• Znamo dizajnirati najugodnejši
raziskovalni dizajn.
Predavanje 7:KONTROLA KAKOVOSTI RAZISKOVANJA
Izvedeli boste:1. Notranjo kontrolo kakovosti
1. Etična odobritev2. Soglasje preiskovancev
2. Zunanjo kontrolo kakovosti1. Omejitve zunanje kontrole kakovosti
3. Raziskovalna nepoštenost4. Vrednotenje kakovosti
Kontrola kakovost raziskovanja
• Spoznali smo temelje raziskovanja, vendar kdo je “raziskovalna policija”, ki naj bi skrbela, da je vse prav?
• Ni ene preproste mere kakovosti raziskovanja.
• Še največ je zaupanonam samim.• Zato moramo
raziskovalno rasti,se usposabljati,izboljševati, …
104
Notranja kontrola kakovosti
• Je kontrola znotraj raziskovalne organizacije (RO) ali skupine (RS), ki skrbi za odobritev raziskovanja in ščiti pravice preiskovancev.• Torej skrbi za kakovost dokler raziskovalec ne
poskuša objaviti svojih rezultatov.• Vrste organov, ki skrbijo za notranjo
kontrolo kakovosti.• Pregled strokovnjaka področja (ang. peer review).• Predstavitev raziskovalca, projekta, kolokviji,
Journal clubi (ang. research defenses).• Znanstveni ali strokovni odbor institucije (ang.
institutional review board - IRB).
Pregled strokovnjaka/ov
• Ponavadi ima RO enega ali več strokovnjakov-znanstvenikov na področju.• Pregleda znanstveni projekt, preden gre na IRB ali ga kar
odobri, če ni potrebe po višjem organu pregleda.• Vendar je za dobro oceno pomembno, da je strokovnjak res
iz področja predlaganega projekta.• Drugače težko oceni metode, znanstveno vrednost.• Lahko le oceni etičnost pristopa in splošno odličnost.• V majhnih RO to skoraj ni možno, zato se mora baza
strokovnjakov širiti tudi izven RO.• Če ni možno dobiti pravega strokovnjaka, lahko prosimo ostale
le za splošno mnenje, konstruktivno kritiko, …, kar od nas zahteva, da smo odprtih glav, pripravljeni sprejeti in dati kritiko.
Predstavitev raziskovalca, projekta, kolokviji, journal clubi• Javna predstavitev (komisija in druga javnost)
projekta in raziskovalca v obliki foruma, kolokvija, branjenja magistrske ali doktorske teze.• Cilj je kandidatu pomagati do še boljše zasnove projekta in
ne do poniževanja ali zgolj hvaljenja. Potrebno je biti kritičen, kajti le tako se nekaj nauči.
• Kandidata se sprašuje in hkrati vodi preko logičnega sklepanja do odgovora.
• Vedno je potrebno k temu pristopiti dobronamerno, kajti običajno je komisija bolj izkušena in strokovno ter znanstveno podkovana od kandidata.
• Tovrstne izkušnje boste dobili tudi vi v okviru seminarjev.
• Če kandidat uspe objaviti svoje delo pred javno predstavitvijo, je to dodaten pokazatelj kakovosti dela, ki ga komisija upošteva.
• Idealen doktorat ali magisterij!
105
Znanstveni ali strokovni odbor institucije – IRB• Primarna naloga je ščitenje etičnega ravnanja s
preiskovanci.• S tem ščitijo tudi RO za odgovornost pri morebitnih
kršenjih, katerih mora biti kar se da malo.• Pregleda raziskovalni predlog, soglasje, oceno verjetnosti
nekaterih nevarnosti, …• Ker ni stopnja nevarnosti povsod visoka, se IRB lahko
sestaja tudi v ožjih oblikah, za manj rizične predloge.• Je najpomembnejši instrument notranje kakovosti.
• Logično je (ni pa nujno), da naj bi vsaka RO, ki dela na področju kineziologije, imela svoj IRB.
• Ponavadi jo sestavljajo: pravniki, zdravniki, učitelji, psihologi, filozofi, sociologi in še kakšni predstavniki neznanstvene stroke, lahko pa še tudi biomehaniki, trenerji, fiziologi kot zunanji konzultanti ali redni člani.
Znanstveni ali strokovni odbor institucije – IRB• Načini ocenjevanja.
• Tipično se postavi vprašanje:• Kakšna je stopnje tveganja za preiskovanca v odnosu na
pomembnost ugotovitve?• Naredi se analiza tveganja in pomembnosti.• Potem se glasuje.
• Vsaka raziskava potrebuje odobritev IRB (že mentor je lahko član, lahko tudi senat univerze), preden se prične izvajati po odobrenih navodilih IRB.
• IRB ne more kaznovati kršitve, zato se zaupa raziskovalcu.• Vsak raziskovalec mora čez urjenje preden lahko izvaja
raziskavo…kar ravnokar počnemo.• Vsak preiskovanec bi moral tudi, no temu pa ni vedno tako,
zato je na raziskovalcu, da ga pošteno pouči.
Etično dovoljenje
• V Sloveniji imamo Komisijo RS za medicinsko etiko.• http://www.kme-nmec.si/• Če IRB odloči, da je potrebno pridobiti dovoljenje KME, se mora
izpolniti naslednji obrazec:
1. Poln naslov in morebitno šifro raziskave.
2. Ime vodje raziskave oz. odgovornega raziskovalca, podatke o strokovni usposobljenosti in njegov kratek življenjepis (če še nima šifre raziskovalca pri Agenciji za raziskovalno dejavnost). Ime ustanove, ki predlaga raziskavo, in ustanove, na kateri bo raziskava potekala.
3. Ime in usposobljenost zdravnika, odgovornega za varnost oseb v raziskavi.
4. Načrt in protokol raziskave, vključno: namen in znanstvena utemeljitev, podprta s pregledom bistvene literature metode (tudi statistične) recenzija znanstvene veljavnosti raziskave (če je na razpolago) predlagateljeva ocena etičnih vidikov raziskave (možne koristi / tveganja in obremenitve) povzetek v jeziku, ki je razumljiv ljudem brez medicinske izobrazbe.
5. Osebe, ki bodo povabljene v raziskavo: način pridobivanja prostovoljcev (ali drugih udeležencev) izjava predlagatelja, da vabila ne bo spremljal pritisk ali neprimerno napeljevanje merila za vključitev, nevključitev, izključitev, predvideno število informacija o denarnem ali kakšnem drugačnem nadomestilu udeleženim osebam.
106
Etično dovoljenje• V Sloveniji imamo Komisijo RS za medicinsko etiko.
• http://www.kme-nmec.si/• Če IRB odloči, da je potrebno pridobiti dovoljenje KME, se mora izpolniti naslednji obrazec:
6. Kako bo poskrbljeno za varnost in koristi oseb v raziskavi narava in verjetnost predvidljivega tveganja za zdravje udeleženih oseb opis ukrepov za preprečevanje oz. ublažitev posledic neugodnih dogodkov če gre za možnost mutagenih ali teratogenih učinkov, kakšni ukrepi so predvideni.
7. Če je predvidena primerjalna skupina bolnikov, kako bodo zavarovane njihove koristi.
8. Kako bo varovana zaupnost osebnih podatkov prostovoljcev v raziskavi.
9. Ali bodo udeležencem dostopni podatki o njihovem zdravju in rezultati raziskave.
10. Kdo je naročnik in plačnik raziskave (ime, naslov, odgovorni koordinator; isto tudi za morebitnega organizatorja raziskave (CRO)). Nadalje:
kako so zavarovane za morebitno škodo na zdravju (kopija zavarovalne police) informacija o morebitnih plačilih ali nagradah raziskovalcem in njihovim sodelavcem v
raziskavi.
11. Ali je predlog te raziskave (ali širše raziskave, katere del je predlagana raziskava) že ocenjevala kakšna komisija za etiko. Predložiti podatke in oceno.
Etično dovoljenje• V Sloveniji imamo Komisijo RS za medicinsko etiko.
• http://www.kme-nmec.si/• Če IRB odloči, da je potrebno pridobiti dovoljenje KME, se mora izpolniti naslednji obrazec:
12. Izjava predstojnika ustanove ali oddelka, na katerem bo tekla raziskava, ali strokovnega predstojnika ali mentorja odgovornega raziskovalca, da so vključeni raziskovalci usposobljeni za delo v zvezi z raziskavo, da so zmožni pravočasno prepoznati morebitne zaplete, ki bi lahko ogrožali zdravje ali življenje oseb v raziskavi, in da so zmožni pravilno ukrepati; da je na ustanovi poskrbljeno za strokovnost dela in varnost oseb v raziskavi; da bo nadziral raziskovalce, da se bodo držali načel Helsinške deklaracije o biomedicinskih raziskavah na človeku, določil Konvencije Sveta Evrope o varovanju človekovih pravic in dostojanstva človeškega bitja v zvezi z uporabo biologije in medicine (Oviedske konvencije) in načel slovenskega Kodeksa medicinske deontologije.
13. Izjava odgovornega raziskovalca, da se bo držal načel Helsinške deklaracije o biomedicinskih raziskavah na človeku, določil Konvencije Sveta Evrope o varovanju človekovih pravic in dostojanstva človeškega bitja v zvezi z uporabo biologije in medicine (Oviedske konvencije) in načel slovenskega Kodeksa medicinske deontologije. Izjava odgovornega raziskovalca in njegovega predstojnika o morebitnem konfliktu interesov (npr. o možnem finančnem interesu za določen izid raziskave).
14. Obrazec izjave o zavestni in svobodni privolitvi sodelujočih zdravih oseb ali bolnikov v raziskavi, ki jo bodo podpisovali preiskovanci (oz. izjave o soglasju, ki jo bodo podpisovali zakoniti zastopniki, če gre za osebe, ki niso sposobne samostojne privolitve) po primerni in razumljivi ustni in pisni poučitvi o morebitnih koristih, neprijetnostih in tveganjih. Obvestilo oz. pojasnila za sodelujoče prostovoljce. Navedba naslova in telefonske številke zdravnika, pri katerem lahko oseba v raziskavi dobi nujno medicinsko pomoč v primeru resnega neugodnega pojava.
Etično dovoljenje• V Sloveniji imamo Komisijo RS za medicinsko etiko.
• http://www.kme-nmec.si/• Če IRB odloči, da je potrebno pridobiti dovoljenje KME, se mora izpolniti naslednji obrazec:
15. Informacija, kako naj osebe v raziskavi v nujni situaciji vzpostavijo stik z odgovornim zdravnikom
16. V raziskavah, kjer obstaja nevarnost teratogenosti in v katerih sodelujejo prostovoljke v rodni dobi (zdrave ali bolne): pisno pojasnilo o nevarnosti in izjava o tem, da se bodo udeleženke zavarovale pred zanositvijo, vse dokler ne mine nevarnost teratogenih učinkov na plod.
Datum oddaje vloge in podpis predlagatelja
Po odobritvi raziskave morate na KME nasloviti tudi: morebitne spremembe protokola, ki kakorkoli spreminjajo etične vidike že odobrene raziskave poročila o resnih neugodnih dogodkih, ki prizadevajo zdravje udeležencev (gl. tudi naslednjo točko) obvestilo o morebitni predčasni prekinitvi raziskave in razlogih zanjo obvestilo o končanju raziskave in sumarično končno poročilo, četudi so rezultati raziskave negativni.
Poročila o resnih nepredvidenih reakcijah (suspected unexpected serious adverse reactions, SUSAR ) in o resnih neugodnih dogodkih (severe adverse events, SAE)
107
Etično dovoljenje• V Sloveniji imamo Komisijo RS za medicinsko etiko.
• http://www.kme-nmec.si/• Če IRB odloči, da je potrebno pridobiti dovoljenje KME, se mora izpolniti naslednji obrazec:
Brez odlašanja poročajte o resnih nepričakovanih zapletih, ki spreminjajo varnostno oceno in s tem tudi razmerje med tveganjem in koristjo, kot je bilo ocenjeno pred začetkom študije oz. je bilo ocenjeno kot sprejemljivo. Tu je všteta tudi nepričakovana pogostnost sicer pričakovanih zapletov. To pravilo se nanaša na vsa pomembna registrirana opažanja, povezana z raziskovanim zdravilom ali substanco, torej tudi v drugih študijah ali zunaj njih.
Iz multicentričnih kliničnih preskušanj, ki se izvajajo tudi v Sloveniji, pričakujemo poročila o resnih nepričakovanih zapletih (SUSAR), ki so se zgodili pri nas.
Za ostale zaplete zadoščajo periodična - četrtletna, polletna oz. letna poročila.
Poročila pod točkama 1 in 2 in letna varnostna poročila naj spremlja komentar naročnika in/ali glavnega raziskovalca. V vseh drugih primerih komisijo do nadaljnjega obveščajte le obdobno (v odvisnosti od trajanja raziskave, npr. četrtletno, polletno, letno…) z varnostnimi poročili, ki naj vsebujejo pregled dogodkov (ne opise posameznih primerov) in komentar naročnika, CRO ali odgovornega glavnega raziskovalca. Sporočila lahko pošljete po e-pošti na naslov tone.zakelj@kclj.si, in sicer kot datoteke PDF, pripete k osnovnemu sporočilu, v katerem seveda navedite vse podatke, ki jih zahteva naslednja, 20. točka.
Vse dopise, naslovljene KME, ki se nanašajo na raziskavo, ki jo je KME že odobrila oz. obravnavala, na primer prošnjo za obravnavo spremembe protokola, za evidentiranje neugodnih dogodkov ipd., opremite z imenom vlagatelja (glavnega raziskovalca) in s številko oz. oznako ter datumom zadnjega dopisa KME, namenjenega tej raziskavi
Etično dovoljenje• V Sloveniji imamo Komisijo RS za medicinsko etiko.
• http://www.kme-nmec.si/• Če IRB odloči, da je potrebno pridobiti dovoljenje KME, se mora izpolniti naslednji obrazec:
Če so osnovni dokumenti raziskave v angleščini, jih - razen navedenih pri št. 4 (zadnja vrstica), 14, 15 in 16 - za komisijo ni treba prevajati. Odgovor komisije je načeloma v slovenščini. Če pa potrebujete mnenje KME tudi v angleščini (npr. pri raziskavah za tuje naročnike), vlogi priložite slovensko in angleško prošnjo za njeno obravnavo (da se izognemo netočnim prevodom specifičnih strokovnih izrazov, imen ustanov, nazivov ipd.).
Komisija se sestaja enkrat mesečno. Vloga je zanesljivo obravnavana na prvi tekoči seji, če gradivo prispe vsaj en teden prej (in ni potrebna še recenzija zunaj KME). V nujnem primeru lahko zaprosite predsednika KME za vnaprejšnjo odobritev, ki jo nato lahko dokončno potrdi Komisija na prvem rednem sestanku. Vlogo pošljite v enem izvodu na naslov:
Prof. dr. Jože Trontelj, dr. med., predsednik KMEInštitut za klinično nevrofiziologijo, Klinični center, 1525 Ljubljana.Po elektronski pošti KME vlog še ne more sprejemati.
KME je dolžna na vlogo pisno odgovoriti v 60 dneh od prejema vloge, navadno pa ga pošlje v dveh do treh tednih po seji, na kateri je vlogo obravnavala, in sicer na naslov iz zaglavja vašega osnovnega dopisa. Če želite, da kopijo odgovora pošljemo še komu (naročniku raziskave, mentorju idr.), nam to sporočite v dopisu k vlogi, kjer - seveda -navedite tudi njegov naslov. Navedite tudi morebitne druge želje, npr. da potrebujete dva originalno podpisana odgovora, seznam članov KME, ki so bili na seji, ko je bila vloga obravnavana, potrjen seznam dokumentov, ki sestavljajo vašo vlogo ipd.
Pisno soglasje• Je dokument, katerega mora podpisati vsak
preiskovanec preden pristopi k raziskavi.VPLIV SIMULIRANE BREZTEŽNOSTI NA ČLOVEKA
Inštitut za kineziološke raziskave, Znanstveno-raziskovalno središče Koper, Univerza na Primorskem
PISNO SOGLASJE PREISKOVANCA–PROSTOVOLJCAIme preiskovanca:_________________________________________Leto rojstva: 19___ Spol: M Ž
Podpisani potrjujem naslednje:• v raziskavi sodelujem prostovoljno in lahko od nje kadarkoli odstopim;• prebral in razumel sem Informacije za preiskovance;• podrobno sem seznanjen s celotnim potekom in pomenom raziskave;• poznam vse stranske učinke in nevarnosti raziskave;• obveščen sem, da me bo pred začetkom prvega poskusa pregledal zdravnik, ki bo spremljal moje zdravstveno stanje tudi v
nadaljevanju raziskave; brez njegovega pristanka v raziskavi ne bom sodeloval;• vem, da je celoten postopek raziskovalnega projekta pregledala in odobrila Komisija RS za medicinsko etiko;• dovoljujem uporabo rezultatov raziskave ob upoštevanju etičnih meril.
S svojim podpisom prostovoljno pristajam na sodelovanje v raziskavi.
Koper,_____2008 Podpis preiskovanca:____________________
IZJAVA RAZISKOVALCEVPotrjujem, da sem preiskovancu razumljivo razložil potek, tveganje, nevšečnosti in koristi raziskave ter, da se bom ravnal po določilih
Komisije RS za medicinsko etiko.Raziskovalec:______________________
Koper,_____2008 Priča:______________________
108
Zunanja kontrola kakovosti
• Je vsakršni proces izven RO, ki skrbi za desiminacijo raziskovalnih rezultatov.• Po končani raziskavi ima raziskovalec možnost,
da deli rezultate z drugimi.• Prezentacija (konference, znanstveni sestanki,
forumi, vabljeno predavanje, plakati…).• Prispevki (konference, revije, znanstvene
monografije, knjige, učbeniki, …).
• Najboljše oblike desiminacije (revije) slovijo ravno po najboljši zunanji kontroli kakovosti.• Recenzija dovoli objavo le najbolj kakovostnih
prispevkov!
• Vrste zunanje kontrole kakovosti:• Objava raziskovalnega prispevka.
Objava raziskovalnega prispevka
• Terminologija:• Prispevek v pripravi (ang. manuscript).• Objavljen prispevek – članek (ang. article).
• Po končani raziskavi ima raziskovalec možnost, da deli rezultate z drugimi:
• Če so rezultati dovolj kakovostni oziroma odmevni jih objavimo, drugače ne – kar lahko predstavlja nevarnost za izkrivljanje znanosti.
• Včasih so tudi kakovostni rezultati, pridobljeni na pravilen način neobjavljivi, ker manjka jasnost razlage, slaba interpretacija.
• Potrebno je gledati na veliko faktorjev, katere mora pretehtati raziskovalec sam in tudi drugi – uredniški odbor, recenzenti, …
Recenzentski proces
• Ga sestavljajo uredniški odbor ali urednik in recenzenti.
• Raziskovalec se sam odloči kam bo poslal prispevek.• Preveri, če je prispevek oddan skladno z navodili za avtorje.• Predlaga nekaj recenzentov (ponavadi 2 ali 3) za kritično
presojo prispevka.• Ponavadi so recenzenti avtorju neznani in obratno (ang. blind
review). Tudi RO se ne navajajo.• Svoje kritike posredujejo nazaj uredniškemu odboru in
opozorijo na vsako najmanjšo napako in priporočajo sprejem ali zavrnitev prispevka (brezpogojno sprejet, sprejet, brezpogojno zavrnjen).
• Če zavrnjen, potem se ga običajno predela in pošlje v drugo revijo.
• Neetično je poslati isti prispevek v dve reviji!
109
Omejitve recenzentskega procesa
• Čeprav je to zagotovo najboljša oblika zunanje kontrole kakovosti, je potrebno vedeti, da:• s tem ne le odločajo kaj se bo v tej reviji objavilo in kaj ne,
ampak tudi oblikujejo znanja na določenem področju.• Novi učbeniki bodo nastali na osnovi teh znanj, študenti bodo
brali to kot učno gradivo, …
• Nizka ponovljivost recenzentov.• Le v 40% recenzij se ocene recenzentov popolnoma ujemajo.
Intraklasna korelacija 0.37.
• Nenatančnost recenzij.• Potrebno najti način urjenja recenzentov! Danes ga ni.
• Niso le najboljše študije objavljene!• Vsak raziskovalec se mora začeti vključevati v
recenzentski proces in prispevati k boljšemu recenzentskemu procesu!
Raziskovalna količina proti kakovosti
• Žal se znanstvena odličnost vedno ocenjuje po raziskovalni količini namesto, da bi se po kakovosti.• Ali količina res odraža kakovost in s tem
povezano odličnost?
• Možna je tudi še drugačna kontrola raziskovalne kakovosti in s tem količine.• Kakovost se oceni le na osnovi petih znanstvenih
objavah (ni pomembno, če jih imaš 20).• Podaljša se obdobja do napredovanja in s tem
omogoči več časa za korektno in kakovostno izvedbo raziskovalnega dela.
Raziskovalna nepoštenost
• Težko odkrijemo, vendar kadar jo, so sankcije velike.
• Pogoste nepoštenosti:• Kopiranje prispevkov drugih.• Ponarejanje in prirejanje podatkov.• Ponovno objavljanje istih podatkov.
110
Vrednotenje kakovosti raziskovanja• Je nujno potrebno, saj vse prevečkrat prehitro
zaključimo ali nekomu verjamemo.• Danes na voljo nešteto virov, da lahko preverimo neko
informacijo.• To je sicer dobro, ampak tudi zelo težko, ob poplavi informacij.
Zato je potrebno prepoznati zaupanja vredne vire.
• S katerimi instrumenti merimo?• Merila veljavnosti.• Metodološki del.• Varianca preiskovancev.• Raba stopnje tveganja.• Velikost efekta.• Avtorstvo in revija. (?)• Dejstvo, če res lahko vse ugotovljene razlike razložimo z
neodvisno spremenljivko.
Vrednotenje kakovosti na osnovi veljavnosti• Je prva faza ocenjevanja rezultata!• Ponavadi se najprej osredotočimo na
velikost vzorca.• Z velikostjo vzorca se zmanjšuje napaka
merjenja, s tem tudi β in s tem povečuje moč raziskave.
• Dovolj velik vzorec znamo oceniti.• Velik N je potreben, ko pričakujemo majhen efekt
faktorja na odvisno spremenljivko, in kadar več zunanjih vplivov (skupno z neodvisno spremenljivko) dodatno vpliva na odvisno spremenljivko.
• Preverimo še pravilno rabo statističnih metod, raziskovalnega dizajna, zadostnega izpostavljanja pravemu faktorju, …
Vrednotenje kakovosti na osnovi metodologije
• Tu se ponavadi osredotočimo na merski instrument, ki je opisan v …• metodološkem delu.
• Opisan mora biti dovolj detajlno, da je iz njega razvidno (ogrevanje, kalibracija, počitek, aplikacija merilnega instrumenta, večkratno merjenje, …).
• Če se sklicujemo na sorazmerno nov instrument, ni dovolj le sklic na drugo literaturo, kjer je opisan, ampak je njegovo rabo potrebno opisati tudi tu bolj detajlno.
• Dobro je navesti (citirati) kakšno drugo našo raziskavo, kjer smo isti instrument že uporabili, čeprav ni vsebinsko vezana na to. S tem dokazujemo naše izkušnje z rabo instrumenta.
• Uveljavljene instrumente lahko opisujemo z manj detajli.
111
Vrednotenje kakovosti na osnovi variance preiskovancev
• Velikost variance (SD2) vpliva na več faktorjev…
• Povečuje velikost potrebnega vzorca N.• Zmanjšuje varianco napake in s tem t- oz. F –vrednost.
• Zato raje vzamemo bolj podobne preiskovance.• Za analizo hoje uporabimo enako stare otroke z približno
enako telesno sestavo in fizično pripravo.
• Vendar, če podoben vzorec, potem manjša zunanja veljavnost (manjša možnost posploševanja).
• Potrebno najti kompromis in ga zagovarjati in pravilno interpretirati.
Vrednotenje kakovosti na osnovi rabe stopnje tveganja• Z njo je možno manipulirati rezultat raziskave.
• Ker je povečevanje N včasih drago in časovno zahtevno, raje povečamo alpha iz 0.05 na 0.10.
• S tem povečamo verjetnost napake prvega reda.• Ampak, tudi alpha = 0.05 ni brez tega tveganja.• Ampak, saj se vedno spodbujajo študije, ki zgolj ponavljajo
določeno hipotezo.• Ampak, če sprejmemo H0 pri alpha 0.05, odvrnemo druge
raziskovalce od tega področja.
• To je pogosto potrebno pri raziskavah z veliko zunanjih vplivov.
• Testiranje efekta treninga, učenja, intervencij za dvig količine in intenzivnosti gibanja, …
• Spodbuja se poročanje P za vsak test, saj se lahko P = 0.051 interpretira in razume popolno drugače kot P = 0.60 ali zgolj N.S.
Vrednotenje kakovosti na osnovi velikosti efekta
• Je velikost razlik med dvema skupinama –praktična značilnost razlik.• Statistična značilnost in velikost efekta sta
ponavadi dva ločena pojma!• Učinek efekta je lahko značilen, a velikost efekta je lahko
zelo majhen … tipično pri prevelikem N.
• Potrebno, ga je izračunati, kjerkoli je to mogoče.• Odstotek razlik med skupinami.• ω2 ali koeficient determiniranosti R2.• Velikost efekta = D/SD = (Me - Mk)/SD.
• Velikost efekta omogoča direktno primerjavo med raziskavami (META analiza).
112
Vrednotenje kakovosti na osnovi avtorstva in revije
• Ni vedno res, da ugledni avtorji ali ugledne revije pomenijo visoko kakovost prispevka.
• Ne gre vedno verjeti prvemu avtorju.• Ne smemo “opremiti” naš prispevek z uglednimi
soavtorji.• Ne gre slepo verjeti ugledni reviji.
• Lahko se najdejo poznanstva avtorjev in recenzentov.
• Vsaka raziskava ima svoje omejitve in slabosti.• Velikokrat lahko tako znanstveno vrednotimo nov
izdelek (merilni instrument, dieta, zdravilo, obutev) trga.• Redko je to res znanstveno vrednoteno.
Vrednotenje kakovosti na osnovi interpretacije pravega efekta
• Vedno je potrebno poznati vse okoliščine raziskave.
• Učinek vadbe bo zagotovo manjši na ljudeh, če jih bomo opazovali v nekem neugodnem trenutku (menstruacija, ločitev, poškodba, uživanje anabolikov, antidepresivov…).
• Zavedati se moramo, da ni vsaka ugotovljena razlika odvisna zgolj od učinka pravega faktorja.
• Zato postavimo vključitvene (ang. inclusion criteria) in izključitvene kriterije (ang. exclusion criteria) pri izbiri preiskovancev oziroma tudi pri obdelavi podatkov.
Da/ne evalvacijska lista1. Je namen raziskave postavljen?2. Je potreba po raziskavi izpostavljena?3. Metode
a. So preiskovanci opisani?b. So meritve opisane dovolj detajlno?c. So meritve veljavne in ponovljive?d. So uporabljene pravilne statistične metode?
4. Rezultatia. So jasno predstavljeni?b. So tabele in grafi primerni?c. So napisane stopnje tveganja?
5. Diskusija in zaključkia. So rezultati primerjani z drugimi študijami?b. Je izračunana velikost efekta?c. So omenjene omejitve raziskave?d. So odmevni zaključki omenjeni?e. So zaključki temelječi na rezultatih?f. Je diskusija aplikativnosti omenjena?
6. Notranja veljavnosta. Je dovolj velik učinek pravega efekta?b. Sta dovolj velika vzorec in raziskovalna moč?c. So bili prisotni zunanji vplivi in ali so bili kontrolirani?
7. Zunanja veljavnosta. Na koga lahko posplošimo rezultate?b. So bili preiskovanci prostovoljci?
113
Ponovitev
• Spoznali smo principe notranje kontrole kakovosti raziskovanja.
• Spoznali smo principe zunanje kontrole kakovosti raziskovanja.
• Spoznali smo se z dvema ključnima dokumentoma etičnosti raziskovanja.
• Omenili smo raziskovalno nepoštenost, katere se bomo izogibali.
• Spoznali smo načine vrednotenja kakovosti raziskovanja.
• Znamo kritično (osnovno) oceniti znanstveni prispevek s stališča kakovosti raziskovanja.
Predavanje 8:RAZVOJ RAZISKOVALNEGA PROBLEMA
Izvedeli boste:1. Razvoj raziskovalnega problema z uporabo literature
a. Identifikacija raziskovalnega problemab. Namen pregleda literaturec. Osnove strategije pregleda literature
2. Predstavitev raziskovalnega problemaa. Pisanje pregleda raziskav – uvodb. Formuliranje metodološkega dela – metode
3. Etična vprašanja
Identifikacija raziskovalnega problema
• Ne smemo se na določenem področju omejevati preozko.• Lahko spoznamo, da je že veliko raziskanega in
bomo šli pregloboko, kjer so naša znanja še neprimerna.• Nastop mišične atrofije pri človeku je dobro raziskana
tudi do molekularne ravni, vendar so določeni vidiki še veno odprti (merilni instrument, rehabilitacija, mikrogravitacija, dinamika, …).
• Glavni razlog, zakaj poslušate ta predmet v 1. semestru, je v tem, da boste znali raziskovalno pristopiti k razumevanju snovi v drugih poglobljenih predmetih.
114
Napotki pri izbiri raziskovalnega projekta• Vedno sledi raziskavam v domači RO,
državi in šele nato širše.• Priključi se izkušenejšim raziskovalnim kolegom,
saj imajo ponavadi planirano serijo raziskav.• Poslušaj predlogom, “journal clubom” starejših
raziskovalcev oziroma mentorjem.• Preberite pregledne prispevke iz področja in
nekatere prispevke, ki jih ti izpostavljajo.• Na osnovi teh treh predlogov si izdelajte
listo sorodnih vprašanj, ki bi vas zanimala.• Pogovorite se z mentorjem ali profesorjem
o njih.• Najprej rešite manj težavne probleme in zrastite
ob njih!
Iščite vzroke in ne posledice
• Naj vas ne fascinirajo posledice, temveč se vedno pozanimajte o vzrokih.• Vzroki so tisto kar iščemo.
• Ugotovili so, da je mišična atrofija značilna že po dveh dneh ležanja. In to kar za 6%. Zakaj je temu tako?
• Naj nas glavna ugotovitev ne zadovolji. Vedno nas mora zanimati, kakšen je mehanizem za njo.
Uporabljaj induktivno in tudi deduktivno sklepanje
• Induktivno sklepanje: iz posameznih opazovanj preidemo na hipoteze in teorijo.• Držimo se logičnega in vzročnega povezovanja.
• Analiziramo delovno mesto in opazimo (število poškodb hrbta visoko, težave z vidom po 10 letih, težave s sluhom po 5 letih, spodbuja debelost, …). Postavimo hipoteze, jih preverimo in ustvarimo teorijo: Delovno mesto XXX je nevarno za zdravje in ga je potrebno spremeniti, da bo delavcu bolj prijazno.
• Deduktivno sklepanje: iz teorije preidemo na posamezne hipoteze.
• Vemo, da je delovno mesto nevarno za zdravje, vendar ne vemo na katere vidike zdravja. Preverimo posamezne hipoteze in potrdimo ali ovržemo teorijo.
115
Pregled literature• Ga je vedno
potrebno izvesti, preden začnemo planirati novo raziskavo.• Če področje “že
preveč” raziskano, je celo bolje menjati raziskovalno področje.
• Pozorni podite na preiskovance –zunanja veljavnost, deljenost ugotovitev, kompleksnost merjenja, omejitve raziskav.
• Načrtujte si tabelo ali graf dosedanjih ugotovitev.
15
20
25
30
35
40
45
50
55
60
5 25 45 65 85
Age / years
Bic
ep
s fe
mo
ris
Tc /
ms
Children NONSP (N=29) Children SPORT (N=17) Sprint (N=27)Sprint (N=15) Sedentary (N=25) Dancers (N=16)Ageing (N=52) MA Sprinters MA Endurance
Pišo
t et
al.,
2007
Šimunič et al., 2005
Šimunič et al., 2009
Namen pregleda literature
• Identifikacija problema.• Izberemo raziskave, ki so vezane na raziskovalno področje.• Podrobno preberimo izbrane in ponavadi najdemo mesto za
naš prispevek – potencialni problem.• Potem podrobno preiščemo potencialni problem.
• Razvoj hipoteze.• Hipoteza je lahko deducirana iz teorije ali inducirana iz
opazovanj.• Mora sloneti na logičnih razmišljanjih.
• Razvoj eksperimentalnega dizajna.• Je zelo kreativen del planiranja raziskovanja, ki pa lahko
hitro spodleti.• Zato se učimo iz že objavljenih poskusov in uporabimo
preverjene dizajne• raziskave same, vzorca, statističnih metod, število meritev, …• Naj to ne ubije kreativnosti v nas samih.• Ne vedno slepo slediti drugim.
Osnovne strategije iskanja literature
• Odvisno od začetnega poznavanja področja oziroma problema.• Začetnik se loti popolnoma drugače od drugih.
• Elektronsko iskanje je danes popularno.• Tam je več novejše literature (primarnih virov).
• Pomanjkanja poglobljenega razumevanja, kar je zapisano v starejših virih oziroma že knjigah (sekundarni viri).
• Koraki iskanja literature.1. Formuliraj raziskovalni problem.2. Upoštevaj sekundarne vire.3. Določi ključne besede.4. Išči preliminarne vire.5. Preberi in izloči relevantno literaturo.6. Napiši pregled relevantne literature.
116
1. Formuliranje raziskovalnega problema
• Dovolj široko in dovolj ozko formulirajte raziskovalni problem.
• Analiza dinamike mišične atrofije.• Vpliv potovanja po vesolju na ravnotežje.• Tehnika učenja ŠV je povezana s kakovostjo učne ure.• Intervencije za dvig količine in intenzivnosti
gibalne/športne aktivnosti.• Analiza fiziološkega stresa vojaških uniform Slovenske
vojske.• Analiza teka pri mlajših otrocih.• Povezanost samoizbrane hitrosti hoje in morfologije
človeka.• Analiza tehnik višinske aklimatizacije.
2. Upoštevanje sekundarnih virov
• S tem pridobimo razumevanje raziskovalnega problema v globino.• Pomembno pri raziskovalcih začetnikih, ki imajo
še omejeno znanje o raziskovalnem problemu.• Enciklopedije, knjige, …
• Poznamo splošne in specializirane, ki se razlikujejo v širini in globini opisovanja področja zanimanja.
• Za njihov nastanek je potrebno več let raziskovanja, kar pomeni veliko raziskovalno zamudo.
• Pregledni članki (ang. review article), znanstvene monografije (ang. scientific monograph), …• Nekdo je naše delo že naredil in nam pripravil izbor
relevantne literature, ga tudi kritično analiziral in predlagal nerešena vprašanja.
3. Definicija ključnih besed
• Ključne besede so besede ali nizi besed, ki nam pomagajo iskati preliminarne vire.• Pomembno, da postavimo primerne širše in ožje
ključne besede.• Skeletna mišica, mišična atrofija, ultrazvok, …• Smučanje, trajektorija zavoja, …• Metabolni sindrom, visok krvni tlak, kajenje, …• Motorično učenje, validacija, testiranje, …
• Pogosto se med iskanjem nabor ključnih besed lahko širi, vendar pri tem pozor, da ne preveč –lahko zaidemo.
117
4. Iskanje preliminarnih virov
• Bazo preliminarnih virov širimo z:• Iskanjem preko povzetkov.
• Dostop do povzetkov je vedno mogoč.• Namen povzetka je ravno olajšanje iskanja preliminarnih virov.
• Iskanjem preko baz podatkov.• Spletni brskalniki revij in člankov.
• Pubmed, Sicris, Web of Science, Medline, SportDiscus,…• Iskanjem preko bibliografij drugih virov.
• Pozor, ker je potrebno vedno preveriti, preden vir umestimo.• Iskanjem preko knjižničnih info sistemov.
• Cobiss, …• Iskanjem preko spleta.
• Deloma vključuje tudi že vse naštete. Google Scholar, …
• Potem pridobimo izbrane preliminarne vire.• Prost dostop, nakup, preko zakupa dostopa, “kopiranje”,
pisanje avtorju.
Nekaj kinezioloških revij in njihova “vrednost” – SCI faktor
Nekaj kinezioloških revij in njihova “vrednost” – SCI faktor
118
Nekaj kinezioloških revij in njihova “vrednost” – SCI faktor
Nekaj kineziologiji sorodnih revij in njihova “vrednost” – SCI faktor
5. Išči in izloči relevantno literaturo• Potrebno je prebrati in razumeti prispevke, da jih lahko
izločimo in hranimo.• Pomembno je, da vključimo vse pomembne prispevke področja, a
dodatno velja tudi (nepisano pravilo):• Uporabi sorodne članke bližnjega (geografskega) okolja (Slovenija,
mentor, …).• Uporabi sorodne članke iz revije, kjer nameravaš objaviti tudi svoj
prispevek.• Pri tem moramo izločiti naslednje ključne META informacije (lahko
beležimo na posebnem obrazcu, ki ga pripnemo kopiji članka):• Hipotezo.• Značilnosti preiskovancev.• Merilne instrumente.• Proceduro merjenja.• Neodvisne in odvisne spremenljivke.• Pravi faktor, ki je bil apliciran.• Raziskovalni dizajn.• Statistične metode.• Zaključke.• Odprta vprašanja, ki jih raziskava pušča za sabo.
119
6. Napiši pregled relevantne literature• Pregled literature ima tri glavne dele.
• Uvodni del• Namen in motivacijo.• Teoretično in praktično pomembnost tega pregleda.
• Telo besedila• Lahko razdelamo v poglavja, smiselne sklope (ne kronološko).• Jasno navajanje dejstev, a naj ne bo dolgočasno in
nepovezano.• Pomembno je držati rdečo nit in ne vijugati.• Pomembnejše študije lahko opišemo detajlneje.• Več podobnih lahko združujemo.• Pokazati moramo dovoljšnjo mero kritičnosti in celostnosti.• Slednje že lahko pomeni prostor za naš prispevek.
• Povzamemo s sklepom• Naj poudari končne zaključke in pomen tega dela.• Naj navede neodgovorjena vprašanja in predlaga bodoče
raziskave.
Predstavitev raziskovalnega problema• Cilj je bralcu predstaviti razlog, zakaj se
ukvarjamo s to tematiko.• Za ta namen imamo na voljo UVOD, ki je
lahko razdeljen na več delov.• Naslov• Uvodni odstavek• Stavek z definicijo problema in pomembnost• Hipoteza• Definicije• Predpostavke in omejitve
• Ta razdelitev ni obvezujoča, ampak mora temu logično slediti.
Izbira naslova
• Zaradi velike pomembnosti naslova se le-ta največkrat dokončno oblikuje šele na koncu.• Vmes uporabljamo delovni naslov raziskave.
• Problem dolžine naslova.• Povezan s tem, kako detajlno naj opisuje raziskavo.
• Nekatere revije omejujejo dolžino naslova na cca 85 znakov.• Primer dobrega naslova: “12-minutni test plavanja za določitev
aerobnih sposobnosti”• Primer predolgega naslova: “Uporaba 12 minutnega testa
plavalnih sposobnosti za določitev srčno-žilnih in dihalnih sposobnosti človeka”
• Primer prekratkega naslova: “Test plavalnih sposobnosti”
• Vedno imej v mislih bralce.• Prilagodi naslov reviji oziroma potencialnim bralcem.
• “Attenuated Cardiac Mitochondrial-dependent Apoptotic Effects by Li-Fu Formula in Hamsters Fed with a Hypercholesterol Diet”
120
Pisanje Uvoda
• Njegov namen je pritegniti bralce in prikazati problem ter njegovo ozadje.• Ne uporabljati preveč tujk oziroma tehničnih izrazov.• Kljub temu, pa lahko predpostavimo, da bodo bralci vsaj
malo seznanjeni z raziskovalnem področjem.• Ponavadi smo mi tisti, ki največ vemo o tem raziskovalnem
področju in tega se moramo zavedati.• Uvod se zaključi s predstavitvijo problema, ki pa pri dobrem
uvodu niti nebi bila potrebna.
• Obvezni deli uvoda.• Splošne informacije za opis relevance (s sklicevanjem na
literaturo).• Specifične informacije za opis ozadja (s sklicevanjem na
literaturo).• Eksplicitni opis raziskovalnega problema.
Pisanje raziskovalnega problema
• Je kratek odstavek (ali le stavek), ki eksplicitno poudari raziskovalni problem, katerega rešitev bomo v nadaljevanju predstavili.
• “V naši raziskavi bomo pokazali odnos med količino gibanja in telesno maščobo pri mlajših otrocih.”
• “Incidenca poškodb spodnjega dela hrbtenice in vratnih vretenc je na delovnem mestu pilota helikopterja velika, zato bomo v tej raziskavi izmerili vibracije v odnosu na položaj pilota helikopterja.”
• “Motivacija otrok pri testu vzdržljivosti ni vedno enaka, zato bomo analizirali ponovljivost metode za testiranje vzdržljivosti otrok v odnosu na otrokovo motivacijo.”
• Identifikacija spremenljivk.• Čeprav naj bi bil raziskovalni problem zgoščen, je včasih
potrebno izpostaviti tudi spremenljivke (neodvisne, odvisne, kategorične, zunanje, kontrolne, …).
• “Prikazali bomo odnos med odstotkom maščobe, izmerjenim z bioimpedančno metodo, in indeksom telesne mase pri starejših ženskah.”
• Pravilno formuliranje besedila (sintaksa!).
Predstavitev raziskovalne hipoteze
• Raziskovalna hipoteza je logično deduktirana iz teorije ali induktirana iz predhodnih ugotovitev, ki že namiguje rezultat.• Jo vedno uporabljamo v člankih.
• Naša raziskovalna hipoteza je, da obstaja povezava med količino in intenzivnostjo gibalne/športne aktivnosti, izmerjene z merilnikom pospeška oz. poročane s strani preiskovancev.
• Statistična hipoteza (ničelna hipoteza) ni isto kot raziskovalna hipoteza.• Se uporablja le za statistične teste, ki sledijo
eksperimentalnemu delu, in je včasih lahko ista kot raziskovalna hipoteza.
• Ni povezave med objektivno in subjektivno izmerjeno količino gibalne/športne aktivnosti.
• Ni povezave med objektivno in subjektivno izmerjeno intenzivnostjo gibalne/športne aktivnosti.
121
Definicija pojmov
• Je potrebna, da lahko kasneje z njimi operiramo in računamo.
• Mera utrujenosti?• Stopnja fizične pripravljenosti?• Starostni razredi?• Dehidracija?
• Izvedemo funkcijsko definicijo.• Mera utrujenosti – je čas od začetka testa, do trenutka, ko
maksimalna moč pade za 20% od začetne vrednosti.• Starostni razredi – S20_25…20 ≤ starost < 25 let; S25_30… • Čas krčenja – čas od 10% do 90% maksimalne amplitude.
• Ne moremo se vedno strinjati s funkcijsko definicijo, a vsaj vemo katera je bila uporabljena.
Navedba predpostavk, razmejitev in omejitev• Predpostavke
• Brez njih študije ne bi bilo mogoče izvesti.• Študija kakovosti ure ŠV: Predpostavimo, da je izvajalec
kompetenten učitelj.• Merjenje maksimalne moči: Predpostavimo, da merilec zna
opraviti meritev in da je merski instrument veljaven.• Razmejitev
• Omejitve, ki jih postavi raziskovalec.• Raziskava športnikov iz le treh športov.• Raziskava z uporabo specifičnega gibalnega testa.
• Omejitve• Omejitve, ki jih ne moremo kontrolirati oziroma so rezultat
razmejitev.• Slabša zunanja veljavnost, zaradi vključitve le treh športov.• Neprimerljivost podatkov z raziskavami, narejenimi z drugim
gibalnim testom.
• Ne pretiravat z opisom, da ne razvrednotimo raziskave.
Upravičevanje pomembnosti raziskave (ang. rationale of the study)• Temeljni pomen
• Ni potrebno, da ima takojšnji efekt.• Pomen raziskave na razvoj teorije.
• Aplikativni pomen• Ima takojšnji efekt.• Prenos teorije v prakso.• Ponavadi konkretni odgovor na določen problem.
• Opisovanje pomembnosti raziskave.• Poskušat zajeti holističen pogled.• Pokazati zapolnjeno vrzel, ki jo raziskava prinaša.• Opisati tako temeljni kot aplikativni pomen
raziskave.
122
Razlika med magistrskim delom in člankom
• Članki ne vsebujejo vseh teh poglavij.• Dolžina člankov krajša.• Ni pregleda literature, oziroma je integriran in
skrčen v uvod.• Namen raziskave je vedno podan, kot zadnji
(od)stavek uvoda.• Raziskovalne hipoteze so vedno podane.• Predpostavke, omejitve in razmejitve niso skoraj
nikoli podane.• Čeprav se jih priporoča.
Predstavitev metod dela
• Metode dela so namenjene predstavitvi:• Preiskovancev (ang. participants rather than subjects).• Merilnih instrumentov (ang. instruments).• Postopkov dela (ang. procedures).• Raziskovalnega dizajna, analiz in statističnih postopkov
(ang. research design, analysis, statistics).
• Namen metod je razložiti kako je bila raziskava narejena.• Mora biti dovolj podrobna, da lahko drug raziskovalec
ponovi raziskavo.• Podrobnost opisa v disertacijah je bistveno večja kot v
člankih.• V člankih je dovolj sklic na drug članek, vendar le če je
dostopen vsem.
Planiranje metod dela
• Namen je izločitev vseh neželenih hipotez.• Spomnimo se na primer velikosti čevljev in znanja
matematike.• Telesna maščoba je povezana s hitrostjo šprinta.
• Maxiconov princip:• Maksimiziraj pravo varianco in minimiziraj varianco
napake ter kontroliraj zunanje vplive.
• Principa planiranja eksperimentov.• Manj je več.
• Optimalni N, kot tudi število spremenljivk.
• Enostavno je bolje.• Raziskava naj bo enostavna kar se le da. S tem bo
enostavna tudi obdelava in interpretacija.
123
Opisovanje preiskovancev
• Standardni opis preiskovancev.• Starost, Spol, Nivo treniranosti/sposobnosti, Velikost
(telesna višina, teža, maščobna masa, mišična masa, …), Specifičnosti (športnik, kolesar, pacient, …).
• Stavek o prostovoljnem sodelovanju in podpisanem soglasju.
• Stavek o številu preiskovancev vključenih in priznati smrtnost ali izključitev.
• Naključno smo izbrali 48 moških, starih od 21 do 34 let, iz skupine 147 visoko-treniranih tekačev na dolge razdalje (VO2max > 60ml/kg/min). Preiskovanci so imeli naslednje značilnosti (standardna deviacija je v oklepajih): starost, M = 26 let (3.3); telesna višina, M = 172.5 cm (7.5); telesna masa M = 66.9 kg (8.7); VO2max = 65 ml/kg/min (4.2). Kasneje smo jih naključno razdelili v štiri skupine (n = 12).
• Podrobnost opisa se lahko razlikuje med študijami.
Izbor preiskovancev glede na raziskovalne cilje
• Katere preiskovance izbrati?• V skladu s cilji raziskave.
• Za testiranje učinka vadbe ramenskega sklopa ne bomo izbrali metalce kopja.
• Za testiranje povezanosti med VO2max in dosežkom na maratonu, ne bomo izbrali profesionalne maratonce.
Opisovanje merilnih instrumentov
• Cilj je točno definiranje odvisne spremenljivke.• Pri izbiri merilnega instrumenta moramo
upoštevati:• Veljavnost in ponovljivost testa.• Kompleksnost merjenja.• Dostopnost instrumenta.• Upravljanje z instrumentom.• Ali znamo meriti preiskovance z njim?• Občutljivost instrumenta?• Časovna kompleksnost merjenja.
• Opiši:• Poročaj o veljavnosti in ponovljivosti testa.• Poročaj o rezultatu merjenja (enota).• Opiši adaptacije na instrumentu, če so bile potrebne
(izločanje šuma, …).• Podaj shemo meritve, če kompleksno merjenje.
124
Opisovanje postopkov
• Vsebuje pomembne informacije o izvedbi meritev.• Kdaj smo izvedli meritev/meritve.
• Na začetku (ang. baseline), na koncu in 3 mesece po koncu.
• Kako smo izbrali rezultat za nadaljnjo analizo.• Vsak preiskovanec je skočil 3-krat in rezultat najvišjega skoka
smo vzeli v nadaljnjo analizo.
• Kako dolgo/intenzivno/pogosto je deloval faktor.• Kakšna navodila smo dali preiskovancem.• Ali so bile predhodno izvedene pilotne študije oziroma ali se
je merilec izobrazil za rabo instrumenta.
• Podanih mora biti dovolj informacij, da lahko nekdo raziskavo ponovi.
• Za čim manj metodoloških ali postopkovnih napak je vedno potrebno izvesti pilotno študijo.
Pilotna študija
• Namen je preveriti, če lahko veljavno opravimo določene merilne postopke oziroma apliciramo pravi faktor.• Vsaka raziskovalna naloga mora vsebovati pilotno
študijo, saj z njo:• Preverimo izvedljivost študije (časovno, prostorsko,
finančno).• Preverimo delovanje instrumentov.• Preverimo potrebo po raziskovalnem osebju.• Preverimo navodila preiskovancem.• Preverim varnost pri eksperimentalnem delu.• Preverimo zbiranje in vnos podatkov.
Opisovanje raziskovalnega dizajna in statističnih metod• Opis raziskovalnega dizajna je potreben za
logično sklepanje o postavljeni hipotezi.• Zelo pomemben del metode in si zasluži svoje
podpoglavje.• Da vidimo, če smo kontrolirali vse alternativne in
zunanje vplive.• Pri tem tudi naštejemo vse statistične metode
(eksperimentalni dizajn).• Statistično orodje (SPSS, Matlab, STATISTICA,
Mathematica, Excel, …).• Skoraj povsod deskriptivna statistika vseh spremenljivk
(M in SD).• Analiza povezanosti, regresije ali razlik.• Stopnja tveganja.
125
Kontrola efekta manipulacije
• Kako vemo, da je preiskovanec res telovadil doma 60 minut dnevno?
• Kako vemo, da se preiskovanec res ni opiral no nogo pri študiju mišične atrofije in izgube kostne mase zaradi imobilizacije?
• Vedno je potrebno kontrolirati svoj eksperimentalni dizajn.• To lažje izvedemo v laboratorijskih pogojih, težje
v situacijskih pogojih.• Napaka se prišteva k zunanjim vplivom in poveča
možnost vpliva alternativnih spremenljivk.
• Možno je tudi na kvalitativen način preverjati, čeprav je kvantitativen način zaželen.
• O tej kontroli je tudi potrebno poročati v metodah.
Usodne napake raziskovanja
• Usodne napake vedno onemogočijo objavljivost rezultatov in s tem popolnoma razvrednotijo raziskavo.
• Študija ravnotežja po bedrestu z merjenjem v 10-sekundnem intervalu.
• Nelogično postavljena hipoteza.• Predpostavke ne zdržijo.• Neprimerno število preiskovancev.• Premalo intenziven pravi efekt.• Neveljavno merjenje.• Neprimerno zajemanje podatkov (premalokrat).• Nekontrolirani zunanji vplivi.
Etična vprašanja
• Vsak raziskovalec se redno srečuje z etičnimi vprašanji.
• Ponavadi se nanašajo na slabo vodenje (zlorabljanje) raziskave, skupinsko delo in delo s preiskovanci.
• Delimo jih na področja:• Nepoštenosti.• Avtorskih pravic.• Zlorabljanje raziskav.• Skupinsko delo.• Varovanje preiskovancev.• Varovanjem živali.
126
Sedem področij nepoštenosti
1. Plagiarizem• Kraja ideje, slike, rezultata, teksta, …• Raziskovalni tatovi so vsi soavtorji ukradenega.
• Nikoli ne kradite znanstvene ideje, je najdragocenejša stvar raziskovalca.
• Revije preverjajo pred objavo pri vseh avtorjih.2. Prirejanje in ponarejanje
• Prirejanje podatkov, izmišljanje podatkov, večkratno objavljanje rezultatov, krivo navajanje citatov drugih, …• Nikoli objaviti dveh prispevkov z enako vsebino.
3. Neobjavljanje vseh podatkov• Izpustimo nekatere podatke, ker kvarijo statistični test.• Tanka črta med slabimi podatki in neobjavljenimi podatki.
• Prepričajmo se o naravi podatka in jih upoštevajmo (če pravilno izmerjeni) ali izločimo (če prišlo do napake).
Sedem področij nepoštenosti
4. Napake pri zbiranju podatkov.• Zbiranje podatkov preiskovancev, ki ne ustrezajo
vključitvenemu kriteriju.• Napačno delovanje merilne tehnike.• Neprimerno ravnanje s preiskovanci in preiskovancev
(popivanje, izsiljevanje s plačilom).• Nepravilno zajemanje podatkov.
5. Nepravilno hranjenje podatkov.• Podatke moramo shraniti v surovi obliki in ne spremenjeni.
Za kontrolo podatkov vsaj 3 leta.6. Napačno navajanje avtorstva.
• Prvi avtor je avtor ideje in raziskovalnega plana.• Drugi in tretji sta po vrsti glede prispevanja.• Tehnično osebje niso soavtorji, ampak navedeni v zahvali.• Le tisti avtorji, ki so dejansko prispevali k prispevku.• Zadnji avtor je ponavadi ekvivalenten prvemu – vodja
projekta.
Sedem področij nepoštenosti
7. Neprimerne prakse objavljanja.• Mentor ne sme biti prvi avtor prispevka, ki izhaja iz
dizertacije študenta.• Mentor je lahko soavtor le v primeru, da dejansko prispeva
k prispevku.
127
Etična vprašanja avtorskih pravic
• V naših delih pogosto uporabljamo citate, objekte drugih avtorjev.• Za objekte jih moramo vedno vprašati za dovoljenje in potem
navesti “Uporabljeno z dovoljenjem Novak P.”• Za citate pa ustrezno citirati literaturo, iz katere smo črpali.
• Namen uporabe avtorskega dela drugih.• Raziskovalne in izobraževalne namene ali tržne namene?• Kopiranje članka ali dela knjige je pričakovano, medtem ko
kopiranje cele knjige ni.• Največkrat ni pomembno kolikšen delež bi radi kopirali, bolj
pomembna je vsebina.• Knjiga standardiziranih testov ali Svetovno poročilo zdravja.
• Kako kopirana verzija vpliva na marketinško okolje originala.• Kopija članka ne veliko, kopija knjige pa lahko zelo.
• Vedno prosite za dovoljenje, ga boste tudi dobili!• ”Better safe than sorry”
Etična vprašanja zlorabljanja raziskav• Zloraba raziskave se sankcionira, medtem ko
napaka v raziskovanju le tolaži.• Prevara, netočna interpretacija z željo po
objavi/denarju/projektu, ponarejanje, nepravilno postavljanje avtorjev, neetična praksa• Sankcije: prepoved akademskega dela, prekinitev dela na
projektu, denarna kazen, nenapredovanje, verbalni opomin.
• Študenti se naj za vsako vprašljivo etično dejanje posvetujejo s svojim učiteljem ali mentorjem.
Etična vprašanja skupinskega dela
• Skupinsko delo študentov oziroma delo z učitelji/mentorji.• Od trenutka začetka sodelovanja raziskovalci (tudi
študenti) postanejo kolegi. Ne glede na njihovo habilitacijo.• Raziskovalec oz. učitelj ne postaneš ob disertaciji,
temveč se razvijaš več let.
• Zato morajo študenti delovati premišljeno in odgovorno, da zagotavljajo visoko-kakovostno delo.
• Pomembno pri tem je, da izberemo dobrega mentorja.
128
Etična vprašanja skupinskega dela
• Izbira mentorja.• Premišljeno izberite mentorja, na osnovi:
• Njegove dostopnosti, referenc, tekočih projektov in programov, laboratorija in opreme.
• Pri tem se odkrito pozanimaj pri drugih profesorjih in študentih.• “One-on-one” odnos !• Opazujte jih pri delu, razmišljanju, mreženju, …
• Podiplomski študenti morajo biti raziskovalci poln delovni čas (predvsem doktorski študenti).
• Poišči sredino, ki objavlja svoje prispevke !• Poleg mentorja poiščite tudi ostale svetovalce:
• Somentorja, konzultante in komisijo, ki bo vrednotila vaše delo.
• Zamenjava mentorja.• Bodite odkriti, se pogovorite, ponudite drugo možnost
in/ali zamenjajte. Gre se za vas – ne sme biti zamer!
Etična vprašanja varovanja preiskovancev• Zelo pogosto se bo naše raziskovanje vrtelo okrog
preiskovancev.• Ne smemo njihovo zdravje ogrožati v nobenem primeru.
• Če obstoja minimalna možnost tega, je potrebno narediti vse potrebno, da jo še zmanjšamo.
• Ne smemo vršiti psihološki pritisk na njih.• Pravice preiskovancev so:
• Pravica do nesodelovanja.• Vedno ga je potrebno vprašati in dovoliti njegov odstop.
• Pravica do privatnosti.• Uvedba ID.
• Pravica do varovanja podatkov.• Kdo bo imel dostop do podatkov in kdo bo lahko videl njegovo
ime?• Pravica do povratne informacije.• Pravica do odgovornosti raziskovalca.
• Raziskovalec mora vedno imeti fer odnos do preiskovanca in mu povedati vse, četudi prepozno.
Etična vprašanja varovanja živali
• Zelo staro etično vprašanje (vsaj 400 let).• V raziskovalne namene je vključenih zelo malo
živali napram potrebam prehrambene industrije.• Še vedno pa na živalih lahko delamo raziskave, če:
• Testiranje farmacevtskih izdelkov – zdravil.• Preučevanje modelov zdravja (artritis, …, staranje).• Temeljno fiziološko raziskovanje, ki na človeku ni etično.• Laboratorijsko poučevanje študentov.• Razvoj operacijskih tehnik.
• Učinek raziskave mora biti velik!
129
Ponovitev
• Znamo iskati literaturo• Znamo formulirati raziskovalno hipotezo• Znamo zasnovati raziskovalni prispevek
• Uvod (pregled literature)• Hipoteze (raziskovalne in statistične)• Metode
• Zavedamo se poštenosti v raziskovanju• Znamo etično delovati v raziskovanju
Predavanje 9:PISANJE RAZISKOVALNEGA POROČILA
Izvedeli boste:1. Načini raziskovalnega poročanja
a. Zaključna poročilab. Prispevki na konferencahc. Posterjid. Prispevki v revijahe. Diplomsko, magistrsko in doktorsko delof. Znanstvene monografije, knjige, učbeniki
2. Tehnična navodila raziskovalnih poročil
3. Navodila za izdelavo magistrskega delaa. Postopek oddajeb. Tehnična navodila
Načini raziskovalnega poročanja
• Brez zaključnega poročila enostavno raziskava ni dokončana. Omogoča…
• dokumentiranje našega dela,• delitev raziskovalnih dosežkov,• evalvacijo našega dela,• raziskovalno rast!
• Vrste raziskovalnega poročanja so:• Seminar.• Zaključno poročilo projekta.• Prispevek na konferenci (poster, poredavanje, povzetek, celoten
prispevek z recenzijo).• Raziskovalni članek (v revijah različnih kakovosti).• Pregledni članek (v revijah različnih kakovosti).• Znanstvena monografija (celotna ali del).• Diplomsko delo, magistrsko delo, doktorska disertacija.• Knjiga, učbenik, …(v revijah različnih kakovosti)
130
Vloga raziskovalca pri pisanju• Začetnik / majhna
• Pisanje poročila majhnega projekta.• Soavtorstvo članka.• Predstavitev prispevka na lokalni konferenci.• Objava prispevka v revijah nižje kakovosti.
• Srednja• Je napisal poročilo sam.• Predstavitev prispevka na nacionalni konferenci.• Prvi avtor članka.• Objava prispevka v revijah srednje kakovosti.
• Vodilna / velika• Predstavitev prispevka na mednarodni konferenci.• Prvi ali edini avtor članka.• Objava več prispevkov v revijah visoke kakovosti.• Avtor preglednega prispevka v reviji, knjigi, …• Urednik znanstvene monografije, knjige, učbenika.
Tehnična navodila raziskovalnih poročil• Ni poenoteno!
• To lahko predstavlja veliko oviro, predvsem pri izgubi časa, ki lahko doseže tudi po več dni.
• Prispevek na 15000 znakov, pripravimo za objavo v reviji, ki dovoli le 12000 znakov. Potem nam ga revidirajo in na koncu zavrnejo. Kako naprej?
• Povzetek lahko omejen z znaki ali strukturiranjem.• Problem citiranja in navajanja virov.
• Veliko se govori o APA standardih, a upošteva malo.
• APA standardi definirajo:• strukturo, vsebino in stil pisanja,• prikaz rezultatov,• citiranje in navajanje literature,• postopek revizije (objave).
Struktura zaključnih poročil• Naslov (ang. Title)
• Ponavadi omejeno s številom znakov (85) ali številom besed (12).
• Naslovna stran (ang. Title page)• Avtorji, Institucije (ang. Affiliations), kontaktni avtor (ang.
Corresponding author), zahvala (ang. Acknowledgement), …
• Povzetek (ang. Abstract)• Vedno omejen s številom znakov [250, 350] in strukturo [z ali brez].
• Uvod (ang. Introduction)• Ekplicitno navedi znanstveno hipotezo.
• Metode (ang. Method)• Toliko detajlne, da lahko nekdo drug raziskavo ponovi.
• Rezultati (ang. Results)• Suhoparni, zato jih naredite privlačne z objekti (tabele, grafi, slike).
• Diskusija (ang. Discussion)• Interpretacija rezultatov z posploševanjem, samokritičnostjo, …
• Literatura (ang. References)
131
Naslov
• Mora biti samozadosten!• Dovolj širok, da je razumljiv in dovolj
ozek, da ne zavaja. • Prva selekcija nadaljnjega branja
prispevka se vrši na osnovi naslova• Ne uporabljaj kratic v naslovu• Ne uporabljaj odvečnih besed
• Metoda, rezultat, raziskava, …
• Primer:• NE: Primerjava gibalne aktivnosti obeh spolov z
uporabo objektivne metode merjenja gibanja
• DA: Dečki so gibalno aktivnejši od deklic
Povzetek
• Je vedno viden, zato mora biti dobro napisan.
• Na osnovi naslova in njega se bralec odloči o nadaljnjem branju.
• Pri oddaji projektov je vreden tudi po 40k€ na besedo.
• Nekaj tehničnih navodil:• Natančnost: mora omogočati primerjavo s
celotnim prispevkom.• Jedrnat: poudari le 4-5 najpomembnejših
ugotovitev; začni z najbolj udarnim stavkom, ne izgubljaj prostor.
• Struktura mora biti implicitno ali eksplicitno izražena.
Uvod
• Mora predstaviti problem.• Zakaj je problem pomemben?
• Katere so teoretične in praktične implikacije raziskve?
• Kako je ta raziskava povezana z ostalimi?• Katere so hipoteze?
• Ali izbrani raziskovalni dizajn lahko odgovori na zastavljene hipoteze?
• Bralec je zdaj že zainteresiran in pozna področje dobro.• Predstavi motivacijo, odstopanja prejšnjih
raziskav – lahko zgodovinsko, novo merilno metodo na področju, …
• „Ne vijugaj, vleci rdečo nit“
132
Metode
• Detajlno predstavijo kako je bila raziskava izvedena.• Vsi ostali teksti ne sodijo sem.
• Se delijo na podpoglavja:• Preiskovanci• Vzorčenje• Velikost vzorca, raziskovalna moč, natančnost• Merilni postopki, spremenljivke in kontrola kovariat• Raziskovalni dizajn• Intervencije• Postopki obdelave podatkov• Statistika
Rezultati• Bodi pošten in poročaj vse rezultate, tudi
neznačilne.• Vam to mogoče ni pomembno, nekomu drugemu
pa bo.
• Ne sramuj se odstavka o kvalitativnih opazkah.• Velikokrat je to temelj nadaljnih raziskav.
• Poročaj o osnovnih podatkih preiskovancev.• Omogoči dovolj podatkov za pregledne članke in
ostale, ki vas bodo citirali.
• Daj težo najpomembnejši ugotovitvi.• Prikaži grafično, četudi le ena številka!
Diskusija/Razprava
• Ne ponavljaj se!!!• Interpretiraj svoje ugotovitve, glede na
zastavljeno hipotezo in problem.• Razloži mehanizme določene spremembe.
• Ob tem odkrij še neznana področja in spodbujaj področje.
• Razloži teoretične in praktične implikacije.• Omeni omejitve raziskave.
133
Litereatura
• S tem poudarimo delo naših predhodnikov na področju.
• In utemeljimo naše predpostavke, diskusijo.
• Citirano delo navedemo v literaturi, kjer mora biti razvidno kje je bilo objavljeno.• Vsak si želi čistih citatov!
• Citira se članke objavljene v revijah.• Redko konference, neobjavljena opažanja,
študijska zaključna dela.
Recommended