42
Andmeanalüüs: statistiline andmestik ja kirjeldav statistika IFI7041 Kairi Osula

Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

Embed Size (px)

DESCRIPTION

Andmeanalüüs: statistiline andmestik ja kirjeldav statistika. IFI7041 Kairi Osula. Kursuse korraldus. Üldine informatsioon. www.tlu.ee/~kairio/7041 Kursuseprogramm Slaidid Is.töö ülesanded [email protected] Teemad: Uuringute läbiviimise põhietapid Statistiliste andmete kogumine - PowerPoint PPT Presentation

Citation preview

Page 1: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

Andmeanalüüs:statistiline andmestik ja kirjeldav

statistika

IFI7041

Kairi Osula

Page 2: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KURSUSE KORRALDUS

Üldine informatsioon

www.tlu.ee/~kairio/7041• Kursuseprogramm

• Slaidid

• Is.töö ülesanded

[email protected]

Teemad:• Uuringute läbiviimise põhietapid

• Statistiliste andmete kogumine

• Tunnusetüübid.

• Kvantitatiivsed ja kvalitatiivsed meetodid

• Andmete kirjeldamine.

• Tabelid ja diagrammid.

• Arvkarakteristikud

Page 3: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KURSUSE KORRALDUS

Eksam

Kirjalik avatud küsimustega test

Kodused tööd (100p.)

Hinded: • sisestan hiljemalt jaanuaris 2013

„A” - suurepärane 91-100%„B” - väga hea 81- 90%„C” - hea 71- 80%„D” - rahuldav 61-70%„E” - kasin 51- 60%„F” - puudulik 0 – 50%

„+“ 85-100p (tõstab testi hinnet ühe hinde võrra)„0“ 67-84p (jätab testi hinde samaks)„-“ 51-66p (langetab testi hinnet ühe hinde võrra)„F“ 0-50p (töö esitamata või esitatud mitterahuldavalt ning tuleb uuesti esitada)

Page 4: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KURSUSE KORRALDUS

Eksam

Põhieksamitel on materjalide kasutamine lubatud• Kõik mis on paberkandjal, arvutis on avatud 1 fail (slaidid), telefone ei

kasuta Järeleksamitel me materjale ei kasuta

Avatud küsimused, iga kord erinevad, mitu varianti 1 tund Tulemused kahe päeva jooksul Tööd saab pärast näha (eelneval kokkuleppel)

Page 5: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

LISALUGEMIST

“Uuri ja kirjuta” • Autorid: S. Hirsjärvi, P. Remes,

P. Sajavaara • Kirjastus: Medicina• Ilmumisaasta: 2005

“Uurija käsiraamat”• Autor: A.Kidron• Kirjastus: Mondo• Ilmumisaasta: 2008

Page 6: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

LISALUGEMIST

“Andmete analüüs ja tõlgendamine sotsiaalteadustes” • Autor: Liina Mai Tooding• Kirjastus: Tartu Ülikooli kirjastus• Ilmumisaasta 2007

“Andmeanalüüs sotsiaalteadustes”• Autor: Liina Mai Tooding• Kirjastus: Tartu Ülikooli kirjastus• Ilmumisaasta: 1998

Page 7: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

LISALUGEMIST

“Statistilise andmetöötluse pakett SPSS 14.0” Põhikursus• Autor: Katrin Niglas• Kirjastus: Tallinna Ülikooli kirjastus• Ilmumisaasta: 2008

www.tlu.ee/~katrin• Õppematerjalid• SPSS õppematerjal

Page 8: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

UURINGUTÜÜPE SAAB KLASSIFITSEERIDA JÄRGMISELT:

• Avastav• Kirjeldav• Analüütiline• Ennustav

Eesmärgi (purpose) alusel

• Teoreetiline• Empiiriline• Rakenduslik

Uuringu lähenemise

(approach) alusel

• Kvalitatiivne• Kvantitatiivne• KombineeritudProtsessi alusel

Page 9: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

UURINGU LÄHENEMISE PÕHJAL

Page 10: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

TEOREETILINE UURING

Eesmärk • Olemasoleva teabe/uuringute analüüs • Erinevate teooriate kriitiline analüüs (võrreldakse ühe eeliseid

teisega) Autor peab näitama, milline on tema panus uute teadmiste otsingul,

kasutamisel, süstematiseerimisel ja hindamisel.

Näited• Filosoofilised küsimused, puhta matemaatika teoreemid,

ajaloolised uuringud, arvutikasutuseeetika (loogiline arutelu ja seisukohad), tarkvara võrdlev analüüs

Referaat (?)• Seminaritöö kui referaat (teoreetiliste uuringute KÕIGE välimisem kiht)

Page 11: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

RAKENDUST LOOV UURING

Näited• Personaalne

arendusprojekt (või selle osa)

• Õppematerjalide loomine

Sammud• Probleemi analüüs (vajadused, eesmärgid, olemasolev teave)• Disaini protsess (tööjaotus, ajakava, meetodid)• Disaini protsessi resultaat (rakenduse visandid, vaheversioonid, lõplik

rakendus)• Hindamine e. evalvatsioon (rakenduse testimine, hindamine lähtuvalt

standarditest, kasutajate tagasiside)

Page 12: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

EMPIIRILINE UURING

Reaalsed andmed• kirjeldamine (nähtuste ja selles toimuva fikseerimine)• seletamine (põhjuslike seoste tuvastamine ja avamine, nende

tähenduse ja toimemehhanismide äraseletamine) Analüüs andmete põhjal

• mõistmine ja tõlgendamine Järeldused analüüsi põhjal

• prognoosimine (millegi kulgemise suuna ja viisi ettenägemine)• uute probleemide ja hüpoteeside tuletamine

Page 13: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

UURINGU LÄHENEMISE PÕHJAL

Näited

Page 14: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

EMPIIRILINE UURING

K. Niglas

• küsimus, hüpotees, eesmärk

Uurimisprobleem

• juhuslik valim, üks juhtum, mitu juhtumit

Valikumeetod

• struktureeritud ankeet, struktureerimata intervjuu, ...

Andmekogumis meetod(id)

• statistilised meetodid, kodeerimine

Andmeanalüüsi meetodid

• kirjeldused, empiirilised üldistused, seaduspärasused,...

Tulemused/järeldused

Page 15: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

EMPIIRILINE UURING

Uurimisprobleem

Küsimus, probleem Hüpotees Eesmärk

• Kirjeldama, selgitama (põhjus- tagajärg), pakkuma lahendusiLahendamisvajaduse põhjendusOlemuse laiem selgitusSenised teooriad

Probleem peab olema selgelt lahti kirjutatud. Kõik järgmised valikud peab saama sellest põhjendada.

Üliõpilane peab suutma jagada resursse – probleem nii kitsas, et suudab seda reaalselt tagada.

Probleem täpsustub töö käigus (liiga lai?)

Uurimis-

probleem

Valikumeetod

Andmekogumis meetod(id)

Andmeanalüüsi meetodid

Tulemused/

järeldused

Page 16: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

EMPIIRILINE UURING

Strateegia – uuringu üldplaan

Eksperiment e. katse• Nähtuse esilekutsumine uurimise eesmärgil• Hüpoteeside tõestamine/ümberlükkamine• Välismõjudest sõltumatu

Juhtumianalüüs• Ajas või tegevuses piiritletud juhtum• Ka 2-3 objekti• Tulemus: tüüpiliselt on nii...

Valikuuring• Koostatakse valim• Kogutakse andmeid• Kirjeldatakse, selgitatakse nähtusi, üldistatakse

Tegevusuuring• Uuringu eesmärgiks konreektsed parandused või muutused, seega

oluline ka tulemuste rakendamine

• “Kasutaja” tasand

Uurimis-

probleem

Valikumeetod

Andmekogumis meetod(id)

Andmeanalüüsi meetodid

Tulemused/

järeldused

Page 17: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

VALIMI MOODUSTAMINETõenäosuslikud valimid(probability sampling)

Mittetõenäosuslikud valimid (non-probability sampling)

Mugavusvalim (convenience sampling)Objektid valitud “mugavalt”

Eesmärgist lähtuv valim (suunatud valim)

(purposive sampling)Objektid valitud eesmärgipäraselt

Kvootvalim (quota sample)

Objektid vastavad tingimusele

Juhuslik valim (accidental sample)

Pilootuuring (ei esinda üldkogumit)

Lumepalli valim (snowball sample)

Raskesti kättesaadavad sihtgrupid

Juhuvalim (simple random sample)

kõigil üldkogumi liikmetel on võrdne tõenäosus sattuda valimisse

Süstemaatiline valik(systematic sampling)

objektid valitakse kindla süsteemi järgi(iga 7-s)

Kihtvalim(stratified random sample)

Page 18: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

EMPIIRILINE UURING

Andmekogumismeetodidstruktureeritud või poolstruktureeritud

INTERVJUUD (küsitlused)

DOKUMENTEERIMINE koondandmete talletamine struktureerimata andmete

kodeerimine - KONTENTANALÜÜS

psühholoogilisi ja sotsiaalseid aspekte mõõtvad TESTID

(väärtushinnangute skaalad)

(standardiseeritud) võimekus– ja sooritusTESTID

struktureeritud või poolstruktureeritud

ANKEEDID (küsimustikud)

VAATLUS

Uurimis-

probleem

Valikumeetod

Andmekogumis meetod(id)

Andmeanalüüsi meetodid

Tulemused/

järeldused

Page 19: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

ANDMEKOGUMISMEETODID

Rühmatöö

1. Tooge näide olukorrast, kus vaatlus meetodina on ainuvõimalik.

2. Millised on vaatluse kui meetodi kõige olulisemad nõrkused?

3. Reliaablus- kuivõrd on saadud vaatluse tulemused ajas püsivad ja korratavad?

4. Valiidsus- kas on võimalik, et mitu vaatlejat saavad ühel vaatlusel sarnased tulemused?

5. Miks intervjuu edukuse kõige olulisem detail on hea küsitleja?

6. Milliste teemade puhul ei soovita silmast-silma intervjuud?

7. Kui suur võiks olla fookusgrupi grupp?

8. Milliste uuringute jaoks sobib andmekogumismeetodiks postiküsitlus?

9. Kuidas teie motiveeriksite posti teel läbiviidavas küsitluses vastajaid osalema?

10. Kas intervjuu küsimused tuleks eelnevalt vastajale saata?

11. Telefoniküsitluses on väga oluline algus... Kuidas teie alustaksite kõnet?

Page 20: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

INTERVJUU

Page 21: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

FOOKUSGRUPP6-10 osalejat

valitud sihtrühma esindajaid intervjueerib spetsiaalse väljaõppe saanud intervjueerija

(moderaator) koostab uuringu aruande.

Lapsesuu ei valetaI klass

27.09.2010

Page 22: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

INTERNETIKÜSITLUS

Reeglina oodatakse kiirelt suurt hulka vastuseid.

Tihti aga ei laeku vastuseid nii ruttu ja nii palju kui loodetakse. Mis on internetiküsitluse ohud?

Küsitlusest (ette)teavitamine telefoni teel annab reeglina häid tulemusi. Kas küsitlusankeedi ette saatmine annab samuti häid tulemusi?

Page 23: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

PILOOTUURING

Testib idee toimet reaalsetes tingimustes, kuid vähendatud mahus.• Küsimustiku uuringueelne kontrollimine• Vähendab probleemide ja vigade tekkimist reaalse

andmekogumise käigus • Vähe vastajaid

N: reklaamplakatid, loterii, soodushind

esmalt ühes kaupluses, reklaami väljapanek ühes geograafilises piirkonnasNende põhjal tehakse omakorda järeldused täiendamisvajadusening edasise rakendamise kohta kogu sihtturul.

Page 24: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

0 50 100 150 200 250

1500-2000

800-1000

1000-1500

üle 2000

500-800

300-500

alla 100

100-300

0 50 100 150 200 250

alla 100

100-300

300-500

500-800

800-1000

1000-1500

1500-2000

üle 2000

Page 25: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KUMB LEGENDAARNE POPBÄND SULLE ROHKEM MEELDIB?

Page 26: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

ÜLDINE SKEEMSissejuhatavad, lihtsad küsimusedKONTAKTI LOOMINE

Küsimused teema kohta.k.a. kontrollküsimused, provotseerivad (spontaansuse suurendamiseks)

Kommentaaride lisamisvõimalusVähemalt lõpus!

Tausta-küsimusedAinult uuringu jaoks olulised!

Page 27: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

TAUST... et saaksime Teie vastuseid vaadelda koos teiste vastajate omadega,

kes Teile sarnanevad oma soo, vanuse, hariduse, elukoha ning mõnede muude statistiliselt oluliste tunnuste poolest. Teie sugu

Mees

Naine

  Mitu aastat olete kooliharidust saanud,

koolides õppinud?

_____ aastat

Milline on Teie kõrgem omandatud haridustase?

Algharidus

Põhiharidus

Kutseharidus (ilma keskhariduseta)

Keskharidus

Kutseharidus + keskharidus

Rakenduslik kõrgharidus

Ülikooliharidus, kraadiharidus

Muu haridus. Kirjutage, milline ________________

Teie rahvus

Eestlane

Venelane

Muu (mis?)________________

  Kui vana Te olete?

_______ aastat (märkige täisaastad)

Milline on Teie perekonnaseis?

Üksik (pole olnud abielus)

Ametlikus abielus

Vabaabielus (elan koos partneriga)

Lahutatud / Elan lahus

Lesk

Page 29: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

SKAALAD

Äärmiselt madal staatus äärmiselt kõrge staatus

1 2 3 4 5 6 7 8 9 10 11 12 13

Olen täiesti nõus

Olen nõus

Ei ole nõus

Ei ole üldse nõus

Jah, väga Pigem meeldib Pigem ei meeldi Üldse ei meeldi

Üldse mitteVähem kui ½ tundi½ tundi kuni 1 tundRohkem kui 1 tund kuni 1½ tundi Rohkem kui 1½ tundi kuni 2 tundiRohkem kui 2 tundi kuni 2½ tundiRohkem kui 2½ tundi kuni 3 tundiÜle 3 tunniEi oska öelda

Page 30: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KUIDAS KÜSIDA?

“Kas te olete kunagi midagi poest varastanud?”

“Kas Te palun ei ütleks mulle selle kaardi numbri, mis kõige paremini kirjeldab teiega juhtunut”

• 1: ma olen poest midagi varastanud, • 2: ma ei ole poest midagi varastanud, • 3: muu.

“Nagu üldiselt teada, varastavad tänapäeval paljud naised poest midagi. Kas ka Teie olete juhtumisi midagi poest varastanud?”

“Kas teate mõnda naist, kes on midagi poest varastanud?” “Kuidas on lood Teiega?”

Otsene küsimus

Numereeritud kaart (the numbered card)

“Igaühe” lähenemine (the ‘everybody’ approach)

“Teiste inimeste” lähenemine (the ‘other people’ approach)

Page 31: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

MUUDAME ÄRA

Koosta õige sõnastusega küsimus

1. Kas tulite Tallinna Ülikooli, kuna see on edukas kool?JAH EI

2. Kui tihti tegelete spordiga?

4x6 3 korda nädalas (arstide soovitus) Tihti Sageli Harva

3. Ega te ei ole kunagi autoga sõites kiirust ületanud?

4. Kuidas teile meeldib uus ööklubi “Teater”?

5. Kuidas Teile maitses see kõrgelt auhinnatud vein?

6. Kas Teie sünniaasta jääb vahemikku:1961-1970 1971-1980 1981-1990

7. Milliseid aktuaalseid diskursiivseid teemasid peaks teie arvates käsitlema meie kasvatusteaduse uurimismeetodite kursus, pidades silmas eelkõige positivistliku ja interpretatsioonilise teadusparadigmade vahelist diskussiooni Eesti hariduspoleemikas?

Page 32: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KAASKIRI

Näide nr. 1

Tere!Viin läbi üht väikset uuringut, mis aitaks mul enda diplomit kirjutada:-)) Nii et kellel aega ja tahtmist võiksid vastada alljärgnevatele küsimustele...:

• Mis on teie vanuseks(sorry selle küsimuse eest;-), kindlat arvu pole vaja ): 10-20, 20-30, 30-40, 40-50, 60-70?

• Kumba eelistate kas McDonaldsi või Hesburgeri?• Kumma teenindus rohkem meeldib?• Kui tihti te seda külastate?• Kui tihti te ostate koju kaasa?• Kui tihti te võtate komplekteinet ja millist?• Milline on seal teie lemmiktoit?• Millal te seda külastate: hommikul, päeval või õhtul?

Tänan kõiki ette!!!!

Page 33: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KAASKIRINäide 2.

Antud küsimustiku eesmärgiks on uurida erinevaid hoiakuid ning käitumismalle.

Kõik vastused on rangelt konfidentsiaalsed.

Paluks vastata igale küsimusele nii ausalt ja põhjalikult, kui võimalik.

Hoolimata küsimustiku pikkusest, kulub selle täitmiseks vaid 10-15 minutit.

Aitäh osalemise eest.

Konfidentsiaalsus

Vastuseid eraldi ei kasutata ega levitata.

Vastuseid uuringuküsimustele ei saa seostada vastaja isikuandmetega

Analüüsi ei tehta üksikvastaja tasemel, vaid sihtgruppide lõikes.

Andmeid kogutakse ja esitatakse kodeeritult

Page 34: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KAASKIRI

Tallink on läbi viimas turu-uuringut, eesmärgiga selgitada välja meie klientide rahulolu ja ootusi seoses Club One püsikliendiprogrammiga.

Juhusliku valiku alusel meie andmebaasist olete Teie osutunud üheks väljavalitutest, kellel avaneb võimalus anda oma panus Club One püsikliendiprogrammi parendamiseks.

See tähendab, et antud uurimus on mõeldud eelkõige Teie rahulolu suurendamiseks ning Teie arvamus on meile väga oluline.

Loodame, et leiate ca 10 min. aega vastusevariantide märkimiseks.

Väga oodatud on vabas vormis kommentaarid, kuna need annavad Teie arvamustest ja soovidest veelgi parema ülevaate.

Küsitlus on anonüümne ja kestab 2 nädalat.Palume Teil ankeedid täita hiljemalt 12. sept. 2008.

Tutvustus

Uuringu eesmärk

Valikuprintsiip

Motiveerimine

Näide 3.

Täitmisaeg

Konfidentsiaalsus

Tähtaeg

Page 35: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

EMPIIRILINE UURING

Analüüsi meetod

Küsimuse tüübist

• Uurimisküsimus: laiem• Analüüsiküsimus: kas kaks gruppi on erinevad/seotud?

Andmete tüübist (väärtuste järjestatavus, skaalavahemike võrdsus)

Sihtrühmast

• Uurija teadmised/oskused• Kellele esitab, kuidas?

Uurimis-probleem

Valikumeetod

Andmekogumis meetod(id)

Andmeanalüüsi meetodid

Tulemused/järeldused

Page 36: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

TUNNUSE TÜÜBIDArvestame järjestatavust, skaalavahemike võrdsust

Nimitunnuse väärtuseid ei saa järjestada

Järjestustunnuste väärtuseid saab järjestada

Skaalavahemikud ei ole võrdsed

Skaalavahemikud on võrdsed

Vähe erinevaid väärtuseid

Palju võimalikke väärtuseid

Kaks võimalikku väärtust

Järjestatavus ja skaalavahemike võrdsus ei ole probleem

Nimitunnused

Järjestustunnused

Intervalltunnused

Binaarsed tunnused

Page 37: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

MÄÄRAME TUNNUSE TÜÜBID

Objekt – tunnus – väärtus

Nimitunnused Järjestustunnused Arvtunnused Binaarsed tunnused

Page 38: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

TUNNUSE TÜÜBIDUuritakse 100 kooli. Mis tüüpi on tunnused?

Kooli tüüp. (algkool, 9-klassiline kool, 12-klassiline kool) Kui kaugel on kool kesklinnast? Milline on kooli maine? (väga hea, hea, rahuldav, halb, väga halb) Millised huviringid koolis tegutsevad? (laulukoor, korvpalli trenn,

kunstiring, jne) Mitu paralleelklassi avatakse? Kui suured on selles koolis klassid? (väikesed, keskmised, suured) Mis on õpetajate keskmine vanus selles koolis? Kas koolis töötab haridustehnoloog või mitte?

Nimitunnused

Järjestustunnused

Intervalltunnused

Binaarsed tunnused

Page 39: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

ANDMETE ANALÜÜSI VAHENDID

Page 40: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

EMPIIRILINE UURING

Tulemused, järeldused

kirjeldused, empiirilised üldistused seaduspärasused

Millised tendentsid, trendid, seaduspärasused peegelduvad tulemustes

Kas hüpoteesid leidsid kinnitust Kas tulem on varem teadaolevaga kooskõlas või vastuolus?

Millega vastuolu selgitada? Milline on tulemi uudsus?

Uurimis-probleem

Valikumeetod

Andmekogumis meetod(id)

Andmeanalüüsi meetodid

Tulemused/järeldused

Page 41: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

KODUNE ÜL. 1

Rühmatöö

Uurimis-probleem

Taust

Valikumeetod

Andmekogumis meetod(id)

Andmeanalüüsi meetodid

Tulemused/järeldused

Page 42: Andmeanalüüs: statistiline andmestik ja kirjeldav statistika

MEIE KURSUS

Kvantitatiivne uuring Kirjeldav statistika

andmete esmane kokkuvõtt, ülevaatlik analüüs• TABELID• ARVJOONISED• KIRJELDAVAD ARVNÄITAJAD• SEOSED

Eeldame, et andmed on kogutud

Millal millist andmeanalüüsi meetodit kasutada?

Uurimis-probleem

Taust

Valikumeetod

Andmekogumis meetod(id)

Andmeanalüüsi meetodid

Tulemused/järeldused