10
Beugró számítások: Szórás Khi-négyzet próba Szabadságfok (Degrees of Freedom): (sorok száma-1) x (oszlopok száma-1) A várt érték kiszámítása: (sorösszeg*oszlopösszeg/főösszeg) Korreláció Egymintás t-próba

Statisztika I. Elméleti tételek

Embed Size (px)

DESCRIPTION

Kidolgozott elméleti tételek statisztika I. kurzushoz, elsősorban pszichológia szakos hallgatók részére.

Citation preview

Beugr szmtsok:Szrs

Khi-ngyzet prba

Szabadsgfok (Degrees of Freedom): (sorok szma-1) x (oszlopok szma-1)A vrt rtk kiszmtsa: (sorsszeg*oszlopsszeg/fsszeg)Korrelci

Egymints t-prba

Szabadsgfok: n-1

Elmleti ttelekMi a klnbsg minta s alapsokasg kztt? Mit jelent a reprezentatv minta? Mi a megfigyelsi egysg? Melyik a leggyakoribb?Az alapsokasg/populci azon egyedek / trgyak / csoportok sszessge, halmaza, amelyeket a kutatsi krds rint. A minta a populci egy gondosan megvlasztott rsze, amelyen a kutatst vgezzk.Egy minta bizonyos vltozk mentn akkor reprezentatv, ha a mintba kerlt elemek ugyanolyan arnyban vannak jelen, mint az alapsokasgban. Teht egy minta csak bizonyos szempontok alapjn nevezhet reprezentatvnak. Ha ms szempontokat vesznk figyelembe, akkor mintnk lehet, hogy nem reprezentatv.Megfigyelsi egysg: A minta azon eleme, amelyre a kutatsi krds vonatkozik, amit nem lehet kisebb egysgekre bontani. Pl. a csald, vagy telepls stb. Leggyakoribb megfigyelsi egysg: alapveten az ember.Mrsi szintek (sklk) ismertetseNominlis skla: Olyan vltozk, amelyek egyenrangak, hierarchikus sorrendbe nem rendezhetk, mg ha szmmal is vannak jellve (a jells nknyes, nvleges), kzttk a klnbsg minsgi s nem mennyisgi. Ilyen pldul valakinek a neme. Ordinlis skla: A vltozk kategrii valamilyen objektv sorrendbe rendezhetek. Br itt is gyakran szmokat rendelnk a kategrikhoz, kt rtkpr tvolsga nem hasonlthat ssze.Intervallumskla: itt ismerjk a szomszdos rtkek tvolsgt. A szmtani tlag itt rtelmezhet. A zrus megvlasztsa esetleges (mint Celsius-foknl a vz fagyspontja). Ezrt az oszts mvelete nem rtelmezhet. Pl.: Celsius-fok: 40C nem ktszer melegebb a 20C-nl IQ-pont: 200 vs. 100 pont nem ktszer okosabb.Arnyskla: A zrus megvlasztsa nem esetleges (mint abszolt 0 Kelvin-foknl: a rszecskk mozgsa itt megll). Ezrt itt mr van rtelme az oszts mveletnek is. (Az utbbi kett egyttes neve: intervallum-arnyskla Pl. sly, magassg, jvedelem, sklk, indexek. Magas mrsi szint vltozk, egzakt mrsi eredmnyeket tartalmaznak.)

Fontos: Vannak matematika/statisztikai mveletek, amelyek csak bizonyos mrsi szint vltozk esetn alkalmazhatk. Ha a fenti sorrendet tekintjk: a mrsi szintek egymsutnja megfelel a mrsi szintek magassgi sorrendjnek; az arnyskla a legmagasabb mrsi szint. A sorban elbb szereplkre alkalmazhat mdszerek mindegyike hasznlhat az utnuk kvetkez mrsi szintekre is, teht ha a szmtani tlag az intervallum-skla esetn rvnyes mvelet, akkor az arnyskla esetn is. Mi a klnbsg a folytonos s a diszkrt vltozk kztt? A klnbz mrsi szint vltozk melyik kategriba tartoznak?(Vltoz: (szemlyek vagy trgyak) tulajdonsga, mely klnbz rtkeket vehet fel.)Diszkrt vltozrl beszlnk, ha a mreszkznknek van legkisebb sklzsi egysge. Pl: csaldonknti gyermekszm, a skla egysge az 1 gyermek. Teht a vltozk csak elklnlt, elre meghatrozott rtkeket kpesek felvenni.Folytonos vltozk ezzel szemben (elvben) brmilyen finom skln mrhetk, pl. ni munkaer arnya adott foglalkoztatottakon bell (0%100%).A nominlis s az ordinlis vltozk diszkrtek, folytonossgrl alapveten intervallum s arnysklk esetben beszlnk. A szrs fogalma, alkalmazsa, sszefggse a vltoz eloszlsvalSzrs: A szrs az egyes rtkek szmtani tlagtl vett eltrseinek ngyzetes tlaga, vagyis megmutatja, hogy az ismrvrtkek mennyivel trnek el tlagosan az tlagtl. jele: sA szrs az tlagtl val tlagos eltrs mrtkt mutatja meg. Ha nagy az eltrs, akkor a minta heterogn (kiugr rtkek), ha kicsi az eltrs, akkor homogn (kzel ll az tlaghoz). Arra hasznljuk, hogy megllaptsuk, hogy egy minta heterogn vagy homogn.A szrs terjedelme a minta legkisebb s legnagyobb rtknek klnbsge. A terjedelem meglehetsen rzkeny a kiugr rtkekre. A szrs ismeretben el tudjuk dnteni pl. hogy mennyire megbzhat az tlag, mint kzprtk-mutat, illetve sok statisztikai prba rzkeny a minta szrsra. Csak magas mrsi szint vltozk esetn hasznlhat a szrs, vagyis az intervallum, s arnysklk esetn. Szmolsakor az eloszls sszes rtkt figyelembe vesszk, vagyis a teljes vltozkonysgot, nem csak a szlsk kztti tvolsgot.Magas mrsi szint vltoz esetn, ha az eloszls nagyon ferde, az tlag nem reprezentlja megfelelen a centrlis tendencit (kzprtket), gy a variancia vagy a szrs megadsa flrevezethet lehet.A korrelciszmts. A korrelcis egytthat.Korrelci: kt adatsor (egy fggetlen, s egy fgg vltoz) kapcsolatt fejezi ki. Ha az egytthat = 0, akkor nincs korrelci/kapcsolat.Korrelcis egytthat: kt valsznsgi vltoz kztti lineris kapcsolat szorossgt fejezhetjk ki a korrelcis egytthatval. Meghatrozza a korrelci erssgt, irnyt, megmutatja kt vltoz fggsgnek mrtkt. Jele: rEljel s abszoltrtk figyelembevtele fontos, eljel a kapcsolat irnyt, az abszoltrtk az erssgt adja. Egyik mennyisgbl bejsolhat a msik. Folytonos vltozk kzti kapcsolat mrsre hasznljk, magas mrsi szint vltozk esetn (intervallum s arnyskln). Minl magasabb a korrelci, annl ersebb a kapcsolat. (Megjegyzs: determinisztikus kapcsolat esetn a kapcsolat erssgbl (meredeksg) s a fggetlen vltozbl pontosan megadhat a fgg vltoz rtke, sztochasztikus kapcsolat esetn csak a legvalsznbb rtket ismerjk. A determinisztikus kapcsolatot ms nven fggvnyszer kapcsolatnak is nevezik)Milyen kzprtk-mutatkat ismersz? Ezek milyen mrsi szint vltozra alkalmazhatk?Kzprtk mutatk = centrlis tendencia mutatkKzprtkek: a klnbz nagysg, de azonos fajtj adatok, egy szmmal val jellemzsre szolglnak.mdusz: az adatsorban leggyakrabban elfordul rtk. Nominlis vltozknl csak ez hasznlhat. Ha minden rtk csak egyszer fordul el a skln, akkor nem hasznlhat mdusz, vagyis folytonos vltozk esetn nem ajnlott.medin: ha nvekv sorba rendezzk az rtkeket, akkor a sorban a kzps elem, pros elemszm esetn a 2 kzps elem tlaga a medin. Szlssges eloszlsoknl clszer a medin hasznlata. szmtani tlag: az adatok sszegnek s elemszmnak hnyadosa. Kiszmtsnak mdja: az tlagoland rtkek sszegt elosztjuk azok szmval. A szmtani tlagok elemzse sorn figyelembe kell venni azt, hogy az tlagokat ersen befolysoljk az extrm rtkek. Intervallum-arny sklknl hasznlhat.trimmelt tlag (trim-nyr): a legalacsonyabb s legmagasabb (kiugr) rtkeket leszedem az adatsorbl. ltalban az esetek als s fels 10%-t veszik le. pl. reakcimrsA nullhipotzis s az alternatv hipotzis. Mi a statisztikai hipotzisvizsglatok ltalnos menete?Nullhipotzis (H0): a kapcsolat, eltrs stb. hinyt (kt rtk azonossgt) lltja. Pl.: a kezessg nem fgg a nemtl, a kt vltoz egymstl fggetlen.Alternatv hipotzis (H1): a kapcsolat, eltrs stb. megltt lltja. Pl.: a kezessg fgg a nemtl, a kt vltoz kztt van kapcsolat.A hipotzisprt mindig egymst kizr mdon kell fellltani, vagyis ha az egyik igaz, akkor a msik biztos, hogy hamis - s viszont.Hipotzisvizsglat ltalnos menete:1) Kivlasztom a megfelel prbt a megfelel adatokhoz2) Az adott prba nullhipotzise alapjn megadom a konkrt nullhipotzist3) Elvgzem az elemzst s az eredmny alapjn megtartom vagy elvetem a H0-tMit mutat meg az eloszlsdiagram (hisztogram)?Intervallum-arnyskla mrsi szint vltozkra alkalmazand.A kategorizlt vltoz egyes kategriihoz tartoz gyakorisgokat (vagy relatv gyakorisgokat szzalkokkal) mutatja meg.(Klnbsgek az oszlopdiagramhoz kpest: 1. Az egyes oszlopok sszernek a mrsi szintbl fakad folytonossg miatt,2. Az oszlopdiagram esetn lehetsg van csoportok sszehasonltsra ugyanazon brn bell, a hisztogram esetn viszont kln-kln kell brzolnunk az egyes csoportokat, 3. A hisztogram esetben az oszlopok szlessge a kategria szlessgvel arnyos, terletk a kategria (szzalkos) gyakorisgval. Azonos oszlopszlessgnl az oszlopok magassga is a (szzalkos) gyakorisggal arnyos.)(FIGYELEM: ltalnos problma magas mrsi szint vltozk esetn: minl finomabb beosztssal definiljuk a kategrikat, annl egyenetlenebb gyakorisgi kpet kapunk, annl gyakoribb az res kategrik jelenlte, pusztn a mintnk vletlen voltbl fakad esetlegessgek miatt.)Mi a normleloszls lnyege? Rajzold fel a fggvnyt!Norml eloszls: az esetek nagy tbbsge az tlag kr szervezdik, ami jl jellemzi az adatsort, az tlag pedig jl jellemzi a mintt. Minl nagyobb megfigyelsi esetszmmal dolgozunk, annl finomabban kzelti meg a grbt. Ha a vltoz magas mrsi szint, akkor ktdimenzis koordinta rendszerben brzoljuk.Feltn tulajdonsga a normlis eloszlsnak, hogy nem ferde, illetve az tlagra szimmetrikus. Ez azt jelenti, hogy a normlis eloszls tlaga, medinja s mdusza egyenl. A normlis eloszls alakjt haranghoz szoks hasonltani.A normlis eloszlsra jellemz, hogy az tlagtl azonos tvolsgra lv egyforma intervallumokhoz tartoz esetszm/arny azonos.

tlagszrs Mi a megfigyelt s a vrt gyakorisg kereszttblknl? Mi a rezidulis?Kereszttblk: (Khi-ngyzet prba), diszkrt vltozknl, kevs kategrival rtelmezzk. ltalban nominlis, nha ordinlis mrsi szint vltozk esetben. Folytonos vltoz esetn tl sok kategria lenne, ezrt erre nem alkalmas.Megfigyelt gyakorisg: a cellkban szerepl tnyleges elemszm.Vrt gyakorisg: elmleti rtk, olyan felttelezett, adott cellra es elemszm, ami akkor lenne annyi, ha biztos nincs kztk kapcsolat. Arnyprt lltunk fel, s minden kategrit kiszmolunk. Azonos vrt gyakorisgot fggetlensg esetn kapunk. A vrt rtkeket ki kell szmolni a mintban val eloszlsbl kiindulva, azt felttelezve, hogy az egyes kategrikban az alcsoportok ugyanolyan arnyban oszlanak meg, mint a minta egszbenRezidulis: a vrt s a megfigyelt gyakorisg kztti klnbsg, cellnknt. Minl nagyobb az egyes rezidulisok rtke, annl nagyobb az esly, hogy a vltozk kztt kapcsolat van. Khi-ngyzet prba: A khi-ngyzet prba teszteli kt vltoz fggetlensgt (vagy egyik fggst a msiktl). Alkalmas egy kategorizlt vltoz eloszlsnak sszehasonltsra 2 vagy tbb fggetlen csoportban. Akkor alkalmazzuk, ha ms hagyomnyos mrsek nem vgezhetk el (pl. korrelci), mert nem tik meg a minimum rtket (0,05). A khi rtkbl a kapcsolat erssgre kvetkeztethetnk.Mit mutat meg a statisztikai prbknl a szignifikancia-szint?Szignifikancia-szint: Megmutatja, mekkora az az -valsznsg, ami mr elg kicsi a H0 elvetshezA szignifikanciaszint ltalban 5% (0,05 rtk) vagyis akkor vetjk el a nullhipotzist, ha 5%-nl kisebb a valsznsge annak, hogy a statisztika ilyen rtket vegyen fel, mint a konkrt esetben (A 0,05 feletti rtkeket elutastsi tartomnynak nevezzk). A szignifikancia-szint a nullhipotzis igazsgnak valsznsge a populcira. Annak valsznsge, hogy NINCS kapcsolat: 5% az esly, hogy NINCS kapcsolat, s 95% az esly, hogy VAN kapcsolat a fggetlen, s fgg vltozk kztt.(sszefoglalva a szignifikancia-szint megmutatja H0 igaz voltnak valsznsgt, illetve az elsfaj hiba valsznsgt (H0 igaz, mgis elvetjk) Mit jelent az, hogy a korrelci meglte nem felttlenl utal kauzlis sszefggsre?A korrelci meglte nem felttlenl utal kauzlis sszefggsre. Ez azt jelenti, hogy attl mg, hogy kt vltoz korrell, nem felttlen oksgi kapcsolat van kzttk. pl. attl, hogy a glyk s a gyerekek szma korrell, nem jelenti, hogy a glyk hozzk a gyereket. Lehet, hogy mindkett egy httrvltoz, egy 3. vltoz fggvnye.A ksrleti elrendezs fogalma. A kt leggyakoribb elrendezsi logika ismertetseA ksrlet lnyege, hogy (1) tesznk valamit, majd (2) megfigyeljk a tett kvetkezmnyeit. A kutat krltekinten szablyozza a feltteleket, tervszeren avatkozik be a jelensgbe. A megfigyelstl a ksrlet ppen abban klnbzik, hogy itt a vltozkat erteljesen ellenrzs alatt kvnjuk tartani. A ksrlet biztostja a hipotzisek legersebb oksgi ellenrzst.A ksrleti elrendezs a ksrlet megvalstsnak terve, mdja, a ksrlet alapszerkezete.Kontrollcsoportos elrendezs (between-subjects design): Ebben az elrendezsben egyenl ltszm fggetlen csoportok vannak ltrehozva a klnbz felttelekhez. Ahny ksrleti felttel, annyi csoport, a csoportok kztt nincs tfeds (az a csoport, amelyikben nincs jelen a fggetlen vizsglt vltoz a kontrollcsoport, amelyikben/amelyekben jelen van, az/azok a ksrleti csoport/csoportok). A ksrletben rsztvevk egyszer vannak tesztelve, a csoportok tlagai (vagy ms mutati) kerlnek sszehasonltsra. Elnyei: Nagyobb esllyel kikszblhet vele, hogy a vizsglati szemlyeket kls hatsok is rjk, nem csak az, amely a vizsglt tnyezbl fakad (a ksrlet beszennyezdjn). Pl. sorozathats: frads, tesztrutin, stb. Htrnyai: Bonyolult, sok rsztvevt ignyel (hiszen minden j felttelre j csoportot kell ltrehozni), drga, minl tbb csoport (s gy rsztev) szksges, annl nehezebb fenntartani a homogenitst (az egyni klnbsgek miatt (pl. ms szocio-konmiai krnyezet) s nehz elrni, hogy minden csoport reprezentatv legyen. Nehz minden csoport szmra ugyanazokat a krnyezeti feltteleket biztostani (pl. idtakarkossg miatt tbb csoportot tesztelnek egy nap s a napszak befolysolja az eredmnyeket) Kontrollfeltteles elrendezs (within-subject design): Ebben az elrendezsben a szemlyek az sszes felttelben rszt vesznek, gy tbb alkalommal vannak tesztelve. Elnyei: Egyszerbb, olcsbb, knnyebben kivitelezhet, mint a kontrollcsoportos elrendezs, kevesebb rsztvev szksges hozz. Htrnyai leginkbb az elbb emltett sorozathatsbl fakadnak, persze ezek bizonyos fok kikszblsre vannak mdszerek (pl. randomizls, sznetek tartsa stb.).

A t-prbk ismertetseAz sszes t-prba tlagok sszehasonltsra pl.Egymints t-prba: Mintatlag sszehasonltsa egy felttelezett (vrt) tlaggal (a populci szrsa ismeretlen). Egy csoport van, s egy mrsi alkalom.Pros mints t-prba: Kt mrsi alkalom tlagnak sszehasonltsa ugyanazon a mintn. (ld. within-subjects design). Felttel: arnyskla, ugyanaz a mrtkegysg, normleloszls, vletlen mintavtel.Fggetlen mints t-prba: Kt, egymssal tfedsben nem lv minta (csoport) tlagnak sszehasonltsa (ld. between-subejects design). Nem szksges az azonos elemszm (de a durva eltrs nem szerencss). Szksges hozz Levene-prbt csinlni s ha a szrsok eltrnek, akkor Welch-prba alkalmazand. Mondj pldkat a pszicholgia trgykrbl nominlis vltozkra, ordinlis- s arnysklkra!Nominlis: pl. nem, kezessg, prt-szimptia, valls, nemzetisgi hovatartozsOrdinlis: pl. iskolai vgzettsg, trsadalmi osztlyok, telepls tpusIntervallum-arny skla: pl. IQ, reakciid, sly, magassg, jvedelemMi a klnbsg a ler s az elemz (analitikus) statisztikai eljrsok kztt? Mondj pldt ezekre!Ler statisztika: A f clja, hogy akr egy vltozbl is kpes legyen tnyszer adatot kzlni. Nem a vltozk kztti sszefggseket keresi, pusztn tnyeket kzl. (kzprtk-mutatk, eloszlsok, arnyok, gyakorisgok)Elemz (analitikus) statisztika: Vltozk kztti kapcsolatok feldertse matematikai mdszerekkel, modellek kidolgozsval. Pl. a korrelciszmts egy ilyen eljrs. Nem-paramteres statisztikai prbk (alkalmazsuk, fajtik)A jl ismert elmleti httrrel rendelkez s nagy erej paramteres prbk szigor felttelekhez ktttek. Ha olyan felttelek, mint pldul a normalits, nem teljeslnek, alkalmazunk nem-paramteres prbkat, melyek nem kvetelik meg, hogy pl. a vizsglt vltoz valamilyen ismert elmleti eloszlst kvessen, alkalmazsukhoz nem szksges a populci olyan paramtereinek ismerete, mint pldul az tlag. Kevesebb felttelk van, gy kevesebb az esly a hibk elkvetsre, sokszor egyszerbb velk prbastatisztikt elvgezni. tlag helyett ltalban medint hasznlnak, alkalmazhatk ordinlis vltozkon is. Htrnyaik, hogy erejk kisebb, radsul sok paramteres prbnak nincsen nem-paramteres prja.