Upload
nguyennhan
View
217
Download
2
Embed Size (px)
Citation preview
Datorövningar
SPSS
Elisabet Borg, HT2007+
28
Instruktion till SPSS Detta är endast en enkel “lathund” med några få grundläggande funktioner för att du ska kunna komma igång med statistikprogrammet SPSS 13 för MacIntosh. Om du kommer att använda programmet mycket kan det vara idé att skaffa en fullständigare handbok (t.ex. Brace, Kemp and Sneglar (2003). SPSS for psychologists eller den något mer avancerade Pallant, J (2005) SPSS Survival Manual). Efter lathunden finns några övningsexempel. En del kommer att gås igenom under handledning, men gör gärna de övriga på egen hand. Bästa sättet att lära sig hur ett datorprogram fungerar är genom användning. Trial and error är OK! 1. Starta programmet Dubbelklicka på programsymbolen (och välj att mata in nya data om programmet frågar efter det). Du bör få upp ett ”datablad” med fönsterrubriken Untitled - SPSS Data Editor. Här finns två flikar nedtill på fönstret: Data View respektive Variable View. • Data View
• Variable View
2. Namnge och definiera dina variabler: Välj fliken Variable View. Nu har du ett fönster med kolumnnamnen: Name, Type, Width, etc. (se ovan) • Under Name anger du ett kortfattat namn på din variabel (t.ex., kön, längd, eller vad det nu kan vara). I det här namnet fungerar inte alla tecken, t.ex. inte mellanslag. • Under Label kan du återigen ange variabelnamnet. Det kan vara bra att göra eftersom det som står här skrivs ut i resultatutskrifterna (i tabeller och diagram t.ex.). Här kan alla tecken användas och mycket text skrivas. • Om du har Nominaldata (som t.ex. Kön, Grupp, Behandling, etc., alltså en variabel som definierar grupper du t.ex. vill jämföra) behöver du ”koda” dessa under Values: Klicka en gång i den tomma rutan. Nu ser du en ”knapp” till höger i rutan med tre punkter på. Klicka på den. I fönstret som nu kommer upp - Value Labels - anger du i rutan Value: en kodsiffra, t.ex. 1, för den första gruppen och i rutan Value Label: namnet på gruppen (t.ex. man). Klicka sedan på Add. Gör
29
likadant för alla dina grupper (t.ex. 2 för kvinnor, etc.). Glöm inte att klicka på Add efter varje grupp så att du innan du klickar på OK kan se alla dina kodade grupper i rutan! När du är klar klickar du på OK. Du är nu tillbaka i fönstret Variable View. (För att få det hela lite tjusigare kan du också under Decimals ändra till 0 decimaler). 3. Mata in data Du måste först definiera dina variabler i Variable View (se ovan). Därefter klickar du på fliken Data View. Du ska nu se dina valda variabelnamn som kolumnnamn. Mata in data nedåt i kolumnen. För en nominaldatavariabel (som t.ex. kön) anger du de kodsiffror som du definierat för grupperna. Genom att klicka på kan du växla mellan siffror och etiketter för värdena på en nominaldatavariabel. 4. Hantera data och variabler • Ibland vill man kunna räkna på enbart en del av datafilen, t.ex. utföra beräkningarna på män och kvinnor för sig eller bara räkna på de personer som är av en viss ålder. Då kan man t.ex. använda: Split File och Select Cases Data Split File Om du vill göra beräkningar på delgrupper utifrån någon nominaldatavariabel (t.ex. Kön) kan du göra någonting som kallas för Split File. Detta görs från fönstret Data View genom att du i menyraden under Data väljer Split File.... I fönstret som kommer upp väljer du Organize output by groups. Du markerar din nominaldatavariabel genom att klicka på den och flyttar den sedan genom att klicka på pilen så att den hamnar i rutan under Groups Based on:. (Du kan också välja Sort the file by grouping variables så kommer data-filen att sorteras efter denna). Klicka sedan på OK. SPSS kommer nu att betrakta din datafil som två, eller flera, filer (en för män och en för kvinnor om du gjorde en uppdelning för variabeln Kön) och göra uppdelade beräkningar. OBS! Om du vill göra beräkningar på hela datamaterialet efter att ha gjort en Split File... måste du gå in där och välja Analyze all cases, do not create groups och sedan klicka OK för att ta bort uppdelningen. Data Select cases Om du vill räkna på bara en delmängd av dina data, t.ex. bara på personer som är yngre än 20 år, kan du skapa ett kriterium som så att säga utesluter alla andra personer i din datafil. Detta görs från fönstret Data View där man i huvudmenyn kan välja Data och sedan Select Cases. I fönstret som kommer upp kan man bl.a. skräddarsy kriterier för vilka data man vill utföra beräkningar på. Om du t.ex. vill utföra beräkningar enbart på personer som är yngre än 20 år skulle du här kryssa för If condition is satisfied, därefter trycka på knappen som det står If… på, och sedan i fönstret som kommer upp markera din åldersvariabel (i rutan till vänster) och med pilen klicka den till rutan uppe till höger. Med hjälp av funktionstangenterna skulle du sedan klicka < 20, så att det i rutan till höger kommer att stå t.ex. ”ålder < 20”. Därefter klickar du på Continue och sedan på OK. De individer (rader) som motsvarar att ålderna är ≥ 20 kommer nu att vara strukna och du ser också att en ny kolumn har skapats som heter Filter_$ och som med orden Selected och Not selected anger vilka rader som ingår. Om man vill att dessa rader åter ska ingå i beräkningarna måste man åter gå till Select Cases och den här gången välja All Cases. • Ibland vill man göra om eller beräkna nya variabler. Man kanske vill räkna en summa av poängen i två kolumner i Data view och lägga denna i en ny variabel. Eller man vill koda om en variabel så alla individer som har över en viss poäng hamnar i en grupp och alla under en viss poäng hamnar i en annan grupp. Då kan Compute och Recode vara användbart.
30
Transform Compute Recode
5. Beräkna medelvärden och standardavvikelser m.m. Under Analyze kan du t.ex. välja Tables > Basic tables. I rutan som kommer upp har du en lista över dina variabler till vänster. Klicka på den variabel du vill räkna på. Klicka sedan på pilen vid rutan Summaries: Detta gör att din variabel flyttas in i den rutan. Genom att klicka på knappen Statistics... kan du välja vilka statistiska mått du vill beräkna. I rutan som kommer upp kan du till vänster klicka på t.ex. Mean och sedan på kanppen Add, därefter igen på Std. Deviation och Add (pröva gärna andra också). När du valt färdigt klickar du på Continue och sedan på OK. Om du har någon nominaldatavariabel (t.ex. kön) och vill beräkna på varje grupp för sig lägger du in den på samma sätt med pilen till rutan: Down: eller: Across: När du är klar klickar du på OK. (Andra sätt att beräkna medelvärden mm är genom Analyze Descriptive statistcs Descriptives, eller Analyze Compare Means Means…) 6. Beräkna korrelationer mellan två eller flera variabler Under Analyze hittar du Correlate > Bivariate... I rutan som kommer upp lägger du med pilens hjälp över de variabler (minst två) som du vill räkna korrelationer mellan från vänstra rutan till den högra. Kryssa för “Pearson” (dvs r-xy) och Two-tailed (Flag significant correlations betyder att datorn sätter ut stjärnor för sing. Korrelationer). Klicka sedan på OK. 7. Rita grafer Under Graphs finns en mängd graf-alternativ. Här nedan följer endast tre vanliga exempel. Bar... Ger dig ett stapeldiagram. I rutan som kommer upp väljer du utseendet av stapeldiagrammet. Klicka t.ex. på Simple och under Data in Chart Are bör du markera Summaries for groups of cases (om du vill plotta individuella värden ska du istället välja Values of individual cases). Klicka på Define. Till vänster i rutan som kommer upp finns en lista över dina variabler. Klicka på den nominaldatavariabel (.tex. Kön) som du vill ha på x-axeln så att den markeras. Klicka sedan på pilen så att den variabeln flyttas till rutan under Category Axis:. När det är gjort klickar du på den variabel som du vill ha på y-axeln så att den markeras. Under Bars Represent ska du välja Other summary function. Därefter kan du klicka på pilen så att din y-variabel flyttas till rutan under Variable:. Automatiskt väljs att du vill att dina staplar ska beskriva medelvärdet (MEAN). (Genom att klicka på Change Summary... kan du ändra på det om du vill). Klicka på OK. Scatter... Ger dig ett punktdiagram (x-y-plot). I rutan som kommer upp kan du välja utseende på grafen. T.ex. Simple. Klicka sedan på Define. I rutan som kommer upp kan du nu ange vilken variabel som ska vara på x-axeln respektive y-axeln. Klicka på variablen i listan till vänster (varaiblen markeras). Klicka på pilen för att flytta varaibeln till rutan under Y Axis: respektive X Axis:. Om du vill ha flera gruppers värden i grafen (t.ex. män och kvinnor) med olika färg/symbol flyttar du din nominaldatavariabel (t.ex. Kön) till rutan under Set Markers by: på samma sätt. Klicka sedan på OK. Historgram… I rutan som kommer upp klickar du med pilens hjälp den variabel du vill skapa histogrammet för till rutan Variable:. Kryssa för Display normal curve. Klicka på OK.
31
8. Redigera tabeller och grafer Genom att dubbelklicka på tabellen och grafen kan man redigera grafen. Om man t.ex. Dubbelklickar på en graf öppnas ett fönster där det finns möjligheter att t.ex. ändra typsnitt och namn på texten till axlarna, att ändra siffrorna på axlarna, ändra färg, symboler och mönster för staplar eller markörer, etc. För att ändra någonting krävs ibland att du dubbelklickar för att få upp en ruta där du anger dina egan önskemål (t.ex. om du vill ändra sifforna på axlarna), ibland räcker det med att du klickar en gång på det du vill ändra och väljer ett redskap i menyraden upptill i fönstret (t.ex. om du vill ändra markörer i en graf). Prova dig fram! 9. Att jämföra medelvärden (hypotesprövning av medelvärdesskillnader). Under Analyze hittar du Compare Means som ger en ruta med rubrikerna: Means... och sedan...: One-Sample T Test (t-test för ett stickprovsmedelvärde)
I fönstret som kommer upp lägger du den variabel du vill hypotespröva med pilens hjälp till rutan Test Variable(s):. I lilla rutan Test Value: anger du det kända medelvärde som du vill jämföra med. Klicka sedan på OK.
Independant-Samples T Test (t-test för två oberoende stickprovsmedelvärden)
I fönstret som kommer upp lägger du den variabel du vill hypotespröva med pilens hjälp till rutan Test Variable(s):.Därefter lägger du din gruppvariabel (nominaldata, t.ex. kön) med pilens hjälp till rutan Grouping Variable: Sedan klickar du på Define Groups... och skriver dina kodsiffror för grupperna (förmodligen ”1” för Group 1 och ”2” för Group 2). Klicka därefter på Continue och sedan på OK.
Paired-Samples T Test... (parvisa jämförelser, upprepade ”beroende” mätningar)
I fönstret som kommer upp klickar du till vänster på de 2 variabler som du har mätt med samma försökspersoner (de kommer då att bekräftas som Variable 1 och Variable 2 nedtill) och därefter klickar du med pilens hjälp in dem i rutan Paired Variables där de då sätts ihop som ett ”par”. Klicka sedan på OK.
One-Way ANOVA (envägs oberoende ANOVA)
I fönstret som kommer upp klickar du med pilens hjälp in den beroende variabeln (som innehåller alla gruppers värden) i rutan under Dependent List:, och sedan den Nominaldatavariabel som innehåller dina grupper till rutan Factor:. Genom att klicka på knappen Post Hoc kan du öppna ett fönster där du kan välja till lämpliga Post Hoc test. Under Options kan du t.ex. välja till Descriptive (som ger medelv., standardavv. och konfidensintervall) och Homogenity of variance test (som prövar villkoret om homogena populationsvarianser). Avsluta genom att klicka på OK.
ANOVA med upprepade mätningar (Repeated measures) Under Analyze hittar du lite längre ner Genareal Linear Model och i rutan till vänster ska du välja Repeated measures...
I rutan som kommer upp anger du efter Number of Levels: antal nivåer på din beroende variabel (antal upprepningar). Klicka på add, därefter på Define. I nästa ruta som öppnas ska du definiera vilka kolumner i ditt kalkylblad som ska ingå (vilka som utgör upprepningarna). Till vänster ser du en lista över valbara kolumner. Klicka på ett namn och för med pilens hjälp in det till rutan till höger med rubriken Within-Subjects Variables. Om du vill genomföra Post Hoc beräkningar klickar du på Options och i fönstret som kommer upp markerar du din faktor (factor1 t.ex.) i listan till vänster och för den med pilens hjälp till den högra rutan under rubriken Display Means for:. Därefter kryssar du för rutan Compare main effects. Efter orden Cofidence interval adjustment: kan du nu välja Post Hoc test, t.ex. LSD. När du är klar klickar du på Continue och sedan på OK.
32
Flervägs oberoende ANOVA Under Analyze hittar du General Linear Model och i rutan till vänster väljer du nu Univariate…
I rutan som kommer upp flyttar du med pilens hjälp din beroende variabel till Dependent Variable: Därefter klickar du över dina två (eller fler) faktorer (oberoende variabler) till rutan Fixed Factor(s): Klicka sedan på Plots. Här klickar du med pilens hjälp din ena faktor (spelar mindre roll vilken) till rutan Horizontal Axis, och din andra faktor till Separate lines: Klicka därefter på Add (faktor 1 x faktor 2 står då i fältet under Plots: Klicka sedan på Continue (som tar dig tillbaka till föregående fönster). Klicka nu på Post Hoc för att välja post hoc test för den/de av dina faktorer som har fler än 2 nivåer: markera faktorn och flytta med pilens hjälp till fältet med Post Hoc tests for: Klicka sedan i vilka post hoc test du vill beräkna, därefter Continue. Klicka sedan på Options. Här kan du t.ex. välja Descriptive statistics (som ger en tabell med medelvärden och standardavvikelser) och Homogenity tests (som kollar villkoret om homogena populatiosvarianser). Lägg märke till de andra alternativ som finns tillgängliga. Klicka på Continue och sedan på OK.
Chi-två kan du köra genom att skapa två kolumner för nominaldata (en för varje nominaldata-variabel) och en för frekvenserna. Gå sedan till data och välj Weight cases. I rutan som kommer upp markerar du Weight cases by och flyttar din frekvensvariabel med pilens hjälp till rutan under. Klicka sedan OK. Gå därefter till Analyze. Välj Descriptive statistics och i rutan till höger Crosstabs... I rutan som kommer upp lägger du din ena nominaldatavariabel i rutan under Row(s): och den andra i rutan under Column(s): Klicka sedan på Statistics. Välj Chi-square och klicka för Phi. Klicka på Continue. Klicka nu på Cells och i rutan som kommer upp ska du kryssa för Observed och Expected. Klicka på Continue. Avsluta med att klicka på OK. 10. Linjär regressionsanalys. Under Analyze hittar du Regression. I menyn till vänster väljer du Linear… I rutan som kommer upp klickar du med pilens hjälp din beroende variabel till rutan där det står Dependent: och din oberoende variabel till rutand där det står Independent(s): (Här kan du alltså har fler variabler om du gör en multipel linjär regressionsanalys). Klicka därefter på OK.
33
Grafer, medelvärden, standardavvikelser Mål: efter denna övning bör du kunna 1) öppna SPSS och skriva in data samt beräkna medelvärden och standardavvikelser 2) rita och redigera enklare grafer och tabeller Uppgift 1. En grupp studenter fick läsa in ett material från en textbok i medicin. Texten innehöll 54 fakta som var nya för studenterna. För att testa hågkomsten ombads studenterna därefter fritt återge så mycket av det inlästa materialet som de förmådde. Student nr Kön Antal återgivna faktadetaljer 1 Man 37 2 Kvinna 31 3 Kvinna 33 4 Man 36 5 Man 28 6 Man 44 7 Kvinna 43 8 Man 20 9 Kvinna 21 10 Kvinna 37 11 Man 36 12 Kvinna 32 13 Kvinna 35 14 Man 31 15 Kvinna 31 16 Kvinna 40 17 Kvinna 40 18 Man 27 19 Man 25 20 Man 30 Beräkna medelvärden och standardavvikelser för mängden nya fakta studenterna kunde återge a) för hela gruppen b) i samma tabell för män resp. kvinnor för sig c) skapa ett histogram över antalet återgivna faktadetaljer. Lägg in en jämförelse med normalfördelningen (finns en ruta att klicka i för detta). Genom att dubbelklicka på grafen öppnas ett fönster där du kan redigera utseendet på diagrammet… Prova dig fram till någonting som du är nöjd med (men lek inte för länge). Tabeller kan redigeras om du dubbelklickar på dem, går in i huvudmenyn på Format och väljer TableLooks. Tabellen kan också kopieras till Word och redigeras där. I Words kan du då antingen välja ”Klistra in” varvid tabellen blir en Word-tabell, eller ”Klistra in Special” om du vill att tabellen ska klistras in som en bild.
34
Oberoende och beroende ”t-test” Mål: Med SPSS kunna utföra jämförelser mellan medelvärden för oberoende mätningar (2 grupper, el. en grupp mot ett känt populationsmedelvärde) och beroende mätningar (upprepade mätningar, samma individer), samt tolka utskrifterna . Uppgift 2. En grupp på 18 personer som alla rapporterade att de hade sömnsvårigheter fick sova i ett sömnlab där tiden de sov mättes i minuter. På morgonen testades deras koncentrationsförmåga med ett standardiserat test (ju högre poäng desto bättre koncentrationsförmåga). De fick också på en skala från 1 till 10 skatta hur stora de själva upplevde att deras sömnproblem var (1 = inte något problem, 10 = extremt stora problem). Kön Sömn (minuter) Koncentration Problemgrad kvinna 380 27 4 man 210 14 6 man 370 28 8 man 280 19 6 kvinna 320 31 5 kvinna 297 17 8 man 176 22 9 man 246 25 5 kvinna 255 27 7 man 157 13 10 kvinna 400 25 4 kvinna 220 14 8 kvinna 365 27 5 man 250 23 6 man 335 32 6 kvinna 290 11 6 man 186 16 9 kvinna 246 25 6 a) Hypotespröva om dessa 18 personer verkligen sover signifikant mindre än normalpopulationen (vi förutsätter att normalpopulationen i genomsnitt sover 8 timmar per natt, dvs 480 min). Tolka! b) Hypotespröva om det finns någon skillnad mellan hur mycket män och kvinnor med sömnproblem sover. c) En annan grupp på 12 personer (6 män och 6 kvinnor) som alla hade bedömt sina sömnproblem på skalan som mellan 1-3 (inga till små problem) fick genomföra samma koncentrationstest varvid nedanstående resultat erhölls: Koncentration = {27; 35; 22; 31; 19; 24; 26; 28; 37; 28; 32; 23} Var skillnaden i koncentrationspoäng mellan gruppen med sömnsvårigheter och gruppen utan sömnsvårigheter signifikant?
35
Uppgift 3. För att undersöka effekten av träning på fysisk kondition hos äldre fick 18 friska 70-åringa män motionera regelbundet under 3 månader. De testades före och efter träningsperioden vad gäller deras maximala arbetsförmåga (mätt i Watt på en cykelergometer, ju högre värde desto bättre prestation). Nedanstående resultat erhölls. Fp 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Före 160 155 140 130 175 145 155 190 180 130 120 150 175 220 125 240 170 150 Efter 170 175 165 125 175 150 160 200 210 160 135 170 175 230 130 230 160 165 a) Testa på 5%-nivån om det finns någon skillnad mellan de två tillfällena (observera att detta är ett exempel på parvisa jämförelser, upprepade mätningar med ett beroende mellan mätningarna eftersom samma försökspersoner ingår vid båda mättillfällena). Tolka resultatet. b) Två personer (fp 4 och 5) uppgav att de varit förhindrade att träna under perioden. Om dessa plockas bort, vilket t-värde får du då? c) Ett alternativ till upprepade mätningar skulle vara att testa en grupp före och en annan grupp efter. Betrakta materialet som om det kommer från en sådan undersökning och genomför en hypotesprövning för skillnaden mellan de två grupperna. Jämför resultatet med det under a). Vad drar du för slutsats?
36
Korrelation, enkel linjär regressionsanalys och Chi-två Mål: Med SPSS kunna beräkna en korrelationsmatris mellan två eller flera variabler, en enkel linjär regressionsanlys mellan två variabler, Chi-två för två variabler, samt kunna tolka utskrifterna . Uppgift 4. (forts på uppg 3). En grupp på 18 personer med sömnsvårigheter fick sova i ett sömnlab där tiden de sov mättes i minuter. På morgonen testades deras koncentrationsförmåga med ett standardiserat test (ju högre poäng desto bättre koncentrationsförmåga). De fick också på en skala från 1 till 10 skatta hur stora de själva upplevde att deras sömnproblem var (1 = inte något problem, 10 = extremt stort problem). Kön Sömn (minuter) Koncentration Problemgrad kvinna 380 27 4 man 210 14 6 man 370 28 8 man 280 19 6 kvinna 320 31 5 kvinna 297 17 8 man 176 22 9 man 246 25 5 kvinna 255 27 7 man 157 13 10 kvinna 400 25 4 kvinna 220 14 8 kvinna 365 27 5 man 250 23 6 man 335 32 6 kvinna 290 11 6 man 186 16 9 kvinna 246 25 6 a) Beräkna medelvärden, medianer och standardavvikelser för de tre variablerna Sömn, Koncentration och Problemgrad dels för hela gruppen, dels uppdelat på män och kvinnor. b) Skapa x-y-diagram (scatterplot) för sambanden mellan Sömn & Koncentration och mellan Sömn & Problemgrad (Obs: vilken variabel ska du ha på x-axeln?). Ändra så att axlarna har lämpligt sifferområde (t.ex. 60-minuters intervaller). Ändra symbolerna så att du har fyllda cirklar för män och ofyllda kvadrater för kvinnor. Ändra färg på markörerna så att de är mörka nog för att synas på en svart-vit skrivare. c) Skapa en korrelationsmatris över r för Sömn, Koncentration och Problemgrad hela gruppen. Tolka! d) Beräkna regressionslinjen för sambandet mellan Sömn & Koncentration. Överkurs e) Skapa en korrelationsmatris för Sömn, Koncentration och Problemgrad för män och kvinnor för sig. (Tips: Använd Split File). f) Ta bort Split File och skapa en korrelationsmatris för Kön, Sömn, Koncentration och Problemgrad hela gruppen. Jämför resultatet med det du erhöll i Uppgift 2b.
37
Uppgift 5. Professor Love P. Assion (socialpsykolog) ville replikera en studie av Dutton och Aron (1974) om två-faktor-modellen för emotioner. Han lät ett antal försökspersoner (ungefär lika många män och kvinnor, alla heterosexuella) korsa en hög smal hängbro. Mitt på bron blev de hejdade av en försöksledare (FL) av motsatt kön och fick fylla i ett frågeformulär. Efter detta fick de FL’s telefonnummer och erbjöds att ringa upp om de var intresserade av att få veta mer om undersöknings-resultatet. En likvärdig kontrollgrupp fick genomföra exakt detsamma men istället på en vanlig ganska bred cykelbro. Nedanstående korstabell beskriver resultatet: Ringde upp? Brotyp Ja, och bjöd ut FL Ja, för info Nej Hängbro 15 17 18 Cykelbro 2 6 41 Fanns det någon effekt på känslorna (uppmätt genom telefonuppringning) av att befinna sig på en hängbro jämfört med på en cykelbro?
38
Extra övningsuppgifter. Uppgift 6. Under de första två veckorna i juli år 2000 regnade det ovanligt mycket. För sju mätpunkter i landet gjordes i Metro en jämförelse med genomsnittet som för dessa var 33,29 mm. Regnade det signifikant mer under dessa två juliveckor år 2000 (på vilken signifikansnivå)? Umeå: 90,9 mm Torpshammar: 132,5 mm Gävle: 81,8 mm Stockholm: 54,0 mm Norrköping: 58,5 mm Göteborg: 42,4 mm Malmö: 17,4 mm Uppgift 7. På en stor arbetsplats delades en enkät om stress i arbetsmiljön ut till16 anställda: till 8 bland den administrativa resp. 8 bland den tekniska personalen. Ju större total stress de upplevde desto högre poäng fick de i enkäten. Fanns det någon skillnad mellan personalgrupperna på företaget? Ser du några problem vad gäller dina data? Fundera lite över vad problemen skulle kunna bero på och hur det skulle kunna lösas. Personalgrupp Stress Adm 46 Adm 48 Adm 99 Adm 66 Adm 54 Adm 35 Adm 34 Adm 44 Tekn 41 Tekn 31 Tekn 41 Tekn 11 Tekn 46 Tekn 37 Tekn 25 Tekn 46 Uppgift 8. För att prova ut en ny energidryck fick 10 elitidrottsmän använda dels ett placebopreparat och dels energidrycken under två identiska träningspass. De fick därefter skatta sin upplevda ansträngning enligt den sk. RPE skalan för upplevd ansträngning (från 6 till 20). Hade energidrycken någon effekt på den upplevda känslan av ansträngning? Fp. 1 2 3 4 5 6 7 8 9 10 Placebo 15 16 19 18 19 18 16 17 18 18 Energidryck 16 14 18 18 19 19 15 18 17 15 Uppgift 9. Gå till Uppgift 14. Använd data i tabellen för att beräkna en korrelation mellan ljudstyrkan i dB och resultaten på matematiktesten (tips: fundera först över hur du ska lägga upp din datafil).
39
Envägs oberoende och beroende ANOVA. Mål: Med SPSS kunna utföra jämförelser av medelvärden på fler än en grupp (envägs oberoende ANOVA) samt för fler än en upprepad mätning på samma individer (envägs beroende ANOVA), samt tolka utskrifterna . Uppgift 10. En jämförelse gjordes i benstyrka mellan tre grupper män (sprinterlöpare, marathonlöpare och en kontrollgrupp vanliga motionärer). Försöket gick till så att individerna fick arbeta på 70% av sitt individuella maximum på en benpress och antal repetitioner som individen kunde klara av noterades. Grupp Antal repetitioner Sprinter 36 Sprinter 26 Sprinter 29 Sprinter 31 Sprinter 22 Sprinter 27 Sprinter 39 Sprinter 23 Sprinter 40 Sprinter 33 Marathon 19 Marathon 22 Marathon 23 Marathon 27 Marathon 18 Marathon 22 Marathon 24 Marathon 20 Marathon 21 Marathon 26 Kontroll 19 Kontroll 21 Kontroll 18 Kontroll 32 Kontroll 21 Kontroll 17 Kontroll 16 Kontroll 22 Kontroll 24 Kontroll 23 a) Finns det någon signifikant skillnad mellan grupperna? Tolka denna skillnad i ord. b) Var i ANOVA-tabellen kan du utläsa hur många grupper som ingick i försöket? c) Om lämpligt, genomför Post Hoc test (Ficher LSD och Scheffé) för att studera gruppskillnaderna. Tolka dessa i ord.
40
Uppgift 11. För att utvärdera en nyutarbetad terapiform mot depression testades 12 personer som skulle genomgå terapin med ett standardiserat mätinstrument för depression (höga poäng = mer deprimerad) vid fyra tillfällen: 1) Före terapins början, 2) direkt efter avslutad terapi (terapin varade ung. 6 mån)., 3) 6 månader efter avslutad terapi, och 4) 12 månader efter avslutad terapi. fp Före Efter 6 mån 12 mån 1 114 71 81 112 2 136 64 63 71 3 107 100 109 114 4 98 63 72 84 5 141 154 155 178 6 127 103 109 112 7 101 57 74 90 8 87 72 80 94 9 129 118 119 115 10 112 109 101 98 11 119 71 62 120 12 121 67 54 52 a) Var effekten signifikant för den totala tidsperioden? b) Om lämpligt, genomför Post Hoc test för att närmare studera effekten (multipla jämförelser).
41
Extra övningsuppgifter Uppgift 12. En stressforskare mätte muskelaktiviteten i trapezius muskeln med EMG (µV) för att se om belastningen på nacke/skuldra skiljde sig åt mellan tre yrkesgrupper på ett företag. Yrkesgrupp EMG (µV) Lagerarbetare 45,0 Lagerarbetare 23,0 Lagerarbetare 31,0 Lagerarbetare 37,0 Lagerarbetare 40,0 Lagerarbetare 27,0 Lagerarbetare 34,0 Lagerarbetare 36,0 Lagerarbetare 61,0 Kontorspersonal 52,0 Kontorspersonal 43,0 Kontorspersonal 56,0 Kontorspersonal 38,0 Kontorspersonal 61,0 Kontorspersonal 35,0 Kontorspersonal 29,0 Kontorspersonal 47,0 Kontorspersonal 97,0 Säljare 21,0 Säljare 42,0 Säljare 31,0 Säljare 38,0 Säljare 22,0 Säljare 36,0 Säljare 54,0 Säljare 28,0 Säljare 23,0 a) Finns det någon signifikant skillnad i muskelaktivitet mellan grupperna? b) Ser du någonting speciellt med data? Vad kan du göra åt det? Hur påverkar detta resultatet?
42
Uppgift 13. En forskargupp ville testa vilken av 3 behandlingsmetoder mot sömnrubbningar som var mest effektiv: terapi, medicin, eller en kombination av terapi och medicin. 48 patienter som sökt för sömnrubbningar delades slumpmässigt in i fyra grupper och fick genomgå behandling under 6 månader varefter de fick sova en natt i sömnstudio så att antal sömntimmar kunde registreras. Följande resultat erhölls: Terapi Medicin Ter/Med Kontroll 5,0 8,0 5,5 3,0 4,0 9,0 7,0 4,0 6,0 9,0 8,0 5,0 7,5 7,0 6,5 4,0 4,5 8,0 9,0 4,5 6,0 9,0 7,5 2,5 3,5 7,5 7,5 4,5 5,0 7,0 8,5 3,0 6,0 6,5 6,5 4,0 5,0 5,5 7,0 5,5 4,5 8,0 6,0 3,0 6,5 8,5 8,0 3,5 a) Genomför en variansanalys för att avgöra om det finns någon behandlingseffekt. b) Om det är lämpligt genomför Post Hoc tester för att studera skillnader mellan behandlingarna. c) Fundera över svagheter i designen av försöket och hur det skulle ha kunnat göras bättre. Uppgift 14. För att studera om buller påverkade koncentrationsförmågan hos skolbarn fick 12 14-åringar lösa likvärdiga matematiktest under 6 olika bullernivåer (70 dB motsvarar ungefär ljudet av en dammsugare). Nedanstende resultat erhölls (höga poäng = bra resultat). Kan man säga att buller påverkar koncentrationsförmågan? Buller: fp 30dB 40dB 50dB 60dB 70dB 80dB 1 64 67 71 65 60 55 2 61 52 45 48 42 40 3 92 98 96 95 86 78 4 82 77 79 75 70 67 5 66 65 64 71 62 56 6 41 45 47 44 32 14 7 87 78 78 81 75 61 8 81 83 81 78 77 71 9 61 59 52 55 52 49 10 78 87 86 75 71 62 11 68 65 69 66 65 47 12 59 72 70 60 60 48
43
Flervägs oberoende ANOVA Mål: kunna genomföra en univariat ANOVA med två eller fler faktorer (oberoende variabler) och tolka utskrifterna Uppgift 15. För att jämföra om det fanns någon interaktionseffekt mellan kön och inlärningssteknik delades 36 gymnasieungdomar (18 män och 18 kvinnor) in i tre lika stora grupper där varje grupp fick arbeta enligt någon av undervisningsmetoderna A, B, respektive C. Resultatet utvärderades med ett identiskt test för alla tre teknikerna. Nedanstående data erhölls. Beräkna en flervägs oberoende ANOVA och tolka resultatet i ord. Tolka även interaktionseffekten (gärna med hjälp av en graf).
Kön Teknik Resultat
kvinna A 31,0 kvinna A 23,0 kvinna A 26,0 kvinna A 42,0 kvinna A 33,0 kvinna A 25,0 kvinna B 45,0 kvinna B 32,0 kvinna B 38,0 kvinna B 21,0 kvinna B 41,0 kvinna B 39,0 kvinna C 53,0 kvinna C 37,0 kvinna C 45,0 kvinna C 49,0 kvinna C 38,0 kvinna C 36,0 man A 57,0 man A 73,0 man A 62,0 man A 55,0 man A 59,0 man A 60,0 man B 43,0 man B 32,0 man B 28,0 man B 37,0 man B 41,0 man B 35,0 man C 22,0 man C 18,0 man C 31,0 man C 27,0 man C 35,0 man C 39,0
44
Datorutskritsexempel (Obs! Ej fullständigt facit). Uppgift 1 a)
b)
c) T.ex. så här….
31,40 6,96
34,30 6,27
antal återgivnafaktadetaljer
man
antal återgivnafaktadetaljer
kvinna
kön
MeanStd
Deviation
32,85 6,62antal återgivnafaktadetaljer
MeanStd
Deviation
45
Uppgift 2 a)
b)
Independent Samples Test
,071 ,794 -1,950 16 ,069 -62,5556 32,07351 -130,54835 5,43724
-1,950 15,696 ,069 -62,5556 32,07351 -130,65540 5,54429
Equal var iances
assumed
Equal var iancesnot assumed
sömn(min)F Sig.
Levene's Test for Equalityof Variances
t dfSig.
(2-tailed)Mean
DifferenceStd. ErrorDifference Lower Upper
95% Confidence Interval ofthe Difference
t-test for Equality of Means
One-Sample Statistics
18 276,8333 73,43525 17,30885sömn(min)
N Mean
Std.
Deviation
Std. Er ror
Mean
One-Sample Test
-11,738 17 ,000 -203,1667 -239,6852 -166,6482sömn(min)
t dfSig.
(2-tailed)Mean
Difference Lower Upper
95% Confidence Interval ofthe Difference
Test Value = 480
Standardfelet för medelvärdet som fås som
!
s
n
Det observerade t-värdet p-värdet. Om p ≤ 0,05 förkastas H0 till förmån för H1 och skillnaden är signifikant
Det ”populations-medelvärde" som man jämför gruppens värden med
Mean – Test Value Här: 276,8333 - 480
Antal frihetsgrader, df = n – 1
Group Statistics
9 245 ,5556 72,61562 24,20521
9 308 ,1111 63,12972 21,04324
kön
Man
Kvinna
sömn(min)
N Mean
Std.
Deviation
Std. Error
Mean
Testar om villkoret ”homogena populationsvarianser” är uppfyllt. Om p-värdet (Sig.) här är mindre än 0,05 är det så stor skillnad på grupperna varianser att man bör läsa på raden ”Equal variances not assumed”.
Det observerade t-värdet
Antal frihetsgrader, df = n1 + n2 - 2
p-värdet. Om p < 0,05 förkastas H0 till förmån för H1 och skillnaden mellan grupperna betraktas som signifikant (så är alltå inte fallet här)
Det observerade t-värdet beräknas som:
!
t =Mean Diff.
Std. Error Diff.
46
Uppgift 3 a) t-test för beroende mätningar (parvisa jämförelser)
Paired Samples Statistics
161,6667 18 31,9006 7,5190
171,3889 18 30,0395 7,0804
före
efter
Pair 1
Mean N Std. Deviation Std. Error Mean
Paired Samples Correlations
18 ,923 ,000före & efterPair 1
N Correlation Sig.
Paired Samples Test
-9,7222 12,3040 2,9001 -15,8409 -3,6036 -3,352 17 ,004före - efterPair 1
Mean Std. Deviation Std. Error Mean Lower Upper
95% Confidence Interval
of the Difference
Paired Differences
t df Sig. (2-tailed)
Uppgift 4. Chi-två
Observerat t-värde p-värdet. Om p ≤ 0,05 förkastas H0 till förmån för H1 och skillnaden kan betraktas som signifiikant
Det observerade t-värdet beräknas som:
!
t = Mean
Std. Error Mean
Case Processing Summary
99 100 ,0% 0 ,0% 99 100,0%brotyp * r ingde upp?
N Percent N Percent N Percent
Valid Missing Total
Cases
brotyp * ringde upp? Crosstabulat ion
15 17 18 50
8,6 11,6 29,8 50,0
2 6 41 49
8,4 11,4 29,2 49,0
17 23 59 99
17,0 23,0 59,0 99,0
Count
Expected Count
Count
Expected Count
Count
Expected Count
hängbro
cykelbro
brotyp
Total
ja och bjödut ja för info nej
ringde upp?
Total
Chi-S quare Tests
24,161 a 2 ,000
25,932 2 ,000
22,575 1 ,000
99
Pea rson Chi-Square
Likelihood Ratio
Linear-by-LinearAssociation
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)
0 cells (,0%) have expected count less than 5. The minimum
expected count is 8,41.
a.
Pearson Chi-Square är det ”vanliga” Chi-två värdet
Här får vi en varning om vi skulle förväntade värden som är mindre än 5 i någon cell
47
Uppgift 4 a) Jämför uppgift 1 a) och b) b) Ett diagram skulle kunna se ut så här, t.ex.
c) B
Correlations
1 ,602** -,692**
, ,008 ,001
18 18 18
,602** 1 -,494*
,008 , ,037
18 18 18
-,692** -,494* 1
,001 ,037 ,
18 18 18
Pea rson Correlation
Sig. (2-tailed)
N
Pea rson Correlation
Sig. (2-tailed)
N
Pea rson Correlation
Sig. (2-tailed)
N
sömn(min)
koncentration
problemgrad
sömn(min)koncentrati
onprob lemgra
d
Correlation is significant at the 0.01 level (2-tailed).**.
Correlation is significant at the 0.05 level (2-tailed).*.
Korrelationen mellan variabeln och sig själv är 1,0
r = 0,602. Korrelationen mellan koncentration och sömn är positiv: Ju mer de sover desto bättre koncentration alltså.
p = 0,008 jämförs med α = 0,05 Eftersom p < α kan man dra slutsatsen att korrelationen är signifikant
Antal undersökningsdeltagare Stjärnorna kompletterar p-värdet! En stjärna räcker för signifikans, alltså!
48
e) Regressionsanalys
Variables Entered/Removedb
sömn (min)a , Enter
Model
1
Variables
Entered
Variables
Removed Method
All requested variables entered.a.
Dependent Variable: koncentrationb.
Model Summary
,602a ,363 ,323 5,35581
Model
1
R R SquareAdjusted R
SquareStd. Er ror ofthe Estimate
Predictors: (Constant), sömn (min)a.
ANOVAb
261 ,045 1 261,045 9,100 ,008a
458 ,955 16 28,685
720 ,000 17
Regression
Residual
Total
Model
1
Sum ofSquares df Mean Square F Sig.
Predictor s: (Constant), sömn (min)a.
Dependent Variable: koncentrationb.
Coef fici entsa
7,228 5,057 1,429 ,172
5,336E-02 ,018 ,602 3,017 ,008
(Constant)
sömn (min)
Model
1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: koncentrationa.
Prövar om sambandet är signifikant (alltså om korrelationen R är det)
B-koefficienterna är de som ska sättas in i regressionslinjen som alltså blir ungefär: y = 7,2 + 0,053 x
Hypotesprövning av koefficienterna (om någon koeff. inte är signifikant kan man köra om analysen utan att ta med den i modellen).
49
Uppgift 10 a) Envägs ANOVA för oberoende mätningar .
ANOVA
Antal reps.
526,200 2 263,100 11,346 ,000
626,100 27 23,189
1152,300 29
Between Groups
Within Groups
Total
Sum of Squares df Mean Square F Sig.
b) Fås från frihetsgraderna för ”Between Groups”, df1= antal grupper – 1. Alltså 3 grupper. c) Scheffé och Fischer LSD Post Hoc test. Signifikant skillnader finns mellan de grupper där p ≤ 0,05.
Multiple Comparisons
Dependent Variable: Antal reps.
8,4000* 2,1536 ,002 2,8222 13,9778
9,3000* 2,1536 ,001 3,7222 14,8778
-8,4000* 2,1536 ,002 -13,9778 -2,8222
,9000 2,1536 ,917 -4,6778 6,4778
-9,3000* 2,1536 ,001 -14,8778 -3,7222
-,9000 2,1536 ,917 -6,4778 4,6778
8,4000* 2,1536 ,001 3,9813 12,8187
9,3000* 2,1536 ,000 4,8813 13,7187
-8,4000* 2,1536 ,001 -12,8187 -3,9813
,9000 2,1536 ,679 -3,5187 5,3187
-9,3000* 2,1536 ,000 -13,7187 -4,8813
-,9000 2,1536 ,679 -5,3187 3,5187
(J) Grupp
marathon
kontroll
sprinter
kontroll
sprinter
marathon
marathon
kontroll
sprinter
kontroll
sprinter
marathon
(I) Grupp
sprinter
marathon
kontroll
sprinter
marathon
kontroll
Scheffe
LSD
Mean Difference(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
Observerat F-värde med df1=2 och df2 =27 frihetsgrader, F2,27=11,346
p-värdet. Om p ≤ 0,05 förkastas H0 till förmån för H1 och det finns en signifikant skillnad mellan grupperna (variansen – skillnaden – mellan grupperna är större än variansen – skillnaden – inom grupperna)
50
Mauchly's Test of Sphericityb
Measure: MEASURE_1
,232 14,215 5 ,015 ,631 ,758 ,333
Within Subjects EffectFACTOR1
Mauchly's WApprox.
Chi-Square df Sig.Greenhouse
-Geisser Huynh-FeldtLower-bound
Epsilon a
Tests the null hypothesis that the error covar iance matrix of the orthonormalized transformed dependent variables isproportional to an identity matrix.
May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in theTests of Within-Subjects Effects table.
a.
Design: Intercept
Within Subjects Design: FACTOR1
b.
Tests of Within-Subjects Effects
Measure: MEASURE_1
6292,167 3 2097,389 8,380 ,000
6292,167 1,893 3324,193 8,380 ,002
6292,167 2,274 2766,416 8,380 ,001
6292,167 1,000 6292,167 8,380 ,015
8259,833 33 250 ,298
8259,833 20,821 396 ,702
8259,833 25,019 330 ,138
8259,833 11,000 750 ,894
Spher icity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Spher icity Assumed
Greenhouse-Geisser
Huynh-Feldt
Lower-bound
Source
FACTOR1
Error(FACTOR 1)
Type III Sumof Squares df Mean Square F Sig.
Pairwise Comparisons
Measure: MEASURE_1
28,583* 7,156 ,002 12,834 44,333
26,083* 7,877 ,007 8,745 43,421
12,667 8,469 ,163 -5,973 31,306
-28,583* 7,156 ,002 -44,333 -12,834
-2,500 2,601 ,357 -8,225 3,225
-15,917* 5,716 ,018 -28,498 -3,336
-26,083* 7,877 ,007 -43,421 -8,745
2,500 2,601 ,357 -3,225 8,225
-13,417* 5,088 ,023 -24,615 -2,218
-12,667 8,469 ,163 -31,306 5,973
15,917* 5,716 ,018 3,336 28,498
13,417* 5,088 ,023 2,218 24,615
(J) FACTOR1
2
3
4
1
3
4
1
2
4
1
2
3
(I) FACTOR1
1
2
3
4
MeanDifference
(I-J ) Std. Error Sig.a
LowerBound
UpperBound
95% Confidence Interval forDifference
a
Based on estimated ma rginal means
The mean d ifference is significant at the ,05 level.*.
Adjustment for multiple compar isons: Least Significant Difference (equivalent to noadjustments).
a.
Uppgift 11. Envägs ANOVA för upprepade mätningar (inomindividdesign) innehåller bland annat nedanstående tabeller. Om testet av om villkoret för “sfäricitet” är uppfyllt ska man INTE ha något signifikant resultat (dvs man vill INTE att Sig. ≤ 0,05). I det här exemplet bryter man tyvärr mot detta eftersom 0,015 är mindre än 0,05 och bör därför använda någon av korrigeringarna, t.ex. “Lower-Bound” som ger sämst styrka. Sedan kommer själva ANOVA tabellen. Om man kan anta att det råder sfäricitet, dvs villkoret för sfäricitet (ovan) är uppfyllt, tittar man på raden “Sphericity Assumed” (Överkurs: annars tittar man vanligen på den rad som ger lägsta p-värdet:“Lower-bound”). Vi ser att oberoende av vilket vi väljer att göra blir F-kvoten densamma. Genom att justera frihetsgraderna ger de olika justeringarna däremot olika p-värden. Som Post Hoc test har LSD valts (nedan). Som synes erhölls signifikanta skillnader mellan tillfälle 1 & 2, 1 & 3, 2 & 4, och 3 & 4. Dock inte mellan 1 & 4 – vilket kanske var den mest intressanta skillnaden! (Överkurs: Eftersom man har 4 grupper ger den dock troligen lite för stor risk för Typ-I fel och egentligen bör Bonferroni-korrektion väljas).
51
Tests of Between-Subjects Effects
Dependent Variable: studieresultat
4234,222a
5 846,844 16,656 ,000
55068,444 1 55068,444 1083,077 ,000
277,778 1 277,778 5,463 ,026
734,889 2 367,444 7,227 ,003
3221,556 2 1610,778 31,681 ,000
1525,333 30 50,844
60828,000 36
5759,556 35
SourceCorrected Model
Intercept
KÖ N
TEKNIK
KÖ N * TEKNIK
Error
Total
Corrected Total
Type III Sumof Squares df Mean Square F Sig.
R Squared = ,735 (Adjusted R Squared = ,691)a.
Multiple Comparisons
Dependent Var iable: studieresultat
9,5000* 2,91103 ,010 2,0035 16,9965
9,6667* 2,91103 ,009 2,1702 17,1631
-9,5000* 2,91103 ,010 -16,9965 -2,0035
,1667 2,91103 ,998 -7,3298 7,6631
-9,6667* 2,91103 ,009 -17,1631 -2,1702
-,1667 2,91103 ,998 -7,6631 7,3298
9,5000* 2,91103 ,003 3,5549 15,4451
9,6667* 2,91103 ,002 3,7216 15,6118
-9,5000* 2,91103 ,003 -15,4451 -3,5549
,1667 2,91103 ,955 -5,7784 6,1118
-9,6667* 2,91103 ,002 -15,6118 -3,7216
-,1667 2,91103 ,955 -6,1118 5,7784
(J) studieteknik
B
C
A
C
A
B
B
C
A
C
A
B
(I) studieteknik
A
B
C
A
B
C
Scheffe
LSD
MeanDifference
(I-J ) Std. Er ror Sig.LowerBound
Uppe rBound
95% Confidence Interval
Based on observed means.
The mean d ifference is significant at the ,05 level.*.
Uppgift 15. Den viktigaste tabellen vid flervägs oberoende ANOVA är själva ANOVA-tabellen: Vi ser att huvudeffekten för faktorn Kön är signifikant, F1,30 = 5,463 (p = 0,026) liksom att huvudeffekten för faktorn Teknik är signifikant, F2,30 = 7,227 (p = 0,003). När vi tittar på tabellen över medelvärden ser vi att männen totalt sett har ett bättre resultat en kvinnorna. Vi ser också att A totalt sett verkar vara den bästa tekniken. Men speciellt interssant är att interaktionseffekten mellan Kön och Teknik också är signifikant, F2,30 = 31,681 (p < 0,001).
Hjälp till tolkning av interaktionseffekten får vi bäst genom en graf (se nedan). Här kan vi se att det är en antagonistisk interaktionseffekt. Män har bäst nytta av att använda teknik A och kvinnor tjänar mest på att använda teknik C. Resultatet med teknik B verkar däremot vara oberoende av kön. Tabellen över Post Hoc testen tolkas som vanligt och visar att skillnaden mellan A och B, och mellan A och C är signifikant, däremot inte mellan B och C.
Estimated Marginal Means of studieresultat
studieteknik
CBA
Esti
mate
d M
argin
al M
eans
70
60
50
40
30
20
Kön
man
kvinna