Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
STATISTISK ANALYSE I SPSS
Anne Schad Bergsaker
14. februar 2020
FØR VI BEGYNNER...
LÆRINGSMÅL
1. Kjenne til de vanligste testene som kan brukes i statistiskanalyse
2. Vite forskjell på parametriserte og ikke-parametrisertetester
3. Vite hvilke statistiske tester som bør brukes når
4. Vite når du må bruke robuste metoder
5. Kunne tolke resultatene fra en test i SPSS, og vite om enmodell du har laget er god eller ikke
1
TEKNISKE FORUTSETNINGER
Hvis du ikke har SPSS nå, bruk remote desktop: view.uio.no
Data som brukes til eksempler og oppgaver er hentet fra SPSSsurvival manual, og kan lastes ned frahttps://www.allenandunwin.com/spss under Data Files &
Exercises eller fra kurssiden http://www.uio.no/for-ansatte/kompetanse/tema/data/it-forskning/spss-26.02.19.html.
Prøv å gjøre og følge de samme stegene som jeg gjørunderveis. Har du spørsmål eller problemer, rop ut!
2
UTFORSKE FORSKJELLER MELLOM
GRUPPER
LITEN DISCLAIMER
Selv om t-test og ANOVA ofte presenteres som noe helt annetenn lineær regresjon, er det egentlig akkurat det samme. Altsammen baserer seg på den samme lineære modellen.Grunnen til at de holdes separat, er rent historisk. Derfor er detikke så veldig farlig om du er usikker på om du vil utforskeforskjeller mellom grupper, eller forhold mellom variabler.
3
T-TEST
Sammenligne data fra to grupper, for å se om de er forskjellige.Brukes typisk når man har gjort kontrollerte studier.
Vær bevisst på at det finnes (i hovedsak) to ulike t-tester; en foruavhengige grupper, og en for målinger på samme gruppe vedto tidspunkt (repeated measures).
Alternativ dersom kriterier ikke er møtt: Mann Whitney U-test(for uavhengige data), Wilcoxon Signed Rank-test (foravhengige data), t-test kombinert med bootstrap.
4
FORUTSETNINGER FOR UAVHENGIG T-TEST
Du trenger en kontinuerlig avhengig variabel og en kategoriskuavhengig variabel med to nivåer/kategorier
Uavhengige observasjoner/grupper. Dette betyr at hverdeltaker kun kan tilhøre en av gruppene, f.eks. menn ogkvinner, røykere og ikke-røykere.
Tilfeldig utvalg
Ingen utpregede uteliggere
Den avhengige variablen bør være normalfordelt innenfor hverav kategoriene i den uavhengige variablen.
Variansen i den avhengige variablen bør være omtrent lik i deto kategoriene angitt av den uavhengige variablen. Grupper børheller ikke være veldig ulik størrelse.
5
T-TEST
Analyze > Compare Means > Independent Samples T Test
Vi bruker datasettet survey.sav.Flytt den avhengige kontinuerligevariablen til boksen TestVariable(s), og den uavhengigekategoriske variablen til GroupingVariable. Selv om du kan testeflere avhengige variabler avganger, bør du ikke gjøre det, menheller bruke MANOVA.
6
T-TEST
Trykk på Define Groups...
Her gjelder det å huske hvordanden kategoriske variablen er kodet.Angi hva de to gruppene skalvære. Her er kjønn kodet som1=Mann og 2=Kvinne, så vi angir 1og 2 og trykker Continue. Haddede vært kodet som 0 og 1, ville viskrevet inn de verdiene.
7
T-TEST
Group Statistics gir litt info om de to gruppene, gjennomsnitt,standardavvik, etc. Independent Samples Test forteller oss omhvor stor forskjellen er (Mean difference), og om den ersignifikant (Sig. 2-tailed). Dersom Levene’s test ikke ersignifikant (kolonne nr 2), kan vi se på første rad (Equalvariances assumed). t-testen i dette tilfellet er ikke signifikant.
8
MANN WHITNEY U-TEST
Ikke-parametrisert variant av vanlig t-test for uavhengigemålinger. Du trenger en kontinuerlig variabel, og en kategoriskvariabel med to grupper. Alternativ om du har mye outliers.
Analyze > Nonparametric Tests > Independent Samples
Velg Customizeanalysis og trykk påFields
9
MANN WHITNEY U-TEST
Velg Use custom fieldassignments, og flyttden avhengigevariabelen over i feltetTest Fields. Flytt denuavhengige variablenover i Groups, og trykkpå Settings.
10
MANN WHITNEY U-TEST
Hak av påMann-Whitney U (2samples), og trykkPaste.
11
MANN WHITNEY U-TEST
Sammendraget av testen forteller hva som er hypotesen vitester mot (ingen forskjell mellom grupper), og hvakonklusjonen av testen er, basert på signifikans. I dette tilfelleter det ikke signifikant forskjell mellom gruppene, og vi beholdernullhypotesen.
12
MANN WHITNEY U-TEST
Signifikans-verdien fra testen, med tilhørende test-statistikkvises i tabellen Independent Samples Mann-Whitney U....Histogrammene over de to gruppene støtter resultatet avtesten, at det ikke er noen stor forskjell mellom gruppene.
13
FORUTSETNINGER FOR REPEATED MEASURES T-TEST
Du trenger en avhengig variabel som er kontinuerlig og måltved to ulike tidspunkt eller under to ulike forhold
Tilfeldig utvalg
Det bør ikke være noen utpregede uteliggere i differansenmellom de to nivåene/tidspunktene
Forskjellen mellom målingene ved tidspunkt en og tidspunkt tobør være omtrent normalfordelt.
Dataene bør være arrangert slik at alle deltaker kun har en rad,med målinger fra ulike tidspunkt som ulike variabler.
14
T-TEST (REPEATED MEASURES)
Analyze > Compare Means > Paired Samples T Test
Vi bruker datasettetexperim.sav. Flyttvariablen sominneholder målingerved tidspunkt/forhold nr1 over i boksen PairedVariables. Flytt derettervariablen sominneholder målinger fratidspunkt/forhold nr 2.
15
T-TEST (REPEATED MEASURES)
Paired Samples Statistics inneholder beskrivende statistikksom gjennomsnitt og standardavvik for de to uliketidspunktene.Paired Samples Correlations angir korrelasjonmellom målingene fra de to ulike tidspunktene.
16
T-TEST (REPEATED MEASURES)
Siste tabell angir om testen er signifikant eller ikke, og hva somer gjennomsnittlig forskjell mellom de totidspunktene/forholdene. Her er forskjell 2.67, og testen erhøyst signifikant (p<0.001).
17
WILCOXON SIGNED RANK-TEST
Ikke-parametrisert alternativ til repeated measures t-test. Dutrenger en kontinuerlig variabel målt ved to ulike tidspunkt.Spesielt egnet om du har mye outliers.
Analyze > Nonparametric Tests > Legacy Dialogs > 2 RelatedSamples
Flytt først målinger fraførste tidspunkt over iTest Pairs, derettermålinger fra tidspunktnr 2. Hak av forWilcoxon.
18
WILCOXON SIGNED RANK-TEST
Two-Related-Samples: OptionsHak av for Quartiles (ogDescriptives om du ønsker littdeskriptiv statistikk i tillegg).Exclude cases test-by-testgjør at alle som har data forbegge tidspunkt, men someventuelt mangler data iandre variabler fortsatt tasmed i analysen.
19
WILCOXON SIGNED RANK-TEST
Descriptive Statistics angirde ulike kvartilene. Her ser viat det er tegn til forskjellermellom målinger fra uliketidspunkt, ettersom allekvartiler for tidspunkt 2 erlavere enn for tidspunkt 1.Test Statistics bekrefter dette(p<0.001). Effekten kanberegnes vha r=z/(2*N) derN er antall caser, som i dettetilfellet blir -4.18/(2*30)=0.54,som tilsvarer en stor effekt.
20
ANOVA - ANALYSIS OF VARIANCE
Sammenligne data fra to eller flere grupper for å se om de erforskjellige.
Vær bevisst på at testen må tilpasses til om du har uavhengigegrupper (ulike deltakere i hver gruppe), eller om det er desamme som inngår i hver av gruppene (repeated measures).ANOVA antar at alle grupper har omtrent like stor spredning(standardavvik).
Alternativ dersom kriterier ikke er møtt: Kruskal Wallis-test,Friedman-test, bootstrap, andre robuste metoder
21
FORUTSETNINGER FOR UAVHENGIG ANOVA
Du trenger en kontinuerlig avhengig variabel, og en kategoriskuavhengig variabel med minst to kategorier
Uavhengige målinger, slik at deltakere kun forekommer i en avgruppene angitt av den kategoriske variablen, ogenkeltindivider ikke har fått påvirke hverandre
Tilfeldig utvalg
Ingen utpregede uteliggere
Den avhengige variablen bør være omtrent normalfordeltinnenfor de ulike kategoriene angitt av den uavhengigevariablen
Variansen til de ulike kategoriene bør være tilnærmet lik.Grupper bør heller ikke være veldig ulik størrelse.
22
ANOVA - ANALYSIS OF VARIANCE
Analyze > Compare Means > One way ANOVA
Vi bruker datasettetsurvey.sav. Flytt denavhengige variablenover i vinduetDependent List, og denkategoriske variablen tilFactor.
23
ANOVA - ANALYSIS OF VARIANCE
One way ANOVA: Options
Hak av for Descriptive,Homogeneity of variance,Brown-Forsythe og Welch underStatistics og velg Means plot. For åfå med mest mulig data i analysen,velg Exclude cases analysis byanalysis.
24
ANOVA - ANALYSIS OF VARIANCE
One way ANOVA: Post Hoc Multiple Comparisons
Her kan du velge fra et utvalgav post hoc-tester. SjekkSPSS sin dokumentasjon fordetaljer om hver test. Vivelger Tukey (hvis vi haromtrent lik varians ogstørrelse på grupper),Bonferroni (kontrollerer fortype I feil) og Games-Howell(i tilfelle det er ulikhet ivarians).
25
ANOVA - ANALYSIS OF VARIANCE
Descriptives gir beskrivende statistikk for den avhengigevariablen innenfor de ulike gruppene definert av denuavhengige variablen.
26
ANOVA - ANALYSIS OF VARIANCE
Test of Homogeneity... angir om vikan anta at variansen er omtrentlike stor i de ulike gruppene. Her ernullhypotesen at de er like, så viønsker at Sig. skal være større enn0.05. Robust Tests of Equality ofMeans angir testresultater som børbrukes dersom variansen ikke erlik, og angir omtrent det sammesom vanlig ANOVA. I dette tilfellet,at det er signifikant forskjell mellomgruppene.
27
ANOVA - ANALYSIS OF VARIANCE
Siden vi kan anta lik variansbaserer vi oss på vanligANOVA, som også sier at deter signifikante forskjellermellom gruppene (Sig. =0.01). Posthoc-testresultatene angirhvilke grupper som ersignifikant ulike frahverandre. Her ser vi at detkun er signifikant forskjellmellom første og sistealdersgruppe.
28
ANOVA - ANALYSIS OF VARIANCE
Gjennomsnitt i hver aldersgruppe plottet mot aldersgruppeneindikerer også en tydelig trend, med økende optimisme medalder.
29
KRUSKAL WALLIS
Ikke-parametrisert alternativ til ANOVA for uavhengigemålinger. Du trenger en kontinuerlig variabel og en kategoriskvariabel med tre eller flere grupper.
Analyze > Nonparametric parametric Tests > IndependentSamples
I Fields-tabben, flyttden avhengigevariablen over i TestFields, og denkategoriskeuavhengige variablentil Groups.
30
KRUSKAL WALLIS
Under Settings, velgKruskal-Wallis 1-wayANOVA, og pass på atMultiple comparisonsstår på All pairwise.Velg Test for OrderedAlternatives dersomden kategoriskevariablen er ordnet.Trykk Paste.
31
KRUSKAL WALLIS
Hypothesis Test Summaryangir hva null-hypotesen er,og om den bør forkastes. Idette tilfellet sier den at vi børgå for alternativ hypoteste, atdet er forskjell på gruppeneog at den endrer segkonsekvent ettersom alderøker. Spesifikk test-statistikkog signifikans vises også iIndependent-SamplesKruskal-Wallis...
32
KRUSKAL WALLIS
Boxplot av dataene frade ulikealdersgruppene ser uttil å bekrefte atoptimisme økerettersom alder øker.
33
KRUSKAL WALLIS
Pairwise comparisons... forteller oss at det kun er signifikantforskjell mellom første og siste aldersgruppe.
34
FORUTSETNINGER FOR REPEATED MEASURES ANOVA
Du trenger en kontinuerlig variabel som er målt ved minst toulike tidspunkt eller eksperimentelle forhold
Tilfeldig utvalg
Ingen utpregede uteliggere
Den avhengige variablen bør være omtrent normalfordelt vedhvert av tidspunktene eller ved hver av de ulike eksperimentelleoppsettene
Variansen til den avhengige variablen ved de ulike tidspunktenebør være tilnærmet lik
Variansen til differansen mellom alle mulige par av tisdpunkterbør være tilnærmet lik for alle parkombinasjoner (kalles oftesfærisitet). Hvis ikke må korreksjoner brukes.
35
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Analyze > General Linear Model > Repeated Measures
Vi bruker datasettetexperim.sav. Først må vi’lage’ en faktor som definerereffekter som skal testes forflere personer/caser vedulike tidspunkt/forhold. Vi måbare oppgi et navn og angiantall nivåer, og trykke påAdd.
36
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Etter at vi har trykket på Add,vil denne faktoren dukke oppi vinduet under. Deretter kanvi trykke på Define.
37
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
De tre nivåene ifaktoren vi lagde stårlistet opp som tre ulikevariabler. Disse mådefineres ved at vimarkerer nivå 1, ogflytter målingene avden avhengigevariablen ved tidspunkt1 over i boksenWithin-SubjectsVariables.
38
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Når alle tidspunkt erlagt til, vil det seomtrent slik ut. Alle trenivåer i faktoren vårhar blitt definert av hversin variabel.
39
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Repeated Measures: Model
Sjekk at Full factoral ervalgt, og at Sum ofsquares står på TypeIII.
40
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Repeated Measures: Options
Velg Descriptivestatistics og Estimatesof effect size.
41
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Repeated Measures: Profile Plots
Flytt time over i Horizontal axis, ogtrykk på Add. Velg enten Line charteller Bar chart (avhengig av hva duliker). Hak av for Include ErrorBars.
42
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Repeated Measures: Estimated Marginal Means
Velg time og flytt over iDisplay Means for. Hak avfor Compare main effects ogvelg Bonferroni (den erstrengest). Trykk Continueog Paste.
43
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Descriptive Statistics gir gjennomsnitt og standardavvik for denavhengige variablen innenfor hver av gruppene definert av denuavhengige variablen. Multivariate Tests angir signifikans. Herkan du velge den testen som er mest vanlig i ditt fagfelt. Sigmindre enn 0.05 indikerer signifikant forskjell mellom grupper.
44
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Mauchly´s test of sphericity angir om sfærisitet er tilfredsstilteller ikke. Nullhypotesen er at sfærisitet er tilfredsstilt. Hvis Sig.er mindre enn 0.05, kan vi ikke anta at sfærisitet er tilfredsstilt,og vi må da ta hensyn når vi tolker resten av modellen.
45
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Siden vi ikke kan antasfærisitet, må vi basere osspå de tre andre målene påom det er forskjeller påtidspunktene. Denstrengeste er Lower-bound,og selv denne er signifikant.Vi har også signifikans for atdet er en lineærsammenheng medtidsfaktoren vår (se Tests ofwithin-subjectscontrasts-tabell)
46
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Gjennomsnitt for hverttidspunkt sammen medtilhørende standardfeil ofkonfidensintervall erpresentert i EstimatedMarginal Means. Pairwisecomparisons viser at det ersignifikant forskjell mellomalle nivåer, med tilhørendegjennomsnittlig forskjell.
47
ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)
Gjennomsnitt for hvert tidspunkt plottet mot tid, inludertusikkerhet gitt av konfidensintervallene viser en tydelig lineærtrend i at deltakeres frykt for statistikk avtar med tid.
48
FRIEDMANS ANOVA
Ikke-parametrisert alternativ til repeated measures ANOVA. Dutrenger en kontinuerlig variabel som har blitt målt ved minst toulike tidspunkter/ulike forhold.
Analyze > Nonparametric Tests > Legacy Dialogs > K RelatedSamples
Flytt de variablene somrepresenterer målingerpå uliketidspunkt/under ulikeforhold over i boksenTest Variables.
49
FRIEDMANS ANOVA
Several Related Samples:Statistics, Several RelatedSamples: Exact
Hak av for Quartiles ogeventuelt Descriptive om duvil. Velg Exact under Exacttests.
50
FRIEDMANS ANOVA
Deskriptiv statistikk viserkvartiler ved hvert tidspunkt.Ranks angir gjennomsnittligrang ved hver av de tretidspunktene. At rang ser uttil å avta med tid antyder atdet er en sammenhengmellom tid og frykt forstatistikk. Test Statisticsangir om testen er signifikanteller ikke (Asump.Sig.< 0.05).
51
MIXED ANOVA
Brukes når du har lyst til å både sammenligne uavhengigegrupper, samtidig som du har målinger utført på de sammeindividene ved flere tidspunkt/ved ulike forhold.
Analyze > General Linear Model > Repeated Measures
Som med vanligrepeated measuresANOVA, må vi lagefaktoren som angir deulike tidspunk-tene/forholdene. Giden et navn, angi antallnivåer, og trykk Add,og trykk Define
52
MIXED ANOVA
Flytt de variabene somtilsvarer målinger av denavhengige variablen på uliketidspunkt over til tilsvarendenivå i tidsfaktoren i vinduetWithin-subjects variables.Flytt faktoren som angir denfaktoren med uavhengigemålinger over i feltetBetween-subjects factors.
53
MIXED ANOVA
Repeated Measures: Options
Velg Descriptivestatistics, Estimates ofeffect size ogHomogeneity tests.
54
MIXED ANOVA
Repeated Measures: Profile Plots
Legg til den repetertefaktoren (her time) til feltetHorizontal Axis, og faktorenmed uavhengige grupper iboksen Separate Lines, ogtrykk på Add. Velg LineChart, og hak av for IncludeError Bars.
55
MIXED ANOVA
Gjennomsnitt ogstandardavvik forde to uavhengigegruppene vedhvert av de tretidspunktene.
56
MIXED ANOVA
Dette er en test av kovarians påtvers av grupper og tidspunkt.Nullhypotesen er at kovariansen erlik. Hvis denne testen ikke ersignifikant, kan vi anta atkovariansen ikke varierernevneverdig, dvs. at korrelasjonmellom ulike tidspunkter innenforundergruppene definert av deuavhengige gruppene ikke varierer.
57
MIXED ANOVA
De første fire radene iMultivariate tests tilsierat det er en signifikanteffekt av tid. De nestefire radene tilsier at detikke er noen signifikanteffekt av denkombinerte faktoren tidog gruppering.
58
MIXED ANOVA
Levene´s test antyderat det er konstantvarians i feilen sommodellen gjør, ettersomingen av testene ersignifikante. Tests ofBetween Subjectseffects viser atgruppene i denuavhengige variablenikke er signifikant ulike(p=0.81).
59
MIXED ANOVA
Grafen av frykt for statistikk over tid for de to ulike gruppeneforsterker inntrykket av at det ikke er noen forskjell pågruppene, ettersom linjene følger hverandre veldig nært.
60
ANOVA - ANALYSIS OF VARIANCE
Andre varianter av ANOVA
• Two way ANOVA - flere uavhengige kategoriske variable.Resultatet blir å se på forskjeller mellom ulike grupperinger,f.eks. ikke bare kjønn, men aldersgruppe også.
• ANCOVA (ANalysis of COVAriance) - Utføre ANOVA, mensdu tar hensyn til en eller flere kontinuerlige variabler også
• MANOVA (Multippel ANOVA) - Se på forskjeller mellomgrupper, innenfor flere kontinuerlige avhengige variablersamtidig
61
KATEGORISKE UTFALL
CHI SQUARED(χ2)-TEST
Brukes for å teste om fordelingen av data innenfor kategorier ertilfeldig eller ikke, altså om det er en korrelasjon mellomkategoriske variabler.
Dette er en ikke-parametrisert test, så her trenger vi ikke tenkeså mye på fordeling av data. Derimot bør ingen av gruppene ide kategoriske variablene være for små. Hvis du ser påsammenheng mellom to kategoriske variabler med to grupper ihver, resulterer dette i 2 × 2 = 4 undergrupper. Da bør ingenundergrupper ha en forventet frekvens under 5. For størretabeller bør minst 80% av cellene ha forventet frekvens på 5eller mer.
Observasjoner bør være uavhengige, så de to variablene børf.eks. ikke være av typen pre/post-test. Hvis du har slike databør McNemar’s test brukes istedenfor. 62
CHI SQUARED(χ2)-TEST
Analyze > Descriptive Statistics > Crosstabs...
Bruker datasettetsurvey.sav. Flytten av dekategoriskevariablene over iRow(s) og denandre over iColumn(s). Hakav for Displayclustered barcharts hvis du vil.
63
CHI SQUARED(χ2)-TEST
Crosstabs: Exact
Velg Exact fremforAsymptotic only. Daregner du ut Fisher’sexact test, som ergunstig hvis man har fåcaser, eller laveforventede frekvenser ienkeltgrupper. Hvisdette ikke er tilfellet, vildet heller ikke utføresnoen korreksjon, så dutaper ingenting.
64
CHI SQUARED(χ2)-TEST
Crosstabs: Statistics
Hak av Chi-square,Contingency coefficient, Phiand Cramer’s V og Lambda,så vi får utført riktig test (χ2)og får et mål påeffektstørrelse (Phi/CramersV). Lambda gir et mål på ihvor mye mindre feil vi får ommedlemskap i en variabelpredikeres basert påmedlemskap i den andrevariablen.
65
CHI SQUARED(χ2)-TEST
Crosstabs: Cell Display
Hak av for både Observed ogExpected i Counts. I tillegghak av for Row, Column ogTotal i Percentages, ogStandardized i Residuals.
66
CHI SQUARED(χ2)-TEST
Krysstabellen gir hvordandeltakere fordeler seg i de (idette tilfellet) fireundergruppene, sammenmed et forventet antall.Residualene angir forskjellmellom målt frekvens offorventet. Hvis residualeneer større enn 2.0 (for en 2×3tabell eller større), er det myestørre forskjell enn forventet.
67
CHI SQUARED(χ2)-TEST
Liten effekt: 0.1, Middels effekt:0.3, Stor effekt: 0.5.
Den viktigste verdien iChi-Square Tests PearsonChi-Square. Siden denneikke er signifikant, er det ikkeforskjell på antall menn ogkvinner som røyker. Med2×2 tabell er phi best mål påeffekt, ellers er det CramersV.
68
CHI SQUARED(χ2)-TEST
Søylediagrammet forsterker inntrykket av at det ikke er noensignifikant forskjell mellom hvor mange som røyker av menn ogkvinner, ettersom begge grupper ser nesten like ut.
69
LOGISTISK REGRESJON
Brukes når du har en kategorisk avhengig variabel, altså når duprøver å forutse gruppemedlemskap basert på andrekontinuerlige og/eller kategoriske variabler
Ikke avhengig av normalfordeling, men det er viktig at allegrupper/kategorier har nok datapunkter
Her er også multikolinearitet mellom uavhengige variabler viktigå passe på.
70
FORUTSETNINGER FOR LOGISTISK REGRESJON
Du har en avhengig variabel som er kategorisk, derkategoriene ikke overlapper. Det kan ikke være mulig i tilhøremer enn en av utfallskategoriene.
Du har en eller flere uavhengige variabler som er kontinuerligeeller kategoriske
Observasjonene er uavhengige
Hvis du har flere kontinuerlige uavhengige variabler, bør disseikke være korrelert
Alle kategorier i en kategorisk variabel bør være skikkeligrepresentert
Lineært forhold mellom kontinuerlige prediktorer oglogit-tranformasjonen av utfallsvariabel
71
LOGISTISK REGRESJON
Analyze > Regression > Binary Logistic
Vi bruker datasettetsleep.sav. Flytt denavhengige variablen tilDependent og deønskede uavhengigevariablene tilCovariates. Trykk påCategorical...
72
LOGISTISK REGRESJON
Logistic Regression: Define Categorical Variables
Alle kategoriskevariabler måspesifiseres, slik at debehandles på riktigmåte i modellen. Herkan du velge omreferansegruppen skalvære første eller sistegruppe, men husk åtrykke på Change,ellers skjer det ingenendring.
73
LOGISTISK REGRESJON
Logistic Regression: Options
Hak av forHosmer-Lemeshowgoodness-of-fit,Casewise listing ofresiduals, CI for exp(B)og Include constant inmodel. Trykk Continueog Paste.
74
LOGISTISK REGRESJON
Første del av output angirbare litt innledende om hvormange caser som er tatt medi analysen, og hvordan denavhengige variabelen erkodet. Dette er praktisk åhuske på når man skal tolkeresten av resultatene.Referanse-gruppen for utfaller kodet som 0, i dette tilfelletno.
75
LOGISTISK REGRESJON
Tilsvarende koding for deuavhengige (kategoriske)variablene, med frekvens forhver gruppe. Grupper kodetsom 0 er referansegrupper,fordi vi valgte første gruppesom referanse. Classificationtabel gir resultatene av denmodellen vi sammenlignermed, nemlig den uten noenvariabler innkludert.
76
LOGISTISK REGRESJON
Omnibus test angir modellenssignifikans, som helst skal væreunder 0.05. Cox & Snell R Squareog Nagelkerke R Square anslåhvor mye variasjon i utfallet sombeskrives av modellen.Hosmer-Lemeshow angir ommodellen er god. Her vil vi ha Sig.større enn 0.05.
77
LOGISTISK REGRESJON
Til sammenligning med den tommemodellen, kan vi nå med dennemodellen korrekt forutse 75,1% avresultatene, sammenlignet med57.3%. For de resultatene somikke forutses korrekt, har de medresidualer større enn 2 blitt listet iCasewise list. Er residualenestørre enn 2.5 bør disseundersøkes nærmere. Det kanvære en grunn til at disse ikkebeskrives bra av modellen.
78
LOGISTISK REGRESJON
Selve modellen vises i Variables in the Equation.Kolonnene Bog Exp(B) angir effektstørrelse, og Sig. signifikans. Hvis Exp(B)er større enn 1 for en spesifikk variabel, betyr det at sjansen forå ende opp i gruppe 1 i utfallsvariablen, er større om man entenøker verdien av variablen (kontinuerlig), eller går frareferansegruppe til ikke referansegruppe for den variablen. Desom har problemer med å få sove (prob fall asleep=1) har 2.05ganger høyere odds for å ha søvnproblemer (prob sleep=1).
79
LOGISTISK REGRESJON
For å teste linearitet, kan man regne ut den naturligelogaritmen til alle kontinuerlige variabler (LN(age),LN(hourwnit)). Kryssleddene LN(variabel)×variabel inkluderesså i den logistiske regresjonsmodellen. Hvis disse leddene ikkeer signifikante, er antagelsen tilfredsstilt.
80
LOGISTISK REGRESJON
For å teste for multikolinearitet, må man bruke vanlig lineærregresjon, med akkurat de samme variablene som avhengig oguavhengig variabler som i den opprinnelige modellen, og hakeav for Collinearity Diagnostics under Statistics i dialogboksen.VIF<10 er nødvendig.
81
TILBAKE TIL LESESALEN/KONTORET
Begynn å bruke SPSS så fort som mulig på egne data (ellerandres data om du vil)!
Den eneste måten å bli god i statistikk og SPSS er ved å brukedet.
Sørg for å ha gode oppslagsverk
Spør google og youtube når du står fast. Står du fortsatt fast,spør oss ([email protected])
82
FORSLAG TIL BØKER
I SPSS: SPSS Survival manual avJulie Pallant
I statistikk og SPSS: Discoveringstatistics using IBM SPSS og Anadventure in statistics av AndyField
83