Statistisk analyse i SPSS - Universitetet i OsloANOVA - ANALYSIS OF VARIANCE One way ANOVA: Post Hoc Multiple Comparisons Her kan du velge fra et utvalg av post hoc-tester. Sjekk SPSS

STATISTISK ANALYSE I SPSS

Anne Schad Bergsaker

14. februar 2020

FØR VI BEGYNNER...

LÆRINGSMÅL

1. Kjenne til de vanligste testene som kan brukes i statistiskanalyse

2. Vite forskjell på parametriserte og ikke-parametrisertetester

3. Vite hvilke statistiske tester som bør brukes når

4. Vite når du må bruke robuste metoder

5. Kunne tolke resultatene fra en test i SPSS, og vite om enmodell du har laget er god eller ikke

1

TEKNISKE FORUTSETNINGER

Hvis du ikke har SPSS nå, bruk remote desktop: view.uio.no

Data som brukes til eksempler og oppgaver er hentet fra SPSSsurvival manual, og kan lastes ned frahttps://www.allenandunwin.com/spss under Data Files &

Exercises eller fra kurssiden http://www.uio.no/for-ansatte/kompetanse/tema/data/it-forskning/spss-26.02.19.html.

Prøv å gjøre og følge de samme stegene som jeg gjørunderveis. Har du spørsmål eller problemer, rop ut!

2

UTFORSKE FORSKJELLER MELLOM

GRUPPER

LITEN DISCLAIMER

Selv om t-test og ANOVA ofte presenteres som noe helt annetenn lineær regresjon, er det egentlig akkurat det samme. Altsammen baserer seg på den samme lineære modellen.Grunnen til at de holdes separat, er rent historisk. Derfor er detikke så veldig farlig om du er usikker på om du vil utforskeforskjeller mellom grupper, eller forhold mellom variabler.

3

T-TEST

Sammenligne data fra to grupper, for å se om de er forskjellige.Brukes typisk når man har gjort kontrollerte studier.

Vær bevisst på at det finnes (i hovedsak) to ulike t-tester; en foruavhengige grupper, og en for målinger på samme gruppe vedto tidspunkt (repeated measures).

Alternativ dersom kriterier ikke er møtt: Mann Whitney U-test(for uavhengige data), Wilcoxon Signed Rank-test (foravhengige data), t-test kombinert med bootstrap.

4

FORUTSETNINGER FOR UAVHENGIG T-TEST

Du trenger en kontinuerlig avhengig variabel og en kategoriskuavhengig variabel med to nivåer/kategorier

Uavhengige observasjoner/grupper. Dette betyr at hverdeltaker kun kan tilhøre en av gruppene, f.eks. menn ogkvinner, røykere og ikke-røykere.

Tilfeldig utvalg

Ingen utpregede uteliggere

Den avhengige variablen bør være normalfordelt innenfor hverav kategoriene i den uavhengige variablen.

Variansen i den avhengige variablen bør være omtrent lik i deto kategoriene angitt av den uavhengige variablen. Grupper børheller ikke være veldig ulik størrelse.

5

T-TEST

Analyze > Compare Means > Independent Samples T Test

Vi bruker datasettet survey.sav.Flytt den avhengige kontinuerligevariablen til boksen TestVariable(s), og den uavhengigekategoriske variablen til GroupingVariable. Selv om du kan testeflere avhengige variabler avganger, bør du ikke gjøre det, menheller bruke MANOVA.

6

T-TEST

Trykk på Define Groups...

Her gjelder det å huske hvordanden kategoriske variablen er kodet.Angi hva de to gruppene skalvære. Her er kjønn kodet som1=Mann og 2=Kvinne, så vi angir 1og 2 og trykker Continue. Haddede vært kodet som 0 og 1, ville viskrevet inn de verdiene.

7

T-TEST

Group Statistics gir litt info om de to gruppene, gjennomsnitt,standardavvik, etc. Independent Samples Test forteller oss omhvor stor forskjellen er (Mean difference), og om den ersignifikant (Sig. 2-tailed). Dersom Levene’s test ikke ersignifikant (kolonne nr 2), kan vi se på første rad (Equalvariances assumed). t-testen i dette tilfellet er ikke signifikant.

8

MANN WHITNEY U-TEST

Ikke-parametrisert variant av vanlig t-test for uavhengigemålinger. Du trenger en kontinuerlig variabel, og en kategoriskvariabel med to grupper. Alternativ om du har mye outliers.

Analyze > Nonparametric Tests > Independent Samples

Velg Customizeanalysis og trykk påFields

9

MANN WHITNEY U-TEST

Velg Use custom fieldassignments, og flyttden avhengigevariabelen over i feltetTest Fields. Flytt denuavhengige variablenover i Groups, og trykkpå Settings.

10

MANN WHITNEY U-TEST

Hak av påMann-Whitney U (2samples), og trykkPaste.

11

MANN WHITNEY U-TEST

Sammendraget av testen forteller hva som er hypotesen vitester mot (ingen forskjell mellom grupper), og hvakonklusjonen av testen er, basert på signifikans. I dette tilfelleter det ikke signifikant forskjell mellom gruppene, og vi beholdernullhypotesen.

12

MANN WHITNEY U-TEST

Signifikans-verdien fra testen, med tilhørende test-statistikkvises i tabellen Independent Samples Mann-Whitney U....Histogrammene over de to gruppene støtter resultatet avtesten, at det ikke er noen stor forskjell mellom gruppene.

13

FORUTSETNINGER FOR REPEATED MEASURES T-TEST

Du trenger en avhengig variabel som er kontinuerlig og måltved to ulike tidspunkt eller under to ulike forhold

Tilfeldig utvalg

Det bør ikke være noen utpregede uteliggere i differansenmellom de to nivåene/tidspunktene

Forskjellen mellom målingene ved tidspunkt en og tidspunkt tobør være omtrent normalfordelt.

Dataene bør være arrangert slik at alle deltaker kun har en rad,med målinger fra ulike tidspunkt som ulike variabler.

14

T-TEST (REPEATED MEASURES)

Analyze > Compare Means > Paired Samples T Test

Vi bruker datasettetexperim.sav. Flyttvariablen sominneholder målingerved tidspunkt/forhold nr1 over i boksen PairedVariables. Flytt derettervariablen sominneholder målinger fratidspunkt/forhold nr 2.

15


Paired Samples Statistics inneholder beskrivende statistikksom gjennomsnitt og standardavvik for de to uliketidspunktene.Paired Samples Correlations angir korrelasjonmellom målingene fra de to ulike tidspunktene.

16


Siste tabell angir om testen er signifikant eller ikke, og hva somer gjennomsnittlig forskjell mellom de totidspunktene/forholdene. Her er forskjell 2.67, og testen erhøyst signifikant (p<0.001).

17

WILCOXON SIGNED RANK-TEST

Ikke-parametrisert alternativ til repeated measures t-test. Dutrenger en kontinuerlig variabel målt ved to ulike tidspunkt.Spesielt egnet om du har mye outliers.

Analyze > Nonparametric Tests > Legacy Dialogs > 2 RelatedSamples

Flytt først målinger fraførste tidspunkt over iTest Pairs, derettermålinger fra tidspunktnr 2. Hak av forWilcoxon.

18


Two-Related-Samples: OptionsHak av for Quartiles (ogDescriptives om du ønsker littdeskriptiv statistikk i tillegg).Exclude cases test-by-testgjør at alle som har data forbegge tidspunkt, men someventuelt mangler data iandre variabler fortsatt tasmed i analysen.

19


Descriptive Statistics angirde ulike kvartilene. Her ser viat det er tegn til forskjellermellom målinger fra uliketidspunkt, ettersom allekvartiler for tidspunkt 2 erlavere enn for tidspunkt 1.Test Statistics bekrefter dette(p<0.001). Effekten kanberegnes vha r=z/(2*N) derN er antall caser, som i dettetilfellet blir -4.18/(2*30)=0.54,som tilsvarer en stor effekt.

20

ANOVA - ANALYSIS OF VARIANCE

Sammenligne data fra to eller flere grupper for å se om de erforskjellige.

Vær bevisst på at testen må tilpasses til om du har uavhengigegrupper (ulike deltakere i hver gruppe), eller om det er desamme som inngår i hver av gruppene (repeated measures).ANOVA antar at alle grupper har omtrent like stor spredning(standardavvik).

Alternativ dersom kriterier ikke er møtt: Kruskal Wallis-test,Friedman-test, bootstrap, andre robuste metoder

21

FORUTSETNINGER FOR UAVHENGIG ANOVA

Du trenger en kontinuerlig avhengig variabel, og en kategoriskuavhengig variabel med minst to kategorier

Uavhengige målinger, slik at deltakere kun forekommer i en avgruppene angitt av den kategoriske variablen, ogenkeltindivider ikke har fått påvirke hverandre

Tilfeldig utvalg


Den avhengige variablen bør være omtrent normalfordeltinnenfor de ulike kategoriene angitt av den uavhengigevariablen

Variansen til de ulike kategoriene bør være tilnærmet lik.Grupper bør heller ikke være veldig ulik størrelse.

22


Analyze > Compare Means > One way ANOVA

Vi bruker datasettetsurvey.sav. Flytt denavhengige variablenover i vinduetDependent List, og denkategoriske variablen tilFactor.

23


One way ANOVA: Options

Hak av for Descriptive,Homogeneity of variance,Brown-Forsythe og Welch underStatistics og velg Means plot. For åfå med mest mulig data i analysen,velg Exclude cases analysis byanalysis.

24


One way ANOVA: Post Hoc Multiple Comparisons

Her kan du velge fra et utvalgav post hoc-tester. SjekkSPSS sin dokumentasjon fordetaljer om hver test. Vivelger Tukey (hvis vi haromtrent lik varians ogstørrelse på grupper),Bonferroni (kontrollerer fortype I feil) og Games-Howell(i tilfelle det er ulikhet ivarians).

25


Descriptives gir beskrivende statistikk for den avhengigevariablen innenfor de ulike gruppene definert av denuavhengige variablen.

26


Test of Homogeneity... angir om vikan anta at variansen er omtrentlike stor i de ulike gruppene. Her ernullhypotesen at de er like, så viønsker at Sig. skal være større enn0.05. Robust Tests of Equality ofMeans angir testresultater som børbrukes dersom variansen ikke erlik, og angir omtrent det sammesom vanlig ANOVA. I dette tilfellet,at det er signifikant forskjell mellomgruppene.

27


Siden vi kan anta lik variansbaserer vi oss på vanligANOVA, som også sier at deter signifikante forskjellermellom gruppene (Sig. =0.01). Posthoc-testresultatene angirhvilke grupper som ersignifikant ulike frahverandre. Her ser vi at detkun er signifikant forskjellmellom første og sistealdersgruppe.

28


Gjennomsnitt i hver aldersgruppe plottet mot aldersgruppeneindikerer også en tydelig trend, med økende optimisme medalder.

29

KRUSKAL WALLIS

Ikke-parametrisert alternativ til ANOVA for uavhengigemålinger. Du trenger en kontinuerlig variabel og en kategoriskvariabel med tre eller flere grupper.

Analyze > Nonparametric parametric Tests > IndependentSamples

I Fields-tabben, flyttden avhengigevariablen over i TestFields, og denkategoriskeuavhengige variablentil Groups.

30

KRUSKAL WALLIS

Under Settings, velgKruskal-Wallis 1-wayANOVA, og pass på atMultiple comparisonsstår på All pairwise.Velg Test for OrderedAlternatives dersomden kategoriskevariablen er ordnet.Trykk Paste.

31

KRUSKAL WALLIS

Hypothesis Test Summaryangir hva null-hypotesen er,og om den bør forkastes. Idette tilfellet sier den at vi børgå for alternativ hypoteste, atdet er forskjell på gruppeneog at den endrer segkonsekvent ettersom alderøker. Spesifikk test-statistikkog signifikans vises også iIndependent-SamplesKruskal-Wallis...

32

KRUSKAL WALLIS

Boxplot av dataene frade ulikealdersgruppene ser uttil å bekrefte atoptimisme økerettersom alder øker.

33

KRUSKAL WALLIS

Pairwise comparisons... forteller oss at det kun er signifikantforskjell mellom første og siste aldersgruppe.

34

FORUTSETNINGER FOR REPEATED MEASURES ANOVA

Du trenger en kontinuerlig variabel som er målt ved minst toulike tidspunkt eller eksperimentelle forhold

Tilfeldig utvalg


Den avhengige variablen bør være omtrent normalfordelt vedhvert av tidspunktene eller ved hver av de ulike eksperimentelleoppsettene

Variansen til den avhengige variablen ved de ulike tidspunktenebør være tilnærmet lik

Variansen til differansen mellom alle mulige par av tisdpunkterbør være tilnærmet lik for alle parkombinasjoner (kalles oftesfærisitet). Hvis ikke må korreksjoner brukes.

35

ANOVA - ANALYSIS OF VARIANCE (REPEATED MEASURES)

Analyze > General Linear Model > Repeated Measures

Vi bruker datasettetexperim.sav. Først må vi’lage’ en faktor som definerereffekter som skal testes forflere personer/caser vedulike tidspunkt/forhold. Vi måbare oppgi et navn og angiantall nivåer, og trykke påAdd.

36


Etter at vi har trykket på Add,vil denne faktoren dukke oppi vinduet under. Deretter kanvi trykke på Define.

37


De tre nivåene ifaktoren vi lagde stårlistet opp som tre ulikevariabler. Disse mådefineres ved at vimarkerer nivå 1, ogflytter målingene avden avhengigevariablen ved tidspunkt1 over i boksenWithin-SubjectsVariables.

38


Når alle tidspunkt erlagt til, vil det seomtrent slik ut. Alle trenivåer i faktoren vårhar blitt definert av hversin variabel.

39


Repeated Measures: Model

Sjekk at Full factoral ervalgt, og at Sum ofsquares står på TypeIII.

40


Repeated Measures: Options

Velg Descriptivestatistics og Estimatesof effect size.

41


Repeated Measures: Profile Plots

Flytt time over i Horizontal axis, ogtrykk på Add. Velg enten Line charteller Bar chart (avhengig av hva duliker). Hak av for Include ErrorBars.

42


Repeated Measures: Estimated Marginal Means

Velg time og flytt over iDisplay Means for. Hak avfor Compare main effects ogvelg Bonferroni (den erstrengest). Trykk Continueog Paste.

43


Descriptive Statistics gir gjennomsnitt og standardavvik for denavhengige variablen innenfor hver av gruppene definert av denuavhengige variablen. Multivariate Tests angir signifikans. Herkan du velge den testen som er mest vanlig i ditt fagfelt. Sigmindre enn 0.05 indikerer signifikant forskjell mellom grupper.

44


Mauchly´s test of sphericity angir om sfærisitet er tilfredsstilteller ikke. Nullhypotesen er at sfærisitet er tilfredsstilt. Hvis Sig.er mindre enn 0.05, kan vi ikke anta at sfærisitet er tilfredsstilt,og vi må da ta hensyn når vi tolker resten av modellen.

45


Siden vi ikke kan antasfærisitet, må vi basere osspå de tre andre målene påom det er forskjeller påtidspunktene. Denstrengeste er Lower-bound,og selv denne er signifikant.Vi har også signifikans for atdet er en lineærsammenheng medtidsfaktoren vår (se Tests ofwithin-subjectscontrasts-tabell)

46


Gjennomsnitt for hverttidspunkt sammen medtilhørende standardfeil ofkonfidensintervall erpresentert i EstimatedMarginal Means. Pairwisecomparisons viser at det ersignifikant forskjell mellomalle nivåer, med tilhørendegjennomsnittlig forskjell.

47


Gjennomsnitt for hvert tidspunkt plottet mot tid, inludertusikkerhet gitt av konfidensintervallene viser en tydelig lineærtrend i at deltakeres frykt for statistikk avtar med tid.

48

FRIEDMANS ANOVA

Ikke-parametrisert alternativ til repeated measures ANOVA. Dutrenger en kontinuerlig variabel som har blitt målt ved minst toulike tidspunkter/ulike forhold.

Analyze > Nonparametric Tests > Legacy Dialogs > K RelatedSamples

Flytt de variablene somrepresenterer målingerpå uliketidspunkt/under ulikeforhold over i boksenTest Variables.

49

FRIEDMANS ANOVA

Several Related Samples:Statistics, Several RelatedSamples: Exact

Hak av for Quartiles ogeventuelt Descriptive om duvil. Velg Exact under Exacttests.

50

FRIEDMANS ANOVA

Deskriptiv statistikk viserkvartiler ved hvert tidspunkt.Ranks angir gjennomsnittligrang ved hver av de tretidspunktene. At rang ser uttil å avta med tid antyder atdet er en sammenhengmellom tid og frykt forstatistikk. Test Statisticsangir om testen er signifikanteller ikke (Asump.Sig.< 0.05).

51

MIXED ANOVA

Brukes når du har lyst til å både sammenligne uavhengigegrupper, samtidig som du har målinger utført på de sammeindividene ved flere tidspunkt/ved ulike forhold.

Analyze > General Linear Model > Repeated Measures

Som med vanligrepeated measuresANOVA, må vi lagefaktoren som angir deulike tidspunk-tene/forholdene. Giden et navn, angi antallnivåer, og trykk Add,og trykk Define

52

MIXED ANOVA

Flytt de variabene somtilsvarer målinger av denavhengige variablen på uliketidspunkt over til tilsvarendenivå i tidsfaktoren i vinduetWithin-subjects variables.Flytt faktoren som angir denfaktoren med uavhengigemålinger over i feltetBetween-subjects factors.

53

MIXED ANOVA

Repeated Measures: Options

Velg Descriptivestatistics, Estimates ofeffect size ogHomogeneity tests.

54

MIXED ANOVA

Repeated Measures: Profile Plots

Legg til den repetertefaktoren (her time) til feltetHorizontal Axis, og faktorenmed uavhengige grupper iboksen Separate Lines, ogtrykk på Add. Velg LineChart, og hak av for IncludeError Bars.

55

MIXED ANOVA

Gjennomsnitt ogstandardavvik forde to uavhengigegruppene vedhvert av de tretidspunktene.

56

MIXED ANOVA

Dette er en test av kovarians påtvers av grupper og tidspunkt.Nullhypotesen er at kovariansen erlik. Hvis denne testen ikke ersignifikant, kan vi anta atkovariansen ikke varierernevneverdig, dvs. at korrelasjonmellom ulike tidspunkter innenforundergruppene definert av deuavhengige gruppene ikke varierer.

57

MIXED ANOVA

De første fire radene iMultivariate tests tilsierat det er en signifikanteffekt av tid. De nestefire radene tilsier at detikke er noen signifikanteffekt av denkombinerte faktoren tidog gruppering.

58

MIXED ANOVA

Levene´s test antyderat det er konstantvarians i feilen sommodellen gjør, ettersomingen av testene ersignifikante. Tests ofBetween Subjectseffects viser atgruppene i denuavhengige variablenikke er signifikant ulike(p=0.81).

59

MIXED ANOVA

Grafen av frykt for statistikk over tid for de to ulike gruppeneforsterker inntrykket av at det ikke er noen forskjell pågruppene, ettersom linjene følger hverandre veldig nært.

60


Andre varianter av ANOVA

• Two way ANOVA - flere uavhengige kategoriske variable.Resultatet blir å se på forskjeller mellom ulike grupperinger,f.eks. ikke bare kjønn, men aldersgruppe også.

• ANCOVA (ANalysis of COVAriance) - Utføre ANOVA, mensdu tar hensyn til en eller flere kontinuerlige variabler også

• MANOVA (Multippel ANOVA) - Se på forskjeller mellomgrupper, innenfor flere kontinuerlige avhengige variablersamtidig

61

KATEGORISKE UTFALL

CHI SQUARED(χ2)-TEST

Brukes for å teste om fordelingen av data innenfor kategorier ertilfeldig eller ikke, altså om det er en korrelasjon mellomkategoriske variabler.

Dette er en ikke-parametrisert test, så her trenger vi ikke tenkeså mye på fordeling av data. Derimot bør ingen av gruppene ide kategoriske variablene være for små. Hvis du ser påsammenheng mellom to kategoriske variabler med to grupper ihver, resulterer dette i 2 × 2 = 4 undergrupper. Da bør ingenundergrupper ha en forventet frekvens under 5. For størretabeller bør minst 80% av cellene ha forventet frekvens på 5eller mer.

Observasjoner bør være uavhengige, så de to variablene børf.eks. ikke være av typen pre/post-test. Hvis du har slike databør McNemar’s test brukes istedenfor. 62


Analyze > Descriptive Statistics > Crosstabs...

Bruker datasettetsurvey.sav. Flytten av dekategoriskevariablene over iRow(s) og denandre over iColumn(s). Hakav for Displayclustered barcharts hvis du vil.

63


Crosstabs: Exact

Velg Exact fremforAsymptotic only. Daregner du ut Fisher’sexact test, som ergunstig hvis man har fåcaser, eller laveforventede frekvenser ienkeltgrupper. Hvisdette ikke er tilfellet, vildet heller ikke utføresnoen korreksjon, så dutaper ingenting.

64


Crosstabs: Statistics

Hak av Chi-square,Contingency coefficient, Phiand Cramer’s V og Lambda,så vi får utført riktig test (χ2)og får et mål påeffektstørrelse (Phi/CramersV). Lambda gir et mål på ihvor mye mindre feil vi får ommedlemskap i en variabelpredikeres basert påmedlemskap i den andrevariablen.

65


Crosstabs: Cell Display

Hak av for både Observed ogExpected i Counts. I tillegghak av for Row, Column ogTotal i Percentages, ogStandardized i Residuals.

66


Krysstabellen gir hvordandeltakere fordeler seg i de (idette tilfellet) fireundergruppene, sammenmed et forventet antall.Residualene angir forskjellmellom målt frekvens offorventet. Hvis residualeneer større enn 2.0 (for en 2×3tabell eller større), er det myestørre forskjell enn forventet.

67


Liten effekt: 0.1, Middels effekt:0.3, Stor effekt: 0.5.

Den viktigste verdien iChi-Square Tests PearsonChi-Square. Siden denneikke er signifikant, er det ikkeforskjell på antall menn ogkvinner som røyker. Med2×2 tabell er phi best mål påeffekt, ellers er det CramersV.

68


Søylediagrammet forsterker inntrykket av at det ikke er noensignifikant forskjell mellom hvor mange som røyker av menn ogkvinner, ettersom begge grupper ser nesten like ut.

69

LOGISTISK REGRESJON

Brukes når du har en kategorisk avhengig variabel, altså når duprøver å forutse gruppemedlemskap basert på andrekontinuerlige og/eller kategoriske variabler

Ikke avhengig av normalfordeling, men det er viktig at allegrupper/kategorier har nok datapunkter

Her er også multikolinearitet mellom uavhengige variabler viktigå passe på.

70

FORUTSETNINGER FOR LOGISTISK REGRESJON

Du har en avhengig variabel som er kategorisk, derkategoriene ikke overlapper. Det kan ikke være mulig i tilhøremer enn en av utfallskategoriene.

Du har en eller flere uavhengige variabler som er kontinuerligeeller kategoriske

Observasjonene er uavhengige

Hvis du har flere kontinuerlige uavhengige variabler, bør disseikke være korrelert

Alle kategorier i en kategorisk variabel bør være skikkeligrepresentert

Lineært forhold mellom kontinuerlige prediktorer oglogit-tranformasjonen av utfallsvariabel

71

LOGISTISK REGRESJON

Analyze > Regression > Binary Logistic

Vi bruker datasettetsleep.sav. Flytt denavhengige variablen tilDependent og deønskede uavhengigevariablene tilCovariates. Trykk påCategorical...

72

LOGISTISK REGRESJON

Logistic Regression: Define Categorical Variables

Alle kategoriskevariabler måspesifiseres, slik at debehandles på riktigmåte i modellen. Herkan du velge omreferansegruppen skalvære første eller sistegruppe, men husk åtrykke på Change,ellers skjer det ingenendring.

73

LOGISTISK REGRESJON

Logistic Regression: Options

Hak av forHosmer-Lemeshowgoodness-of-fit,Casewise listing ofresiduals, CI for exp(B)og Include constant inmodel. Trykk Continueog Paste.

74

LOGISTISK REGRESJON

Første del av output angirbare litt innledende om hvormange caser som er tatt medi analysen, og hvordan denavhengige variabelen erkodet. Dette er praktisk åhuske på når man skal tolkeresten av resultatene.Referanse-gruppen for utfaller kodet som 0, i dette tilfelletno.

75

LOGISTISK REGRESJON

Tilsvarende koding for deuavhengige (kategoriske)variablene, med frekvens forhver gruppe. Grupper kodetsom 0 er referansegrupper,fordi vi valgte første gruppesom referanse. Classificationtabel gir resultatene av denmodellen vi sammenlignermed, nemlig den uten noenvariabler innkludert.

76

LOGISTISK REGRESJON

Omnibus test angir modellenssignifikans, som helst skal væreunder 0.05. Cox & Snell R Squareog Nagelkerke R Square anslåhvor mye variasjon i utfallet sombeskrives av modellen.Hosmer-Lemeshow angir ommodellen er god. Her vil vi ha Sig.større enn 0.05.

77

LOGISTISK REGRESJON

Til sammenligning med den tommemodellen, kan vi nå med dennemodellen korrekt forutse 75,1% avresultatene, sammenlignet med57.3%. For de resultatene somikke forutses korrekt, har de medresidualer større enn 2 blitt listet iCasewise list. Er residualenestørre enn 2.5 bør disseundersøkes nærmere. Det kanvære en grunn til at disse ikkebeskrives bra av modellen.

78

LOGISTISK REGRESJON

Selve modellen vises i Variables in the Equation.Kolonnene Bog Exp(B) angir effektstørrelse, og Sig. signifikans. Hvis Exp(B)er større enn 1 for en spesifikk variabel, betyr det at sjansen forå ende opp i gruppe 1 i utfallsvariablen, er større om man entenøker verdien av variablen (kontinuerlig), eller går frareferansegruppe til ikke referansegruppe for den variablen. Desom har problemer med å få sove (prob fall asleep=1) har 2.05ganger høyere odds for å ha søvnproblemer (prob sleep=1).

79

LOGISTISK REGRESJON

For å teste linearitet, kan man regne ut den naturligelogaritmen til alle kontinuerlige variabler (LN(age),LN(hourwnit)). Kryssleddene LN(variabel)×variabel inkluderesså i den logistiske regresjonsmodellen. Hvis disse leddene ikkeer signifikante, er antagelsen tilfredsstilt.

80

LOGISTISK REGRESJON

For å teste for multikolinearitet, må man bruke vanlig lineærregresjon, med akkurat de samme variablene som avhengig oguavhengig variabler som i den opprinnelige modellen, og hakeav for Collinearity Diagnostics under Statistics i dialogboksen.VIF<10 er nødvendig.

81

TILBAKE TIL LESESALEN/KONTORET

Begynn å bruke SPSS så fort som mulig på egne data (ellerandres data om du vil)!

Den eneste måten å bli god i statistikk og SPSS er ved å brukedet.

Sørg for å ha gode oppslagsverk

Spør google og youtube når du står fast. Står du fortsatt fast,spør oss ([email protected])

82

FORSLAG TIL BØKER

I SPSS: SPSS Survival manual avJulie Pallant

I statistikk og SPSS: Discoveringstatistics using IBM SPSS og Anadventure in statistics av AndyField

83

Documents

Statistisk analyse i SPSS - Universitetet i OsloANOVA - ANALYSIS OF VARIANCE One way ANOVA: Post Hoc Multiple Comparisons Her kan du velge fra et utvalg av post hoc-tester. Sjekk SPSS